Oracle nimmt eine neue Variante von MySQL: Es fügt dem Cloud-Dienst Data Warehousing hinzu

  • Sep 27, 2023

Oracle geht MySQL in eine neue Richtung: Einführung eines preisaggressiven Cloud-Dienstes, der Transaktionsverarbeitung und Data Warehousing kombiniert, mit dem Vorteil, auf ETL zu verzichten.

oracle-cloud-dw.jpg

MySQL, die relationale Open-Source-Datenbank, die es gab Orakel entstand durch die Übernahme von Sun Microsystems als relativ einfache relationale Datenbank, die für eine Aufgabe bekannt war: Transaktionsverarbeitung. In einer heutigen Ankündigung stellt Oracle eine erweiterte Version von MySQL vor, die in den Bereich Data Warehousing vordringt. Es veröffentlicht einen neuen verwalteten MySQL-Datenbankdienst auf der Oracle Cloud Infrastructure (OCI), der sowohl Transaktions- als auch Analyseverarbeitungs-Workloads unterstützt.

Das führt zu einer entscheidenden Änderung für MySQL-Benutzer. Da nur wenige oder gar keine Analyseoptionen zur Verfügung standen, griffen MySQL-Benutzer normalerweise auf ETL zurück, um Daten in eine separate Datenbank zu verschieben, wenn sie ein Data Warehouse benötigten. Im neuen Cloud-Service von Oracle ist es Teil desselben Angebots und macht dank der großzügigen Nutzung der In-Memory-Technologie die Ausführung von ETL überflüssig.

Bisher war MySQL hauptsächlich auf die Transaktionsverarbeitung beschränkt, da es an Funktionen wie der Unterstützung für fehlt materialisierte Sichts für Abfragen, die auf aggregierten oder abgeleiteten Daten basieren, die für die Analyse von entscheidender Bedeutung sind. Und außerdem stand Oracle bisher nicht im Fokus von MySQL-Benutzern; Durch die Einführung eines hochdifferenzierten Dienstes möchte das Unternehmen dies ändern.

Der Ansatz, den Oracle zur Erweiterung von MySQL verfolgt, ist in der Welt der Open-Source-Datenbanken nicht allzu ungewöhnlich; Es werden Erweiterungen hinzugefügt, anstatt die Kern-Engine zu modifizieren, um neue Funktionen bereitzustellen. Diese Praxis ist in der PostgreSQL-Community üblich. Zum Beispiel die Greenplum-Datenbank, jetzt Teil von Pivotal, hat PostgreSQL angepasst, um Analysen zu unterstützen. Citus-Daten, jetzt Teil von Microsoft, erweitertes PostgreSQL um die Shard-Transaktionsverarbeitung zu unterstützen. Und die Liste geht weiter.

Oracle ist nicht das erste Unternehmen, das auf MySQL basierende Innovationen einführt. AWS hat MySQL erweitert Aurora für große OLTP-Bereitstellungen mit mehreren Terabyte, bei denen die Parallelverarbeitung eine hohe Parallelität unterstützen kann. Es verwendet jedoch eine andere Speicher-Engine und gewährleistet die Kompatibilität auf API-Ebene. Im Gegensatz dazu behielt Oracle die ursprüngliche Speicher-Engine bei, fügte jedoch eine neue hinzu, um Echtzeitanalysen hinzuzufügen Für Entwickler und Datenwissenschaftler ist es einfacher, ihre Arbeit zu erledigen, ohne ETL ausführen und zu einer anderen Datenbank wechseln zu müssen Analytik.

MySQL galt traditionell nicht als analytisches Ziel, da ihm einige davon fehlten Die umfangreichere Funktionalität von PostgreSQL. Abgesehen von der fehlenden Unterstützung materialisierter Ansichten verfügte MySQL über eingeschränktere Möglichkeiten zum Löschen oder Abschneiden von Tabellen; Ausführen von Joins und Triggern; Ganz zu schweigen von der Unterstützung von Nicht-SQL-Sprachen für gespeicherte Prozeduren.

Aber MySQL hat einen wichtigen Trumpf im Ärmel. Im Gegensatz zu PostgreSQL unterstützt es austauschbare Speicher-Engines. Das bereitete Oracle den Weg, alle Hebel in Bewegung zu setzen, um MySQL zu erweitern: es in eine kombinierte Transaktion umzuwandeln und Analyseplattform, die Daten am selben Ort speichert und dann ihre Cloud-Infrastruktur nutzt, um aggressive Preise zu erzielen Es.

Es beginnt mit dem, was Oracle als „hybriden spaltenbasierten In-Memory“-Datenspeicher bezeichnet. Auf den ersten Blick klingt das nach der Anwendung der Technologie, die Oracle mit seiner Flaggschiff-Datenbank bereits als Option anbietet: Oracle Database-In-Memory, der neben dem Reihenspeicher verläuft. Standardmäßig legen Kunden fest, welche Daten in den Hybrid-Datenspeicher verschoben werden sollen. Sie können dies jedoch auch per Schalter umlegen legt alle Daten automatisch dort ab (obwohl dies für die meisten Installationen wahrscheinlich nicht die wirtschaftlichste ist). Möglichkeit). Es klingt auch sehr danach MariaDB bietet als Option im Rahmen seiner Plattform mit seinem Column Store an.

Ein wesentlicher Unterschied besteht natürlich darin, dass MariaDB aufgrund seines Erbes Ähnlichkeiten mit MySQL aufweist, Oracle MySQL jedoch im wahrsten Sinne des Wortes MySQL ist. Aber es gibt noch einige weitere wichtige Unterschiede. Kunden von First Oracle MySQL Cloud müssen nicht angeben, welche Abfragen von der In-Memory-Engine ausgeführt werden sollen. Dies erfolgt automatisch durch den MySQL-Optimierer. Dann gibt es noch einen weiteren wichtigen Unterschied: Im In-Memory-Spaltenspeicher ist dies auch bei Oracle MySQL Analytics Engine der Fall Vektorverarbeitung in den Zeilen, bei der mehrere sich wiederholende Anweisungen in einer einzigen Operation zusammengefasst werden. Dies ähnelt dem, was Actian damit macht Aktiver Vektor. Auch hier wählt der Optimierer und nicht der Benutzer den Verarbeitungspfad.

Es gibt weitere Optimierungen, die die Leistung beschleunigen und Datenmengen im Terabyte-Bereich unterstützen. Beispielsweise gibt es eine dynamische Workload-Partitionierung, die die Parallelverarbeitung skaliert, und verteilte Abfrageverarbeitungsalgorithmen für verteilte Verknüpfungen. Dies wird durch im Prozessor zwischengespeicherte Hash-Tabellen zur Steuerung von Verknüpfungen ermöglicht.

Oracle behauptet, dass es mit Optimierungen, die in seine native Cloud-Infrastruktur integriert sind, konkurrierende Cloud-Data-Warehousing-Dienste unterbieten kann. Was Benchmarks betrifft, zitiert Oracle seine eigenen TPC-H-Läufe, mit denen sein neuer Dienst ohne Index (Data Warehouses) verglichen wird wird selten mit Indizes ausgeführt) übertrifft eine herkömmliche MySQL-Implementierung mit einem Index um das 400-fache und führt einen 400-GByte-Datensatz auf einem 64-Core-Computer aus. Es überrascht nicht, dass Oracle in seinen eigenen Benchmarks gegenüber seinem bevorzugten Ziel auch ein überlegenes Preis-Leistungs-Verhältnis angibt, Amazon Redshift.

Offensichtlich blickt Oracle über seinen Kernkundenstamm hinaus. Während sie MySQL besitzen, ist Oracle mit seiner gleichnamigen Plattform eher für High-End-Unternehmensdatenbanken bekannt; Es überrascht nicht, dass MySQL als die ärmere Stiefschwester von Oracle bekannt ist. Dennoch erfreut sich MySQL als Open-Source-Plattform weiterhin großer Beliebtheit, und zwar in der November 2020 db-Engines-Ranglistesteht an zweiter Stelle hinter der Oracle-Datenbank selbst.

Da MySQL im Vergleich zu allen üblichen Verdächtigen die Grundlage für Open-Source-Datenbankdienste bildet, bestand die Strategie von Oracle nicht darin, MySQL zu einer Kopie davon zu machen Amazon RDS für MySQL, Azure-Datenbank für MySQL, oder Google Cloud SQL. Stattdessen wollte Oracle sein Angebot zu einem anderen Service machen, indem es Analysen hinzufügte und den Service dann aggressiv bepreiste. Oracle lässt seinen Worten Taten folgen und stellt seine Benchmark-Suite auf GitHub als Open-Source-Lösung zur Verfügung, damit Kunden A-B-Tests durchführen können Sie vergleichen Oracle MySQL Cloud selbst mit anderen MySQL-Cloud-Diensten, anstatt sich auf Oracle zu verlassen Zahlen.

Oracle ist nicht für seine Fähigkeit bekannt, neue Datenbankkunden zu gewinnen. Die meisten Cloud-Anbieter machen die Kunden, die sie von Oracle gewonnen haben, stark bekannt. Aber die frühe Erfolgsbilanz mit der Autonomous Database von Oracle hat einen überraschend hohen Anteil an Neukundengewinnen gezeigt. Angesichts der Tatsache, dass Oracles Hauptziel für autonome Datenbanken der Großteil seiner bestehenden Basis war, sind Neukunden das Sahnehäubchen. Bei MySQL sieht das anders aus, da Oracle ein Herausforderer auf diesem Markt ist und daher das Hauptziel neue Kunden sein werden. Oracle muss neue Wege finden, um seine Botschaft zu verbreiten und eine Meinungsbildung bei einer Zielgruppe aufzubauen, die Oracle Cloud nicht als wahrscheinlichen Ort für die Ausführung von MySQL in Betracht zieht.

Große Daten

So finden Sie heraus, ob Sie in einen Datenverstoß verwickelt sind (und was als nächstes zu tun ist)
Der Kampf gegen Voreingenommenheit in der KI beginnt bei den Daten
Faire Prognose? Wie 180 Meteorologen „ausreichend gute“ Wetterdaten liefern
Krebstherapien sind auf schwindelerregende Datenmengen angewiesen. So ist es in der Cloud sortiert
  • So finden Sie heraus, ob Sie in einen Datenverstoß verwickelt sind (und was als nächstes zu tun ist)
  • Der Kampf gegen Voreingenommenheit in der KI beginnt bei den Daten
  • Faire Prognose? Wie 180 Meteorologen „ausreichend gute“ Wetterdaten liefern
  • Krebstherapien sind auf schwindelerregende Datenmengen angewiesen. So ist es in der Cloud sortiert