Gartner veröffentlicht den Data Warehouse Magic Quadrant 2013

  • Sep 02, 2023

Im Data-Warehouse-Report von Gartner behauptet Teradata seinen Vorsprung, Microsoft ist auf dem Vormarsch und zu den Megatrends zählen das logische Data Warehouse, die In-Memory-Technologie und die Big-Data-Integration.

Stamford, CT-basiertes Analysten- und Marktforschungsunternehmen Gärtner veröffentlichte sein jährliches Data Warehouse Magic Quadrant-Bericht vom Montag. Einerseits können Data Warehousing (DW) und Big Data als unterschiedliche Welten betrachtet werden. Es gibt jedoch einen Vormarsch von SQL in der Hadoop-Welt, und MPP-Data-Warehouse-Appliances (Massively Parallel Processing) können jetzt ernsthafte Big-Data-Workloads bewältigen. Wenn man dazu noch die Anzahl der DW-Produkte hinzufügt, die sich in Hadoop integrieren lassen, wird es immer schwieriger, über DW zu sprechen, ohne auch über Big Data zu diskutieren. Also die Veröffentlichung des Gartner Data Warehouse-Bericht ist für die Big-Data-Szene insgesamt relevant und eine Analyse davon erscheint hier sinnvoll.

Das Pferderennen

Erlauben Sie mir zunächst, die brennende Frage zu beantworten: Wer hat „gewonnen?“ Oder anders ausgedrückt: Welcher Anbieter hatte das? Gartners unnachahmliche Umgangssprache, die größte „Fähigkeit zur Umsetzung“ und „Vollständigkeit der Vision“? Der Antwort: Teradaten. Einfach ausgedrückt, die drei Jahrzehnte lange Geschichte des Unternehmens; die große Anzahl an Branchen, mit denen das Unternehmen Erfahrung hat; die Anzahl und Vielfalt seiner Kunden (in Bezug auf Umsatz und geografische Lage); und der Beitrag der Aster-Daten Von der Akquisition bis hin zur Produktvielfalt hat Gartner wirklich beeindruckt.

2013 Gartner DW MQ

Bildnachweis: Gartner

Aber Teradata hat letztes Jahr auch die Nase vorn, und aufgrund seiner Preislage ist es nicht die DW-Lösung für jedermann (tatsächlich nennt Gartner die Kosten als allgemeines Problem für Teradata). Daher ist es wichtig, darüber nachzudenken, was der Bericht sonst noch zu sagen hatte. Ich werde den Bericht selbst nicht noch einmal aufwärmen, da Sie auf den Link oben klicken und ihn selbst lesen können, aber ich werde es tun Versuchen Sie, einige allgemeine Trends im Bericht und diejenigen im Markt aufzuzeigen, auf die der Bericht hinweist aus.

  • Lesen Sie auch: Teradata und SAS arbeiten bei Analyse-Appliance zusammen
  • Lesen Sie auch: Gartner, IBM und Teradata machen Big-Data-Ankündigungen

Logisches Data Warehouse
Wenn es im DW Magic Quadrant (MQ)-Bericht einen Megatrend gibt, dann ist es die Entstehung des logischen Data Warehouse. Im Wesentlichen bezieht sich dieses Konzept auf die Vereinigung verschiedener physischer DW-Assets zu einem logischen Ganzen, es gibt hier jedoch einige unterschiedliche Vektoren. Logische Data-Warehouse-Funktionen können sich auf Lastausgleich und verteilte Daten beziehen (wobei unterschiedliche Daten in verschiedenen physischen Data-Warehouses und Data-Marts gespeichert werden). werden in einem logisch einheitlichen virtuellen DW gebündelt) und mehrere Workloads (wobei relationale/strukturierte, NoSQL/halbstrukturierte und unstrukturierte Daten logisch integriert werden).

Dieser Multi-Workload-Vektor ist auch ein Big-Data-Integrationspunkt, da 10 der 14 Anbieter im Bericht Hadoop-Konnektoren für ihre DW-Produkte anbieten.

In-Memory ist heiß
In-Memory-Technologie, sei es spaltenspeicherbasiert, zeilenspeicherbasiert oder beides, und ob sie ausschließlich oder in einer Hybridkonfiguration mit festplattenbasiertem Speicher verwendet wird, ist im DW-Bereich mittlerweile weit verbreitet. Gartner betrachtet dies als eine Wettbewerbsnotwendigkeit und gibt IBM Vorwürfe, weil es hinter der In-Memory-Kurve zurückbleibt. Andererseits verweist es dreimal auf den „Hype“ um die In-Memory-Technologie und führt den Hype allgemein auf die Vermarktung von SAP zurück HANA. Unterdessen stellt Gartner fest, dass sich der Kundenstamm von HANA von etwa 500 Kunden Ende Juni 2012 auf 1.000 am Jahresende verdoppelt hat.

  • Lesen Sie auch: SAP HANA verarbeitet Big Data... mit ERP-, CRM- und BI-Kenntnissen
  • Lesen Sie auch: SAP nutzt ERP im Speicher

Unterstützung für R
Unterstützung für die Open-Source-R Die Akzeptanz und Anerkennung der Programmiersprache im Mainstream-DW scheint sich zu beschleunigen. Unterstützung für die Sprache, die für Statistik- und Analyseanwendungen verwendet wird, wird von den 2013 DW MQ-Anbietern Exasol, Oracle und SAP bereitgestellt. Oracle bietet einen Datenkonnektor für R an, während Exasol und SAP R in ihre Programmier- und Abfrage-Frameworks integrieren.

  • Lesen Sie auch: Revolution R v6.0 kommt in die Stadt

Ich halte es für wahrscheinlich, dass die Einführung von R im Jahr 2013 in den Bereichen DW, Business Intelligence und Hadoop noch stärker an Dynamik gewinnen wird.

Mehrere Spieler mit einer Kundenzahl von 300 oder weniger
Nicht alles im Gartner DW MQ-Bericht konzentriert sich auf große Mainstream-Kräfte. Neben Mega-Anbietern wie IBM, Oracle, SAP und Microsoft oder erfahrenen DW-fokussierten Anbietern wie Teradata umfasst der Bericht mehrere Anbieter mit relativ kleinen Kundenzahlen. Das sagt der Bericht 1010Daten hat „über 250“ Kunden und Infobright „gibt an, 300 Kunden zu haben.“ Und diese Zahlen sind eher gering Aktianer (ehemals Ingres) mit einem Gewicht von „über 65“ Kunden, ParAccel behaupten „über 60,Calpont bei „ungefähr 50 namentlich genannten Kunden“ und dem Bericht, der dies erklärt Exasol „meldet 38 Kunden in der Produktion und geht davon aus, bis Januar 2013 50 Kunden zu haben.“

Ich sage das nicht, um bissig zu sein, aber es ist ein wichtiger Realitätscheck. Viele von uns in der Presse-/Blogger-/Analysten-Community, mich eingeschlossen, weisen Unternehmen, die tatsächlich nur sehr wenige Kunden haben, manchmal den Schwerpunkt auf große Anbieter zu. Manchmal wedelt der Schwanz mit dem Hund in dieser Startup-Branche, und die Leser sollten sich dessen bewusst sein.

Obwohl ParAccel nur über „über 60“ Kunden verfügt, ist einer seiner Investoren Amazon, das die Technologie von ParAccel für sein neues Unternehmen lizenziert hat Rotverschiebung cloudbasierter Data-Warehouse-Dienst.

  • Lesen Sie auch: Amazon Redshift: ParAccel rein, teure Geräte raus

Mehrere „Formfaktoren“
Ein weiterer von Gartner hervorgehobener Trend ist die Vielfalt der Bereitstellungs-/Beschaffungskonfigurationen (oder – um Gartners Begriff zu verwenden – „Formfaktoren“), in denen DW-Produkte verfügbar sind. Zu den von den Anbietern angebotenen Optionen gehören: reine Softwarelizenzen, Referenzarchitekturen, aGeräte, Platform as a Service (PaaS) claute Opfergaben und ausgewachsene mverwaltete Dienste, bei denen Anbieter die DW-Infrastruktur bereitstellen, überwachen und verwalten. Und bei Nicht-Cloud-Optionen können Anbieter ihre Preise auf der Anzahl der Server, Prozessorkerne oder Dateneinheiten (typischerweise Terabyte) basieren. Manchmal lassen sie den Kunden sogar entscheiden, welches Modell am besten funktioniert.

Viele Anbieter bieten mehrere dieser Formfaktor- und Lizenzierungsoptionen an, und Gartner impliziert, dass es umso besser ist, je mehr solcher Optionen ein Anbieter anbietet. Wer nur eine Option anbietet, kann sich von der Berücksichtigung durch die Kunden ausschließen. Diejenigen, die mehrere anbieten, und insbesondere solche, die den Kunden die Flexibilität geben, zwischen Bereitstellungs- und Preismodellen zu wechseln, erzielen tendenziell bessere Kundenzufriedenheit.

Datenmodelle
In Bezug auf Modelle erwähnt Gartner insbesondere, dass HP und Oracle branchenspezifische DW-Datenmodelle anbieten und dass Microsoft über bestimmte Partner dies auch tut. Gartner sieht darin ein wichtiges Merkmal der Data-Warehouse-Angebote der Anbieter. Ich stimme zu... Datenmodelle können Best Practices schnell vermitteln und zumindest als nützliche Ausgangspunkte für die Beschleunigung von DW-Implementierungen dienen.

HCatalog für die Datenverwaltung
HKatalog, ursprünglich eingeführt von Yahoo/Hortonworks und jetzt ein eigenständiges Apache-Inkubatorprojekt, fungiert als Metadaten-Repository, das die Speicherung und Datenverwaltung für Hadoop-Stack-Komponenten wie vereinheitlichen soll Bienenstock, Schwein und die Hadoop MapReduce-Engine selbst. Auf der DW-Seite der Welt integrieren ParAccel und Teradata jeweils HCatalog, um Hadoop-Daten in das DW-Design zu integrieren, anstatt nur eine Verbindung zu diesen Daten herzustellen und diese zu importieren. Dies scheint auf eine gute Anziehungskraft für HCatalog hinzudeuten, und vielleicht wird sich diese Unterstützung im nächsten Jahr allgegenwärtiger verbreiten.

Microsoft im Aufschwung
Ich denke, es ist wichtig, auf Gartners Berichterstattung über Microsoft im diesjährigen DW MQ-Bericht hinzuweisen. Microsoft befand sich letztes Jahr im Leaders-Quadranten, allerdings ganz unten links, während es dieses Jahr genau in der Mitte dieses Quadranten liegt. Im vergangenen Jahr war der in Redmond ansässige Softwareriese führend mit seinem Fast-Track-Data-Warehouse, basierend auf seiner SQL Server Enterprise Produkt. Seine MPP-Data-Warehouse-Appliance, SQL Server Parallel Data Warehouse (PDW) hatte wenig Schwung und wenige Kunden.

Ich war einmal Mitglied des Business Intelligence Partner Advisory Council von Microsoft und war vom PDW-Produkt zunächst nicht beeindruckt. Es kam mir damals wie ein Produkt vor, das entwickelt wurde, um Microsoft Glaubwürdigkeit im Datenbankspiel der Enterprise-Klasse zu verleihen bieten den Kunden ein sicheres Gefühl und weniger ein Produkt, das eigentlich darauf ausgelegt ist, eine signifikante Einheit zu erzeugen Verkäufe.

Aber die Dinge haben sich gewendet. Ein Jahr später hat das Produkt sein drittes „Appliance-Update“ (und ist viel besser auf Nicht-PDW-Editionen von SQL Server abgestimmt) und eine echte Version 2.0 des Produkts wird später in diesem Jahr erscheinen. Laut Gartner wurde PDW in den letzten 18 Monaten von 100 neuen Kunden übernommen und wird sich wahrscheinlich noch weiter beschleunigen Die PDW-basierte Appliance von Dell nimmt Fahrt auf.

Gartner zitiert auch die xVelocity In-Memory-Technologie, anwesend in PowerPivotsowie die 2012-Version von SQL Server Enterprise und den Tabellenmodus von SQL Server Analysis Services, als wichtigen Fortschritt für das Unternehmen bezeichnet und sogar erwähnt StreamInsight, die wenig bekannte Complex Event Processing (CEP)-Engine von Microsoft.

  • Lesen Sie auch: In-Memory-Datenbanken bei Microsoft und anderswo

Die nächste Version von PDW wird die neue PolyBase-Komponente enthalten, die die MPP-Engine von PDW mit Datenknoten integriert das Hadoop Distributed File System (HDFS), um echte parallelisierte, nicht-batchbasierte SQL-Abfragefunktionen über Hadoop bereitzustellen Daten.

  • Lesen Sie auch: PolyBase von Microsoft vereint SQL Server und Hadoop

Und die nächste Hauptversion von SQL Server Enterprise wird eine In-Memory-Transaktionsdatenbank-Engine mit dem Codenamen enthalten Hekaton. Hinzu kommt die Möglichkeit, SQL Server vollständig zu lizenzieren, DW-Referenzarchitekturen dafür zu erwerben und verschiedene zu kaufen SQL Server-basierte Appliancesund die Verwendung von SQL Server in den Amazon- und Microsoft-Clouds (in Infrastructure as a Service- oder PaaS-Konfigurationen) und die Entwicklung des Produkts scheint aufwärts gerichtet zu sein.

Was hat das alles zu bedeuten?
Egal, was Sie über den Einfluss von Gartner auf dem Technologiemarkt denken mögen, es lässt sich nicht leugnen, dass es Einfluss gibt. Der DW MQ-Bericht ist äußerst wichtig und wirkt dieses Jahr besonders methodisch, durchdacht und aufschlussreich. Analysten Mark A. Beyer, Donald Feinberg, Roxane Edjlali Und Merv Adrian haben einen Bericht erstellt, den jeder in diesem Bereich lesen sollte.