Die Ergebnisse von Hortonworks, die Veröffentlichung von Databricks und mehr sind die Top-Big-Data-Neuigkeiten der Woche

  • Sep 26, 2023

Finanzergebnisse, eine Akquisition, strategische Investitionen und Neuerscheinungen ergeben eine Woche, in der es mit Big Data ernst wurde

Meine Kollegen hier bei ZDNet haben diese Woche über viele Neuigkeiten zu Big Data berichtet. Ich wollte es noch einmal zusammenfassen, ein paar Punkte hinzufügen und alles in mich aufnehmen.

Der grüne Elefant im Raum
Zunächst gab Hortonworks, ein führender Anbieter von Hadoop-Distributionen, am Mittwoch nachbörsliche Quartalsergebnisse bekannt, die die Erwartungen übertrafen. Wie von Rachel King berichtetHortonworks meldete einen Umsatz von 30,7 Mio. US-Dollar, ein Plus von 154 % gegenüber dem Vorjahresquartal und übertraf die Erwartungen der Wall Street von 23,29 Mio. US-Dollar. Das Unternehmen ist natürlich immer noch ein verlustbringendes Unternehmen – es meldete einen Nettoverlust von 42,3 Mio. US-Dollar/1 US-Dollar pro Aktie oder 80 Cent pro Aktie auf Non-GAAP-Basis, was geringer ausfiel als von der Wall Street erwartet.

Auch wenn es immer noch den Anschein hat, dass Hortonworks mehr zahlt, um einen Kunden zu gewinnen, als es zurückbekommt, geht man doch davon aus, dass der Gewinn von Marktanteilen und die Dividenden derzeit entscheidend sind

Wille Komm später. Damit das funktioniert, muss Hadoop stärker in die Unternehmensinfrastruktur integriert und für Unternehmensbenutzer relevanter werden. Es gibt viele Anzeichen dafür, dass die Branche das versteht.

Wählen Sie 1010Data für die Erfassung
Ein Zeichen für eine reifere Branche oder Teilbranche ist die Konsolidierung, und davon hatten wir diese Woche einiges. Wie von Larry Dignan berichtetAdvance/Newhouse, die Muttergesellschaft von Conde Nast, hat den in New York City ansässigen In-Memory-Data-Warehouse-Anbieter übernommen 1010Daten. 1010data war in vielerlei Hinsicht ein Unternehmen der alten Schule, dessen Technologie aus der Beratungstätigkeit der Gründer an der Wall Street vor Jahren stammte. Meiner Meinung nach ist das ein guter Stammbaum, denn dieses Umfeld zwingt dazu, sich auf Zuverlässigkeit und Gewinn zu konzentrieren.

Allerdings passt es etwas nicht zum risikokapitalfinanzierten Goldrausch-Feeling in der Bay Area. Sogar der Firmenname sollte ähnlich klingen wie die Fülle der US-amerikanischen „Dial-Around„Die in den 90er Jahren entstandenen Ferngesprächsunternehmen, deren Zugangscodes aus sieben Ziffern bestehen, beginnend mit 1010, waren altmodisch. Auch der nicht gerade hohe Kaufpreis von 500 Millionen US-Dollar für ein altes Medienunternehmen ist altmodisch. Aber es sieht so aus, als ob Advance/Newhouse in einer guten Position sein wird, moderner und, fast sprichwörtlich, „datengesteuert“ zu werden. Und das ist ein Zeichen dafür, dass die Sache mit Big Data real ist.

Informatica, bitte
Ein weiterer Aspekt der Konsolidierung ist die Übernahme reiner Anbieter durch größere, allgemeinere Unternehmen für Unternehmenssoftware. Die Akquisitionen von Spotfire Und Jaspersoft von Tibco sind gute Beispiele. Oder, etwas weiter zurückgehend, die Übernahme von Ascential Software und seinen DataStage Produkt von IBM im Jahr 2005. Nach einer solchen Akquisitionsrunde gibt es meist ein oder zwei reine Spiele, die unabhängig bleiben.

Ein solches Unternehmen ist Informatica. Obwohl das Unternehmen bereits 1999 an die Börse ging, gab es diese Woche bekannt, dass es seinen Deal zur erneuten Privatisierung abgeschlossen hat. Als Larry Dignan berichtete Gestern strukturierte Informatica den Deal mit strategischen Investitionen von Salesforce und Microsoft.

Als ehemaliger CTO eines Microsoft Gold Partners, der sich auf Datenplattformlösungen konzentrierte, muss ich zugeben, dass ich es mir anders überlegt habe, als ich sah, dass Microsoft ein Investor war. Informatica ist seit einiger Zeit ein Konkurrent von Microsoft im Datenbereich und liefert sich ein Kopf-an-Kopf-Rennen mit der SQL Server Integration Services-Komponente, und nun auch gegen diese Azure Data Factory, das erst seit gestern allgemein verfügbar ist.

Aber vielleicht zeigt das eher eine Übereinstimmung als eine Feindschaft. Möglicherweise ist Microsoft an der Expertise und dem geistigen Eigentum von Informatica interessiert, auch in Bezug auf Datenqualität und Stammdaten Management, zwei Bereiche, in denen Microsoft im Vergleich zu vielen anderen Daten Produkte mit geringer Akzeptanz anbietet Angebote. Und da Informatica belegte im Gartner Magic Quadrant für Datenintegrationstools den ersten Platz das letzte Woche herauskam, der Zeitpunkt ist auch nicht schlecht.

Amazon Aurora GAs
Microsoft war nicht das einzige Unternehmen, das ein neues Cloud-Datenprodukt veröffentlicht hat. Amazon Web Services GA hat es Aurora Datenbankangebot letzte Woche und konfigurierte es als fünfte Plattformwahl für seine Relationaler Datenbankdienst (RDS), neben MySQL, PostgreSQL, Oracle und Microsoft SQL Server. AWS-Chefevangelist Jeff Bar machte die Ankündigung in einem Blogeintrag am 27. Juli.

Da Aurora selbst auf MySQL basiert, könnte es für Kunden etwas verwirrend sein, beide Plattformoptionen auf RDS anzubieten. Nichtsdestotrotz sagt Amazon: „...Aurora kann beim Betrieb das Fünffache des Preis-Leistungs-Verhältnisses einer herkömmlichen relationalen Datenbank bieten.“ auf der gleichen Hardwareklasse.“ Für Kunden, die immer noch die „nationale Marke“ wollen, die reine MySQL-Option Überreste. Für andere hat Amazon einige Tools entwickelt, die die Migration von MySQL ziemlich nahtlos gestalten sollen.

Databricks, nach Stein
Datensteine, das SaaS-Angebot von Apache Spark vom Unternehmen unter der Leitung der Projektentwickler, angekündigt seine 2.0-Veröffentlichung diese Woche. Mein Kollege Toby Wolpe berichtete über die Einzelheiten Am Mittwoch. Diese Version bringt eine Form der Zugriffskontrolle auf die Plattform über die Entwickler-„Notebooks“, die sie als Schnittstelle verwendet. Notizbücher können privat gemacht oder für bestimmte Benutzer freigegeben werden, wodurch eine effektive Zugriffskontrolle auf die Daten hinter dem Notizbuch gewährleistet wird.

Zu den weiteren Funktionen von Databricks 2.0 gehört die Unterstützung der Programmiersprache R (keine Kleinigkeit) und für mehrere Versionen von Spark. So können Unternehmen, die über ausreichend Spark-Verlauf verfügen, Abhängigkeiten von mehreren Versionen haben, um in der Databricks-Cloud zu arbeiten dennoch.

Das letzte Feature ist nicht „sexy“. Und das ist gut so. Denn wenn Unternehmen beginnen, Funktionen für komplexe Bereitstellungen zu priorisieren (statt beispielsweise für Pressemitteilungen), dann ist klar, dass die Kunden die Anforderungen bestimmen.

Das war eine gute Woche.