Abgesehen von dem Elefanten im Raum möchte Cloudera mit dem Unternehmen sprechen

  • Sep 05, 2023

Welche sind die nächsten Schritte, die Cloudera unternehmen wird, um seine Attraktivität für Unternehmen zu steigern? Und wie wird es sich der Cloud nähern?

Cloudera hat in der Hadoop-Community eine beneidenswerte Position eingenommen, da es am frühesten Fuß gefasst hat und immer noch die größte installierte Basis hat. Dank Intel ist es auch das Gerät mit den größten Taschen 740 Millionen US-Dollar Unterstützung. Der Elefant im Raum ist, dass es, da es behauptet, dass es genug auf der Bank hat, um es in die Gewinnzone zu bringen, welche gibt unbegründete veröffentlichte Gerüchte eines bevorstehenden Börsengangs.

Siehe auch

Die Macht von IoT und Big Data

Wir untersuchen, wo das IoT den größten Einfluss haben wird und was es für die Zukunft der Big-Data-Analyse bedeutet.

Lies jetzt

Es beginnt, sich von seinem technischen Erbe zu lösen und neue Kämpfe zu beginnen. In einem Treffen mit Analysten diese Woche setzte Cloudera das bei Strata begonnene Thema fort, wo Mike Olsonsprudelte„Wenn Sie Data Science machen wollen, seien Sie nicht wie Watson, sondern wie Holmes.“ Der Ursprung liegt bei Cloudera Der Eindruck, dass es sich weltweit gegen IBM und nicht gegen seinen traditionellen Elefanten stellt Rivalen. Und während IBM ein setzt

Bärenumarmung um Apache SparkCloudera behauptet, dass seine Basis von 400 Spark-Produktionsimplementierungen in seinem gesamten Kundenstamm den Platzbedarf für maschinelles Lernen im Vergleich zu weit übersteigt Watson.

Mit einem neuen Marketingteam versucht Cloudera, den gewohnten Wandel eines Produktentwicklungsunternehmens zu vollziehen und sich nun gezielt an Entscheidungsträger in der Wirtschaft zu wenden. Angesichts der Entstehungsgeschichte von Hadoop ist das eine Herausforderung: Da es sich um ein Open-Source-Projekt handelt, von dem es über zwei Dutzend davon auf der Cloudera-Plattform gibt, hat sich die Diskussion bei der Zähmung des Hadoops verzettelt Zoo bevor es zur Lösung erhoben wird.

Open Source ist ein zweischneidiges Schwert; Einerseits wünschen sich Organisationen, die Big-Data-Analysen implementieren, unbedingt Open Source, um einen Lock-in zu vermeiden, möchten aber auch nicht die Nachteile einer Zähmung dieser Projekte in Kauf nehmen; Das ist die Aufgabe der Clouderas dieser Welt.

Den Business-Talk vorantreiben

In der Analystensitzung hielt Cloudera das Wort und stellte Kunden aus den Bereichen Finanzdienstleistungen und Digital vor Unternehmen, die sich auf die Plattform für unternehmenskritische Anwendungsfälle verlassen, wie z. B. die Optimierung der Kundenbindung und -sortierung Risiko. Einer der Kunden – ein globaler Finanzdienstleistungsriese, der einer der ersten Clouderas war – ist Die Standardisierung auf der Plattform ist Teil einer langfristigen Strategie zur Herausnahme von Zehntausenden Daten Lagerhäuser.

Cloudera verfolgt nicht unbedingt die Strategie, Teradata, Oracle oder Netezza zu verdrängen, aber man muss ihm zugute halten, dass das Unternehmen im vergangenen Jahr sein Produkt so umgestaltet hat, dass es dort hinkommt, wo seine Kunden sind. Du kannst es immer noch bekommen Unternehmensdaten-Hub, aber Sie können auch Teilmengeneditionen erhalten, die darauf zugeschnitten sind Datenwissenschaft und -technik; analytische Datenbank; Und Betriebsdatenbank Arbeitsbelastungen. Das ist ein Schritt zur Abstraktion der Zootiere.

Landen und erweitern

Für Hadoop-Spieler (einschließlich Cloudera) ist der Erstverkauf wahrscheinlich nicht der Punkt, an dem Sie Ihr Geld verdienen werden. Der Verkaufszyklus ist in der Regel lang und mit der Erwartung von Open-Source- und Massentechnologie werden die Preise nicht auf dem Niveau etablierter Datenbanken liegen. Die Margen entstehen, wenn Kunden ihre Cluster erneuern und erweitern.

Eine Möglichkeit zur Erweiterung besteht darin, den Stapel in Richtung Lösungen zu erweitern, aber Cloudera ist eindeutig nicht Oracle. Stattdessen führt der Weg für Cloudera über sein Kerndatenmanagement, seine Governance und seinen Sicherheits-Stack. Cloudera hat seine Klebrigkeit durch Ergänzungen wie erweitert Kudu. Hierbei handelt es sich um ein aktualisierbares Data Warehouse, das Analysen für sich schnell ändernde Daten unterstützt, bei denen der Mehraufwand bei der Arbeit mit HDFS und spaltenbasierten Dateiformaten wie Parquet zu große Latenz verursacht. Dies bietet weitere Einblicke in die BI-Zielgruppe.

Besonderheit

Integration der Hybrid Cloud

So weit und schnell sich Cloud Computing im Unternehmen etabliert, gibt es immer noch viele Cloud-resistente Anwendungen und Dienste.

Lies jetzt

Aber auch da gibt es Grenzen. nicht wie KarteR, Cloudera glaubt nicht, dass die Hadoop-Verarbeitung außen vor bleibt Rand für IoT-Anwendungsfälle. Aber wenn Edge Computing außerhalb des Steuerhauses von Cloudera liegt, braucht es eine Strategie, um die Ciscos der Welt an der Peripherie zu treffen. Tatsächlich ist der wahrscheinlichste Weg der mit Cisco Frenemy (und Cloudera Equity Partner) Intel und sein IoT-Lösungspartner.

Es gibt immer noch Leerraum, den Cloudera angehen muss. Beispielsweise nutzt Cloudera Container opportunistisch mit Kubernetes fungiert als Orchestrierungsmotor für sein neues Data Science Workbench. Sollte es sich auch an MapR orientieren, das seine Kernplattform um erweitert hat? Container Unterstützung leisten und das Publikum von Dateningenieuren und BI-Endbenutzern auf Unternehmensanwendungen und die Entwicklergemeinschaft erweitern?

Wie sieht es mit der Datenintegration für Data Lakes aus? Es bietet Datenkatalogisierung, überlässt die Datenaufbereitung, Stammdaten und Lebenszyklusverwaltung jedoch vorerst Dritten. An diesem Punkt ist die Strategie sinnvoll, da es sich um sich entwickelnde Märkte handelt und die Einführung von Data Lakes bei der Kundenbasis noch in einem frühen Stadium ist. Aber da Data Lakes in der installierten Basis immer häufiger vorkommen, wäre es für Cloudera-Kunden dann nicht selbstverständlich, zu erwarten, dass der Footprint der Plattform die Integration umfassen sollte?

Cloudera hat einige kluge Akquisitionen getätigt, die auch dazu führen könnten, dass Kunden mehr verlangen. GazzangDas 2014 erworbene Unternehmen bietet eine Verschlüsselungsschlüsselverwaltung auf Unternehmensniveau, die – was am wichtigsten ist – über die HDFS-Verschlüsselung mit externer Schlüsselspeicherung hinausgeht. Sense.io, vor einem Jahr erworben, lieferte die Kerntechnologie für Data Science Workbench, bedeckt letzte Woche. Wir warten immer noch auf die wahre Auszahlung Xplain.io Übernahme von vor ein paar Jahren mit dem Ziel der SQL-Abfrageoptimierung, aber wenn Cloudera seine Cloud-Strategie auf den Weg bringt Boden, Xplain.io könnte die IP bereitstellen, um Cloud-Kunden dabei zu helfen, monatlich echte Dellen in ihre AWS- oder Azure-Umgebungen zu bringen Rechnungen.

Haben wir Wolke gesagt?

Cloudera-Kunden, die vor dem Analystenpublikum sprachen, gaben an, dass die Cloud ihre langfristige Vision sei. Derzeit bestehen weiterhin Probleme im Zusammenhang mit personenbezogenen Daten und ähnlichen sensiblen Daten. Alle betonten die Notwendigkeit, ihre eigene Verschlüsselung zu kontrollieren, ein Problem, das Cloudera bereits anspricht. Einige anonymisieren die Daten, während andere strenge Fristen für die Aufbewahrung sensibler Daten außerhalb des Unternehmens vorsehen.

Aber die Bewegung zur Wolke ähnelt der Plattentektonik – sie findet statt und wird wahrscheinlich nicht so schnell nachlassen. Cloudera berichtete, dass die Cloud-Akzeptanz bei seinen Kunden im vergangenen Jahr nahezu geometrisch gewachsen sei; Ähnliches haben wir auch von anderen Hadoop-Anbietern gehört.

Wir haben aktenkundig gemacht dass die Komplexität von Hadoop verwaltete Cloud-Lösungen erfordert, um die installierte Basis zu vergrößern, und wir haben prognostiziert dass bis zum Jahresende 2018 die Greenfield-Implementierungen in der Cloud den Wendepunkt erreichen würden 50%. Wenn wir den Kunden von Cloudera zuhören, gehen wir davon aus, dass wir in unseren Prognosen vielleicht etwas aggressiv sind. Aber die Cloud ist im Kommen, und sie wird hybrid sein – On-Premise-Bereitstellungen werden so schnell nicht verschwinden.

Das ergibt einen interessanten Kontext darüber, wie und wo Hadoop in der Cloud bereitgestellt werden soll.

Wenn Ihre Organisation eine Hybridbereitstellung vor Ort und außerhalb des Unternehmens plant, können Sie sich für die üblichen drei Verdächtigen entscheiden und erhalten die gleiche Umgebung. Ihr IT-Team muss die Instanzen aktiv verwalten. Aber Sie erhalten die gleiche Umgebung und mit Cloudera Enterprise (Und Hortonworks-Datenplattform (im Übrigen) erhalten Sie Daten-Governance. Der Nachteil besteht darin, dass Ihre IT-Organisation die Cloud-Instanzen genau wie im Rechenzentrum aktiv bereitstellen, patchen und verwalten muss.

Alternativ, wenn Ihr Unternehmen vollständig auf Hadoop in der Cloud setzt, gibt es die heimGerichtAngebote von AWS, Azurblau, Und Google Cloud die vollständig verwaltet werden – wodurch Probleme wie das Patchen entfallen. Und wenn Ihre Bedürfnisse sehr speziell oder projektorientiert sind, gibt es noch eine dritte Möglichkeit: Entscheiden Sie sich für ein À-la-carte-Angebot maschinelles Lernen Und Funke Dienstleistungen.

Der andere Elefant im Raum ist also die Gelegenheit, die Cloudera in der Cloud erwartet: das Angebot Das Beste aus beiden Welten mit einem Managed Service, der über die gesamte Governance und Sicherheit seines Kerns verfügt Plattform. Wird Cloudera den Köder schlucken?

Der Schöpfer von Hadoop wirft einen Blick auf kommende Technologien, die Big Data erschließen werden