H2O.ai bringt KI-Großmeister-gestütztes NLP in das Unternehmen

  • Sep 06, 2023

Hydrogen Torch, das neueste Produkt von H2O, soll die KI-Fähigkeiten von Webgiganten dem Rest der Welt zugänglich machen, sagt CEO Sri Ambati.

Es gibt etwa 1200 Schachgroßmeister auf der Welt und nur 250 KI-Großmeister. Im Schach wie auch in der KI ist der Titel „Großmeister“ eine Auszeichnung, die den Spitzenprofis vorbehalten ist. Im Bereich KI wird diese Auszeichnung an die leistungsstärksten Datenwissenschaftler in verliehen Kaggles Fortschrittssystem.

H2O.ai, das KI-Cloud-Unternehmen, das Ende 2021 in einer Serie-E-Runde 100 Millionen US-Dollar eingesammelt hat und nun einen Wert von 1,6 Milliarden US-Dollar hat, beschäftigt 10 % der KI-Großmeister der Welt. Das hat das Unternehmen gerade bekannt gegeben H2O-Wasserstoffbrenner, ein Produkt, das darauf abzielt, Unternehmen eine umfassende Beherrschung der Bild-, Video- und Verarbeitung natürlicher Sprache (NLP) durch KI zu ermöglichen.

Wir haben uns mit Sri Ambati, CEO und Gründer von H2O, unterhalten und alles besprochen, von den Ursprüngen von H2O und dem Gesamtangebot bis hin zu Hydrogen Torch und wo es in die KI-Landschaft passt.

H2O: Ein Stapel für KI

Ambati begann vor einigen Jahrzehnten erstmals mit KI zu arbeiten, indem er Sprach-zu-Text-Übersetzungen für das indische Weltraumforschungsprogramm durchführte. Anschließend stieß er auf neuronale Netze, die sich damals noch in einem frühen Stadium befanden. Als Einwanderer im Silicon Valley arbeitete er einige Zeit in Startups. Er verbrachte auch einige Zeit während seines Forschungsurlaubs zwischen Berkeley und Stanford und traf sich mit Mathematikern, Physikern und Informatikern.

Gemeinsam mit ihnen legte Ambati den Grundstein für die spätere Open-Source-Grundlage von H2O. Doch erst als seine Mutter an Brustkrebs erkrankte, wurde er „inspiriert, maschinelles Lernen für alle zu demokratisieren“.

Ambati wollte, wie er es ausdrückte, jedem Arzt oder Datenwissenschaftler KI zur Verfügung stellen, um Probleme von Wert für die Gesellschaft zu lösen. Um dies zu erreichen, müssten Mathematik und Analytik im großen Maßstab neu erfunden werden, fügte er hinzu. Das führte zu H2O, das Compiler-Ingenieure, Systemingenieure, Mathematiker, Datenwissenschaftler und Großmeister zusammenbrachte, um es einfach und schnell zu machen, Modelle von hohem Wert und hoher Genauigkeit zu erstellen.

Um dies zu verwirklichen, hat H2O im Laufe der Jahre eine ganze Produktlinie entwickelt. Als H2O im Jahr 2012 startete, gab es laut Ambati eine Lücke bei den skalierbaren Open-Source-KI-Grundlagen. Es gab Sprachen wie R und Python, mit denen man Modelle erstellen konnte, aber sie waren sehr langsam oder spröde oder nicht vollständig funktionsfähig. Der Beitrag von H2O bestand laut Ambati darin, dass sie „den schnellsten Entfernungsrechner der Welt“ gebaut haben.

Dies ist ein Verweis auf die Kernmathematik, die für die Matrixmultiplikation beim Deep Learning verwendet wird. Wenn Sie den Abstand zwischen zwei langen Tensoren berechnen können, fügte Ambati hinzu, können Sie damit beginnen, umfangreiche, lineare und nichtlineare Mathematik für hoch- und niedrigdimensionale Daten zu erstellen.

Dieser Beitrag ist Teil des H2O Open-Source-Frameworks. Ambati nennt diese Low-Level-Grundlage „die Assemblersprache für KI“. Dann integrierte H2O Frameworks und Open-Source-Communities wie Scikit-learn, XGBoost, TensorFlow von Google, oder Facebooks PyTorch. Das H2O-Team begann, dazu beizutragen und entwickelte schließlich ein integriertes Framework, das später als AutoML bekannt wurde.

Die Produkte von H2O in diesem Bereich sind H2O AutoML, basierend auf H2O Open Source und XGBoost, und ein breiteres Angebot namens Driverless AI, das Closed Source ist. Beide zielen auf Zeitreihendaten ab, die das Rückgrat vieler Unternehmensanwendungsfälle wie Abwanderungsvorhersage, Betrugsprävention oder Kreditbewertung bilden.

H2Os Hydrogen Torch ist die neueste Ergänzung seines Produktportfolios und zielt darauf ab, dem Unternehmen KI-Kompetenz für Bild-, Video- und natürliche Sprachverarbeitung (NLP) zu verleihen. Bild: H2O

Laut Ambati war die fahrerlose KI in den letzten vier Jahren „der Motor der H2O-Wirtschaft“. Es half H2O, Hunderte von Kunden zu gewinnen, darunter über die Hälfte der Fortune 500, darunter AT&T, Citi und Capital Eins, GlaxoSmithKline, Hitachi, Kaiser Permanente, Procter & Gamble, PayPal, PwC, Reckitt, Unilever und Walgreens.

Ambati nennt diese Schicht „die Compiler der KI“. Hier begann H2O, den Großmeister-Ansatz zu nutzen: den Problemraum in viele Bereiche aufzuteilen von Rezepten, wobei jedem Rezept Kaggle-Großmeister zugewiesen werden, mit dem Ziel, ihr Wissen zu destillieren, um den Teams auf der Insel die Arbeit zu erleichtern Boden.

Die nächste Phase nach dem Aufbau eines guten Modells für maschinelles Lernen ist der sichere Betrieb dieses Modells. Daten sind von Natur aus verzerrt, und verzerrte Modelle sollten nicht unangefochten in die Produktion gehen. Finden Sie blinde Flecken und führen Sie gegnerische Tests und Modellvalidierungen durch, stellen Sie Modelle bereit und integrieren Sie sie dann in die CI/CD der Softwareentwicklung nennt Ambati „die Middleware für KI“.

Dem begegnet man mit einem Hybrid-Cloud-, On-Premises- und Edge-Angebot von H2O – der KI-Cloud. Kunden nutzen es über Anwendungen: Es gibt einen KI-App-Store, einen vorgefertigten Modell-Store und Feature-Stores, die die Erkenntnisse aus der Modellerstellung kristallisieren. Die AI Cloud ist auch Multi-Cloud, da Kunden Auswahl wünschen. Dann gibt es noch H2O Wave – ein SDK für die Erstellung von Anwendungen, so Ambati.

Auf den Schultern von Webgiganten stehen

Hydrogen Torch, die neueste Ergänzung des H2O-Portfolios, ist speziell auf Anwendungen für Bild, Video und NLP zugeschnitten Verarbeitung von Anwendungsfällen, einschließlich der Identifizierung oder Klassifizierung von Objekten, der Stimmungsanalyse oder der Suche nach relevanten Informationen in einem Text. Es handelt sich um ein No-Code-Angebot, zu dem Ambati sagte:

„Es betritt den traditionellen Bereich von Webgiganten wie Google, Microsoft, Amazon und Facebook und nutzt einige ihrer Innovationen, aber.“ fordert sie heraus, indem es Kunden ermöglicht, Deep Learning einfacher zu nutzen, indem es sowohl vorgefertigte Modelle übernimmt als auch diese für lokal umwandelt verwenden."

Ambati verwies auf einige Anwendungsfälle der ersten Anwender von Hydrogen Torch, beispielsweise die Videoverarbeitung in Echtzeit. In Singapur geschieht dies, um festzustellen, ob der Verkehr zugenommen hat oder ob bestimmte Situationen zu Unfällen führen können. Der verwendete Ansatz besteht darin, „traditionelle“ große Modelle für maschinelles Lernen zu verwenden und sie dann genau auf die spezifischen vorliegenden Daten abzustimmen.

Hydrogen Torch nutzt unter der Haube PyTorch von Facebook und TensorFlow von Google. H2O nimmt sie auf und fügt Großmeister-Expertise sowie eine integrierte Umgebung hinzu. Dazu gehört auch das MLOps-Angebot von H2O, das sich an den Daten- und Machine-Learning-Pipelines orientiert, die in die Produktion gehen.

Modelle werden kontinuierlich überwacht, um festzustellen, ob sich ihre Genauigkeit geändert hat. Dies kann passieren, weil sich das Muster der eingehenden Daten geändert hat oder weil sich das Verhalten der Endbenutzer geändert hat. In jedem Fall wird das Modell dann neu erstellt und erneut bereitgestellt.

Darüber hinaus ist Teil des No-Code-Angebots von Hydrogen Torch die automatisierte Dokumentationserstellung dass Datenwissenschaftler einen Drilldown durchführen können, um zu untersuchen, welche Daten ausgewählt wurden und welche Transformationen stattgefunden haben angewandt. Ambati behauptete, die Genauigkeit des Wasserstoffbrennermodells könne im Vergleich zu Basismodellen um bis zu 30 % besser sein und die hohen 90 Perzentile erreichen.

Natürlich, fügte er hinzu, gebe es bei der KI einen bekannten Kompromiss zwischen Genauigkeit, Geschwindigkeit und Erklärbarkeit. Abhängig von den Anforderungen des Anwendungsfalls müssen Entscheidungen getroffen werden. Geschwindigkeit ist jedoch eine Art universelle Anforderung.

Was die Geschwindigkeit betrifft, spielt die In-Memory-Verarbeitung von H2O eine Schlüsselrolle, um sicherzustellen, dass Hydrogen Torch für Anwendungsfälle bei der Bild-, Video- und NLP-Verarbeitung die erforderliche Leistung erbringen kann. In einem ähnlichen Zusammenhang steht auch H2O Miniaturisierung von Modellen für maschinelles Lernen auf seiner Tagesordnung. Dadurch können Modelle auf mehr Geräten am Edge bereitgestellt werden und bieten außerdem eine bessere Leistung.

Hydrogen Torch hat auch Synergien mit einem anderen Produkt im Portfolio von H2O, nämlich Document AI. Document AI ermöglicht die Verarbeitung eingehender Dokumente durch die Kombination von Bild- und NLP-Methoden. Und dann sind da noch Audio- und Videodaten aus Quellen wie Zoom-Anrufen und Podcasts, die sich immer weiter vermehren, und H2O möchte seinen Kunden dabei helfen, mitzuhalten.

H2O arbeitet kontinuierlich mit namhaften Kunden zusammen, wie z CommBank und AT&T. Experten von H2O und Kundenorganisationen entwickeln gemeinsam Modelle für maschinelles Lernen, und es gibt ein Umsatzbeteiligungsprogramm.

Ambati identifizierte außerdem weitere Bereiche für zukünftiges Wachstum im Portfolio von H2O: Federated AI, Content Creation, Die Generierung synthetischer Daten, das Erzählen von Datengeschichten und sogar Bereiche wie Datenjournalismus stehen auf dem Radar von H2O. Das Ziel, sagte Ambati, bestehe darin, Vertrauen in die KI aufzubauen, um Gemeinschaften zu dienen. Das ist in der Tat eine großartige Vision, deren Fortschritt schwer zu messen ist. Was die Produkt-Roadmap angeht, scheint H2O jedoch auf dem richtigen Weg zu sein.

Hervorgehoben

Ist Windows 10 zu beliebt für sein eigenes Wohl?
5 Wege, den besten Ort für den Berufseinstieg zu finden
So wird generative KI die Gig Economy zum Besseren verändern
3 Gründe, warum ich dieses 300-Dollar-Android dem Pixel 6a von Google vorziehe
  • Ist Windows 10 zu beliebt für sein eigenes Wohl?
  • 5 Wege, den besten Ort für den Berufseinstieg zu finden
  • So wird generative KI die Gig Economy zum Besseren verändern
  • 3 Gründe, warum ich dieses 300-Dollar-Android dem Pixel 6a von Google vorziehe