Maschinelles Lernen für die Massen

  • Oct 06, 2023

Entwickler, die sich nicht an der Data-Science-Aktion beteiligen, erhalten dank der üblichen Verdächtigen aus der Cloud-Computing-Welt Zugang zum maschinellen Lernen. Die Frage ist, ob diese neuen IDEs für maschinelles Lernen diejenigen befähigen, die gerade genug Wissen haben, um buchstäblich gefährlich zu werden.

Erste Schritte mit künstlicher Intelligenz und maschinellem Lernen

Das Paradoxe an künstlicher Intelligenz (KI) und maschinellem Lernen (ML) ist, dass es trotz (oder wegen) des Hypes immer noch schwierig ist, Praktiker zu finden, die verstehen, wie man diese Ansätze nutzt. Vielleicht lässt sich das KI-Paradoxon am besten mit „so nah und doch so fern“ charakterisieren.

KI ist aus verschiedenen Gründen verlockend zugänglich.

Besonderheit

So implementieren Sie KI und maschinelles Lernen

Die nächste Welle der IT-Innovation wird durch künstliche Intelligenz und maschinelles Lernen vorangetrieben. Wir schauen uns an, wie Unternehmen davon profitieren können und wie sie damit beginnen können.

Lies jetzt

Da sind zunächst die Daten. Mit der explosionsartigen Verbreitung von Big Data gibt es reichlich Möglichkeiten, Maschinen in die Lage zu versetzen, das Lernen zu übernehmen. Anders als früher, als die Daten spärlich und die Speicherung teuer waren, sind wir nicht mehr auf statische Regeln angewiesen, die von menschlichen Experten entwickelt wurden.

Dann ist da noch die Infrastruktur. Dank der Cloud steht ausreichend Rechenleistung und Speicher zum richtigen Preis zur Verfügung – Sie müssen nicht mehr für ein dediziertes HPC-Grid bezahlen.

Und schließlich ist da noch die Software. Sie müssen die Algorithmen nicht mehr von Grund auf neu schreiben. Die Open-Source-Community bietet eine Fülle an Bibliotheken.

Was könnte also schiefgehen?

Während wir von künstlicher Intelligenz und maschinellem Lernen und Erkennen sprechen, bleibt der Mensch ein wesentlicher Teil der Gleichung. Klar, KI-Programme können das jetzt erschaffe fremde Welten Aber um nützliche Probleme zu lösen, muss immer noch eine Person dafür sorgen, dass das Modell auf dem richtigen Weg ist. Es überrascht nicht, dass qualifizierte Arbeitskräfte nach wie vor das am schwersten erhältliche Gut sind. Gestern waren Datenwissenschaftler Mangelware. Korrigieren Sie das – selbst wenn Hochschulen und Universitäten neue Horden von Datenwissenschaftlern hervorbringen – ist das immer noch der Fall. Sie werden immer noch von den Global 2000 übernommen. Gerade in diesem Moment fügen die meisten Datenwissenschaftler KI und ML zu ihren Visitenkarten hinzu.

Von außen blickt man jedoch auf eine große Gruppe von Entwicklern, die gerne einen Teil des Geschehens miterleben würden. Und so wie die Natur ein Vakuum, Überraschungen und Überraschungen verabscheut, gibt es eine wachsende Zahl von Diensten, die Entwicklern mit weniger formalen Kenntnissen über Modellierungstechniken die Türen zum maschinellen Lernen öffnen.

Amazon SageMaker, Microsoft Azure Machine Learning Studio, Und Google Cloud AutoML Jedes bietet kuratierte Umgebungen, bei denen es sich im Wesentlichen um IDEs für grundlegendes maschinelles Lernen handelt, die auf eine Welt aktualisiert wurden, in der Jupyter-Notizbücher ist geworden tabula rasa. Während diese Dienste ML vereinfachen, müssen Entwickler den Unterschied zwischen Klassifizierung, Clustering, Regression und anderen grundlegenden Algorithmen kennen.

SageMaker hält Sie beispielsweise in einem Wall Garden aus etwa einem Dutzend vorgefertigten Algorithmen. Wenn Sie ehrgeizig werden möchten, können Sie sie mit ausführen MXnet oder TensorFlow tiefes Lernen. Sie stellen die Modelle mit einem einzigen Klick auf einer serverlosen Infrastruktur bereit, in der der Dienst den Cluster automatisch skaliert. Der Dienst von Google befindet sich in einem früheren Stadium und ist ehrgeiziger auf neuronale Netze ausgerichtet. Derzeit sind jedoch nur Bildverarbeitungsmodelle verfügbar.

Azure Machine Learning Studio ähnelt eher einer klassischen IDE, was nicht überraschen sollte, da es von demselben Unternehmen stammt, das es gebracht hat Visual Studio in die Welt. Wie SageMaker enthält auch das Azure-Angebot eine Bibliothek vorgefertigter Algorithmen, die Sie in ein Experiment integrieren. Alternativ können Sie auch zu gehen Azure AI-Galerie um von Experimenten zu profitieren, die bereits von anderen Mitgliedern der Community geteilt wurden. Experimente sind als eigenständige Module organisiert, die die Algorithmen enthalten. Entwickler durchlaufen Schritte wie die Vorbereitung der Daten, die Definition der Merkmale (oder Parameter) des Modells und die Auswahl der Algorithmen. Dann beginnt der Spaß, wenn Sie einen Datensatz auf die Leinwand legen und das Experiment ausführen, zunächst um das Modell zu trainieren und es dann auf den Datensatz anzuwenden, bei dem Sie die Vorhersageergebnisse wünschen.

Die Idee der Demokratisierung der Analytik ist für Big Data und maschinelles Lernen heute noch genauso wichtig wie zu Beginn der modernen BI vor 20 Jahren. Es folgte ganz der Tradition der Demokratisierung der Anwendungsentwicklung von IDEs wie Visual Studio wurde vor Jahren eingeführt und erweiterte das Feld über Informatik hinaus auf Musik, Philosophie und Englisch Hauptfächer. Mit AppDev gelang die Demokratisierung wohl, aber mit BI dauerte es noch mehr als ein Jahrzehnt, bis die Welt sie bekam Tableau-Datenextrakte.

Einerseits war der Preis für die Demokratisierung ein Gewirr aus undokumentiertem Spaghetti-Code und die Verbreitung von BI-Visualisierungen, die Fragen zur Datenverwaltung, -aktualität und -konsistenz aufwerfen. Und beim maschinellen Lernen, genau wie zuvor bei der Datenwissenschaft, müssen Sie Strafen zahlen, wenn Sie die falschen Datensätze auswählen oder die falschen Signale identifizieren. Für ML gibt es eine zusätzliche Herausforderung: Datensätze und Modelle weichen von Natur aus ab (ja, das gibt es). Werkzeuge dafür).

Aber die Tore wurden aus einem bestimmten Grund geöffnet. Für AppDev gab es einfach nicht genügend formal ausgebildete Programmierer, um den Appetit auf eine neue Generation verteilter Desktop- und Webanwendungen zu stillen. Und selbst wenn es genug Mainframe-Programmierer gäbe, hätten sie die Natur wahrscheinlich nicht verstanden dieser neuen verteilten Apps oder die für die Entwicklung erforderlichen Bottom-up-, schnellen und später agilen Entwicklungsprozesse ihnen.

Für BI spiegelte das Aufkommen der Self-Service-Visualisierung die Notwendigkeit wider, dass Geschäftsbereiche angesichts sich verändernder Märkte agiler werden müssen. Für ML steht es noch am Anfang, die Kosten schlecht konzipierter Modelle zu beurteilen. Ja, das gab es auf jeden Fall viel Gepäck um die Vorstellung von Citizen Data Scientists herum. Und wenn es ein Äquivalent für maschinelles Lernen gibt, werden sich diese sogenannten Bürger nicht damit befassen Entwicklung hochentwickelter Modelle, für die Global-2000-Unternehmen Absolventen der Datenwissenschaften mit Spitzenleistungen auszeichnen Dollar für. Aber wenn Erfahrung mit AppDev und Bi Anzeichen dafür sind, gibt es möglicherweise keine andere Wahl, als die Tore für mehr zu öffnen bescheidene, gut abgegrenzte, alltägliche prädiktive Analyse, Text- oder Bilderkennung oder im Zusammenhang mit der Sprachübersetzung Probleme.