AWS treibt maschinelles Lernen mit neuem Chip und elastischer Inferenz voran

  • Sep 04, 2023

Um den hohen Inferenzkosten entgegenzuwirken, führte AWS bei re: Invent Amazon Elastic Inference und einen neuen Prozessor namens AWS Inferentia ein.

Hervorgehoben

  • Ist Windows 10 zu beliebt für sein eigenes Wohl?
  • 5 Wege, den besten Ort für den Berufseinstieg zu finden
  • So wird generative KI die Gig Economy zum Besseren verändern
  • 3 Gründe, warum ich dieses 300-Dollar-Android dem Pixel 6a von Google vorziehe

Mit der Einführung von Amazon Elastic Inference können Kunden jede EC2-Instanz mit GPU-Beschleunigung ausstatten, um schnellere Inferenzen zu erzielen und 75 Prozent einzusparen. Typischerweise beträgt die durchschnittliche Auslastung von GPUs während der Inferenz 10 bis 30 Prozent, sagte Jassy.

Auch: Top-Cloud-Anbieter 2018: Wie AWS, Microsoft, Google Cloud Platform, IBM Cloud, Oracle und Alibaba im Vergleich abschneiden

Da immer mehr Unternehmen maschinelles Lernen in der Cloud nutzen, führt Amazon Web Services neue Funktionen und Tools ein, um die Inferenz zu verbessern. Konkret geht es um die Einführung von Amazon Elastic Inference und die Vorstellung eines neuen Prozessors namens AWS Inferentia.

„Wenn Sie über die Kostengleichung nachdenken … Der überwiegende Teil der Kosten – wahrscheinlich etwa 90 Prozent davon – entfällt auf Schlussfolgerungen“, sagte Andy Jassy, ​​CEO von AWS, auf der re: Invent-Konferenz in Las Vegas.

Mit Elastic Inference können Sie jede EC2-Instanz nutzen und elastische Inferenz direkt zum Zeitpunkt der Erstellung dieser Instanz bereitstellen. Sie können bei 1 Teraflop beginnen oder bis zu 32 Teraflops erreichen. Elastic Inference kann erkennen, wann eines der wichtigsten Frameworks auf dieser Instanz ausgeführt wird, und bestimmen, was von der Beschleunigung profitieren würde.

Auch: Cloud Wars 2018: 6 Dinge, die wir gelernt haben

AWS bezüglich: Erfinden

  • Neuer AWS-Service, der Sie zum DevOps-Guru macht
  • CEO Jassy wehrt sich gegen Wachstumsraten vs. Rivalen
  • AWS erwartet mehr Datenbank-Workloads
  • Die QuickSight Q-Vorschau zielt auf den BI-Markt ab
  • Was Mac EC2-Instanzen für Apple-Entwickler bedeuten
  • Jassy spricht über AWS Outposts, Wavelength
  • Amazon baut seine Contact-Center-Dienste aus
  • Zu den neuen Recheninstanzen gehört das rechenintensive C6gn
  • Trainium startet für Modelle für maschinelles Lernen
  • Vorschau: Proton-Container-Management-Service

„Dies ist eine ziemlich bedeutende Veränderung, da es uns ermöglicht, Inferenzen viel kostengünstiger durchzuführen“, sagte Jassy.

Mittlerweile ist AWS Inferentia ein leistungsstarker Inferenzchip für maschinelles Lernen, der speziell von AWS entwickelt wurde. Es wird einen sehr hohen Durchsatz, eine geringe Latenz, eine nachhaltige Leistung und eine hohe Kosteneffizienz bieten, sagte Jassy. Es unterstützt alle wichtigen Frameworks und ist auf allen EC2-Instance-Typen verfügbar.

Während der Keynote wurde außerdem AWS SageMaker Ground Truth angekündigt, mit dem laut Jassy Unternehmen maschinelles Lernen implementieren können, ohne Tausende von Arbeitsstunden für das Training von Modellen aufwenden zu müssen.

Auch: Die Cloud Cam von Amazon findet die richtige Balance für die Sicherheit zu Hause CNET

Der CEO sagte, AWS SageMaker Ground Truth sei ein hochpräziser Trainingsdatensatz, der die Kosten für die Datenkennzeichnung um 70 Prozent senken werde.

Typischerweise „muss man Objekte beschriften, um das Modell zu trainieren …“ Sie müssen wissen, was ein Stoppschild oder ein Fußgänger ist“, erklärte er. „Es erfordert Tausende von Stunden Filmmaterial, und man muss alles beschriften.“

Dieser Prozess ist im Allgemeinen langsam, teuer und schwer durchzuführen. „Die meisten Unternehmen kümmern sich einfach nicht darum und das macht es schwieriger, diese Computer-Vision-Modelle zu entwickeln“, sagte Jassy.

Auch: 51 % der Technikprofis sagen, dass die Cloud die Nr. 1 ist. 1 am wichtigsten TechRepublic

In der Zwischenzeit stellt Amazon SageMaker RL neue Funktionen für maschinelles Lernen in Amazon SageMaker zur Verfügung, um sie mit verstärktem Lernen zu erstellen, zu trainieren und bereitzustellen. Es komme einem „verstärkten Lernen für jeden Entwickler und Datenwissenschaftler“ gleich, sagte Jassy.

„Wir wollen jedem den Zugang dazu ermöglichen“, sagte er und wies darauf hin, dass kleinere Unternehmen in der Lage sein sollten, das zu tun, was die größeren tun.

Cloud-Dienste: 24 weniger bekannte Webdienste, die Ihr Unternehmen ausprobieren sollte

Bisherige und verwandte Berichterstattung:

Was eine Hybrid Cloud im „Multi-Cloud-Zeitalter“ ist und warum Sie möglicherweise bereits über eine verfügen

Da die von einem Unternehmen genutzten und seinen Kunden bereitgestellten Dienste nun möglicherweise auf Servern in der öffentlichen Cloud oder vor Ort gehostet werden, ist die „Hybrid Cloud“ möglicherweise keine Architektur mehr. Auch wenn dies der Fall sein mag, hält das einige in der digitalen Transformationsbranche nicht davon ab, sie als eigene Arbeitsweise zu verkünden.

Cloud Computing: Hier kommt ein wichtiger Wendepunkt

Die Anwendungsausgaben haben sich am schnellsten in die Cloud verlagert, aber auch andere Bereiche der IT-Ausgaben holen auf.

Ähnliche Beiträge:

  • Was ist der beste Cloud-Speicher für Sie?
  • Top-Cloud-Anbieter 2018: Wie AWS, Microsoft, Google
  • Alles, was Sie über die Cloud wissen müssen, erklärt
  • XaaS: Warum „alles“ jetzt ein Service ist
  • Infografik: Warum Unternehmen auf Everything as a Service umsteigen
  • Kostenloser PDF-Download: Die Zukunft von Everything as a Service
  • SaaS, PaaS und IaaS: Verstehen Sie die Unterschiede
  • Cloud Computing: Wie Sie den Schritt schaffen, ohne die Kontrolle zu verlieren
  • Der Cloud-Vorsprung von Amazon schrumpft, während das Wachstum von Microsoft Azure explodiertTechRepublic