Was tun mit den Daten? Die Entwicklung von Datenplattformen in einer Post-Big-Data-Welt

  • Sep 05, 2023

Der Vordenker Esteban Kolsky stellt sich der großen Frage: Wie werden Datenplattformen aussehen, nachdem der Hype um Big Data vorbei ist und „Lösungen“ für Big Data zur Verfügung stehen?

jump-into-data-lake.jpg

Hinweis: Der herausragende Vordenker Esteban Kolsky, Gründer und Geschäftsführer von ThinkJar, hat bereits Gastbeiträge in diesem Blog geschrieben. Immer wieder bringt der Typ auf den Punkt, was den Kern des zeitgenössischen Denkens ausmacht und wie man sich ihm nähern kann.

Dieses Mal geht er auf den Kern der Entwicklung der Geschäftswelt und der Voraussetzungen für einen transformativen Erfolg ein – und damit sind Ökosysteme und Plattformen gemeint.

Dieser Beitrag ist der erste von zwei, die er hier haben wird. (Teil zwei kommt nächste Woche.) Die Idee für diese Beiträge entstand aus Recherchen, die Esteban gerade abgeschlossen hat Radius, ein Unternehmen, das sich als Anbieter von Kundendatenplattformen (CDP) für B2B-Umsätze auszeichnet Mannschaften. Diese Forschung inspirierte mehr als nur einen Beitrag mit Marktdaten; Dies ist eine wichtige Überlegung darüber, wohin sich Datenplattformen in einer Welt entwickeln, die (mehr oder weniger) gelöst hat.

Große Daten.

Also, Esteban, fang an, den Ball ins Rollen zu bringen ...


Siehe auch

Big Data und digitale Transformation: Wie das eine das andere ermöglicht

In Daten zu ertrinken ist nicht dasselbe wie Big Data. Hier ist die wahre Definition von Big Data und ein eindrucksvolles Beispiel dafür, wie es zur Förderung der digitalen Transformation genutzt wird.

Lies jetzt

Vielen Dank, Paul, dass ich Ihren Blog nutzen durfte, um über Daten und Datenplattformen zu berichten. Ich möchte die Recherche, die ich durchgeführt habe, in zwei Beiträge aufteilen (zur einfacheren Nutzung). Erstes (dieses) über die Entwicklung von Daten, und der zweite (nächste) über die Entwicklung von Datenplattformen.

Im „Thought Leadership Interwebz“ wurde in letzter Zeit viel darüber diskutiert, wie Daten am besten aggregiert werden können. Wir sprechen über Datenseen, Sümpfe, BI, MDM, CDP und vieles mehr – aber nichts davon bietet eine einfache Lösung für das Problem, wie die Datennutzung in einer digital transformierten Organisation optimiert werden kann.

Auch: IBM Cloud Private for Data bereitet die Red Hat OpenShift-Zertifizierung und das Suchtool Queryplex vor

Das Problem hat sich kürzlich auf die Führungsebene ausgeweitet, wo ich Gespräche über die Unterschiede zwischen ihnen allen führe. Wo hat dieses ganze Problem angefangen? Ich bin froh, dass du gefragt hast.

Datenentwicklung: Wo alles begann

Überwältigende Datenmengen lösten das Problem aus.

Bis 2025 wird das Volumen aller Daten Die erstellte Datei wird 163 ZB (Zettabyte) überschreiten. Unternehmen werden einen 50-fachen Anstieg der zu verwaltenden Daten erleben. Dies ist es, was wir in den letzten fünf bis sechs Jahren unter dem Namen verwendet haben Große Daten. Wie alle reinen Technologielösungen wurden sie schnell zu „Lösungen“, die nach zu lösenden Problemen suchten – nicht nach der Lösung bestehender Probleme.

Was heute verfügbar ist, konzentriert sich eher auf die schiere Menge der verfügbaren Daten (Big Data) und darauf, wie diese gespeichert werden, als darauf, einen Nutzen daraus zu ziehen. Wenn wir nur Daten verarbeiten wollten, wäre die Big-Data-Bewegung in Ordnung gewesen, aber da wir mehr wollten, wurden umsetzbare Erkenntnisse zum heiligen Gral der Daten (Datenverarbeitung kurz nach Beginn von Big Data und der Ursprung der digitalen Transformation) müssen wir verschiedene Wertversprechen für diese Flutwelle finden von Daten.


In den letzten 10 Jahren haben wir einen langsamen Fortschritt von einfachen, demografischen gespeicherten Daten hin zu mehrdimensionalen Daten erlebt Data-in-Use: Wir sind von der Schaffung riesiger elektronischer Speicherbereiche für Daten abgerückt und haben begonnen, sie in zu nutzen Echtzeit; Leider werden die meisten Unternehmensdaten heute immer noch in unterschiedlichen Systemen gespeichert und warten darauf, verarbeitet zu werden. Der Wert entsteht durch die Aggregation der richtigen Daten aus unzähligen Quellen und deren effiziente und effiziente Nutzung Wir können geschäftliche Probleme effektiv lösen und Prozesse optimieren – und dazu müssen wir es tun verstehen, was die Daten zeigen, nicht nur die Daten selbst.

Wir haben kein Problem damit, Daten zu finden, wir können mehr finden, als wir brauchen. Das Problem besteht darin, es angemessen zu nutzen.

Auch: Apache Flink nimmt ACID

Unternehmen beginnen, das Konzept der datengesteuerten, ergebnisorientierten und kundenorientierten Vorgehensweise zu verstehen Betriebsabläufe und die Notwendigkeit einer digitalen Transformation (Gewährleistung eines einfachen und reibungslosen Datenflusses im gesamten Unternehmen). Unternehmen). Die meisten von ihnen verfügen über frühe Strategien und Abläufe.

Das größte Problem bleibt, zu verstehen, wie sich Daten auf Transaktionen und Prozesse auswirken (was Daten sind). und wie man es nutzt, um beabsichtigte Geschäftsergebnisse zu erzielen) und nicht in der Lage zu sein, aus der Vergangenheit zu lernen Ergebnisse. Hier liegt das „Gold in den Hügeln“ – die Nutzung der gewonnenen Erkenntnisse zur kontinuierlichen Optimierung und nicht nur zu einmaligen Verbesserungen. Der Zusammenhang zwischen digitalen Strategien und vorhandenen Daten ist das Erforderliche Datenplattformen, aber zuerst müssen wir schwerwiegende betriebliche Probleme beheben.

Wir haben vier Probleme festgestellt, mit denen Unternehmen bei der Nutzung von Daten konfrontiert sind:

Schlechte Operationalisierung. Alle Unternehmen verfügen über Analysetools, nur nicht über die richtigen. Wie man all diese Tools in einem gemeinsamen Datenmodell zusammenfasst und dieses dann für die Geschäftsabwicklung nutzt, ist die Operationalisierungsstrategie, die den meisten Unternehmen fehlt.

Schlechte Daten, das passiert. Die Ära von „Große Daten„Der Anteil schlechter Daten in Unternehmen liegt bei durchschnittlich 40 Prozent. Eine schlechte Aggregation von Daten birgt ein inhärentes Risiko – und die von uns verwendeten Tools zielen nicht darauf ab, dieses Problem zu lösen, sondern vielmehr auf die Vergrößerung der gespeicherten Daten.

Erschöpfte Ressourcen. Alle Organisationen, mit denen ich spreche, haben das gleiche Problem: Nicht genügend qualifizierte Ressourcen (Menschen, Geld, Technologie, Zeit), um die benötigte Arbeit mit Daten zu erledigen.

Verständnis. Jeder weiß, was Daten bedeuten; Es gibt viele Definitionen, und wir verwenden sie schon seit fast einer Ewigkeit, um Unternehmen zu führen. Aber nur wenige verstehen, wie es funktioniert. Schuld daran ist der Mangel an Datenverwaltung und Investitionen im Zuge des Unternehmenswachstums.

Managementtechniken, Speicherung, Manipulation, Analyse – sie alle haben sich in den letzten Jahren dramatisch weiterentwickelt und die Welt der Big Data geschaffen. Sie haben nur ein größeres Durcheinander hinterlassen: Zu viele Daten, nicht genügend daraus gewonnene Erkenntnisse Daten.

Auch: Big Data ist heute ein Wirtschaftszweig und nicht nur Technologie TechRepublic

Und die falschen Werkzeuge, um es auch in Zukunft gut zu machen.

Posten Sie die Big-Data-Welt und was mit den Daten zu tun ist

Hervorgehoben

  • Ist Windows 10 zu beliebt für sein eigenes Wohl?
  • 5 Wege, den besten Ort für den Berufseinstieg zu finden
  • So wird generative KI die Gig Economy zum Besseren verändern
  • 3 Gründe, warum ich dieses 300-Dollar-Android dem Pixel 6a von Google vorziehe

Wir befinden uns in einer Post-Big-Data-Welt.

Das ursprüngliche Versprechen von Große Daten – Sammeln Sie genügend Informationen und Sie werden einen Weg finden, diese zu nutzen, um Abläufe und Ergebnisse zu verbessern – gescheitert. Um es mit The Notorious B.I.G zu sagen: Je mehr Daten wir finden, desto mehr Probleme sehen wir.

Am Ende hatten wir eine Menge Daten in voneinander isolierten Silos, die die Benutzer überforderten die versuchen herauszufinden, wie man es nutzt, und die IT-Leute, die versuchen herauszufinden, wie man es verwaltet Es.

Dies ist der Beginn des Post-Big-Data-Weltdilemmas.

Die meisten großen Datensammlungen sind ungenau, überwältigend, komplex und werden in der Regel in Silos gespeichert. Die Organisation glaubt, dass dies der Fall ist Daten – aber was sie haben, ist eines von zwei Dingen: Rauschen, das niemals in ein Signal umgewandelt wird und nur dem Endergebnis hilft Speicheranbieter oder nicht verbundene, nicht korrelierte, unterschiedliche und schlechte Daten, die nutzlos sind, weil sie nicht wissen, wie oder warum benutze es.

Auch: Die Macht von IoT und Big Data

Die erhobenen, verarbeiteten, gespeicherten und genutzten Daten müssen stets zweckgebunden sein. Früher bestimmte das Unternehmen, was der Zweck war, aber jetzt verlangt der Kunde spezifische Ergebnisse, die die Art und Weise ändern, wie viele Daten verarbeitet, gespeichert und genutzt werden.

Entscheidend ist nicht die Menge der erfassten Daten, sondern der tatsächliche Nutzen der Daten. Während wir immer weiter in die datenbasierte Entscheidungsfindung vordringen, sowohl automatisch als auch durch die Unterstützung von Menschen bei der Entscheidungsfindung, erfordern Prozesse Bessere, sauberere Daten und Lehren aus der Vergangenheit (umsetzbare Erkenntnisse), um die Art und Weise, wie wir mit Daten arbeiten – sowohl historischen als auch neuen – kontinuierlich zu verbessern Daten. Zu erfahren, was beim letzten Mal passiert ist, wird uns beim nächsten Mal helfen, bessere Entscheidungen zu treffen, genau wie im wirklichen Leben (und wird zur Grundlage für maschinelles Lernen und künstliche Intelligenz).

Das Speichern von Daten für den Fall, dass wir sie eines Tages benötigen, trägt nur dazu bei, Prozesse mit nutzlosem Lärm zu verschmutzen. Organisationen müssen verstehen, was die Daten Die verwendeten Daten stellen dar, woher sie kommen, wohin sie gehen und wie sie verwendet werden, aber noch wichtiger: Welchen Wert bieten die Daten, wie sie verwendet und gespeichert werden?

Auch: Aus Big Data Geschäftseinblicke machen

Diese Parameter ergeben dann ein vollständiges aggregiertes Echtzeitdaten-Repository, das verwendet werden kann um Kundenerwartungen zu verstehen, Prozesse zu optimieren, Ergebnisse zu erzielen, Erkenntnisse zu generieren und mehr.

Dafür benötigen Sie jedoch eine gute Datenplattform. Und das ist der nächste Beitrag...


BEACHTEN: Der Registrierung für die CRM Watchlist 2019 und die Anmeldung für Der Emergence Maturity Index Award für 2019 schließt im September. 30, keine Verlängerung möglich. Wenn Sie also sicherstellen möchten, dass Sie dazugehören (Einzelheiten finden Sie unter den Links in den Namen), dann haben Sie noch etwa drei Wochen Zeit. Ich würde es tun, wenn ich du wäre, obwohl ich es nicht bin. Du, das heißt.

Um das Anmeldeformular für beide anzufordern, senden Sie mir bitte eine E-Mail an Mail an: [email protected].

Dies sind die größten Hacks, Leaks und Datenverstöße des Jahres 2018

Bisherige und verwandte Berichterstattung:

Die Vergangenheit, Gegenwart und Zukunft des Streamings: Flink, Spark und die Bande

Reaktive Echtzeitanwendungen erfordern ereignisreiche Datenflüsse in Echtzeit. Dies ist die Prämisse, auf der sich eine Reihe von Streaming-Frameworks stark verbreitet haben. Der jüngste Meilenstein war das Hinzufügen von ACID-Funktionen. Lassen Sie uns also eine Bilanz ziehen, wo wir auf dieser Reise stromabwärts – oder flussabwärts – stehen.

Arcadia Data bringt Abfragen in natürlicher Sprache in den Data Lake

Arcadia Data bietet als neueste Abfrageschnittstelle ein Textfeld im Suchmaschinenstil und bringt BI-Abfragen in natürlicher Sprache in den Data Lake.

Dieses Startup glaubt, dass es weiß, wie man die Echtzeitanalyse von Unmengen an Daten beschleunigt

Die riesigen Datenmengen, die von Unternehmen gesammelt werden, zu verstehen, ist ein Problem für Unternehmen, das laut Iguazio gelöst ist.