Starburst remporte un nouveau tour de financement en doublant son maillage de données

  • Jul 19, 2023

Starburst étend sa présence à l'Asie-Pacifique et à la présence dans le cloud tout en faisant du maillage des données son objectif principal. Son adoption étroite du maillage de données accélérera-t-elle ou limitera-t-elle la croissance de Starburst?

Données d'étoiles a annoncé cette semaine qu'elle avait plus que doublé son financement avec un nouveau cycle de série D de 250 millions de dollars annoncé cette semaine et l'ouverture d'un nouveau portail frontal vers son moteur de requête distribué. La société affirme que cela a à peu près triplé sa valorisation précédente, pour laquelle il y avait des chiffres publiés contradictoires (ici et ici). Les annonces coïncident avec Datanova, l'événement en ligne annuel de l'entreprise.

Nuage

  • Qu'est-ce que la transformation numérique? tout ce que tu as besoin de savoir
  • Les meilleurs fournisseurs de cloud comparés: AWS, Azure, Google Cloud, etc.
  • Les 6 meilleurs services d'hébergement Web bon marché: trouvez une option abordable
  • Qu'est-ce que l'informatique en nuage? Voici tout ce que vous devez savoir

À l'aube de 2022, l'entreprise continue de doubler ses efforts en matière de maillage de données. La page d'accueil de l'entreprise se caractérise comme "Le moteur d'analyse pour le maillage de données". Nous aurons plus à dire à ce sujet dans un instant.

Cette semaine chez Datanova, il annonce une extension qui ajoute un portail frontal de type catalogue à son moteur de requête distribué basé sur Trino. Du côté administratif, le portail permet aux producteurs de données et aux ingénieurs de données de définir des métadonnées, de suivre l'utilisation et d'appliquer un accès et des droits basés sur les rôles. Du côté de l'utilisateur final, ils peuvent utiliser le portail pour découvrir, parcourir et ajouter des révisions d'ensembles de données. Bien qu'il s'agisse d'un catalogue de données au sens "léger", il n'est pas destiné à remplacer les catalogues de données d'entreprise. En tant que catalogue léger contenant son propre moteur de requête, Starburst continue néanmoins de prendre en charge l'intégration à Alation et Collibra.

Sur la feuille de route, Starburst intensifie la prise en charge des nouveaux formats de tableaux de données open source, y compris Lac Delta et Iceberg, avec le soutien de Delta Lake plus loin.

Avec le nouveau financement, un thème clé pour Starburst cette année est l'expansion mondiale, en particulier dans la mise sur le marché; alors qu'elle est actuellement présente sur le terrain en Amérique du Nord et en Europe, cette année marque le point où elle s'implantera en Asie et dans le pourtour du Pacifique. Soulignant cela, il ajoute Alibaba pour son service cloud Galaxie (qui est passé en GA il y a seulement deux mois sur AWS, Azure et Google Cloud). Starburst joue également son partenariat avec Red Hat, à la fois sur le cloud privé et pris en charge sur Red Hat OpenShift Dedicated, un service géré par Red Hat sur AWS et Google Cloud. Starburst est certifié sur OpenShift, est disponible sur le marché Red Hat et est l'un des quatre seuls ISV en Service cloud OpenShift Data Science de Red Hat. Et il y a une montée en puissance de l'engagement avec les suspects habituels des intégrateurs de systèmes mondiaux.

Starburst Enterprise est également disponible sur HPE Marketplace en tant que moteur de requête distribué pour HPE Ezmeral Runtime, et les deux lanceront bientôt une commercialisation conjointe en Amérique du Nord et en Europe. Mais, pour mémoire, il en va de même pour le rival de Starburst, Ahana, où une partie de l'équipe de direction partage des racines communes avec la partie de l'équipe produit Ezmeral issue de MapR.

Starburst en est encore à ses débuts où la croissance est géométrique; son activité a triplé annuellement ces trois dernières années. Le point culminant est le lancement récent de Starburst Galaxy, le service cloud géré; n'ayant été publié qu'à la fin de l'année dernière, l'activité cloud SaaS n'apparaît pas encore fortement dans les chiffres des revenus. Bien que Starburst ne soit pas sur le point d'abandonner les clients sur site ou autogérés pour l'entreprise Starburst, il y a un petit secret que l'entreprise prévoit le gros de la croissance future provenant du cloud SaaS service.

Et c'est là qu'un nouvel ajout clé à l'équipe de direction, Javier Molina en tant que Chief Revenue Officer, jouera un rôle clé. Auparavant SVP pour les ventes mondiales chez MongoDB, le Atlas Service SaaS était à l'avant-plan. Lancé il y a bientôt six ans, Atlas représente désormais plus de la moitié des revenus de MongoDB. Une leçon clé que Molina tire est qu'Atlas n'a pas connu une croissance explosive du jour au lendemain. Ce n'est qu'avec l'acquisition de mLab, qui a ajouté l'intégration en libre-service, qu'Atlas a atteint sa trajectoire actuelle. Avec Starburst Galaxy lancé il y a à peine deux mois, vous pouvez vous attendre à ce qu'il y ait du lourd l'accent mis sur le libre-service, permettant aux clients de le consommer à la demande sans les formalités administratives contrats.

De toute évidence, Starburst se positionne pour surmonter les petites batailles de partage d'esprit concernant qui a le moteur de recherche le plus open source en positionnant la requête distribuée, qui est au cœur de sa technologie Trino, comme un rouage clé dans la construction produits de données. Et la création de produits de données est au cœur de l'adoption par Starburst du maillage de données. Ils en font la promotion au point où le maillage de données est devenu le slogan de l'entreprise. Et ils sont un source d'accès aux projets de chapitres résumés depuis Chez Zhamak Dehghani (auteur du concept actuel de maillage de données) livre à venir.

En se présentant comme "le moteur d'analyse du maillage de données", Starburst marche sur une ligne fine, car le maillage de données n'est pas une technologie; il s'agit d'un ensemble de meilleures pratiques et de modèles de conception architecturale pour localiser le contrôle du cycle de vie des ensembles de données, qui doivent être traités comme des produits. Donc, non, Starburst n'appelle pas Starburst Enterprise ou Galaxy une solution de maillage de données en soi. Mais la distinction est assez subtile.

Bien sûr, les outils et les technologies seront essentiels pour supporter les différentes tâches de maillage de données. Et il existe de nombreuses tâches qui surpasseront les humains, de la gestion et de l'automatisation de l'ingestion de données, des pipelines de données, de la qualité des données et de la validation que les données sont fiables, valides et à jour. Les humains dirigent clairement le processus, mais la technologie adapte leurs efforts.

Aller droit au but: Starburst Enterprise ou Galaxy n'est qu'une pièce du puzzle du maillage de données. Mais le maillage de données n'est qu'une pièce du puzzle Starburst. Expliquons-nous.

Comme nous l'avons précisé (ici et ici), nous nous attendons à ce que cette année, les maillages de données fassent l'objet de leur premier examen sérieux et de leur retour de flamme. C'est en fait une bonne chose. Il faut s'y attendre pour toute pratique technologique qui fait l'objet d'un examen approfondi. Bien qu'il existe des organisations qui revendiqueront des victoires du jour au lendemain, le maillage de données sera toujours un voyage, et toutes les organisations n'adopteront pas ces pratiques.

La requête distribuée sera un élément clé de l'exécution pour toute organisation axée sur les données, qu'elle adopte ou non les pratiques de maillage de données. Alors que Starburst est certainement sur la bonne voie en soulignant le rôle de la requête distribuée et ses crochets pour gouvernance, il serait logique que Starburst généralise également son message et ne soit pas lié à la hanche pour maillage de données. Et c'est là que les synergies avec les data fabrics pourraient commencer.

Big Data

Comment savoir si vous êtes impliqué dans une violation de données (et que faire ensuite)
La lutte contre les préjugés dans l'IA commence par les données
Prévision juste? Comment 180 météorologues fournissent des données météorologiques "assez bonnes"
Les thérapies contre le cancer dépendent de quantités vertigineuses de données. Voici comment c'est trié dans le cloud
  • Comment savoir si vous êtes impliqué dans une violation de données (et que faire ensuite)
  • La lutte contre les préjugés dans l'IA commence par les données
  • Prévision juste? Comment 180 météorologues fournissent des données météorologiques "assez bonnes"
  • Les thérapies contre le cancer dépendent de quantités vertigineuses de données. Voici comment c'est trié dans le cloud

Big Data

Comment savoir si vous êtes impliqué dans une violation de données (et que faire ensuite)
La lutte contre les préjugés dans l'IA commence par les données
Prévision juste? Comment 180 météorologues fournissent des données météorologiques "assez bonnes"
Les thérapies contre le cancer dépendent de quantités vertigineuses de données. Voici comment c'est trié dans le cloud
  • Comment savoir si vous êtes impliqué dans une violation de données (et que faire ensuite)
  • La lutte contre les préjugés dans l'IA commence par les données
  • Prévision juste? Comment 180 météorologues fournissent des données météorologiques "assez bonnes"
  • Les thérapies contre le cancer dépendent de quantités vertigineuses de données. Voici comment c'est trié dans le cloud