Súperí Databricks o úplný analytický balík?

  • Oct 16, 2023

Poskytuje spoločnosť, ktorá stojí za obsahom Apache Spark, zákazníkom hosťované vývojové a spúšťacie prostredie, alebo sa snaží vybudovať komplexné riešenie?

Spark Summit East sa konal minulý týždeň v New Yorku. A hoci som Newyorčan, nie som odolný voči chladu, takže som s deťmi na Bermudách unikal pred mrazivými teplotami. To mi však nebránilo prečítať si moje tlačové správy.

Vyšli dve zaujímavé Databricks minulú stredu, ktorá zahŕňa oznámenia na podujatí. Jeden diskutovali o novej „Community Edition“ cloudovej služby spoločnosti. Ďalší oznámila pridanie novej funkcie palubnej dosky. Tieto nové ponuky samy osebe pôsobia skôr takticky. Keď to však vezmeme spolu a s výhodou deviatich dní premýšľania, rozhodol som sa, že je to dosť veľká vec.

Aby sme pochopili prečo, urobme inventúru toho, čo bolo skutočne oznámené, a potom sa tomu pokúsme pochopiť z hľadiska čoho Apache Spark ponúka natívne a čo ešte ponúka cloudová služba Databricks.

Podpora komunity
Množstvo produktov s otvoreným zdrojom ponúka bezplatné komunitné vydania. A keďže Spark je už open source, je už aj zadarmo pre komunitu. Čo však nie je zadarmo, je hardvér potrebný na jeho spustenie (aj keď v jednoduchom vývoji prostredie) alebo v prípade cloudovej služby, ako je Databricks, cloudový nájomca na praktické využitie s tým.

Databricks sa pokúša vyplniť túto medzeru tým, že ponúka práve takéhoto bezplatného nájomcu. Iste, základná infraštruktúra je to, čo Databricks nazýva „mikroklaster“ a spoločnosť tiež uvádza explicitný scenár up-sell na platenú úroveň. Bezplatné prostredie však znie viac než dostatočne na to, aby ste sa mohli oboznámiť so Sparkom a Databricks, a takáto bezplatná úroveň je nevyhnutnou súčasťou odstránenia trenia pri adopcii.

Komunitná edícia bude spustená ako beta verzia len na pozvanie, ku ktorej budú mať prístup ako prví účastníci Spark Summit East. Ostatní záujemcovia o účasť v beta verzii sa môžu prihlásiť do programu zoznam čakateľov. To je všetko v poriadku. Keď však Databricks Community Edition dosiahne všeobecnú dostupnosť (GA), veci začnú byť zaujímavé. Mnoho zvedavých vývojárov a používateľov s vysokým výkonom údajov by sa mohlo dostať do rúk takmer okamžite.

Oko na palubnej doske
Ďalšie oznámenie zahŕňalo pridanie funkcie dashboardingu na platformu Databricks. Aj tu je význam väčší, ako sa na prvý pohľad zdalo. V skutočnosti by sa niekto mohol čudovať, prečo Databricks už nemá funkciu dashboardingu. A teraz, keď sa tak stane, sa môže zdať, že je dohnaný len ľubovoľným počtom samoobslužných cloudových BI produktov.

databricks-dashboards-screenshot.png
Zdroj: Databricks

Ale o to ide: Databricks vôbec nie je (alebo aspoň nebol) samoobslužným produktom. Bol to produkt vývojára, ktorý poskytuje prístup z príkazového riadku aj k surovým komponentom Apache Spark ako „notebookové“ rozhranie, ktoré je u vývojárov v móde, no pre každého je akosi nezaujímavé inak.

Ale to, čo Databricks teraz urobili, je prebratie rozhrania notebooku a pridanie grafického zobrazenia vo forme nového zariadenia na palubnej doske. Okrem toho sa dashboardy dajú nastaviť pomocou samoobslužného používateľského rozhrania na výber hodnôt parametrov a podobne a môžu byť zdieľané s inými používateľmi prostredníctvom adresy URL. Tí, ktorí nie sú vývojármi, potom môžu mať zabezpečený prístup (niečo iné, čo Databricks pridáva k surovému Sparku) a môžu začať vykonávať nejakú prácu na zisťovaní údajov, aj keď je to obmedzené.

Odporúčané

Je Windows 10 príliš populárny pre svoje vlastné dobro?
5 spôsobov, ako nájsť najlepšie miesto na začatie kariéry
Takto generatívna AI zmení ekonomiku koncertov k lepšiemu
3 dôvody, prečo uprednostňujem tento 300 USD Android pred Pixelom 6a od Google
  • Je Windows 10 príliš populárny pre svoje vlastné dobro?
  • 5 spôsobov, ako nájsť najlepšie miesto na začatie kariéry
  • Takto generatívna AI zmení ekonomiku koncertov k lepšiemu
  • 3 dôvody, prečo uprednostňujem tento 300 USD Android pred Pixelom 6a od Google

Teraz všetci spolu
Keď sa zamyslíte nad Sparkom, ktorý obsahuje jadro jadra, ako aj vstavané komponenty pre SQL dotaz prístup, streamovanie údajov, spracovanie grafov a strojové učenie, máte k dispozícii všestrannú vývojársku platformu údajov. Vrstva na cloude Databricks a odpadá potreba motať sa s hardvérovou infraštruktúrou. Pridajte informačné panely, ktoré je možné zdieľať s inými používateľmi, ktorí nie sú vývojármi, a získate nové funkcie podnikových používateľov.

Dajte to všetko do nižšej bezplatnej úrovne a máte službu, ktorá môže začať konkurovať Microsoft Power BI a ďalšie ponuky cloud BI, s ktorými môžu koncoví používatelia voľne experimentovať. Je pravda, že s vývojárom, ktorý im pomôže, sa ďaleko nedostanú... ale teraz môže analytik povýšiť Spark na svojich vývojárov, okrem toho naopak.

Zaregistroval som sa do beta verzie Databricks Community Edition. Teším sa, že sa mi to dostane do rúk. Ak chce Databricks ponúknuť komplexnú platformu cloudovej analýzy, funkcia dashboardu bude musieť byť viac než len jednoduché vytváranie grafov. Bude to viac? Chce to Databricks?

Budem mať možnosť to zistiť, keď sa porozprávam so spoluzakladateľom a výkonným predsedom Databricks Ionom Stoicom (ako aj s Nehou Narkhede, spoluzakladateľkou a vedúcou inžinierstva v Súvislý -- spoločnosť, ktorá za tým stojí Apache Kafka) na pódiu v Údaje o štruktúre konferencii v San Franciscu 10. marca.