Hortonworks presenta la soluzione di avvio rapido per l'ottimizzazione del data warehouse

  • Oct 19, 2023

Hortonworks sta facendo il passo successivo con gli strumenti OEM che ora rivende, introducendo un impegno prescrittivo e immediato per implementare il pacchetto completo. Dato che il mercato richiede accessi più semplici a Hadoop, riteniamo che Hortonworks dovrebbe portare questo nuovo programma di avvio nel cloud.

Circa sei mesi fa, abbiamo scritto di Hortonworks' evoluzione da una strategia dogmatica open source pura a una strategia che sia di più pragmatico. La sua piattaforma principale rimane open source al 100%, ma come abbiamo notato, l'azienda assomiglia molto di più ai suoi rivali nell'aggiungere contenuti specifici del fornitore attraverso partnership di rivendita con Sincronizza per la trasformazione dei dati e In scala per fornire viste data mart OLAP virtuali.

Guarda anche

Il potere dell’IoT e dei Big Data

Approfondiremo dove l'IoT avrà il maggiore impatto e cosa significherà per il futuro dell'analisi dei big data.

Leggi ora

Ora Hortonworks sta compiendo il logico passo successivo, introducendo un'offerta prescrittiva basata sui servizi per implementare il pacchetto di strumenti Hortonworks e OEM. La nuova soluzione di ottimizzazione Hortonworks EDW offre un impegno immediato, guidato dai servizi in 7-8 settimane, per i clienti che non conoscono Hadoop e desiderano estendere i propri data warehouse. Raggruppare il

Piattaforma dati Hortonworks (HDP) con Syncsort DMX-h e AtScale, la nuova offerta è progettata per portare i clienti alla fase di prototipo.

Anche:Hortonworks e Neustar collaborano per proteggere l'IoT, seguiranno ulteriori sforzi | I fornitori di Hadoop stanno ascoltando: Hortonworks diventa pragmatico | Non tutti i cloud Big Data sono uguali

Questa offerta affronta due questioni fondamentali: in primo luogo, l'implementazione di Hadoop può essere complessa e intimidatoria per i nuovi clienti; e in secondo luogo, rimane la necessità perenne di domare i problemi più banali di integrazione dei sistemi relativi a qualsiasi progetto di data warehouse o data mart.

I clienti target sono coloro che desiderano utilizzare Hadoop per i suoi cicli di elaborazione e archiviazione più economici per spostare alcuni carichi di lavoro, come ETL; estendere l'analisi in un caso d'uso di "archiviazione attiva" per includere dati storici più vecchi; o costruire nuovi data mart. Ad esempio, mentre lo strumento Syncsort DMX-h può generare e indirizzare una gamma più ampia di tipi di dati (ad esempio JSON), l'offerta Hortonworks si concentra strettamente sulla trasformazione dei dati strutturati convenzionali provenienti da dati magazzini.

L’idea pratica è che Hadoop sarà una piattaforma più economica per molti di questi carichi di lavoro, in particolare con la trasformazione dei dati e l’analisi esplorativa. Ma presuppone anche che il data warehouse rimanga il luogo più adatto per le analisi operative di routine. Ecco perché Hortonworks etichetta questo impegno come ottimizzazione del data warehouse, non come sostituzione.

L'impegno comprende consulenti sul campo Hortonworks che installano HDP, Syncsort e AtScale; configurazione di origini e destinazioni, processi (ad esempio, Hive LLAP per SQL interattivo) e interfacce ODBC/JDBC; routine di trasformazione dei dati; creare fino a tre cubi OLAP virtuali in AtScale; e demo dei risultati.

Sebbene esistano molti casi d'uso per Hadoop, l'ottimizzazione EDW è spesso la prima in quanto obiettivi come lo spostamento di ETL possono generare un ROI tangibile. E questo spiega perché Hortonworks ha mirato in modo mirato questo pacchetto di avvio a questo scenario.

La soluzione Hortonworks EDW Optimization arriva in un momento propizio. Ad oggi, stimiamo che la base installata di Hadoop sia poco più di 3000. Questa è ovviamente solo la punta dell'iceberg nel mercato complessivo del data warehousing e dell'analisi.

Hadoop è stato scherzosamente definito una raccolta di animali dello zoo, in parte perché molti dei progetti prendono il nome da creature selvatiche, ma anche perché anche quei progetti comportarsi come creature selvatiche. E non sorprende che il profilo degli early adopter sia quello di coloro che dispongono di organizzazioni IT con le risorse e le competenze per affrontare progetti complessi, come ad esempio domare quelle creature. Per i prossimi 3.000 adottanti, le cose dovranno diventare molto più semplici.

Ed è per questo che Hortonworks svela questo pacchetto e molte altre opzioni onramp mirate. Quelli ovvi sono i servizi gestiti di analisi dei big data che si comportano come servizi cloud SaaS occupandosi dell'impianto idraulico, della manutenzione e dell'aggiornamento sottostanti. Tra i più affermati ci sono Elastic MapReduce (EMR) di Amazon E Microsoft Azure HDInsight (che è costruito attorno all'HDP). E nello spazio del data warehousing c'è Amazon Redshift, Data Warehouse SQL di Azure, E Fiocco di neve.

Ma vedi anche servizi più mirati, come macchinaapprendimento da tutti i maggiori nuvolafornitori, E Scintilla dedicataservizi informatici. Vengono forniti con la premessa dell'esecuzione di operazioni mirate piuttosto che di una piattaforma Hadoop o di data warehousing completa. Anche Hortonworks ha alimentato questa narrazione Nuvola di dati Hortonworks, a sua volta un'offerta semplificata costruita attorno ai due carichi di lavoro più popolari di Hadoop: Hive e Spark.

La nostra opinione è che i servizi gestiti nel cloud siano il percorso logico per la prossima ondata di utilizzatori di big data. Riteniamo che entro la fine del 2018, oltre la metà delle nuove implementazioni Hadoop saranno basate sul cloud e i servizi gestiti saranno essenziali per rendere Hadoop – o altre forme di analisi – attraenti per i nuovi adottanti. A partire dall'annuncio odierno, la soluzione Hortonworks EDW Optimization è destinata ai clienti on-premise. Ma il percorso logico sarà che Hortonworks lo estenda al cloud, con Hortonworks Data Cloud che è un obiettivo fin troppo ovvio.

Come trasformare i big data in informazioni aziendali?