Strata NYC prinaša obvestila MapR, Pentaho, Zoomdata in drugih

  • Sep 26, 2023

Letni nastop Strata + Hadoop World v New Yorku je ta teden in poletne suše novic o velikih podatkih je več kot konec.

Avgust je običajno mesec počasnih novic, september pa ponavadi zagotovi protistrup. Letos ni izjema, saj Strata + svet Hadoop ta teden se začne v New Yorku. To jutro prihajajo številne objave; več drugih je bilo včeraj prikritih v novice. Tukaj bom podal povzetek obvestil obeh dni.

Predstavljeno

  • iPhone 15: Zaradi štirih stvari je to leto zabavne nadgradnje
  • Kako uporabljati ChatGPT za izdelavo grafikonov in tabel
  • Vsak izdelek, ki ga pričakujemo na Applovem septembrskem dogodku (in kateri ne bo predstavljen)
  • Najboljše ponudbe telefonov trenutno: prihranite pri najnovejših telefonih iPhone in Android

Začnimo z današnjimi novicami, ki vključujejo obvestila iz MapR, the Pobuda za odprto podatkovno platformo (ODPi), BlueData, Cazena, in Bitno.

ODPi želi narediti svet Hadoop združljiv
Danes ODPi napoveduje svoj novi program interoperabilne skladnosti ODPi in vključitev v ta program aplikacij SAS, WANdisco, SyncSort, DataTorrent, IBM, Pivotal in Xaivent. Interoperable Compliance Program v bistvu potrjuje aplikacije kot združljive s platformami Hadoop, ki so skladne s specifikacijo ODPi Runtime.

Napovedana je tudi različica 2 specifikacije izvajalnega okolja. Medtem ko je različica 1 vsebovala sinhroniziran sklad, sestavljen iz PREJA, MapReduce in Hadoop Distributed File System (HDFS), različica 2 je nadmnožica prve različice, ki dodaja Apache Hive in Podpora za združljiv datotečni sistem Hadoop (HCFS).

Hive, ki je aplikacija, ki se nahaja na vrhu MapReduce in YARN, označuje, da Runtime Spec ne vključuje samo Osrednje komponente Hadoopa, vključno z aplikacijo, zgrajeno na njih, ki je kljub temu del vsakega Hadoopa. distribucija. In dodajanje HCFS specifikaciji pomeni, da MapR in Microsoft HDInsight, ki implementirajo HDFS preko svojih lastniških datotečnih sistemov, bi se lahko teoretično pridružili ODPi. Da bo jasno, MapR in Microsoft sta ne pridružili ODPi, zdaj pa bi teoretično lahko.

MapR in mikrostoritve
Ko že govorimo o MapR, to podjetje napoveduje podporo za arhitekturo mikrostoritev za svojo distribucijo Hadoop. Mikrostoritve MapR so zgrajene na tehnologijah MapR DB, MapR FS (datotečni sistem) in MapR Streams, ki so že bile del distribucije. Toda zdaj obstaja eksplicitna podpora za količine, specifične za mikrostoritve, spremljanje (v celotni gruči) in mikrostoritve za A-B/multivariatno testiranje.

MapR prav tako napoveduje, da bo izdal serijo "konvergentnih načrtov aplikacij", od katerih se bo prvi osredotočil na pretočne podatke visoke hitrosti za trgovanje na finančnih trgih. Načrti so sestavljeni iz vzorčnih aplikacij z izvorno kodo, arhitekturnimi vodniki, skupnim strokovnim znanjem in najboljšimi praksami.

Cazenino podatkovno jezero je azurno modre barve
Cazena, ki ponuja implementacije oblaka "kot storitev" za podatkovne borze in podatkovna jezera, napoveduje, da je slednja storitev zdaj na voljo na Microsoftovi platformi v oblaku Azure. Prej je bila storitev Cazena Data Mart-as-a na voljo na Azure in obe storitvi sta bili na voljo na Amazon Web Services. Zdaj bosta oba na voljo tudi na Azure. Data Lake-as-a-Service temelji na Cloudera Enterprise deluje na virih Azure Infrastructure-as-a-Service. Kljub temu je Cazena vaša edina kontaktna točka za storitev; ni vam treba biti stranka Azure, da bi jo uporabljali, čeprav to zagotovo lahko.

BlueData postane robusten na področju varnosti, mreženja in shranjevanja
BlueData, katere platforma EPIC omogoča hitro uvajanje Hadoop in Spark v kontejnerjih Docker grozdov, napoveduje svojo novo jesensko izdajo, ki zagotavlja avtomatizirano nastavitev Kerberosa na svojem grozdi; avtomatizirano upravljanje LDAP/Active Directory ter uporabnikov in skupin; integracija z orodji za upravljanje privilegiranega dostopa (PAM) Linuxa, kot je BeyondTrust PowerBroker in FoxT ServerControl; ter izboljšano virtualno mreženje in podporo za shranjevanje.

ETL ni več umazana beseda
Bitwise, podjetje, ki je zame novo, napoveduje izdajo svojega izdelka Hydrograph, ki zagotavlja platformo Extract transform and Load (ETL), ki je izvorno implementirana na Hadoop. Pod pokrovom uporablja Hydrograph Kaskadno za ustvarjanje opravil MapReduce za izvajanje opravil ETL. Bitwise pravi, da je njegova arhitektura vtična in to sprejetje Apache Spark in Apache Flink ker bi lahko izvedba posla prišla pozneje. Družba pravi, da bi lahko izdelek sčasoma postal tudi odprtokoden.

Včeraj, ne tako daleč
Tudi včeraj je bilo na Strati več objav. Kar se tiče financiranja, Kinetica (ki ponuja podatkovno bazo v pomnilniku, pospešeno z grafičnimi procesorji) je napovedal zbiranje 6 milijonov dolarjev financiranja pospeševanja in Podatki o podiju (ki ponuja platformo za upravljanje podatkovnega jezera) je napovedal svoj krog serije A v vrednosti 9,5 milijona dolarjev, ki ga vodi Malibu Ventures.

Na sprednji strani nove izdaje Pentaho napovedal nove stvari za svojo platformo za integracijo podatkov PDI. Ti vključujejo globljo integracijo Apache Spark; izboljšana integracija Kerberos; Apaški stražar integracija; Apaš Kafka podpora; in podporo za Avro in Parket formati datotek. Pentaho je dodal več kot 30 korakov transformacije za Hadoop, HBase, JSON, XML, Vertica, Greenplum.

Maana ponuja tisto, kar imenuje svojo platformo znanja, ki združuje AI, semantično iskanje in neposredno analitiko za ustvarjanje poslovnih priporočil in njihovo integracijo v linijo poslovnih aplikacij. Maana 2017 na platformo dodaja pomočnike znanja in aplikacije znanja. Prvi omogočajo optimizacijo dobavne verige, klicnega centra, terjatev, prediktivnega vzdrževanja in drugih področij. Slednje olajšajo analize časovnih vrst; iskanje pomenske podobnosti znotraj primerkov, primerov, dogodkov in zapisov; in pridobivanje znanja iz nestrukturiranih dokumentov.

Lightbend je objavil svojo novo platformo za hitre podatke (FDP) -- ki uporablja Apache Kafka, Spark, Flink, Mezosfera DC/OS, OpsClarityin Lightbendove lastne tehnologije – da bi razvijalcem olajšali izdelavo aplikacij za pretakanje podatkov.

končno, Zoomdata napovedal partnerstva in integracije z Cloudera za Cloudera Enterprise, Google za BigQuery in Teradata za bazo podatkov Teradata in napravo Teradata za Hadoop, vključno s Cloudero in Hortonworks izdaje. Zoomdata je tudi objavila razpoložljivost 30-dnevne preskusne izdaje izdelka na Amazon Web Services Marketplace.

Več jutri?
Vse te novice, pa je šele torek. Medtem sta glavna konferenčna dneva v Strati sreda in četrtek. Bo novosti še več? Nisem prepričan, a v teh dveh dneh bom sedel za več kot ducat sestankov prodajalcev. Tudi če je novic konec, se je analiza komaj začela.