Microsofts Hadoop-køreplan afslører nye big data-leverancer

  • Sep 06, 2023

En Microsoft roadmap-dias kaster nogle yderligere detaljer om omfanget af det arbejde, virksomheden udfører for at integrere Hadoop med Windows Azure og Windows Server.

Når det kommer til big data, har Microsoft mere på vej end blot Windows Azure og Windows Server versioner af Hadoop big-data framework. Virksomheden arbejder på en række supplerende værktøjer og teknologier, som den planlægger at udrulle aggressivt i første halvdel af dette år, ifølge en køreplan delt med mig af en af ​​mine kontakter.

Microsoft meddelte sidste efterår, at selskabet var samarbejde med Hortonworks for at skabe Windows Azure og Windows Server Hadoop-distributioner. Virksomhedens embedsmænd delte også via en kort video på Microsofts Channel 9, at Microsoft så ud over disse distributioner sig selv og arbejdede på måder at integrere tovejs med Hadoop-filsystemet og Hadoop-værktøjer som Sqoop og Flume. Microsofts embedsmænd har brugt kodenavn "Isotope" for at henvise til kommende suite af Microsoft-produkter og hjælpeprogrammer, der vil understøtte Hadoop på Windows Azure og Windows Server.

Ifølge køreplansbilledet nedenfor planlægger Microsoft at levere den endelige version af Hadoop på Azure den 30. marts. (Vi vidste, at dette skulle ske et stykke tid i marts, men havde ikke den nøjagtige måldato indtil nu.) På samme tid er Microsoft også planlægger at lancere en teknisk forhåndsvisning af Hadoop på Windows Server, siger køreplanen, med den endelige version af tilbuddet målrettet til udgivelse på 29. juni. (Igen vidste vi, at målet var juni for Hadoop på Windows Server, men vi kendte ikke til en specifik dato.)

mshadooproadmap.png

(klik på dias for at forstørre)

De nøjagtige leveringsdatoer er ikke så interessante for mig, da de sandsynligvis stadig kan ændres noget (i betragtning af at dette dias er dateret december 2011). Her er, hvad jeg fandt langt mere interessant i dette dias:

Kan du se den omtale af "BigTop", der er under punktet Hadoop på Azure GA (generel tilgængelighed)? Det er et virkelig overraskende brag fra fortiden - i det mindste for denne Microsoft-kodenavn-watcher. "BigTop" var et Microsoft-projekt, jeg sidst skrev om tilbage i 2004. BigTop, fra hvad jeg fik at vide, handlede om at hjælpe udviklere med at skabe et sæt løst koblede, distribuerede operativsystemkomponenter på en relativt hurtig måde. Sidst jeg havde hørt Microsoft dræbte det BigTop inkubationsindsats, men det ser ud til, at i det mindste nogle af teknologierne fra den lever i bedste velgående, hvis den er nævnt som en del af den nuværende køreplan.

Opdatering: Tak til læseren Andrew Bayer (@abayer), som gjorde mig opmærksom på den "anden" BigTop -- og den langt mere sandsynlige reference på dette slide. Der er en Apache BigTop det handler om interoperabilitetstest og emballage. Jeg er 99% sikker på, at dette er BigTop, der menes med sliden og ikke den gamle Microsoft BigTop.

Også under punktet Hadoop på Azure GA er en .Net/Common Language Runtime (CLR)/C#-ramme til Hadoop-programmering. Jeg hører brugt, at der ikke er nogen reel C#-understøttelse der endnu, ud over en enkelt sample, som kan bruges i en begrænset kapacitet. Så det bliver interessant at se, hvordan/om dette bliver til i marts.

På Hadoop på serversiden er der endnu en omtale af Active Directory (AD)-integration - noget Microsofts ledere hentydede til i den førnævnte Channel 9 Isotope-video. Køreplanen bemærker også, at System Center (SC)-integration også er på vej. Og på det tidspunkt, hvor produktet er generelt tilgængeligt i slutningen af ​​juni, ser det ud til, at det understøttes "R" statistisk grafik og beregningssprog vil blive indarbejdet, ligesom tilgængeligheden af ​​"secure HDFS" (Hadoop File System).

Jeg har spurgt Microsofts embedsmænd, om de har flere detaljer at dele om deres Hadoop-planer. Intet ord tilbage indtil videre.