File system MapR selezionato da SAP per il livello di archiviazione cloud

  • Oct 19, 2023

SAP utilizza il file system del fornitore di distro Hadoop MapR nel suo livello di archiviazione cloud e non solo per Hadoop/Big Data.

È una novità che potrebbe causare grandi doppietti nel mondo dei Big Data. MappaR ha annunciato martedì che il file system nel suo file Piattaforma dati convergente La distribuzione Hadoop è stata scelta da LINFA da utilizzare come la sua nuvola tecnologia di archiviazione per HANA, QI SAPe carichi di lavoro di dati simili.

Hai letto bene: File system MapR (MapR-FS), il sostituto immediato dell'azienda per il File system distribuito Hadoop (HDFS), è stato selezionato da un'importante società di software per l'archiviazione cloud generica, o almeno per scopi oltre Hadoop E Scintilla.

È sempre stato speciale
Il file system di MapR è stato il suo elemento di differenziazione originale nel mercato Hadoop: a differenza dello standard HDFS, per il quale è ottimizzato lettura e supporta la scrittura su un file una sola volta, MapR-FS supporta completamente le funzionalità di lettura-scrittura di un file convenzionale sistema. Ciò non spiega ancora perché SAP lo utilizzerebbe per scopi più ampi, ovviamente.

Ma Vikram Gupta, Senior Director of Product Management presso MapR, mi ha spiegato che, lungi dall'essere, è così semplicemente una versione migliorata di HDFS, MapR-FS è stato infatti implementato come file system standard da vai via. Dopo lo sviluppo del file system principale, è stata creata sopra un'interfaccia compatibile con HDFS, consentendo a MapR di scambiarlo nella sua distribuzione Hadoop in sostituzione del generico HDFS.

Archiviazione polimorfica
Nel frattempo, è ancora presente il file system completo e le interfacce aggiuntive per NFS E POSIX sedetevi sopra anche voi. Ciò consente a diversi client di file system di trattare MapR-FS in modo diverso, mentre tutti leggono e scrivono fisicamente i dati nello stesso posto. Questo è importante per le aziende che non vorrebbero utilizzare HDFS standard per archiviare le copie "gold" dei propri dati, ma non vogliono nemmeno pagare la duplice penalità dello spostamento e della duplicazione dei dati.

A quanto pare, questo è importante anche per SAP.

Storage distribuito e infrastruttura elastica
Naturalmente, HDFS stesso (e quindi la funzionalità simile a HDFS di MapR-FS) ha caratteristiche che lo fanno funzionare bene nel cloud. Innanzitutto, è un file system distribuito, che consente la federazione di più dischi fisici in un unico volume di archiviazione. Ciò consente la distribuzione geografica, la combinazione e la corrispondenza di diversi tipi di unità (ad esempio, memoria flash, SSD e dischi rotanti) nel sistema. Ciò, a sua volta, consente una gerarchia di archiviazione in cui dati con “temperature” diverse possono essere archiviati su supporti diversi. Ad esempio, i dati a cui si accede frequentemente potrebbero essere archiviati in flash mentre i dati storici più archivistici potrebbero essere conservati su supporti rotanti più economici.

HDFS e MapR-FS dispongono inoltre di ridondanza integrata, mantenendo più repliche di ciascun file, dove ciascuna di queste repliche è archiviata su unità fisiche separate. Ciò rende entrambi i file system resistenti al guasto di una qualsiasi unità, poiché le unità danneggiate possono essere rapidamente rimosse dal cluster di archiviazione e nuove unità aggiunte al loro posto altrettanto facilmente. E la possibilità di aggiungere e rimuovere dischi così facilmente consente l'elasticità generale richiesta dal cloud computing.

Tutto ha senso adesso
Se Microsoft e Amazon si scambiano e consigliano il proprio spazio di archiviazione BLOB nei loro servizi Hadoop, per sostituire HDFS, allora perché SAP non può andare dall'altra parte e prendere un sistema di storage utilizzato in una distribuzione Hadoop personalizzata come un file più tradizionale negozio?

E anche questo accordo MapR-SAP non è un caso isolato. Quando ho parlato con Gupta, era fermamente convinto che ulteriori accordi simili sarebbero stati perseguiti con altri licenziatari. MapR vede davvero la sua piattaforma dati convergente proprio come questo, una piattaforma. E uno che trascende Hadoop, Spark e forse anche gli stessi "dati" tradizionali.