Perché Facebook scommette il suo futuro sull'open hardware e perché è importante per te

  • Oct 17, 2023

Il capo dell'hardware aperto di Facebook, Frank Frankovsky, spiega perché non tornerà al tradizionale mercato di massa server e come la progettazione di data center open source aiuta a costruire server più efficienti e affidabili fattorie.

Per anni, i server sono stati costruiti secondo un menu fisso: alla maggior parte dei clienti venivano offerti box che includevano lo stesso hardware e software, indipendentemente dal fatto che ne avessero bisogno o meno.

I giganti del web come Google e Facebook hanno scelto un approccio più à la carte per i loro prodotti data center, progettando server su misura per i carichi di lavoro informatici che dovranno svolgere e niente di più.

Sotto il Apri progetto di calcolo (OCP), Facebook e i suoi partner si sono impegnati a sviluppare nuovi progetti per l'elaborazione, l'archiviazione e l'infrastruttura generale dei data center, non solo i server stessi, ma il telaio e i rack in cui si trovano e l'alimentazione e il raffreddamento associati, e quindi a condividere tali progetti in modo che possano essere perfezionati e costruiti su.

Per Facebook, il passaggio ai data center fai da te sta dando i suoi frutti, sia in termini di efficienza che di affidabilità dei suoi data center. Il data center di Facebook a Lulea, in Svezia, è dotato al 100% di apparecchiature progettate da OCP e ha un tasso di fallimento pari a un terzo di quello dei data center di Facebook che utilizzano un mix di OCP e non OCP hardware.

Allo stesso modo, Facebook attribuisce alle apparecchiature OCP il merito di aver consentito loro di gestire alcuni dei data center più efficienti al mondo. Le server farm di Facebook hanno un punteggio PUE (Power Usage Effectiveness) di 1,07, quando il "gold standard" per il settore è 1,5 (il PUE riflette quanta parte della potenza totale fornita a un data center arriva a a server).

Maggiori informazioni sull'infrastruttura di Facebook:

  • Facebook descrive in dettaglio due anni di lavoro per attivare HTTPS predefinito
  • Facebook spiega come "TAO" serve i carichi di lavoro sociali e le richieste di dati
  • Gli sviluppatori di Facebook spiegano come mappa le connessioni degli utenti ad altre "entità"
  • Facebook traduce l'interfaccia in linguaggio naturale in Graph Search
  • Gli ingegneri di Facebook rivelano come Parse si inserisce nelle strategie B2B della piattaforma
  • Facebook rilascia il nuovo benchmark del database Social Graph: LinkBench
  • Facebook rivela gli ingredienti dietro il motore di raccomandazione dell'App Center
  • Comprendere l'Unicorno: un'analisi approfondita del Graph Search di Facebook

In definitiva, le aziende trarranno un servizio migliore dotando i propri data center di un’infrastruttura ridotta ai componenti principali necessari per eseguire carichi di lavoro informatici specifici, ha affermato Frank Frankovsky, vicepresidente di Facebook per la progettazione hardware e le operazioni della catena di fornitura, un approccio che l'OCP definisce "privo di vanità" progetto'.

"Noi [Facebook] rimuoviamo tutto ciò che non è necessario, se non contribuisce all'elaborazione del tuo feed di notizie o all'archiviazione delle tue foto quindi non è nella progettazione quindi ci sono meno cose che possono rompersi," ha detto, spiegando perché i server OCP si sono dimostrati più affidabile.

"Si elimina quanto più possibile per renderlo il più efficiente possibile, e inoltre non ci sono così tante cose accessorie che possono rompersi."

Frankovsky ha affermato che un altro miglioramento della qualità deriva dai test eseguiti in modo specifico per i carichi di lavoro eseguiti. Al contrario, le procedure di test utilizzate sui server tradizionali degli OEM sono limitate perché devono eseguire “test molto ampi e superficiali” per un gran numero di casi d’uso.

La modularità è un altro principio fondamentale del design OCP, un'idea centrale alla base del progetto è quella di rompere componenti del data center, rack e server in parti che possono essere scambiate in base alle esigenze informatiche modifica. Al summit del progetto a Santa Clara all'inizio di quest'anno, è stata rivelata l'architettura dello slot "Group Hug", il cui design consentirebbe alle schede madri dei server di accettare il sistema ARM su un chip, così come AMD o Intel patatine fritte.

Mentre solo una manciata di grandi aziende ha pubblicamente riconosciuto l’utilizzo di progetti Open Compute nei propri data center, l’altra grande azienda è la società di hosting europea Rackspace, sembra che anche gli OEM di server come IBM, HP e Dell dovranno passare ai server à la carte se vogliono conquistare affari da grandi clienti web come Facebook.

Tutto l'hardware Facebook nei data center sarà progettato da OCP, ha affermato Frankovsky, indipendentemente dal fatto che sia fornito da ODM (Original Design Manufacturers) - aziende come Hyve Solutions o Quanta che fabbricano prodotti venduti con un altro marchio o dagli OEM, poiché sia ​​Dell che HP sono membri di l'OCP.

L'apertura dell'OCP fa sì che i contributori condividano i progetti delle apparecchiature dei data center che producono. Grandi aziende come Rackspace possono quindi prendere questi progetti e modificarli per adattarli alle loro esigenze specifiche e quindi chiedere agli ODM di produrre queste apparecchiature.

Le aziende più piccole, senza la capacità o il desiderio di modificare i progetti OCP, possono acquistare apparecchiature basate su specifiche OCP standard. Questo è l'approccio seguito dall'editore di videogiochi Riot Games, responsabile del popolare gioco online League of Legends.

Esistono numerosi produttori di apparecchiature approvate da OCP che producono server e infrastrutture di data center basati su progetti OCP, come ad esempio Informatica dei pinguini, che realizza server basati sui sistemi Open Compute V2 e V3.

"Questi sono due esempi di come la comunità si sta impegnando dal punto di vista dell'adozione", ha affermato Frankovsky, che è anche presidente dell'OCP.

Perché il calcolo aperto diventerà mainstream

Anche se le aziende non adottano direttamente apparecchiature OCP, Frankovsky prevede il numero di carichi di lavoro informatici trasportati il numero di apparecchiature OCP continuerà a crescere man mano che sempre più lavoro verrà spostato verso fornitori di cloud computing di dimensioni più piccole data center.

"I sistemi Cisco UCS o PowerEdge sono eccellenti per le PMI che desiderano uno stack tecnologico completamente integrato. Quei clienti non vogliono trasparenza, vogliono che le cose funzionino," ha detto Frankovsky.

"Con il passare del tempo questi clienti si procureranno sempre meno, ma chiederanno sempre meno ai fornitori di cloud computing, ecco perché sono così ottimista riguardo all’impatto che l’OCP avrà sull’industria nei prossimi tre-cinque anni. Sono proprio questi grandi provider i principali utilizzatori dell’open computing."

Frank Frankovsky di Facebook. Foto: Jack Clark

Non tutte le aziende hanno carichi di lavoro informatici facilmente definibili che possono essere abbinati così facilmente all'hardware sottostante o che sono vincolati da vincoli normativi o di altro tipo sul modo in cui eseguono i calcoli, che Frankovsky accetta potrebbero limitare la loro adozione di OCP hardware.

Scoprire come l'OCP potrebbe funzionare per queste aziende è stato uno dei motivi per cui l'OCP ha chiesto a Don Duet, responsabile della tecnologia globale della società finanziaria Goldman Sachs, di sedere nel consiglio di amministrazione dell'OCP, ha affermato.

"Goldman Sachs è un esempio di azienda fortemente gravata dai requisiti normativi. Imparare di più su quali siano le sfide per raggiungere questo livello di efficienza in base alla realtà del mondo in cui vivono ci sta insegnando molto", ha detto Frankovsky.

"Una delle cose che abbiamo pensato è che non tutto è vincolato da queste restrizioni. I servizi finanziari dispongono di grandissimi computer scalabili che assomigliano molto ai nostri, che in genere eseguono simulazioni Monte Carlo. Si tratta di una parte piuttosto ampia della loro infrastruttura IT che può trarre immediatamente vantaggio da Open Compute.

"Ci sono porzioni ampie e crescenti dell'infrastruttura informatica di tutti che assomigliano più ad architetture su scala web", ha affermato, citando cluster di calcolo della ricerca sanitaria e farmaceutica e server farm di petrolio e gas per l'elaborazione sismica dati.

In primo piano

  • Recensione Apple Mac Studio M2 Ultra: questo è il nuovo desktop Mac di punta
  • 4 cose che Claude AI può fare e ChatGPT non può
  • Provo centinaia di smartwatch, ma questo è stato al mio polso tutto l'anno
  • I migliori cacciaviti elettrici: esegui attività di fai da te e riparazioni nella metà del tempo

"Dal punto di vista dell'infrastruttura fisica, assomigliano moltissimo a Google, Microsoft, Facebook o Amazon."

Un'architettura server emergente che integra l'approccio modulare e privo di vanità di OCP è microserver, server che consumano energia, in genere con un TDP inferiore a 15 W, che possono essere utilizzati per eseguire attività computazionalmente semplici su larga scala.

"Siamo davvero entusiasti del potenziale dei microserver [su Facebook]", ha affermato Frankovsky, aggiungendolo Facebook deve ancora adottarli in gran numero perché è in attesa di un sistema microserver adeguato a 64 bit un chip. Intel ha recentemente rilasciato la sua seconda generazione di SoC microserver basati su Atom: il Chip Avoton - e sembra improbabile che i primi microserver ARM a 64 bit vengano spediti in qualsiasi numero fino al 2014.

"La prima area in cui utilizzeremmo una tecnologia del genere è l'area di stoccaggio", ha affermato Frankovsky.

Ha detto che Facebook sta attualmente testando due array di archiviazione OCP Open Vault: uno basato su Avoton e l'altro a Sistema basato su ARM Calxeda: in cui i controller SCSI (SAS) collegati in serie sono stati sostituiti microserver.

"Abbiamo trasformato quello che è considerato solo un mucchio di dischi in un server di archiviazione. Ciò consente di eliminare l'intero chassis del server separato che si trovava sopra il disco custodia, ora il server è un microserver e si trova in uno slot per schede che fa parte del dispositivo di archiviazione," Egli ha detto.

Il progetto per l'array di storage è venuto dalla comunità OCP basandosi sui progetti disponibili gratuitamente per l'hardware OCP e per Frankovsky dimostra perché vale la pena condividere i progetti OCP.

"Questo è un esempio di contributo comunitario, e uno di quei momenti 'Aha', è come 'Cavolo, perché non ci abbiamo pensato'. Abbiamo molti grandi ingegneri ma non abbiamo tutti i più grandi ingegneri sotto lo stesso tetto, nessuno lo fa. Questo è un esempio del potere dell'open source", ha affermato Frankovsky.

Ulteriori letture sul progetto Open Compute

  • Open Compute: il data center ha un futuro aperto?
  • Open Compute Project si occupa di switch e networking
  • Facebook apre Open Compute Project