Mentre l’intelligenza artificiale emerge sempre più nell’informatica scientifica, un nuovo test temporale misura la velocità con cui una rete neurale può essere addestrata

  • Sep 04, 2023

I test riflettono un crescente utilizzo del deep learning nell’informatica scientifica sui computer più grandi del mondo.

fujitsu-2020-fugaku-supercomputer.png

Il computer più potente del mondo, Fugaku, al RIKEN Center for Computational Science di Kobe, in Giappone, costruito da Fujitsu. Il computer, e molti altri supercomputer di punta, stanno incorporando sempre più reti neurali utilizzate nell’intelligenza artificiale per lavorare sui tipi più sofisticati di problemi di ricerca scientifica.

Fujitsu

La tecnologia dell’intelligenza artificiale è diventata così diffusa anche nei domini più complessi scienza che ora dispone di una propria suite di test per misurare il tempo di elaborazione sul computer più potente del mondo computer.

MLPerf, il consorzio industriale che serve l'industria informatica misurando il tempo necessario per eseguire l'apprendimento automatico, un sottoinsieme dell'intelligenza artificiale, mercoledì ha offerto una serie inaugurale di risultati dei test per sistemi di calcolo ad alte prestazioni, o HPC, che eseguono attività di apprendimento automatico.

I risultati dei test, presentati da una serie di laboratori di ricerca, includono risultati per il computer più veloce del mondo, Fugaku.

Questo sforzo riflette il fatto che i supercomputer stanno incorporando sempre più forme di intelligenza artificiale di deep learning nel calcolo dei problemi scientifici tradizionali.

"Abbiamo notato un'omissione nel fatto che non avevamo carichi di lavoro più orientati scientificamente in un momento in cui le persone cominciano a guardare alla formazione come potenzialmente un carico di lavoro HPC, o accoppiato a, o una componente di essi," ha affermato David Kanter, capo di MLPerf, in un briefing con giornalisti.

I nuovi risultati si uniscono a due risultati di test benchmark esistenti, uno quello misura la formazione sui normali sistemi server, E uno che misura l’inferenza dell’apprendimento automatico, facendo previsioni, sui server e sui dispositivi mobili.

Anche: Nvidia fa piazza pulita del punto di riferimento delle previsioni MLPerf per l'intelligenza artificiale

Lo staff di MLPerf che ha progettato i test terrà una sessione mercoledì pomeriggio per discutere il lavoro svolto SC20, una conferenza sui supercalcoli che si svolge ogni anno in una città diversa, ma quest'anno si terrà come evento virtuale data la pandemia di COVID-19.

I test misurano specificamente quanti minuti impiegano i supercomputer per addestrare una rete di deep learning fino a raggiungere la competenza in due attività, chiamate CosmoFlow e DeepCAM.

CosmoFlow, una collaborazione tra Intel e l'unità Cray di Hewlett Packard Enterprise e il Dipartimento dell'Energia Il National Energy Research Scientific Computing Center, o NERSC, utilizza un neurale convoluzionale tridimensionale rete a determinare i parametri cosmologici dell’universo.

DeepCAM, una collaborazione tra Nvidia, Lawrence Berkeley National Laboratory e Oak Ridge National Laboratory, è un'applicazione di rete neurale per la segmentazione delle immagini che impara a prevedere i fenomeni meteorologici "estremi"..

Parte dell'impulso per i nuovi test proviene dai laboratori che volevano utilizzare parametri di riferimento per specificare tutti i parametri tecnologia venduta dai fornitori di apparecchiature per supercalcolo, inclusi i produttori di chip Intel e Nvidia e Advanced Micro Dispositivi.

"Siamo stati contattati da un paio di centri di supercalcolo interessati a utilizzare la formazione MLPerf per le offerte, la qualificazione e l'accettazione", ha affermato Kanter. "Oltre un miliardo di dollari di offerte hanno utilizzato componenti MLPerf nel processo di offerta."

Anche: Nvidia e Google rivendicano il diritto di vantarsi nei benchmark MLPerf man mano che i computer AI diventano sempre più grandi

I sistemi che hanno preso parte includono alcuni dei più veloci al mondo, secondo quanto misurato da l'elenco dei 500 migliori supercomputer. Includono il Sistema Fugaku al RIKEN Center for Computational Science di Kobe, in Giappone, costruito da Fujitsu e che è il numero uno nella lista dei Top 500. Un altro concorrente era Frontera-RTX, presso il Texas Advanced Computing Center dell'Università del Texas, il numero nove della lista.

I parametri di riferimento dovevano accogliere alcuni cambiamenti nel modo in cui le cose vengono misurate.

A differenza della formazione MLPerf sui computer server, dove la metrica abituale è il numero di immagini che possono essere elaborati al secondo, dove più è meglio, i compiti del supercomputer contano il tempo necessario per raggiungere la precisione, dove meno è Meglio.

Il tempo minimo per sviluppare una rete neurale per risolvere il problema CosmoFlow è stato di tredici minuti, ottenuto dall'AI Bridging Cloud Infrastructure Computer, o ABCI, come viene chiamato, ospitato presso l'Istituto nazionale di scienza e tecnologia industriale avanzata a Giappone. La macchina, la quattordicesima più potente al mondo, è stata sviluppata sempre da Fujitsu e presenta una combinazione di 1.024 microprocessori Intel Xeon e 2.048 GPU Nvidia V100.

Un secondo sistema ABCI, utilizzando metà della potenza di calcolo, ha ottenuto il tempo più basso per addestrare l’attività di segmentazione delle immagini su DeepCAM, impiegando solo dieci minuti e mezzo.

Ma ci sono altri cambiamenti più specifici riguardanti la natura dei supercomputer e il loro lavoro.

Ad esempio, l’input-output deve essere misurato con maggiore attenzione nei benchmark dei supercomputer perché può avere una maggiore influenza sui risultati. A differenza dei test sulle tipiche attività MLPerf come ImageNet, "disponiamo di grandi set di dati scientifici, strutture di dati complesse, set di dati spazio-temporali che potrebbero derivare da simulazioni HPC di grandi dimensioni", ha affermato Steve Farrell, un ingegnere di apprendimento automatico del NERSC e copresidente del progetto HPC per MLPerf.

"Il movimento dei dati, quella parte della storia, è molto importante per l'HPC", ha affermato Farrell. CosmoFlow e DeepCAM hanno set di dati che misurano cinque e nove terabyte, ha osservato.

"Ciò che abbiamo aggiunto alle regole è che qualsiasi spostamento di dati da un file system generale doveva essere incluso nel tempo riportato dal benchmark e abbiamo catturato il tempo impiegato nel processo di staging", ha affermato.

Guadagni tecnologici

SMART Risultati fiscali globali del secondo trimestre, prospettive superiori alle aspettative
Le azioni Adobe crollano perché le prospettive non deludono le aspettative
Le azioni Micron salgono con i risultati fiscali del secondo trimestre e le prospettive superano le aspettative
Le azioni Oracle rimbalzano, la visione fiscale del quarto trimestre supera le aspettative
Le azioni di PagerDuty aumentano in quanto le entrate fiscali del quarto trimestre, prevedono le migliori aspettative
Le azioni di DocuSign crollano, le previsioni sul primo trimestre e sull'anno non soddisfano le aspettative
Crowdstrike riporta un fatturato del quarto trimestre pari a 431 milioni di dollari e 1,45 miliardi di dollari per l'intero anno
Le azioni Broadcom salgono con i risultati fiscali del primo trimestre e le prospettive superano le aspettative
  • SMART Risultati fiscali globali del secondo trimestre, prospettive superiori alle aspettative
  • Le azioni Adobe crollano perché le prospettive non deludono le aspettative
  • Le azioni Micron salgono con i risultati fiscali del secondo trimestre e le prospettive superano le aspettative
  • Le azioni Oracle rimbalzano, la visione fiscale del quarto trimestre supera le aspettative
  • Le azioni di PagerDuty aumentano in quanto le entrate fiscali del quarto trimestre, prevedono le migliori aspettative
  • Le azioni di DocuSign crollano, le previsioni sul primo trimestre e sull'anno non soddisfano le aspettative
  • Crowdstrike riporta un fatturato del quarto trimestre pari a 431 milioni di dollari e 1,45 miliardi di dollari per l'intero anno
  • Le azioni Broadcom salgono con i risultati fiscali del primo trimestre e le prospettive superano le aspettative