Skip to main content
Il futuro è a alte prestazioni
credits: CINECA

Il futuro è a alte prestazioni

| Maddalena Vario, Federica Tanlongo | Caffè scientifico

Articolo letto 1579 volte

Big Data: la ricerca italiana verso l’exascale con la partenza dei grandi progetti infrastrutturali del PNRR

Al Centro Nazionale partecipano 37 università e enti di ricerca e 15 aziende private.

Il PNRR ha sbloccato straordinarie opportunità per dotare il nostro paese di infrastrutture di ricerca di prossima generazione. Un posto speciale tra queste è occupato dalle infrastrutture di calcolo per la ricerca, come substrato trasversale ed abilitante per tutti gli ambiti disciplinari.

Il calcolo ad alte prestazioni (HPC, High Peformance Computing) e l’analisi e la gestione dei Big Data sono temi strategici per comprendere ed affrontare le grandi sfide del futuro. Per riuscire in questi obiettivi, HPC e Big Data devono essere collegati alle future tecnologie per il supercalcolo exascale e post-exascale, incluso il calcolo quantistico.

È per questo che nasce il Centro Nazionale HPC, Big Data e Quantum Computing (ICSC). Ne abbiamo parlato con Claudio Grandi, già presidente della Commissione Calcolo e Reti dell’INFN, per conto del quale attualmente segue l’iniziativa e con due esperti del Cineca: Sanzio Bassini, direttore High Performance Computing e Mirko Cestari, HPC and Cloud technology coordinator.

Piani ambiziosi per il Centro Nazionale per il supercalcolo

Colloquio con Claudio Grandi, INFN

foto di Claudio Grandi - credits: Cineca

Claudio Grandi, in occasione dell’inaugurazione del supercomputer Leonardo nel novembre 2022. credits: Cineca

Quali sono le risorse messe in campo da ICSC?

Il Centro Nazionale è finanziato con un totale di 320 milioni, a cui vanno ad aggiungersi altri 41 milioni che arrivano dal progetto TeRABIT. 139 milioni sono per l’infrastruttura cloud intesa in senso lato, 32 milioni sono dedicati a open call per coinvolgere soggetti esterni al centro nazionale e altrettanti per innovazione e trasferimento tecnologico. Il 42% degli investimenti sarà dedicato alle regioni del Sud.
Per quanto riguarda la Fondazione, il Centro vede la partecipazione di 37 università e istituti di ricerca e 15 compagnie private: un numero significativo ma che, visto il grande interesse dimostrato da enti pubblici e privati per l’iniziativa, sarebbe potuto essere molto più elevato, se non fosse stato limitato dalle esigenze del bando. ICSC mobiliterà più di 1.500 ricercatori, oltre ai nuovi previsti: 250 nuove assunzioni e 250 dottorandi, con una partecipazione femminile che, secondo le priorità trasversali del PNRR, dovrebbe arrivare almeno al 40%, obiettivo che auspichiamo venga raggiunto.
L’obiettivo primario dal punto di vista infrastrutturale è quello di creare un sistema digitale nazionale che possa servire le diverse esigenze di calcolo per la ricerca nell’ambito HPC e Big Data ed evolvere verso un modello di tipo “data lake”, con la possibilità di condividere risorse e dati. L’ambizione è dar vita ad un ecosistema che possa essere attraente non solo per la ricerca pura, ma soprattutto per le partnership pubblico-private.

Come sarà organizzato ICSC?

Le notevoli risorse messe in campo e la complessità del progetto si riflettono nella sua organizzazione: ICSC è organizzato in una struttura a raggiera con un hub centrale e diversi spoke (raggi), per coprire le varie aree tematiche. In particolare ci sono 11 spoke, due dei quali, lo spoke 1 e lo spoke 10, sono dedicati a ricerca tecnologica, rispettivamente nei campi dell’HPC e Big Data analisys e del quantum computing; gli spoke dal 2 al 9 sono invece dedicati alle diverse aree applicative. In questi 8 spoke tematici si farà sviluppo di applicazioni in grado di sfruttare l’infrastruttura di calcolo del Centro nazionale per fare scienza nei diversi settori.

credits: Cineca

L’undicesimo è infine lo spoke 0, responsabile per la realizzazione della interconnessione dell’infrastruttura di calcolo e che include i maggiori centri di calcolo nazionali, come Cineca e INFN, e GARR come gestore della rete.

In che modo le risorse disponibili sull’infrastruttura saranno rese disponibili alla comunità?

Il nostro modello prevede che l’acquisto e l’operatività delle risorse ICT siano co-finanziati dal Centro nazionale e dai partner che le ospitano. Una parte delle risorse sarà riservata all’Istituto ospitante, ma la maggior parte sarà a disposizione di quanti ne faranno domanda. Le richieste saranno gestite da un apposito Access Committee che si occuperà della valutazione delle richieste e dell’allocazione delle risorse in accordo con le regole di accesso stabilite e in modo analogo a quanto avviene nelle grandi collaborazioni europee (Prace, ISCRA per CINECA).

Come si modificherà l’infrastruttura di calcolo INFN?

Grazie agli interventi di ICSC, l’infrastruttura di calcolo INFN, che è una infrastruttura di cloud federata distribuita su vari punti di presenza in tutto il territorio nazionale, beneficerà di un adeguamento con particolare attenzione agli aspetti di efficienza energetica e vedrà l’avvio di nuove iniziative nell’ambito di due spoke, una dedicata alla mitigazione dei disastri naturali e antropici e l’altra dedicata alla space economy, che avranno il loro fulcro rispettivamente presso i Laboratori Nazionali del Gran Sasso e di Frascati. È previsto anche un adeguamento dell’infrastruttura di rete per beneficiare dell’evoluzione di GARR-T e un potenziamento delle risorse di calcolo.

credits: Cineca

Leonardo e gli altri: HPC per tutte le taglie

Colloquio con Mirko Cestari e Sanzio Bassini, Cineca

foto dell'inaugurazione

ICSC è stato inaugurato con il kick-off meeting del 25 e 26 novembre a Bologna, presso il Tecnopolo, alla presenza del Ministro dell’Università e della Ricerca, Anna Maria Bernini

Quale sarà il ruolo di Cineca in ICSC?

Cestari: Il ruolo del Cineca nel neonato Centro Nazionale di supercalcolo sarà trasversale a tutti gli spoke tematici di ricerca. Contribuiremo infatti alla fornitura ed evoluzione dell’infrastruttura di supercalcolo e di storage che dovrà rispondere alle necessità di elaborazione e archiviazione dei dati che provengono delle attività di ricerca tematiche. Cineca sta realizzando il primo grande passo dell’infrastruttura di High Performance Computing (HPC), con l’installazione di Leonardo, il supercomputer di classe pre-exascale, che oggi è al quarto posto al mondo per capacità di processamento.

Leonardo vedrà fra due anni un duplice aggiornamento dell’infrastruttura, con l’integrazione di un acceleratore Quantum Computing (QC) e di tecnologie hardware di prossima generazione in 2 nuove partizioni computazionali, che permetteranno a Leonardo di raggiungere una potenza di calcolo complessiva di 350 P-FLOPS (FLoating point Operations Per Second). Il Centro Nazionale beneficerà inoltre degli aggiornamenti previsti per il sistema HPC Tier-1 attualmente operativo in Cineca, che fornisce i servizi Interactive Computing e Cloud, oltre a ospitare progetti di supercalcolo che necessitano di piccola-media scalabilità. L’aggiornamento vedrà una forte crescita dei servizi e risorse cloud, che diventeranno parte fondamentale di tutti i progetti di ricerca computazionali. Inoltre, ulteriori sistemi Tier-1 verranno realizzati per rispondere ai bisogni specifici delle diverse comunità.

I sistemi cloud e HPC (Tier-0, Tier-1 e Tier-2), realizzati o aggiornati attraverso i fondi del Centro Nazionale, saranno caratterizzati da un livello di integrazione che permetterà di scalare facilmente le risorse con l’aumentare delle esigenze computazionali dei progetti.

Oltre che negli aspetti di potenziamento dell’infrastruttura, Cineca è profondamente coinvolto nelle attività di ricerca di spoke 1, con l’obiettivo di sfruttare l’esperienza e le competenze acquisite da Cineca nell’operare e utilizzare al meglio alcuni tra i sistemi di calcolo ad alte prestazioni più potenti al mondo nell’esplorare le tendenze future dell’HPC, promuovere l’adozione delle più promettenti tecnologie di supercalcolo e affrontare sfide crescenti come la sicurezza informatica.

Il nostro contributo nello spoke 1 mira ad aumentare la competitività dei servizi computazionali e di storage forniti agli utenti attraverso due linee di azione: l’incremento della capacità di calcolo nell’ordine del pre-exascale, sfruttando tecnologie hardware emergenti realizzate e testate nei progetti europei e su sistemi pilota (ad es. EuroHPC, EPI, EuPEX) e il miglioramento dei servizi HPC (Fenix-RI, EOSC DICE) per affrontare la complessità delle simulazioni odierne, con flussi di lavoro che richiedono ambienti flessibili, interattivi e con una gestione specifica di grandi moli di dati.

Quale sarà il ruolo di Leonardo?

Oltre alle discipline scientifiche tradizionali, Leonardo supporterà progetti di frontiera come la medicina personalizzata o la ricerca di nuove fonti di energia.

Bassini: Oltre alle discipline scientifiche tradizionali, come fisica, astrofisica, chimica e fluidodinamica, Leonardo avrà il compito di affrontare progetti di frontiera, come la medicina personalizzata, il cambiamento climatico, la ricerca di nuove fonti di energia, lo sviluppo di nuovi materiali e la bioingegneria. Una parte delle risorse sarà anche destinata allo sviluppo di progetti industriali basati su intelligenza artificiale, digital twin e simulazione di impianti e processi in logica predittiva.

Leonardo è il nodo più importante del network HPC che andrà a costituirsi a livello nazionale. Sarà una rete HPC federata con una piattaforma digitale condivisa per affrontare situazioni estreme come terremoti, tsunami e pandemie. Il network potrà compensare picchi di produzione quotidiana e migliorare l’efficacia della risposta dei singoli nodi di rete, sarà infatti un vero cloud di supercomputing a livello nazionale.

Cestari: Un esempio di progetto flagship europeo che verrà supportato dall’infrastruttura di supercalcolo e cloud, realizzata anche grazie al Centro Nazionale, è il progetto Destination Earth, che ha l’ambizione di creare un gemello digitale della terra nel tentativo di prevedere e mitigare i cambiamenti climatici che si stanno verificando. Il progetto si estende in un arco temporale di 10 anni, con il coinvolgimento fra gli altri di ECMWF, ESA e EUMETSAT.

foto di Mirko Cestari
foto di Sanzio Bassini

Mirko Cestari (sopra) e Sanzio Bassini (sotto) sono figure chiave nello sviluppo di progetti HPC in Cineca

Analogamente sarà possibile sostenere progetti nazionali caratterizzati da una estensione temporale ampia, sia di implementazione che di produzione (7-10 anni), durante la quale la raccolta e la gestione dei dati, oltre che la loro elaborazione, sarà centrale per il successo del progetto. Due esempi da ambiti disciplinari molto diversi sono la raccolta dei genomi e degli esomi della popolazione nazionale ai fini della ricerca per nuove cure, o la creazione di una collezione di beni culturali in forma digitale per creare una libreria con accesso online, che possa promuovere la cultura italiana a livello internazionale.

Infine, il 20% delle risorse di Leonardo è destinato alle industrie con l’obiettivo di favorire il trasferimento tecnologico dal mondo della ricerca ai soggetti privati.

Che modello di accesso e integrazione delle risorse verrà adottato per Leonardo?

Cestari: Per il supercomputer Leonardo è già prevista una fase di early access program chiamata LEAP che consentirà a progetti selezionati per merito scientifico di realizzare vere e proprie pietre miliari computazionali nei rispettivi campi scientifici. Leonardo entrerà in produzione ad aprile 2023, con accesso “peer-reviewed”. Il 50% delle risorse sarà assegnato con call europee o progetti flagship europei e il 50% sarà allocato con canali di assegnazione delle risorse gestiti a livello italiano.

Il modello di accesso della parte italiana sarà in relazione diretta con il Centro Nazionale. Gli spoke tematici avranno la necessaria autonomia per amministrare la distribuzione delle risorse di calcolo, potendo privilegiare progetti di punta nella rispettiva disciplina scientifica. Il continuo interscambio tra spoke e hub permetterà inoltre di promuovere linee di ricerca prioritarie con la possibilità di dedicare loro risorse specifiche. Inoltre, con la progressiva evoluzione e integrazione dell’infrastruttura, un maggior numero di risorse per le diverse esigenze di supercalcolo, storage, quantum computing e cloud verrà messo a disposizione della ricerca tematica, con l’ambizione di poter sostenere tutte le ricerche italiane di carattere computazionale e promuovere le competenze e i risultati via via acquisiti.

Quali figure sono previste a supporto?

Bassini: Per sostenere quest’impresa sarà fondamentale la presenza di personale altamente formato per l’adattamento delle applicazioni all’ambiente HPC e di un servizio di supporto per l’utilizzo dell’infrastruttura distribuita. Sarà inoltre cruciale il ruolo del comitato che si occuperà di valutare le richieste di accesso alle infrastrutture connesse agli Open Call e destinare le risorse informatiche secondo la Access Policy del Centro Nazionale.

Ti è piaciuto questo articolo? Faccelo sapere!
Dai un voto da 1 a 5, ne terremo conto per scrivere i prossimi articoli.

Voto attuale:

ICSC - il Centro Nazionale HPC, Big Data e Quantum Computing

Ultimi articoli in rubrica