- Home
- Flussi RSS
- progetti PNRR
- Servizi alla comunità
- Se cloud vuol dire facile
Se cloud vuol dire facile
| Carlo Volpe | Servizi alla comunità
Scienza, formazione, multimedia: tutto è più semplice con il cloud. Ecco il bilancio del primo anno della cloud federata GARR
Abbiamo parlato negli scorsi numeri della nuova piattaforma cloud federata gestita da GARR, analizzandone i benefici e le peculiarità e mettendo in evidenza l’impostazione aperta nei confronti della comunità della ricerca per quanto riguarda partecipazione e condivisione di risorse. Ma quali sono i servizi effettivamente utilizzati e qual è la risposta degli utenti che hanno iniziato a sperimentarne l’uso? Lo abbiamo chiesto ad alcuni professori e ricercatori che sono stati tra i primi a credere alle potenzialità di una cloud della ricerca italiana ed oggi sono in grado di raccontarci la propria esperienza.
La piattaforma GARR è soprattutto collaborazione. Il suo sviluppo è guidato dall’interazione continua, dall’ascolto delle esigenze e dalla condivisione di competenze all’interno della comunità dell’università e della ricerca. Un esempio emblematico è quello dell’Università di Palermo che con Benedetto Vassallo, responsabile dello sviluppo e della manutenzione dei sistemi di Ateneo, ha partecipato alle primissime sperimentazioni, collaborando alle modifiche di configurazioni e ai vari aggiornamenti che hanno portato alla realizzazione della piattaforma attuale. Le sue parole raccontano una “esperienza positiva, in quanto i servizi cloud GARR sono stati un valido supporto per tutte quelle attività, soprattutto sistemistiche, che altrimenti avrebbero comportato acquisto di hardware, di software e un notevole impiego di tempo per effettuare le configurazioni ed i test necessari”. A Palermo usano i servizi GARR da circa un anno e mezzo e i risultati sono giudicati soddisfacenti, così come il livello di assistenza personalizzato ricevuto. L’utilizzo attuale delle risorse cloud è di tipo generale, non tanto per un calcolo scientifico intensivo, ma piuttosto per disporre di un sito esterno che consenta di mettere in alta affidabilità i servizi critici. Si tratta di un’attività particolarmente rilevante per un grande ateneo. “Oltre a questo”, aggiunge Vassallo, “al momento abbiamo installato anche un piccolo cluster di 16 nodi per il calcolo scientifico utilizzato dal nostro Dipartimento di Informatica e usiamo un servizio di object storage per il backup del data centre. Inoltre è apprezzabile la facilità di utilizzo: il servizio è user friendly ed è veramente di facile comprensione”.
ASCOLTO, SCAMBIO DI COMPETENZE E INTERAZIONE CONTINUA: COSÌ LA CLOUD GARR È UN PROGETTO CONDIVISO
Per scopi di calcolo scientifico invece sono impiegate le risorse ai Laboratori Nazionali del Sud dell’Istituto Nazionale di Fisica Nucleare. “Usiamo il servizio da circa un anno”, spiega il tecnologo Emidio Giorgio, “come estensione della nostra infrastruttura fisica e virtuale, per progetti con una durata temporale breve oppure non critica per l’infrastruttura. Uno dei progetti impiega codici parallelizzati e quindi necessita di un alto numero di CPU per contenere il tempo di calcolo in circa una settimana. I risultati consentono da un parte di estrarre proprietà nucleari e dall’altra di estrapolare le sezioni d’urto ove assenti, per le applicazioni astrofisiche. Un altro studio è dedicato alla modellizzazione di eventi di Supernova e coinvolge molti aspetti di fisica, da quella particellare a quella atomica, passando per quella nucleare. Inoltre disponiamo di altre macchine di test per il servizio calcolo, per le quali sfruttiamo principalmente il vantaggio di non essere sulla nostra stessa rete”.
All’Università di Salerno, il gruppo del professor Giuseppe Cattaneo conduce studi nel campo della bioinformatica. Qui è necessario far fronte ad una crescita massiccia dei dati raccolti, dovuta anche alle nuove tecniche di sequenziamento del genoma e all’abbattimento dei costi di tali operazioni. La richiesta è quella di analisi sempre più accurate (metagenomica) e l’unica soluzione è sviluppare algoritmi distribuiti e scalabili. Tra gli obiettivi della sperimentazione, dunque, c’era l’individuazione di una strategia per l’analisi di sequenze genomiche. Gestire questi Big Data attraverso un Virtual Data Centre ha consentito di avere soluzioni replicabili e architetture scalabili per le diverse esigenze di calcolo.
IL PROSSIMO PASSO È INCREMENTARE LA POTENZA DI CALCOLO CON L’USO DI GPU
Per l’analisi di grandi quantità di dati si è rivelato necessario configurare un cluster Hadoop, un framework che supporta applicazioni distribuite con elevato accesso ai dati sotto una licenza libera. In particolare l’uso della cloud GARR ha permesso di replicare gli esperimenti, prima condotti su un piccolo cluster di 4 nodi, su un numero di nodi maggiore (32) e ampliando in questo modo la rilevanza dei test dal punto di vista scientifico. Attualmente l’uso di risorse GARR da parte del gruppo del prof. Cattaneo è di 2 TB di RAM, 512 virtual core e 20 TB di spazio disco. La sfida ora è quella di continuare su questa strada visto anche il grande interesse della comunità scientifica sui primi risultati prodotti. Dalle digital humanities, all’open access fino ai dati geomarini e ai Big Data dei social network, all’Istituto di Scienza e Tecnologie dell’Informazione (ISTI) del Cnr a Pisa sono tante le discipline e i progetti che beneficiano della cloud GARR per servizi in produzione. Lo racconta Andrea Dell’Amico, tecnico informatico che gestisce circa 50 istanze con 650 virtual core, 1,2 TB di RAM e 5 TB di spazio alle quali accedono migliaia di utenti registrati all’infrastruttura D4Science che serve, tra gli altri, anche innumerevoli progetti europei come Parthenos, SoBigData, BlueBridge, OpenAire, AgInfraPlus. “Avevamo bisogno di integrare le nostre risorse proprio perché i nostri servizi sono disponibili 24 ore su 24 e utilizzati da ricercatori in tutto il mondo. Per loro l’utilizzo è del tutto trasparente: possono accedere ad un portale ed effettuare elaborazioni di dati senza preoccuparsi della complessità sottostante. Utilizzare le risorse GARR è stata una scelta vincente perché sono di facile utilizzo e si integrano perfettamente con le risorse di calcolo gestite con il data centre locale. Altre soluzioni commerciali non garantivano la stessa elasticità e soprattutto risultavano molto più costose. Grazie alla dashboard di OpenStack inoltre è estremamente semplice replicare istanze da utilizzare al momento opportuno”. Attualmente sono oltre 400 le macchine virtuali attive sull’infrastruttura GARR, con oltre 100 progetti ai quali sono stati complessivamente riservate risorse pari a oltre 2.000 virtual core, 5 TB di RAM e 250 TB di spazio disco. Tra i vari enti che stanno sperimentando il servizio ci sono enti di ricerca biomedica come il Centro di Riferimento Oncologico di Aviano e l’Istituto Oncologico Veneto di Padova, l’Istituto Tumori Giovanni Paolo II di Bari, l’Istituto Besta di Milano, l’Humanitas di Rozzano e altri sei IRCCS che collaborano per il progetto IDEA per la realizzazione di un database comune sull’autismo. Nel campo della fisica delle alte energie, invece, è stato utilizzato con successo dalla Sezione di Firenze dell’INFN per simulazioni che descrivono interazioni tra ioni pesanti. Da segnalare, inoltre, il progetto Acce(n :-)di Scienza coordinato dai Laboratori Nazionali di Frascati dell’INFN e che ha realizzato un portale e-learning basato su Moodle con l’obiettivo di migliorare la qualità dell’apprendimento e dell’aggiornamento in fisica moderna fornendo corsi online con possibilità di interazione con i ricercatori. Il progetto si avvale della collaborazione di GARR che ha contribuito all’installazione di una macchina virtuale per la piattaforma Moodle.
Attraverso il pannello di controllo della piattaforma cloud GARR, l’utente può configurare le proprie macchine virtuali secondo le proprie esigenze e gestire il proprio data centre virtuale.
Sempre nel campo della formazione, la flessibilità e la facilità di installazione di macchine virtuali e applicazioni anche per un periodo molto limitato è stata la chiave che ha permesso di configurare decine di macchine virtuali in pochi minuti in occasione di uno dei corsi di formazione GARR sull’uso di Moodle. In questo modo è stata data la possibilità ad ogni partecipante al corso di poter simulare un’installazione completa e migliorare l’apprendimento attraverso un’esperienza diretta sul campo. Ultima in ordine di tempo, ma non certo per i risultati raggiunti, è stata la sperimentazione per lo streaming di eventi della comunità della ricerca. Cogliendo l’occasione della conferenza GARR a Venezia sono stati installati alcuni streaming server sulla cloud GARR utilizzando differenti tecnologie (Wowza, Nginx e Quavlive) coinvolgendo il gruppo Netcast ed esperti di GARR, CNR, INFN, Politecnico di Bari, Università del Piemonte Orientale.
Ovviamente, gli utenti di riferimento di GARR fanno un uso molto particolare delle risorse e sono quindi particolarmente esigenti. Sono un banco di prova importante per migliorare il servizio. Tra le richieste principali, si avverte l’esigenza di avere la possibilità di usare le risorse anche per un periodo molto limitato di tempo, necessità ad esempio per alcuni calcoli che richiedono un uso intensivo concentrato in soli 2-3 giorni. Inoltre, avere un file system condiviso tra le istanze di un dato progetto potrebbe semplificare il trasferimento in ambiente cloud di alcuni workflow consolidati. Intanto, il prossimo passo per la cloud GARR è verso l’incremento di potenza di calcolo attraverso l’uso di GPU, processori superveloci pensati per l’elaborazione e il rendering di immagini grafiche. Come spiegato in questo numero nell’articolo a pagina 26, il nuovo servizio sarà presto disponibile per la comunità della ricerca italiana e metterà a disposizione i più diffusi framework per lo sviluppo di applicazioni di deep learning e di intelligenza artificiale, sfruttando le alte prestazioni degli acceleratori per il calcolo tensoriale parallelo.
Screenshot della dashboard di Juju con cui l’utente può configurare i propri servizi su macchine virtuali attraverso un’interfaccia grafica semplificata. Macchine virtuali e servizi possono essere installati con un semplice click e nel tempo di pochi minuti.
Dai un voto da 1 a 5, ne terremo conto per scrivere i prossimi articoli.
Voto attuale:
Ultimi articoli in rubrica
-
di Erika Trotto
-
di Barbara Monticini, Mario Di Lorenzo, Davide Vaghetti
-
di Marta Mieli
-
di Davide Vaghetti
-
di Federica Tanlongo
-
di Federica Tanlongo