Recentemente, il 3 ottobre scorso, si è celebrata al CERN la LHC Grid Fest per annunciare che, la Worldwide LHC Computing Grid (WLCG) ha ormai raggiunto la sua piena maturità ed è pronta a sostenere la mole di dati e di calcolo che verrà generata dagli esperimenti all’acceleratore LHC.
Quando sarà a pieno regime, LHC ( Large Hadron Collider ), il più grande acceleratore di particelle del mondo, sarà in grado di produrre più di 15 milioni di Gigabytes di dati, equivalenti ad una pila di CD alta 21 km, in ciascun anno di funzionamento. Ogni secondo avranno luogo centinaia di milioni di collisioni ognuna delle quali genererà centinaia di particelle subatomiche e quindi un’enorme quantità di dati fluirà dagli apparati che le registrano.
La ragion d’essere di WLCG è creare e far funzionare l’infrastruttura che permette di immagazzinare, preparare ed analizzare tutti questi dati, mettendo insieme le risorse di 140 centri di calcolo (una dozzina di grandi centri di primo livello “Tier1”, e i centri di secondo livello “Tier2” ad essi connessi) sparsi in 33 paesi nei 5 continenti.
WLCG è l’infrastruttura di Grid creata specificatamente per LHC; la Grid è però un’idea generale e viene utilizzata in molti campi di ricerca anche lontani dalla fisica delle particelle. In effetti i centri che forniscono le risorse di calcolo a WLCG sono inseriti in diverse Grid, in particolare quella del progetto Europeo EGEE (Enabling Grids for E-SciencE) e dell’americano OSG (the Open Science Grid), ma anche di diverse Grid regionali e nazionali, come GridPP nel regno unito, INFN Grid in Italia e NorduGrid nei paesi nordici. Tutte queste infrastrutture Grid sono utilizzate da molte e diverse attività scientifiche, che vanno dalla bioinformatica e genomica, alle scienze della terra e al trattamento delle immagini di tipo medico.
La Grid connette risorse di calcolo e depositi di dati distribuiti geograficamente ed appartenenti ad organizzazioni diverse in modo che un utente membro di una singola organizzazione sia riconosciuto da tutte e possa accedere ai dati e alla potenza di calcolo in modo trasparente per lui e però concordato in modo automatico fra i possessori delle risorse. Proprio come la World Wide Web facilita enormemente l’accesso alle informazioni, così la Grid facilita l’accesso alle risorse di calcolo (che comprendono non solo calcolatori e depositi di dati, ma anche sensori, strumenti e visualizzazione etc.) e ne permette la condivisione in modi prima impensabili.
Il termine Grid è stato ispirato da “electrical grid” (la rete elettrica) nella visione secondo cui connettersi ad una computing-grid potrà diventare come connettersi ad una rete elettrica e un utente, col suo Personal Computer, potrà semplicemente accedere a tutte le risorse di calcolo che gli servissero, senza sapere dove stanno o come sono ottenute. Questa visione è per ora realizzata solo in modo parziale, ma la Grid è già oggi uno strumento estremamente potente. Solo per le attività degli esperimenti LHC nel 2008 si stima che sulla Grid avranno girato circa 100 milioni di programmi, e ognuno dei programmi di questi esperimenti dura tipicamente una decina di ore su di un processore recente di alta gamma.
La Grid in Europa è oggi in una fase di grande progresso, non solo dovuta all’inizio delle attività di LHC, ma anche ad un importante processo di riorganizzazione interna che la porterà da un finanziamento sulla base di progetti biennali come è stato fin qui, ad una infrastruttura pan-europea sostenibile (EGI), basata sulle infrastrutture Grid nazionali (NGI), con una organizzazione molto simile a quella che si sono già stabilmente date le reti europee delle ricerca in GEAN. Il disegno di questa riorganizzazione della Grid Europea è il compito del progetto EGI_DS che dovrà completare i suoi lavori entro la primavera del 2010 quando la nuova infrastruttura EGI inizierà a funzionare. Il ruolo dell’Italia in Grid è di particolare importanza. Basti pensare che è di responsabilità italiana nel progetto EGEE l’attività che si occupa dello sviluppo e supporto del “middleware”, il software che è al cuore della Grid e le permette di svolgere tutti i servizi di condivisione che la caratterizzano; ed è di responsabilità italiana in EGI_DS, l’attività che deve definire le funzionalità di EGI e le modalità della loro implementazione. Inoltre naturalmente l’Italia e in particolare l’Istituto Nazionale di Fisica Nucleare (INFN) danno un rilevante contributo a WLGC con il centro “Tier1” del CNAF a Bologna e con i centri “Tier2” di Catania, Legnaro, Milano, Napoli, Pisa, Roma, Torino.