Come si posiziona l’Italia rispetto alla nuova rivoluzionaria tecnologia dell’Intelligenza Artificiale, detta “IA generativa”? È importante porsi la domanda, in quanto molti luminari (veri: come Yann LeCun) ritengono questa invenzione di un’importanza paragonabile a quella della stampa a caratteri mobili o della macchina a vapore.
Italia e Francia
È anche importante porsi la domanda in quanto già l’anno scorso il nostro amico/nemico presidente francese Emmanuel Macron aveva allocato centinaia di milioni per la costruzione di una IA “francese”, impegno ribadito a dicembre nell’ambito di France 2030 (e che non aveva avuto nell’immediato una risposta italiana).
Per fare il punto parliamo oggi di un fatto, una realtà storica concreta, e accenniamo ad una possibile novità. Il fatto – forse noto a pochi – è che a livello di infrastrutture l’Italia è posizionata ottimamente, con il sesto computer più potente al mondo ormai al servizio anche della IA (la Francia arriva solo al 17mo posto, perfino dopo Olanda e Spagna). Proprio su questo Atlantico Quotidiano ha avuto il privilegio di intervistare la direttrice generale di Cineca, Alessandra Poggiani.
La possibile novità è invece stata raccontata da Il Sole 24 ore il 24 gennaio, in un articolo intitolato “Cineca e iGenius insieme: nasce la prima Intelligenza Artificiale generativa italiana”. Diciamo possibile perché – a differenza del modello francese Mistral che è non solo totalmente documentato, ma anche open e disponibile a tutti – nel caso italiano il Sole parla di un progetto non ancora realizzato e per il quale non abbiamo trovato alcun white paper. Ma, sulla carta (elettronica) alcune delle premesse sembrano interessanti e contiamo di tornare ad occuparcene.
Concentriamoci in ogni caso oggi su fatti verificabili, con questa intervista esclusiva.
Il supercomputing in Italia
MARCO HUGO BARSOTTI: Pochi italiani sanno che Leonardo risulta il sesto computer più potente al mondo secondo la lista top500. Se non sbagliamo, su questa infrastruttura Dompe’ Farmaceutici di Milano aveva anche iniziato un importante progetto di ricerca proprio all’inizio della pandemia, progetto di cui ci eravamo occupati nel 2023. Può fornirci non solo qualche lume su questa installazione, ma anche sulla storia del supercomputing in Italia?
ALESSANDRA POGGIANI: Leonardo, attualmente in funzione al Tecnopolo di Bologna sotto la gestione di Cineca, è storicamente il 19esimo sistema di supercalcolo del nostro Paese. L’Italia ha infatti una tradizione importante legata al supercalcolo, cominciata sul finire degli anni ‘60, quando quattro rettori di altrettante università italiane (Alma Mater Studiorum di Bologna, Università di Firenze, Università di Padova e Università Ca’ Foscari di Venezia) decidono di unire le forze e costituire un consorzio interuniversitario per la gestione del Centro di calcolo elettronico dell’Italia nord-orientale: nasce così Cineca.
Nel 2010 la Commissione europea posiziona l’HPC come un fattore abilitante strategico per il mantenimento della competitività del sistema economico europeo e avvia il finanziamento di una azione per la realizzazione di un’infrastruttura di ricerca di sistemi HPC. L’impegno è sottoscritto da quattro Paesi – Francia, Germania, Italia e Spagna – che costituiscono l’associazione PRACE. L’Italia delega Cineca come rappresentante nazionale nella associazione e si impegna a contribuire alla infrastruttura con un sistema di classe tier0, il progetto FERMI, il primo sistema HPC classificato nella top 10 del ranking mondiale Top500.
Nel 2017 l’associazione PRACE è superata dalla istituzione di una entità autonoma a responsabilità condivisa (joint undertaking), denominata EuroHPC, tra Commissione europea e attualmente 34 Paesi partecipanti, trai quali l’Italia. EuroHPC ha come missione istitutiva sviluppare, diffondere, estendere e mantenere nell’Ue un ecosistema leader a livello mondiale di supercalcolo, calcolo quantistico, infrastrutture di servizi e dati, federato, sicuro e iperconnesso. Nell’ambito della azione di EuroHPC l’Italia ha cofinanziato l’acquisizione del sistema pre-Exascale Leonardo classificato nella posizione numero 4 del ranking Top500 nel novembre 2022 al momento del suo avvio in funzionamento.
La potenza di un supercalcolatore si misura in numero di operazioni al secondo: Leonardo ne fa 250 milioni di miliardi, meritandosi così la definizione pre-Exascale. Per dare un’idea della sua velocità, possiamo immaginare che ogni singolo abitante della terra compia un’operazione algebrica al secondo, per 365 giorni: questo, in un anno, svilupperebbe una potenza di calcolo che Leonardo è in grado di eseguire in un solo secondo.
Il sistema contiene al suo interno 14.000 GPU di architettura Ampere plus, una specifica configurazione dell’acceleratore GPU Ampere che Cineca ha co-progettato con uno dei leader del settore, la società Nvidia.
Campi di applicazione
MHB: Oggi sembra che il training delle IA sia la principale applicazione che necessita di grandi potenze di calcolo parallelo, quando in passato si pensava a meteorologia e difesa. Nel vostro caso quali sono stati i campi di applicazione principali, prima dell’avvento della IA generativa?
AP: Negli ultimi anni è aumentata in maniera esponenziale la quantità di campi di applicazione dei supercalcolatori. Nati per supportare la ricerca scientifica e l’innovazione, oggi i supercomputer sono utilizzati anche per analizzare i dati emersi dagli esperimenti dei fisici delle particelle, per supportare le osservazioni degli astrofisici che studiano l’evoluzione dello spazio, o in aiuto alla medicina, in particolare per quanto riguarda lo sviluppo di nuovi farmaci o delle discipline omiche.
Non solo nel campo della fisica e della sanità, i supercalcolatori hanno un ruolo chiave nella mitigazione e gestione di rischi dovuti a eventi naturali, come terremoti, eruzioni vulcaniche, inondazioni improvvise, ma anche nella lotta contro le situazioni pandemiche e le epidemie.
Oltre alla ricerca scientifica, i supercomputer hanno un vasto impiego anche nel settore industriale: si pensi ad esempio all’automotive, all’aerospazio, alla produzione e gestione di energia sia da fonti convenzionali come gas e idrocarburi, sia da fonti rinnovabili come eolico, fotovoltaico, idroelettrico, all’industria della chimica e dei materiali, all’industria dei semiconduttori e dei microprocessori, fino ai settori nuovi come industria della robotica o delle bioingegnerie.
Il progetto francese Mistral
MHB: Abbiamo letto il white paper della “IA Francese”, Mistral AI (Mistral 7B) dove venite ringraziati in prima persona. Qual è stato il vostro ruolo nel progetto Mistral e quale tipo di rapporto economico (se esiste) è stato adottato?
AP: Il modello LLM (Large Language Model) di Mistral è stato realizzato anche grazie alla collaborazione con Cineca, che ha messo a disposizione parte delle risorse di calcolo del supercalcolatore Leonardo, permettendo di eseguire sia il fine tuning del modello LLM che molti piccoli esperimenti per la scoperta dei parametri.
L’accesso alle risorse di Leonardo da parte di Mistral non ha comportato rapporti economici, ma sono state messe a disposizione all’interno di un protocollo di intesa sottoscritto fra Cineca e GENCI/CEA (Grand équipement national de calcul intensif – Francia), che prevedeva lo scambio di tempo calcolo a supporto della ricerca avanzata fra Leonardo e il sistema Exascale in via di realizzazione in Francia “Jules-Verne”.
Due anni di vantaggio
MHB: Poco dopo la nascita di ChatGPT il presidente francese Macron aveva annunciato un investimento di 500 milioni di euro per creare una IA “francese”. Poi però Mistral è stato trainato in Italia, il che mi fa pensare che per ora non dispongano di nulla di paragonabile a Leonardo. In generale, come pensa debba essere l’approccio europeo, quello stile Macron (sovrano) o uno al 100 per cento comunitario?
A.P.: Il consorzio Jules Verne (formato dagli istituti francesi GENCI e CEA e dall’olandese SURF) ha annunciato che il GENCI di Parigi ospiterà un nuovo supercomputer europeo di classe Exascale a partire dal 2026. Al momento attuale, però, i supercalcolatori dell’Unione europea di livello mondiale sono il nostro Leonardo, il finlandese LUMI e lo spagnolo MareNostrum5, appena inaugurato a dicembre 2023.
L’approccio, vista la scala degli investimenti e la portata delle competenze necessarie, deve avere almeno una dimensione europea: la Commissione europea e EuroHPC JU si sono impegnate ad ampliare l’accesso alle proprie risorse di supercalcolo per chi fa Intelligenza Artificiale in Europa, con l’obiettivo di creare un ecosistema di intelligenza artificiale affidabile e rendere disponibili risorse per l’apprendimento automatico a soggetti europei.
Con l’arrivo dei supercomputer exascale, le risorse di supercalcolo europee giocheranno un ruolo fondamentale nella creazione e nella formazione di modelli di Intelligenza Artificiale.
Utilizzabile gratuitamente
MHB: Infine, molte startup italiane vorrebbero poter disporre di GPU e potenza di calcolo per realizzare progetti simili a quello di Mistral. Quale è la vostra proposta verso queste entità?
AP: I nostri supercalcolatori sono a disposizione della comunità scientifica italiana ed europea, utilizzabili gratuitamente per progetti di ricerca e innovazione. Per accedervi si passa attraverso bandi e call pubbliche che vengono pubblicate con frequenza semestrale o attraverso la sottoposizione di progetti mediante azioni europee come EDIH, Centri di Competenza, Fortissimo PoC, o nazionali come il Centro Nazionale HPC, Big Data e Quantum Computing: chi ha un progetto fa domanda, che viene valutata sia in termini di merito tecnico-scientifico, sia in base alla fattibilità. Ai progetti selezionati vengono assegnate risorse di calcolo e il personale di supporto specialistico necessari alla realizzazione del progetto.
Affinché risorse così preziose, ma anche così rare e costose, siano accessibili al sistema paese è importante che l’infrastruttura sia pubblica e che abbia una vocazione alla ricerca avanzata.