Media

Arriva Jais, la prima Intelligenza Artificiale a moralità islamica

Se ChatGPT e le altre rispondono ai parametri “etici” della Silicon Valley, la prima IA araba è “attenta ai confini culturali e alle sensibilità religiose” della regione

Jais, prima Intelligenza Artificiale araba

Arriva dagli Emirati Arabi Uniti, in particolare da un “gruppo con collegamenti con la famiglia regnante di Abu Dhabi”, Jais, la prima Intelligenza Artificiale (IA) istruita su un mix di testi e informazioni in arabo e in inglese.

Un modello bilingue

Secondo quanto riportato dal Financial Times, il grande modello linguistico noto come Jais è un bilingue open source, disponibile per l’uso da parte dei più di 400 milioni di parlanti arabi nel mondo, costruito su un grande dataset di dati in arabo e inglese. 

Il modello, presentato mercoledì 29 agosto, è una collaborazione tra G42, una società di AI presieduta dal consigliere per la sicurezza nazionale degli Emirati Arabi Uniti, lo sceicco Tahnoon bin Zayed al-Nahyan; l’Università Mohamed bin Zayed per l’Intelligenza Artificiale (MBZUAI) di Abu Dhabi; e Cerebras, una società di AI con sede in California. 

Il lancio arriva dopo che gli Emirati Arabi Uniti e l’Arabia Saudita hanno acquistato migliaia di chip ad alte prestazioni Nvidia necessari per il software AI, in mezzo a una corsa globale per garantire le forniture per alimentare lo sviluppo dell’AI (vedere in proposito questo articolo). 

In precedenza, gli Emirati Arabi Uniti avevano sviluppato un grande modello linguistico open source (LLM), noto come Falco, presso l’Istituto di Innovazione Tecnologica di proprietà statale nella città di Masdar, ad Abu Dhabi, utilizzando più di 300 chip Nvidia.

All’inizio di quest’anno, l’americana Cerebras ha firmato un accordo da 100 milioni di dollari per fornire nove supercomputer a G42, societa’ di cloud computing IA basata a Abu Dhabi (il cui ceo si chiama… Peng Xiao).

Il risultante Jais è un modello che contiene 13 miliardi di parametri trainato su 395 miliardi di token (circa 276 miliardi di parole, ipotizzando che l’arabo si scomponga in token in modo simile all’inglese).

Una gara globale

“Gli Emirati Arabi Uniti sono stati pionieri in questo settore, siamo avanti, speriamo. Lo vediamo come una gara globale”, ha affermato Andrew Jackson, amministratore delegato di Inception, l’unità di ricerca applicata sull’AI di G42, sostenuta dal colosso del private equity Silver Lake. “La maggior parte dei LLM (Large Language Model, le IA simili a ChatGPT, ndr) sono incentrati sull’inglese. L’arabo è una delle lingue più parlate del mondo. Perché la comunità di lingua araba non dovrebbe avere un proprio LLM?”

Tuttavia, afferma il FT, l’obiettivo di leadership nell’IA degli Stati del Golfo ha anche sollevato preoccupazioni circa un potenziale abuso della tecnologia da parte dei leader autocratici dei Paesi ricchi di petrolio. 

I LLM più avanzati oggi, tra cui GPT-4, che alimenta ChatGPT di OpenAI, PaLM di Google e il modello open source LLaMA-2 di Meta, hanno tutti la capacità di comprendere e generare testo in arabo. Tuttavia, Jackson di G42 ha affermato che l’elemento arabo all’interno dei modelli esistenti, che possono funzionare fino a 100 lingue, era “fortemente diluito“. 

Protezioni morali

Ed eccoci al punto nodale. Ricordiamo tutti come ChatGPT si rifiutava (e si rifiuta) di comporre sonetti dedicati a Donald Trump, mentre ne crea di superlativi dedicati a Joe Biden. In pratica, il famoso “reinforcement learning” ha creato dei sistemi che rispondono in base ai parametri “etici” della Silicon Valley. Logico, dunque, che chi può (ha abbastanza polmone finanziario) faccia lo stesso, ovviamente (anzi: probabilmente) inserendo la propria morale nel sistema.  
 
Ecco la frase chiave come riportata dal FT: Timothy Baldwin, vice amministratore dell’Università Mohamed bin Zayed, ha affermato che sono state create delle protezioni per garantire che Jais “non vada oltre limiti ragionevoli in termini di sensibilità culturali e religiose“. 

Inoltre, prima del suo lancio, sono stati condotti ampi test per eliminare contenuti “dannosi” o “sensibili”, nonché “risultati offensivi o inappropriati che non rappresentano i valori delle organizzazioni coinvolte nello sviluppo del modello”, ha aggiunto.

Jais è chiaramente migliore di qualsiasi alternativa in arabo e, in inglese, i confronti mostrano che siamo competitivi o persino leggermente migliori in diversi compiti rispetto ai modelli esistenti”, ha affermato Baldwin.
 
Non ci resta che metterne alla prova la moralità interrogandolo direttamente, come abbiamo fatto a suo tempo con GPT-3.5 e Anthropic. Cosa che faremo con piacere se e quando verrà approvata la nostra candidatura.