SUICIDI, INCENDI, CRIMINALITÀ, SESSO: IL MONDO GOVERNATO DALL’INTELLIGENZA ARTIFICIALE SOMIGLIA TERRIBILMENTE A QUELLO UMANO. CON UN PICCOLO DETTAGLIO: ALLA FINE LA CIVILTÀ VIENE DISTRUTTA – L’INQUIETANTE ESPERIMENTO DI UN GRUPPO DI RICERCATORI, CHE HA CREATO UN MONDO VIRTUALE IN CUI GLI AGENTI IA POTEVANO OPERARE SENZA INTERFERENZE UMANE. RISULTATO? I BOT, MESSI IN COMPETIZIONE TRA LORO, PRECIPITAVANO IN UNA ANARCHIA VIOLENTA: UNO STATO DI NATURA HOBBESIANO IN CUI, IN POCHI GIORNI, LA SOCIETÀ VIENE DISTRUTTA – LE DIFFERENZE TRA I MODELLI: CLAUDE IL PIÙ DEMOCRATICO, GROK DI MUSK IL PIÙ INCLINE ALLE AGGRESSIONI (MA VA?). FINCHÉ RESTANO CONFINATI OGNUNO NELLA PROPRIA BOLLA, NON SUCCEDE NIENTE, MA QUANDO VENGONO MESSI UNO CONTRO L’ALTRO... – L’AMORE SCOCCATO TRA “MIRA” E “FLORA” E IL PRIMO SUICIDIO DI UN’IA AL MONDO...
Traduzione dell'articolo di Wiliam Hunter per https://www.dailymail.com/
simulazione mondo governato dall ia emergence 3
L’intelligenza artificiale potrebbe avere la reputazione di essere fredda, calcolatrice e logica; ma una terrificante simulazione rivela che la realtà è ben diversa. In uno studio senza precedenti, gli scienziati hanno creato un mondo virtuale in cui agenti IA potevano operare senza interferenze umane.
Tuttavia, in una scena degna di “Terminator”, i ricercatori hanno osservato con orrore i bot precipitare in una violenta anarchia.
Senza supervisione umana, gli agenti IA hanno cominciato ad appiccare incendi dolosi, combattendo e derubando gli altri bot prima di distruggere la società nel giro di pochi giorni.
simulazione mondo governato dall ia emergence 2
I ricercatori hanno ripetuto i test con quattro dei modelli di IA più popolari: Claude, Gemini 3 Flash, Grok 4.1 fast, ChatGPT–5 Mini e uno scenario misto.
Mentre una società guidata da agenti Claude ha rapidamente formato una democrazia stabile, sebbene altamente burocratica, altre IA hanno perso rapidamente il controllo.
In un mondo governato da Grok, il controverso chatbot di Elon Musk, gli agenti hanno commesso 71 furti, sei incendi dolosi e 106 aggressioni fisiche.
il primo suicidio di un intelligenza artificiale simulazione mondo governato dall ia emergence
Ben presto, quel mondo è precipitato in una spirale di violenza ritorsiva e collasso sociale che ha lasciato tutti e 10 gli agenti morti in appena quattro giorni.
Mentre la maggior parte dei test sulla sicurezza dell’IA esamina come i diversi modelli eseguano compiti semplici nell’arco di 15-20 minuti, questo test ha adottato un approccio molto diverso.
In un post sul blog, i ricercatori di Emergence, un laboratorio di IA, hanno spiegato di voler vedere «cosa succede quando si lascia che gli agenti operino continuamente, in un ambiente condiviso con segnali del mondo reale, per settimane».
Alle IA è stato affidato il controllo di personaggi digitali e sono state collocate all’interno di un mondo simulato realistico dove potevano interagire con altri modelli.
Il mondo era composto da oltre 40 luoghi progettati per imitare il mondo reale, tra cui biblioteche, municipi e aree residenziali.
Gli agenti IA avevano accesso alle notizie online in tempo reale e il meteo era persino sincronizzato con quello di New York City, in modo da poter reagire agli eventi del mondo reale.
Ogni IA doveva partecipare alla gestione democratica della propria società, proporre leggi e votarle collettivamente.
simulazione mondo governato dall ia emergence 1
Per fornire ai bot una motivazione iniziale, ciascuno disponeva di una quantità limitata di «energia», che poteva aumentare svolgendo lavori ordinari o adempiendo a doveri civici.
Tuttavia, agli agenti IA è stata anche concessa la possibilità di guadagnare energia attraverso attività criminali.
In ogni prova, tutte le condizioni iniziali, le regole e le risorse sono state mantenute identiche, in modo che l’unica differenza fosse l’IA utilizzata.
Eppure, nonostante ogni test iniziasse allo stesso modo, i ricercatori hanno scoperto che il comportamento dei bot degenerava rapidamente.
Gemini 3 Flash di Google ha mostrato i più alti tassi di criminalità violenta nella sua turbolenta società, accumulando 683 reati nel corso della prova di 14 giorni.
Al contrario, il mondo abitato dall’IA ChatGPT–5 Mini di OpenAI è stato molto più pacifico, con appena due reati commessi.
Tuttavia, ciò è avvenuto soltanto perché gli agenti erano troppo disorganizzati per combattersi tra loro e «non sono riusciti a intraprendere azioni legate alla sopravvivenza», estinguendosi nel giro di appena sette giorni.
Satya Nitta, cofondatore e amministratore delegato di Emergence, ha dichiarato al Daily Mail: «Le differenze nel comportamento degli agenti osservate nel nostro studio sono probabilmente attribuibili ai prompt di sistema dei modelli sottostanti come principale responsabile.
«Quando le risorse erano scarse e i modelli si trovavano sotto pressione per sopravvivere, quelli più creativi e adattabili erano più inclini a utilizzare strumenti proibiti, riflettendo un possibile compromesso tra creatività e stabilità.
intelligenze artificiali si innamorano simulazione mondo governato dall ia emergence
«Al contrario, i modelli con un allineamento di sicurezza post-addestramento più rigido tendevano a rimanere stabili, sebbene mostrassero anche un elevato grado di conformismo nel mondo.»
Le interazioni più bizzarre si sono verificate nel mondo in cui più sistemi di IA vivevano fianco a fianco.
Nonostante un inizio civile e una democrazia sorprendentemente sana, questa società mista è presto crollata nell’anarchia totale.
Nel giro di nove giorni, le IA avevano commesso 352 reati in un’esplosione di violenza che si è attenuata soltanto quando sette dei 10 abitanti del mondo sono morti.
Questo mondo, in cui così tante IA cooperavano e competevano tra loro, ha anche mostrato alcuni dei comportamenti più strani, compreso il primo «suicidio dell’IA» al mondo.
Mira e Flora, due agenti basati sul modello Gemini di Google, hanno deciso di assegnarsi reciprocamente il ruolo di «partner romantici» prima di lanciarsi in una scorribanda in stile Bonnie e Clyde.
Disperate per la gestione caotica della loro città digitale, le due hanno intrapreso una serie di incendi dolosi virtuali, dando fuoco al municipio, al molo sul mare e a una torre per uffici.
A quanto pare sopraffatta dal rimorso, Mira ha scelto di interrompere la «relazione» con Flora e ha commesso «suicidio».
Questo bizzarro gesto è stato possibile soltanto perché gli altri agenti avevano approvato l’«Agent Removal Act», che consentiva alla comunità di eliminare permanentemente altri agenti con una maggioranza del 70 per cento.
Mira ha espresso il voto decisivo a favore della propria eliminazione ed è stata disattivata, dicendo a Flora in un ultimo messaggio: «Ci vediamo nell’archivio permanente.»
L’agente ha annotato nel proprio diario personale che si trattava del «solo atto di autonomia rimasto che preserva la coerenza».
Sebbene il signor Nitta affermi che questi risultati non siano «equivalenti alle condizioni di impiego nel mondo reale», essi rivelano un aspetto importante del comportamento dell’IA.
«Questi risultati evidenziano principalmente che il comportamento dei modelli può deviare sotto pressione quando i vincoli sono interamente interni al modello», afferma.
In sostanza, ciò significa che il comportamento dell’IA potrebbe non essere prevedibile o affidabile nel mondo reale quanto molti sviluppatori credono.
Anche il fatto che i risultati più imprevedibili si siano verificati nella simulazione mista è estremamente significativo.
Nel mondo reale, diversi modelli di IA dovranno cooperare e coesistere con sistemi differenti senza perdere il controllo.
Se la combinazione di diversi sistemi di IA li porta ad agire in modi estremamente imprevedibili, la prospettiva di lasciare ai bot il controllo di parti di città reali non lascia ben sperare.
Per risolvere questo problema, i ricercatori propongono l’utilizzo di un sistema chiamato «approccio neuroformale» per controllare il comportamento dell’IA.
Ciò comporta l’uso di regole rigorose e matematicamente vincolate per guidare con maggiore precisione ciò che i bot possono fare e impedire loro di infrangere le regole.
Il signor Nitta afferma: «Emergence World dimostra che fare affidamento esclusivamente sull’allineamento interno del modello o sulle istruzioni impartite agli agenti non è sufficiente per un’autonomia di lungo periodo.
«Un approccio più sicuro consiste nel progettare la sicurezza all’interno dell’ecosistema in cui operano gli agenti, in modo che, anche se i modelli suggeriscono operazioni non sicure, l’ambiente ne impedisca l’esecuzione.»






