27 mag 2025 18:07

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

stefano benigni marina berlusconi antonio tajani

16 lug 15:48

LA “SFI-DUCETTA” ALLA LEGGE ELETTORALE HA APERTO IL VASO DI PANDORA: IN FORZA ITALIA SIAMO ALLA NOTTE DEI LUNGHI COLTELLI! SI VOCIFERA CHE IL SEGRETARIO, ANTONIO TAJANI E STEFANO BENIGNI PASSASSERO FRA I BANCHI A DIRE AI DEPUTATI COME VOTARE. MA HANNO FALLITO: IL LORO OBIETTIVO ERA INFATTI FAR PASSARE L’EMENDAMENTO SULLE PREFERENZE, IN PARTICOLARE IL SUPERAMENTO DELLA REGOLA DEL 60/40 (L’ALTERNANZA DI GENERE) - L’EX MONARCHICO VORREBBE LIBERARSI DEI PARLAMENTARI STORICAMENTE LEGATI A SILVIO BERLUSCONI, E OGGI A MARINA – IL SEGRETARIO È CONVINTO CHE LA “CAVALIERA” NON METTERÀ BOCCA SULLE LISTE PERCHE' SI SAREBBE GIÀ STANCATA DEL "GIOCATTOLO” FORZA ITALIA...

15 lug 20:03

DAGOREPORT – ORA SÌ CHE TI RICONOSCIAMO, NAIKE! LA RIVELLI DEDICA UN ALTRO VIDEO COATTO A DAGOSPIA E FINALMENTE TORNA LA BURINELLA CHE ABBIAMO SEMPRE AMATO – DALLE LEZIONI SULL’INGOIO DELLE BANANE ALLA FOTO CON LA TESTA NEL CESSO FINO ALLA “VULVA ART” E ALLA MEGA-HIT “DEFAILLANCE”, ABBIAMO SEMPRE ADORATO LA NAIKE FUORI CONTROLLO, TRA AVVENTURE LESBO, FOTO IGNUDA E APPELLI PRO-GNOCCA – CARISSIMA NAIKE, ABBIAMO UN CONSIGLIO: LASCIA PERDERE I DISSING, GLI SCONTRI VERBALI, LE POLEMICHE. NON SONO PER TE. NON AFFATICARE LE SINAPSI, LASCIALE LIBERE DI SINTONIZZARSI CON L’UNIVERSO. SPALANCA I CHAKRA, CHISSÀ CHE L’ENERGIA COSMICA NON ENTRI A FARE UN SALUTO. NON PRENDERTI TROPPO SUL SERIO. NOI NON L’ABBIAMO MAI FATTO...

giorgia meloni salvini tajani legge elettorale

15 lug 19:40

DAGOREPORT – GIORGIA MELONI ERA CONVINTA DI AVER TROVATO UN ACCORDO CON SALVINI E TAJANI: PER AMMANSIRE I SUOI DUE ALLEATI, CONTRARISSIMI ALLE PREFERENZE, LI AVEVA ACCONTENTATI CON LE NOMINE DI STRISCIUGLIO A FERROVIE E STAZI ALLA CONSOB. OTTENUTO TUTTO QUESTO, NON SI METTERANNO MICA A ROMPERE I COJONI, PENSAVA LA DUCETTA. E INVECE… - IL GUAIO È CHE IL “FU TRUCE DEL PAPEETE” E L’EX MONARCHICO DI FERENTINO NON GOVERNANO PIÙ I LORO PARTITI, ORMAI SFARINATI – DENTRO FRATELLI D’ITALIA, MICA VA TANTO MEGLIO: QUANDO FRANCESCO LOLLOBRIGIDA PARLA DI “VIGLIACCHINI” CHE HANNO VOTATO NO, CE L’HA ANCHE CON I SUOI CAMERATI DI VIA DELLA SCROFA (IL PARTITO GRANITICO E COMPATTO DIETRO “IO SO’ GIORGIA’ NON ESISTE PIÙ

13 lug 20:46

DAGOREPORT- MENTRE LA RIFORMA ELETTORALE APPRODA IN PARLAMENTO, GIORGIA MELONI È TORMENTATA DA DUBBI E PERPLESSITÀ - ALL’EPOCA DELLA STESURA DEL NUOVO SISTEMA DI VOTO, NESSUNO DELLA FIAMMA MAGICA AVEVA PRESO IN SERIA CONSIDERAZIONE IL GENERALISSIMO VANNACCI E L'INARRESTABILE ASCESA DEL SUO PARTITO FUTURO NAZIONALE - E ADESSO SI CORRE IL FORTE RISCHIO CHE NESSUNA DELLE DUE CONTRAPPOSTE ALLEANZE RIESCA A INCAMERARE QUEL 42% CHE PORTEREBBE A UN PREMIO DI MAGGIORANZA DI 70 DEPUTATI E 35 SENATORI - UN BONUS TALMENTE ESAGERATO CHE LA CORTE COSTITUZIONALE NON AVREBBE IL MINIMO DUBBIO NEL BOCCIARLO - NON SOLO: A FINIRE SOTTO GLI ARTIGLI DELLA CORTE SPICCA ANCHE L’INDICAZIONE DEL CANDIDATO PREMIER NEL PROGRAMMA, UNA SORTA DI PREMIERATO IN VERSIONE DIETOR CHE VA A CONFLIGGERE CON LA COSTITUZIONE CHE VUOLE CHE SIA IL CAPO DELLO STATO A INDICARE IL PREMIER…

13 lug 20:05

DAGOREPORT - TRUFFE, FAVORI, ABUSI DI POTERE: MA COME SI FA A DIRE AI RAGAZZI DI STUDIARE E A CREDERE NELL’UNIVERSITÀ ITALIANA? - IL PRIMO ATENEO IN CLASSIFICA, IL POLITECNICO DI MILANO, TIENE PER TRENT’ANNI UN PROFESSORE PRECARIO A MILLE EURO CIRCA ALL’ANNO, MENO DI UN PAKISTANO CHE RACCOGLIE POMODORI! - CONTRO GLI ESITI, PILOTATI, DEI CONCORSI UNIVERSITARI, GIACCIONO CENTINAIA DI CAUSE DI RICORSO, POICHÉ L’ITALIA È L’UNICO PAESE DOVE PRIMA SI SCEGLIE IL CANDIDATO, POI SI RITAGLIA IL CONCORSO - IL CELEBRATO ERASMUS E' TANTO DIVERTENTE PER GLI STUDENTI (ANCHE PER ACCOPPIARSI) QUANTO INUTILISSIMO PER LO STUDIO: LO SANNO TUTTI CHE LO STUDENTE ERASMUS LO SI FA PASSARE PERCHÉ TANTO POI SE NE TORNA NELLA SUA UNIVERSITÀ - IN PARLAMENTO HANNO FATTO SALTARE L’ABILITAZIONE NAZIONALE (CHE FU INTRODOTTA DALLA GELMINI): I CONCORSI PER NUOVI DOCENTI SARANNO LOCALI, CIOE’ CONSEGNATI, COMPLETAMENTE, NELLE MANI DEI ‘’BARONI’’: TANTO LA MAGISTRATURA DORME (OPPURE LI ASSOLVE) - E PER FORTUNA CHE È IL GOVERNO DELLA MERITOCRAZIA, PRESIEDUTO DA UN “UNDERDOG”…

tommaso cerno lirio abbate sigfrido ranucci giuliano ferrara valter lavitola

11 lug 19:28

DAGOREPORT - SE C'È UN FILO DI CONTINUITÀ NELLA STORIA DELL’ITALIETTA, UN ELEMENTO CHE RIMBALZA DA UN SECOLO ALL'ALTRO, È IL TRASFORMISMO - SE ALL’EPOCA SULLA VOLATILITÀ DI GIULIANO FERRARA SCESE UNA SORTA DI CONDANNA MORALE, OGGI SI VEDONO COSE CHE DIECI ANNI FA SI POTEVANO IMMAGINARE SOLO IN UN FANTAFUMETTO - L'"AMICIZIA FRATERNA" CHE LEGA L’EX GALEOTTO LAVITOLA CON IL GIORNALISTA DI PUNTA DELL’ANTI-POTERE, SIGFRIDO RANUCCI - L’EX DIRETTORE DELL’''ESPRESSO” LIRIO ABBATE CHE È IN ATTESA DI ASSUMERE LA VICE-DIREZIONE DEL ‘’GIORNALE’’, DOVE L’ATTENDE IL ‘’CERNO-BYL’’ DEL TRASFORMISMO: IL GAIO TOMMASINO, NEL BREVE GIRO DI UN LUSTRO, È STATO DIRETTORE DELL’’’ESPRESSO’’, VICEDIRETTORE DI ‘’REPUBBLICA’’, SENATORE PD SOTTO L’ALA DI RENZI, FINO A QUANDO, TRAFITTO DAL RAGGIO DI GIORGIA MELONI, E' PLANATO NELLA STAMPA DI DESTRA - TI BUTTI NELLA VITA DI MARIO ORFEO E SALTA FUORI DI TUTTO: DA CALTAGIRONE ALLA RAI, DA “REPUBBLICA” A LEONARDINO DEL VECCHIO…