robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

matteo piantedosi claudia conte

TUTTE LE DOMANDE SUL CASO CONTE-PIANTEDOSI – PERCHÉ CLAUDIA CONTE, CHE SOSTIENE DI ESSERE UNA “PERSONA MOLTO RISERVATA”, HA DECISO DI ROMPERE GLI INDUGI E DICHIARARE AL MONDO LA SUA RELAZIONE CON IL MINISTRO DELL’INTERNO PROPRIO ADESSO? LA GIORNALISTA E “PRODUCER” DEI SUOI AFFARI SI È RESA CONTO DI AVER MESSO IN DIFFICOLTÀ IL PREFETTO IRPINO, E PURE SE STESSA (I SUOI INCARICHI PASSATI E FUTURI SARANNO PASSATI AL SETACCIO) – CON TUTTI I GIORNALISTI CHE CONOSCE, PERCHÉ CLAUDIA CONTE SI È FATTA INTERVISTARE DAL “FRATELLINO D’ITALIA” MARCO GAETANI, CONCORDANDO PRIMA LA DOMANDA SU PIANTEDOSI? IL BOCCOLUTO CONDUTTORE DI RADIO ATREJU SI È ACCORTO CHE LA NOTIZIA SAREBBE STATA UNA BOMBA SU PALAZZO CHIGI? – INFINE, LA DOMANDA DELLE DOMANDE: QUAL È L’OBIETTIVO DEL “COMING OUT”? C’È UN INTERESSE SINGOLO O MULTIPLO? E DI CHI? È DI CONTE E PIANTEDOSI INSIEME? DELLA SOLA EX "RAGAZZA CINEMA OK"? OPPURE LA NOTIZIA INTERESSA ANCHE QUALCUN ALTRO, CON CONSEGUENZE POTENZIALMENTE FATALI PER IL GOVERNO?

parolin papa leone xiv prevost pena parra barbara jatta franceaca francesca immacolata chaouqui

DAGOREPORT - GRRRRR! LA ZAMPATA DI PAPA LEONE: IN SOFFITTA L’ERA BERGOGLIO, PIENI POTERI A PAROLIN - PREVOST HA RESTITUITO IL FAVORE DELLA SUA ELEZIONE AL TRONO DI PIETRO CONCEDENDO, FINALMENTE IL GOVERNO DELLA CHIESA A PIETRO PAROLIN - PER 13 ANNI IL SEGRETARIO DI STATO E' STATO INFATTI IGNORATO E UMILIATO, PREFERENDO IL PAPA ARGENTINO FARSI RIMBAMBIRE DAL DISCUSSO EDGAR PEÑA PARRA, UNA SORTA DI RASPUTIN NELLE STANZE DI SANTA MARTA - COME NUOVO SOSTITUTO AGLI AFFARI GENERALI DELLA SEGRETERIA DI STATO ARRIVA PAOLO RUDELLI, MENTRE PEÑA PARRA VIENE ACCANTONATO COME NUNZIO IN ITALIA MA PARE CHE DURERÀ POCO: IL SUO NOME È DESTINATO A RIENTRARE NELLE CARTE DEL PROCESSO BECCIU - CON PAROLIN LA CURIA TORNA AD ESSERE UN'ISTITUZIONE CATTOLICA. E FORSE PER QUESTO C’È GRANDE AGITAZIONE TRA “LE CARDINALESSE” DELL'ERA BERGOGLIO, PRIVE DELLO SCUDO  DELLO SCUDO DI PEÑA PARRA: SUOR RAFFAELLA PETRINI, PRESIDENTE DEL GOVERNATORATO VATICANO; BARBARA JATTA, DIRETTRICE DEI MUSEI VATICANI; L’AVVOCATO CANONICO LAURA SGRÒ, PALADINA DI CAUSE MOLTO MEDIATIZZATE E FRANCESCA IMMACOLATA (SI FA PER DIRE) CHAOUQUI...

matteo piantedosi claudia conte

FLASH – FERMI TUTTI: MATTEO PIANTEDOSI E CLAUDIA CONTE SI CONOSCEVANO GIÀ PRIMA CHE IL PREFETTO IRPINO DIVENTASSE MINISTRO! IL 16 DICEMBRE 2021, PIANTEDOSI PARTECIPÒ ALLA PRESENTAZIONE DEL ROMANZO DELLA PREZZEMOLONA CIOCIARA, “LA LEGGE DEL CUORE”. UN EVENTO PATROCINATO DAL MINISTERO DELLA CULTURA, ALLORA GUIDATO DA “SU-DARIO” FRANCESCHINI – GLI “ADDETTI AI LIVORI” “DATANO” L’INIZIO DELLA RELAZIONE TRA I DUE AL 2023, QUANDO CLAUDIA CONTE MODERÒ UN CONVEGNO SULL'EREDITÀ DI ALDO MORO AL SENATO, A CUI PARTECIPAVA IL MINISTRO DELL'INTERNO. AVEVANO INIZIATO A FREQUENTARSI PRIMA?

claudia conte

DAGOREPORT - COME MAI I CAMERATI VIA DELLA SCROFA HANNO MESSO SU UNA SCENEGGIATA PER SPUTTANARE LA LIASON TRA IL MINISTRO DEGLI INTERNI MATTEO PIANTEDOSI E LA CURVACEA CLAUDIA CONTE? - SAPETE CHI E' STATO AD INTERVISTARLA? NIENTEMENO CHE IL SOCIAL MEDIA STRATEGIST DI FRATELLI D’ITALIA ALLA CAMERA, MARCO GAETANI, UN BOCCOLUTO DONZELLIANO TENDENZA ARIANNA - BENE: SE TUTTO È STATO CUCINATO IN VIA DELLA SCROFA, PERCHÉ STENDERE IL TAPPETO ROSSO ALLA DICHIARAZIONE D'AMORE DELLA "PREZZEMOLONA" DEI PALAZZI ROMANI, METTENDO IN MUTANDE IL NUMERO UNO DEL VIMINALE? - PERCHE' LA SUA POLTRONA È DA ANNI RICHIESTA VIGOROSAMENTE INDIETRO DA MATTEO SALVINI, DI CUI PIANTEDOSI ERA ALL'EPOCA IL SUO FIDO CAPO DI GABINETTO, POI PASSATO SOTTO L'ALA DELLA MELONA ACCHIAPPATTUTTO? - VISTO CHE È IN VENA DI RIVELAZIONI, PERCHÉ CLAUDIA CONTE NON CI DICE DA QUANTO TEMPO VA AVANTI LA SUA AFFETTUOSA AMICIZIA CON IL MINISTRO DELL'INTERNO? ''TRE ANNI DI PIANTEDOSI'', COME QUALCHE "ADDETTO AI LIVORI" SUSSURRA? PERCHÉ - MA GUARDA TU IL CASO! - È PROPRIO DA TRE ANNI CHE LA STELLA DI CLAUDIA HA INIZIATO A SBRILLUCCICARE NEI CIELI TRICOLORI - VIDEO

donald trump roberto cingolani

FLASH! – L’INCAZZATURA DI MELONI CON ROBERTO CINGOLANI? FOLLOW THE MONEY! L’IRRITAZIONE DELLA PREMIER CON L’AD DI LEONARDO NON SI DEVE A QUESTIONI POLITICHE O AL SOLO DESIDERIO DI FARE PIAZZA PULITA DOPO LA BATOSTA REFERENDARIA. LA “COLPA” DI CINGOLANI È DI AVER PROGETTATO IL SOFISTICATISSIMO SCUDO ANTI-MISSILE “MICHELANGELO DOME”. DAGLI STATI UNITI SI ASPETTAVANO CHE L’ITALIA, COME LA GERMANIA, RICORRESSE AL COLLAUDATO SISTEMA ISRAELO-AMERICANO “IRON DOME”, A CUI IL PROGETTO ITALIANO FAREBBE UNA BELLA CONCORRENZA…