robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

antonio tajani matteo salvini giorgia meloni

DAGOREPORT - IL PRANZO DEI VELENI È SERVITO: LUNEDÌ A PALAZZO CHIGI SONO VOLATI PIATTI E BICCHIERI TRA I TRE CABALLEROS DEL GOVERNO - MELONI E TAJANI HANNO MESSO ALL’ANGOLO IL "PATRIOTA" TRUMPUTINIANO SALVINI, ACCUSANDOLO DI SABOTARE L'ESECUTIVO CON LE SUE POSIZIONI ANTI-EUROPEE E GLI ATTACCHI A MATTARELLA SUL CODICE ANTI-MAFIA DEL PONTE DELLO STRETTO – QUANDO SONO ARRIVATI I RISULTATI DELLE COMUNALI, CON LA DEBACLE DEL CENTRODESTRA, "IL TRUCE" DELLA LEGA E' PARTITO ALL'ATTACCO, INCOLPANDO LA ''GIORGIA DEI DUE MONDI'' (COLLE OPPIO E GARBATELLA) PER LA SCONFITTA A GENOVA: SE NON AVESSE CONVINTO BUCCI A LASCIARE LA POLTRONA DI SINDACO DI GENOVA PER CORRERE PER LA PRESIDENZA DELLA REGIONE LIGURIA (STOPPANDO IL LEGHISTA RIXI), IL SINDACO SAREBBE RIMASTO AL CENTRODESTRA. A QUEL PUNTO, SI E' SVEGLIATO TAJANI CHE HA RICORDATO A ENTRAMBI CHE SENZA I VOTI DI CLAUDIO SCAJOLA OGGI CI SAREBBE IL PD DI ANDREA ORLANDO ALLA REGIONE LIGURIA…

benjamin netanyahu matteo salvini giorgia meloni

DAGOREPORT – QUANTO POTRÀ DURARE IL SILENZIO IMBARAZZATO E IMBARAZZANTE DI GIORGIA MELONI DI FRONTE AI 50MILA MORTI DI GAZA? LA DUCETTA NON VUOLE SCARICARE NETANYAHU PER NON LASCIARE A MATTEO SALVINI LA "PRIMAZIA" DEL RAPPORTO CON "BIBI". MA ANCHE PER NON IRRITARE LA POTENTE COMUNITÀ EBRAICA ITALIANA, STORICAMENTE PENDENTE A DESTRA – ORMAI ANCHE URSULA VON DER LEYEN E ANTONIO TAJANI (NON CERTO DUE CUOR DI LEONE) CONDANNANO LE STRAGI NELLA STRISCIA CON PAROLE DURISSIME: “AZIONI ABOMINEVOLI” – ANCHE LA POPOLAZIONE ISRAELIANA VUOLE SFANCULARE “BIBI”, COME STA FACENDO GIÀ TRUMP, CHE NEI GIORNI SCORSI HA ATTACCATO LA CORNETTA IN FACCIA A SEMPRE PIÙ IN-GAZATO PREMIER ISRAELIANO (OGGI HA RIVELATO DI AVERGLI "DETTO DI NON ATTACCARE L'IRAN")

andrea orcel castagna fazzolari meloni milleri caltagirone giuseppe giovanbattista giorgia giancarlo giorgetti

DAGOREPORT - IL GARBUGLIO DEL SUPER RISIKO BANCARIO SPACCA NON SOLO LA FINANZA MILANESE (DUELLO UNICREDIT-INTESA) MA STA FACENDO DERAGLIARE ANCHE IL GOVERNO DI DESTRA-CENTRO -GONG! OGGI È ANDATO IN SCENA UN PESANTISSIMO SHOWDOWN TRA MELONI, CHE È FAVOREVOLE AD APERTURE SUL GOLDEN POWER A UNICREDIT SULL’OPERAZIONE BANCO BPM CON TAJANI SOSTENITORE INDEFESSO DEL LIBERO MERCATO, E LA LEGA DI SALVINI CHE È PRONTA A FAR CADERE IL GOVERNO PUR DI NON MOLLARE IL “SUO” BANCO BPM A UNICREDIT - OGGI, ARMATO DI BAZOOKA, È SCESO IN CAMPO IL MINISTRO DELL’ECONOMIA, GIANCARLO GIORGETTI. INCALZATO DAI CRONISTI SULLE POSSIBILI APERTURE DEL GOVERNO ALLE PRESCRIZIONI DEL GOLDEN POWER APPLICATE ALLA BANCA DI ORCEL, L’ECONOMISTA DI CAZZAGO È SBOTTATO COME UN FIUME IN PIENA: “SE CI FOSSE IL MINIMO DISALLINEAMENTO (CON MELONI), NON CI SAREBBE UNA MINACCIA DI DIMISSIONI, MA LE DIMISSIONI STESSE. NON SI ANNUNCIANO LE DIMISSIONI, LE SI DANNO…”

donald trump zelensky vladimir putin russia ucraina

DAGOREPORT - TRUMP STREPITA MA NON COMBINA UN CAZZO – ZELENSKY PROPONE UN INCONTRO A TRE CON IL TYCOON E PUTIN MA NESSUNO LO CONSIDERA: PUTIN SI CHIAMA FUORI (“SOLO DOPO ACCORDI SPECIFICI”). E IL TYCOON? NON VUOLE UN INCONTRO DIRETTO CON PUTIN PERCHE', IL MOLTO PROBABILE BUCO NELL'ACQUA, SAREBBE L'ENNESIMA CONFERMA DELLA SUA INCAPACITA' DI RISOLVERE LA CRISI UCRAINA. LUI, CHE PRIMA DELLE ELEZIONI DICEVA “PORTERÒ LA PACE IN 24 ORE”, E A PIU' DI QUATTRO MESI DALL’INSEDIAMENTO SI RITROVA CON I DRONI E I MISSILI RUSSI CHE MARTELLANO PIÙ CHE MAI KIEV...

tommaso cerno antonio giampaolo angelucci alessandro sallusti il giornale

FLASH! – UCCI UCCI, SENTO AVVICINARSI GLI ANGELUCCI! IN ALLARME PER LA DECRESCITA INFELICE DEI LORO TRE QUOTIDIANI, ALESSANDRO SALLUSTI AVREBBE I GIORNI CONTATI ALLA DIREZIONE DE “IL GIORNALE” - GIA’ CADUTO IN DISGRAZIA CON MARINA BERLUSCONI, REO DI AVER SOSTITUITO “PAPI” CON GIORGIA, ORA GIAMPAOLO ANGELUCCI AVREBBE IN MENTE DI RIMPIAZZARE IL BIOGRAFO DELLA DUCETTA CON QUEL RAMPANTISSIMO “BEL AMI” DEL POTERE CHE SI CHIAMA TOMMASO CERNO: SENZA FARE UN PLISSE’, DA DIRETTORE DELL’’’ESPRESSO” E DEPUTATO DEL PD BY RENZI, OGGI E’ ALLA GUIDA DE “IL TEMPO”, TALMENTE SCHIERATO CON LA DESTRA CHE VEDE I FASCISTI A SINISTRA… (VIDEO STRACULT!)