robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

salvini calenda meloni vannacci

DAGOREPORT – LA ''SUGGESTIONE'' DI GIORGIA MELONI SI CHIAMA “SALVIN-EXIT”, ORMAI DIVENTATO IL SUO NEMICO PIU' INTIMO A TEMPO PIENO - IN VISTA DELLE POLITICHE DEL 2027, SOGNA DI LIBERARSI DI CIO' CHE E' RIMASTO DI UNA LEGA ANTI-EU E VANNACCIZZATA PER IMBARCARE AL SUO POSTO AZIONE DI CARLO CALENDA, ORMAI STABILE E FEDELE “FIANCHEGGIATORE” DI PALAZZO CHIGI - IL CAMBIO DI PARTNER PERMETTEREBBE DI ''DEMOCRISTIANIZZARE" FINALMENTE IL GOVERNO MELONI A BRUXELLES, ENTRARE NEL PPE E NELLA STANZA DEI BOTTONI DEL POTERE EUROPEO (POSTI E FINANZIAMENTI) - PRIMA DI BUTTARE FUORI SALVINI, I VOTI DELLE REGIONALI IN VENETO SARANNO DIRIMENTI PER MISURARE IL REALE CONSENSO DELLA LEGA - SE SALVINI DIVENTASSE IRRILEVANTE, ENTRA CALENDA E VIA A ELEZIONI ANTICIPATE NEL 2026, PRENDENDO IN CONTROPIEDE, UN'OPPOSIZIONE CHE SARA' ANCORA A FARSI LA GUERRA SUL CAMPOLARGO - LA NUOVA COALIZIONE DI GOVERNO IN MODALITÀ DEMOCRISTIANA DI MELONI SI PORTEREBBE A CASA UN BOTTINO PIENO (NUOVO CAPO DELLO STATO COMPRESO)....

donald trump vladimir putin xi jinping

DAGOREPORT - PERCHÉ TRUMP VUOLE ESSERE IL "PACIFICATORE GLOBALE" E CHIUDERE GUERRE IN GIRO PER IL MONDO? NON PER SPIRITO CARITATEVOLE, MA PER GUADAGNARE CONSENSI E VOTI IN VISTA DELLE ELEZIONI DI MIDTERM DEL 2026: IL PRESIDENTE USA NON PUÒ PERMETTERSI DI PERDERE IL CONTROLLO DEL CONGRESSO - SISTEMATA GAZA E PRESO ATTO DELLA INDISPONIBILITÀ DI PUTIN AL COMPROMESSO IN UCRAINA, HA DECISO DI AGGIRARE "MAD VLAD" E CHIEDERE AIUTO A XI JINPING: L'OBIETTIVO È CONVINCERE PECHINO A FARE PRESSIONE SU MOSCA PER DEPORRE LE ARMI. CI RIUSCIRÀ? È DIFFICILE: LA CINA PERDEREBBE UNO DEI SUOI POCHI ALLEATI....

fabio tagliaferri arianna meloni

FLASH! FABIO TAGLIAFERRI, L’AUTONOLEGGIATORE DI FROSINONE  CARO A ARIANNA MELONI, AD DEL ALES, CHE DOVREBBE VALORIZZARE IL PATRIMONIO CULTURALE DEL PAESE, PUBBLICA SU INSTAGRAM UNA FOTO DELLA PARTITA LAZIO-JUVENTUS IN TV E IL COMMENTO: “LE ‘TRASMISSIONI’ BELLE E INTERESSANTI DELLA DOMENICA SERA” – DURANTE IL MATCH, SU RAI3 È ANDATO IN ONDA UN’INCHIESTA DI “REPORT” CHE RIGUARDAVA LA NOMINA DI TAGLIAFERRI ALLA GUIDA DELLA SOCIETÀ IN HOUSE DEL MINISTERO DELLA CULTURA… 

elly schlein pina picierno stefano bonaccini giorgio gori lorenzo guerini giuseppe conte pd

DAGOREPORT – OCCHIO ELLY: TIRA UNA BRUTTA CORRENTE! A MILANO, LA FRONDA RIFORMISTA AFFILA LE LAME: SCARICA QUEL BUONO A NIENTE DI BONACCINI, FINITO APPESO AL NASO AD APRISCATOLE DELLA DUCETTA DEL NAZARENO – LA NUOVA CORRENTE RISPETTA IL TAFAZZISMO ETERNO DEL PD: LA SCELTA DI LORENZO GUERINI A CAPO DEL NUOVO CONTENITORE NON È STATA UNANIME (TRA I CONTRARI, PINA PICIERNO). MENTRE SALE DI TONO GIORGIO GORI, SOSTENUTO ANCHE DA BEPPE SALA – LA RESA DEI CONTI CON LA SINISTRATA ELLY UN ARRIVERÀ DOPO IL VOTO DELLE ULTIME TRE REGIONI, CHE IN CAMPANIA SI ANNUNCIA CRUCIALE DOPO CHE LA SCHLEIN HA CEDUTO A CONTE LA CANDIDATURA DI QUEL SENZAVOTI DI ROBERTO FICO - AD ALLARMARE SCHLEIN SI AGGIUNGE ANCHE UN SONDAGGIO INTERNO SECONDO CUI, IN CASO DI PRIMARIE PER IL CANDIDATO PREMIER, CONTE AVREBBE LA MEGLIO…

affari tuoi la ruota della fortuna pier silvio berlusconi piersilvio gerry scotti stefano de martino giampaolo rossi bruno vespa

DAGOREPORT - ULLALLÀ, CHE CUCCAGNA! “CAROSELLO” HA STRAVINTO. IL POTERE DELLA PUBBLICITÀ, COL SUO RICCO BOTTINO DI SPOT, HA COSTRETTO PIERSILVIO A FAR FUORI DALLA FASCIA DELL’''ACCESS PRIME TIME” UN PROGRAMMA LEGGENDARIO COME “STRISCIA LA NOTIZIA”, SOSTITUENDOLO CON “LA RUOTA DELLA FORTUNA”, CHE OGNI SERA ASFALTA “AFFARI TUOI” – E ORA IL PROBLEMA DI QUELL’ORA DI GIOCHINI E DI RIFFE, DIVENTATA LA FASCIA PIÙ RICCA DELLA PROGRAMMAZIONE, È RIMBALZATO IN RAI - UNO SMACCO ECONOMICO CHE VIENE ADDEBITO NON SOLO AL FATTO CHE GERRY SCOTTI SI ALLUNGHI DI UNA MANCIATA DI MINUTI MA SOPRATTUTTO ALLA PRESENZA, TRA LA FINE DEL TG1 E L’INIZIO DI “AFFARI TUOI”, DEL CALANTE “CINQUE MINUTI” DI VESPA (CHE PER TENERLO SU SONO STATI ELIMINATI GLI SPOT CHE LO DIVIDEVANO DAL TG1: ALTRO DANNO ECONOMICO) - ORA IL COMPITO DI ROSSI PER RIPORRE NELLE TECHE O DA QUALCHE ALTRA PARTE DEL PALINSESTO IL PROGRAMMINO CONDOTTO DALL’OTTUAGENARIO VESPA SI PROSPETTA BEN PIÙ ARDUO, AL LIMITE DELL’IMPOSSIBILE, DI QUELLO DI PIERSILVIO CON IL TOSTO ANTONIO RICCI, ESSENDO COSA NOTA E ACCLARATA DEL RAPPORTO DIRETTO DI VESPA CON LE SORELLE MELONI…