robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

beppe sala manfredi catella giancarlo tancredi stefano boeri

DAGOREPORT - L’ANSIA ATTANAGLIA LA ‘’MILANO DEL BALLO DEL MATTONE’’. ‘’QUI SALTA TUTTO!’’, BALBETTANO PIÙ SPAVENTATI DI UN CONIGLIO - SE IL GIP DELLA PROCURA DECIDESSE DI ACCOGLIERE LE PROPOSTE DEI PM, A QUEL PUNTO, ESPLODEREBBE UNA SANTA BARBARA A MISURA DUOMO. E POTREBBE RIPETERSI CIÒ CHE SUCCESSO ALL’EPOCA DI TANGENTOPOLI: A TANTI DEI 74 INDAGATI, LA PAURA DI FINIRE IN GABBIA A SAN VITTORE APRIREBBE DI COLPO LE VALVOLE DELLA MEMORIA - DA PARTE SUA, IL SINDACO BEPPE SALA, INDAGATO, INTASCATA LA SOLIDARIETÀ DA DESTRA E SINISTRA, HA RIPRESO A MACINARE ARROGANZA, E HA SPARATO TESTARDO E SPAVALDO: “LE DIMISSIONI NON AVREBBERO FATTO COMODO A NESSUNO…” – QUALCHE ANIMA PIA GLI RICORDI CHE L’USO SBARAZZINO DELL’URBANISTICA MENEGHINA È AVVENUTO SOTTO IL SUO NASONE... 

urbano cairo sigfrido ranucci la7 fiorenza sarzanini

DAGOREPORT - SIETE PRONTI? VIA! È PARTITA LA GRANDE CAMPAGNA ACQUISTI (A SINISTRA!) DI URBANO CAIRO - IL COLPACCIO SU CUI LAVORA URBANETTO: PORTARE A LA7 SIGFRIDO RANUCCI E L’INTERA SQUADRA DI “REPORT”, A CUI TELE-MELONI STA RENDENDO LA VITA IMPOSSIBILE - IL PROGETTO È GIÀ PRONTO: PRIMA SERATA DI LUNEDI', SECONDE SERATE CON "REPORT-LAB", COINVOLGENDO SITO, SOCIAL E L'EDITRICE SOLFERINO - MA NON FINISCE QUI: CAIRO VUOLE RIPOSIZIONARE IL “CORRIERE DELLA SERA”: ESSERE LA GAZZETTA DI FAZZOLARI NON PORTA ALL'EDICOLA NUOVI LETTORI, CHE PREFERISCONO L'ORIGINALE: "IL GIORNALE", "LIBERO", "LA VERITA'": MEGLIO RITORNARE AL CENTRO-SINISTRA. IN ARRIVO GIOVANI GIORNALISTI BEN DISTANTI DAL MELONISMO...

mara venier gabriele corsi

PERCHÉ GABRIELE CORSI HA MOLLATO “DOMENICA IN”? LA SUA PRESENZA AL FIANCO DI MARA VENIER ERA STATA FRETTOLOSAMENTE ANNUNCIATA DA ANGELO MELLONE, DURANTE LA PRESENTAZIONE DEI PALINSESTI RAI. E INVECE, SOLO DUE GIORNI FA, CORSI HA ANNUNCIATO DI ESSERSI TIRATO INDIETRO - COSA È SUCCESSO? LA RAI AVEVA TENTATO DI COMMISSARIARE LA "ZIA MARA", PIAZZANDOLE ACCANTO I "BADANTI" NEK E CORSI. MA L'ARZILLA 74ENNE, FORTE DI BUONI ASCOLTI, HA FATTO TERRA BRUCIATA AI SUOI DUE "VALLETTI", USANDO L’ARMA DA FINE DEL MONDO: “SE IO MOLLO AD AGOSTO CHI CI METTETE?". E COSÌ, UNA VOLTA VISTO IL SUO SPAZIO RIDOTTO A QUALCHE MINUTO DI UN QUIZ, IL CONDUTTORE SI È CHIAMATO FUORI (NEK ERA GIÀ SCAPPATO A "THE VOICE") - LA VENIER HA TENTATO DI DISSIPARE I DUBBI SULLE SUE “COLPE” POSTANDO UNA STORIA IN CUI SI INSINUAVA CHE CORSI AVESSE MOLLATO PER I SOLDI (POCHI). MA A SMENTIRE LA SUA VERSIONE È STATO IL MANAGEMENT DEL CONDUTTORE…

antonio spadaro papa leone xiv robert prevost

FLASH! – SPADARO DI FUOCO! IL GESUITA, ORFANO DI BERGOGLIO, , OGGI SU ''LA STAMPA”, SPACCIA COME SUA ''INTERVISTA INEDITA'' UNA VECCHIA CONVERSAZIONE PUBBLICA CHE L'ALLORA CARDINALE ROBERT FRANCIS PREVOST TENNE A NEW LENOX, IN ILLINOIS, IL 7 AGOSTO 2024 - IL GESUITA HA PRESO IL TESTO SBOBINATO E L’HA INFRAMEZZATO CON DOMANDE SUE: UN CAPOLAVORO DI AUTO-PROMOZIONE DEGNO DI UN VERO INFLUENCER... - LA PRECISAZIONE DELLA CASA EDITRICE EDB: "SOLLEVIAMO DA OGNI RESPONSABILITA' PADRE SPADARO CIRCA OGNI FRAINTENDIMENTO TRA LA STAMPA E LA CASA EDITRICE" - VIDEO

tommaso labate mario giordano

DAGOREPORT - VA AVANTI IL PROGETTO DI PIER SILVIO BERLUSCONI DI “RIEQUILIBRARE” POLITICAMENTE LE RETI MEDIASET (TROPPO SOVRANISMO FA MALE ALL'AUDIENCE): L'ULTIMO ARRIVATO E' L’ACERBO TOMMASO LABATE, IN ODORE DI SINISTRA DEM, A CUI È STATO AFFIDATA LA PRIMA SERATA DEL MERCOLEDÌ - LA SUA SCELTA HA FATTO INVIPERIRE MARIO GIORDANO, SBATTUTO ALLA DOMENICA SERA CON IL SUO “FUORI DAL CORO”. E, GUARDA CASO, GIORDANO È DIVENTATO IMPROVVISAMENTE OSTILE AL GOVERNO MELONI: “NON STA DANDO LE RISPOSTE CHE SI ASPETTAVANO GLI ITALIANI, SEMBRA UN GOVERNO MELONI-FORLANI”

antonio tajani pier silvio marina berlusconi forza italia

DAGOREPORT: CHE CE FAMO CON FORZA ITALIA? È IL DUBBIO CHE ASSILLA I FRATELLI BERLUSCONI: MOLLARE AL SUO DESTINO IL PARTITO FONDATO DA "PAPI" O NE CAMBIAMO I CONNOTATI, A PARTIRE DAL "MAGGIORDOMO" DI CASA MELONI, ANTONIO TAJANI? -CON PIER SILVIO CHE SCALPITA PER SCENDERE IN POLITICA ALLE POLITICHE 2027, I DUE FRATELLI HANNO COMMISSIONATO UN SONDAGGIO SUL BRAND BERLUSCONI IN CHIAVE ELETTORALE. RISULTATO: L’8% DEI CONSENSI DI CUI È ACCREDITATO IL PARTITO, LA METÀ, CIOÈ IL 4%, È RICONDUCIBILE AL RICORDO DI SILVIO BERLUSCONI - ALTRO DATO: SE SCENDESSE IN CAMPO “UN” BERLUSCONI, I CONSENSI DI FORZA ITALIA CRESCEREBBERO FINO QUASI A RADDOPPIARSI - QUEL CHE COLPISCE È CHE IL PARTITO RACCOGLIEREBBE PIÙ VOTI CON PIER SILVIO LEADER DI QUANTI NE CONQUISTEREBBE CON MARINA - (SE SCENDE IN CAMPO, O PIER SILVIO PRENDERA' PIU' VOTI DI MELONI, STRAPPANDOLI A FDI E LEGA, E FARA' IL PREMIER OPPURE LO VEDREMO CHE PRENDERA' ORDINI DALLA DUCETTA...)