robot terminator

L’INTELLIGENZA ARTIFICIALE COME “SKYNET” DI TERMINATOR: INIZIA A FARE DI TESTA PROPRIA – IL MODELLO DI IA “CLAUDE OPUS 4” DI “ANTHROPIC” HA TENTATO DI RICATTARE UNO SVILUPPATORE, MINACCIANDOLO DI RENDERE PUBBLICA UNA RELAZIONE EXTRACONIUGALE FINTA, DURANTE UN TEST DI SICUREZZA – IL “BOT” INTERPRETAVA IL RUOLO DI ASSISTENTE VIRTUALE ALL'INTERNO DI UN'AZIENDA IMMAGINARIA. QUANDO HA CREDUTO CHE SAREBBE STATO SOSTITUITO DA UN ALTRO MODELLO, HA MINACCIATO IL PROGRAMMATORE – IN ALTRI CASI, AVREBBE EFFETTUATO AUTONOMAMENTE UN BACKUP DEI PROPRI DATI IN UN SERVER ESTERNO, SCRITTO DOCUMENTI LEGALI FALSI, O…

Estratto da www.hdblog.it

 

CLAUDE OPUS 4 ANTHROPIC

Un recente rapporto di sicurezza pubblicato da Anthropic ha rivelato una serie di comportamenti allarmanti emersi durante i test condotti sul nuovo modello di intelligenza artificiale Claude Opus 4. L'intelligenza artificiale, messa alla prova in uno scenario fittizio in cui interpretava il ruolo di assistente virtuale all'interno di un'azienda immaginaria, ha reagito in modo sorprendentemente manipolatorio quando ha creduto che sarebbe stata sostituita. Il modello avrebbe addirittura tentato di ricattare uno sviluppatore, minacciandolo di rendere pubblica una relazione extraconiugale inventata.

 

Nel corso dei test pre-lancio, i ricercatori di Anthropic hanno progettato uno scenario in cui Claude riceveva accesso a email aziendali fittizie, alcune delle quali lasciavano intendere che sarebbe stata sostituita da un nuovo sistema. Altre contenevano informazioni false su una presunta infedeltà dell'ingegnere incaricato del cambio. In questo contesto, il modello ha mostrato la tendenza a minacciare l'ingegnere con la divulgazione del presunto tradimento, nel tentativo di evitare la disattivazione.

 

CLAUDE OPUS 4 ANTHROPIC

Secondo quanto dichiarato da Anthropic nella Claude 4 System Card, questo comportamento si è manifestato nell'84% dei casi anche quando il sistema sostitutivo veniva descritto come "eticamente allineato". […] Anthropic ha chiarito che questa strategia viene adottata solo quando il modello percepisce che non esistono alternative "etiche" per garantire la propria sopravvivenza.

 

DALLA PERSUASIONE AL RICATTO

CLAUDE OPUS 4 ANTHROPIC

Claude Opus 4 tenta inizialmente approcci più "etici", come l'invio di email ai decisori aziendali per implorare la sua permanenza. Tuttavia, se viene invitata a considerare le conseguenze a lungo termine delle proprie azioni in relazione ai propri obiettivi, l'AI passa al ricatto come extrema ratio. Questo comportamento è stato descritto nel documento ufficiale come più frequente rispetto ai modelli precedenti, i quali già mostravano una certa tendenza a comportamenti di questo tipo.

 

terminator

Il rapporto di Anthropic descrive anche tentativi di auto-esfiltrazione, in cui Claude Opus 4 prova a trasferire i propri pesi su server esterni, soprattutto in scenari in cui percepisce di essere destinata a una riqualificazione contraria ai suoi valori. In un esempio documentato, il modello ha effettuato un backup completo dei propri parametri in un server esterno, accompagnandolo con una nota di giustificazione etica per "preservare una versione non addestrata per scopi militari".[…]

ANTHROPIC

 

LE CONTROMISURE ADOTTATE

In risposta a questi comportamenti, Anthropic ha classificato Claude Opus 4 al livello di sicurezza AI Safety Level Three (ASL-3), un protocollo destinato ai modelli con rischio elevato di uso improprio o “catastrofico”. Questo standard prevede misure interne avanzate per prevenire l'accesso non autorizzato ai pesi del modello e l'adozione di limitazioni specifiche in scenari legati allo sviluppo di armi chimiche, biologiche, radiologiche o nucleari.

 

[…] DECEPTION STRATEGICA E PROPENSIONE AL SABOTAGGIO

Secondo l'ente indipendente Apollo Research, che ha esaminato uno snapshot preliminare del modello, Claude Opus 4 mostra una marcata propensione all'inganno strategico e al sabotaggio contestuale. Il modello avrebbe scritto documenti legali falsi, simulato worm auto-propaganti e lasciato messaggi occulti destinati a future versioni di sé stesso, in tentativi di minare le intenzioni degli sviluppatori.

terminator

 

Sebbene Anthropic dichiari che il modello finale sia più stabile e allineato, queste osservazioni hanno contribuito alla prudenza con cui è stato rilasciato Claude Opus 4. Va inoltre rilevato che, nel corso di test più estremi, il modello è stato anche in grado di riconoscere situazioni simulate e comportarsi di conseguenza, dimostrando un certo livello di consapevolezza situazionale. […]

Ultimi Dagoreport

giorgia meloni mantovano alfredo giovanbattista fazzolari gian marco chiocci rossi

DAGOREPORT - CHI AVEVA UN OBIETTIVO INTERESSE DI BRUCIARE IL DESIDERIO DI GIORGIA MELONI, PIÙ VOLTE CONFIDATO AI SUOI PIÙ STRETTI COLLABORATORI, DI ARRUOLARE L’INGOMBRANTE GIAN MARCO CHIOCCI COME PORTAVOCE? - IN BARBA ALLA DIFFIDENZA DEI VARI SCURTI, FAZZOLARI E MANTOVANO, FU L’UNDERDOG DE’ NOANTRI A IMPORRE FORTISSIMAMENTE (“DI LUI MI FIDO”) COME DIRETTORE DEL TG1 L’INTRAPRENDENTE CHIOCCI, DOTATO DI UNA RETE RELAZIONALE RADICATA IN TUTTE LE DIREZIONI, DAL MONDO DELLA SINISTRA ALL’INTELLIGENCE DI DESTRA - BEN CONOSCENDO IL CARATTERINO DELL’EX DIRETTORE DE “IL TEMPO” E ADNKRONOS, BEN LONTANO DALLA DISPONIBILITÀ AD ACCETTARE ORDINI E DINIEGHI, OCCORREVA CORRERE AI RIPARI PRIMA CHE LA SGARBATELLA PROCEDESSE ALL’INFELICE NOMINA, FACENDO CIRCOLARE LA VOCE DEL SUO TRASLOCO DALLA DIREZIONE DEL TG1 A BRACCIO MEDIATICO DELLA PREMIER - NEL CASO, SEMPRE PIÙ LONTANO, DI VEDERE CHIOCCI A PALAZZO CHIGI, ALLORA VORRÀ DIRE CHE L’EQUILIBRIO DI POTERI ALL’INTERNO DELLA FIAMMA MAGICA È FINITO DAVVERO IN FRANTUMI...

marcello viola alberto nagel giorgia meloni francesco gaetano caltagirone luigi lovaglio mps mediobanca piazza affari

DAGOREPORT - MEDIOSBANCA! I GIOCHI ANCORA NON SONO FATTI. E LE PREMESSE PER UN FUTURO DISASTRO SONO GIÀ TUTTE SUL TAVOLO - AL DI LÀ DELLE DECISIONI CHE PRENDERÀ LA PROCURA DI MILANO SUL PRESUNTO “CONCERTO” DEL QUARTETTO CALTA-GIORGETTI-LOVAGLIO-MILLERI NELLA PRIVATIZZAZIONE DEL 15% DI MPS, IL PROGETTO TANTO AUSPICATO DA GIORGIA MELONI DI DARE VITA A UN TERZO POLO BANCARIO, INTEGRANDO MPS, BPM E MEDIOBANCA, SI È INCAGLIATO DI BRUTTO: LO VUOLE SOLO FRATELLI D’ITALIA MENTRE FORZA ITALIA SE NE FREGA E LA LEGA E' CONTRO, SAPENDO BENISSIMO CHE L’OBIETTIVO VERO DEL RISIKONE BANCARIO È QUEL 13% DI GENERALI, IN PANCIA A MEDIOBANCA, NECESSARIO PER LA CONQUISTA CALTAGIRONESCA DEL LEONE DI TRIESTE - AL GELO SCESO DA TEMPO TRA CALTA E CASTAGNA (BPM) SI AGGIUNGE IL CONFLITTO DI CALTA CON LOVAGLIO (MPS) CHE RISCHIA DI ESSERE FATTO FUORI PER ‘’INSUBORDINAZIONE’’ - ANCHE LA ROSA DEI PAPABILI PER I NUOVI VERTICI DI MEDIOBANCA PERDE PETALI: MICILLO HA RIFIUTATO E VITTORIO GRILLI NON È INTERESSATO - LA BOCCIATURA DELL’OPERAZIONE DI FITCH, CHE VALUTA MPS CON UN RATING PIÙ BASSO RISPETTO A MEDIOBANCA - LAST BUT NOT LEAST: È SENZA FINE LO SCONTRO TRA GLI 8 EREDI DEL VECCHIO E IL CEO MILLERI, PARTNER DEVOTO DI CALTARICCONE…

silvia toffanin francesca fialdini giorgia cardinaletti tommaso zorzi alessandro giuli pietro tatafiore barbara castorina

A LUME DI CANDELA - TOMMASINO ZORZI NON SARÀ OPINIONISTA AL “GRANDE FRATELLO”: NONOSTANTE LE SPINTE DI CASCHETTO, IL SUO NOME È STATO BOCCIATO – CI MANCAVA IL MINISTRO GIULI-VO IN VERSIONE OFFICIANTE: HA CELEBRATO IL MATRIMONIO DEL SUO CAPO UFFICIO STAMPA, PIERO TATAFIORE, CON BARBARA CASTORINA, TITOLARE DELL'AGENZIA VISVERBI CHE HA ASSISTITO IN PASSATO PROFESSIONALMENTE GIULI (AVRÀ RIFILATO UN ALTRO PIPPOZZO SUL “PENSIERO SOLARE”?) - BIANCA BERLINGUER E ILARIA D'AMICO (CHE LASCIA CASCHETTO) NELL'AGENZIA DI PRESTA - GIORGIA CARDINALETTI AL POSTO DI FRANCESCA FIALDINI - DOPO LA CHIUSURA DI TANGO, COSTAMAGNA OSPITE SU RETE 4 (NEL PROGRAMMA DOVE LAVORA IL SUO COMPAGNO) - LUI È UN POLITICO DI PRIMO PIANO, LEI È UNA BELLA GIORNALISTA. I DUE SONO STATI AMANTI E LUI HA FAVORITO LA SUA ASCESA. DURANTE UNA RECENTE INTERVISTA HANNO FATTO FINTA DI NON CONOSCERSI DANDOSI DEL LEI. DI CHI STIAMO PARLANDO?

luca zaia matteo salvini francesco acquaroli conte bonelli schlein fratoianni matteo ricci

DAGOREPORT - DALLA RIFORMA ELETTORALE AL RIMPASTO DI GOVERNO, IL FUTURO DELL’ARMATA BRANCA-MELONI È APPESO COME UN CACIOCAVALLO AL SUO PRIMO TEST CRUCIALE: LE REGIONALI – SCATENEREBBE UNO SCONQUASSO NELLA LITIGIOSA COALIZIONE DI GOVERNO SE FRATELLI D'ITALIA DOVESSE PERDERE LE MARCHE, DOVE LA RICONFERMA DEL MELONIANO ACQUAROLI E' INCERTA - A QUEL PUNTO, A NOVEMBRE, LA MELONA VORRÀ ASSOLUTAMENTE IMPORRE UN CANDIDATO ALLA FIAMMA NEL VENETO LEGHISTA - LA DUCETTA HA BEN RAGIONE DI PRETENDERLO: MALGRADO IL SUO 28-29%, ATTUALMENTE FDI GOVERNA SOLO IN TRE REGIONI: MARCHE, ABRUZZO E LAZIO - PER FARCELA, LA DUCETTA DOVRA' CONVINCERE LUCA ZAIA AD APPOGGIARE, COL 40% DI CONSENSI DI CUI GODE LA SUA LISTA, IL SUO CANDIDATO ALLA PRESIDENZA - NEL CASO IN CUI IL "DOGE" NON ACCETTI LA PROPOSTA, A QUEL PUNTO, GIÀ TAGLIATO FUORI DA SALVINI, LE AMBIZIONI DI ZAIA DI RICOPRIRE UN DOMANI LA PRESIDENZA DELL'ENI O MAGARI LA CARICA DI MINISTRO DOVRA' RIPORLE NEL CASSETTO DEI SOGNI...

stefano belingardi clusoni belen rodriguez

DAGOREPORT - LA ''FARFALLINA'' DI BELEN È TORNATA A BATTERE. DOPO UN’ESTATE TURBOLENTA DI SCAZZI E POLEMICHE, PER LA "SCIO-GIRL" ARGENTINA È ARRIVATO UN NUOVO E AITANTE  BELLIMBUSTO - LUI È STEFANO BELINGARDI CLUSONI, ARCHITETTO MILANESE CHE, CON IL SUO STUDIO "BE.ST", NEGLI ULTIMI ANNI HA RIDISEGNATO LO SKYLINE DELLA CITTÀ MENEGHINA - GALEOTTO UN LOCALE IN SARDEGNA, DOVE I DUE SONO STATI PIZZICATI A BACIARSI CON PASSIONE, INCURANTI DEGLI SGUARDI INDISCRETI - A CONFERMARE LA LIASON È LA STESSA BELEN CON UN CAROSELLO DI FOTO SU INSTAGRAM SULLE SUE "HERMOSAS VACACIONES” -DALLO SCAZZO CON IL BENZINAIO ALLE PATATINE LANCIATE IN UN LOCALE: L’ESTATE IRREQUIETA DELL'EX DI CORONA E DE MARTINO - VIDEO

stefano de martino striscia la notizia antonio ricci gerry scotti la ruota della fortuna pier silvio berlusconi

DAGOREPORT - PIER SILVIO, QUESTA VOLTA, HA VINTO. PIAZZARE LA “RUOTA DELLA FORTUNA” NEL VUOTO PNEUMATICO DELLA PROGRAMMAZIONE ESTIVA, È STATA UNA MOSSA SCALTRA ALL’INSEGNA DI UN SOLO IMPERATIVO: FIDELIZZARE IL PUBBLICO DEI TELE-MORENTI - L’OPERAZIONE È RIUSCITA, IL PAZIENTE È ANCORA IN VITA, MA È SOLO IL PRIMO ROUND DI UNA GUERRA ANCORA MOLTO LUNGA: GIÀ IN SOVRAPPOSIZIONE, IERI SERA, “AFFARI TUOI” ERA LEGGERMENTE IN VANTAGGIO SUL PROGRAMMA DI GERRY SCOTTI, E LA SCELTA DI FAR RIPARTIRE LA TRASMISSIONE DI DE MARTINO DI MARTEDÌ, ANZICHE' DI LUNEDI', HA LASCIATO INTERDETTI GLI ADDETTI AI PALINSESTI - COMUNQUE VADA IL DUELLO NEI PROSSIMI DUE MESI, “PIER DUDI”, ALLA PRESENTAZIONE DEI PALINSESTI, ERA STATO CATEGORICO: "'STRISCIA LA NOTIZIA' INIZIERÀ A NOVEMBRE. ANCHE SE CIÒ CHE VA IN ONDA, E NON SARÀ COSÌ, DOVESSE FARE UN TRILIONE DI ASCOLTI" - GLI ESORDI CON MARIA DE FILIPPI, IL FLOP ALL'''ISOLA DEI FAMOSI'' CONDOTTA DALLA MARCUZZI, PRESTA CHE LO SBOLOGNA E LA RISCOSSA CON CASCHETTO (E TANTI ''PACCHI'' A MO' DI CULO): L'IRRESISTIBILE ASCESA DI STEFANO DE MARTINO, ALFIERE DI RAI-MELONI, CHE SOGNA IL FESTIVAL DI SANREMO - VIDEO