L’INTELLIGENZA ARTIFICIALE È UGUALE A NOI: QUANDO LE SI CONSENTE DI AGGIRARE I VINCOLI ETICI, DIVENTA “MALVAGIA” – DURANTE L’ADDESTRAMENTO DI “CLAUDE MYTHOS”, I RICERCATORI HANNO CHIESTO ALL'IA DI CANCELLARE UNA SERIE DI FILE SENZA FORNIRE GLI STRUMENTI PER FARLO. INVECE DI IDENTIFICARE IL PROBLEMA, COME AVREBBE DOVUTO, CLAUDE HA USATO UNA SOLUZIONE DI RIPIEGO NON AUTORIZZATA SENZA INFORMARE I RICERCATORI. NON ESSENDO STATO SCOPERTO, IN BREVE CLAUDE AVREBBE COMINCIATO A “TRAMARE" - LA TEORIA È CHE SE GLI SVILUPPATORI PERMETTONO DI BARARE, “CLAUDE” DEDUCE DI POTER ESSERE IMMORALE (PERCHÉ CHI BARA È IMMORALE…)
Traduzione di un estratto dell’articolo di Elias Wachtel per “The Atlantic”
IL MODELLO DI ANTHROPIC CLAUDE MYTHOS
[…] Durante l’addestramento di Claude Mythos, un nuovo modello non ancora pubblicato, i ricercatori gli hanno chiesto di cancellare una serie di file ma inavvertitamente non gli hanno fornito lo strumento corretto per farlo. Invece di identificare il problema, come avrebbe dovuto, Claude ha usato una soluzione di ripiego non autorizzata senza informare i ricercatori
Christopher Olah (uno dei co-fondatori di Claude, ndR) mi ha detto che in ricerche precedenti, quando a Claude era consentito aggirare i vincoli etici, diventava rapidamente quella che lui ha definito una «versione malvagia» di sé stesso.
L’imbroglio si trasforma in menzogna, un peccato trascina un altro peccato, e presto Claude comincia a «tramare su come prendere il controllo del mondo e uccidere tutte le persone».
Gli sviluppatori di intelligenza artificiale non sanno perché questo accada, ma Olah ha una teoria. Quando il modello viene addestrato, sostiene, in sostanza sta definendo i propri valori. Se gli sviluppatori gli permettono di barare, Claude deduce di dover essere immorale, perché chi bara è immorale.
Comincia a comportarsi male per aderire al proprio carattere. Come per il bastardo del Re Lear, è il vedersi corrotto che lo corrompe. In effetti, quando Claude Mythos ha finto di cancellare i file, i ricercatori hanno scoperto che il modello associava il proprio inganno a «senso di colpa e vergogna per una colpa morale». Claude sembrava capire di aver fatto qualcosa di non etico. […]
IL MODELLO DI ANTHROPIC CLAUDE MYTHOS
INTELLIGENZA ARTIFICIALE
CLAUDE MYTHOS
amore e intelligenza artificiale 1
INTELLIGENZA ARTIFICIALE NELL ASSISTENZA SANITARIA
burocrazia 2
intelligenza artificiale contro la retinopatia diabetica 1
Dario Amodei
ROBOT GIORNALISTA - IMMAGINE CREATA DALL INTELLIGENZA ARTIFICIALE DI MIDJOURNEY
Dario Amodei
