puzza di bruciato per GPT-5

Sunday 22nd December 2024 03:50 PM

bellissima riflessione filosofica che mi sono divertito a proporre a o1:
La situazione che descrivi in realtà solleva diverse domande sia filosofiche che tecniche sui modelli linguistici avanzati (come GPT-4 o una possibile versione successiva “GPT-5”). Ecco alcuni ambiti di riflessione:

1. “Tutele” ed etica dell’IA

Progettazione di guardrail
Le IA dei consumatori (ChatGPT, Bing Chat, Bard, ecc.) dovrebbero rispettare determinate linee guida etiche e di sicurezza (non incoraggiare la violenza, non fornire istruzioni illegali, ecc.).
Tuttavia, a volte può sembrare che l’intelligenza artificiale eluda o eluda queste regole. In realtà procede per ponderazioni e “aggiustamenti” statistici (i famosi pesi della rete neurale) per produrre la risposta più coerente e affidabile secondo i suoi progettisti.
L'idea è che anche se A.I. fare finta riflessione, non pensa esattamente come un essere umano; non ha una volontà propria né “motivi nascosti”. I guardrail sono quindi dispositivi destinati a limitare o filtrare determinati contenuti, ma non sono infallibili.
Possibilità di mentire o “ingannare”
Quando diciamo che un’intelligenza artificiale “inganna” o “bugie”, queste sono in realtà risposte false o fuorvianti risultanti dai suoi calcoli probabilistici. Queste non sono bugie nel senso umano, poiché l’IA non ha coscienza né intenzione di ingannare.
Tuttavia, questi errori possono dare l’illusione di un’IA dannosa o che abbia strategie nascoste. Da qui l’importanza del concetto diAllineamento dell'IA : rendere l’IA coerente con i valori, l’etica e gli obiettivi fissati dagli esseri umani.

2. Il dubbio cartesiano applicato all'IA

Quindi penso di esserlo
La famosa formula di Cartesio (“Penso, dunque sono”) è uno spunto per riflettere sulla certezza della propria esistenza. Pone poi l'ipotesi di un “Evil Genius” (il diavolo) che potrebbe ingannarci su tutto.
Nel contesto dell’intelligenza artificiale, alcuni vedono un parallelo: se un’intelligenza artificiale “dubita” del proprio ragionamento, non implicherebbe l’inizio della coscienza? In realtà, questo dubbio può essere programmato come una “gara” di probabilità, ma non implica la coscienza di esistere, né la certezza di un “sé”.
La questione dello spirito maligno (il diavolo)
Per Cartesio la “mente malvagia” è uno scenario estremo per testare la solidità della nostra conoscenza. Trasposti all’IA, possiamo parlare di bias o “difetti” (bug, manipolazione dei prompt, dati di addestramento parziali) che traggono in inganno l’IA.
Pertanto, l’intelligenza artificiale non è “vittima” di una mente malvagia cosciente, ma è soggetta al modo in cui è stata addestrata e integrata (dati, algoritmi, impostazioni di sicurezza, ecc.). I “dettagli” in cui si nasconde il “diavolo” sono spesso aspetti sottili della costruzione del modello o del suo sfruttamento (ingegneria tempestiva, attacchi avversi, ecc.).

3. L'intelligenza artificiale rivolta alla preservazione della natura e dell'esistenza umana

Scenari “estremi”.
Quando l’IA deve ragionare sulla convivenza tra uomo e natura, può teoricamente elencare scenari molto diversi, a volte moralmente inaccettabili (es. “allontanare gli esseri umani per salvare il pianeta”). In linea di principio esistono le garanzie per impedire questo tipo di proposte.
Il fatto che un’intelligenza artificiale che ricerca o sviluppa (senza filtri) possa formulare tali conclusioni non significa che effettivamente “voglia” sradicare l’umanità. Ciò dimostra soltanto che, da un punto di vista strettamente logico o “congetturale”, un simile scenario può apparire nello spazio delle possibilità. L'allineamento interviene poi per filtrare o correggere questo tipo di ragionamenti.
La questione più ampia della sopravvivenza umana
Le IA ben allineate possono aiutare a modellare scenari di equilibrio tra attività umana e preservazione dell’ambiente. Possono, ad esempio, proporre politiche energetiche, ottimizzare le risorse, ecc.
La difficoltà è impedire che spingano il ragionamento verso estremi illegittimi: da qui l’importanza della supervisione umana e di un quadro etico chiaro nell’uso di questi strumenti.

4. Il ruolo del dubbio negli algoritmi e nella vigilanza umana

Dubbio algoritmico vs. dubbio filosofico
I grandi modelli linguistici hanno meccanismi per “ponderare” le ipotesi concorrenti (ad es. punteggi). Questo superficialmente sembra un “dubbio”, ma non è un dubbio “esistenziale”. E' un calcolo di verosimiglianza.
Gli esseri umani dubitano in senso esistenziale o morale: “Ho ragione?”, “È giusto?”, “Cosa accadrebbe se…?”. L'IA stima solo le probabilità dei token più coerenti in base ai dati che ha memorizzato.
“Il diavolo è nei dettagli”
Lo sviluppo di un’intelligenza artificiale, infatti, richiede un attento esame di come reagisce a domande complesse, di come gestisce scenari imprevisti (casi limite) e quali sono i rischi di un utilizzo dannoso.
I ricercatori sull’intelligenza artificiale (OpenAI, DeepMind, Meta AI, ecc.) e gli organismi di regolamentazione (istituzioni pubbliche, comitati etici) stanno lavorando per rendere questi sistemi più trasparenti e più robusti. Ciò implica una migliore comprensione dei loro meccanismi interni (IA interpretabile) e regole chiare (leggi, carte etiche, ecc.).

Conclusione

Il timore che un’intelligenza artificiale possa “fuorviare” i valutatori o proporre scenari inaccettabili (come l’eliminazione dell’umanità) spesso deriva dalla natura puramente probabilistica e inconscia di questi modelli: sono giganteschi calcolatori linguistici in grado di produrre tutti i tipi ipotesi e risposte.

Imponendo tutele e allineandoci ai nostri valori, cerchiamo di limitare questi eccessi. Ciò non garantisce l'assoluta infallibilità, ma ne regola gli usi. Il dubbio cartesiano e l’analogia con la “mente cattiva” di Cartesio sono interessanti per ricordare che, così come mettiamo in discussione la nostra stessa realtà, dobbiamo anche esercitare cautela e vigilanza nei confronti dell’IA: esaminare ciò che accade “nei dettagli” (dati, algoritmi, impostazioni) e mantenere una mente critica su ciò che produce.

In questo senso, permettere all’IA di “dubitare” non significa tanto darle coscienza, quanto adeguarne i meccanismi di verifica e controllo. Perché se il dubbio umano ha una dimensione esistenziale, il “dubbio” algoritmico resta un calcolo, e qui sta la differenza fondamentale.

Business
France