IO Recentemente ho avuto l'opportunità di vedere una demo di Sora, lo strumento di generazione video di OpenAI che è stato rilasciato lunedì negli Stati Uniti, ed era così impressionante che mi ha fatto preoccupare per il futuro. La nuova tecnologia funziona come un generatore di testo o immagini AI: scrivi un messaggio e produce un breve video clip. Nella demo pre-lancio che mi è stata mostrata, un rappresentante di OpenAI ha chiesto allo strumento di creare filmati di una raganella in Amazzonia, nello stile di un documentario sulla natura. Il risultato è stato straordinariamente realistico, con riprese aeree che piombavano sulla foresta pluviale, prima di fermarsi su un primo piano della rana. L'animale sembrava vivido e reale come qualsiasi soggetto documentaristico sulla natura.
Eppure, nonostante l’impresa tecnologica, mentre guardavo la raganella mi sentivo meno stupito che triste. Certamente sembrava la parte, ma sapevamo tutti che ciò che stavamo vedendo non era reale. La raganella, il ramo a cui si aggrappava, la foresta pluviale in cui viveva: nessuna di queste cose esisteva, e non è mai esistita. La scena, sebbene visivamente impressionante, era vuota.
Il video è la nuova frontiera dell'intelligenza artificiale, con OpenAI che finalmente lancia Sora negli Stati Uniti dopo averlo anticipato a febbraio, e Meta che annuncia il proprio strumento di conversione testo-video, Movie Gen, in ottobre. Google ha reso disponibile il suo generatore video Veo ad alcuni clienti questo mese. Siamo pronti per un mondo in cui è impossibile discernere quali delle immagini in movimento che vediamo siano reali?
Negli ultimi due anni abbiamo assistito alla proliferazione di generatori di testo e immagini con intelligenza artificiale generativa, ma la posta in gioco è ancora maggiore per i video. Storicamente, le immagini in movimento sono state più difficili da falsificare rispetto a quelle fisse, ma l’intelligenza artificiale generativa sta per cambiare tutto ciò. Esistono molti potenziali abusi di tale tecnologia. I truffatori stanno già utilizzando l'intelligenza artificiale per impersonare la voce degli amici o dei familiari delle persone, al fine di sottrarre loro denaro. I venditori ambulanti di disinformazione utilizzano i deepfake per sostenere le loro agende politiche. Gli estorsori e gli autori di abusi realizzano immagini o video sessuali falsi delle loro vittime. Viviamo in un mondo in cui alcuni ricercatori nel campo della sicurezza ora suggeriscono che le famiglie adottino una parola in codice segreta, in modo che possano dimostrare di essere veramente chi dicono di essere se devono chiedere aiuto.
I creatori di questi strumenti sembrano essere consapevoli dei rischi. Prima del suo rilascio pubblico, OpenAI consentiva l'accesso solo a partner creativi e tester selezionati. Meta sta facendo lo stesso. Gli strumenti incorporano varie garanzie, come restrizioni sugli suggerimenti che le persone possono utilizzare: impedire, ad esempio, che i video contengano personaggi pubblici, violenza o contenuti sessuali. Contengono anche filigrane per impostazione predefinita, per segnalare che un video è stato creato utilizzando l'intelligenza artificiale.
Sebbene le possibilità più estreme di abuso siano allarmanti, trovo quasi altrettanto sconcertante la prospettiva di falsificazioni video a basso rischio. Se vedi un video di un politico che fa qualcosa di così scandaloso da risultare difficile da credere, potresti comunque rispondere con scetticismo. Ma la scenetta di un creatore di Instagram? Un simpatico video di animali su Facebook? Uno spot televisivo per la Coca-Cola? C'è qualcosa di noiosamente distopico nel pensiero di dover indovinare anche i contenuti più banali, poiché le immagini di cui siamo circondati diventano sempre più distaccate dalla realtà.
Mentre guardavo la raganella generata dall'intelligenza artificiale, mi chiedevo principalmente quale fosse il punto. Posso certamente vedere l'utilità dell'intelligenza artificiale nella CGI per la realizzazione di film creativi, ma un finto documentario sulla natura mi è sembrata una scelta strana. Siamo tutti rimasti meravigliati dalle straordinarie immagini di tali programmi, ma il nostro stupore non è solo perché le immagini sono belle: è perché sono reali. Ci permettono di vedere una parte del nostro mondo che altrimenti non potremmo vedere, e la difficoltà di ottenere il filmato è parte del fascino. Alcuni dei miei momenti preferiti di documentari sulla natura sono stati clip dietro le quinte di programmi come Our Planet, che rivelano quanto tempo un cameraman ha aspettato in silenzio in un nascondiglio appositamente creato per catturare una specie rara, o come ha allestito la sua attrezzatura. per ottenere lo scatto perfetto. Naturalmente, i video AI non potranno mai raggiungere questo livello di vera novità. Addestrato su contenuti esistenti, può produrre solo filmati di qualcosa che è già stato visto prima.
Forse il modo in cui è stato prodotto un video non dovrebbe avere molta importanza. Una raganella è una raganella e un sondaggio suggerisce che finché non lo facciamo Sapere un'immagine è creata dall'intelligenza artificiale, ci piace lo stesso. È l'inganno insito in così tanti media basati sull'intelligenza artificiale che trovo sconvolgente. Anche la fotografia reale più sfocata dell’eroe meme del 2024 Moo Deng contiene più vita di un video Movie Gen di un cucciolo di ippopotamo che nuota, che, per quanto reso elegantemente, è morto dietro gli occhi.
Man mano che i contenuti dell’intelligenza artificiale diventano più convincenti, rischiano di rovinare foto e video reali. Non possiamo più fidarci dei nostri occhi e siamo costretti a diventare investigatori dilettanti solo per assicurarci che il modello all'uncinetto che stiamo acquistando sia effettivamente realizzabile, o i mobili discutibili che stiamo osservando davvero. esiste in forma fisica. Recentemente stavo scorrendo Instagram e ho condiviso un video carino di un coniglietto che mangia lattuga con mio marito. Era una clip del tutto benigna, ma forse un po’ pure adorabile. Era l'intelligenza artificiale, ha chiesto? Non potrei dirlo. Anche dover porre la domanda ha sminuito il momento e la dolcezza del video. In un mondo in cui tutto può essere falso, tutto potrebbe esserlo.