OpenAI lancia Operator, un agente AI che esegue attività in modo autonomo

OpenAI lancia Operator, un agente AI che esegue attività in modo autonomo
OpenAI lancia Operator, un agente AI che esegue attività in modo autonomo
-

Il CEO di OpenAI, Sam Altman, ha iniziato quest’anno affermando in un post sul blog che il 2025 sarebbe stato un grande anno per gli agenti AI, strumenti in grado di automatizzare le attività e intraprendere azioni per tuo conto.

Ora stiamo assistendo al primo vero tentativo di OpenAI.

OpenAI ha annunciato giovedì il lancio di un’anteprima di ricerca di Operator, un agente AI generico in grado di assumere il controllo di un browser Web ed eseguire in modo indipendente determinate azioni. L’operatore arriverà prima agli utenti statunitensi con il piano di abbonamento Pro da $ 200 di ChatGPT. OpenAI afferma che prevede di estendere questa funzionalità a più utenti nei livelli Plus, Team ed Enterprise.

“[Operator] sarà [in] presto in altri paesi”, ha dichiarato il CEO di OpenAI Sam Altman durante un live streaming giovedì. “L’Europa, purtroppo, impiegherà un po’ di tempo”.

Questa anteprima della ricerca iniziale è disponibile tramite operator.chatgpt.com, ma presto OpenAI afferma di voler integrare Operator in tutti i suoi client ChatGPT.

Schermata iniziale dell’operatore.Crediti immagine:Openai

Secondo OpenAI, l’operatore promette di automatizzare attività come la prenotazione di alloggi di viaggio, la prenotazione di ristoranti e lo shopping online. Esistono diverse categorie di attività tra cui gli utenti possono scegliere all’interno dell’interfaccia dell’operatore, inclusi acquisti, consegne, ristorazione e viaggi, che consentono tutti diversi tipi di automazione.

Quando gli utenti ChatGPT attivano Operatore, verrà visualizzata una piccola finestra che mostra un browser Web dedicato che l’agente utilizza per completare le attività, insieme alle spiegazioni delle azioni specifiche che l’agente sta eseguendo. Gli utenti possono comunque assumere il controllo del proprio schermo mentre Operator sta lavorando, poiché Operator utilizza il proprio browser dedicato.

OpenAI afferma che Operator è alimentato da un modello di agente che utilizza computer, o CUA, che combina le capacità di visione del modello GPT-4o dell’azienda con le capacità di ragionamento dei modelli più avanzati di OpenAI. La CUA è addestrata per interagire con il front-end dei siti Web, il che significa che non ha bisogno di utilizzare API rivolte agli sviluppatori per attingere a diversi servizi.

In altre parole, la CUA può utilizzare pulsanti, navigare nei menu e compilare moduli su una pagina Web proprio come farebbe un essere umano.

OpenAI afferma che sta collaborando con aziende come DoorDash, eBay, Instacart, Priceline, StubHub e Uber per garantire che l’Operatore rispetti i termini dei contratti di servizio di queste aziende.

Crediti immagine:Openai

“Il modello CUA è addestrato a chiedere conferma all’utente prima di finalizzare attività con effetti collaterali esterni, ad esempio prima di inviare un ordine, inviare un’e-mail, ecc., in modo che l’utente possa ricontrollare il lavoro del modello prima che diventi permanente.” OpenAI scrive nei materiali forniti a TechCrunch. “[It] si è già dimostrato utile in una varietà di casi e puntiamo a estendere tale affidabilità a una gamma più ampia di attività”.

Ma OpenAI avverte che la CUA non è perfetta. Lo dice l’azienda”[doesn’t] aspettarsi [the] CUA è ancora in grado di funzionare in modo affidabile in tutti gli scenari”.

“Attualmente, Operator non è in grado di gestire in modo affidabile molte attività complesse o specializzate”, aggiunge OpenAI in un documento di supporto, “come la creazione di presentazioni dettagliate, la gestione di complessi sistemi di calendario o l’interazione con interfacce web altamente personalizzate o non standard.

Per estrema cautela, OpenAI richiede anche la supervisione di alcuni compiti, come le transazioni bancarie, che la CUA e l’Operatore potrebbero svolgere per lo più da soli. Gli utenti dovranno prendere il controllo per inserire i dati della carta di credito, ad esempio. OpenAI afferma che Operator non raccoglie né effettua screenshot di alcun dato.

“Su siti Web particolarmente sensibili, come la posta elettronica, Operator richiede una supervisione attiva dell’utente, garantendo che gli utenti possano individuare e risolvere direttamente eventuali errori che il modello potrebbe commettere”, afferma OpenAI nei suoi materiali di supporto.

Ciò limita l’utilità di Operator, certo, ma garantisce anche che l’agente non abbia allucinazioni e, ad esempio, non spenda la rata del mutuo per sedie accentate. Google ha adottato un approccio simile con il suo agente AI Project Mariner, che non inserisce informazioni come i numeri di carta di credito.

Limitazioni

L’operatore presenta alcune limitazioni degne di nota.

Esistono limiti di frequenza, sia giornalieri che dipendenti dall’attività. OpenAI afferma che l’Operatore può eseguire più attività contemporaneamente, ma che esistono “limiti dinamici” al riguardo. Esiste anche un limite di utilizzo complessivo che si reimposta quotidianamente.

In questa fase di rilascio, l’Operatore rifiuterà anche di eseguire attività a titolo definitivo per motivi di sicurezza, come l’invio di e-mail (nonostante il CUA sia in grado di farlo) e l’eliminazione di eventi del calendario. OpenAI dice che questo cambierà in futuro, ma non fornisce ETA.

L’operatore potrebbe anche rimanere “bloccato” se si imbatte in un’interfaccia, un campo password o un controllo CAPTCHA particolarmente complessi. Chiederà all’utente di subentrare quando ciò accade, afferma OpenAI.

Un futuro agente

OpenAI è stata piuttosto lenta nello sviluppare un agente AI rispetto ai rivali (vedi: agenti di Rabbit, Google e Anthropic), il che potrebbe avere qualcosa a che fare con i rischi per la sicurezza legati alla tecnologia.

Quando un sistema di intelligenza artificiale può eseguire azioni sul web, apre la porta a casi d’uso molto più pericolosi da parte di attori malvagi. Potresti automatizzare gli agenti IA per orchestrare truffe di phishing o attacchi DDoS o far sì che si accaparrino i biglietti per un concerto prima che lo faccia chiunque altro. Soprattutto per uno strumento ampiamente utilizzato come ChatGPT, è importante che OpenAI adotti misure per prevenire questo tipo di exploit.

OpenAI sembra ritenere che Operator sia sufficientemente sicuro da poter essere rilasciato nella sua forma attuale, almeno come anteprima di ricerca.

“L’operatore utilizza strumenti che cercano di limitare la suscettibilità del modello a richieste dannose, istruzioni nascoste e tentativi di phishing”, spiega OpenAI sul suo sito web. “Un sistema di monitoraggio sospende l’esecuzione se viene rilevata un’attività sospetta, mentre i processi automatizzati e sottoposti a revisione umana aggiornano continuamente le misure di protezione”.

Operator è il tentativo più audace di OpenAI di creare un agente AI. La settimana scorsa, OpenAI ha rilasciato Tasks, offrendo a ChatGPT semplici funzionalità di automazione come la possibilità di impostare promemoria e pianificare le istruzioni da eseguire ogni giorno a un’ora prestabilita.

Le attività hanno offerto agli utenti di ChatGPT alcune funzionalità familiari, ma necessarie, per rendere ChatGPT pratico da usare come Siri o Alexa. Tuttavia, Operator mostra funzionalità che la generazione precedente di assistenti virtuali non avrebbe mai potuto offrire.

Gli agenti IA sono stati presentati come la prossima grande novità nel campo dell’intelligenza artificiale dopo ChatGPT: una nuova tecnologia che cambierà il modo in cui le persone utilizzano Internet e i loro PC. Invece di limitarsi a fornire ed elaborare informazioni, gli agenti possono, in teoria, intraprendere azioni e fare effettivamente delle cose.

Con il rilascio della prima versione concreta degli agenti di OpenAI, diventerà presto chiaro quanto sia realistica questa visione.

-

PREV Sui segnali La stella nascente del tennis svizzero Henry Bernet
NEXT Dopo un 2024 difficile, Michael van Gerwen sembra rinascere ai Mondiali di freccette: “Il re è tornato”