OpenAI continua a rilasciare nuovi prodotti. E l’Operatore era atteso con impazienza.
OpenAI ha appena presentato Operator, il suo primo agente AI in grado di eseguire compiti concreti su un computer.
Per andare oltre
“Operatore” ovvero come ChatGPT si prepara a prendere il controllo del tuo computer molto presto
Questo è un passo nell’evoluzione dell’intelligenza artificiale. Per spiegarlo: fino ad ora OpenAI offriva ChatGPT, una chat conversazionale piuttosto passiva, poiché non poteva svolgere compiti specifici.
Con Operator passiamo da semplici assistenti conversazionali a veri e propri agenti autonomi. Basato sul modello GPT-4o, l’Operatore può navigare sul web, compilare moduli e interagire con diverse interfacce come farebbe un utente umano.
La particolarità di Operator è la sua capacità di scomporre compiti complessi in azioni semplici, grazie al suo modello Agente che utilizza il computer (CUA). A differenza delle soluzioni tradizionali che richiedono API specifiche, Operator analizza direttamente i pixel sullo schermo per comprendere e interagire con qualsiasi GUI. Vediamo quindi il mouse muoversi ed eseguire azioni sul suo browser web.
Alcuni esempi? Puoi combinare file PDF, comprimere immagini, acquisire screenshot, inviare un’e-mail… puoi combinare tutto per eseguire attività complesse.
Questo non è il primo agente AI. Ma Operator supera già i suoi concorrenti come Computer Use di Anthropic o Mariner di Google DeepMind su diversi benchmark, ma rimane limitato all’uso del browser et richiede un abbonamento premium a $ 200 al mese.
Le implicazioni sulla sicurezza sono state studiate da OpenAI, come spiega l’azienda americana sul suo blog. La società ha implementato misure di salvaguardia per prevenire usi dannosi, inclusa la formazione del modello affinché chieda conferma prima di eseguire azioni con conseguenze esterne.
Gli agenti AI cambieranno i nostri PC e smartphone
L’arrivo di tali agenti IA è un passo molto importante. Le attività quotidiane come la prenotazione di ristoranti o la gestione degli acquisti possono ora essere delegate a un’intelligenza artificiale, in modo da liberare tempo per attività a maggior valore aggiunto.
L’esempio di Yash Kumar, ricercatore di OpenAI, illustra perfettamente questo potenziale: utilizza Operator per gestire automaticamente le prenotazioni dei suoi ristoranti, un compito semplice ma dispendioso in termini di tempo che ora può essere completamente automatizzato.
Tuttavia, è importante notare che questa tecnologia è ancora agli inizi. Come sottolinea lo stesso Sam Altman, dobbiamo moderare le aspettative e non cedere al clamore mediatico. Gli errori rimangono possibili e lo strumento necessita ancora di miglioramenti.
Questa settimana Samsung ha annunciato il suo Galaxy S25 che integra anche un agente AI basato su Google Gemini, potrai anche lasciare che il tuo smartphone esegua azioni sulle app, senza toccare nulla.