Informazioni chiave
- OpenAI ha introdotto o3, il successore del suo modello iniziale di “ragionamento”.
- La nuova famiglia di modelli comprende sia o3 che o3-mini, che sono attualmente aperti ai test di sicurezza pubblica.
- o3 ha dimostrato un miglioramento significativo rispetto ai suoi predecessori, ottenendo un vantaggio di 23 punti percentuali rispetto a o1 sul benchmark SWE-Bench Verified di OpenAI.
OpenAI ha introdotto o3, il successore del suo modello di “ragionamento” iniziale, al termine dell'evento di lancio del prodotto “12 giorni di OpenAI”. La nuova famiglia di modelli comprende sia o3 che o3-mini. Sebbene non siano immediatamente disponibili al pubblico, questi modelli sono attualmente aperti a test di pubblica sicurezza.
Durante un annuncio dal vivo, il CEO di OpenAI Sam Altman ha sottolineato che questo è l’inizio di una nuova era dell’intelligenza artificiale in cui compiti di ragionamento complessi diventano sempre più fattibili. Ha spiegato la decisione di non utilizzare la designazione “o2” per rispetto verso Telefónica, un operatore di rete mobile, e per riconoscere la storia di OpenAI con la denominazione del modello.
Nuove funzionalità e prestazioni
Per la prima volta, OpenAI invita ricercatori esterni nel campo della sicurezza a presentare in anteprima questi modelli. Altman ha condiviso che o3-mini sarà rilasciato verso la fine di gennaio, seguito poco dopo dal modello o3 completo. Rispetto ai suoi predecessori, o1 e o1-mini, o3 ha dimostrato un miglioramento significativo. Ha ottenuto un vantaggio di 23 punti percentuali rispetto a o1 nella valutazione SWE-Bench Verified di OpenAI e ha ottenuto un punteggio Codeforces di 2727, superando addirittura il punteggio ottenuto dal capo scienziato di OpenAI.
Confronto con i modelli precedenti
OpenAI ha inizialmente lanciato la versione completa del suo modello o1 durante il primo giorno della campagna promozionale “12 Days of OpenAI”. Insieme a questo annuncio, ha introdotto ChatGPT Pro, un nuovo abbonamento mensile da $ 200 per ChatGPT che include una versione avanzata di o1 nota come “modalità o1 pro”.
Se vuoi accedere a tutti gli articoli, iscriviti qui!