OpenAI presenta o3! Questa nuova intelligenza artificiale che succede a o1 è in grado di riprodurre il modo in cui gli esseri umani ragionano, al fine di fornire risposte più profonde e complesse a domande e altri suggerimenti. Scopri come funziona e le sue impressionanti capacità!
Questo venerdì, dicembre 20, per l'ultimo dei 12 giorni di annunci dei suoi “Shipmas”, OpenAI ha creato una sorpresa rivelando i suoi prossimi modelli di intelligenza artificiale in grado di ragionare.
Successore di o1, appena uscito in versione completa dopo un'anteprima all'inizio del 2024, questi sono o3 e o3-mini.
o3, il successore di o1 che fa esplodere i benchmark
Grazie ad a nuovo processo di “ catena di pensiero privata » (catena di pensiero privata), questi schemi si interrompono a vicenda esaminare il loro dialogo interno e pianificare prima di rispondere.
Questo è un « ragionamento simulato »andando oltre le semplici previsioni delle parole di modelli linguistici di grandi dimensioni (LLM) come GPT-4.
Selon OpenAI, o3 ha battuto i record sul Benchmark sul ragionamento visivo ARC-AGI. Ha raggiunto un punteggio del 75,7% in scenari a basso consumo e 87,5% ad alta potenza. In confronto, gli umani raggiungono solo l’85%.
Inoltre, il modello ha raggiunto a punteggio del 96,7% sul Esame di matematica su invito americano del 2024. Ha mancato solo una domanda!
Per quanto riguarda il GPQA Test di biologia, fisica e chimica del diamanteo3 ha ottenuto l'87,7%. Ha anche risolto Il 25,2% dei problemi sul benchmark EpochAI Frontier Math. Nessuno l'altro modello aveva superato il 2%…
IL presidente della Fondazione ARC Prize stesso ha parlato durante la diretta streaming per affermare che “ vedendo questi risultati, Ho bisogno di cambiare la mia visione del mondo SU cosa può fare l’intelligenza artificiale e di cosa è capace ».
Un costo assolutamente sproporzionato
Alcuni esperti lo credono giào3 è così efficiente che possiamo considerarlo come il primo AGI superiore all’intelligenza umana.
Tuttavia, il suo Il grande problema attuale è il suo costo. Ogni risposta a una richiesta costa tra $ 30 e $ 6.000! Per farlo passare un esame di matematica e fisica, OpenAI ha speso $ 350.000…
Ma dove è finito l'O2?
Forse ti starai chiedendo perché OpenAI è passato direttamente da o1 a o3. In realtà, l'azienda semplicemente vuole evitare conflitti intorno al marchio registrato con l'operatore telefonico britannico O2.
Oltretutto, Il CEO Sam Altman ha scherzato durante l’annuncio spiegando che questa AI si chiama o3” nel grande tradizione di OpenAI essere veramente, davvero pessimo con i nomi ».
o3-mini: una piccola IA capace di adattare la propria velocità
Da parte sua, o3-mini ha una funzionalità di pensiero temporale adattivo che gli consente di variare a velocità di elaborazione bassa, media o alta.
Nonostante le sue piccole dimensioni, questa variante in miniatura supera il suo predecessore o1 sul benchmark Codeforces. Impostazioni di potenza più elevate producono risultati migliori.
Il ragionamento, la prossima pietra miliare nell’evoluzione dell’intelligenza artificiale?
Questo annuncio di OpenAI arriva in un momento in cui altre società stanno sviluppando i propri modelli di ragionamento. È il caso di Googleche ha appena presentato Gemini 2.0 Flash Thinking Experimental.
Nel novembre 2024, DeepSeek ha introdotto DeepSeek-R1. Citiamo anche il colosso cinese Alibaba e il suo modello aperto QwQ.
Questi nuovi modelli di intelligenza artificiale si basano sui tradizionali LLM, ma sono adattati per seguire a catena del processo di pensiero in grado di considerare i propri risultati simulare il ragionamento.
Questo forse esteso dal tempo di esecuzionepiuttosto che concentrarsi su miglioramenti durante l'addestramento del modello.
Questo approccio era utilizzato per LLM come GPT-4ma porta sempre meno miglioramenti per qualche tempo.
E sembra che il tetto sia stato raggiuntoin particolare a causa del carenza di dati generati dall’uomo con cui nutrire l’IA.
Come testare OpenAI o3?
Questi nuovi modelli saranno messo per la prima volta a disposizione dei ricercatoriin modo che possano testarli. Inizialmente, OpenAI intende lanciare o3-mini a fine gennaio 2025, poi o3 poco dopo.
Dovremo quindi attendere per poter mettere le mani su queste IA e testarne le capacità. IO pensare personalmente che è un modello capace di riflessione molto più utile di un semplice LLM come GPT!
E tu, cosa ne pensi? Stai usando o1? Pensi che il ragionamento simulato sia la strada da seguire per continuare a migliorare l’intelligenza artificiale? Condividi la tua opinione nei commenti!
Condividi l'articolo:
Facebook
LinkedIn
Il nostro blog è alimentato dai lettori. Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione.
Related News :