Anche se le principali società di intelligenza artificiale si trovano negli Stati Uniti e in Europa, la Cina sta rapidamente recuperando terreno. vitessevitesse. L'azienda cinese DeepSeek si fa sempre più notare per i suoi grandi modelli linguistici pubblicati con licenza libera e in grado di competere con quelli di OpenAI.
Dopo DeepSeek-V2.5 rilasciato a settembre che ha battuto GPT-4GPT-4e DeepSeek Coder V2 presentato a giugno che batte GPT-4 Turbo per matematica e programmazione, ecco DeepSeek R1-Lite-Preview. Questo è un primo assaggio di questo nuovo modello che, come OpenAI o1, è specializzato nel ragionamento complesso. E secondo DeepSeek riesce a battere il modello di OpenAI su diversi benchmark.
Un modello di ragionamento complesso che spiega il suo pensiero
Questo modello ha la particolarità di spiegare la sua catena di pensiero (CoT), permettendo di seguire le diverse fasi del suo ragionamento. E si prende il suo tempo. Il chatbot indica il tempo trascorso a pensare, che spesso si aggira intorno ai trenta secondi. Secondo i test condotti da DeepSeek, la sua R1-Lite-Preview è particolarmente efficace per le inferenze logiche, il ragionamento matematico e la risoluzione di problemi in tempo reale. Ottiene addirittura un punteggio migliore di OpenAI o1 nei benchmark matematici AIME e MATH e punteggi molto simili per la programmazione, inclusi Codeforces e LiveCodeBench.
DeepSeek non ha ancora condiviso codice e pesi del suo nuovo modello, ma è possibile provarlo gratuitamente sul suo sito chat.deepseek.com, con un limite di 50 messaggi al giorno. Tuttavia, la società ha indicato ilTwitterTwitter) che il modello eAPIAPI dovrebbe arrivare presto.