DeepSeek-V3: la Cina presenta il suo ChatGPT dieci volte più economico

-

Con DeepSeek-V3 la Cina potrebbe avere motivo di preoccupare OpenAI e i grandi gruppi americani. Il suo approccio open Source, in un settore sempre più dominato da gruppi privati, gli consente di muoversi rapidamente, con molto meno denaro.

In pochi anni la Cina si è affermata come il Paese leader in termini di innovazione tecnologica. A lungo associato all’immagine di un assemblatore e/o di un fotocopiatore, il paese di Huawei e Xiaomi è oggi quello che investe di più nella ricerca, con la speranza di detronizzare gli Stati Uniti. Oltre agli smartphone e ai computer, la Cina è ora in grado di progettare i propri chip ed è recentemente diventata leader nel settore automobilistico.

Davanti all’intelligenza artificiale generativa grazie ad aziende come OpenAI, Google e Meta, gli Stati Uniti pensano da tempo che avrebbero mantenuto il loro vantaggio abbastanza a lungo da tenere a bada la Cina. Due anni dopo l’annuncio di ChatGPT, la Cina afferma tuttavia di averli detronizzati.

DeepSeek: la fabbrica modello cinese

Fondata nel 2023, DeepSeek sta andando veloce. In meno di un anno è riuscita a mettere online diversi modelli considerati efficaci, in particolare grazie ad un ingente sforzo finanziario da parte dei giocatori cinesi. DeepSeek funziona sia su LLM classici (come GPT-4o), LLM formati per compiti (codificazione, ad esempio) sia su modelli all’avanguardia, capaci di “pensare” (come o1 o o3).

La sua ultima impresa si chiama DeepSeek-V3 ed è stata annunciata il 26 dicembre 2024. In programma per questo nuovo modello:

  • Un’interfaccia ispirata al 100% a quella di ChatGPT, con animazioni molto simili. C’è anche un pulsante Cerca, con un motore di ricerca integrato.
  • Una velocità di scrittura in netto aumento (60 gettoni/parole al secondo).
  • Un modello completamente open Source, con 671 miliardi di parametri (più di Meta Llama 3.1, il miglior modello open Source americano).
  • Un costo di formazione stimato in 5,5 milioni di dollari, che alcuni stimano 10 volte inferiore a quello americano, con 14,8 trilioni di token analizzati per la formazione.
  • Un’API decisamente più economica, che potrebbe incoraggiare molti sviluppatori a utilizzare DeepSeek, se davvero efficace, piuttosto che GPT-4o o un’altra soluzione americana.
type="image/webp">>
Su Twitter, DeepSeek si descrive come un’azienda americana. L’obiettivo è mettere in ombra OpenAI e altri gruppi statunitensi. // Fonte: X

Secondo i benchmark pubblicati da DeepSeek, il suo modello V3 è paragonabile a GPT-4o (OpenAI) e Claude-3.5-Sonnet (Anthropic), i due LLM più popolari negli Stati Uniti. DeepSeek-V3 fa ancora meglio con la matematica e la programmazione, eccellendo naturalmente in cinese. Tutto questo è ancora da dimostrare (i primi tester indicano che DeepSeek a volte sembra confondersi), ma è comunque molto promettente. Soprattutto per un costo così basso.

type="image/webp">Benchmark pubblicati da DeepSeek per presentare il suo LLM V3.>Benchmark pubblicati da DeepSeek per presentare il suo LLM V3.
Benchmark pubblicati da DeepSeek per presentare il suo LLM V3. // Fonte: DeepSeek

Gli Stati Uniti dovrebbero preoccuparsi di DeepSeek-V3?

In pochi mesi e con relativamente pochi soldi, gli ingegneri reclutati dalla Cina sarebbero quindi riusciti a eguagliare GPT-4o, il modello predefinito di ChatGPT. Naturalmente rimangono molti vantaggi in OpenAI (multimodalità, modalità vocale, integrazione, generazione di immagini e video, ecc.), ma l’impresa rimane impressionante. DeepSeek riesce tanto più nel suo colpo di comunicazione in quanto il suo ultimo annuncio sta provocando una reazione negli Stati Uniti, dove i precedenti interessavano solo un pubblico molto informato. Il capo di Perplexity è addirittura sorpreso dalla politica americana contro l’open Source, che rallenterebbe i ricercatori. Insomma, gli Stati Uniti hanno abboccato e sono preoccupati per l’ascesa cinese.

Altro punto di forza: DeepSeek-V3 è già disponibile gratuitamente. Chiunque può provarlo.

type="image/webp">Il capo della Perplexity, azienda americana, denuncia la politica degli Stati Uniti nei confronti dell'open Source</a>.>Il capo della Perplexity, azienda americana, denuncia la politica degli Stati Uniti nei confronti dell'open Source</a>.
Il capo della Perplexity, azienda americana, denuncia la politica degli Stati Uniti nei confronti dell’open Source. // Fonte: X

Oltre agli exploit di DeepSeek, che vuole diventare il ChatGPT cinese, la Cina sta finanziando altri modelli all’avanguardia. Tra questi, CogVideoX, HunyuanVideo (Tencent) e Kling per generare video o Qwen su Alibaba. Hanno tutti una cosa in comune: l’open Source. Un approccio diverso rispetto agli Stati Uniti, che permette ai ricercatori di andare più veloci, con molti più dati.

Unica incognita: come reagiranno gli Stati Uniti di Donald Trump, che ben conosce questa concorrenza cinese? Una guerra tecnologica come quella con Huawei non è impossibile, per rallentare la ricerca cinese.

Questo contenuto è bloccato perché non hai accettato cookie e altri tracker. Questo contenuto è fornito da YouTube.
Per poterlo visualizzare, devi accettare l’uso effettuato da YouTube con i tuoi dati che potranno essere utilizzati per i seguenti scopi: consentirti di visualizzare e condividere contenuti con i social media, promuovere lo sviluppo e il miglioramento dei prodotti di Humanoid e dei suoi partner, mostrarti annunci pubblicitari personalizzati in relazione al tuo profilo e alla tua attività, definire un profilo pubblicitario personalizzato, misurare le prestazioni degli annunci pubblicitari e dei contenuti su questo sito e misurare il pubblico di questo sito (ulteriori informazioni)

Facendo clic su “Accetto tutto”, acconsenti agli scopi sopra menzionati per tutti i cookie e altri tracker inseriti da Humanoid e dai suoi partner.

Hai la possibilità di revocare il tuo consenso in qualsiasi momento. Per maggiori informazioni ti invitiamo a leggere la nostra Cookie Policy.

Accetto tutto

Gestisci le mie scelte


-