Con DeepSeek-V3 la Cina potrebbe avere motivo di preoccupare OpenAI e i grandi gruppi americani. Il suo approccio open Source, in un settore sempre più dominato da gruppi privati, gli consente di muoversi rapidamente, con molto meno denaro.
In pochi anni la Cina si è affermata come il Paese leader in termini di innovazione tecnologica. A lungo associato all’immagine di un assemblatore e/o di un fotocopiatore, il paese di Huawei e Xiaomi è oggi quello che investe di più nella ricerca, con la speranza di detronizzare gli Stati Uniti. Oltre agli smartphone e ai computer, la Cina è ora in grado di progettare i propri chip ed è recentemente diventata leader nel settore automobilistico.
Davanti all’intelligenza artificiale generativa grazie ad aziende come OpenAI, Google e Meta, gli Stati Uniti pensano da tempo che avrebbero mantenuto il loro vantaggio abbastanza a lungo da tenere a bada la Cina. Due anni dopo l’annuncio di ChatGPT, la Cina afferma tuttavia di averli detronizzati.
DeepSeek: la fabbrica modello cinese
Fondata nel 2023, DeepSeek sta andando veloce. In meno di un anno è riuscita a mettere online diversi modelli considerati efficaci, in particolare grazie ad un ingente sforzo finanziario da parte dei giocatori cinesi. DeepSeek funziona sia su LLM classici (come GPT-4o), LLM formati per compiti (codificazione, ad esempio) sia su modelli all’avanguardia, capaci di “pensare” (come o1 o o3).
La sua ultima impresa si chiama DeepSeek-V3 ed è stata annunciata il 26 dicembre 2024. In programma per questo nuovo modello:
- Un’interfaccia ispirata al 100% a quella di ChatGPT, con animazioni molto simili. C’è anche un pulsante Cerca, con un motore di ricerca integrato.
- Una velocità di scrittura in netto aumento (60 gettoni/parole al secondo).
- Un modello completamente open Source, con 671 miliardi di parametri (più di Meta Llama 3.1, il miglior modello open Source americano).
- Un costo di formazione stimato in 5,5 milioni di dollari, che alcuni stimano 10 volte inferiore a quello americano, con 14,8 trilioni di token analizzati per la formazione.
- Un’API decisamente più economica, che potrebbe incoraggiare molti sviluppatori a utilizzare DeepSeek, se davvero efficace, piuttosto che GPT-4o o un’altra soluzione americana.
Secondo i benchmark pubblicati da DeepSeek, il suo modello V3 è paragonabile a GPT-4o (OpenAI) e Claude-3.5-Sonnet (Anthropic), i due LLM più popolari negli Stati Uniti. DeepSeek-V3 fa ancora meglio con la matematica e la programmazione, eccellendo naturalmente in cinese. Tutto questo è ancora da dimostrare (i primi tester indicano che DeepSeek a volte sembra confondersi), ma è comunque molto promettente. Soprattutto per un costo così basso.
Gli Stati Uniti dovrebbero preoccuparsi di DeepSeek-V3?
In pochi mesi e con relativamente pochi soldi, gli ingegneri reclutati dalla Cina sarebbero quindi riusciti a eguagliare GPT-4o, il modello predefinito di ChatGPT. Naturalmente rimangono molti vantaggi in OpenAI (multimodalità, modalità vocale, integrazione, generazione di immagini e video, ecc.), ma l’impresa rimane impressionante. DeepSeek riesce tanto più nel suo colpo di comunicazione in quanto il suo ultimo annuncio sta provocando una reazione negli Stati Uniti, dove i precedenti interessavano solo un pubblico molto informato. Il capo di Perplexity è addirittura sorpreso dalla politica americana contro l’open Source, che rallenterebbe i ricercatori. Insomma, gli Stati Uniti hanno abboccato e sono preoccupati per l’ascesa cinese.
Altro punto di forza: DeepSeek-V3 è già disponibile gratuitamente. Chiunque può provarlo.
Oltre agli exploit di DeepSeek, che vuole diventare il ChatGPT cinese, la Cina sta finanziando altri modelli all’avanguardia. Tra questi, CogVideoX, HunyuanVideo (Tencent) e Kling per generare video o Qwen su Alibaba. Hanno tutti una cosa in comune: l’open Source. Un approccio diverso rispetto agli Stati Uniti, che permette ai ricercatori di andare più veloci, con molti più dati.
Unica incognita: come reagiranno gli Stati Uniti di Donald Trump, che ben conosce questa concorrenza cinese? Una guerra tecnologica come quella con Huawei non è impossibile, per rallentare la ricerca cinese.