DayFR Italian

AI cinese che spaventa i giganti americani

-

È panico nel mezzo dell’IA americana, a ” Momento di sputnik “Ha dichiarato Marc Andreessen, investitore e consigliere stretto di Donald Trump, in riferimento al primo satellite lanciato dall’Unione Sovietica nel 1957 che ha messo gli Stati Uniti. Un chatbot cinese, Deep -WeekNegli ultimi giorni in cima alla classificazione delle applicazioni gratuite più popolari in tutto il mondo.

David contro Goliath

Il modello linguistico più avanzato (LLM) proposto dal bot, DeepSeek-R1, farebbe meglio del modello O1, il più avanzato di OpenAI, sui problemi di matematica e ragionamento, secondo i parametri di riferimento realizzati da DeepSeek. Per impostazione predefinita, il chatbot funziona con DeepSeek-V3, che sarebbe costato meno di $ 6 milioni per lo sviluppo. Una goccia d’acqua nelle centinaia di miliardi necessari per la progettazione di LLM ad alte prestazioni, ricordano costantemente i giganti americani del dominio, ad esempio attraverso il progetto Stargate.

Leggi Stargate: contorni molto vaghi per il progetto da $ 500 miliardi ad Openai

DeepSeek ha questo piccolo lato David Battant Goliath che potrebbe scuotere le certezze dell’industria degli Stati Uniti (e europea): con i suoi modelli open Source calcolati con chip meno efficienti di quelli dei campioni occidentali, il bot cinese farebbe meglio … e ancora meno caro. Secondo Epoch AI, il modello DeepSeek sarebbe così efficace che la sua formazione richiederebbe solo il decimo della potenza di calcolo del modello Meta LAMA 3.1.

Chi afferma che il cinese bot comporta anche restrizioni su determinate richieste “sensibili”. Ad esempio, è impossibile porre domande DeepSeek relative alla rivolta del luogo Tien-Anmen o in Xi Jinping.

Dal 2021, è molto complicato ottenere il silicio americano più avanzato in Cina, a causa delle restrizioni imposte dalla Casa Bianca. Per essere in grado di continuare a lavorare, gli sviluppatori IA cinesi condividono il loro lavoro tra di loro e stanno provando nuovi approcci. “” DeepSeek si è concentrato sull’ottimizzazione delle risorse grazie alle soluzioni software “, Spiega Cablato Marina Zhang, professore associato presso la Sydney University of Technology.

Lo specialista della tecnologia cinese continua: ” DeepSeek ha adottato metodi open Source, raggruppando l’esperienza collettiva e promuovendo l’innovazione collaborativa. Questo approccio non solo supera i vincoli delle risorse, ma anche per accelerare lo sviluppo di tecnologie avanzate, che distingue DeepSeek dai suoi concorrenti più chiusi ».

Deepseek è stato creato nel 2023 da Liang Wenfeng a Hangzhou. Questo ingegnere elettronico ha assemblato una batteria di 10.000 chip H100 da Nvidia che ora è vietato l’importazione in Cina. A questa infrastruttura avrebbe aggiunto chip meno potenti sempre disponibili per l’importazione e ottimizzazioni per limitare i costi e ridurre la potenza di calcolo necessaria per la formazione LLM.

Il successo di Deepseek è un vero elettroshock per l’IA occidentale. L’esempio cinese può spingerlo a funzionare più in comune e a cercare una maggiore efficienza con le infrastrutture esistenti.

???? Per non perdere alcuna notizia 01NET, seguici su Google News e WhatsApp.

Fonte :

Cablato