Iscriviti alle nostre newsletter giornaliere e settimanali per gli ultimi aggiornamenti e contenuti esclusivi sulla copertura AI leader del settore. Saperne di più
Mistral ha aggiornato il suo modello di codifica open Source Codestral, che si sta rivelando popolare tra i programmatori, estendendo la concorrenza per modelli incentrati sulla codifica rivolti agli sviluppatori.
In un post sul blog, la società ha affermato di aver aggiornato il modello con un’architettura più efficiente per creare Codestral 25.01, un modello che Mistral promette sarà il “leader indiscusso per la codifica nella sua classe di peso” e due volte più veloce della versione precedente.
Come il Codestral originale, Codestral 25.01 è ottimizzato per azioni a bassa latenza e ad alta frequenza e supporta la correzione del codice, la generazione di test e le attività di riempimento. La società ha affermato che potrebbe essere utile per le aziende con più dati e casi d’uso di residenza modello.
I test di benchmark hanno mostrato che Codestral 25.01 ha ottenuto risultati migliori nei test di codifica in Python e ha ottenuto un punteggio dell’86,6% nel test HumanEval. Ha battuto la versione precedente di Codestral, Codellama 70B Instruct e DeepSeek Coder 33B instruct.
Questa versione di Codestral sarà disponibile per gli sviluppatori che fanno parte dei partner plug-in IDE di Mistral. Gli utenti possono distribuire Codestral 25.01 localmente tramite l’assistente al codice Continua. Possono anche accedere all’API del modello tramite la Plateforme di Mistral e Google Vertex AI. Il modello è disponibile in anteprima su Azure AI Foundry e presto sarà anche su Amazon Bedrock.
Sempre più modelli di codifica
Mistral ha rilasciato Codestral nel maggio dello scorso anno come primo modello incentrato sul codice. Il modello con parametri 22B potrebbe codificare in 80 lingue diverse e ha sovraperformato altri modelli incentrati sul codice. Da allora, Mistral ha rilasciato Codestral-Mamba, un modello di generazione di codice costruito sull’architettura Mamba in grado di generare stringhe di codice più lunghe e gestire più input.
E sembra che ci sia già molto interesse per Codestral 25.01. A poche ore dall’annuncio di Mistral, il modello sta già scalando le classifiche su Copilot Arena.
La scrittura del codice è stata una delle prime caratteristiche dei modelli di base, anche per modelli più generici come o3 di OpenAI e Claude di Anthropic. Tuttavia, nell’ultimo anno, i modelli specifici per la codifica sono migliorati e spesso superano i modelli più ampi.
Solo nell’ultimo anno sono stati messi a disposizione degli sviluppatori diversi modelli specifici per la codifica. Alibaba ha rilasciato Qwen2.5-Coder a novembre. Il DeepSeek Coder cinese è diventato il primo modello a battere GPT-4 Turbo a giugno. Microsoft ha inoltre presentato GRIN-MoE, un modello basato su una miscela di esperti (MOE) in grado di codificare e risolvere problemi di matematica.
Nessuno ha risolto l’eterno dibattito sulla scelta di un modello generico che apprende tutto o di un modello mirato che sa solo programmare. Alcuni sviluppatori preferiscono l’ampiezza delle opzioni che trovano in un modello come Claude, ma la proliferazione di modelli di codifica mostra una richiesta di specificità. Poiché Codestral è addestrato alla codifica dei dati, ovviamente sarà più bravo a codificare le attività piuttosto che a scrivere e-mail.
Approfondimenti giornalieri sui casi d’uso aziendali con VB Daily
Se vuoi impressionare il tuo capo, VB Daily fa al caso tuo. Ti forniamo informazioni approfondite su ciò che le aziende stanno facendo con l’intelligenza artificiale generativa, dai cambiamenti normativi alle implementazioni pratiche, in modo che tu possa condividere approfondimenti per il massimo ROI.
Leggi la nostra Informativa sulla privacy
Grazie per esserti iscritto Scopri altre newsletter VB qui.
Si è verificato un errore.