Mistral AI lancia una bomba chiamata Pixtral-Large, in grado di battere Gemini 1.5 Pro e GPT-4o

Mistral AI lancia una bomba chiamata Pixtral-Large, in grado di battere Gemini 1.5 Pro e GPT-4o
Mistral AI lancia una bomba chiamata Pixtral-Large, in grado di battere Gemini 1.5 Pro e GPT-4o
-

Mistral AI accelera il ritmo. La più importante start-up francese nel campo dell'intelligenza artificiale vuole mettersi alla prova. E per raggiungere questo obiettivo, non esita a dare il massimo nello sviluppo dei suoi modelli. Prova di ciò è il suo ultimo modello, appena uscito: Pixtral Large. Nel dettaglio si tratta di un modello multimodale open-weighted con 124 miliardi di parametri (proprio quello) costruito sulla base del Mistral Large 2.

Secondo modello della famiglia dei modelli multimodali, dimostra la comprensione delle immagini di “livello di confine“, afferma la start-up, sottolineando la sua capacità di comprendere documenti, grafici e immagini naturali, pur mantenendo la comprensione testuale all'avanguardia di Mistral Large 2. Dispone inoltre di una finestra contestuale di 128.000 token e può contenere almeno 30 high- immagini ad alta risoluzione.

Mistral compete contro Anthropic, Google e OpenAI

In termini di prestazioni, Pixtral Large batte i record. Valutato rispetto a modelli di frontiera su una serie di parametri di riferimento multimodali standard, risulta essere migliore dei modelli pubblicati dai concorrenti diretti di Mistral. Pertanto, su MathVista, che valuta ragionamenti matematici complessi su dati visivi, il modello ottiene un punteggio del 69,4%, superando tutti gli altri modelli. In confronto, Llama-3.2 90B raggiunge il 49,1%, Gemini-1.5 Pro il 67,8%, GPT-4o il 65,4% e Claude-3.5 Sonnet il 67,1%.

Per valutare le capacità di ragionamento su grafici e documenti complessi, i team Mistral si sono affidati ai test ChartQA e DocVQA, dove Pixtral Large supera anche GPT-4o e Gemini-1.5 Pro.

Infine, Pixtral Large dimostra le capacità competitive sul test MM-MT-Bench open Source inteso a riflettere casi d'uso reali di LLM multimodali. Supera Claude-3.5 Sonnet, Gemini-1.5 Pro e GPT-4o (il più recente). Il modello è disponibile con la licenza Mistral Research License (MRL) per uso di ricerca e didattico, afferma la start-up, aggiungendo che è disponibile anche con licenza commerciale Mistral per sperimentazione, test e produzione a fini commerciali.

Aggiornato Mistral Grande

Oltre a Pixtral Large, Mistral Large, il suo modello multilingue pubblicato lo scorso febbraio, beneficia di un aggiornamento. Dedicato al ragionamento di alto livello per compiti complessi, è ora disponibile su pixtral-large-latest, l'API della start-up, e con il nome Mistral Large 24.11 su Hugging Face con la licenza Mistral Research per la ricerca, o con una licenza commerciale. da Mistral AI per uso commerciale.

Rispetto a Large 24.07, questa versione beneficia di miglioramenti nella comprensione del contesto lungo, dell'aggiunta di un prompt di sistema e di una chiamata di funzione più precisa. “Il modello funziona molto bene per i flussi di lavoro RAG e agentici, rendendolo una scelta adatta per casi d'uso aziendali come l'esplorazione e la condivisione della conoscenza, la comprensione semantica dei documenti, le attività di automazione e il miglioramento dell'esperienza del cliente”, commenta l'avvio. Il modello dovrebbe essere rapidamente disponibile sulle piattaforme dei fornitori, a partirecer da Google Cloud e Microsoft Azure entro una settimana.

L'interfaccia “Le Chat” in grado di competere con ChatGPT

A Mistral piace fare ingressi notevoli. E l’ultima versione della sua interfaccia conversazionale “Le Chat” ne è un buon esempio. Nel suo ultimo aggiornamento, l'interfaccia beneficia di numerose aggiunte che faranno impallidire OpenAI e il suo famoso ChatGPT o addirittura Google con Gemini. Le ultime funzionalità includono: ricerca web con citazioni, tela per l'ideazione, modifica ed esportazione online, integrazione dell'ultimo modello Pixtral Large per una migliore comprensione di documenti e immagini, generazione di immagini, basata su Black Forest Labs Flux Pro.

Lo strumento Canvas ricorda molto l'interfaccia con il nome omonimo lanciata da OpenAI all'inizio del mese. In poche parole, l'interfaccia viene visualizzata nella finestra della chat quando l'utente ha bisogno di andare oltre le conversazioni ed entrare nella creazione. È possibile utilizzare i diversi template di Mistral su risultati condivisi e modificare i contenuti creati direttamente online senza rigenerare le risposte, creare bozze e visualizzare in anteprima i progetti.

Determinato a distinguersi, Mistral assicura che non cercherà di continuare “AGI a tutti i costi; la nostra missione è invece mettere nelle vostre mani un’intelligenza artificiale all’avanguardia.” Su “Le Chat”, l'ammiraglia francese offre quindi un livello gratuito con queste funzionalità beta e sta lavorando allo sviluppo di versioni premium con garanzie di servizio più elevate.

Selezionato per te

-

NEXT “Un campanello d’allarme per il nostro pianeta”: nuove immagini mostrano la spaventosa portata del ritiro dei ghiacci artici