Hugging Chat, Whisper, Stable Diffusion… Ecco le alternative open Source alla migliore IA sul mercato.
L’intelligenza artificiale accessibile a tutti è possibile nel 2024. Oltre agli attori proprietari dell’intelligenza artificiale generativa, l’ecosistema open Source è cresciuto notevolmente negli ultimi 24 mesi. Le alternative gratuite oggi sono efficienti quasi quanto le loro equivalenti proprietarie. JDN elenca i migliori strumenti e modelli di intelligenza artificiale gratuiti sul mercato, per generare testo, immagini e persino trascrizioni.
Hugging Chat: l’alternativa a ChatGPT
Chatta con gli abbracci si distingue come una delle alternative open Source più promettenti a ChatGPT. Sviluppato da Hugging Face, il chatbot può essere configurato con diversi modelli all’avanguardia: Llama-3.1 70B di Meta, Command R+ di Cohere, Qwen2.5-72B (di Qwen), Llama-3.1-Nemotron 70B di Nvidia, Llama- 3.2 -11B Vision di Meta, Hermes 3 di NousResearch, Mistral Nemo di Mistral AI e infine Phi 3.5 di Mistral AI. Per la generazione di riepilogo o testo, è preferibile Llama-3.1 70B. Per inviare immagini al modello per l’analisi, utilizzare Llama-3.2-11B.
Negli ultimi mesi Hugging Chat è davvero cresciuto. È possibile creare i propri bot personalizzati e utilizzare strumenti, come con ChatGPT: ricerca web, generazione di immagini, editing di immagini, calcolatrice… È anche possibile utilizzare uno dei 37 strumenti (a novembre 2024) sviluppati dal comunità.
Diffusione Stabile: l’alternativa a Dall-E e Midjourney
Mentre l’intelligenza artificiale proprietaria continua a dominare la generazione di immagini, i modelli open Source hanno compiuto progressi significativi negli ultimi 12 mesi. Il più popolare, Diffusione stabileti consente di generare immagini in una serie di stili diversi. L’ultima versione 3.5 offre una migliore adesione al prompt, immagini più dettagliate e risultati complessivamente più realistici. La sua forza? È possibile eseguirlo localmente con una configurazione relativamente ragionevole (in particolare con la gamma RTX di Nvidia).
Un’altra alternativaFLUX.1 Devsviluppato dal laboratorio della Foresta Nera, offre ottimi risultati. FLUX.1 Dev offre un’eccellente qualità dell’immagine. Funziona particolarmente bene con istruzioni complesse e offre un’ottima comprensione delle scene dettagliate. Grazie alla sua architettura ibrida, il modello è spesso più veloce di Stable Diffusion in inferenza ma richiede più risorse hardware.
Whisper: l’alternativa ai modelli STT dei cloud provider
Google Speech-to-Text su Google Cloud, Amazon Transcribe su AWS, Azure Speech to Text su Microsoft… I fornitori di servizi cloud dominano da tempo la trascrizione AI. Ma l’arrivo di Sussurro a OpenAI si comincia a rimescolare le carte. Disponibile come open Source con aggiornamenti regolari (almeno una volta all’anno), Whisper offre una solida alternativa ai modelli proprietari di sintesi vocale.
Il modello rimane molto efficiente, anche con registrazioni audio contenenti molto rumore e qualunque sia la lingua. Il suo unico limite? Un vocabolario limitato, soprattutto in ambiti lessicali ultra-specializzati. (esempio: acronimo medico). Infine, l’ultima versione Turbo (large-v3-turbo) offre una generazione molto più veloce con una perdita marginale di precisione (meno del 5%).
Per dedurre il modello senza utilizzare un server dedicato o un’API a pagamento, è possibile eseguire il modello gratuitamente su Google TPU con Google Colab.
Audio, video: modelli open Source in ritardo
Il settore molto più recente dell’intelligenza artificiale generativa per audio e video manca ancora di maturità. Diversi modelli proprietari come Runway o Pika per i video, o Suno AI e MusicFX per l’audio, stanno iniziando a offrire risultati accettabili. D’altro canto l’open Source non è ancora molto avanzato. I rari modelli ad alte prestazioni, come AudioCraft di obiettivo o Diffusione video stabile di stabilità, sono ancora vicini allo stato della ricerca e non producono risultati veramente qualitativi.
Nonostante le considerevoli risorse dei giganti della tecnologia, l’intelligenza artificiale open Source oggi compete con soluzioni proprietarie in diversi settori. Questo successo è in gran parte dovuto a Meta, che ha reso accessibili modelli potenti come Llama, ma anche a Hugging Face, la cui piattaforma accoglie ogni giorno nuovi modelli migliorati dalla community.
La sfida principale per l’IA open Source non risiede più tanto nella qualità dei modelli quanto nell’accesso alle risorse di inferenza. L’hosting e l’esecuzione dei modelli rappresentano costi sostanziali e persino i fornitori open Source che attualmente offrono piattaforme di inferenza gratuite, come Hugging Face con la sua Hugging Chat, potrebbero non essere in grado di mantenerle gratuite a tempo indeterminato.
Related News :