Panoramica dei prezzi dei principali modelli linguistici di grandi dimensioni in base al numero di token richiesti tramite la loro API. I prezzi possono variare completamente a seconda delle offerte.
I LLM vengono fatturati per “token”, un’unità di misura che rappresenta segmenti di testo, cioè parole o frammenti di parole. In generale, i modelli linguistici di grandi dimensioni (LLM) valutano separatamente i token di input (quelli inviati al modello) e i token di output (quelli generati in risposta). Questo metodo di fatturazione consente agli utenti di stimare il costo in base al volume di dati elaborati dagli LLM resi disponibili sotto forma di API. Secondo la definizione di OpenAI, un token corrisponde, in inglese, a 0,75 parole. La tabella seguente riassume i prezzi stimati per token per i principali LLM presenti sul mercato, siano essi di entrata o di uscita.
Modello | Fornitore | Prezzo per 1000 token di input | Prezzo per 1000 gettoni in uscita | Numero totale di token supportati |
---|---|---|---|---|
GPT-4o (omnicomprensivo) | OpenAI | 0,05 dollari | 0,15 dollari | 128 000 |
GPT-4 Turbo | OpenAI | 0,1 dollaro | 0,3 dollari | 128 000 |
GPT-4 | OpenAI | 0,3 dollari | 0,6 dollari | 8 000 |
Claude 3 Haiku | Antropico | 0,0025 dollari | 0,0125 dollari | 200 000 |
Claude 3 Sonetto | Antropico | 0,03 dollari | 0,15 dollari | 200 000 |
Chiudi 3 Lavoro | Antropico | 0,15 dollari | 0,75 dollari | 200 000 |
Chiama il 370b | Meta (tramite AWS) | 0,00265 dollari | 0,0035 dollari | 8 000 |
Chiama il 2 70b | Meta (tramite AWS) | 0,00195 dollari | 0,00256 dollari | 4 000 |
Gemelli 1.0 Pro | 0,005 dollari | 0,015 dollari | 32 000 | |
Gemelli 1.5 Pro | 0,07 dollari | 0,21 dollari | 1.000.000 | |
Comando | Coerenza | 0,1 dollaro | 0,2 dollari | 4 000 |
Comando R | Coerenza | 0,005 dollari | 0,015 dollari | 132 000 |
Comando R+ | Coerenza | 0,03 dollari | 0,15 dollari | 128 000 |
Mixtral 8x7B | Mistral AI (via Anyscale) | 0,005 dollari | 0,005 dollari | 32 000 |
Mistral Piccolo | Maestrale AI | 0,02 dollari | 0,06 dollari | 32 000 |
Mistral Grande | Maestrale AI | 0,08 dollari | 0,24 dollari | 32 000 |
GPT-3.5 Turbo | OpenAI | 0,12 dollari | 0,16 dollari | 4 000 |
PALM2 | 0,02 dollari | 0,02 dollari | 8 000 |
Analisi del modello
- GPT-4o e GPT-4 Turbo (OpenAI) – All’interno della gamma LLM di OpenAI, GPT-4o è una versione multimodale ad alte prestazioni a un prezzo competitivo, mentre GPT-4 Turbo è un’opzione leggera a costi ridotti. GPT-4 rimane la versione principale per compiti complessi, ma a un costo maggiore.
- Gemini 1.5 e 1.5 Pro (Google DeepMind) – Sviluppati da Google, i modelli Gemini sono ottimizzati per testo e immagini. La versione Pro è più potente, con una maggiore capacità di token per casi d’uso avanzati.
- Claude 3.5 Sonetto, Haiku et Opus (Antropico) – Anthropic offre diverse versioni del suo LLM per esigenze specifiche, risposte rapide (Haiku) o interazioni lunghe e approfondite (Sonnet e Opus). I prezzi variano a seconda delle capacità di ogni persona.
- Chiama 3 70b e Chiama 2 70b (Obiettivo) – Sviluppati da Meta, questi modelli sono offerti in particolare dal cloud di Amazon. Forniscono una maggiore flessibilità per le attività personalizzate.
- Comando, Comando R e Comando R+ (Cohere) – Cohere offre una gamma completa di modelli per la ricerca e l’analisi, che vanno dalle opzioni economicamente vantaggiose per la ricerca di dati di base ai LLM su misura per analisi più complesse.
- Mixtral e Maestrale – I modelli francesi Mistral sono ottimizzati per compiti linguistici specifici (Mixtral) o interazioni rapide (Mistral Small).
- GPT-3.5 Turbo – Si tratta di un’opzione economica dei modelli OpenAI, adatta per attività semplici con capacità di token limitata, che offre una buona alternativa per esigenze meno intensive.