Agentic AI: editori in cerca di maturità, secondo AI Builders

Poiché i modelli linguistici di grandi dimensioni sono ora in grado di spiegare il ragionamento – e quindi di dettagliare una sequenza di passaggi logici – possono, in linea di principio, pianificare compiti e gestire tutto o parte di un processo. Per fare ciò, i fornitori LLM forniscono loro quella che chiamano “chiamata di funzione”. In poche parole, i modelli possono eseguire azioni dopo averli collegati a strumenti di terze parti. Alcuni editori, tra cui Salesforce e ServiceNow, cercano di addestrare modelli non da un corpus di documenti, ma da descrizioni di processi di pensiero (tecnica chiamata Catena di pensiero), azioni e passaggi da seguire durante le chiamate di funzione.

Cos’è un modello di azione di grandi dimensioni? Il motore di un agente autonomo

Questi nuovi tipi di modelli che appariranno nel 2022 sono chiamati “Large Action Models” o LAM. Per il momento si tratta di varianti piuttosto perfezionate di LLM o di grandi modelli linguistici a cui è stata dedicata parte della formazione (in particolare utilizzando tecniche di apprendimento per rinforzo) per svolgere questi compiti. Queste sono le basi di ciò che gli editori chiamano “agenti autonomi”.

“Un agente è la combinazione di un orchestratore LLM, capace di scomporre i compiti e di assegnarli, con un frammento di codice dedicato”, descrive Stéphane Roder, CEO di AI Builders. “Questo pezzo di codice si prende cura di ogni sottoattività, capisce come funziona lo strumento, interagisce con esso, recupera il risultato prodotto e lo trasmette all’orchestratore.” Questa sarebbe l’evoluzione dell’RPA. A differenza di un bot RPA che deve essere programmato manualmente o trasmesso la registrazione di una serie di attività, un agente “troverà da solo le azioni da svolgere”.

La proliferazione di questi agenti suggerisce un passaggio dall’analisi prescrittiva, che gli LLM hanno promesso di migliorare, all’azionabilità pianificata. “Si tratta di una tendenza prevista da Gartner nel 2014”, osserva Stéphane Roder.

I primi casi d’uso di questi agenti più o meno autonomi sono gli “assistenti applicativi”. AI Builders distingue tra due: gli assistenti applicativi integrati nelle suite per ufficio e quelli integrati nelle suite aziendali. “Stiamo osservando una tendenza di fondo tra tutti gli editori di software che offrono o offriranno questi assistenti applicativi che integrano almeno un agente”, commenta il CEO di AI Builders.

Salesforce Agentforce e Microsoft Copilot si distinguono dalla massa

La matrice decisionale AI di AI Builders tenta di chiarire il panorama degli assistenti AI integrati nelle suite per ufficio e negli strumenti aziendali (CRM, ERP, ITSM, ecc.)

Per aiutare le aziende a vedere più chiaramente in questa giungla di rapida crescita, la società di consulenza ha ideato la sua AI Decision Matrix.

Come il quadrato magico di Gartner, AI Builders ha definito quattro categorie: AI Next Gen, AI Best-In-Class, AI Rising Star e AI Safe Bet. La posizione della soluzione sull’ordinata materializza la sua prestazione e sull’ascissa la sua maturità.

Le prestazioni vengono valutate in base alla qualità delle risposte ottenute, all’eventuale personalizzazione dell’assistente, alla sicurezza e alla gestione dei dati, al numero di funzionalità e alla complessità dei compiti svolti. La maturità viene valutata in base a quattro criteri, vale a dire il livello di implementazione della soluzione sorgente sul mercato, l’entità delle integrazioni interne ed esterne, la facilità di implementazione e utilizzo, nonché la scalabilità.

Le soluzioni etichettate Next Gen e Rising Star si trovano a sinistra della tabella. Gli “astri nascenti” sono in fase di sviluppo – quindi inefficienti e inaffidabili – ma promettono di guadagnare terreno sul mercato. Le soluzioni Next Gen sono considerate efficienti, ma non molto mature. La categoria Safe Bet, come suggerisce il nome, riunisce assistenti performanti, dai molteplici utilizzi e più affidabili della media. Le soluzioni “best-in-class” sono ritenute le migliori sul mercato e si distinguono per la capacità di integrarsi con i sistemi informativi esistenti delle aziende. Gli assistenti alle applicazioni Office sono indicati da un punto arancione, mentre quelli dedicati agli strumenti aziendali sono in rosso.

Di conseguenza, Zia di Zoho, Muse, Konverso e Work Intelligence di Wrike sono le “Astri nascenti”. Al contrario, Salesforce Agentforce, Microsoft Copilot, Gemini di Google e Now Assist di ServiceNow sono gli assistenti più efficienti e maturi. Le soluzioni Safe Bet riuniscono gli strumenti per ufficio di Dust, Notion AI e gli assistenti aziendali Agent Lumi, Adobe Sensei e Amazon Q.

Priorità alla prestazione

“Tra tutte le categorie di assistenti, consideriamo Agentforce la soluzione più potente fino ad oggi”, ha affermato Dimitri Calmand, analista dati/AI presso AI Builders Research. “Ciò che fa la differenza secondo noi è la funzionalità Agent Builder che ti consente di creare i tuoi agenti con azioni esistenti o aggiuntive tramite MuleSoft, tra gli altri, con un notevole risparmio di tempo.”

“Tra tutte le categorie di assistenti, consideriamo Agentforce la soluzione più potente fino ad oggi.”

Dimitri CalmandAnalista di dati/intelligenza artificiale, ricerca sugli sviluppatori di intelligenza artificiale

Stranamente, GitHub Copilot, ancora uno degli strumenti di intelligenza artificiale generativa più popolari tra gli sviluppatori, è classificato come “Next Gen”, con Joule di SAP. «Per quanto GitHub Copilot sia efficace per generare codice e test, la sua integrazione nell’ambiente di programmazione e la sua capacità di assistere determinati compiti specifici di categorie di sviluppatori non sono molto avanzate», spiega Stéphane Roder.

Per quanto riguarda Joule di SAP, “le funzionalità più avanzate sono previste per il 2025”. D’altro canto sarebbe rivelatore il fatto che l’editore tedesco stia sviluppando anche assistenti agentici, secondo il CEO di AI Builders. “Se un player come SAP inizia a offrire agenti, è perché stiamo assistendo alla creazione di uno standard”.

Se un player come SAP inizia a offrire agenti, è perché stiamo assistendo alla creazione di uno standard”.

Stephane RoderCEO, costruttori di intelligenza artificiale

Va inoltre notato che alcuni criteri di valutazione sono stati sovrappesati dall’azienda. Pertanto, in questo benchmark vengono evidenziati la qualità delle risposte ottenute, la complessità dei compiti svolti e l’entità delle integrazioni. “Questi sono i criteri che avranno il maggiore impatto sul ROI del nostro cliente”, spiega Pauline de Lavallade, direttrice di AI Builders Research. Al contrario, garantire soluzioni è più complesso da giudicare poiché spesso dipende da un modello di responsabilità condivisa. Soprattutto perché rimangono molte incognite su come proteggere le interazioni degli agenti con strumenti di terze parti.

Prezzi: ancora una volta, molta sperimentazione

La matrice decisionale non sembra tenere conto del prezzo delle soluzioni. “I prezzi degli assistenti variano a seconda delle opzioni e dei livelli di personalizzazione”, risponde Dimitri Calmand. “Diversi strumenti, tra cui Gemini e Notion, offrono prove gratuite, poi il prezzo aumenta fino a circa 20 euro al mese per utente. Tuttavia, opzioni commerciali più personalizzate aumentano significativamente i costi. Ad esempio, Copilot per Microsoft 365 ha un prezzo di 30 euro al mese per utente, mentre Copilot Studio viene fatturato a 200 dollari per 25.000 messaggi al mese», spiega.

Oltre a prezzi diversi a seconda dei moduli scelti, Salesforce offre ai clienti esistenti di Sales, Services, Marketing e Commerce Cloud 1.000 conversazioni gratuite e 250.000 crediti dati gratuiti per Data Cloud. Oltre a ciò, il gigante del CRM intende addebitare due dollari per ogni conversazione. Il gigante del CRM offre anche un altro modello di prezzo personalizzato.

Per Agentforce Service Agent, fornisce un simulatore del ROI che tiene conto del costo dei dipendenti del servizio clienti, del numero di conversazioni gestite ogni giorno e del volume dei ticket di supporto da trasferire ad Agentforce. Questo strumento fornito a scopo illustrativo non tiene conto dei costi di implementazione, ma prendere in considerazione il cliente ridurrà parte del suo libro paga.

“Ci sono anche gli inizi di un’economia di agenti verticalizzati che si sta affermando. Alcuni agenti saranno sviluppati da partner o aziende prima di essere commercializzati come su un App Store», aggiunge Stéphane Roder.

Un paesaggio che cambia

La matrice AI Builders appena rilasciata verrà aggiornata tra sei mesi. “È un mercato che si muove molto velocemente. Le soluzioni continueranno ad evolversi ogni mese, emergeranno nuovi attori e gli strumenti esistenti verranno rinominati. Solitamente in Salesforce Einstein GPT è diventato Agentforce”, ricorda Pauline de Lavallade.

“Immaginate che nasca un progetto di intelligenza artificiale e che una settimana dopo qualcuno venga da me per un parere”, esclama Stéphane Roder.

In ogni caso, gli attori citati sono in forte concorrenza. “C’è il timore della disintermediazione. Prendiamo l’esempio di Microsoft che vuole collegare il suo Copilot a tutto, compresi Salesforce e SAP, e Salesforce che si oppone a questo desiderio offrendo i propri agenti”, afferma il CEO di AI Builder. Alla conferenza annuale Dreamforce, Marc Benioff è stato veemente nei confronti di Microsoft.

Oltre ai LLM o LAM “generici”, la società di consulenza prevede l’emergere di assistenti universali, incarnati da funzioni come “Computer Use” e segue da vicino la visione di “agent automation” immaginata da UiPath. “Il concetto di agente si sta espandendo in molte modalità, ma non abbiamo ancora studiato questa parte”, ammette Stéphane Roder. “I nostri clienti sono meno interessati a queste soluzioni che si interfacciano con i sistemi e sono ancora tecnicamente inefficienti. Siamo all’inizio di questa capacità di scomporre il ragionamento”.