L’Intelligenza Artificiale Generativa: Il Futuro Appartiene ai Grandi o ai Piccoli Modelli di Linguaggio?
La crescita dell’IA generativa (gen AI) è alimentata da grandi modelli di linguaggio (LLM) molto noti, come GPT-4 di Open AI, Gemini di Google e Claude di Anthropic.
Tuttavia, mentre questi grandi modelli dominano i titoli dei giornali, un altro tipo di modelli sta guadagnando terreno. Alcuni esperti ritengono che i piccoli modelli di linguaggio (SLM, Small Language Models) potrebbero rappresentare il futuro dell’IA generica.
Secondo l’agenzia di ricerca Gartner, mentre i LLM hanno dominato fino ad ora lo sviluppo dei modelli di linguaggio, gli SLM offrono soluzioni alle principali sfide identificate dai CIO, in particolare per quanto riguarda le limitazioni di budget, la protezione dei dati, la privacy e la mitigazione dei rischi legati all’IA. I dirigenti aziendali potrebbero quindi dover scegliere tra modelli più grandi e più piccoli man mano che esplorano l’IA generativa.
Chi vincerà questa battaglia? Cinque dirigenti ci danno il loro parere.
- Considerare opportunità specifiche di settore
Claire Thompson, responsabile dei dati presso L&G, si aspetta che i modelli di piccole e grandi dimensioni abbiano un posto negli affari. Tuttavia, ritiene anche che i modelli più noti oggi potrebbero essere adattati a nuovi casi d’uso.
“Alcuni LLM potrebbero iniziare a essere addestrati su argomenti specifici per ottenere di più. E vedo che questo sta cominciando a succedere sempre di più”, ha dichiarato.
Anche se c’è ancora molto da fare per ottenere modelli specifici per settori precisi, la signora Thompson afferma che molte aziende dedicano poche risorse umane e finanziarie allo sviluppo interno.
“Non so se le aziende costruiscano i propri modelli”, ha aggiunto. “Quando parlo di creare modelli, intendo piuttosto sfruttare i modelli esistenti internamente e usare i propri dati in un ambiente sicuro per ottenere risultati.”
Tuttavia, che siano piccoli o grandi, la signora Thompson ritiene che il futuro sia nei modelli specifici. “Potresti adattare un modello alle informazioni mediche, ai temi climatici e ESG (ambientale, sociale e di governance) e ai mercati degli asset. Sono questi casi d’uso specifici che potrebbero dare vita a modelli più personalizzati”, ha affermato.
- Scegliere il cavallo giusto
Nick Woods, CIO del gruppo MAG Airports, spiega che il futuro dell’IA generativa sarà probabilmente una combinazione di modelli grandi e piccoli. “Non penso che esista un modello unico”, dice, “e il modello che scegli dipende dal caso d’uso nella tua azienda”.
Woods afferma di sentire molti professionisti dire che l’azienda dovrebbe implementare un programma di IA. La sua risposta? “No, è l’ultima cosa da fare.”
Secondo Woods, i dirigenti dovrebbero concentrarsi sul programma di trasformazione dell’azienda e decidere quali strumenti, inclusa l’IA generativa, possono aiutare a ottenere i risultati giusti. “Potrei eseguire un piccolo modello specifico in modalità Edge Computing per risolvere un caso d’uso particolare, come ad esempio individuare quando una passerella dell’aereo è stata dispiegata”, afferma.
In breve, secondo Woods, scegliere un modello significa scegliere il cavallo giusto.
“Vedremo molti piccoli modelli distribuiti su larga scala in modalità Edge Computing per casi d’uso specifici”, ha dichiarato. “È quasi inevitabile. Tuttavia, continuo a pensare che alcuni grandi modelli prevarranno.”
- Considerare il contesto
Gabriela Vogel, analista di Gartner, afferma che le sue conversazioni con i CIO suggeriscono che i piccoli modelli specifici per un settore avranno un ruolo importante, almeno nel breve termine.
“I clienti stanno cercando di trovare e creare modelli applicati a un contesto specifico”, dice. “Non si tratta necessariamente di grandi modelli generali, ma di modelli specificamente legati a piccole basi di dati per applicazioni particolari.”
Gabriela Vogel aggiunge che sempre più aziende stanno passando dall’esplorazione alla produzione, utilizzando servizi IA tramite SLM.
“Molti hanno testato gli SLM”, afferma, “hanno visto cosa funziona e cosa non funziona con modelli più grandi. Stanno cercando di essere più specifici e di applicare questo approccio.”
- Ridurre le allucinazioni
Ollie Wildeman, responsabile della soddisfazione dei clienti presso Big Bus Tours, spiega che la scelta tra SLM e LLM dipende dal caso d’uso. Ma per molte aziende è probabile che la scelta ricada su una soluzione più piccola piuttosto che più grande.
Spiega a ZDNET come Big Bus Tours utilizza Freshworks Customer Service Suite, un software di assistenza omnicanale che include chatbot e biglietteria alimentati da IA. L’azienda utilizza anche un assistente virtuale con IA di Satisfi Labs che si collega al suo sito web e risponde alle domande di base dei clienti.
“Questa tecnologia IA considera solo i dati delle aziende dove è integrata”, precisa. “La tecnologia aziendale non è collegata a IA su larga scala, come ChatGPT o altri strumenti.”
Wildeman afferma che questo approccio limitato presenta vantaggi. I dirigenti possono essere sicuri che i loro dati siano utilizzati con cura per produrre risultati. “In questo modo, i tuoi dati sono più sicuri perché sai da dove provengono e quali processi vengono utilizzati”, afferma. “Inoltre, hai meno allucinazioni perché sai che il modello che usi è progettato per il tipo di attività che svolgi.”
Questi risultati portano Wildeman a concludere che i modelli più piccoli e specifici per un settore saranno importanti per le aziende. “Per le aziende, la scelta del modello sarà più specifica, mentre per l’utente generale, questi modelli massicci e gratuiti che vediamo ovunque saranno probabilmente più utilizzati.”
- Concentrarsi sui propri dati di prima mano
Rahul Todkar, responsabile dei dati e dell’IA presso Tripadvisor, afferma che il modello giusto per un’azienda potrebbe non dipendere solo dalla dimensione.
I professionisti possono provare entrambi i modelli. Tuttavia, Todkar ritiene che i modelli personalizzati siano il futuro dell’IA, che siano grandi o piccoli.
“Prendi l’esempio di Mistral 7B, che è un modello relativamente piccolo, ma che offre risultati fantastici per compiti specifici”, afferma. “Per me, il futuro è quindi nei modelli personalizzabili.”
Secondo Rahul Todkar, la chiave del successo dell’IA è assicurarsi che il modello utilizzi i tuoi dati in modo sicuro ed efficiente. “Non è la dimensione del campo di addestramento o le caratteristiche del modello che contano. Ma piuttosto il fatto di prendere questo modello e applicarlo nel tuo contesto con i tuoi dati di prima mano. È allora che superi i modelli standard e puoi utilizzare le informazioni provenienti dai tuoi dati.”
Fonte: “ZDNet.com”
[…] L’affermazione del carattere ineluttabile della diffusione dell’IA è una predizione. Questa è la sua principale debolezza, poiché il futuro non è mai certo. Tanto più che questa predizione ha origine all’interno delle grandi aziende del digitale, i Gafam – Google (Alphabet), Apple, Facebook (Meta), Amazon e Microsoft, che predicono ciò che è vantaggioso per loro e si trovano così in una manifesta situazione di conflitto di interessi. Che essa venga ripresa massicciamente dai media e dalle organizzazioni che vi trovano un interesse diretto, ma anche dai quadri dell’educazione, deriva innanzitutto dal potere dei Gafam e dalla loro influenza. […]