Come funziona l'AI Generativa: significato e applicazioni

Aggiornato il / Creato il / Di Carlo Negri / 1 Commento

L’AI Generativa, o Generative AI, o ancora Intelligenza Artificiale Generativa, può essere oggi considerato l’ultimo grande traguardo dell’Intelligenza Artificiale. Sebbene anche per gli addetti ai lavori quest’area dell’AI non sia una novità, il 2023 rimarrà alla storia come l’anno che ha segnato il confine tra due ere, quella antecedente e quella l’exploit commerciale della GenAI.

Infatti, se la più popolare tra le soluzioni di AI Generativa, ChatGPT, è stata rilasciata nel novembre 2022, è stato proprio il 2023 l’anno in cui si è compresa la portata del reale cambiamento indotto, sotto molteplici prospettive. Aiutati dalla Ricerca dell’Osservatorio Artificial Intelligence del Politecnico di Milano, in questo articolo approfondiremo:

  • cos’è l’AI Generativa e come funziona
  • AI Generativa e Big Tech, le grandi sfide
  • le applicazioni dell’AI Generativa
  • l’AI Generativa in Italia

Cos’è l’AI Generativa e come funziona

L’AI Generativa è un tipo di Intelligenza Artificiale che utilizza algoritmi di Machine Learning (ossia apprendimento automatico) per generare nuovi contenuti che in precedenza si basavano sulla creatività dell’uomo. Questi contenuti possono essere ad esempio testo, audio, immagini, video e codice informatico.

L’AI Generativa si basa tipicamente sui foundation model, vale a dire su modelli di AI addestrati su enormi quantità di dati. Questi modelli sono in grado di apprendere la distribuzione dei dati di addestramento, studiarne la probabilità di distribuzione e da qui generare contenuti nuovi, che replicano le caratteristiche più probabili dei dati di addestramento. I foundation model possono essere usati in tramite interfaccia conversazionale oppure tramite API (Application Programming Interface), che vengono “richiamate” dagli sviluppatori nel codice che stanno sviluppando.

Sebbene tramite l'AI Generativa si spazi dalla generazione di codice alla progettazione di nuove proteine, i foundation model sono emersi in ambito linguaggio naturale e immagini. Tra gli esempi che possiamo citare troviamo i due modelli elaborati dalla società statunitense OpenAI. Il primo è GPT-4 (Generative Pre-trained Transformer 4), utilizzato per ChatGPT (la cui versione 4, a pagamento, è multimodale, poiché è in grado di rispondere a input testuali e visivi, mentre il profilo base può comprendere solo input testuali e fa leva sul modello 3.5). Il secondo è DALL·E 3, il modello di generazione immagini alla base dell’omonima soluzione generativa.

Tra i foundation model di Generative IA rilasciati da Google troviamo, invece, LaMDA (Language Model for Dialogue Applications), Bert (Bidirectional Encoder Representations from Transformers), PaLM 2 (Pathways Autoregressive Language Model) e Gemini. Quest’ultimo, anch’esso multimodale, è alla base della piattaforma Gemini, a cui dà il nome, subentrata a Bard l’8 febbraio 2024.

Un ultimo esempio di foundation model di Generative IA è rappresentato dal recente lancio della terza generazione dei modelli Claude, rilasciati dalla società Anthropic. Al pari di GPT4 e Gemini, si caratterizza per la multimodalità, ovvero la capacità di gestire testo e immagini. Inoltre, secondo i benchmark che comparano tali modelli, è in grado di performare meglio degli stessi GPT4 e Gemini.

I foundation model dell'AI Generativa per l’interpretazione del linguaggio naturale prendono il nome di Large Language Model (LLM), famiglia di cui fanno parte gli stessi GPT4 e Gemini. Dopo un pre-addestramento, è possibile adattare i LLM a diverse esigenze specifiche, rendendoli utilizzabili per una vasta gamma di applicazioni, come la traduzione o il riassunto.

L’evoluzione dell’AI Generativa

L’AI Generativa, come già accennato, non è una nuova area dell’Intelligenza Artificiale (AI). Infatti, è da almeno dieci anni che gli addetti ai lavori usano modelli, perlopiù per la generazione di testi e immagini.

I precursori dell’AI Generativa sono stati il Deep Learning (o apprendimento approfondito), che consiste in un ramo approfondito del Machine Learning, e le reti neurali, ossia modelli di neuroni artificiali ispirati alle reti del cervello umano. Tra le prime architetture che possiamo menzionare per la parte generativa troviamo, ad esempio, la GAN (Generative Adversarial Network) e gli AutoEncoder. Questi, però avevano difficoltà a gestire grandi quantità di testo. Tale ostacolo è stato poi risolto con l’architettura dei Transformer, che vedremo meglio in seguito. Per l’AI questa nuova capacità ha rappresentato una nuova grande conquista, abilitata da tre principali fattori:

  • il primo è la disponibilità di dati che, grazie a Internet, alla sensoristica IoT e al digitale, in generale sono oggi disponibili in quantità senza precedenti;
  • il secondo è la grande evoluzione dei modelli e degli algoritmi alla base dell’AI, che citavamo in precedenza;
  • il terzo è l’avanzamento tecnologico degli hardware di nuova generazione che sono sempre più performanti e permettono di sfruttare appieno questa tecnologia.

In questo contesto, dobbiamo tenere presente che l’AI Generativa viene alimentata da enormi quantità di dati elaborati da strutture con altissime complessità (reti neurali) e hanno quindi bisogno di molta capacità computazionale.

genertive-ai-come-funziona-cos-e

AI Generativa e Transformers: cosa sono e come funzionano

Molti dei foundation model di Generative IA sono oggi basati sull’architettura dei Transformer. Apparsi al grande pubblico con ChatGPT, sono invece noti nella comunità di studio sull'Intelligenza Artificiale, dal 2017 grazie al paper Attention is all you need.

I Transformer in AI Generativa sono un’architettura di reti neurali basata su un meccanismo di attenzione, che si focalizza su particolari elementi di una sequenza di dati. Esattamente come la mente umana, che in una frase si focalizza su elementi essenziali come sostantivi, pronomi, aggettivi, verbi, comprendendone le relazioni, allo stesso modo i Transformer apprendono relazioni di dipendenza a lungo raggio tra le parole in una sequenza.

Questa caratteristica li rende più performanti di altre architetture, come le RNN (Reti Neurali Ricorrenti), che invece procedono in modo sequenziale e con un limite sulla lunghezza delle sequenze in input. L'architettura dei transformer, originariamente sviluppata per il trattamento del linguaggio naturale, si è dimostrata flessibile e adatta anche per altre applicazioni al di fuori del solo linguaggio. Si tratta, ad esempio, della generazione di testo basato su immagini o la generazione di immagini stesse.

ia generativa significato

AI Generativa e Big Tech, le grandi sfide

Vista la centralità dell’AI Generativa, tutte le principali BigTech sono scese in campo per competere in questa corsa all’innovazione. Prima fra tutte è stata la società OpenAI con la nota piattaforma ChatGPT.

AI Generativa e ChatGPT

ChatGPT, come detto in precedenza, è l’interfaccia del foundation model di AI Generativa di OpenAI, GPT-4 (Generative Pre-trained Transformer). È disponibile in due versioni: una gratuita, denominata ChatGPT 3.5, e una premium, chiamata ChatGPT 4. In entrambe le versioni il chatbot è in grado di elaborare testi, sia essi articoli, traduzioni, codici, ricette, ecc. Nella versione a pagamento, inoltre, ChatGPT è multimodale, ovvero in grado di comprendere e rispondere a input sia testuali che visivi.

Il programma di AI Generativa, che ha avuto un grande hype già a partire dal suo rilascio (si è parlato di un milione di utenti al giorno nella prima settimana) ha però un limite, che consiste nell’aggiornamento delle informazioni. L’ultimo aggiornamento del dataset di ChatGPT 3.5 risale a gennaio 2022, mentre quelle di ChatGPT 4 ad aprile 2023.

A partire dal suo rilascio al grande pubblico, avvenuto a novembre 2022, sono poi seguite le risposte delle altre Big Tech.

AI Generativa e Google

In risposta all'AI Generativa di OpenAI, ChatGPT, Google a febbraio del 2023 ha lanciato la sua soluzione conversazionale chiamata Bard. Un anno dopo questo strumento è stato rinominato Gemini, proprio come l’ultimo grande LLM (Large Language Model) presentato dalla stessa azienda di Mountain View a fine 2023.

Multimodale come ChatGPT, questa AI Generativa differisce però per diversi aspetti. Mentre uno dei limiti principali di ChatGPT è l'aggiornamento delle informazioni, Google può sfruttare la sua immensa mole di dati per perfezionare Gemini. Inoltre, un’altra delle caratteristiche della piattaforma di Google è la possibilità di integrare anche altri servizi, come Gmail e Google Documenti.

AI Generativa e Microsoft

L’azienda di Bill Gates è stata forse la prima BigTech che pubblicamente è entrata nella partita dell’AI Generativa investendo in OpenAI. Basandosi proprio sull’AI sviluppata da OpenAI, a maggio 2023 Microsoft ha rilasciato Bing Chat, l’assistente conversazionale che oggi è stato sostituito da Copilot (o Bing AI) Questa piattaforma di Intelligenza Artificiale Generativa, diversamente da ChatGPT, è in grado di produrre immagini. Inoltre, secondo un esperimento condotto dall’Osservatorio Design Thinking for Business del Politecnico di Milano, Bing AI, attraverso contenuti visuali, è in grado di elaborare contenuti visuali intensi e maggiormente impattanti a livello emotivo.

Microsoft Copilot è disponibile principalmente su Windows 11, tramite il web e come assistente per Microsoft 365.

AI Generativa e Amazon

L’azienda di Jeff Bezos ha diversificato la strategia sull’AI Generativa. Oltre aver investito nella startup Anthropic, nata da ex dirigenti di OpenAI e proprietaria del modello linguistico multimodale Claude, nel corso del 2023 Amazon ha fatto altri due annunci.

Il primo è il lancio della suite Bedrock, la cui feature principale è che permette agli sviluppatori di integrare servizi AI in grado di generare testo, appunto come ChatGPT, nei loro software. Il secondo è la nascita dell’AWS Generative AI Innovation Center per mettere in contatto gli esperti di Amazon con i clienti che desiderano creare applicazioni basate su Intelligenza Artificiale. L’obiettivo è lavorare a una soluzione per sfidare gli altri player.

AI Generativa e Apple

Negli ultimi mesi, Apple ha continuato a progredire nel campo dell'AI Generativa, seppur mantenendo un profilo più discreto. È importante sottolineare che nell'ottobre del 2023 Apple ha divulgato uno studio relativo al modello linguistico multimodale di ampia portata, denominato Ferret, successivamente reso disponibile anche su GitHub a fini di ricerca.

Il 2024 pare sia l’anno della svolta per Apple a livello di Generative IA. L’azienda afferma infatti di stare lavorando all'integrazione di funzionalità di Intelligenza Artificiale Generativa nelle sue piattaforme software. Sempre stando a quanto affermato dalla Big Tech, queste funzionalità saranno disponibili per gli utenti entro la fine dell'anno.

AI Generativa e Meta

Tra le prime azioni per sviluppare un AI Generativa messe in campo da Meta c’è il rilascio del suo modello linguistico di grandi dimensioni Llama. Si tratta sempre di un LLM, rilasciato però in modalità open source (ovvero accessibile a chiunque voglia usarla). Pare che l’azienda sia già al lavoro per la nuova versione Llama 3. Inoltre, Mark Zuckerberg ha annunciato anche il lancio di AI Studio. Si tratta di una piattaforma che supporterà la creazione di soluzioni di Intelligenza Artificiale basate sui modelli forniti dal gruppo anche al di fuori della società.

AI Generativa e xAI

Dopo essere stato tra i principali firmatari della lettera per sospendere lo sviluppo dell’AI e quindi anche dell'AI Generativa, a fine 2023 Elon Musk ha lanciato la società di Intelligenza Artificiale xAI, con l’obiettivo di compete con le altre BigTech. Al momento, xAI sta sviluppando il chatbot Grok, di cui sul sito ufficiale sono rimarcate soprattutto la sua “vena ribelle”, sarcastica e irriverente, e la sua capacità di rispondere a domande “piccanti”, a differenza dei competitor.

Le applicazioni dell’AI Generativa

Le applicazioni dell'AI Generativa sono diversificate e influiscono positivamente su molteplici settori. Nella programmazione, ad esempio, l'Intelligenza Artificiale Generativa può essere utilizzata per generare codice automaticamente, semplificando i processi di sviluppo software e accelerando la creazione di nuove applicazioni.

Nei servizi di customer service, i chatbot basati sull'AI Generativa migliorano l'esperienza dell'utente fornendo risposte intelligenti e contestualizzate. In questo modo contribuiscono a una gestione più efficace delle richieste e riducendo i tempi di attesa.

Nel contesto aziendale, la AI Generativa può essere impiegata per la generazione di nuove idee, supportando il processo creativo attraverso la proposta di concetti innovativi e soluzioni originali. Ciò può essere particolarmente utile per l'innovazione e lo sviluppo di nuovi prodotti o servizi.

Quanto alla gestione della knowledge base aziendale, l'AI Generativa può automatizzare la creazione, l'organizzazione e l'aggiornamento delle informazioni aziendali. Queste azioni semplificano la ricerca e l'accesso a conoscenze specifiche, migliorando l'efficienza operativa e la condivisione di informazioni all'interno dell'organizzazione.

In generale, le applicazioni dell'AI Generativa stanno contribuendo in modo significativo a ottimizzare processi, migliorare l'esperienza utente e stimolare l'innovazione in diversi settori.

L’AI Generativa in Italia

L’Intelligenza Artificiale in Italia sta crescendo in maniera impetuosa e i dati di mercato lo dimostrano. Si parla, infatti, di un aumento del +52% nel 2023 rispetto all’anno precedente, che portano il mercato a un valore complessivo di 760 milioni di euro. Di questi, le progettualità specificatamente realizzate tramite l'IA Generativa pesano oggi il 5%, vale a dire circa 38 milioni di euro.

L’AI Generativa, contrariamente alle aspettative, non ha però influenzato il percorso di avvicinamento all’IA da parte di quelle aziende che non hanno adottato questa tecnologia.

Introdurre l’Intelligenza Artificiale Generativa in azienda mediante integrazioni con API, infatti, è più complesso rispetto alla semplice interazione con i chatbot. Il potenziale di tali integrazioni è indubbiamente enorme, ma la gestione delle soluzioni di AI comporta numerose complessità.

La GenAI rischia dunque di allargare il gap, invece di ridurlo, tra le aziende più propense all’innovazione tecnologica (che hanno avuto la capacità di muoversi per prime) e quelle meno inclini. Sono infatti le aziende già pronte quelle che hanno avuto la capacità di muoversi per prime.

Secondo la Ricerca dell’Osservatorio Artificial Intelligence, però, il futuro è sicuramente promettente. Circa 2 grandi aziende su 3 hanno discusso circa l’applicazione della Generative AI. Di queste, il 17% del totale ha avviato progetti di sperimentazione. All’interno delle PMI (piccole e medie imprese), solo il 7% delle realtà dichiara di aver preso in considerazione potenziali applicazioni dell’AI Generativa. Solo il 2% ha attivato concretamente almeno un’iniziativa.

Per quanto riguarda invece il punto di vista dei cittadini, circa 3 italiani su 4 hanno sentito parlare di ChatGPT. Tuttavia, la percentuale di chi conosce il termine Intelligenza Artificiale Generativa scende al 57%.

  • Autore

Ricercatore Senior dell'Osservatorio Space Economy e dell'Osservatorio Artificial Intelligence