Intelligenza artificiale generativa
L’intelligenza artificiale generativa (GenAI) è un tipo di tecnologia di intelligenza artificiale in grado di produrre vari tipi di contenuti, tra cui testo, immagini, audio e dati sintetici. Il recente fermento attorno all’intelligenza artificiale generativa è stato guidato dalla semplicità delle nuove interfacce utente per la creazione di testo, grafica e video di alta qualità in pochi secondi.
La tecnologia, va notato, non è nuovissima. L’intelligenza artificiale generativa è stata introdotta negli anni ’60 nei chatbot. Ma è stato solo nel 2014, con l’introduzione delle reti generative avversarie, o GAN, un tipo di algoritmo di apprendimento automatico, che l’intelligenza artificiale generativa ha potuto creare immagini, video e audio di persone reali in modo convincente e autentico.
Da un lato, questa nuova capacità ha aperto opportunità che includono un migliore doppiaggio dei film e ricchi contenuti educativi. Ha anche sbloccato le preoccupazioni sui deepfake, immagini o video contraffatti digitalmente, e sugli attacchi alla sicurezza informatica dannosi alle aziende, tra cui richieste nefaste che imitano realisticamente il capo di un dipendente.
Altri due recenti progressi che saranno discussi più in dettaglio di seguito hanno svolto un ruolo fondamentale nel far diventare mainstream l’IA generativa: i trasformatori e i modelli linguistici innovativi che hanno reso possibili. I trasformatori sono un tipo di apprendimento automatico che ha reso possibile ai ricercatori di addestrare modelli sempre più grandi senza dover etichettare tutti i dati in anticipo. Nuovi modelli potrebbero quindi essere addestrati su miliardi di pagine di testo, con conseguenti risposte più approfondite. Inoltre, i trasformatori hanno sbloccato una nuova nozione chiamata attenzione che ha consentito ai modelli di tracciare le connessioni tra parole attraverso pagine, capitoli e libri anziché solo in singole frasi. E non solo parole: i trasformatori potrebbero anche usare la loro capacità di tracciare le connessioni per analizzare codice, proteine, sostanze chimiche e DNA.
I rapidi progressi nei cosiddetti grandi modelli linguistici (LLM), ovvero modelli con miliardi o addirittura trilioni di parametri, hanno aperto una nuova era in cui i modelli di IA generativa possono scrivere testi accattivanti, dipingere immagini fotorealistiche e persino creare sitcom piuttosto divertenti al volo. Inoltre, le innovazioni nell’intelligenza artificiale multimodale consentono ai team di generare contenuti su più tipi di media, tra cui testo, grafica e video. Questa è la base per strumenti come Dall-E che creano automaticamente immagini da una descrizione di testo o generano didascalie di testo dalle immagini.
Nonostante queste innovazioni, siamo ancora agli inizi dell’uso dell’intelligenza artificiale generativa per creare testo leggibile e grafica stilizzata fotorealistica. Le prime implementazioni hanno avuto problemi di accuratezza e parzialità, oltre a essere inclini ad allucinazioni e a restituire risposte strane. Tuttavia, i progressi finora compiuti indicano che le capacità intrinseche di questa intelligenza artificiale generativa potrebbero cambiare radicalmente la tecnologia aziendale e il modo in cui operano le aziende. In futuro, questa tecnologia potrebbe aiutare a scrivere codice, progettare nuovi farmaci, sviluppare prodotti, riprogettare i processi aziendali e trasformare le catene di fornitura.
Come funziona l’intelligenza artificiale generativa?
L’intelligenza artificiale generativa inizia con un prompt che potrebbe essere sotto forma di testo, immagine, video, disegno, note musicali o qualsiasi input che il sistema di intelligenza artificiale possa elaborare. Vari algoritmi di intelligenza artificiale restituiscono quindi nuovi contenuti in risposta al prompt. I contenuti possono includere saggi, soluzioni a problemi o falsi realistici creati da immagini o audio di una persona.
Le prime versioni dell’intelligenza artificiale generativa richiedevano l’invio di dati tramite un’API o un processo altrimenti complicato. Gli sviluppatori dovevano familiarizzare con strumenti speciali e scrivere applicazioni utilizzando linguaggi come Python.
Ora, i pionieri dell’intelligenza artificiale generativa stanno sviluppando esperienze utente migliori che consentono di descrivere una richiesta in un linguaggio semplice. Dopo una risposta iniziale, è anche possibile personalizzare i risultati con feedback sullo stile, il tono e altri elementi che si desidera che il contenuto generato rifletta.
Modelli di intelligenza artificiale generativa
I modelli di intelligenza artificiale generativa combinano vari algoritmi di intelligenza artificiale per rappresentare ed elaborare il contenuto. Ad esempio, per generare testo, varie tecniche di elaborazione del linguaggio naturale trasformano i caratteri grezzi (ad esempio lettere, punteggiatura e parole) in frasi, parti del discorso, entità e azioni, che vengono rappresentate come vettori utilizzando più tecniche di codifica. Allo stesso modo, le immagini vengono trasformate in vari elementi visivi, anch’essi espressi come vettori. Un avvertimento è che queste tecniche possono anche codificare i pregiudizi, il razzismo, l’inganno e la montatura contenuti nei dati di formazione.
Una volta che gli sviluppatori hanno deciso un modo per rappresentare il mondo, applicano una particolare rete neurale per generare nuovi contenuti in risposta a una query o a un prompt. Tecniche come GAN e autoencoder variazionali (VAE), reti neurali con un decodificatore e un codificatore, sono adatte per generare volti umani realistici, dati sintetici per l’addestramento dell’intelligenza artificiale o persino facsimili di particolari esseri umani.
I recenti progressi nei trasformatori come Bidirectional Encoder Representations from Transformers (BERT) di Google, GPT di OpenAI e Google AlphaFold hanno anche prodotto reti neurali che possono non solo codificare linguaggio, immagini e proteine, ma anche generare nuovi contenuti.
Come le reti neurali stanno trasformando l’intelligenza artificiale generativa
I ricercatori hanno creato intelligenza artificiale e altri strumenti per generare contenuti in modo programmatico sin dai primi giorni dell’intelligenza artificiale. I primi approcci, noti come sistemi basati su regole e in seguito come “sistemi esperti”, utilizzavano regole create in modo esplicito per generare risposte o set di dati.
Le reti neurali, che costituiscono la base di gran parte delle applicazioni di intelligenza artificiale e apprendimento automatico odierne, hanno capovolto il problema. Progettate per imitare il funzionamento del cervello umano, le reti neurali “imparano” le regole trovando modelli in set di dati esistenti. Sviluppate negli anni ’50 e ’60, le prime reti neurali erano limitate dalla mancanza di potenza di calcolo e da piccoli set di dati. Solo con l’avvento dei big data a metà degli anni 2000 e i miglioramenti nell’hardware dei computer, le reti neurali sono diventate pratiche per generare contenuti.
Il campo ha accelerato quando i ricercatori hanno trovato un modo per far funzionare le reti neurali in parallelo attraverso le unità di elaborazione grafica (GPU) utilizzate nel settore dei giochi per computer per il rendering dei videogiochi. Le nuove tecniche di apprendimento automatico sviluppate nell’ultimo decennio, tra cui le reti generative avversarie e i trasformatori sopra menzionati, hanno preparato il terreno per i recenti notevoli progressi nei contenuti generati dall’intelligenza artificiale.
Cosa sono Dall-E, ChatGPT e Gemini?
ChatGPT, Dall-E e Gemini (in precedenza Bard) sono popolari interfacce di intelligenza artificiale generativa.
Dall-E. Addestrato su un ampio set di dati di immagini e le relative descrizioni di testo associate, Dall-E è un esempio di un’applicazione di intelligenza artificiale multimodale che identifica le connessioni attraverso più media, come visione, testo e audio. In questo caso, collega il significato delle parole agli elementi visivi. È stato creato utilizzando l’implementazione GPT di OpenAI nel 2021. Dall-E 2, una seconda versione più capace, è stata rilasciata nel 2022. Consente agli utenti di generare immagini in più stili guidati da prompt utente.
ChatGPT. Il chatbot basato sull’intelligenza artificiale che ha preso d’assalto il mondo nel novembre 2022 è stato creato sull’implementazione GPT-3.5 di OpenAI. OpenAI ha fornito un modo per interagire e perfezionare le risposte di testo tramite un’interfaccia di chat con feedback interattivo. Le versioni precedenti di GPT erano accessibili solo tramite un’API. GPT-4 è stato rilasciato il 14 marzo 2023. ChatGPT incorpora la cronologia della sua conversazione con un utente nei suoi risultati, simulando una conversazione reale. Dopo l’incredibile popolarità della nuova interfaccia GPT, Microsoft ha annunciato un nuovo investimento significativo in OpenAI e ha integrato una versione di GPT nel suo motore di ricerca Bing.
Gemini. Google è stato un altro dei primi leader nelle tecniche pionieristiche di intelligenza artificiale per l’elaborazione di linguaggio, proteine e altri tipi di contenuti. Ha reso open source alcuni di questi modelli per i ricercatori. Tuttavia, non ha mai rilasciato un’interfaccia pubblica per questi modelli. La decisione di Microsoft di implementare GPT in Bing ha spinto Google a lanciarsi sul mercato con un chatbot pubblico, Google Gemini, basato su una versione leggera della sua famiglia di modelli linguistici di grandi dimensioni LaMDA. Google ha subito una significativa perdita nel prezzo delle azioni in seguito al debutto affrettato di Gemini dopo che il modello linguistico ha affermato erroneamente che il telescopio Webb era il primo a scoprire un pianeta in un sistema solare straniero. Nel frattempo, anche le implementazioni di Microsoft e ChatGPT hanno perso la faccia nelle loro prime uscite a causa di risultati imprecisi e comportamento irregolare. Da allora Google ha presentato una nuova versione di Gemini basata sul suo LLM più avanzato, PaLM 2, che consente a Gemini di essere più efficiente e visivo nella sua risposta alle query degli utenti.
Quali sono i casi d’uso per l’intelligenza artificiale generativa?
L’intelligenza artificiale generativa può essere applicata in vari casi d’uso per generare praticamente qualsiasi tipo di contenuto. La tecnologia sta diventando più accessibile a utenti di ogni tipo grazie a innovazioni all’avanguardia come GPT che possono essere adattate a diverse applicazioni. Alcuni dei casi d’uso per l’IA generativa includono quanto segue:
- Implementazione di chatbot per il servizio clienti e il supporto tecnico.
- Distribuzione di deepfake per imitare persone o persino individui specifici.
- Miglioramento del doppiaggio per film e contenuti educativi in diverse lingue.
- Scrittura di risposte e-mail, profili di appuntamenti, curriculum e tesine.
- Creazione di arte fotorealistica in uno stile particolare.
- Miglioramento di video dimostrativi di prodotti.
- Suggerimento di nuovi composti farmaceutici da testare.
- Progettazione di prodotti fisici ed edifici.
- Ottimizzazione di nuovi progetti di chip.
- Scrittura di musica in uno stile o tono specifico.
Quali sono i vantaggi dell’IA generativa?
L’IA generativa può essere ampiamente applicata in molte aree aziendali. Può semplificare l’interpretazione e la comprensione dei contenuti esistenti e creare automaticamente nuovi contenuti. Gli sviluppatori stanno esplorando modi in cui l’IA generativa può migliorare i flussi di lavoro esistenti, con l’obiettivo di adattare completamente i flussi di lavoro per sfruttare la tecnologia. Alcuni dei potenziali vantaggi dell’implementazione dell’IA generativa includono quanto segue:
- Automazione del processo manuale di scrittura dei contenuti.
- Riduzione dello sforzo di risposta alle e-mail.
- Miglioramento della risposta a specifiche domande tecniche.
- Creazione di rappresentazioni realistiche delle persone.
- Riassunto di informazioni complesse in una narrazione coerente.
- Semplificazione del processo di creazione di contenuti in uno stile particolare.
Quali sono i limiti dell’IA generativa?
Le prime implementazioni dell’IA generativa illustrano vividamente i suoi numerosi limiti. Alcune delle sfide che l’IA generativa presenta derivano dagli approcci specifici utilizzati per implementare casi d’uso particolari. Ad esempio, un riepilogo di un argomento complesso è più facile da leggere di una spiegazione che include varie fonti a supporto dei punti chiave. La leggibilità del riepilogo, tuttavia, va a scapito della possibilità per un utente di verificare la provenienza delle informazioni.
Ecco alcuni dei limiti da considerare quando si implementa o si utilizza un’app di IA generativa:
- Non identifica sempre la fonte del contenuto.
- Può essere difficile valutare la parzialità delle fonti originali. I contenuti realistici rendono più difficile identificare
- informazioni non accurate.
- Può essere difficile capire come sintonizzarsi su nuove circostanze.
- I risultati possono sorvolare su pregiudizi, distorsioni e odio.
L’attenzione è tutto ciò di cui hai bisogno: i trasformatori portano nuove capacità
Nel 2017, Google ha segnalato un nuovo tipo di architettura di rete neurale che ha apportato miglioramenti significativi in termini di efficienza e accuratezza in attività come l’elaborazione del linguaggio naturale. L’approccio rivoluzionario, chiamato trasformatori, si basava sul concetto di attenzione.
Ad alto livello, l’attenzione si riferisce alla descrizione matematica di come le cose (ad esempio, le parole) si relazionano, si completano e si modificano a vicenda. I ricercatori hanno descritto l’architettura nel loro articolo fondamentale, “L’attenzione è tutto ciò di cui hai bisogno”, mostrando come una rete neurale trasformatrice fosse in grado di tradurre dall’inglese al francese con maggiore accuratezza e in solo un quarto del tempo di addestramento rispetto ad altre reti neurali. La tecnica rivoluzionaria potrebbe anche scoprire relazioni, o ordini nascosti, tra altre cose sepolte nei dati di cui gli esseri umani potrebbero non essere a conoscenza perché erano troppo complicate da esprimere o discernere.
L’architettura dei trasformatori si è evoluta rapidamente dalla sua introduzione, dando origine a LLM come GPT-3 e a tecniche di pre-addestramento migliori, come BERT di Google.
Quali sono le preoccupazioni che circondano l’IA generativa?
L’ascesa dell’IA generativa sta anche alimentando varie preoccupazioni. Queste riguardano la qualità dei risultati, il potenziale di uso improprio e abuso e il potenziale di sconvolgere i modelli aziendali esistenti. Ecco alcuni dei tipi specifici di problemi problematici posti dallo stato attuale dell’IA generativa:
- Può fornire informazioni imprecise e fuorvianti.
- È più difficile fidarsi senza conoscere la fonte e la provenienza delle informazioni.
- Può promuovere nuovi tipi di plagio che ignorano i diritti dei creatori di contenuti e degli artisti di contenuti originali.
- Potrebbe sconvolgere i modelli aziendali esistenti basati sull’ottimizzazione dei motori di ricerca e sulla pubblicità.
- Rende più facile generare fake news.
- Rende più facile affermare che le vere prove fotografiche di un illecito erano solo un falso generato dall’IA.
- Potrebbe impersonare persone per attacchi informatici di ingegneria sociale più efficaci.
Data la novità degli strumenti GenAI e la loro rapida adozione, le aziende dovrebbero prepararsi all’inevitabile “crollo della disillusione” che è parte integrante della tecnologia emergente, adottando solide pratiche di ingegneria AI e rendendo l’AI responsabile una pietra angolare dei loro sforzi GenAI.
Quali sono alcuni esempi di strumenti AI generativi?
Esistono strumenti AI generativi per varie modalità, come testo, immagini, musica, codice e voci. Alcuni popolari generatori di contenuti AI da esplorare includono quanto segue:
- Gli strumenti di generazione di testo includono GPT, Jasper, AI-Writer e Lex.
- Gli strumenti di generazione di immagini includono Dall-E 2, Midjourney e Stable Diffusion.
- Gli strumenti di generazione di musica includono Amper, Dadabots e MuseNet.
- Gli strumenti di generazione di codice includono CodeStarter, Codex, GitHub Copilot e Tabnine.
- Gli strumenti di sintesi vocale includono Descript, Listnr e Podcast.ai.
- Le aziende di strumenti di progettazione di chip AI includono Synopsys, Cadence, Google e Nvidia.
Casi d’uso per l’IA generativa, per settore
Le nuove tecnologie di IA generativa sono state talvolta descritte come tecnologie di uso generale simili all’energia a vapore, all’elettricità e all’informatica perché possono influenzare profondamente molti settori e casi d’uso. È essenziale tenere presente che, come le precedenti tecnologie di uso generale, spesso ci sono voluti decenni prima che le persone trovassero il modo migliore per organizzare i flussi di lavoro per sfruttare il nuovo approccio anziché accelerare piccole porzioni di flussi di lavoro esistenti. Ecco alcuni modi in cui le applicazioni di IA generativa potrebbero avere un impatto su diversi settori:
- La finanza può monitorare le transazioni nel contesto della cronologia di un individuo per creare sistemi di rilevamento delle frodi migliori.
- Gli studi legali possono utilizzare l’IA generativa per progettare e interpretare contratti, analizzare prove e suggerire argomentazioni.
- I produttori possono utilizzare l’IA generativa per combinare dati da telecamere, raggi X e altre metriche per identificare parti difettose e le cause profonde in modo più accurato ed economico.
- Le aziende cinematografiche e dei media possono utilizzare l’IA generativa per produrre contenuti in modo più economico e tradurli in altre lingue con le voci degli attori.
- Il settore medico può utilizzare l’IA generativa per identificare promettenti candidati farmaci in modo più efficiente. Gli studi di architettura possono usare l’intelligenza artificiale generativa per progettare e adattare i prototipi più rapidamente.
- Le aziende di gioco possono usare l’intelligenza artificiale generativa per progettare contenuti e livelli di gioco.
Etica e pregiudizi nell’intelligenza artificiale generativa
Nonostante le loro promesse, i nuovi strumenti di intelligenza artificiale generativa aprono un vaso di Pandora per quanto riguarda accuratezza, affidabilità, pregiudizi, allucinazioni e plagio, questioni etiche che probabilmente richiederanno anni per essere risolte. Nessuna di queste questioni è particolarmente nuova per l’intelligenza artificiale. La prima incursione di Microsoft nei chatbot nel 2016, chiamata Tay, ad esempio, ha dovuto essere interrotta dopo aver iniziato a vomitare retorica infiammatoria su Twitter.
La novità è che l’ultima generazione di app di intelligenza artificiale generativa sembra più coerente in superficie. Ma questa combinazione di linguaggio umano e coerenza non è sinonimo di intelligenza umana e attualmente c’è un grande dibattito sul fatto che i modelli di intelligenza artificiale generativa possano essere addestrati per avere capacità di ragionamento. Un ingegnere di Google è stato addirittura licenziato dopo aver dichiarato pubblicamente che l’app di intelligenza artificiale generativa dell’azienda, Language Models for Dialog Applications (LaMDA), era senziente.
Il convincente realismo dei contenuti di intelligenza artificiale generativa introduce una nuova serie di rischi per l’intelligenza artificiale. Rende più difficile rilevare i contenuti generati dall’intelligenza artificiale e, cosa ancora più importante, rende più difficile rilevare quando le cose non vanno. Questo può essere un grosso problema quando ci affidiamo ai risultati dell’intelligenza artificiale generativa per scrivere codice o fornire consigli medici. Molti risultati dell’intelligenza artificiale generativa non sono trasparenti, quindi è difficile determinare se, ad esempio, violano i diritti d’autore o se ci sono problemi con le fonti originali da cui traggono i risultati. Se non sai come l’intelligenza artificiale è giunta a una conclusione, non puoi ragionare sul perché potrebbe essere sbagliata.
Intelligenza artificiale generativa vs. intelligenza artificiale
L’intelligenza artificiale generativa si concentra sulla creazione di contenuti nuovi e originali, risposte alle chat, progetti, dati sintetici o persino deepfake. È particolarmente preziosa nei campi creativi e per la risoluzione di nuovi problemi, poiché può generare autonomamente molti tipi di nuovi output.
L’intelligenza artificiale generativa, come notato sopra, si basa su tecniche di reti neurali come trasformatori, GAN e VAE. Altri tipi di intelligenza artificiale, a differenza di altre, utilizzano tecniche tra cui reti neurali convoluzionali, reti neurali ricorrenti e apprendimento per rinforzo.
L’intelligenza artificiale generativa spesso inizia con un prompt che consente a un utente o a una fonte di dati di inviare una query iniziale o un set di dati per guidare la generazione di contenuti. Questo può essere un processo iterativo per esplorare le variazioni di contenuto. Gli algoritmi di intelligenza artificiale tradizionali, d’altra parte, spesso seguono un set predefinito di regole per elaborare i dati e produrre un risultato.
Entrambi gli approcci hanno i loro punti di forza e di debolezza a seconda del problema da risolvere, con l’intelligenza artificiale generativa adatta per attività che coinvolgono NLP e richiedono la creazione di nuovi contenuti e gli algoritmi tradizionali più efficaci per attività che coinvolgono elaborazione basata su regole e risultati predeterminati.
Intelligenza artificiale generativa vs. intelligenza artificiale predittiva vs. intelligenza artificiale conversazionale
L’intelligenza artificiale predittiva, a differenza dell’intelligenza artificiale generativa, utilizza modelli nei dati storici per prevedere risultati, classificare eventi e informazioni fruibili. Le organizzazioni utilizzano l’intelligenza artificiale predittiva per affinare il processo decisionale e sviluppare strategie basate sui dati.
L’intelligenza artificiale conversazionale aiuta i sistemi di intelligenza artificiale come assistenti virtuali, chatbot e app di assistenza clienti a interagire e interagire con gli esseri umani in modo naturale. Utilizza tecniche di PNL e apprendimento automatico per comprendere il linguaggio e fornire risposte testuali o vocali simili a quelle umane.
Storia dell’intelligenza artificiale generativa
Il chatbot Eliza creato da Joseph Weizenbaum negli anni ’60 è stato uno dei primi esempi di intelligenza artificiale generativa. Queste prime implementazioni utilizzavano un approccio basato su regole che si rompeva facilmente a causa di un vocabolario limitato, mancanza di contesto ed eccessiva dipendenza da modelli, tra le altre carenze. I primi chatbot erano anche difficili da personalizzare ed estendere.
Il campo ha visto una rinascita sulla scia dei progressi nelle reti neurali e nell’apprendimento profondo nel 2010 che hanno consentito alla tecnologia di imparare automaticamente ad analizzare il testo esistente, classificare gli elementi delle immagini e trascrivere l’audio.
Ian Goodfellow ha introdotto le GAN nel 2014. Questa tecnica di apprendimento profondo ha fornito un nuovo approccio per organizzare reti neurali concorrenti per generare e quindi valutare le variazioni di contenuto. Queste potrebbero generare persone, voci, musica e testo realistici. Ciò ha ispirato interesse e timore per come l’IA generativa potrebbe essere utilizzata per creare deepfake realistici che impersonano voci e persone nei video.
Da allora, i progressi in altre tecniche e architetture di reti neurali hanno contribuito ad ampliare le capacità dell’IA generativa. Le tecniche includono VAE, memoria a lungo termine, trasformatori, modelli di diffusione e campi di radianza neurale.
Best practice per l’utilizzo dell’IA generativa
Le best practice per l’utilizzo dell’IA generativa variano a seconda delle modalità, del flusso di lavoro e degli obiettivi desiderati. Detto questo, è importante considerare fattori essenziali come accuratezza, trasparenza e facilità d’uso quando si lavora con l’IA generativa. Le seguenti pratiche aiutano a raggiungere questi fattori:
- Etichettare chiaramente tutti i contenuti di IA generativa per utenti e consumatori.
- Verificare l’accuratezza dei contenuti generati utilizzando fonti primarie, ove applicabile.
- Considerare come i pregiudizi potrebbero essere intrecciati nei risultati dell’IA generata.
- Ricontrollare la qualità del codice e dei contenuti generati dall’IA utilizzando altri strumenti.
- Scoprire i punti di forza e i limiti di ogni strumento di IA generativa.
- Familiarizzare con le modalità di errore comuni nei risultati e aggirarle.
Il futuro dell’IA generativa
L’incredibile profondità e semplicità di ChatGPT hanno stimolato l’adozione diffusa dell’IA generativa. Di sicuro, la rapida adozione di applicazioni di IA generativa ha anche dimostrato alcune delle difficoltà nell’implementare questa tecnologia in modo sicuro e responsabile. Ma questi primi problemi di implementazione hanno ispirato la ricerca di strumenti migliori per rilevare testo, immagini e video generati dall’IA.
In effetti, la popolarità di strumenti di intelligenza artificiale generativa come ChatGPT, Midjourney, Stable Diffusion e Gemini ha anche alimentato un’infinita varietà di corsi di formazione a tutti i livelli di competenza. Molti sono mirati ad aiutare gli sviluppatori a creare applicazioni di intelligenza artificiale. Altri si concentrano maggiormente sugli utenti aziendali che cercano di applicare la nuova tecnologia in tutta l’azienda.
A un certo punto, anche l’industria e la società creeranno strumenti migliori per tracciare la provenienza delle informazioni per creare un’intelligenza artificiale più affidabile. L’intelligenza artificiale generativa continuerà a evolversi, facendo progressi nella traduzione, nella scoperta di farmaci, nel rilevamento di anomalie e nella generazione di nuovi contenuti, dal testo e video al design della moda e alla musica. Per quanto validi siano questi nuovi strumenti una tantum, l’impatto più significativo dell’intelligenza artificiale generativa in futuro deriverà dall’integrazione di queste capacità direttamente negli strumenti che già utilizziamo. I correttori grammaticali, ad esempio, miglioreranno.
Gli strumenti di progettazione incorporeranno senza problemi raccomandazioni più utili direttamente nei nostri flussi di lavoro. Gli strumenti di formazione saranno in grado di identificare automaticamente le best practice in una parte di un’organizzazione per aiutare a formare altri dipendenti in modo più efficiente. Questi sono solo una frazione dei modi in cui l’intelligenza artificiale generativa cambierà ciò che facciamo nel breve termine.
Quale sarà l’impatto dell’intelligenza artificiale generativa in futuro è difficile da dire. Ma mentre continuiamo a sfruttare questi strumenti per automatizzare e aumentare le attività umane, ci troveremo inevitabilmente a dover rivalutare la natura e il valore delle competenze umane.
Domande frequenti sull’intelligenza artificiale generativa
Di seguito sono riportate alcune domande frequenti che le persone hanno sull’intelligenza artificiale generativa.
Chi ha creato l’intelligenza artificiale generativa?
Joseph Weizenbaum ha creato la prima intelligenza artificiale generativa negli anni ’60 come parte del chatbot Eliza.
Ian Goodfellow ha dimostrato reti generative avversarie per generare persone dall’aspetto e dal suono realistici nel 2014.
Le ricerche successive sugli LLM di Open AI e Google hanno acceso il recente entusiasmo che si è evoluto in strumenti come ChatGPT, Google Gemini e Dall-E.
In che modo l’intelligenza artificiale generativa potrebbe sostituire i lavori?
L’intelligenza artificiale generativa ha il potenziale per sostituire una varietà di lavori, tra cui i seguenti:
- Scrivere descrizioni di prodotti.
- Creare testi di marketing.
- Generare contenuti web di base.
- Avviare contatti di vendita interattivi.
- Rispondere alle domande dei clienti.
- Creare grafica per pagine web.
Alcune aziende cercheranno opportunità per sostituire gli esseri umani ove possibile, mentre altre utilizzeranno l’intelligenza artificiale generativa per aumentare e migliorare la propria forza lavoro esistente.
Come si costruisce un modello di IA generativa?
Un modello di IA generativa inizia codificando in modo efficiente una rappresentazione di ciò che si desidera generare. Ad esempio, un modello di IA generativa per il testo potrebbe iniziare trovando un modo per rappresentare le parole come vettori che caratterizzano la somiglianza tra parole spesso utilizzate nella stessa frase o che significano cose simili.
I recenti progressi nella ricerca LLM hanno aiutato il settore a implementare lo stesso processo per rappresentare modelli trovati in immagini, suoni, proteine, DNA, farmaci e progetti 3D. Questo modello di IA generativa fornisce un modo efficiente per rappresentare il tipo di contenuto desiderato e iterare in modo efficiente su varianti utili.
Come si addestra un modello di IA generativa?
Il modello di IA generativa deve essere addestrato per un caso d’uso particolare. I recenti progressi negli LLM forniscono un punto di partenza ideale per personalizzare le applicazioni per diversi casi d’uso. Ad esempio, il popolare modello GPT sviluppato da OpenAI è stato utilizzato per scrivere testo, generare codice e creare immagini basate su descrizioni scritte.
L’addestramento comporta la messa a punto dei parametri del modello per diversi casi d’uso e quindi la messa a punto dei risultati su un dato set di dati di addestramento. Ad esempio, un call center potrebbe addestrare un chatbot in base ai tipi di domande che gli agenti del servizio ricevono da vari tipi di clienti e alle risposte che gli agenti del servizio danno in cambio. Un’app di generazione di immagini, a differenza del testo, potrebbe iniziare con etichette che descrivono il contenuto e lo stile delle immagini per addestrare il modello a generare nuove immagini.
In che modo l’intelligenza artificiale generativa sta cambiando il lavoro creativo?
L’intelligenza artificiale generativa promette di aiutare i lavoratori creativi a esplorare varianti di idee. Gli artisti potrebbero iniziare con un concetto di progettazione di base e quindi esplorare varianti. I designer industriali potrebbero esplorare varianti di prodotto. Gli architetti potrebbero esplorare diversi layout di edifici e visualizzarli come punto di partenza per un ulteriore perfezionamento.
Potrebbe anche aiutare a democratizzare alcuni aspetti del lavoro creativo. Ad esempio, gli utenti aziendali potrebbero esplorare le immagini di marketing del prodotto utilizzando descrizioni di testo. Potrebbero ulteriormente perfezionare questi risultati utilizzando semplici comandi o suggerimenti.
Cosa riserva il futuro all’IA generativa?
La capacità di ChatGPT di generare testo simile a quello umano ha suscitato una curiosità diffusa sul potenziale dell’IA generativa. Ha anche fatto luce sui numerosi problemi e sfide futuri.
Nel breve termine, il lavoro si concentrerà sul miglioramento dell’esperienza utente e dei flussi di lavoro utilizzando strumenti di IA generativa. Sarà inoltre essenziale creare fiducia nei risultati dell’IA generativa.
Molte aziende personalizzeranno anche l’IA generativa sui propri dati per contribuire a migliorare il branding e la comunicazione. I team di programmazione utilizzeranno l’IA generativa per applicare le best practice specifiche dell’azienda per scrivere e formattare codice più leggibile e coerente.
I fornitori integreranno le funzionalità di IA generativa nei loro strumenti aggiuntivi per semplificare i flussi di lavoro di generazione di contenuti. Ciò guiderà l’innovazione nel modo in cui queste nuove funzionalità possono aumentare la produttività.
L’IA generativa potrebbe anche svolgere un ruolo in vari aspetti dell’elaborazione, trasformazione, etichettatura e verifica dei dati come parte dei flussi di lavoro di analisi aumentata. Le applicazioni web semantiche potrebbero utilizzare l’IA generativa per mappare automaticamente le tassonomie interne che descrivono le competenze lavorative in diverse tassonomie sui siti di formazione e reclutamento delle competenze. Allo stesso modo, i team aziendali utilizzeranno questi modelli per trasformare ed etichettare dati di terze parti per valutazioni del rischio più sofisticate e capacità di analisi delle opportunità.
In futuro, i modelli di intelligenza artificiale generativa saranno estesi per supportare la modellazione 3D, la progettazione di prodotti, lo sviluppo di farmaci, i gemelli digitali, le catene di fornitura e i processi aziendali. Ciò renderà più facile generare nuove idee di prodotto, sperimentare diversi modelli organizzativi ed esplorare varie idee aziendali.
Definizioni delle più recenti tecnologie di AI generativa
AgentGPT
AgentGPT è uno strumento di intelligenza artificiale generativa che consente agli utenti di creare agenti AI autonomi a cui è possibile delegare una serie di attività.
Arte AI (arte dell’intelligenza artificiale)
L’arte AI è qualsiasi forma di arte digitale creata o migliorata con strumenti AI.
Prompt AI
Un prompt di intelligenza artificiale (AI) è una modalità di interazione tra un essere umano e un LLM che consente al modello di generare l’output previsto. Questa interazione può essere sotto forma di domanda, testo, frammenti di codice o esempi.
Ingegnere prompt AI
Un ingegnere prompt di intelligenza artificiale (AI) è un esperto nella creazione di prompt o segnali basati su testo che possono essere interpretati e compresi da grandi modelli linguistici e strumenti AI generativi.
Red teaming AI
Il red teaming AI è la pratica di simulare scenari di attacco su un’applicazione di intelligenza artificiale per individuare i punti deboli e pianificare misure preventive. Questo processo aiuta a proteggere il modello AI da una serie di possibili tattiche di infiltrazione e problemi di funzionalità.
Amazon Bedrock
Amazon Bedrock, nota anche come AWS Bedrock, è una piattaforma di apprendimento automatico utilizzata per creare applicazioni di intelligenza artificiale (AI) generativa sulla piattaforma di cloud computing Amazon Web Services.
Apple Intelligence
Apple Intelligence è il nome della piattaforma per una suite di funzionalità di AI generativa che Apple sta integrando nei suoi prodotti, inclusi dispositivi iPhone, Mac e iPad.
Auto-GPT
Auto-GPT è un agente AI autonomo sperimentale e open source basato sul modello linguistico GPT-4 che concatena autonomamente attività per raggiungere un obiettivo generale impostato dall’utente.
Intelligenza artificiale autonoma
L’intelligenza artificiale autonoma è un ramo dell’AI in cui sistemi e strumenti sono sufficientemente avanzati da agire con supervisione e coinvolgimento umani limitati.
Prompt a catena di pensiero
Questa tecnica di progettazione dei prompt mira a migliorare le prestazioni dei modelli linguistici su attività che richiedono logica, calcolo e processo decisionale strutturando il prompt di input in un modo che imita il ragionamento umano.
Avvelenamento dei dati (avvelenamento dell’IA)
Gli attacchi di avvelenamento dei dati o dell’IA sono tentativi deliberati di manipolare i dati di addestramento dei modelli di intelligenza artificiale e apprendimento automatico (ML) per corromperne il comportamento e ottenere output distorti, parziali o dannosi.
Modelli di incorporamento per la ricerca semantica
I modelli di incorporamento per la ricerca semantica trasformano i dati in formati più efficienti per l’elaborazione simbolica e statistica dei computer.
Gemma
Gemma è una raccolta di modelli GenAI open source leggeri progettati principalmente per sviluppatori e ricercatori, creati dal laboratorio di ricerca Google DeepMind.
Google Gemini
Google Gemini è una famiglia di modelli di linguaggio di grandi dimensioni di intelligenza artificiale (IA) multimodale con capacità di comprensione di linguaggio, audio, codice e video.
Panoramiche dell’IA di Google
Le panoramiche dell’IA sono un set di capacità di ricerca e interfaccia che integrano risultati generativi basati sull’IA nelle risposte alle query del motore di ricerca di Google.
Google Search Labs
Search Labs è un’iniziativa della divisione Google di Alphabet per fornire nuove capacità ed esperimenti per la Ricerca Google in un formato di anteprima prima che diventino disponibili al pubblico.
Reti neurali grafiche (GNN)
Le reti neurali grafiche (GNN) sono un tipo di architettura di rete neurale e un metodo di apprendimento profondo che può aiutare gli utenti ad analizzare i grafici, consentendo loro di fare previsioni basate sui dati descritti dai nodi e dagli spigoli di un grafico.
Traduzione da immagine a immagine
La traduzione da immagine a immagine è una tecnica di intelligenza artificiale (IA) generativa che traduce un’immagine sorgente in un’immagine di destinazione preservando alcune proprietà visive dell’immagine originale.
Punteggio di inizio
Il punteggio di inizio (IS) è un algoritmo matematico utilizzato per misurare o determinare la qualità delle immagini create dall’IA generativa tramite una rete avversaria generativa (GAN). La parola “inizio” si riferisce alla scintilla di creatività o all’inizio iniziale di un pensiero o di un’azione tradizionalmente sperimentati dagli esseri umani.
Knowledge graph in ML
Nel regno dell’apprendimento automatico, un knowledge graph è una rappresentazione grafica che cattura le connessioni tra diverse entità. È costituito da nodi, che rappresentano entità o concetti, e spigoli, che rappresentano le relazioni tra tali entità.
LangChain
LangChain è un framework open source che consente agli sviluppatori di software che lavorano con l’intelligenza artificiale (IA) e il suo sottoinsieme di apprendimento automatico di combinare grandi modelli linguistici con altri componenti esterni per sviluppare applicazioni basate su LLM.
Modelli linguistici mascherati (MLM)
Gli MLM vengono utilizzati in attività di elaborazione del linguaggio naturale per addestrare modelli linguistici. Alcune parole e token in un input specifico vengono mascherati o nascosti casualmente in questo approccio e il modello viene quindi addestrato per prevedere questi elementi mascherati utilizzando il contesto fornito dalle parole circostanti.
Intelligenza artificiale neurosimbolica
L’intelligenza artificiale neurosimbolica combina reti neurali con tecniche di elaborazione simbolica basate su regole per migliorare l’intelligenza artificiale.
accuratezza, spiegabilità e precisione dei sistemi di intelligenza artificiale.
Ingegneria rapida
L’ingegneria rapida è una tecnica di ingegneria AI che serve a diversi scopi. Comprende il processo di perfezionamento degli LLM con prompt specifici e output consigliati, nonché il processo di perfezionamento dell’input per vari servizi AI generativi per generare testo o immagini.
Q-learning
Il Q-learning è un approccio di apprendimento automatico che consente a un modello di apprendere e migliorare iterativamente nel tempo eseguendo l’azione corretta.
Apprendimento per rinforzo dal feedback umano (RLHF)
RLHF è un approccio di apprendimento automatico che combina tecniche di apprendimento per rinforzo, come ricompense e confronti, con la guida umana per addestrare un agente AI.
Generazione aumentata dal recupero
La generazione aumentata dal recupero (RAG) è un framework di intelligenza artificiale (AI) che recupera dati da fonti esterne di conoscenza per migliorare la qualità delle risposte.
Pre-addestramento del modello linguistico con recupero aumentato
Un modello linguistico con recupero aumentato, noto anche come REALM o RALM, è un modello linguistico AI progettato per recuperare testo e quindi utilizzarlo per eseguire attività basate su domande.
Rete semantica (Knowledge Grapfh)
Una rete semantica è una struttura di conoscenza che descrive come i concetti sono correlati tra loro e come si interconnettono. Le reti semantiche utilizzano la programmazione AI per estrarre dati, collegare concetti e richiamare l’attenzione sulle relazioni.
Ricerca semantica
La ricerca semantica è una tecnica di ricerca dati che utilizza algoritmi di elaborazione del linguaggio naturale (NLP) e apprendimento automatico per migliorare l’accuratezza dei risultati di ricerca considerando l’intento del ricercatore e il significato contestuale dei termini utilizzati nella query.
Autoencoder variazionale (VAE)
Un autoencoder variazionale è un algoritmo AI generativo che utilizza l’apprendimento profondo per generare nuovi contenuti, rilevare anomalie e rimuovere il rumore.
Incorporamenti vettoriali
Gli incorporamenti vettoriali sono rappresentazioni numeriche che catturano le relazioni e il significato di parole, frasi e altri tipi di dati.
Modelli linguistici di visione (VLM)
I VLM combinano tecniche di elaborazione semantica e di visione artificiale per dare un senso alla relazione all’interno e tra gli oggetti nelle immagini.
Quali sono alcuni modelli generativi per l’elaborazione del linguaggio naturale?
Alcuni modelli generativi per l’elaborazione del linguaggio naturale includono i seguenti:
- XLNet della Carnegie Mellon University
- GPT (Generative Pre-trained Transformer) di OpenAI
- ALBERT (“A Lite” BERT) di Google
- Google BERT
- Google LaMDA
L’IA acquisirà mai coscienza?
Alcuni sostenitori dell’IA ritengono che l’IA generativa sia un passo essenziale verso l’IA di uso generale e persino la coscienza. Uno dei primi tester del chatbot LaMDA di Google ha persino creato scalpore quando ha dichiarato pubblicamente che era senziente. Poi è stato licenziato dall’azienda.
Nel 1993, lo scrittore di fantascienza e informatico americano Vernor Vinge ha ipotizzato che in 30 anni avremmo avuto la capacità tecnologica di creare un'”intelligenza sovrumana”, un’IA più intelligente degli umani, dopodiché l’era umana sarebbe finita. Il pioniere dell’intelligenza artificiale Ray Kurzweil ha previsto una tale “singolarità” entro il 2045.
Molti altri esperti di intelligenza artificiale pensano che potrebbe essere molto più lontano. Il pioniere della robotica Rodney Brooks ha previsto che l’intelligenza artificiale non acquisirà la sensibilità di un bambino di 6 anni nel corso della sua vita, ma potrebbe sembrare intelligente e attenta come un cane entro il 2048.
Tra clamore e realtà
Rischio esistenziale dell’IA: l’IA è una minaccia per l’umanità?
Cosa dovrebbero pensare le aziende dei recenti avvertimenti sulla minaccia dell’IA per l’umanità? Esperti di IA ed eticisti offrono opinioni e consigli pratici per gestire il rischio dell’IA.
Oltre il pessimismo dell’IA: tra clamore e realtà nel rischio dell’IA
Man mano che l’IA diventa sempre più diffusa, punti di vista che presentano sia sensazionalismo che preoccupazione reale stanno plasmando le discussioni sulla tecnologia e sulle sue implicazioni per il futuro.