IA automatica - AutoAI
L'intelligenza artificiale automatizzata (AutoAI) è una variante della tecnologia di apprendimento automatico automatizzato , o AutoML, che estende l'automazione della creazione di modelli verso l'automazione dell'intero ciclo di vita di un modello di apprendimento automatico. Applica l'automazione intelligente al compito di creare modelli di apprendimento automatico predittivo preparando i dati per l'addestramento, identificando il miglior tipo di modello per i dati forniti, quindi scegliendo le funzionalità, o colonne di dati, che supportano al meglio il problema che il modello sta risolvendo. Infine, l'automazione testa una varietà di opzioni di ottimizzazione per raggiungere il miglior risultato in quanto genera, quindi classifica, le pipeline dei candidati modello. Le pipeline più performanti possono essere messe in produzione per elaborare nuovi dati e fornire previsioni basate sull'addestramento del modello. L'intelligenza artificiale automatizzata può anche essere applicata per assicurarsi che il modello non abbia pregiudizi intrinseci e automatizzare le attività per il miglioramento continuo del modello. La gestione di un modello AutoAI richiede monitoraggio e aggiornamento frequenti, gestiti da un processo noto come operazioni del modello o ModelOps .
L'Automated Machine Learning and Data Science Team (AMLDS), un piccolo team all'interno di IBM Research, formato per "applicare tecniche di Intelligenza Artificiale (AI), Machine Learning (ML) e gestione dei dati per accelerare e ottimizzare la creazione di macchine flussi di lavoro di apprendimento e scienza dei dati", è accreditato per l'avanzamento dello sviluppo di AutoAI.
Caso d'uso
Un tipico caso d'uso per AutoAI sarebbe l'addestramento di un modello per prevedere come i clienti potrebbero rispondere a un incentivo di vendita. Il modello viene prima addestrato con dati effettivi su come i clienti hanno risposto alla promozione. Presentato con nuovi dati, il modello può fornire una previsione di come un nuovo cliente potrebbe rispondere, con un punteggio di confidenza per la previsione. Prima di AutoML, gli scienziati dei dati dovevano costruire manualmente questi modelli predittivi, testando varie combinazioni di algoritmi, quindi testando per vedere come le previsioni si confrontavano con i risultati effettivi. Laddove AutoML ha automatizzato parte del processo di preparazione dei dati per l'addestramento, applicando algoritmi per elaborare i dati e quindi ottimizzando ulteriormente i risultati, AutoAI fornisce una maggiore automazione intelligente che consente di testare un numero significativamente maggiore di combinazioni di fattori per generare pipeline candidate modello che riflettono in modo più accurato e affrontare il problema da risolvere. Una volta creato, un modello può essere testato per rilevare eventuali distorsioni e aggiornato per migliorare le prestazioni.
Il processo di AutoAI
L'utente avvia il processo fornendo una serie di dati di addestramento e identificando la colonna di previsione, che imposta il problema da risolvere. Ad esempio, la colonna di previsione potrebbe contenere possibili valori di sì o no in risposta a un incentivo offerto. Nella fase di pre-elaborazione dei dati , AutoAI applica numerosi algoritmi, o stimatori, per analizzare, pulire (ad esempio, rimuovere informazioni ridondanti o imputare dati mancanti) e preparare dati grezzi strutturati per l'apprendimento automatico (ML).
La successiva è la selezione automatica del modello che abbina i dati a un tipo di modello, come la classificazione o la regressione . Ad esempio, se sono presenti solo due tipi di dati in una colonna di previsione, AutoAI si prepara a creare un modello di classificazione binaria. Se esiste un insieme inconoscibile di possibili risposte, AutoAI prepara un modello di regressione, che impiega un diverso insieme di algoritmi o trasformazioni per la risoluzione dei problemi. AutoAI si classifica dopo aver testato gli algoritmi candidati rispetto a piccoli sottoinsiemi di informazioni, aumentando gradualmente la dimensione del sottoinsieme per gli algoritmi che risultano più promettenti per raggiungere la migliore corrispondenza. Questo processo di apprendimento automatico iterativo e incrementale è ciò che distingue AutoAI dalle versioni precedenti di AutoML.
L'ingegneria delle funzionalità trasforma i dati grezzi nella combinazione che rappresenta il problema per arrivare alla previsione più accurata. Parte di questo processo consiste nel valutare in che modo i dati nell'origine dati di training possono supportare al meglio una previsione accurata. Utilizzando algoritmi , valuta alcuni dati come più importanti di altri per ottenere il risultato desiderato. AutoAI automatizza la considerazione di numerose opzioni di costruzione delle funzionalità in modo non esaustivo e strutturato, massimizzando progressivamente l'accuratezza del modello utilizzando l'apprendimento per rinforzo. Ciò risulta da una sequenza ottimizzata di informazioni e trasformazioni di dati che corrisponde ai migliori algoritmi della fase che coinvolge la selezione del modello.
Infine, AutoAI applica la fase di ottimizzazione degli iperparametri per perfezionare e far progredire le pipeline del modello più performanti. Le pipeline sono candidati modello che vengono valutati e classificati in base a metriche quali accuratezza e precisione. Alla fine del processo, l'utente può rivedere le pipeline e scegliere la pipeline o le pipeline da mettere in produzione per fornire previsioni su nuovi dati.
Storia
Nell'agosto 2017, AMLDS ha annunciato che stavano effettuando ricerche sull'uso dell'ingegneria delle funzionalità automatizzate per eliminare le congetture nella scienza dei dati. I membri di AMDLS Udayan Khurana, Horst Samulowitz, Gregory Bramble, Deepak Toraga e Peter Kirchner, insieme a Fatemeh Nargesian dell'Università di Toronto e Elias Khalil della Georgia Tech, hanno presentato la loro ricerca preliminare all'IJCAI quello stesso anno.
Chiamato "Ingegneria delle caratteristiche basata sull'apprendimento", il loro metodo ha appreso le correlazioni tra distribuzioni di caratteristiche, distribuzioni di destinazione e trasformazioni, ha costruito meta-modelli che utilizzavano osservazioni passate per prevedere trasformazioni praticabili e ha generalizzato migliaia di set di dati che abbracciano diversi domini. Per affrontare vettori di caratteristiche di diverse dimensioni, ha utilizzato Quantile Sketch Array per catturare il carattere essenziale di una caratteristica.
Nel 2018, IBM Research ha annunciato Deep Learning as a Service, che ha aperto popolari librerie di deep learning come Caffe, Torch e TensorFlow , agli sviluppatori nel cloud. AMLDS ha continuato il suo lavoro e l'ha usato in un noto concorso Kaggle . Ha completato nella top ten per cento. Jean-Francois Puget, PhD, un distinto ingegnere specializzato in machine learning (ML) e ottimizzazione presso IBM, ha partecipato al concorso. Ha scoperto e ha deciso di essere pronto per IBM AI e piattaforme di data science come IBM Watson . Nel dicembre 2018, IBM Research ha annunciato NeuNetS, una nuova funzionalità che automatizza la sintesi del modello di rete neurale come parte dello sviluppo e della distribuzione automatizzati di modelli di intelligenza artificiale.
In "An ADMM Based Framework for AutoML Pipeline Configuration", un documento di ricerca AAAI 2020, gli autori Sijia Liu, Parikshit Ram, Djallel Bouneffouf, Deepak Vijaykeerthy, Gregory Bramble, Horst Samulowitz, Dakuo Wang, Andrew R Conn e Alexander Gray hanno proposto un metodo per AutoML che utilizzava il metodo dei moltiplicatori a direzione alternata (ADMM) per configurare più fasi di una pipeline ML, come trasformazioni, ingegneria e selezione delle funzionalità e modellazione predittiva. Questa è stata la prima volta registrata che IBM Research ha applicato pubblicamente il termine "Auto" all'apprendimento automatico.
AutoAI: l'evoluzione di AutoML
Il 2019 è stato l'anno in cui AutoML è diventato più ampiamente discusso come concetto. "The Forrester New Wave™: soluzioni di apprendimento automatico incentrate sull'automazione, secondo trimestre del 2019", ha valutato le soluzioni AutoML e ha scoperto che le versioni più potenti offrivano funzionalità di ingegneria. Un rapporto di Gartner Technical Professional Advice dell'agosto 2019 ha riportato che, sulla base della loro ricerca, AutoML potrebbe aumentare la scienza dei dati e l'apprendimento automatico. Hanno descritto AutoML come l'automazione delle attività di preparazione dei dati, progettazione delle funzionalità e progettazione dei modelli.
AutoAI è l'evoluzione di AutoML. Uno dei principali inventori di AutoAI, Jean-Francois Puget, PhD, lo descrive come l'esecuzione automatica della preparazione dei dati, dell'ingegneria delle funzionalità, della selezione dell'algoritmo di apprendimento automatico e dell'ottimizzazione degli iperparametri per trovare il miglior modello di apprendimento automatico possibile. L'algoritmo di ottimizzazione degli iperparametri utilizzato in AutoAI differisce dall'ottimizzazione degli iperparametri di AutoML. L'algoritmo è ottimizzato per le valutazioni delle funzioni di costo come l'addestramento del modello e il punteggio, tipici dell'apprendimento automatico, consentendo una rapida convergenza verso una buona soluzione nonostante i tempi di valutazione di ciascuna iterazione siano di lunga durata.
I ricercatori di IBM Research hanno pubblicato un documento "Towards Automating the AI Operations Lifecycle", che descrive i vantaggi e le tecnologie disponibili per automatizzare maggiormente il processo, con l'obiettivo di limitare il coinvolgimento umano necessario per costruire, testare e mantenere un machine learning applicazione. Tuttavia, alcuni ricercatori HCI sostengono che l'applicazione di apprendimento automatico e le sue raccomandazioni sono inevitabilmente prese dai decisori umani, quindi è impossibile eliminare il coinvolgimento umano nel processo. Piuttosto, un design AutoAI più trasparente e interpretabile è la chiave per guadagnare la fiducia degli utenti umani, ma tale design in sé è piuttosto una sfida.
Premi per AutoAI
- Vincitore del premio Best Innovation in Intelligent Automation all'AIconics AI Summit (2019), San Francisco.
- Vincitore del premio iF Design Guide per la comunicazione in un'applicazione software (2020)