Rendere il Machine Learning Comprensibile per le Aziende
La ricerca si concentra sullo sviluppo di strumenti predittivi che spiegano le loro decisioni.
― 8 leggere min
Indice
- L'importanza del Machine Learning
- Problemi di Adozione nel Machine Learning
- Il Ruolo della Ricerca Accademica
- Definire il Processo di Ricerca in Design Science
- Analisi Predittiva
- La Necessità di Metodologie nella Modellazione Predittiva
- Costruire Modelli Predittivi e Interpretare i Risultati
- Esempio di Applicazione: Previsione dei Prezzi nell'Economia della Condivisione
- Fonte originale
- Link di riferimento
Il machine learning predittivo sta diventando super importante per le organizzazioni perché può migliorare tante aree di business. Però, molti decision-maker in vari settori sono un po' scettici nell'usare il machine learning moderno perché pensano che questi sistemi siano "black box". Questo vuol dire che sono complessi e non mostrano chiaramente come arrivano alle loro conclusioni. Per affrontare questo problema, sosteniamo che la ricerca dovrebbe concentrarsi di più sulla creazione di strumenti di machine learning predittivo che possano spiegare le loro previsioni agli utenti.
Nonostante la recente disponibilità di strumenti che aiutano nello sviluppo di questi sistemi, la ricerca su come creare modelli predittivi interpretabili è stata un po' carente. Crediamo che questo gap nella ricerca esista perché non ci sono abbastanza indicazioni su come costruire questi strumenti in modo efficace. Quindi, presentiamo una metodologia che combina conoscenze da diverse aree di ricerca insieme a tecniche moderne per rendere il machine learning comprensibile. Mostreremo questo approccio analizzando le previsioni dei prezzi nell'economia della condivisione, specificamente per Airbnb.
L'importanza del Machine Learning
Il machine learning (ML) gioca un ruolo fondamentale nell'era digitale, influenzando molte parti della vita quotidiana. Dai telefoni smart ai social media, le tecniche di ML supportano un’ampia gamma di applicazioni aziendali. La maggior parte degli algoritmi di ML sono costruiti per fare previsioni basate sui dati raccolti. Questo processo implica l'apprendimento supervisionato o la Modellazione predittiva, che richiede almeno due set di dati: uno per l'addestramento e uno per il test. I dati di addestramento aiutano l'algoritmo ML a imparare i pattern, mentre i dati di test controllano quanto è preciso il modello appreso.
Se un modello mostra buona precisione, può essere usato per previsioni nel mondo reale. Questo aspetto dell'apprendimento supervisionato è cruciale per il business, alimentando applicazioni come la manutenzione predittiva, il rilevamento delle frodi e le raccomandazioni personalizzate. Di conseguenza, il mercato globale del machine learning sta crescendo rapidamente, segnalando il suo grande potenziale per le organizzazioni.
Problemi di Adozione nel Machine Learning
Nonostante le promettenti opportunità che il machine learning offre, molte organizzazioni non hanno ancora completamente adottato algoritmi ML avanzati a causa delle preoccupazioni sulla loro complessità. Molti decision-maker vedono questi algoritmi come troppo complicati e temono di non poter capire il ragionamento dietro le previsioni dei sistemi. Questa percezione porta a incertezze nel fare affidamento sui sistemi di supporto decisionale, soprattutto quando il ragionamento non è chiaro.
La riluttanza nell'adottare strumenti di machine learning può avere gravi conseguenze per le aziende, poiché può impedirle di utilizzare tecnologie che potrebbero migliorare la loro competitività. Per superare questo problema, la ricerca dovrebbe concentrarsi su strumenti che rendano i modelli di machine learning più facili da interpretare e capire.
Il Ruolo della Ricerca Accademica
La ricerca accademica ha un ruolo significativo nel aiutare le organizzazioni ad adottare strumenti di machine learning. I ricercatori dovrebbero sviluppare sia strumenti che aiutano a interpretare i modelli sia applicazioni esempio che incorporano questi strumenti. Attualmente, esistono vari strumenti che possono aiutare a interpretare i modelli di machine learning, rendendo più facile per gli utenti capire come vengono fatte le previsioni.
Uno strumento chiave che ha guadagnato attenzione è SHAP, che calcola e visualizza efficacemente l'importanza delle diverse variabili di input nel plasmare l'output di un modello di machine learning. Aiuta a rendere i modelli black box più trasparenti, permettendo agli utenti di vedere come diversi fattori influenzano le previsioni.
Per creare strumenti predittivi efficaci, dovremmo concentrarci sulla ricerca in design science (DSR). Questo approccio mira a creare soluzioni pratiche che estendono le capacità organizzative e forniscono preziose intuizioni. Tuttavia, c'è stata poca ricerca su come sviluppare artefatti focalizzati sulle previsioni utilizzando gli strumenti per interpretare i modelli black box.
Definire il Processo di Ricerca in Design Science
Il DSR è una parte fondamentale della ricerca sui sistemi informativi, concentrandosi sulla creazione di artefatti utili che aiutano le organizzazioni. Quando si sviluppa un artefatto, è vitale assicurarsi che abbia uno scopo pratico mentre fornisce anche intuizioni teoriche. La maggior parte delle metodologie per il DSR segue fasi specifiche, che dovrebbero idealmente includere:
- Identificazione del Problema: Definire chiaramente il problema che l'artefatto è destinato ad affrontare.
- Concettualizzazione: Sviluppare un approccio chiaro e fissare obiettivi per l'artefatto.
- Implementazione: Creare e testare l'artefatto.
- Valutazione: Valutare le prestazioni e l'impatto dell'artefatto.
- Comprensione: Usare strumenti per interpretare e spiegare come funziona l'artefatto.
- Pubblicazione: Condividere le scoperte con la comunità più ampia.
Questo processo aiuta i ricercatori a costruire artefatti pratici e preziosi che possono portare a migliori pratiche organizzative.
Analisi Predittiva
L'analisi predittiva è un'area specifica all'interno del machine learning focalizzata sul fare previsioni basate sui dati piuttosto che su modelli teorici. Si basa su metodi guidati dai dati per costruire modelli predittivi senza necessariamente aderire a rigorosi background teorici.
Nella modellazione predittiva, le valutazioni si basano spesso su previsioni out-of-sample, che vengono valutate utilizzando metriche appropriate per il tipo di problema, come l'errore assoluto medio per compiti di regressione o l'accuratezza per compiti di classificazione.
La crescente disponibilità di dati negli ultimi anni ha portato i ricercatori a enfatizzare l'importanza della modellazione predittiva, rendendola rilevante sia per la ricerca accademica che per le applicazioni pratiche in vari campi.
La Necessità di Metodologie nella Modellazione Predittiva
Per garantire sforzi efficaci di modellazione predittiva, sono state proposte diverse metodologie per guidare ricercatori e praticanti. Tuttavia, molte delle metodologie esistenti non sono specificamente adattate alle esigenze delle organizzazioni che mirano ad adottare il machine learning. Questo crea un gap che deve essere affrontato per una migliore integrazione del machine learning nel business.
Valutando le metodologie attuali, possiamo estrarre fasi essenziali per condurre ricerche. Queste fasi possono guidare i ricercatori nella creazione di modelli predittivi che siano sia efficaci che interpretabili.
Costruire Modelli Predittivi e Interpretare i Risultati
Quando si sviluppano artefatti di machine learning, è essenziale concentrarsi sulla comprensione delle previsioni che fanno. Questo implica vedere i modelli come più di semplici tassi di accuratezza, ma anche considerando le intuizioni che forniscono.
Dopo aver creato un modello, i ricercatori dovrebbero selezionare un algoritmo adatto e raccogliere dati per l'addestramento. La qualità del modello dipende dall'algoritmo scelto e dai dati utilizzati. È fondamentale suddividere i dati in set di addestramento e test per evitare l'overfitting e garantire l'utilità del modello nelle applicazioni del mondo reale.
Una volta che un modello è stato addestrato, deve essere valutato per determinarne l'efficacia. Le metriche di valutazione possono aiutare a determinare quanto bene il modello si comporta rispetto ai benchmark o ad altri modelli.
La comprensione dovrebbe essere la fase finale, in cui i ricercatori utilizzano strumenti di interpretazione come SHAP per ottenere intuizioni su come il modello arriva alle sue previsioni. Le interpretazioni locali e globali possono aiutare a individuare quali caratteristiche influenzano le previsioni e come.
Esempio di Applicazione: Previsione dei Prezzi nell'Economia della Condivisione
Per dimostrare la metodologia proposta, possiamo considerare un esempio del mondo reale sulla previsione dei prezzi nell'economia della condivisione, specificamente per gli annunci di Airbnb. Molti host faticano a determinare il giusto prezzo di affitto, soprattutto quando entrano per la prima volta nel mercato. Sviluppare un modello di machine learning che raccomanda prezzi di affitto mentre fornisce spiegazioni può aiutare gli host a prendere decisioni informate.
Definizione del Problema
In questo esempio, il problema nasce dagli host che cercano di impostare prezzi competitivi per i loro affitti senza avere esperienza precedente. Il problema del cold-start è particolarmente prominente qui, poiché i nuovi host mancano di informazioni sufficienti per stabilire punti di prezzo ragionevoli.
Obiettivi
Gli obiettivi principali di questo modello sarebbero:
- Creare un artefatto che prevede prezzi di partenza appropriati basati su caratteristiche varie.
- Fornire intuizioni agli host sui fattori decisionali che influenzano il prezzo.
Approccio Concettuale
L'approccio concettuale include la raccolta dei dati, la pulizia, l'esplorazione e la preparazione dei dati per l'addestramento del modello. Inoltre, dettaglia come l'output finale dovrebbe fornire raccomandazioni e spiegazioni per gli host.
Raccolta dei Dati
I dati possono essere raccolti da varie fonti come l'API di Airbnb, che fornisce accesso alle caratteristiche delle case, ai dettagli sui prezzi, alle informazioni sulla posizione, e altro. I dati dovrebbero essere abbastanza estesi da coprire una gamma di annunci per garantire che il modello sia robusto.
Preparazione dei Dati
Una volta raccolti i dati, devono essere puliti e preparati per la modellazione. Questo include gestire valori mancanti, outlier e ingegnerizzare nuove caratteristiche rilevanti per il problema in questione. La struttura dei dati dovrebbe supportare lo sviluppo di un modello predittivo.
Addestramento e Valutazione del Modello
Il modello può essere addestrato utilizzando vari algoritmi. È essenziale valutare il modello utilizzando metriche di prestazione appropriate per garantire che fornisca previsioni affidabili. Testando il modello contro un set di convalida, possiamo identificare i suoi punti di forza e di debolezza.
Comprendere le Previsioni
Utilizzare strumenti come SHAP aiuta a interpretare le previsioni del modello. Attraverso le visualizzazioni di SHAP, gli host possono vedere come diverse caratteristiche contribuiscono al prezzo previsto, consentendo loro di adeguare i propri annunci di conseguenza.
Conclusione e Implicazioni Pratiche
Applicando la metodologia sviluppata, i ricercatori possono contribuire a una maggiore adozione del machine learning nelle organizzazioni. Creare modelli predittivi interpretabili migliora i processi decisionali per gli utenti mentre facilita una migliore comprensione degli algoritmi complessi.
In generale, l'integrazione di modelli predittivi spiegabili nelle pratiche aziendali non solo favorisce l'innovazione, ma incoraggia anche le organizzazioni ad abbracciare metodi guidati dai dati per migliori risultati.
In sintesi, lo sviluppo di artefatti di machine learning predittivo spiegabili fornisce alle organizzazioni gli strumenti necessari per prendere decisioni informate. Comprendendo i fattori che guidano le previsioni, i decision-maker possono utilizzare queste intuizioni per migliorare le loro strategie e promuovere migliori pratiche aziendali in vari settori.
Titolo: Designing Explainable Predictive Machine Learning Artifacts: Methodology and Practical Demonstration
Estratto: Prediction-oriented machine learning is becoming increasingly valuable to organizations, as it may drive applications in crucial business areas. However, decision-makers from companies across various industries are still largely reluctant to employ applications based on modern machine learning algorithms. We ascribe this issue to the widely held view on advanced machine learning algorithms as "black boxes" whose complexity does not allow for uncovering the factors that drive the output of a corresponding system. To contribute to overcome this adoption barrier, we argue that research in information systems should devote more attention to the design of prototypical prediction-oriented machine learning applications (i.e., artifacts) whose predictions can be explained to human decision-makers. However, despite the recent emergence of a variety of tools that facilitate the development of such artifacts, there has so far been little research on their development. We attribute this research gap to the lack of methodological guidance to support the creation of these artifacts. For this reason, we develop a methodology which unifies methodological knowledge from design science research and predictive analytics with state-of-the-art approaches to explainable artificial intelligence. Moreover, we showcase the methodology using the example of price prediction in the sharing economy (i.e., on Airbnb).
Autori: Giacomo Welsch, Peter Kowalczyk
Ultimo aggiornamento: 2023-06-20 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2306.11771
Fonte PDF: https://arxiv.org/pdf/2306.11771
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.