IBM WATSON A SERVIZIO DELLA BANKING INTELLIGENCE (PART I)

In questo articolo verrà affrontato il tema dell’automazione applicato ai processi di creazione di modelli di Intelligenza Artificiale, in particolare tramite il servizio di IBM AutoAI, proponendo uno scenario d’uso connesso al settore Bancario.

Business Understanding

L’utilizzo dell’AI all’interno delle imprese è in continuo aumento. A seconda del settore industriale di appartenenza, la tecnologia ha un ruolo sempre più centrale ed è sempre più fondamentale nell’ottimizzazione dei processi o perfino nella creazione di nuove opportunità di business.

Tra i settori più impattati da questi fenomeni c’è sicuramente quello bancario che, a causa di queste tecnologie dirompenti e delle nuove regolamentazioni, ha sempre più il bisogno di innovarsi.

Le ultime tendenze nel campo dell’AI si concentrano su alcuni aspetti:

1) Automazione nella creazione di modelli di classificazione e regressione

2) Explainability

3) Fairness

La gestione di questi tre fattori può essere modulata in base all’organizzazione interna che un’azienda possiede in termini di personale e livello tecnologico, passando da soluzioni di mercato a soluzioni personalizzate, create ad hoc internamente.

IBM AutoAI

In questo primo articolo ci soffermeremo sul primo aspetto cioè l’AutoAI, una funzionalità pensata per velocizzare le procedure di studio del dato e consegnare il potenziale dell’Intelligenza Artificiale nelle mani degli esperti di business, ma anche di Data Scientist che possono trovare in questo tool uno strumento acceleratore per le loro analisi (testando contemporaneamente diversi processi di trasformazione e modelli di Machine Learning).

La libertà di pesare velocemente gli effetti di una vasta gamma di strategie di analisi del dato rende AutoAI un investimento non solo dal punto di vista tecnico, ma anche e soprattutto dal punto di vista manageriale.

Cosa è possibile fare con AutoAI?

· Selezionare pipeline specifiche in poco tempo

· Velocizzare la strategia di gestione delle variabili

· Creare modelli di Machine Learning in parallelo

· Massimizzare una metrica specifica e poterla studiare in un ambiente intuitivo

A chi si rivolge AutoAI?

· Ai Data Scientist che vogliono ottimizzare i tempi di progettazione, addestramento e sviluppo dei modelli

· Ai Manager che vogliono valutare velocemente l’impatto delle varie strategie di business

· Agli Analisti che vogliono esporre risultati complessi con un linguaggio business-friendly.

Un caso d’uso…

NB: Per poter replicare autonomamente quanto segue è necessario creare un account gratuito su IBM Cloud (https://cloud.ibm.com/registration) e successivamente creare delle istanze gratuite (Lite) dei servizi IBM Watson Studio e IBM Watson Machine Learning. Per una guida passo per passo, si rimanda a https://developer.ibm.com/recipes/tutorials/create-an-ibm-watson-studio-project/

Dataset

Il dataset usato in questo articolo, contenente informazioni riguardanti il bilancio d’esercizio di 7027 compagnie polacche, è composto da 63 variabili predittive anonimizzate e da 1 variabile binaria target, in cui:

· il valore 0 indica che la compagnia NON è andata in bancarotta nei cinque anni seguenti;

· il valore 1 indica che la compagnia è andata in bancarotta entro i successivi cinque anni.

In particolare, le compagnie andate in bancarotta sono 271 e costituiscono dunque il 3.9% delle compagnie presenti nel dataset.

AutoAI su Watson Studio

Vediamo dunque come utilizzare AutoAI per creare un modello di machine learning finalizzato a predire se una compagnia andrà in bancarotta entro cinque anni. Per servirsi di AutoAI è sufficiente selezionare AutoAI experiment, presente fra gli asset che si possono aggiungere ad un progetto cliccando su Add to project in alto a destra.

Dopo avere definito un nome e una descrizione dell’esperimento di AutoAI ed aver specificato il servizio di Watson Machine Learning associato, cliccare su Create. Ora è possibile selezionare il dataset in formato CSV: sulla destra compariranno i nomi delle colonne con i relativi formati, desunti automaticamente dal file.

Come ultimo passo selezionare la colonna di cui si intende predire il valore, denominata class nel caso in esame. Apparirà una finestra in basso, nella quale si evidenziano il tipo di predizione (Binary Classification), la classe positiva (1) e la metrica obiettivo da ottimizzare (ROC AUC di default) dedotti autonomamente da IBM Watson Studio.

Si può avviare la creazione dei modelli cliccando su Run Experiment, oppure è possibile cambiare alcune impostazioni selezionando Experiment settings: più in dettaglio, AutoAI consente di:

· selezionare un sottoinsieme del dataset per velocizzare la creazione dei modelli;

· scegliere la percentuale del dataset da riservare all’addestramento;

· deselezionare le variabili predittrici che si desidera escludere nella creazione dei modelli;

· selezionare il valore positivo di target e la metrica da ottimizzare;

· scegliere di includere/escludere determinati algoritmi di classificazione/regressione.

Una volta avviata l’esecuzione, AutoAI trova i modelli ottimali per la risoluzione del problema e li inserisce nella Pipeline Leaderboard a mano a mano che vengono addestrati e valutati. Durante l’esecuzione il cruscotto Experiment summary mostra una Relationship map che riassume i migliori algoritmi selezionati, le pipeline implementate e le trasformazioni delle variabili effettuate. Nel caso specifico sono stati selezionati 8 modelli.

Al termine dell’esecuzione, nella schermata denominata Pipeline comparison, dove vengono riportate otto metriche per ogni modello in modo tale da confrontare facilmente i modelli creati:

Per vedere più nel dettaglio un modello, basta cliccare su di esso nella Pipeline Leaderboard; comparirà una schermata di valutazione del modello, dove è possibile accedere alle seguenti informazioni:

Model Evaluation: viene mostrata la ROC Curve insieme a una dettagliata tabella contente tutte le misure di valutazione del modello;

· Confusion Matrix: la matrice di confusione, che mostra la performance del modello caso per caso, evidenziando i veri positivi, i falsi positivi, i veri negativi e i falsi negativi;

· Precision Recall Curve: il grafico avente il richiamo sulle ascisse e la precisione sulle ordinate

· Model Information: una tabella riassuntiva del modello, che indica la variabile target, il tipo di modello e la data di creazione, il numero di variabili prese in considerazione e la dimensione del test set

Feature Transformation: vengono elencate tutte le variabili aggiuntive create dal modello per trasformazione delle variabili iniziali, con i dettagli delle trasformazioni;

· Feature Importance: su un grafico a barre orizzontali vengono elencate le variabili predittive, in ordine di importanza, intesa come contributo alla realizzazione delle predizioni.

Ogni modello può essere salvato direttamente su Watson Studio oppure come Jupyter Notebook, usando la tendina Save as sulla destra.

Seguiteci nel prossimo articolo per le altre capabilities di AutoAI e per approfondimenti sui temi di Explainability e Fairness applicati allo stesso caso d’uso.

--

--