In moltissimi casi il singolo sensore, misurando la specifica variabile che ci interessa, basta ed avanza. Mi basta osservare tre gas per capire se una batteria sta andando in malora, e non mi serve nessuna intelligenza artificiale per capire cosa fare. In altri casi l’analisi statistica dei dati, ossia della loro evoluzione, correlazione e traiettoria nel tempo, è quello che serve: ad esempio quando il medico decide se prescrivere le statine o provare ancora con la dieta. Infine, ci sono casi in cui possiamo mettere assieme tanti dati diversi, da sensori differenti, e chiedere all’intelligenza artificiale di scoprire se c’è un qualcosa che li lega, e magari consentire delle previsioni prima impossibili, come si fa in finanza per capire dove andrà la borsa, o nel campo energetico per prevedere l’andamento dei i prezzi.
Prima ancora di lasciar spazio all’intelligenza artificiale, occorre che l’ingegnere dei dati utilizzi le proprie competenze statistiche per capire come meglio mettere assieme tutti questi dati, un esercizio che spesso significa togliere quelli che non servono. Con Data Fusion (fusione dei dati) si intende proprio la disciplina e l’arte del mettere assieme informazioni diverse, spesso apparentemente scorrelate tra loro. Da questo lavoro si vede cosa ci dà la statistica, magari un ottimo risultato, e poi si può provare l’intelligenza artificiale per vedere se il computer immagina un modello ed una spiegazione dei fenomeni che a noi non verrebbe mai in mente.
Qualche anno fa l’aviazione militare americana ha iniziato ad usare questo approccio per prevedere se qualche areo prendesse traiettorie pericolose, creando Pathfinder (scopritore di tracce), e riuscendo a scoprire in tempo un mattacchione che stava volando verso il Congresso. Nessuno dei controllori e degli strumenti precedenti aveva capito che questo postino della Florida, con semplice brevetto da aereo da diporto, aveva trovato il modo di confondersi tra le rotte aeree, ed era molto vicino al suo obiettivo.
La differenza tra la statistica e l’intelligenza artificiale è tutta qua: con la prima si guardano i dati, si fanno delle ipotesi e poi da lì iniziamo a testarle, per vedere quale spiegazione, correlazione o previsione sia più calzante. Con la seconda chiediamo alla macchina di fare ipotesi, testarle, imparare dai risultati e ripartire da zero, migliaia di volte al giorno. Nel primo caso sappiamo cosa può succedere: le nostre ipotesi sono correte, oppure sbagliate, ma abbiamo tutto sotto controllo. Nel secondo il risultato dell’intelligenza artificiale può sembrare incredibile, e fatichiamo a capire se giusto o no. E’ per questo motivo che prima di imbarcarsi in progetti di intelligenza artificiale occorre conoscere bene il fenomeno che si va ad investigare, utilizzare gli strumenti che la matematica ci mette a disposizione, tenere sempre a mente il ruolo del noise (rumore statistico) e bias (pregiudizi) che rischiano di farci prendere fischi per fiaschi.