mattbriar

LA DATAFICATION DI OGNI COSA (BIG DATA PARTE 2)




Se da un lato l’ascesa dei big data è stata resa possibile dai progressi (e dalla riduzione dei costi) nel campo dell’elaborazione e dell’archiviazione dati, dall’altro ha comportato un importante cambiamento di mentalità. Un tempo le informazioni venivano raccolte per uno scopo specifico, trattate e poi scartate. Oggi i dati vengono considerati una materia prima grezza da riutilizzare in modo creativo per generare un valore potenzialmente inesauribile.
Questo approccio richiede di trasformare qualsiasi tipo di informazione in un formato digitale che sia quantificabile e analizzabile: ovvero datafication.
L’idea non è nuova. Matthew Fontaine Maury, ufficiale della marina americana del XIX secolo, utilizzò le informazioni registrate su vecchi diari di bordo (venti, correnti e condizioni meteo) per tracciare carte nautiche che permisero di ottimizzare le rotte marittime, riducendo i tempi e i rischi dei viaggi. La sua pioneristica intuizione fu quella di ricavare valore da dati non strutturati, esattamente ciò che fanno le moderne tecniche di analisi dei big data.

Una delle mappe di Maury

Un secolo e mezzo dopo, abbiamo sistemi che riconoscono il conducente dell’auto in base alla pressione esercitata sul sedile. Questa tecnologia, basata sulla datafication della postura, ha applicazioni nel campo della sicurezza e della prevenzione dei furti. Oppure Google Books, che ha prima digitalizzato milioni di libri, poi ha dataficato il testo tramite un software, cosa che lo rende ricercabile e analizzabile dagli algoritmi (la semplice digitalizzazione, infatti, non è sufficiente).
Dalla datafication della posizione, da cui i servizi GPS di localizzazione, a quella delle interazioni sociali, che alimenta la crescita dei social e la loro monetizzazione, stiamo andando verso la datafication di ogni aspetto della realtà. Una delle ultime frontiere, ad esempio, riguarda i parametri fisiologici e comportamentali per migliorare la salute e il benessere.

Uno dei nostri contributi quotidiani ai dati: il captcha

Oggi possiamo estrarre valore dalle informazioni digitali grazie alla loro capacità di essere riutilizzate per scopi diversi da quelli originali. Ricombinate in set diversi e analizzate nuovamente, daranno origine a nuove correlazioni e intuizioni, per scopi secondari.
Un esempio pratico che conosciamo tutti: quando risolviamo un captcha per accedere a qualche funzione online, stiamo fornendo due informazioni. Da un lato ottemperiamo alla richiesta di verificare che un utente sia umano, come dichiarato sulla pagina web, ma dall’altro stiamo anche contribuendo alla conoscenza che permette di decifrare parole poco chiare nei testi digitalizzati, o di decifrare immagini, o correlare parole a immagini. Il pane quotidiano delle IA. Ci avete mai pensato?
In questo processo, anche le informazioni raccolte passivamente, ovvero i "dati di scarto", hanno un valore latente. Facebook, ad esempio, ha utilizzato le interazioni tra gli utenti per migliorare la visibilità delle attività degli amici, mentre alcune piattaforme di apprendimento online per identificare le criticità e indirizzare meglio l’insegnamento.
Di fatto nell’economia dell’informazione nulla è da scartare. Va da sé che un’informazione a cui abbiamo acconsentito oggi per un determinato utilizzo, potrà rivelare domani altre cose di noi, per le quali nessuno ci chiederà l’autorizzazione.

Crescita del mercato dei big data (fonte)

La mentalità data-centrica ha impatto sui modelli di business, sui processi decisionali e sulle normali interazioni sociali: in pratica, sta cambiando il modo in cui guardiamo al mondo e al futuro. Occorre esserne consapevoli, perché una rivoluzione di questa portata non può essere esente da attente riflessioni sulle sfide etiche e sociali che la accompagnano. Ridurle alla già annosa questione della privacy sarebbe ingenuo: con la prospettiva di un vero e proprio mercato dei dati personali, in cui ciascuno di noi potrebbe concedere in licenza i propri dati alle aziende, si pongono questioni del tutto pratiche sul controllo degli individui, il libero arbitrio, la prevedibilità del comportamento, la sostituzione del pensiero critico e del giudizio umano, la discriminazione algoritmica. Ognuno di questi aspetti andrebbe approfondito a dovere.
Dobbiamo controllare i big data per evitare di essere controllati, ma questo è solo il primo punto. Dobbiamo evitare di ridurre a una questione di dati qualunque problema che affligga la nostra vita come individui o la società nel suo complesso, pensando (come vuole la Silicon Valley) di poterli risolvere scaricando un’app che, per quanto possa ottimizzare le risorse a nostra disposizione nell’immediato, non metterà mai in discussione l’origine reale del problema, quasi sempre politica ed economica.
Su questo tema il testo di Morozov dà preziosi insegnamenti. Ne parlerò in futuro.

Commenti