I BIG DATA COME MISURA DEL MONDO (PARTE 1)
Tutto ebbe inizio dai big data.
Forse un giorno queste parole saranno davvero l'incipit di una fiaba postumana. Forse diventeremo gli involontari protagonisti di un romanzo di Simak.
Ma per ora fermiamoci alla realtà, agli anni dell’avvento dell’IA che stiamo vivendo proprio adesso, punto d’arrivo di una rivoluzione iniziata una quindicina di anni fa che oggi impatta sulla nostra vita più di quanto molti di noi non sappiano.
Nel quarto di secolo che ci stiamo lasciando alle spalle la potenza dell'algoritmo è esplosa. Nel prossimo ne raccoglieremo i frutti, dolci o amari che siano. Con questo post, primo di due, ho voluto rispolverare gli aspetti cruciali della questione e invitarvi a un percorso di lettura. Perché già viviamo in un’economia dell’informazione e il petrolio di questa economia sono i dati.
Il mio consiglio è iniziare con Big Data. Una rivoluzione che trasformerà il nostro modo di vivere. Perché lo hanno fatto, altroché se lo hanno fatto. Il testo risale al 2013 e alcuni degli esempi che riporta sono stati nel frattempo superati, ma i concetti sono ancora validi e costituiscono i fondamenti del nostro presente e la direzione in cui il nostro futuro si sta plasmando. Di recente l’ho riaperto e ho ritrovato le mie sottolineature (sì, sono uno di quelli che sottolinea i saggi che legge, però rigorosamente a matita), che mi hanno ispirato l'articolo. Per proseguire, poi, ideale a mio parere è il testo del sociologo Evgenij Morozov, Silicon Valley. I signori del silicio, che affronta invece le conseguenze sociali del “credo” dei dati.
Per gran parte della storia, l'analisi dei dati si è basata sul campionamento casuale, un metodo limitato ma l’unico possibile considerando le difficoltà di raccogliere, organizzare ed elaborare set molto grandi di dati. Con la sempre maggior efficienza della tecnologia digitale, la raccolta di dati a campione è stata surclassata dall’elaborazione di set di dati enormemente più ampi, definiti “completi”, in grado di fornire un livello di dettaglio tale da rilevare connessioni altrimenti impossibili.
È stato così, ad esempio, per l’analisi dell'intero genoma di Steve Jobs, che ha evidenziato nuovi marcatori del cancro; quella dei registri delle chiamate da mobile, con cui si sono mappate le interazioni sociali di una popolazione; e quella di undici anni di partite di sumo, da cui sono stati scoperti schemi di partite truccate.
Amazon.it |
I set completi di dati permettono un più alto margine di errore nella singola misurazione. In passato, quando il campione era limitato, l'accuratezza di ogni informazione era determinante per l’affidabilità dei risultati. Nel mondo digitale, invece, il concetto stesso di “tutti i dati disponibili” implica il disordine, per via della moltitudine di fonti e di tipi diversi di informazione. I big data ci insegnano che l'imprecisione non solo è accettabile, ma paradossalmente conduce a una maggior comprensione a livello macro.
Un esempio sono le applicazioni di traduzione come Google Translate: il loro sistema sfrutta un corpus disordinato di miliardi e miliardi di parole diverse, non correlate, in lingue diverse, per ottenere un altissimo livello di accuratezza e ricchezza (quelle che percepiamo come intuizioni o sfumature quando gli affidiamo una traduzione). Ciò non sarebbe possibile utilizzando set di dati inferiori, più selezionati e “puliti”.
Anche i tag di Instagram, Youtube e di altri social network, che nel loro infinito numero di combinazioni classificano i contenuti online, permettono l’accesso a dati non strutturati altrimenti inaccessibili (di fatto il 95% dei dati digitali, come pagine web e video) e l’analisi dei sottogruppi di interesse.
Vari modelli di rappresentazione grafica della correlazione dei dati (fonte) |
In una visione improntata alla correlazione, ampi set di dati disordinati e flessibili si adattano molto meglio ai cambiamenti del mondo reale. Forse perché in fin dei conti ne sono lo specchio.
Il passaggio dalla causalità alla correlazione è l’altro grande cambiamento introdotto dai big data: il ragionamento umano, fatto di teorie, ipotesi e potenziali vizi di forma, è stato superato. I big data sacrificano il “perché” in nome del “cosa”, liberando gli analisti dai vincoli delle ipotesi preesistenti, identificando correlazioni inaspettate e ottenendo risultati meno distorti.
La potenza della correlazione è davanti ai nostri occhi oggi più di ieri: analizzando le associazioni tra i prodotti e l’attività degli utenti, Amazon suggerisce gli articoli che possiamo apprezzare (e che spesso apprezziamo davvero) senza svelarcene le ragioni. Questa applicazione ha generato un aumento spropositato di vendite nell’intero mondo dell’e-commerce. Nessun’analisi umana avrebbe potuto dare risultati paragonabili, ed è la dimostrazione tangibile che conoscere “cosa”, tramite una fotografia dettagliata del presente, funziona anche senza conoscere il “perché”.
Le prime applicazioni di questi concetti, sebbene ormai un po’ datate, sono state Google Flu Trends (strumento che sfrutta miliardi di query di ricerca su internet per prevedere la diffusione dell'influenza in tempo reale) e Farecast (che analizza enormi quantità di dati sui prezzi dei biglietti aerei per prevedere le fluttuazioni future).
Ma gli esempi sono innumerevoli: la catena di negozi americana Walmart, analizzando lo storico delle transazioni, ha correlato le abitudini di acquisto con i periodi degli uragani. Ha quindi posizionato i prodotti in modo strategico e aumentato le vendite. Un'altra catena, Target, utilizza i dati degli acquisti per prevedere le gravidanze dei clienti, inviando poi coupon mirati. UPS sfrutta l'analisi di schemi e segnali precursori per prevenire guasti costosi alla sua flotta di veicoli. Nel settore sanitario, i big data possono aiutare la diagnosi precoce e il trattamento delle malattie.
Nel prossimo post mi soffermerò sulle implicazioni della datafication, cioè trasformare in dati potenzialmente qualsiasi aspetto della nostra vita.
Percorsi di lettura
Ti è piaciuto? Condividi!
Potrebbero interessarti anche:
Commenti
Posta un commento