
Adesso, a causa dei Big Data, tutti sanno che sono lo scarabocchio di un labrador quindicenne che ha una passione segreta per il cibo per gatti.
I Big Data danno accesso a una quantità enorme di dati sulla singola persona e sulle sue relazioni con il suo ambiente. I soggetti (commerciali, sociali e politici) che accedono a tali dati vengono messi in grado di correlarli e ricavarne previsioni sul comportamento o agire per indirizzarlo.
_
_
L'analisi e la valutazioni di dati sensibili sono sempre più affidate a soggetti non istituzionali con interessi commerciali della cui eticità è lecito dubitare. I Big Data sollevano quindi una serie di sfide epistemologiche che riguardano, ad esempio, i rapporti fiduciari tra le persone e l'etica della ricerca accademica di fronte alla possibilità che i dati vengano sfruttati commercialmente. I problemi etici sulle propensioni degli individui che dovessero emergere dalle correlazioni non sono ancora state oggetto di analisi politiche ma già fanno discutere i filosofi.
I Big Data si possono definire come un qualunque aggregato di dati, così grande e così complesso da rendere difficile il suo trattamento mediante le tradizionali applicazioni informatiche. L'informatico e docente al MIT Samuel Madden (ved. bibliografia) ha dato dei Big Data la seguente definizione: "Dati che sono troppo grandi, troppo rapidi, o troppo complessi per gli attuali strumenti di calcolo".
Gli informatici Viktor Mayer-Schönberger e Kenneth Cukier, hanno analizzato vantaggi e svantaggi dei Big Data, nel libro "Big Data".
I vantaggi che essi accreditano ai Big Data sono soprattutto tre (p. 33):
- Quantità: possibilità di analizzare enormi quantitativi di dati su un certo argomento, anzichè doversi accontentare di insiemi ristretti (campioni statistici)
- Confusione: disponibilità ad accettare la confusione dei dati reali, anzichè privilegiarne l'esattezza
- Correlazioni: possibilità di effettuare correlazioni sull'intero set di dati, anzichè andare alla ricerca di causalità su campioni parziali
Un altro caso di correlazioni utili commercialmente è stato quello della catena Walmart (ved. bibliografia) che scoprì una correlazione tra previsioni atmosferiche e consumo di merendine infatti, passando al setaccio le transazioni pregresse dei suoi clienti, scoprì che in previsione di un uragano aumentavano le vendite di torce elettriche e di merendine. Tutti prodotti che venivano posti all'ingresso dei punti vendita quando le previsioni atmosferiche segnalavano tempeste e uragani in arrivo. Il libro di Viktor Mayer-Schönberger e Kenneth Cukier riporta molti altri esempi "americani" dell'applicazione dei big data a casi concreti di interesse pubblico.Sapere se una cliente potrebbe essere incinta è importante per le catene distributive, perchè la gravidanza è un vero e proprio spartiacque nella vita delle coppie, in quanto segna un profondo cambiamento nelle loro abitudini di acquisto. Il team ha passato in rassegna gli acquisti effettuati dalle donne che si erano iscritte nel registro dei regali per i bambini piccoli. E ha osservato che quelle donne acquistavano grosse quantità di lozione senza profumo intorno al terzo mese di gravidanza, e che alcune settimane dopo tendevano ad acquistare integratori alimentari al magnesio, al sodio e allo zinco. Alla fine il team ha individuato una ventina di prodotti che, utilizzati come indicatori rappresentativi, consentivano all'azienda di calcolare un indicatore di "previsione della gravidanza" per ogni cliente che pagava con la carta di credito, usava una tessera-fedeltà o dei buoni sconto inviati per posta. Le correlazioni hanno consentito a Target di stimare con ragionevole attendibilità persino la data del parto, in modo da poter spedire alle clienti buoni-sconto su misura per ogni fase della gravidanza. Più "Target" di così...
- Privacy: Internet ha reso più facile la rilevazione dei dati personali sia a coloro che già la effettuavano (le agenzie governative di intelligence), sia a coloro che hanno potuto ampliare enormente la loro azione di profilazione commerciale dei consumatori (private enterprises).
- Propensione: i Big Data offrono la possibilità di usare le previsioni sulla singola persona per giudicarla e punirla prima che agisca; se questa possibilità verrà usata vi saranno gravi rischi per la democrazia. Come scrivono gli autori (p.213): "La scena di apertura del film "Minority Report" ritrae una società in cui le previsioni sono così accurate da consentire alla polizia di arrestare gli individui prima che commettano i delitti. Le persone vengono incarcerate non per quello che hanno fatto ma per quello che stanno per fare, anche se non hanno commesso alcun delitto."
- Valutazione degli Algoritmi: data l'enorme quantità di dati disponibile su ogni aspetto della realtà sociale e individuale, il problema si sposta sulla progettazione di algoritmi che estraggano da quei dati previsioni, tendenze, propensioni, ecc. La valutazione degli scopi degli algoritmi diventerà cruciale per determinarne la liceità. Scrivono gli autori (p.205): "Nonostante la sua bravura nella raccolta e nella conservazione delle informazioni, c'erano molte cose che la Stasi non era in grado di fare. Non poteva seguire costantemente gli spostamenti di tutti e non poteva sapere, se non attraverso grandissimi sforzi, con chi parlavano. Ma oggi, la maggior parte di queste informazioni viene raccolta dagli operatori di telefonia mobile. Il governo della DDR non era in grado di sapere quanti cittadini sarebbero diventati dissidenti, ma le forze di polizia stanno cominciando a impiegare modelli algoritmici per stabilire dove e quando effettuare dei pattugliamenti, il che ci dà un'idea dei prossimi sviluppi."

"Con il codice identificativo abbiamo il vostro nome, indirizzo e modalità di pagamento, sappiamo che avete una Target Visa, una carta di debito, e possiamo collegare tutti i vostri acquisti al supermercato" dichiarò Pole [l'esperto statistico di Target] davanti a un pubblico di esperti in statistica commerciale in un congresso del 2010. L'azienda può ricollegare a una persona circa metà di tutte le vendite nel supermercato, quasi tutte le vendite online e circa un quarto della navigazione in rete. In quel congresso Pole mostrò una diapositiva che descriveva un esempio dei dati raccolti da Target. [quella mostrata in figura] Il problema di tutti questi dati, però, è che non hanno alcun significato senza l'interpretazione fornita dagli statistici: agli occhi di un profano, due clienti che acquistano entrambi lo stesso succo d'arancia potrebbero sembrare uguali. E' necessario un matematico per stabilire se uno è una donna di trentaquattro anni che acquista il succo per i figli (e quindi potrebbe gradire un buono per un DVD di Thomas la locomotiva a vapore) e l'altro è uno scapolo di ventotto anni che beve succo d'arancia dopo aver fatto jogging (e al quale pertanto potrebbero interessare gli sconti sulle scarpe da ginnastica). Pole e gli altri cinquanta membri del Guest Data and Analytical Service di Target erano in grado di individuare le abitudini nascoste nei dati.
Nella sua lotta personale contro il cancro, il leggendario CEO di Apple Steve Jobs ha adottato un approccio del tutto diverso. E' stato uno dei primi al mondo a far sequenziare per intero il proprio DNA e quello del suo tumore. A tale scopo, ha pagato una cifra a sei zeri - parecchie centinaia di volte il prezzo richiesto da 23andMe. In cambio non ha ricevuto un campione, una serie di marker, ma un file con i codici genetici nella loro interezza. Nella scelta del trattamento da somministrare a un paziente oncologico, i medici devono sperare che il suo DNA sia abbastanza simile a quello dei pazienti che hanno partecipato alla sperimentazione del farmaco. Ma i medici che curavano Steve Jobs hanno potuto selezionare le terapie in base all'efficacia che avrebbero avuto per la composizione specifica del suo codice genetico. Tutte le volte che una cura perdeva di efficacia perchè il tumore si modificava e riusciva a eluderla, potevano impiegare un altro farmaco - saltando, come diceva lui, "da una ninfea all'altra". "Sarò uno dei primi a sconfiggere un tumore di questo tipo, o uno degli ultimi a morirne", amava ripetere. Purtroppo la sua predizione non si è avverata...
Nel definire i "Big Data" il ricercatore Bob Hayes cita una ricerca effettuata dall'Università di Berkeley che ha chiesto a un grande numero di aziende (operanti in campi disparati) la loro definizione del termine ricevendone circa 40 diverse.
Bob Hayes ha suddiviso e organizzato queste definizioni in sei categorie (indicando tra parentesi il numero delle occorrenze):
- Caratteristiche dei Dati: Big Data riguarda le tradizionali 3V (volume, velocità, varietà) di dati (n= 19) e le risorse di calcolo non routinarie necessarie per elaborare tali dati (n= 11). Big Data sono "dati che contengono sufficienti osservazioni da richiedere un trattamento particolare a causa della loro grandezza."
- Intuizioni (Insights): Big Data riguarda le intuizioni/risultati/valore (N = 17) che otteniamo dai dati e le persone necessarie per estrarle (n = 3). Big Data "ci incantano con la promessa di nuove intuizioni."
- Analisi (Analytics): Big Data riguarda l'analisi e i metodi di modellazione (n = 12) e la loro applicazione nel migliorare il processo decisionale (n = 4). Big Data ci dà l'opportunità "di acquisire una maggiore comprensione delle relazioni tra i diversi fattori e di scoprire delle strutture relazionali precedentemente non rilevati nei dati."
- Integrazione Dati: Big Data riguarda l'integrazione di diverse disparate fonti di dati e sfruttarne la loro potenza combinata (n = 6). Quel che c'è di grande nei Big Data è "il gran numero di fonti di dati cui è possibile accedere, come sensori digitali e rilevatori comportamentali in tutto il mondo."
- Visualizzazione e Narrazione: Big Data riguarda l'essere in grado di raccontare una storia (n = 1) attraverso la visualizzazione (n = 2). Big Data è "storytelling - sia che si tratti di farlo attraverso una informazione grafica o altri ausilii visivi che spiegano il tema in un modo comprensibile a persone di tutti i settori."
- Etica: Big Data è essere consapevoli di come usiamo le enormi quantità di dati che abbiamo oggi a disposizione (n = 1). Big Data è in grado di fornirci "infinite possibilità per tutta la vita."

That's why you do not find anything.

Le elezioni USA del 2012 vengono accreditate (ved. bibliografia Wadhwa) come le prime in cui i Big Data sono stati usati per prevedere le intenzioni di voto degli elettori. Come mostrato nell'immagine a fianco, le intenzioni possono essere inferite dalle banali preferenze personali degli elettori (perfino dalla bevanda preferita). Le tecniche di micro-targeting, un tempo impossibili da attuare, oggi consentono di profilare gli elettori in base alle intenzioni di voto rivelate dai loro consumi personali, e di inviare loro messaggi personalizzati online, come mostrato nella seguente slide dell'intero processo. I dati online e offline del singolo elettore convergono in un motore centrale (CampaignGrid) che "decide" quale tipo di messaggio elettorale inviargli.

I ricercatori informatici A.Oboler, C.Welsh e L.Cruz hanno fatto un'analisi dei Big Data alla luce delle trasformazioni sociali che essi comportano, evidenziando i rischi di aggregazioni e correlazioni. Il filosofo Luciano Floridi (ved. bibliografia) mette in guardia sull'eticità dei soggetti che governano i dati e le correlazioni su di essi, parafrasando Orwell e il suo 1984: "Chi controlla le domande dà forma alle risposte e chi controlla le risposte dà forma alla realtà".
Alexander Nix è il CEO di Cambridge Analytica, una società che effettua analisi su grandi masse di Big Data e che è stata ingaggiata da Donald Trump alle ultime elezioni USA (vedi bibliografia Grasseger). La società di Nix ha utilizzato un modello già noto in psicometria (denominato "Big Five") per valutare la personalità degli individui sulla base di cinque dimensioni:
- Apertura (Opennes): quanto siete aperti a nuove esperienze?
- Coscienziosità (Conscientiousness): quanto siete perfezionisti?
- Estroversione (Extroversion): quanto siete socievoli?
- Gradevolezza (Agreableness): quanto siete premurosi e cooperativi?
- Nevrosi (Neuroticism): quanto facilmente venite turbati?
Sulla base di queste dimensioni, note anche come modello OCEAN, acronimo di apertura, coscienziosità, estroversione, gradevolezza, nevrosi, si è in grado di effettuare una valutazione piuttosto precisa del tipo di persona di fronte a noi. Ciò che ha permesso di mettere in atto su grande scala tale modello è stato l'avvento di Internet e, in particolare, di Facebook. Infatti nel 2012 il ricercatore Michal Kosinski dell'Università di Cambridge ha svolto una ricerca sperimentale sui "like" di Facebook, dimostrando che sono sufficienti 68 "like" da parte di un utente per individuare il suo colore della pelle (con il 95% di precisione), il suo orientamento sessuale (88% di precisione), il suo orientamento politico democratico o repubblicano (85% di precisione), più altre caratteristiche quali appartenenza religiosa, dipendenza da droghe, ecc. La scoperta di Kosinski venne sfruttata, a partire dal 2014, da Cambridge Analytica per offrire servizi ai propri clienti, tra i quali Nigel Farage per sostenere la campagna online "Leave-EU". Nel giugno 2016 Alexander Nix dichiarò di essere stato ingaggiato da Donald Trump per la sua campagna elettorale e di aver costruito i profili di personalità degli elettori americani acquistando i dati (tutti i dati personali sono in vendita sul mercato!) da varie fonti quali: catasti, registri automobilistici, iscrizioni a club, ecc. Nix si è vantato di aver profilato la personalità di ogni adulto negli USA: 220 milioni di cittadini. In che modo sono stati utilizzati i dati per produrre risultati tangibili a favore di Donald Trump? In due modi:
- Agire sugli elettori democratici scontenti in modo da convincerli a non andare a votare (ad esempio inviando dei messaggi pubblicitari agli elettori afro-americani in cui si mostravano delle dichiarazioni di Hillary Clinton che in passato aveva definito gli uomini neri "predatori")
- Individuare, nei collegi elettorali più a rischio, quegli elettori repubblicani su cui indirizzare gli sforzi persuasivi
Alexander Nix ha affermato che sta costruendo un database di profili personali per tutto il mondo e che ha già ricevuto richieste specifiche da Germania, Svizzera e Australia.
Iscriviti alla Newsletter di pensierocritico.eu per ricevere in anteprima nuovi contenuti e aggiornamenti:
Sam Madden (2012), From Databases to Big Data (PDF) [225 citazioni]
Viktor Mayer-Schönberger, Kenneth Cukier (2014), Big data - a revolution that will transform how we live work and think (PDF)
Bob Hayes (2014), Six Ways to Define Big Data
- Sean P. Gorman (2013), The Danger of a Big Data Episteme and the Need to Evolve GIS (PDF) [7 citazioni]
- David W. Nickerson, Todd Rogers (2014), Political Campaigns and Big Data (PDF) [28 citazioni]
- Andre Oboler, Cristopher Welsh, Lito Cruz (2012), The danger of Big Data: Social media as computational social science (PDF) - First Monday
- Kashmir Hill (2012), How Target Figured Out A Teen Girl Was Pregnant Before Her Father Did - Forbes
- Constance L. Hays (2004), What Wal-Mart Knows About Customers' Habits
- Luciano Floridi (2012), Big Data and Their Epistemological Challenge (PDF) [44 citazioni]
- Brent Daniel Mittelstadt, Luciano Floridi (2015), The Ethics of Big Data: Current and Foreseeable Issues in Biomedical Contexts (PDF) [6 citazioni]
- Andrea Milluzzi (2016), Big Data, Luciano Floridi: «Ecco perché è l'affare del terzo millennio»
- (2013), Election 2016: Marriage of Big Data, Social Data Will Determine the Next President - Wired
- Tarun Wadhwa (2012), Coke Or Pepsi? Politicians Say Choices Like These Reveal How You Vote - Wired
- Lois Beckett (2012), How Companies Have Assembled Political Profiles for Millions of Internet Users - Propublica
- Deeksha Joshi, Vishal Kumar (2015), The Big Analytics (PDF) - Una ricca collezione di articoli di vari esperti
- David Tuffley, Bela Stantic (2016), Can big data studies know your thoughts and predict who will win an election?
- Aaron Timms (2016), Is Donald Trump's Surprise Win a Failure of Big Data? Not Really - Fortune
- Zeynep Tufekci (2014), Engineering the public: Big Data, surveillance and computational politics - First Monday
- Hannes Grassenger, Mikael Krogerus (2017), The data that turned the world upside down - Motherbord
- Paul Wood (2016), The British data-crunchers who say they helped Donald Trump to win - The Spectator
- Brynna Leslie (2017), Trump knows you better than you know yourself - OttawaCommunityNews.com
- Bruno Saetta (2017), Big Data - Protezione dati personali
- Emanuele Menietti (2018), Il caso Cambridge Analytica, spiegato bene - Il Post
Profilazione utenti
Sovraccarico informativo
Manipolazioni statistiche
Ignoranza indotta
Pagina aggiornata il 3 settembre 2022