La profilazione consentita dai Big Data danneggerà la democrazia? - Pensiero Critico

Cerca nel sito
Privacy Policy
Vai ai contenuti

Menu principale:

La profilazione consentita dai Big Data danneggerà la democrazia?

Teorie > Concetti > Ecosistema Mediatico
Puoi condividere questa pagina:
Il punto chiave

I Big Data danno accesso a una quantità enorme di dati sulla singola persona e sulle sue relazioni con il suo ambiente. I soggetti (commerciali, sociali e politici) che accedono a tali dati vengono messi in grado di correlarli e ricavarne previsioni sul comportamento o agire per indirizzarlo.

_

Una cultura sviluppata non si preoccupa soltanto di accumulare dati, ma ne ha anche cura: li analizza, li inserisce in un contesto, li interpreta. Oggi invece la velocità dell'informazione cancella e riscrive in un ciclo continuo. Non è un caso, purtroppo, che i due mestieri oggi a maggior rischio di estinzione siano i bibliotecari e i giornalisti. La storia rischia di essere ridotta a un perenne hic et nunc e noi potremmo finire imprigionati in un perenne 'adesso'.  (Luciano Floridi)

_

L'analisi e la valutazioni di dati sensibili sono sempre più affidate a soggetti non istituzionali con interessi commerciali della cui eticità è lecito dubitare. I Big Data sollevano quindi una serie di sfide epistemologiche che riguardano, ad esempio, i rapporti fiduciari tra le persone e l'etica della ricerca accademica di fronte alla possibilità che i dati vengano sfruttati commercialmente. I problemi etici sulle propensioni degli individui che dovessero emergere dalle correlazioni non sono ancora state oggetto di analisi politiche ma già fanno discutere i filosofi.

Un tempo su internet nessuno sapeva che ero un cane.
Adesso, a causa dei Big Data, tutti sanno che sono lo scarabocchio di un labrador quindicenne che ha una passione segreta per il cibo per gatti.
Quando il tuo supermercato sa che sei incinta prima che tu lo abbia detto a qualcuno
big data
Le abitudini di acquisto dei consumatori rivelano molto più di quanto si immagini se si fanno le giuste correlazioni. Il team statistico della catena di supermercati statunitense Target ha individuato una ventina di prodotti che, utilizzati come indicatori rappresentativi, consentivano all'azienda di calcolare un indicatore di "previsione della gravidanza" per ogni cliente che utilizzava la sua carta-fedeltà.
Le carte-fedeltà dei supermercati servono a profilare i clienti
Target
I supermercati che ci "regalano" una carta-fedeltà per avere diritto a sconti sui prodotti accedono a una quantità di dati su di noi che consentono di fare correlazioni di vario tipo e, se gli diamo anche il nostro indirizzo, hanno la possibilità di inviarci a casa volantini e buoni-sconto personalizzati. Se poi il supermercato fornisce anche carte di credito e carte telefoniche userà questi dati facendoli convergere sul nostro identificativo (Guest ID). Negli USA tale profilazione è già realtà, in Italia non siamo ancora a questo livello. Scrive Charles Duhigg nel libro "Il potere delle abitudini" (279):

"Con il codice identificativo abbiamo il vostro nome, indirizzo e modalità di pagamento, sappiamo che avete una Target Visa, una carta di debito, e possiamo collegare tutti i vostri acquisti al supermercato" dichiarò Pole [l'esperto statistico di Target] davanti a un pubblico di esperti in statistica commerciale in un congresso del 2010. L'azienda può ricollegare a una persona circa metà di tutte le vendite nel supermercato, quasi tutte le vendite online e circa un quarto della navigazione in rete. In quel congresso Pole mostrò una diapositiva che descriveva un esempio dei dati raccolti da Target. [quella mostrata in figura] Il problema di tutti questi dati, però, è che non hanno alcun significato senza l'interpretazione fornita dagli statistici: agli occhi di un profano, due clienti che acquistano entrambi lo stesso succo d'arancia potrebbero sembrare uguali. E' necessario un matematico per stabilire se uno è una donna di trentaquattro anni che acquista il succo per i figli (e quindi potrebbe gradire un buono per un DVD di Thomas la locomotiva a vapore) e l'altro è uno scapolo di ventotto anni che beve succo d'arancia dopo aver fatto jogging (e al quale pertanto potrebbero interessare gli sconti sulle scarpe da ginnastica). Pole e gli altri cinquanta membri del Guest Data and Analytical Service di Target erano in grado di individuare le abitudini nascoste nei dati.
Una società " numerizzata" dai Big Data

I Big Data si possono definire come un qualunque aggregato di dati, così grande e così complesso da rendere difficile il suo trattamento mediante le tradizionali applicazioni informatiche. L'informatico e docente al MIT Samuel Madden (ved. bibliografia) ha dato dei Big Data la seguente definizione: "Dati che sono troppo grandi, troppo rapidi, o troppo complessi per gli attuali strumenti di calcolo".   


Gli informatici Viktor Mayer-Schönberger e Kenneth Cukier, hanno analizzato vantaggi e svantaggi dei Big Data, nel libro "Big Data".

I vantaggi che essi accreditano ai Big Data sono soprattutto tre (p. 33):


  1. Quantità: possibilità di analizzare enormi quantitativi di dati su un certo argomento, anzichè doversi accontentare di insiemi ristretti (campioni statistici)

  2. Confusione: disponibilità ad accettare la confusione dei dati reali, anzichè privilegiarne l'esattezza

  3. Correlazioni: possibilità di effettuare correlazioni sull'intero set di dati, anzichè andare alla ricerca di causalità su campioni parziali

Riguardo al primo e al secondo punto un esempio applicativo noto è quello delle traduzioni online. Alla fine degli anni '80 l'approccio innovativo trovato dalla IBM prevedeva una traduzione automatica su base statistica, cioè che lasciava che il software di traduzione usasse il calcolo delle probabilità per scegliere quale parola o frase fosse la più adatta. La IBM aveva applicato il processo di traduzione a dieci anni di trascrizioni dei dibattiti parlamentari in francese e in inglese ma, dopo pochi anni, abbandonò l'impresa. Invece, nel 2006, Google si lanciò in un approccio completamente diverso (basato sui Big Data), che prevedeva l'uso di un dataset di frasi molto più vasto e confuso, cioè quello dell'intera Rete. Sfruttando il fatto che essa poteva accedere ai documenti presenti in Rete e alle traduzioni in varie lingue di tutti i documenti ufficiali, Google addestrò il proprio software su miliardi di pagine dalla qualità di traduzione disomogenea. Quest'approccio si rivelò vincente infatti, pur rinunciando all'esattezza delle traduzioni di qualità, sfruttava la numerosità delle frasi presenti in Rete per inferire la traduzione migliore. Infatti il traduttore Google online che tutti usiamo è il migliore, nonostante gli errori che talvolta esso produce.

Riguardo al terzo punto, cioè all'importanza delle correlazioni, un caso emblematico è quello delle catene di supermercati che attraverso gli acquisti dei consumatori, monitorati con le carte-fedeltà offerte ai clienti, hanno la possibilità di prevedere molti cambiamenti avvenuti nella famiglia del consumatore e "agire" preventivamente con l'offerta "mirata" di buoni sconto. Un caso che ha fatto scalpore è quello delle donne incinta, scrive Kenneth Cukier (p. 83):

Sapere se una cliente potrebbe essere incinta è importante per le catene distributive, perchè la gravidanza è un vero e proprio spartiacque nella vita delle coppie, in quanto segna un profondo cambiamento nelle loro abitudini di acquisto. Il team ha passato in rassegna gli acquisti effettuati dalle donne che si erano iscritte nel registro dei regali per i bambini piccoli. E ha osservato che quelle donne acquistavano grosse quantità di lozione senza profumo intorno al terzo mese di gravidanza, e che alcune settimane dopo tendevano ad acquistare integratori alimentari al magnesio, al sodio e allo zinco. Alla fine il team ha individuato una ventina di prodotti che, utilizzati come indicatori rappresentativi, consentivano all'azienda di calcolare un indicatore di "previsione della gravidanza" per ogni cliente che pagava con la carta di credito, usava una tessera-fedeltà o dei buoni sconto inviati per posta. Le correlazioni hanno consentito a Target di stimare con ragionevole attendibilità persino la data del parto, in modo da poter spedire alle clienti buoni-sconto su misura per ogni fase della gravidanza. Più "Target" di così...

Un altro caso di correlazioni utili commercialmente è stato quello della catena Walmart (ved. bibliografia) che scoprì una correlazione tra previsioni atmosferiche e consumo di merendine infatti, passando al setaccio le transazioni pregresse dei suoi clienti, scoprì che in previsione di un uragano aumentavano le vendite di torce elettriche e di merendine. Tutti prodotti che venivano posti all'ingresso dei punti vendita quando le previsioni atmosferiche segnalavano tempeste e uragani in arrivo. Il libro di Viktor Mayer-Schönberger e Kenneth Cukier riporta molti altri esempi "americani" dell'applicazione dei big data a casi concreti di interesse pubblico.


Tra gli svantaggi dei Big Data citati da Viktor Mayer-Schönberger e Kenneth Cukier figurano tre fattori:

  1. Privacy: Internet ha reso più facile la rilevazione dei dati personali sia a coloro che già la effettuavano (le agenzie governative di intelligence), sia a coloro che hanno potuto ampliare enormente la loro azione di profilazione commerciale dei consumatori (private enterprises).

  2. Propensione: i Big Data offrono la possibilità di usare le previsioni sulla singola persona per giudicarla e punirla prima che agisca; se questa possibilità verrà usata vi saranno gravi rischi per la democrazia. Come scrivono gli autori (p.213): "La scena di apertura del film "Minority Report" ritrae una società in cui le previsioni sono così accurate da consentire alla polizia di arrestare gli individui prima che commettano i delitti. Le persone vengono incarcerate non per quello che hanno fatto ma per quello che stanno per fare, anche se non hanno commesso alcun delitto."

  3. Valutazione degli Algoritmi: data l'enorme quantità di dati disponibile su ogni aspetto della realtà sociale e individuale, il problema si sposta sulla progettazione di algoritmi che estraggano da quei dati previsioni, tendenze, propensioni, ecc. La valutazione degli scopi degli algoritmi diventerà cruciale per determinarne la liceità. Scrivono gli autori (p.205): "Nonostante la sua bravura nella raccolta e nella conservazione delle informazioni, c'erano molte cose che la Stasi non era in grado di fare. Non poteva seguire costantemente gli spostamenti di tutti e non poteva sapere, se non attraverso grandissimi sforzi, con chi parlavano. Ma oggi, la maggior parte di queste informazioni viene raccolta dagli operatori di telefonia mobile. Il governo della DDR non era in grado di sapere quanti cittadini sarebbero diventati dissidenti, ma le forze di polizia stanno cominciando a impiegare modelli algoritmici per stabilire dove e quando effettuare dei pattugliamenti, il che ci dà un'idea dei prossimi sviluppi."
Il DNA di Steve Jobs
Big Data
I Big Data che non salvarono la vita a Steve Jobs
Com'è noto, il fondatore della Apple, Steve Jobs è morto di un tumore al pancreas ma, in virtù della sua ricchezza, cercò di sfruttare i Big Data applicati al suo corpo (l'intero DNA) per scegliere le terapie più efficaci.
Scrivono Viktor Mayer-Schönberger e Kenneth Cukier nel libro "Big Data" (p.42):

Nella sua lotta personale contro il cancro, il leggendario CEO di Apple Steve Jobs ha adottato un approccio del tutto diverso. E' stato uno dei primi al mondo a far sequenziare per intero il proprio DNA e quello del suo tumore. A tale scopo, ha pagato una cifra a sei zeri - parecchie centinaia di volte il prezzo richiesto da 23andMe. In cambio non ha ricevuto un campione, una serie di marker, ma un file con i codici genetici nella loro interezza. Nella scelta del trattamento da somministrare a un paziente oncologico, i medici devono sperare che il suo DNA sia abbastanza simile a quello dei pazienti che hanno partecipato alla sperimentazione del farmaco. Ma i medici che curavano Steve Jobs hanno potuto selezionare le terapie in base all'efficacia che avrebbero avuto per la composizione specifica del suo codice genetico. Tutte le volte che una cura perdeva di efficacia perchè il tumore si modificava e riusciva a eluderla, potevano impiegare un altro farmaco - saltando, come diceva lui, "da una ninfea all'altra". "Sarò uno dei primi a sconfiggere un tumore di questo tipo, o uno degli ultimi a morirne", amava ripetere. Purtroppo la sua predizione non si è avverata...
Una tassonomia dei Big Data

Nel definire i "Big Data" il ricercatore Bob Hayes cita una ricerca effettuata dall'Università di Berkeley che ha chiesto a un grande numero di aziende (operanti in campi disparati) la loro definizione del termine ricevendone circa 40 diverse.

Bob Hayes ha suddiviso e organizzato queste definizioni in sei categorie (indicando tra parentesi il numero delle occorrenze):


  1. Caratteristiche dei Dati: Big Data riguarda le tradizionali 3V (volume, velocità, varietà) di dati (n= 19) e le risorse di calcolo non routinarie necessarie per elaborare tali dati (n= 11). Big Data sono "dati che contengono sufficienti osservazioni da richiedere un trattamento particolare a causa della loro grandezza."

  2. Intuizioni (Insights): Big Data riguarda le intuizioni/risultati/valore (N = 17) che otteniamo dai dati e le persone necessarie per estrarle (n = 3). Big Data "ci incantano con la promessa di nuove intuizioni."

  3. Analisi (Analytics): Big Data riguarda l'analisi e i metodi di modellazione (n = 12) e la loro applicazione nel migliorare il processo decisionale (n = 4). Big Data ci dà l'opportunità "di acquisire una maggiore comprensione delle relazioni tra i diversi fattori e di scoprire delle strutture relazionali precedentemente non rilevati nei dati."

  4. Integrazione Dati: Big Data riguarda l'integrazione di diverse disparate fonti di dati e sfruttarne la loro potenza combinata (n = 6). Quel che c'è di grande nei Big Data è "il gran numero di fonti di dati cui è possibile accedere, come sensori digitali e rilevatori comportamentali in tutto il mondo."

  5. Visualizzazione e Narrazione: Big Data riguarda l'essere in grado di raccontare una storia (n = 1) attraverso la visualizzazione (n = 2). Big Data è "storytelling - sia che si tratti di farlo attraverso una informazione grafica o altri ausilii visivi che spiegano il tema in un modo comprensibile a persone di tutti i settori."

  6. Etica: Big Data è essere consapevoli di come usiamo le enormi quantità di dati che abbiamo oggi a disposizione (n = 1). Big Data è in grado di fornirci "infinite possibilità per tutta la vita."

L'uso politico dei Big Data

Le elezioni USA del 2012 vengono accreditate (ved. bibliografia Wadhwa) come le prime in cui i Big Data sono stati usati per prevedere le intenzioni di voto degli elettori. Come mostrato nell'immagine a fianco, le intenzioni possono essere inferite dalle banali preferenze personali degli elettori (perfino dalla bevanda preferita). Le tecniche di micro-targeting, un tempo impossibili da attuare, oggi consentono di profilare gli elettori in base alle intenzioni di voto rivelate dai loro consumi personali, e di inviare loro messaggi personalizzati online, come mostrato nella seguente slide dell'intero processo. I dati online e offline del singolo elettore convergono in un motore centrale (CampaignGrid) che "decide" quale tipo di messaggio elettorale inviargli.

Big Data Elections

I ricercatori informatici A.Oboler, C.Welsh e L.Cruz hanno fatto un'analisi dei Big Data alla luce delle trasformazioni sociali che essi comportano, evidenziando i rischi di aggregazioni e correlazioni. Il filosofo Luciano Floridi (ved. bibliografia) mette in guardia sull'eticità dei soggetti che governano i dati e le correlazioni su di essi, parafrasando Orwell e il suo 1984: "Chi controlla le domande dà forma alle risposte e chi controlla le risposte dà forma alla realtà".

E infatti i media proponevano che le elezioni USA sarebbero state vinte dal candidato che avrebbe saputo usare meglio Big Data e Social Media. Ma sono stati smentiti.

Elezioni USA 2012: preferenze di voto in funzione di ciò che si beve
Data-mining
Big Data
They want to make us change our habits.
With you I see it hard.
Bibliografia (chi fa delle buone letture è meno manipolabile)


Libri consigliati a chi vuole capire in che modo le aziende usano i Big Data
 
Duhigg
Mayer-Schonberger - Cukier
Commenti
Se ritenete che le tesi del "punto chiave" non vengano sufficientemente supportate dagli argomenti presenti in questa pagina potete esprimere il vostro parere (motivandolo).
Inviate una email con il FORM. Riceverete una risposta. Grazie della collaborazione.
Cosa si può fare per diventare "pensatori critici"
E' stato ampiamente dimostrato negli ultimi 30-40 anni da parecchi psicologi tra i quali Amos Tversky, Daniel Kahneman, Gerd Gigerenzer e altri, che l'essere umano crede di essere razionale ma non lo è. Quando un individuo si trova a prendere decisioni in condizioni di incertezza il più delle volte usa un "pensiero intuitivo" facendo ricorso alle euristiche, cioè a scorciatoie mentali maturate nel corso dell'evoluzione. Nella maggior parte delle situazioni della vita quotidiana le decisioni euristiche si rivelano giuste ma in situazioni più complesse, apparse solo con la modernità, le euristiche portano a distorsioni del giudizio (bias) che danno luogo a decisioni errate.
Secondo Daniel Kahneman (pp.464-465 di Pensieri lenti e veloci - Mondadori) il nostro pensiero intuitivo non è facilmente educabile e ostacola il riconoscimento dei segnali ambientali che in certi casi renderebbero necessario il passaggio a un pensiero razionale e critico. Un osservatore esterno è sempre meno coinvolto emotivamente di colui che prende decisioni e compie azioni. Occorre quindi impegnarsi a costruire una "società critica", nella quale ci siano "osservatori critici" che sappiano avvertirci dei pericoli insiti in certe situazioni decisionali. Questo è un compito primario delle Istituzioni che devono investire in programmi di formazione al "pensiero critico" degli educatori scolastici. A livello individuale, ecco alcune attività perseguibili:

  1. Atteggiamento critico: sforzarsi di assumere un atteggiamento critico contrastando la tendenza umana innata di saltare subito alle conclusioni e prendere decisioni impulsive. Per approfondire andare alla pagina: Atteggiamento critico 
  2. Lettura: diversi studi confermano che l'attività di lettura migliora l'attività del cervello contrastando i deficit cognitivi e l'invecchiamento cerebrale. Per approfondire andare alla pagina: Lettura e Cervello. Inoltre, il  miglioramento cerebrale viene potenziato dalla lettura critica dei testi (non narrativi). 
  3. Apprendimento linguistico: recenti studi hanno confermato che imparare lingue diverse dalla propria (anche in età avanzata) migliora il rendimento cerebrale. Per approfondire andare alla pagina: Bilinguismo e incremento cognitivo

_________________________________________________________________________________________________________________________________________________________________________________________________________________________

Pagina aggiornata il 24 novembre 2016

 
copyright 2012-2016 Licenza Creative Commons
I contenuti di pensierocritico.eu sono distribuiti con Licenza Creative Commons Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 Italia.
Protected by Copyscape Web Plagiarism Check
Copyright 2015. All rights reserved.
Torna ai contenuti | Torna al menu