Perchè le nostre ricerche online sono fallaci e distorte? Perchè ci sono i bias! - Pensiero Critico

Brain
brain
europa
critic
Coloro cui sfugge completamente l'idea che
è possibile aver torto non possono imparare nulla,
tranne la tecnica. (Gregory Bateson)
Vai ai contenuti

Perchè le nostre ricerche online sono fallaci e distorte? Perchè ci sono i bias!

Teorie > Metodi > Intelligenza Artificiale
Puoi condividere questa pagina:
Il punto chiave
Noi abbiamo dimostrato che le persone cercano di confermare le loro convinzioni con le loro ricerche e che i motori di ricerca forniscono risultati di ricerca distorti, irrispettosi della verità. (Ryen White)
_
Tutti noi tendiamo a cercare prove ed evidenze a sostegno delle nostre idee e a rigettare quelle contrarie ad esse. (Raymond Nickerson)
_

Ogni tentativo di essere imparziali potrebbe essere distorto dalla nostra cultura e dai nostri pregiudizi cognitivi, il primo passo deve quindi essere la consapevolezza dei pregiudizi (bias). Solo se  i webdesigner e gli sviluppatori conoscono l'esistenza dei bias possono contrastarli e, se possibile, correggerli. Altrimenti, il nostro futuro potrebbe essere un mondo fittizio basato su di percezioni distorte da cui nemmeno diversità, novità o serendipità potranno salvarci. (Ricardo Baeza-Yates)
google
Distorsioni del giudizio (Bias) nelle ricerche online

Talvolta ci chiediamo perchè facciamo così fatica a ottenere rapidamente delle buone risposte dalle nostre ricerche online. La risposta degli esperti (vedi bibliografia White) è che non teniamo conto dei pregiudizi che albergano nella nostra mente e di quelli che gli algoritmi dei motori di ricerca portano dentro di se.
L'attenzione al proprio processo di ricerca online si rivela indispensabile se si vogliono evitare gli errori che la maggior parte delle persone fa durante le ricerche online. Ad esempio il ricercatore Ryen White, in uno studio sperimentale condotto su impiegati Microsoft, ha evidenziato la forza irresistibile di biases quali il Pregiudizio di conferma (Confirmation Bias). Ryen White ha notato che le keywords che le persone inseriscono nelle domande sono influenzate dai pregiudizi posseduti o dalle emozioni vissute (in particolare l'ansia), e vanno a creare dei "frame", cioè dei contesti che indirizzano la ricerca semantica verso risultati errati.

Esistono due tipi di pregiudizi che vanno a inficiare i risultati: pregiudizi di ricerca che sono presenti nella mente di colui che effettua la ricerca, e pregiudizi di sistema che sono presenti negli algoritmi del motore e sono stati creati da un apprendimento del motore distorto o incompleto (machine learning).
Se si vuole fare una ricerca che dia dei risultati utili a raggiungere lo scopo desiderato occorre:

1-Umiltà, cioè essere consapevoli (almeno in parte) dei propri pregiudizi e sforzarsi di contrastarli

2-Conoscenza del contesto, cioè scegliere le keyword da inserire nella query, chiedendosi se rappresentano il contesto culturale che si vuole esplorare

3-Mente aperta, cioè valutare i risultati della SERP non guardando troppo all'ordinamento dei risultati (non bisogna fermarsi alla prima pagina di risultati) ma guardando alla credibilità dell'autore o dell'Istituzione e al numero di citazioni dei documenti

4-Scetticismo, cioè mantenere dubbi sulla qualità di risultati e sforzarsi di acquisire nuove informazioni.

Scrive Ryen White nelle conclusioni del suo studio:

Le credenze delle persone e i pregiudizi inconsci che derivano da tali credenze, influenzano il loro giudizio, il processo decisionale e le loro azioni, così come evidenziato dagli psicologi. Possono essere osservati pregiudizi nel recupero di informazioni in situazioni in cui i ricercatori cercano o vengono a contatto con informazioni che si discostano significativamente dalla verità. Abbiamo descritto uno studio dettagliato dei pregiudizi in ricerche online, nel contesto di domande sì-no in ambito medico. Abbiamo dimostrato che le persone cercano di confermare le loro convinzioni con le loro ricerche e che i motori di ricerca forniscono risultati di ricerca distorti, irrispettosi della verità. [probabilmente falsati dall'errato apprendimento automatico dell'algoritmo del motore]  Abbiamo anche dimostrato che le persone hanno maggiori probabilità di selezionare informazioni positive sui risultati di ricerca del motore (SERP), indipendentemente dall'ordinamento dei risultati, e probabilmente salteranno i risultati negativi per raggiungere quelli positivi. Forse la scoperta più preoccupante della nostra analisi è che la combinazione di pregiudizi di sistema e di ricerca portano le persone ad accontentarsi di risposte errate per circa la metà delle volte (e che questa inesattezza viene amplificata quando la risposta del medico, usata come verità fondamentale, è no). I risultati evidenziano un compromesso tra distorsione e precisione che i motori di ricerca devono considerare.
Tassonomia: le categorie che condizionano le decisioni umane
Il testo in formato PDF è scaricabile qui:
Il web rappresenta la saggezza della folla? E chi ci crede ?

I pregiudizi fanno parte della storia dell'umanità fin dai suoi albori ma, con l'invenzione del Web la loro diffusione è aumentata a dismisura. I bias sono presenti nei dati perchè qualcuno ce li introduce, e si tratta di piccole minoranze molto attive. Il ricercatore Ricardo Baeza-Yates (vedi bibliografia) chiarisce questo fenomeno:



La presenza di biases ha causato parzialità nei big data per diventare una tendenza e un argomento controverso negli ultimi anni. Le minoranze, in particolare, hanno subito gli effetti dannosi della distorsione dei dati nel perseguire obiettivi di vita, con esiti governati principalmente da algoritmi, a partire dalla concessione di mutui fino alla personalizzazione della pubblicità. Mentre gli ostacoli che essi incontrano rimangono un punto  importante, il pregiudizio riguarda tutti noi, sebbene la maggior parte delle volte siamo inconsapevoli o non sappiamo come potrebbe (negativamente) influenzare il nostro giudizio e comportamento. Nell'esplorazione di un set di dati di Facebook dal 2009 con quasi 40.000 utenti attivi, abbiamo riscontrato che il 7% ha prodotto il 50% dei post. In un set di dati più grande di Amazon con recensioni dal 2013, abbiamo trovato solo il 4% di utenti attivi. In un set di dati molto grande dal 2011 con 12 milioni di utenti Twitter attivi, il risultato è stato solo del 2%. Infine, abbiamo appreso che la prima stesura della metà delle voci di Wikipedia in inglese è stato pubblicata dallo 0,04% dei suoi editor registrati o, approssimativamente, da 2.000 persone, indicando che solo una piccola percentuale di tutti gli utenti contribuisce al Web e che l'idea che il Web rappresenti la saggezza della folla è un'illusione. Alla luce di tali risultati,  non ha senso che solo il 4% delle persone scriva volontariamente la metà di tutte le recensioni nel set di dati di Amazon. Ho avvertito che qualcos'altro era in gioco. Un mese dopo la pubblicazione dei nostri risultati, la mia intuizione è stata confermata. Nell'ottobre 2015, Amazon ha iniziato una campagna aziendale contro le false recensioni pagate che ha continuato nel 2016 citando in giudizio quasi 1.000 persone accusate di scriverle.

Ricardo Baeza-Yates descrive i bias che possono presentarsi sul web suddividendoli in due tipologie:

  1. bias nei dati e bias algoritmici: i bias nei dati possono essere stati introdotti dagli autori umani degli articoli inconsapevolmente e provenire da inaccuratezza originaria dei dati, quelli algoritmici possono derivare dai testi (magari densi di bias di genere o altro) che sono stati usati per l'apprendimento automatico (machine learning) degli algoritmi.

  2. bias di autoselezione: derivano dall'interazione dell'utente con il web. Noi leggiamo dall'alto in basso e da sinistra a destra, quindi le informazioni che ci attraggono maggiormente (e vengono più cliccate) si trovano nella parte alta spostata a sinistra della pagina web (il cosiddetto triangolo d'oro vedi figura)



Come guardiamo (male) le pagine web
Il triangolo d'oro della visione
Tipi di bias presenti sul web
Ricardo Baeza-Yates ha individuato due tipologie di bias: i bias dei dati e algoritmici e i bias di autoselezione
Conclusioni (provvisorie): le keyword sono influenzate dai pregiudizi posseduti
L'attenzione al proprio processo di ricerca online si rivela indispensabile se si vogliono evitare gli errori che la maggior parte delle persone fa durante le ricerche online. Il ricercatore Ryen White, in uno studio sperimentale condotto su impiegati Microsoft, ha evidenziato la forza irresistibile di biases quali il Pregiudizio di conferma (Confirmation Bias). Ryen White ha notato che le keywords che le persone inseriscono nelle domande sono influenzate dai pregiudizi posseduti o dalle emozioni vissute (in particolare l'ansia), e vanno a creare dei "frame", cioè dei contesti che indirizzano la ricerca semantica verso risultati errati.
Esistono due tipi di pregiudizi che vanno a inficiare i risultati: pregiudizi di ricerca che sono presenti nella mente di colui che effettua la ricerca, e pregiudizi di sistema che sono presenti negli algoritmi del motore e sono stati creati da un apprendimento del motore incompleto o distorto (machine learning), magari attuato su testi densi di pregiudizi. Se si vuole fare una ricerca che dia dei risultati utili a raggiungere lo scopo desiderato occorre: 1-Umiltà, cioè essere consapevoli (almeno in parte) dei propri pregiudizi e sforzarsi di contrastarli, 2-Conoscenza del contesto, cioè scegliere le keyword da inserire nella query, chiedendosi se rappresentano il contesto culturale che si vuole esplorare, 3-Mente aperta, cioè valutare i risultati della SERP non guardando troppo all'ordinamento dei risultati (non bisogna fermarsi alla prima pagina di risultati) ma guardando alla credibilità dell'autore o dell'Istituzione e al numero di citazioni dei documenti, 4-Scetticismo, cioè mantenere dubbi sulla qualità di risultati e sforzarsi di acquisire nuove informazioni.
La razionalità richiede impegno personale!
Iscriviti alla Newsletter di pensierocritico.eu per ricevere in anteprima nuovi contenuti e aggiornamenti:
Bibliografia (chi fa delle buone letture è meno manipolabile)


Commenti
Se ritenete che le tesi del "punto chiave" non vengano sufficientemente supportate dagli argomenti presenti in questa pagina potete esprimere il vostro parere (motivandolo).
Inviate una email con il FORM. Riceverete una risposta. Grazie della collaborazione.
Libri consigliati a chi è interessato a migliorare i propri processi di ricerca
Spesa annua pro capite in Italia per gioco d'azzardo 1.583 euro, per l'acquisto di libri 58,8 euro (fonte: l'Espresso 5/2/17)

__________________________________________________________________________________________________________________________________________________________

Pagina aggiornata il 12 dicembre 2019

Copyright 2012-2020
creative commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione 2.5 Generico
Torna ai contenuti