Se sul numero di persone sentite si può discutere se questo sia sufficiente o insufficiente (in Italia la media degli intervistati varia da 500 a 1.000 persone; in Inghilterra è quasi il doppio; ma negli Stati Uniti, dove la popolazione è maggiore rispetto al nostro paese, le persone interpellate sono sempre un migliaio) si può invece discutere meno sul fatto che all’origine degli errori dei sondaggi, e all’origine anche delle notevoli differenze che esistono tra un sondaggio e un altro, c’è una questione legata al modo con cui vengono scelte le persone che fanno parte del campione. [...] Ancora, altri motivi per cui non fidarsi troppo dei sondaggi sono relativi, secondo Natale (2009), al fatto che ogni sondaggio passa per una serie di interviste che vengono rivolte ad un campione di individui, e quindi è necessario tener presente l’effetto clima di opinione (in particolare nel contesto di acceso scontro politico tipicamente italiano), ovvero la desiderabilità sociale delle risposte, nonchè la problematica dell’autoselezione dei rispondenti, che deriva dal fenomeno delle non risposte e della relativa sostituzione degli intervistati, motivo per il quale anche se il campione iniziale è probabilistico, il campione finale spesso non lo è.
I risultati dei sondaggi vengono utilizzati come strumento di comunicazione in campagna elettorale, ovvero per confermare l’andamento vincente di un determinato partito/candidato. In questo senso, il sondaggio rischia non solo di manipolare l’imparzialità e la correttezza dell’informazione, ma anche di scatenare un effetto band wagon (ovvero di salita sul carro del vincitore) da parte dei cittadini: proprio da questo rischio trae l’origine il divieto di diffusione di sondaggi politico-elettorali nella fase finale del periodo elettorale, presente nelle legislazioni di alcune democrazie occidentali.
I sondaggi politici tradizionali (basati su interviste telefoniche a un campione rappresentativo della popolazione) non sono mai stati attendibili e stanno per essere sostituiti da metodi di "emotional web anaysis" e "sentiment analysis" basati sui social media.

Per ridurre il rischio di manipolazione delle indagini statistiche, o anche solo delle distorsioni non intenzionali, Darrell Huff ("Mentire con le statistiche" pp.42-52) suggerisce di farsi almeno due domande:
- Come è stato costruito il campione rappresentativo? (infatti un campione non è la realtà, e più è piccolo e focalizzato meno riflette la realtà che vuole rappresentare)
- Come sono state costruite le domande del questionario? (infatti la tipologia, la sequenza ed il modo in cui sono proposte le domande può non essere neutro ma, anzi, indirizzare le persone verso certe risposte)

Nel 2014 Wang, Gelman et Al. (ved. bibliografia) hanno pubblicato la sperimentazione dell'esito di un nuovo metodo (con mezzi tradizionali tranne l'impiego di Internet per le comunicazioni) per svolgere sondaggi elettorali utilizzando dei campioni non-rappresentativi della popolazione (nelle elezioni USA del 2012), facendo delle correlazioni tra questi dati e altri dati rappresentativi della stessa area geografica e trovando dei risultati molto prossimi all'esito del voto (un giorno prima del voto pari a una probabilità del 88%) pur con una tecnica poco costosa come quella messa in atto (basata su un totale di 750.148 interviste con 345.858 rispondenti unici). L'impiego di Internet e della console Xbox Live per le risposte al sondaggio, ha consentito la riduzione dei costi e, per questo motivo, gli autori ritengono che il metodo possa fornire dei buoni risultati anche per altre tipologie di sondaggi.
Lo scopo del sondaggio era il seguente: se le elezioni si tenessero oggi, per chi voterebbe? Barack Obama\Mitt Romney\Altri\Non sicuro
Ecco le domande non-rappresentative fatte all'elettore:
- Per chi ha votato alle elezioni presidenziali del 2008? Barack Obama\ John McCain\ Altri candidati\ Non ho votato nel 2008
- Parlando di politica oggi, come descriverebbe il suo punto di vista politico? Liberale\ Moderato\ Conservatore\ Non sicuro
- Generalmente parlando, lei si ritiene . . . ? Democratico\ Republicano\ Indipemdente\ Altro
- E' attualmente registrato per il voto? Si \ No\ Non sicuro
- Lei è maschio o femmina? Maschio\ Femmina
- Qual è il suo livello scolastico? Non diplomato\ Diplomato\ Laureato (breve)\ Laureato (laurea magistrale)
- Dove vive? Indicare lo stato
- In quale anno è nato? 1947 o precedente\ 1948–1967\1968–1982\ 1983–1994
- Qual è la sua razza o gruppo etnico? Bianco\ Nero\ Ispanico\ Altro
I sondaggi del futuro (ved. bibliografia Umberto Grandi) saranno quindi realizzati con l'analisi automatica dei testi che gli utenti/elettori immettono spontaneamente in rete (blog post, facebook posts, tweets, commenti, online research, ecc).Tra le tecniche implementate per l’analisi del contenuto sul web, emotional web analysis e sentiment analysis appartengono al filone che tenta la massimizzazione dell’efficacia emotiva della comunicazione al fine di analizzare l’emotività collettiva espressa in rete nei confronti di specifici oggetti/soggetti, secondo le specifiche logiche che guidano gli utenti nell’uso dei social media, nella gestione dei diversi target di pubblico a cui si rivolgono, nella narrazione di specifici argomenti, e nella ricerca della massima autenticità (Marwick, Boyd 2010); in questo senso il web si presta ad essere eletto quale contesto relazionale che possa far emergere correlazioni tra oggetti emotivamente in relazione nello stesso contesto. [...] La sentiment analysis consiste operativamente nell’attuazione di una suddivisione di testo e nella sua traduzione in polarità positive o negative, e si serve pertanto degli sviluppi del text mining (Kennedy 2012) e dell’unione con tecniche di connessione, afferenti alla social network text analysis, che si dimostra un ottimo strumento per l’individuazione di utenti leader o influenzatori ed utenti seguaci, determinandone anche la forza e il raggio di azione attraverso la posizione assunta da tali soggetti all’interno della rete, e diventando quindi assai utile in caso di studi predittivi.
Iscriviti alla Newsletter di pensierocritico.eu per ricevere in anteprima nuovi contenuti e aggiornamenti:
- Francesco Marrazzo (2014), Dai sondaggi alla sentiment analysis: le previsioni politicoelettorali nel racconto dei mass media (PDF)
- Andrew Gelman, Gary King (1993), Why are American Presidential Election Campaign Polls so Variable When Votes are so Predictable? (PDF)
- Wei Wang, David Rothschild, Sharad Goel, Andrew Gelman (2014), Forecasting elections with non-representative polls (PDF)
- Éric Bélanger, Stuart Soroka (2012), Campaigns and the prediction of election outcomes: Can historical and campaign-period prediction models be combined? (PDF)
- Barbara Norrander, Clyde Wilcox (2000), Understanding Public Opinion (PDF) [31 citazioni]
- Akshat Bakliwal et Al. (2013), Sentiment Analysis of Political Tweets: Towards an Accurate Classifier (PDF)
- Ilvo Diamanti, Luigi Ceccarini (2013), Sondaggi ed elezioni - Le regole del gioco e della comunicazione (PDF) - XI Convegno internazionale Sise
- Bo Pang, Lillian Lee (2008), Opinion mining and sentiment analysis (PDF) [4820 citazioni]
- Umberto Grandi, Andrea Loreggia, Francesca Rossi, Vijay A. Saraswat (2014), From sentiment anaysis to preference aggregation (PDF) [7 citazioni]
- Manisha Shinde-Pawar (2014), Formation of smart sentiment analysis tecnique for Big Data (PDF)
- Riccardo Esposito (2019), Come usare i sondaggi sui social: FB, Instagram e Twitter
Pagina aggiornata il 14 febbraio 2021