Archive

Tag Archives: lies

Deia un professor de l’ETSECCPB que a la vida hi ha veritats, mentides i estadístiques. I és que les estadístiques no són altra cosa que una acumulació de dades. La utilitat o inutilitat d’una estadística (i també el seu grau de proximitat amb la realitat) depèn completament de com es recullen, analitzen i tracten aquestes dades. Al llarg de tot aquest procés es poden produir errors, o bé manipul·lacions intencionades, que redueixin el resultat precisament a això: a un conjunt de dades sense gaire sentit, o bé amb un sentit induït artificialment.

Se li atribueix a Winston Churchill (com tantes altres frases que potser va dir, o potser no) allò de no crec en cap estadística que no hagi manipul·lat jo mateix. I és que massa sovint les utilitzem tan malament com sabem, sense cap mena de rigor ni respecte per la metodologia d’una ciència molt maltractada i molt mal compresa.

Per començar potser hauríem de definir què és l’Estadística. Per a la majoria de la gent, les estadístiques són el mateix que les enquestes, xifres que apareixen als diaris i a la televisió, i que normalment s’expressen en termes de tants per cent, cosa que encara les fa més equívoques.

Però què és, en realitat, l’Estadística?

Segons el diccionari de l’Institut d’Estudis Catalans, estadística és la ciència que té per objecte d’aplegar, classificar i comptar tots els fets del mateix ordre. Només això: comptar i classificar. L’Estadística no és altra cosa que l’eina per analitzar grans quantitats de dades. I, com totes les eines, pot ser perillosa en mans d’algú que no la sap fer servir.

Ara bé, quin és l’interès d’analitzar totes aquestes dades? Conèixer la realitat. Aquest és sempre l’objectiu final: fem estadístiques per saber alguna cosa més del món en què vivim. I per què necessitem l’Estadística? Perquè el món és tan gran, tan vast i està tan saturat d’informació que és impossible conèixer-la tota. L’Estadística defensa que aquesta realitat pot representar-se dins d’uns certs marges d’error analitzant-ne només una part i suposant que el què és vàlid per aquesta part (que anomenarem a partir d’ara mostra) també ho és per al tot (que anomenarem població). Així doncs, si volgués saber quants arbres hi ha en una selva, tindria l’opció de comptar-los tots un per un, cosa que seria inhumanament llarga i molt probablement fora de l’abast dels meus recursos, o bé comptar, per exemple, quants arbres caben en 1 km quadrat, medir sobre un mapa (o sobre imatges per satèl·lit) la superfície de la selva i multiplicar-ho pel nombre d’arbres que cabien a la meva mostra. Així tindria una aproximació de la quantitat d’arbres totals. Igualment, si volem conèixer l’opinió de tot un país sobre un tema, tenim l’opció de visitar un per un cada habitant dels que en conformen la població i preguntar-los què en pensen, cosa que no és gaire pràctica, o bé fer una enquesta sobre una mostra extreta d’aquesta població.

Fins aquí molt bé. El problema és que això és una simplificació, i no sempre es recorda: és evident que, procedint d’aquesta manera, només per la més afortunada de les casualitats encertaria el nombre real d’arbres que hi ha a la selva. Però potser m’hi acostaria amb una precisió d’uns quants milers. Si no només comptés els arbres al llarg d’un km quadrat, sino que ho fes diverses vegades, en zones diferents, amb accidents geogràfics diversos, i fes la mitja de tots els resultats, potser aconseguiria aproximar el resultat fins als centenars. Tot això requereix un procés de tractament de les dades molt estricte a fi d’estar segurs que ens allunyem el mínim possible de la realitat. Perquè això que quedi ben clar: una estadística mai no és la realitat, però una estadística ben feta s’hi aproxima el màxim possible.

Són molts els errors que es cometen en aquest procés. Analitzem-ne alguns dels més comuns.

1. Mostres massa petites

L’Estadística requereix gran quantitat de dades per funcionar. Bàsicament, com més dades, més s’acostarà a la realitat (si portem el raonament fins a l’extrem, si recollíssim totes les dades, podríem representar la realitat en tota la seva exactitud… com fer-ho ja és una altra cosa). Aplicar l’Estadística a mostres petites només ens portarà a equívocs.

D’aquí venen algunes de les crítiques tradicionalment fetes a l’Estadística. Per exemple, estadísticament parlant, al Vaticà hi ha 2 Sants Pares per kilòmetre quadrat. El problema (a part que el Vaticà només té mig kilòmetre quadrat de superfície) és que no es pot aplicar l’Estadística al Sant Pare de Roma, perquè només n’hi ha un. Igualment, s’ha dit tota la vida que l’Estadística és la ciència que diu que, si tu t’has menjat un bistec de 5 kg i jo m’he begut un litre d’aigua, cap dels dos no té ni gana ni set. O, formulat d’una altra manera, si jo m’he menjat tot un pollastre i tu no has menjat res, cada un dels dos ens hem menjat mig pollastre.

2. Mostres esbiaixades

És menys sabut del que caldria que les enquestes que fan els diaris no volen dir res: l’absoluta majoria dels lectors d’un diari són gent que està d’acord amb la línea ideològica del mateix. Per tant, una enquesta sobre qualsevol tema feta entre els propis lectors només demostra que la majoria de la gent que pensa com nosaltres està d’acord amb el que diem. De la mateixa manera, està clar que si fem una enquesta sobre la religiositat de la població enmig de Plaça Catalunya obtindrem resultats força diferents que si fem les mateixes preguntes un diumenge a la sortida d’una esglèsia. Trobaríem també que dos enquestadors que fessin la mateixa pregunta (així, per exemple, “qui creus que guanyarà la lliga?”) en dos llocs escollits “a l’atzar” (com ara el Camp Nou i el Santiago Bernabeu) obtindrien resultats força diferents… Contradictoris, potser.

Hi ha tota una ciència al voltant del mostreig: s’intenta que les mostres siguin prou grans, que comprenguin diferents segments demogràfics, per edats, per sexes, per localització geogràfica, per nivell d’ingressos, etc. Una mostra massa petita no és mai representativa, però fins i tot una mostra molt gran pot donar resultats esbiaixats si no representa adequadament la població: com a exemple extrem, podríem fer una mostra sobre la meitat de la població, preguntar-los de quin sexe són i obtenir com a resultat de l’enquesta que el 100% dels habitants del país són dones.

3. L’irrellevància de les dades

En podreu trobar un exemple darrere l’altre a la retransmissió de qualsevol enfrontament esportiu, coses de l’estil de “la meitat de les vegades que el Barça ha encaixat un gol abans del minut 42, ha acabat remuntant el partit“.

Molt bé… i què? Per què el minut 42 i no el 41 o el 43? De la mateixa manera podríem dir “la meitat de vegades que m’he obert una cervesa a la mitja part, el Barça ha acabat remuntant el partit” o “el 80% de vegades que em vesteixo de negre plou a Galícia“.

El problema és que ni casualitat implica correlació ni correlació implica conseqüència. Què és el que fa que el Barça remunti el partit, que encaixin el gol abans del minut 42 o que jo m’obri una cervesa? Probablement cap de totes dues coses. I, de la mateixa manera, encara que tingui per costum vestir-me de negre (i encara que a Galícia hi hagi el costum que el temps sigui plujós), no hi ha cap relació entre el color del meu jersei i la meteorologia gallega, no més enllà de la coincidència. Quina rellevància te aquesta dada, llavors? Cap ni una.

El problema amb aquestes dades irrellevants és que de vegades arriben fins i tot a ser notícia. Un exemple força recent arriba de la mà del tancament de Megaupload. El cap de setmana següent, un conegut diari presentava el següent titular: Los cines llenan tras el cierre de Megaupload, detallant a continuació que l’afluència de públic havia augmentat un 32%. El problema és que una variació de taquilla del 32% és perfectament normal d’un cap de setmana a l’altre, en funció de la cartellera, del temps que faci, d’altres opcions d’oci disponibles… En conclusió, no hi ha notícia. Cap ni una. És una dada que no indica res.

4. La manera de formular la pregunta

Us ho cregueu o no, la manera de formular una pregunta té molta influència sobre la resposta que donem a la mateixa. Dan Ariely en aquesta conferència enmarcada en les TED talks ho explica molt millor que jo (i subtitolat en 38 idiomes).

El senyor Ariely defensa que els éssers humans som previsiblement irracionals. Davant d’un estímul, tendim tots a actuar de maneres similars, que no sempre tenen gaire a veure amb l’anàlisi intel·ligent de les circumstàncies, sino més aviat tot el contrari. Això és vàl·lid també per al cas de respondre a una enquesta, o bé triar entre diverses opcions.

Hi ha un exemple de llibre, molt explicatiu. Suposem que dos diaris fan una enquesta sobre la percepció ciutadana de la tasca del govern. El primer pregunta “Està vostè d’acord amb totes les mesures que ha pres el nostre president?”, mentre que el segon pregunta “Creu que la tasca del nostre president ha estat, en general, positiva?”. És, en essència, la mateixa pregunta. Però, clarament, a la primera d’elles hi haurà molta més gent que contestarà “no”. D’acord amb totes les seves decisions? Amb totes? O bé ets un militant convencut dels que porten el carnet del partit a la butxaca o bé en alguna cosa o altra discreparàs, no? En canvi, l’altre diari t’ofereix dir que en general ho ha fet més o menys bé. Molta més gent estarà d’acord amb aquest altre enfocament, simplement perquè ja està orientat així.

I no només de la pregunta. El resultat també dependrà de les respostes elegibles. En el cas de la pregunta anterior, els resultats no seran els mateixos si només oferim les possibilitats “Sí” i “No” que si hi afegim “Més o menys”. Hi haurà una variació, que no sempre és evident. Exemples extrems ja freguen la manipul·lació descarada. És el cas de la consulta popular per al canvi de nom de Maó, que no permetia l’opció de conservar el nom en ús (arrel de la qual es va crear el hastag #ésMaó), o bé aquesta altra enquesta feta per un diari, en què només éra possible votar “no”.

Així que ja ho veieu. Potser sí que no ens hauríem de creure cap estadística que no haguem manipul·lat nosaltres mateixos. O potser no cal anar tan lluny, però si tenir present que una estadística mai no demostra res. Només és un sondeig, una recopil·lació de dades que, si no es fa correctament, ni tan sols no tenen significat.

Ara bé, aquestes que hem vist són algunes de les pràctiques més comunes, però ni de bon tros les úniques. Podríem dedicar-li tota una sèrie només a l’Estadística (10 maneres de mentir fent servir l’Estadística…) i no ens les acabaríem. I a tu? Se t’ocorre alguna altra manera habitual de manipul·lar les dades?

Advertisements

Avui començarem amb un exemple pràctic, que em va arribar fa no gaire a través del Facebook (Hinterlands, com sempre, utilitzant fonts del més alt nivell acadèmic). Observem la pregunta i les respostes possibles:

Què me’n dieu? Us atreviu a aventurar una resposta abans de continuar llegint?

D’entrada, per si algú ho dubtava, us avanço que la sol·lució no és zero. Sí, com ho llegiu: l’absoluta majoria de la gent que ha contestat la pregunta, més de 1.300.000 persones (i ja deu anar pels dos milions, a hores d’ara), s’han equivocat de mig a mig.

Però com poden estar equivocades un milió i mig de persones? Però si tothom sap que qualsevol cosa multiplicada per zero és zero! I, a més, si ho fas amb la calculadora, veuràs que dóna zero. Ara em diràs que saps més tu que la calculadora?

Doncs sí, amic meu. Sé més jo que la calculadora. I tu. I tothom. Perquè la calculadora no sap res: ella es limita a tornar-li la resposta al què li introdueixes, però no en té ni idea de quina operació és la que vols fer. Així doncs, si tecleges l’operació equivocada, obtindràs el resultat equivocat. I, en aquest cas, has introduit l’operació equivocada.

I ara! Què dius? Jo he teclejat exactament el que posa allí!

M’ho crec. Però, si has fet servir una calculadora corrent (o, fins i tot, certes calculadores científiques que no permeten introduir la línia sencera, sino en què has d’anar operant pas a pas), haver teclejat exactament el què surt en aquella pregunta et condueix a l’operació equivocada. Perquè la calculadora no sap res. Ni tan sols matemàtiques.

Et proposo un experiment: tecleja-la al revés, de dreta a esquerra. Això és:

0 x 2 – 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2

Si ho fas, obtindràs un resultat que no és zero, sino la veritable resposta (efectivament, 26, si no ens hem descomptat amb els dosos).

Ai, caram! Màgia! Com és que ara sí que dóna?

Doncs perquè ara has fet les operacions en l’ordre correcte.

Per començar, espero que tothom vegi que el zero no està multiplicant tot el carro de dosos, sino només el darrer de tots ells. Per a què la resposta fos, efectivament, zero, caldria recórrer a uns vells coneguts: els parèntesis. L’operació quedaria llavors:

(2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 – 2 + 2) x 0 = 0

I per què? Doncs per una convenció de la notació matemàtica. Quan parlem, gairebé no distingim entre, diguem, “dos per… tres més dos” i “dos per tres… més dos”, però en realitat són dues operacions força diferents. En el primer cas, estaríem parlant de 2 x (3 + 2) = 2 x 5 = 10, mentre que en el segon el que tenim és 2 x 3 + 2 = 6 + 2 = 8. Dos resultats, com veieu, que provenen de combinar els mateixos nombres i operacions en diferent ordre.

La Matemàtica és una ciència universal i exacta, amb el què no es pot permetre aquesta ambigüitat que existeix en el llenguatge. Cal una manera d’escriure aquestes operacions sense possibilitat de dobles interpretacions, i de fet és la que he utilitzat jo quan us les he transcrit amb nombres i parèntesis. Ara bé, aquesta eina que és la notació matemàtica s’ha de saber fer servir. Si no seguim les regles, serà com tractar de llegir en veu alta un idioma del què en desconeixem la fonètica: tota semblança amb les paraules reals serà fruit de la casualitat.

En la notació matemàtica que utilitzem (podríem escollir-ne una altra, com ara la dels maiesels egipcis o els babilonis), la prioritat de les operacions és:

1- En primer lloc, es resolen els parèntesis

2- Multiplicacions i divisions

3- Sumes i restes

Això, insisteixo, és així per convenció: només és una manera d’escriure les operacions, com l’alfabet llatí, el ciríl·lic o els kana-kanji són maneres (distintes i vàlides totes elles) de transcriure sons. No obstant, que dues llengües s’escriguin amb sistemes diferents no suposa un excessiu mal de cap (excepte per als estudiants estrangers, sobretot als primers cursos), però si tothom escrivís les Matemàtiques de diferent manera, la “mateixa” operació podría valdre 8 a França i 10 a Anglaterra. I així no anem enlloc. Si les Matemàtiques han de ser una ciència universal, la manera d’escriure-les també ha de ser universal. I es va escollir aquesta, probablement perquè es va considerar la més pràctica i senzilla de fer servir.

Ara bé, com tot sistema d’escriptura, té unes regles que, si no respectem, ens duen a equívocs. En definitiva, si no resolem les operacions en l’ordre adeqüat, arribarem al resultat incorrecte. I què ens importa això a l’hora de mentir? Doncs molt, per dos factors que ja he enunciat.

En primer lloc, les matemàtiques no deixen lloc a l’ambigüitat, però la llengua sí: quan parlem, sobretot quan parlem de pressa, és impossible distingir “2 x (3 + 2)” de “2 x 3 + 2”. Totes dues coses es llegeixen “dos per tres més dos”, i si ens estem referint a l’una o a l’altra és quelcom que pot quedar clar pel context… O no. La gràcia de la qüestió arriba quan parlem d’una de les dues opcions però deixem que el nostre interlocutor entengui l’altra. Això, evidentment, pot produir-se de manera involuntària i accidental, en un malentès, però també es pot induir amb tota la mala intenció del món.

Però és que, a més, podem utilitzar una calculadora en el nostre benefici. Perquè la gent confia en les calculadores, les considera portadores de la veritat absoluta i font de totes les respostes. Però, com m’he afartat de repetir, la calculadora no sap matemàtiques, no té criteri: únicament es limita a processar la informació que li introduïm. I, si introduïm la informació errònia, obtindrem el resultat erroni (“garbage in, garbage out“). Novament, això pot ser accidental (qui no s’ha equivocat mai teclejant en ple examen de Matemàtiques?) o fredament premeditat, com és el cas de la pregunta que obria aquesta entrada. Indubtablement, la persona que la va redactar va posar el zero al final amb tota la intenció del món. I, per si de cas, el va separar de tot el tren de dosos amb un doble espai per a destacar-lo encara més. El resultat és clar: més de 1,3 milions de persones (més de la meitat dels que han respost) han caigut a la trampa.

Només cal, llavors, una mica de coneixement de la mecànica interna de la calculadora per a poder fer afirmacions falses que podrem respatllar molt convincentment gràcies a ella. Dubto molt que ningú s’hagi fet ric gràcies a aquesta tècnica, però segur que més d’un s’ha estalviat pagar la seva part en un sopar o alguna cosa per l’estil.

Perquè els humans sóm molt fàcils d’enganyar. I, en qüestió de nombres, encara més. Perquè el càlcul és una activitat que exigeix de tota la nostra concentració. El nostre cervell se satura si intenta mantenir una conversa i resoldre una operació al mateix temps. I un bon mentider s’assegurarà que l’atenció del seu interlocutor resti en la conversa i no pas en l’operació.

Així que ja ho veieu: no et pots fiar de ningú. Ni tan sols de les calculadores.

Els tants per cent són potser una de les eines més antiintuïtives de la matemàtica quotidiana. I aquest és el seu problema: d’eines matemàtiques que són antiintuïtives en podríem trobar un bon grapat, però definitivament cap d’elles tan corrent com els tants per cent. Tothom fa servir tants per cent: el banc, els polítics, els periodistes, els anuncis del supermercat… Tot són tants per cent. Amb aquesta profusió de percentatges al nostre voltant sembla que els hauríem de tenir per la mà, no? Doncs no. Hi ha molt poca gent que tingui clar com funcionen exactament els tants per cent. I fins i tot aquesta gent s’equivoca de tant en tant. Per què? Perquè són antiintuïtius.

Posem, per exemple, que llegiu en un diari (no seria gaire difícil trobar algun cas semblant) quelcom de l’estil de “Els preus de l’habitatge han pujat un 5% cada any durant els últims 10 anys. Per tant, ara són un 50% més cars que ara fa 10 anys”. Què en penseu? Veritat o mentida?

Si has pensat que necessàriament ha de ser mentida perquè, si no, no ho hauria posat com a exemple en aquesta entrada, ja hi tens molt guanyat. Ara bé, sabries dir-me per què és mentida? Per què un augment del 5% anual durant 10 anys no és el mateix que un augment del 50% en 10 anys?

Suposem un preu inicial de 100. Al final del primer any, un augment del 5% es tradueix en un preu de 105. Fins aquí correcte, oi?

Per al segon any, tenim un altre augment del 5%, però –¡cuidaaao!- ara ja no estem parlant del 5% de 100, sino de 105. I el 5% de 105 ja no és 5, sino que val 105 · 0,05 = 5,25. Per tant, per al segon any, els preus no pugen fins a 110, sino fins a 110,25. Però és que llavors això implica que al tercer any el 5% es calcularà precisament sobre aquests 110,25, en lloc de sobre els 100 inicials. Si fem el càlcul per als 8 anys que ens resten, veurem que al cap dels 10 anys el preu del nostre habitatge és de 163,89. Així doncs, un augment del 5% cada any durant 10 anys no ha suposat un augment total del 50%, sino més aviat del 63,89%. Si estàvem parlant d’un pis força normal (posa-li 200.000 euros), la diferència entre un preu i l’altre és ni més ni menys que de 27.780 €. Si us sobren me’ls podeu donar, eh?

Bé. Oblidem-nos ara del 5% i suposem que sí que tenim un augment del 50% en 10 anys. Això vol dir que, si el nostre preu era de 100 deu anys abans, ara és de 150. Tots d’acord? Què us sembla ara si us dic que fa 10 anys els preus eren un 33% inferiors als d’ara?

Au, quin disbarat! No m’acabes de dir que han pujat un 50%? I ara pretens dir-me que eren un 33% més baixos? Voldràs dir un 50: si han pujat un 50% és que abans eren un 50% més baixos, està clar… 

¡¡MENTIRAAAAA!!

Anem a veure: abans valien 100 i ara valen 150, no? Estem d’acord en que han pujat un 50%. Però és que si fa 10 anys haguessin estat un 50% més baixos, haurien d’haver valgut la meitat del que valen ara. És a dir, 75. I no en valien 75, que en valien 100: valien dos terços del que valen ara. El tercer terç és la diferència. Així doncs, de fa 10 anys a ara, els preus han augmentat un 50%, però abans eren només un 33% més baixos que ara.

Marejats? Espero que no.

En aquest ordre de coses, és evident que em quedaré amb la xifra que m’interessi: si estic a l’oposició i vull criticar l’acció del govern, diré “per culpa seva, els preus han augmentat un 50%!”, mentre que si estic al govern i m’interessa defensar la meva gestió, acusaré a l’oposició de mentiders i diré que “segons les meves dades, fa 10 anys els preus eren solsament un 33% més baixos que ara”. Qui menteix? Estrictament parlant, ningú. Però és evident que totes dues parts han triat la manera de presentar la informació amb uns objectius ben clars. Perquè tot es pot manipul·lar i tot es pot maquillar.

Fins i tot les dades objectives.