dilluns, de setembre 22, 2008

la supremacia del número 1

Imaginem que un dia decidiu començar a falsificar dades. Tant és les dades que siguin. Poden ser les d’hisenda, els resultats electorals, les notes d’escola o les dades de les analítiques que us heu fet per presentar a l’asseguradora. (Ep! Que és un exercici imaginari eh! No digueu que animo a ningú a ser un falsificador). Doncs si, hipotèticament, féssiu aquesta activitat, per fer-ho bé hauríeu de tenir en compte un detall poc conegut dels números. Un detall que ha permès enxampar alguns tramposos.

Donem per fet que tots els números són igualment probables, però sorprenentment a la vida real no és així. En conseqüència, en inventar dades falses, molt probablement als nombres que haureu posat hi faltaran uns quants que comencin amb la xifra “1”.

Això va ser observat per primera vegada l’any 1881. Un matemàtic, en Simon Newcomb va agafar unes tables de logaritmes per fer alguns càlculs. Ara tot es fa amb calculadora i els més joves no han vist mai una tabla de logaritmes, però durant molt temps van ser una eina imprescindible per calcular. Eren uns llibres (Si! llibres!) on hi havia pàgina rere pàgina els valors del logaritme dels números, per exemple de l’u fins al trenta mil.

Doncs en Newcomb la va agafar i va notar un detall curiós. Les pàgines corresponents als números que començaven amb la xifra 1 estaven més desgastades que la resta. Semblava com si aquells números es fessin servir amb més freqüència que la resta.

No va fer cap estudi seriós del fenomen, però va expressar-ho com si existís una relació logarítmica per la probabilitat que un número comencés amb una xifra o una altra.

El fenomen el va notar també, anys després, el físic Frank Benford, de nou en observar el desgast de les tables de logaritmes. Però ell si que va analitzar-ho a fons, fins que va postular una llei que descriu amb quina freqüència apareixen els números. És el que ara coneixem com la llei de Benford.

La gràcia és que el fenomen no es limita als logaritmes. Si analitzem dades corresponents a la mida de rius, al número de les adreces postals, als resultats de la lliga de futbol, als vots emesos en unes eleccions, les constants físiques o al que sigui, trobarem que els números començats en 1 són molt freqüents, mentre que els que comencen en 9 són inesperadament escassos.

I anar buscant tables per Google i comprovar-ho és un entreteniment curiós pels fans de les matemàtiques.

Al principi podríem pensar que cada xifra apareixerà amb igual probabilitat. Com que fem servir deu xifres, doncs les trobarem una dècima part de les vegades cada una. Però el cas és que no. Les que comencen en 1 seran el trenta per cent del total, mentre que el 9 únicament surt en un miserable cinc per cent de les ocasions.

Per això, de vegades es poden detectar eleccions fraudulentes o dades falses presentades a hisenda simplement perquè els números presentats no segueixen la distribució marcada per la llei de Benford. Normalment falten dades que comencin per “1”.

De totes maneres una cosa és que podem calcular la probabilitat, però quin és el motiu que fa que les coses siguin així? Doncs no és exactament un caprici de la natura sinó l’efecte de com fem servir els números. El normal és que comencem a contar a partir del número 1. Si el que mesurem arribés únicament fins al 9 ens apareixerien totes les xifres amb igual probabilitat, però després tenim els nombres del 10 fins al 19. En aquest punt els que comencen per 1 estaran molt més representats. A continuació comencen a sortir els de la vintena, de manera que el 2 recupera posicions mentre que els altres segueixen poc probables. Únicament quan enllestim els noranta tornen a tenir tots la mateixa probabilitat. Però tot seguit iniciem els cent, i de nou els que comencen per 1 tornen a ser molt més probables.... i ho seran fins al 999.

Com que la seqüència es repeteix cada vegada, el resultat final és que els 1 surten més freqüentment que els 2. Els 2 més que els 3 i així successivament.

Per tant, si voleu falsificar dades, no ho dubteu: un 30 % de xifres que comencin per 1. I a l’inrevés: Si sospiteu un engany, compteu les dades que us donen. Si no segueixen la llei de Benford... segurament us la volen fotre!

Són les utilitats insospitades de les matemàtiques!

11 comentaris :

Carquinyol ha dit...

Ja diuen que s'agafa abans a un mentider que a un coix...

Anna ha dit...

jaja, explicat així resulta tan evident que sorprèn que no ens n'haguem adonat tots.

ignasi cebrian ha dit...

Una curiositat sobre el número 1. Aquest no és el primer número que aprenem. El matemàtic Claudi Alsina, la setmana passada, a La Contra de La Vanguardia, deia que el numero o la unitat no és el que primer número que aprenem. Primer captem la idea de quantitat. Després entenem que el dos és la repetició de 1.

Dan ha dit...

carquinyol. Aixxò sempre que el mentider no conegui la llei de Benford. Que hi ha mentiders molt bons!


anna. Je je. Quasi tot, quan se sap sembla obvi.

ignais cebrian. Això deia? Sembla una contrqdicció. Per saber que el dos es la repetició de l'1 cal identificar primer l'1. Ja la buscaré per llegir-lo.

Alasanid ha dit...

En part és normal perquè amb tot hem tendit a fer-ho el més simple possible. És més fàcil que els dies tinguin 24 hores (11 de les quals comencen amb 1) o que la mitjana d'alçada estigui cap al metre i pico.

Hem adaptat les unitats a la nostra mida. I d'aquesta manera passa el que dius.

En canvi, si vols trobar distribucions a parts iguals el millor és mirar en processos aleatoris.

Sònia FR ha dit...

Així doncs quan falsifiquem les notes posarem en comptes de sets i vuits tot de deus, així serà més creible :P
Bona teoria! No m'hi havia fixat mai ^^

matgala ha dit...

Jeje, bon post :-D

Ara, tu t'has confabulat avui per fer-me sortir de mare totes les estadístiques del blog, veritat? Sempre tenia un nombre de visitants que començava per 1 i avui comença per 7 i encara no ha acabat el dia. Això contradiu la llei de Benford? :-P

Alepsi ha dit...

Ai Déu meu!!! Em permets ser políticament incorrecta?? Sí??? Gràcies!!!!

Crec que els posts de matemàtiques em posen catxondaaaaaa! xDDDDDDD

Buaaaah!!! Jo en vull més, més!!! xDDDD

Ja, perdona, és que avui tinc el dia girat... xDDDD

Dan ha dit...

alasanid. Si. Però curiosament costa molt trobar processos realment aleatoris a la vida real. Que ho siguin en aparença es fàcil, però que ho siguin de veritat...

Sònia fr. Dona, no se si un 30 % de 10 colaria encara que fos fidel a la llei de Benford. Caldrà provar-ho :-DD

matgala. je je. Ja saps que opino que cal cedir sempre la paraula als experts. I si sempre començava per 1, tampoc segui la llei. Potser ara s'hi ajusta millor ;-)

alepsi. Cap problema. Ara mateix preparo uns quants posts sobre la conjectura de Hodge, les equacions de Navier-Stokes, la teoria de Yang-Mills o la conjectura de Poincaré. Podem corregir-los prenent una cervesa...
Valeeeeee...., tenia que intentar-ho ;-)
(també tinc dies girats)

- assumpta - ha dit...

Gràcies x aquest bloc ! és una passada la quantitat d'informació interessant i k expliques d'una manera tan planera. No pararia de llegir-ho tot de cop. Però millor poquet a poquet com el bon vi. ;)

Dan ha dit...

assumpta. Gràcies a tu per passar per aquí!
:-)