3/8/11

Encuestas y Estadísticas

Se atribuye al Primer Ministro inglés Benjamín Disraeli la frase “Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas”

Es natural este cuestionamiento ante los números porque en muchas oportunidades los mismos no acompañan nuestros deseos, creencias, fantasías o simplemente no nos acompañan en el resultado de alguna gestión como en este caso. Otras veces porque favorecen a algún adversario o por alguna otra carencia propia de nosotros los humanos. También es cierto que en muchas ocasiones la información estadística se falsea para obtener beneficios ya sea económicos, de imagen, de dominación cuando los interlocutores no tienen acceso suficiente a la misma, etc. Para poder ejercer un criterio propio ante una serie de datos se hace entonces imprescindible adquirir una noción acerca de la consistencia del razonamiento estadístico.

En primer lugar hay que diferenciar los datos según sean provenientes de un censo o de una encuesta. Si están originados en un censo los mismos son considerados exactos siempre que se refieran al tiempo y lugar en que fueron obtenidos, así la población de la Argentina que resulte del censo nacional de población de 2010 estará referida a todo el territorio del país al día 27 de octubre, luego continuarán los nacimientos y las muertes pero se seguirá considerando la cantidad obtenida como la población del país por un tiempo, del mismo modo que se considera a un automóvil como cero kilómetro durante un tiempo aunque ya haya recorrido unos cuantos. Con el correr del tiempo se irá estimando la población en función de las tasas de nacimiento y mortalidad, hasta que se realice el próximo censo. Por otra parte los censos se someten a criterios de validación para depurarlos de los errores que se pudieran cometer. De modo que los censos se consideran no sometidos a errores de tipo estadístico que son los cometidos cuando en lugar de toda la población se releva sólo una parte de ella, llamada muestra.

Pero si hay errores de tipo estadístico, quiere decir que los hay de otro tipo, veamos algunos ejemplos:

1. Se quiere ver el grado de aceptación de un candidato presidencial tomando las personas mayores de 40 años
2. Se quiere conocer el rechazo en la población a la violencia contra la mujer, pero no se consulta a las hombres mayores de 50 años
3. Se mide el consumo de una canasta de productos en la Capital Federal, pero sólo de Rivadavia hacia el río

En el primer caso si el candidato es un cantante de rock, seguramente va a resultar poco atrayente para el público encuestado y también seguramente con menor atracción en general que si se consultara a todas las edades. En el segundo al dejarse fuera al sector menos opuesto a la violencia de género, se estimaría una menor permisividad ante la violencia contra la mujer. Finalmente se daría una sobreestimación del consumo en la capital, al dejarse de lado a las zonas más pobres de la misma. En todos estos casos el mal diseño de los estudios introduce sesgos en los resultados, según se ha detallado. En cada caso se trata de errores sistemáticos porque se producen para cada caso en la misma dirección. En estadística no se trata con esta clase de errores que son indicadores de mala praxis, encuestas que no sirven. Veamos en qué consisten los errores estadísticos. Para ello tomaremos como modelo las tiradas de una moneda en la cual cada una de las mismas se asimila a un cuestionario con una sola pregunta que tiene respuesta por sí o por no. (Cara = sí, ceca = no). Un supuesto para el caso es que la moneda está equilibrada, las chances de que salga cada uno de los lados es la misma (en una encuesta las chances para cada respuesta serían las mismas). Ahora seguiremos considerando solamente las monedas porque se aclara la exposición y las consideraciones y resultados son los mismos.

Cada vez que hagamos tiradas de 100, difícilmente salgan 50 caras, por el contrario saldrán series con distintas cantidades de caras (si no lo cree, hágalo) de modo que si bien por la clase de la moneda que es equilibrada se pueden esperar 50 caras este valor estará sujeto a error en el sentido que la mayor parte de las veces se agruparán cerca de ese valor central, a veces menos, a veces más de modo que hay un 95% de chances de que el número de caras esté entre 40 y 60 y se dice que el intervalo (40,60), que también se escribe 50+-10, es de confianza. ¿Por qué? Porque se puede confiar que si las salidas en 100 tiradas de una moneda resultan en un número del intervalo, la misma esté equilibrada. En el ejemplo, como las chances previas eran del 95%, se le llama intervalo de confianza del 95%.

Ahora bien, una moneda equilibrada, bien puede salir menos de 40 veces o más de 60 y no estará en el intervalo de confianza o sea no se aceptará como tal. Esto es un error. En el caso de una moneda no equilibrada, si la misma está menos o más desviada tiene más o menos chances respectivamente de a pesar de todo caer dentro del intervalo de confianza. Otro error. Son dos tipos de error. En el primer caso se rechaza una hipótesis cierta, y en segundo se acepta una falsa. Un error no es lo mismo que una mentira. Sirve a qué atenernos cuando nos movemos en casos de inexactitud. Veamos algo de nuestro razonamiento. Si no quisiéramos rechazar una hipótesis cierta, o sea tener un 100% de confianza, el intervalo iría de 0 á 100, y todas las monedas serían consideradas equilibradas, no importaría lo desequilibradas que estuvieran y por lo tanto este criterio del 100% de confianza no serviría a ningún efecto, y si no quisiéramos aceptar una hipótesis falsa, sólo admitiríamos como verdadero el caso de que en las 100 tiradas, resultaran exactamente 50 caras, cuya chance es menor que 8%, quiere decir que estaríamos rechazando en un 92% de ocasiones a monedas bien realizadas. Si se aumenta el nivel de confianza, para disminuir las chances de rechazar una hipótesis cierta, aumentan las chances de aceptar una hipótesis falsa. Si se disminuye la probabilidad de esta, aumenta la de rechazar una cierta. En los libros se llama error de tipo I al que consiste en el rechazo de una hipótesis cierta y de tipo II al restante. En cuanto a la elección del nivel, por lo general depende de cada aplicación concreta se usa frecuentemente el de 95% aunque en algunos estudios de mercado el autor ha usado hasta un 80% de confianza si era necesario para el nuevo producto estudiado disminuir las chances de una fácil aceptación del mismo en función de su costo de producción. El valor a priori del intervalo de rechazo de la hipótesis se llama nivel de significación, en el caso general es del 5%. Para un intervalo de confianza del 80% el nivel de significación es del 20%

Continuará.