Sobre la estadística se hacen muchas comparaciones, y sobre los estadísticos se suelen hacer bromas. Así por ejemplo, es muy conocida la frase del profesor estadounidense Aaron Levenstein, quien dijo que «la estadística es como los bikinis: lo que revela es muy sugestivo, pero lo que oculta es fundamental». Y comparto uno de esos conocidos chistes sobre nuestros colegas: tres estadísticos salen de cacería juntos. Después de un rato, divisan un venado solitario. El primer estadístico apunta y el proyectil pasa un metro a la derecha. El segundo apunta y le pasa un metro a la izquierda. Y el tercero grita “¡le dimos!”.

Lo cierto es que hay conceptos estadísticos que son fundamentales y que en la actualidad, cuando estamos recibiendo ráfagas de información todos los días con un alto contenido de cifras y gráficas que presentan estadísticas, resulta indispensable conocer y saber aplicar algunos conceptos básicos. Decía el escritor británico H. G. Wells (1866-1946): “El pensamiento estadístico será algún día tan necesario para una ciudadanía eficiente como la capacidad de leer o de escribir” ¡Y este día ha llegado!

Empecemos por recordar un concepto básico, que cuando es mal usado puede distorsionar la información y facilitar la manipulación, se trata de 

la media aritmética de un conjunto de números 

que se calcula sumando todos los números y dividiendo la suma entre el número total de términos.

Así por ejemplo, supongamos que en la cuadra de un barrio hay 9 casas y en 6 de ellas tienen mascotas distribuidas de la siguiente manera: 

  • En las dos primeras casas hay 1 perro y un 1 gato en cada casa.
  • En las tres casas siguientes hay 1 perro en cada una.
  • En la última casa tienen 2 gatos.

Y ahora se pregunta cuál es la media de mascotas por casa. Dado que hay 9 casas, si ordenamos los datos de acuerdo con la información completa y la ubicación de las casas, los números de las mascotas por casa se distribuyen así:

2, 2, 1, 1, 1, 0, 0, 0, 2 

y la media es entonces:

 (2 + 2 + 1 + 1 + 1 + 0 + 0 + 0 + 2) / 9 = 9 / 9 = 1.

Es entonces correcto afirmar que en esa cuadra hay en promedio 1 mascota por casa.

Pero si ahora se va uno de los vecinos que no tenía mascotas y llega a esa casa una familia que tiene 18 mascotas porque alberga pájaros en una jaula grande, entonces la nueva media es: 

 (2 + 2 + 1 + 1 + 1 + 18 + 0 + 0 + 2) / 9 = 27 / 9 = 3

es decir que hay, en promedio, 3 mascotas por casa, o sea el triple de la media anterior. Si se interpreta la media como una medida representativa del número de mascotas de estas 9 casas obtenemos por un lado que las casas tienen 3 mascotas en promedio, pero por otro lado es paradójico que 8 de esas 9 casas tienen un número de mascotas por debajo de la media. ¿Es entonces la media una medida representativa de la situación real? Pues no y la razón es que la media es sensible a valores extremos; es decir, si tenemos algún valor mucho mayor que la mayoría de los datos, la media es muy grande respecto a los mismos, y también ocurre, pero al revés, si el valor extremo es mucho más pequeño que los demás. Por ello, en casos así la media no es representativa de la situación, por lo que no es conveniente dar el valor medio como dato realista y por lo tanto se presta para manipular información.

Otro ejemplo, si en una universidad pública la matrícula más alta es de $10.000.000 por semestre para estudiantes del estrato 6 (que son el 8%), de $7.000.000 para los de estrato 5 (que son el 10%), de $4.000.000 para los de estrato 4 (que constituyen el 18%) y hay gratuidad para los estratos 1, 2, y 3 que son la mayoría de los estudiantes, entonces puede afirmarse que la matrícula cuesta 

[(8 x 10.000.000) + (10 x 7.000.000) + (18 x 4.000.000)] / 100 = 2.220.000 

en promedio. Estamos acostumbrados a que los medios de comunicación nos den este tipo de información, como si la media fuese un dato suficiente para sacar conclusiones y afirmar entonces, por ejemplo, que esa universidad pública resulta costosa, cuando en realidad la mayoría de sus estudiantes no pagan matrícula.

También se usa la media ponderada que es una mejor medida para promediar ciertos datos, como por ejemplo las calificaciones de asignaturas, cuando éstas tienen pesos diferentes. Imaginemos un escenario en el que se cursan dos asignaturas, una de 2 horas a la semana y otra de 6 horas a la semana y se desea calcular la media de las calificaciones obtenidas en ellas, sabiendo que en la primera la calificación fue de 2.0 y en la segunda fue de 4.0. En este caso el promedio sería 3.0, mientras que el promedio ponderado, dando peso a la intensidad horaria, sería:

Promedio ponderado = (2 x 2.0 + 6 x 4.0) / (2 + 6) = 28 / 8 = 3.5 

En muchas ocasiones conviene acudir a la mediana que representa la situación real mucho mejor que la media. Pasemos entonces a recordar que 

la mediana de un conjunto de números 

se obtiene ordenando los datos de menor a mayor. Si tenemos un número impar de datos, la mediana es el dato central. Y si tenemos un número par de datos, la mediana se calcula sumando los dos centrales y dividiendo entre 2 el resultado.

Veamos qué ocurre en el caso de las mascotas. Ordenamos de menor a mayor los datos que indican el número de mascotas de cada una de las 9 casas de la cuadra y obtenemos:

0, 0, 1, 1, 1, 2, 2, 2, 18. 

Como se trata de un número impar de datos, la mediana es el número central que en este caso ocupa la posición 5; es decir que la mediana es 1, que es más realista como medida representativa de la cantidad de mascotas por casa. 

Y en el caso de las matrículas la mediana sería cero, que es el valor de la matrícula para los estratos 1, 2, y 3 que representan el 64% de los estudiantes.

Lo cierto es que estamos tan acostumbrados a la media que el hecho de cambiar a mediana podría interpretarse como intento de manipulación, cuando en realidad es todo lo contrario.

Finalmente hablemos de 

la moda de un conjunto de números

que se define como el valor que aparece con mayor frecuencia en el conjunto y que no se utiliza tan comúnmente en la práctica. Su cálculo es extremadamente sencillo, pues solo necesita un recuento. Así por ejemplo en el caso de las mascotas distribuidas en las 9 casas tenemos 

2, 2, 1, 1, 1, 18, 0, 0, 2.

Los números que más se repiten son 1 y 2, lo que indica que esa es la moda, que como bien puede concluirse no es un único valor y bien podría afirmarse entonces que la moda en esa cuadra es tener 1 o 2 mascotas.

Espero que estos sencillos ejemplos contribuyan a incentivar en los lectores la lectura cuidadosa y crítica de la informacion estadística cotidiana.

@MantillaIgnacio

Avatar de Ignacio Mantilla Prada

Comparte tu opinión

1 Estrella2 Estrellas3 Estrellas4 Estrellas5 EstrellasLoading…


Todos los Blogueros

Los editores de los blogs son los únicos responsables por las opiniones, contenidos, y en general por todas las entradas de información que deposite en el mismo. Elespectador.com no se hará responsable de ninguna acción legal producto de un mal uso de los espacios ofrecidos. Si considera que el editor de un blog está poniendo un contenido que represente un abuso, contáctenos.