Ecuaciones de opinión

Publicado el Ignacio Mantilla Prada

Matemáticas contra el fraude

Al profesor de estadística de la Universidad de Chicago, Stephen Stigler, se le reconoce como el autor de la llamada “Ley de Stigler”, cuando dijo en 1980 que:

“Ningún descubrimiento científico recibe el nombre de quien lo descubrió en primer lugar”.

Este es justamente el caso de la conocida “Ley de Benford”, a la que me referiré a continuación, descubierta varias décadas antes de Benford, por el matemático y astrónomo canadiense Simon Newcomb (1835-1909).

La historia es bastante interesante y fue a raíz de una observación realizada por Newcomb que se conoció este resultado. En efecto, un día de 1881 él se encontraba consultando una de esas tablas de logaritmos que se usaban hasta antes de la aparición de las reglas de cálculo y las calculadoras, que venían presentadas en forma de un pequeño libro, para realizar unos cálculos y observó que las primeras páginas de la vieja tabla que tenía en sus manos estaban más usadas, sucias y desgastadas que las finales. ¿Por qué razón? Después de un análisis detallado, Newcomb concluyó que los dígitos iniciales de los números que estaba utilizando para estudiar las observaciones de los astros no aparecían con la misma frecuencia: el dígito 1 aparecía más veces, seguido del 2; observó también que el 9 era el dígito que menos aparecía al inicio de los números utilizados, concluyendo así que la ubicación de los dígitos no era equiprobable. 

La pregunta que se formuló Newcomb fue: ¿es más probable que un número empiece por el dígito 1 que por otro dígito como el 7, por ejemplo? En principio es lógico pensar que cualquier dígito tiene la misma probabilidad de ser el primero de un número elegido en forma aleatoria, sin embargo Newcomb dedujo, sin aportar una explicación matemática formal, que el dígito inicial no nulo más probable de aparecer es el 1, el segundo más probable es el 2, luego el 3 y así sucesivamente hasta el 9; y expresó que la probabilidad de que uno de los números buscados tenga como primera cifra no nula C, se puede calcular con la siguiente fórmula:

P = log (1 + 1/C).

Posteriormente, en 1938, el físico Frank Benford recuperó las observaciones de Newcomb y publicó esta propiedad, que tomó el nombre de “Ley de Benford”.

Esta curiosa propiedad se verifica para cualquier lista de números que se obtenga como resultado de datos tomados en forma aleatoria, por ejemplo se ha verificado con estadísticas deportivas, valores de impuestos, constantes y magnitudes físicas, longitudes de ríos y carreteras, poblaciones de países y ciudades, cifras económicas.

Los datos que no se ajustan a la Ley de Benford, son los provenientes de distribuciones uniformes o normales como son por ejemplo, los números de loterías, listas telefónicas o números de identidad.

Pero sorprendentemente se han descubierto aplicaciones insospechadas de la Ley de Benford que han sido objeto de investigación en las ciencias de la computación, área de gran actividad actual y particularmente dentro de la criptografía. También ha sido usada para detectar fraudes en datos electorales y en auditorías fiscales.

Uno de los usos más frecuentes es a través de pruebas repetidas con datos similares para verificar el cumplimiento de la ley en algunos conjuntos de datos; así, cuando no se cumpla o se presente una importante desviación, se puede sospechar que hay algo anómalo o que hay cifras que han sido manipuladas en la información, lo que facilita la identificación de datos que deben ser revisados rigurosamente. Como ejemplo, si en los resultados de unos comicios electorales la distribución de los primeros dígitos no se ajusta a la Ley de Benford, es conveniente llevar a cabo un reconteo de votos para comprobar los resultados.

Una de las principales aplicaciones de la Ley de Benford se da en la detección de fraudes en las finanzas, ya que en 1992 se demostró que los datos financieros encajaban perfectamente en la Ley de Benford, lo cual permite identificar cambios y alteraciones en la declaración de impuestos o en las cifras que reportan las empresas periódicamente. La aparición de cifras que contienen dígitos con frecuencias que violan la Ley de Benford, no necesariamente significa un fraude, pero sí se convierte en un buen indicio que amerita llevar a cabo una investigación.

Recientemente la Ley de Benford ha tenido una importante aplicación a las cifras que arroja el comportamiento del Covid-19. Por ejemplo el número de muertes atribuidas a la epidemia sigue una distribución tal, que el ajuste a la Ley de Benford de las frecuencias de los casos reportados en los diferentes países es indiscutible. En la  página web https://coronavirus.app/map puede consultarse, por ejemplo, el ajuste de las frecuencias de los casos de afectados y de muertes producidas reportados de Covid-19 en Colombia respecto a los esperados en la Ley de Benford, como lo indica la siguiente imagen.

Así, la Ley de Benford se convierte en una poderosa herramienta que ayuda para predecir cifras y tomar a tiempo medidas de control contra el coronavirus en una población.

@MantillaIgnacio

Comentarios