domingo, 27 de enero de 2013

Pandigitales, cromos y un poco de Benford (2)

Esta es la segunda parte de nuestra participación en el  Carnaval de MatemáticasEdición 3.1415926535, cuyo anfitrión es La Aventura de la Ciencia.

Estudiamos en la anterior entrada cuándo unos resultados de potencias se convierten todos en pandigitales en sentido amplio (con repetición) Llegamos a la conclusión de que esto ocurre aproximadamente cuando la potencia alcanza unas 50 cifras. A partir de este resultado sospechamos que la distribución de cifras no presentan uniformidad.

Estadísticas de cifras

Según lo anterior, hemos de tener cuidado en considerar como casi uniforme la aparición de cifras en las potencias de un número. Si así aparecieran, deberíamos encontrar más similitud entre lo que se espera de un fenómeno aleatorio y este que nos ocupa.

La uniformidad

Para estudiar de forma empírica la distribución de cifras en las potencias hemos elegido las bases entre 2 y 9, a cada una la hemos elevado a todos los exponentes comprendidos entre 1 y 50, pues son los cálculos antecedentes de la región en la que desaparecen los resultados que no son pandigitales. Para ello nos ha sido útil nuestra calculadora STCALCU para hoja de cálculo (que presentaremos próximamente). Hemos obtenido este resultado:



 (1) Las desviaciones típicas mayores se corresponden con los divisores del 10, 2 y 5. Después baja algo en los números no coprimos con 10: 4, 6 y 8. Por último, son más homogéneas en los coprimos, 3, 7 y 9. Esto tiene cierto sentido, pero no seguiremos por ahí.

(2) La distribución por cifras presentan un máximo en la cifra 1 (como en la Ley de Benford) de 11,2%, muy alejado del 8,7% de la cifra 0. Además, las cifras impares aparecen más que las pares. Esto lo afirmamos descriptivamente, pues una prueba chi-cuadrado no da significación.

(3) Casi todas las cifras presentan un máximo en la base igual a ellas. Las hemos destacado en rojo. Llama la atención el 14% del 5 y del 6. A eso no es ajeno el que en esas cifras coincidan las terminaciones de sus potencias sucesivas: 5, 25, 125, 625, … y 6, 36, 216,…Te puedes divertir intentando analizar otros casos.

Resumiendo, no aparece una uniformidad clara en los resultados, que más bien parecen sesgados hacia el 1 y los impares. ¿Se mantendrá esta tendencia para potencias mayores?

Hemos acumulado los resultados desde exponente 1 al 200, para ver cómo evoluciona la distribución de cifras, llegando a esto:



Aquí el panorama cambia algo: se percibe más uniformidad, aunque el 1 es la cifra que presenta mayor frecuencia. Por tanto debemos pensar que en las primeras potencias las cifras aparecen con frecuencias más alejadas del 10% y que eso es lo que produce que se tenga que llegar a unas 50 cifras para llegar a completar el carácter pandigital

La herencia

Otra pregunta sería pertinente: estas desviaciones de la uniformidad ¿se mantienen de cierta forma entre unas potencias y las posteriores dentro de una misma base? Si una cifra presenta una frecuencia en 2N sería interesante saber cómo se comporta en 2N+1. Pues bien, aquí tampoco se ve relación clara y significativa entre las frecuencias de un exponente  con el siguiente. Tomamos como ejemplo la base 5 haciendo trampa, porque podía esperase que la cifra 5 y la 0 se mantuvieran en sus frecuencias al crecer N.



Basta ver los máximos y mínimos para darnos cuenta de lo alejada de la uniformidad que está la distribución de cifras. Respecto a la herencia, si recorres los porcentajes correspondientes a cada cifra sí se percibe una cierta constancia en la tendencia. No es importante. Le hemos aplicado la prueba Chi-cuadrado y no nos da una diferencia significativa respecto a la homogeneidad máxima.

Así que, por si acaso, no uses potencias para extraer números psudoaleatorios, que te puedes llevar sorpresas.

Nuestra Ley de Benford

Y ya puestos, ¿cómo se comportan las primeras cifras de cada potencia? Recuerda que según la Ley de Benford (en la Red tienes muchas referencias a ella, por ejemplo en http://www.estadisticaparatodos.es/taller/benford/benford.html),

se podría esperar un  30% para el 1, un 17% para el 2, 12% para el 3 y así disminuyendo para el resto, como se ve en la gráfica incluida en la página recomendada.

Lo intentamos: elevaremos las distintas bases de 2 a 9 (podían ser otras) a todos los exponentes comprendidos entre 1 y 250 y recogeremos las estadísticas de la primera cifra.
Son estas:


Esto quiere decir que respecto a la Ley de Benford las potencias se comportan admirablemente. Hemos comparado nuestras frecuencias con la fórmula de Benford LOG((d+1)/d) y nos ha resultado:



No necesita comentario. El comportamiento de las estadísticas globales viene dado más por las cifras intermedias que por la primera, que sigue la distribución esperada. A partir de aquí puedes emprender un estudio del que sólo hemos esbozado el principio.