Keith Devlin
Ediciones Robinbook. 2002
Páginas 310, 311, 312 y 313.
Los asombrosos Bernoulli
El desarrollo de las matemáticas del azar durante el siglo XVIII debe mucho a dos miembros de una de las familias más notables de todos los tiempos. «Los asombrosos Bernoulli» suena a nombre de un número circense. Sin embargo, los Bernoulli no llevaron a cabo sus hazañas deslumbrantes en el trapecio ni en el alambre, sino en las matemáticas.
En total fueron ocho los miembros de la familia que se distinguieron en matemáticas. El padre de la familia fue Nicolas Bernoulli, un comerciante adinerado que vivió en Basilea (Suiza) de 1623 a 1708. Sus tres hijos Jacob, Nicolas y Johann se convertirían en matemáticos de primer rango.
Una de las contribuciones más significativas de Jacob a las matemáticas es su «ley de los grandes números», un teorema fundamental de la teoría de la probabilidad. Los otros miembros de la familia que contribuyeron a las nuevas matemáticas del azar fueron el hijo de Johann, Daniel, conocido también por su descubrimiento de la «ecuación de Bernoulli», que explica por qué se mantiene un aeroplano en el aire, y el sobrino de Jacob, Nicolas (otro Nicolas, fueron cuatro en total). Jacob y Daniel se interesaron por aspectos distintos de lo que era esencialmente la misma cuestión: ¿como puede aplicarse la teoría de la probabilidad de los juegos de azar, en la que las probabilidades se pueden calcular con exactitud, al mundo real, bastante más desordenado?
El problema especifico del que se ocupó Jacob estaba ya implícito en el anterior trabajo de John Graunt sobre los indices de mortalidad. Graunt era muy consciente de que los datos de los que disponía, aunque extensos, representaban solamente una muestra de toda la población: la población de Londres. E incluso para ésta los datos se referían a un período de tiempo determinado. A pesar de eso, la naturaleza limitada de los datos no le impidió efectuar generalizaciones que sobrepasaban el horizonte de los propios datos. Al extrapolar los datos de los registros de defunción para obtener conclusiones aplicables a todo el país y a periodos más amplios de tiempo. Graunt fue uno de los primeros analistas que llevaron a cabo lo que ahora llamamos la inferencia estadística: sacar conclusiones relativas a una gran población basadas en datos recogidos de una muestra pequeña. Para que un proceso de ese tipo permita obtener conclusiones fiables, la muestra deberá ser «representativa de la población completa». ¿Cómo puede elegirse tal muestra representativa?
Otra cuestión relacionada con la anterior es la de si una muestra más grande garantiza un resultado más fiable y, si es así, cuán grande ha de ser dicha muestra. Jacob Benoulli planteó dicha cuestión en una carta dirigida a su amigo Leibniz (el del cálculo) en 1703.
En su respuesta pesimista, Leibniz hizo notar que «la naturaleza ha establecido pautas que se originan en la repetición de los sucesos, pero válidas solamente para la mayoría». Fue la frase «solamente para la mayoría» la que parecía presidir el análisis matemático de muchas probabilidades de la «vida real».
Sin amilanarse por el tono descorazonador de la respuesta de Leibniz, Bernoulli prosiguió su investigación. En lo que iban a ser los dos años restantes de su vida, hizo un progreso considerable. Después de su muerte en 1705, su sobrino Nicolas Bernoulli organizó los resultados de su tío en forma publicable, aunque la tarea fue tan desafiante que le llevó ocho años antes de que el libro El arte de la conjetura fuera publicado en 1713, figurando Jacob como su autor.
Jacob empezó reconociendo que la cuestión que habla planteado a Leibniz se dividía realmente en dos partes, dependiendo de dos nociones distintas de la probabilidad. En primer lugar, estaba la que Jacob llamó probabilidad a priori, una probabilidad calculada con anterioridad al acontecimiento. ¿Era posible calcular una probabilidad exacta del resultado de un suceso antes de que se produjera? En el caso de los juegos de azar, la respuesta es afirmativa. Pero, como Leibniz había hecho notar correctamente, las probabilidades calculadas con antelación para sucesos tales como la enfermedad o la muerte podían ser fiables «solamente para la mayoría».
Jacob utilizó el término probabilidad a posteriori para referirse al otro tipo de probabilidad, la que se calcula después del suceso. Dada una muestra de una población, si se calcula la probabilidad para dicha muestra, ¿cuán fiable es esa probabilidad en cuanto a la población en su totalidad? Supongamos por ejemplo que nos dan una bolsa grande y opaca que contiene canicas rojas y azules. Sabemos que hay en total 5.000 canicas, pero no sabemos cuántas existen de cada color. Extraemos al azar una de la bolsa, y resulta ser roja. La devolvernos a la bolsa, sacudirnos ésta, y luego volvemos a sacar una bola. Esta vez tenemos una de color azul. Repetimos el proceso, sacudiendo, sacando una bola, volviéndola a introducir en la bolsa, 50 veces, y hallamos que en 31 ocasiones hemos obtenido una bola roja y en 19 una azul. Esto nos lleva a sospechar que hay unas 3.000 canicas rojas y unas 2.000 azules, de forma que la probabilidad a posteriori de sacar una bola roja al azar es de 3/5. Pero ¿cuál es el grado de confianza que podemos tener respecto de esta conclusión? ¿Estaríamos más seguros si hubiéramos probado con un número mayor de bolas, 100 por ejemplo?
Bernoulli demostró que tomando una muestra suficientemente grande, se puede aumentar el grado de confianza de la probabilidad calculada hasta el valor deseado. De modo más preciso, al aumentar el tamaño de la muestra podemos aumentar hasta cualquier nivel nuestra confianza de que la probabilidad calculada a partir de la muestra se halla dentro de cualquier valor estipulado de la probabilidad verdadera. Éste es el resultado conocido como ley de los grandes números, y es un teorema central de la teoría de la probabilidad.
En el caso de las 5.000 bolas de la bolsa, si hay exactamente 3.000 rojas y 2.000 azules, Bernoulli calculó cuántas bolas hay que extraer para estar seguros, con un grado de probabilidad menor que uno entre mil, de que la distribución hallada en la muestra dista menos del 2% de la verdadera proporción 3:2. La respuesta que obtuvo fue 25.550 extracciones. Esto es mucho más que el número total de bolas colocadas inicialmente en la bolsa. Así, en este ejemplo, sería mucho más eficaz contar simplemente todas las bolas. No obstante, el resultado teórico de Bernoulli muestra que tomando un número lo bastante grande es posible calcular las probabilidades de una muestra de forma que hasta un grado cualquiera de certeza (aparte de la certeza absoluta), la probabilidad calculada esté dentro del rango de cualquier grado de seguridad en relación con la probabilidad verdadera.
El desarrollo de las matemáticas del azar durante el siglo XVIII debe mucho a dos miembros de una de las familias más notables de todos los tiempos. «Los asombrosos Bernoulli» suena a nombre de un número circense. Sin embargo, los Bernoulli no llevaron a cabo sus hazañas deslumbrantes en el trapecio ni en el alambre, sino en las matemáticas.
En total fueron ocho los miembros de la familia que se distinguieron en matemáticas. El padre de la familia fue Nicolas Bernoulli, un comerciante adinerado que vivió en Basilea (Suiza) de 1623 a 1708. Sus tres hijos Jacob, Nicolas y Johann se convertirían en matemáticos de primer rango.
Una de las contribuciones más significativas de Jacob a las matemáticas es su «ley de los grandes números», un teorema fundamental de la teoría de la probabilidad. Los otros miembros de la familia que contribuyeron a las nuevas matemáticas del azar fueron el hijo de Johann, Daniel, conocido también por su descubrimiento de la «ecuación de Bernoulli», que explica por qué se mantiene un aeroplano en el aire, y el sobrino de Jacob, Nicolas (otro Nicolas, fueron cuatro en total). Jacob y Daniel se interesaron por aspectos distintos de lo que era esencialmente la misma cuestión: ¿como puede aplicarse la teoría de la probabilidad de los juegos de azar, en la que las probabilidades se pueden calcular con exactitud, al mundo real, bastante más desordenado?
El problema especifico del que se ocupó Jacob estaba ya implícito en el anterior trabajo de John Graunt sobre los indices de mortalidad. Graunt era muy consciente de que los datos de los que disponía, aunque extensos, representaban solamente una muestra de toda la población: la población de Londres. E incluso para ésta los datos se referían a un período de tiempo determinado. A pesar de eso, la naturaleza limitada de los datos no le impidió efectuar generalizaciones que sobrepasaban el horizonte de los propios datos. Al extrapolar los datos de los registros de defunción para obtener conclusiones aplicables a todo el país y a periodos más amplios de tiempo. Graunt fue uno de los primeros analistas que llevaron a cabo lo que ahora llamamos la inferencia estadística: sacar conclusiones relativas a una gran población basadas en datos recogidos de una muestra pequeña. Para que un proceso de ese tipo permita obtener conclusiones fiables, la muestra deberá ser «representativa de la población completa». ¿Cómo puede elegirse tal muestra representativa?
Otra cuestión relacionada con la anterior es la de si una muestra más grande garantiza un resultado más fiable y, si es así, cuán grande ha de ser dicha muestra. Jacob Benoulli planteó dicha cuestión en una carta dirigida a su amigo Leibniz (el del cálculo) en 1703.
En su respuesta pesimista, Leibniz hizo notar que «la naturaleza ha establecido pautas que se originan en la repetición de los sucesos, pero válidas solamente para la mayoría». Fue la frase «solamente para la mayoría» la que parecía presidir el análisis matemático de muchas probabilidades de la «vida real».
Sin amilanarse por el tono descorazonador de la respuesta de Leibniz, Bernoulli prosiguió su investigación. En lo que iban a ser los dos años restantes de su vida, hizo un progreso considerable. Después de su muerte en 1705, su sobrino Nicolas Bernoulli organizó los resultados de su tío en forma publicable, aunque la tarea fue tan desafiante que le llevó ocho años antes de que el libro El arte de la conjetura fuera publicado en 1713, figurando Jacob como su autor.
Jacob empezó reconociendo que la cuestión que habla planteado a Leibniz se dividía realmente en dos partes, dependiendo de dos nociones distintas de la probabilidad. En primer lugar, estaba la que Jacob llamó probabilidad a priori, una probabilidad calculada con anterioridad al acontecimiento. ¿Era posible calcular una probabilidad exacta del resultado de un suceso antes de que se produjera? En el caso de los juegos de azar, la respuesta es afirmativa. Pero, como Leibniz había hecho notar correctamente, las probabilidades calculadas con antelación para sucesos tales como la enfermedad o la muerte podían ser fiables «solamente para la mayoría».
Jacob utilizó el término probabilidad a posteriori para referirse al otro tipo de probabilidad, la que se calcula después del suceso. Dada una muestra de una población, si se calcula la probabilidad para dicha muestra, ¿cuán fiable es esa probabilidad en cuanto a la población en su totalidad? Supongamos por ejemplo que nos dan una bolsa grande y opaca que contiene canicas rojas y azules. Sabemos que hay en total 5.000 canicas, pero no sabemos cuántas existen de cada color. Extraemos al azar una de la bolsa, y resulta ser roja. La devolvernos a la bolsa, sacudirnos ésta, y luego volvemos a sacar una bola. Esta vez tenemos una de color azul. Repetimos el proceso, sacudiendo, sacando una bola, volviéndola a introducir en la bolsa, 50 veces, y hallamos que en 31 ocasiones hemos obtenido una bola roja y en 19 una azul. Esto nos lleva a sospechar que hay unas 3.000 canicas rojas y unas 2.000 azules, de forma que la probabilidad a posteriori de sacar una bola roja al azar es de 3/5. Pero ¿cuál es el grado de confianza que podemos tener respecto de esta conclusión? ¿Estaríamos más seguros si hubiéramos probado con un número mayor de bolas, 100 por ejemplo?
Bernoulli demostró que tomando una muestra suficientemente grande, se puede aumentar el grado de confianza de la probabilidad calculada hasta el valor deseado. De modo más preciso, al aumentar el tamaño de la muestra podemos aumentar hasta cualquier nivel nuestra confianza de que la probabilidad calculada a partir de la muestra se halla dentro de cualquier valor estipulado de la probabilidad verdadera. Éste es el resultado conocido como ley de los grandes números, y es un teorema central de la teoría de la probabilidad.
En el caso de las 5.000 bolas de la bolsa, si hay exactamente 3.000 rojas y 2.000 azules, Bernoulli calculó cuántas bolas hay que extraer para estar seguros, con un grado de probabilidad menor que uno entre mil, de que la distribución hallada en la muestra dista menos del 2% de la verdadera proporción 3:2. La respuesta que obtuvo fue 25.550 extracciones. Esto es mucho más que el número total de bolas colocadas inicialmente en la bolsa. Así, en este ejemplo, sería mucho más eficaz contar simplemente todas las bolas. No obstante, el resultado teórico de Bernoulli muestra que tomando un número lo bastante grande es posible calcular las probabilidades de una muestra de forma que hasta un grado cualquiera de certeza (aparte de la certeza absoluta), la probabilidad calculada esté dentro del rango de cualquier grado de seguridad en relación con la probabilidad verdadera.
Jacob Bernouilli nació el 27 de diciembre 1654.