lunes, 5 de marzo de 2007

Encuestas

Recientemente, se hizo una encuesta en un foro de internet donde salía un 20% de votantes a IU. Teniendo en cuenta que este partido tiene aproximadamente un 5% de los votos, algo estaba mal en la encuesta.

Para que un sondeo tenga valor, debe realizarse aleatoriamente. Los componentes de aquel foro no eran una muestra insesgada de la población. Por ejemplo, gran parte de la población no participa en los foros (personas mayores, no poseedores de ordenador, quizá personas de bajo nivel cultural). Hay otros aspectos, como la ideología de los moderadores del foro (o del medio de comunicación) donde se hace la encuesta, que también pueden influir.

Por ejemplo, hay sondeos en medios afines a la derecha donde el 98% de la gente coincide con las ideas del PP. Esos sondeos están claramente sesgados. Esos sondeos no valen de nada.En algunos casos, en esos programas, hay un sociólogo, que sabe esto, y se calla, prestándose a una payasada.

Hace 70 años hubo una encuesta en EEUU a 2.000.000 de habitantes en que Franklin Delano Roosevelt salía perdedor. Naturalmente Roosevelt ganó. El elemento que hizo que la encuesta fuera sesgada fue que se hizo por telefono, y no todo el mundo tenía telefono.No importa cómo de grande sea una muestra. Si es sesgada no sirve para nada.

De hecho, una muestra puede ser sesgada aunque sea una muestra infinita. Por ejemplo, si yo escojo como muestra todos los números racionales entre 0 y 1, tengo una muestra infinita. Y en esa muestra no existe un sólo número irracional. Sin embargo ¡existen números irracionales entre 0 y 1!

Esto prueba que no sirve de nada que la muestra tenga un tamaño tan grande como se quiera. Si la muestra está sesgada, los resultados no sirven de nada.

viernes, 2 de marzo de 2007

El teorema de Gödel (I)

Hofstadter compara el teorema de Gödel a una curiosa idea. Supone un gramófono de alta fidelidad que pueda producir todos los sonidos posibles. El gramófono se llama X y hay un disco que se llama “No puedo ser escuchado por el gramófono X”. Resulta que si se pone ese disco en el gramófono, éste produce unos sonidos que destruyen el propio gramófono. Es posible usar un gramófono de baja fidelidad, que no producirá esos sonidos y no se autodestruirá. Pero entonces ya no será un gramófono que produzca todos los sonidos posibles.

El sistema de Gödel es una parte de la teoría de la computación. Uno de los conceptos fundamentales para entender el tema de la teoría de la computación es lo que los matemáticos llaman conjunto recursivamente enumerable.

¿Qué es un conjunto recursivamente enumerable? Un conjunto A es recursivamente enumerable si la función f(x) :

f(x) = 1 ( si x pertenece a A)
f(x) = indefinido (si x no pertenece a A)

es computable

Que un conjunto sea recursivamente enumerable es equivalente a que el conjunto sea generable por computador. Un conjunto es recursivo, si tanto él como su complemento son recursivamente enumerables.

En muchos casos el concepto de recursivamente enumerable se usa solo para subconjuntos de N (el conjunto de los números naturales). Por ejemplo, los primos son un conjunto recursivo en N. Consideremos otro conjunto, como los números que forman la sucesión de Fibonacci.

0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233…

Los números de Fibonacci consisten en una serie en la que todo número excepto los dos primeros es la suma de los dos precedentes.

1+1=2
1+2=3
2+3=5
3+5= 8

Yo mismo he ideado un programa en Q-Basic que genera la serie de Fibonacci. La serie de Fibonacci es un típico ejemplo de programa sencillo y también un ejemplo de conjunto recursivamente enumerable. De hecho, un conjunto es recursivamente enumerable si puede ser generado por algún programa. En su libro, Hofstadter produce la serie de Fibonacci por lo que él llama una red de transición recursiva. De hecho, la serie de Fibonacci es un programa muy sencillo, que es usado en los lenguajes de programación para aprendices. Consideremos otro programa de Q-Basic . Un programa que produzca la serie de los números primos hasta un número dado, que el usuario debe introducir en el ordenador. Por ejemplo, el conjunto de los números primos es recursivamente enumerable. Pero ¿el conjunto de los números no primos es recursivamente enumerable? Sí, basta con generar un programa que nos dé todo número m, tal que exista un número n (mayor que 1 y menor que m) para el que se cumpla que el resto de m dividido entre n da 0. Cuando sucede a un conjunto que tanto sus elementos como los elementos que no pertenecen a ese conjunto (los primos como los no primos) son generados mediante sus respectivos programas de ordenador, se dice que ese conjunto es recursivo. Se dice también que tanto el conjunto (los primos) como su complementario (los no primos) son recursivamente enumerables. Es decir, que si el conjunto P es recursivamente enumerable y el conjunto complementario de P es, también, recursivamente enumerable, P es recursivo.

Se plantea la interrogante de si todos los conjuntos recursivamente enumerables son, a su vez recursivos. Lo cierto es que no. Existen conjuntos cuyos elementos son generables mediante un programa, pero no tenemos un programa para generar todos y cada uno de los elementos que no pertenecen al conjunto.

Hofstadter supone que tenemos un conjunto I (por ejemplo los primos) y un conjunto O (Por ejemplo, los números compuestos). Juntos I y O abarcan todos los números naturales. El problema es que hay conjuntos en que podemos generar todos los números del conjunto I, pero no hay programa para generar todos los números del conjunto O.

“Es importante fijarse en que, si los miembros del conjunto I fueran generados siempre en orden creciente, podríamos en todo momento caracterizar a O. El problema es que muchos conjuntos r.e. [recursivamente enumerables] son generados a través de métodos
que diseminan los elementos en un orden arbitrario, así que nunca se sabe si un número omitido largo tiempo obtendrá, esperando un poco más, su inclusión”

Si alguien, al tropezar con estas reflexiones, se asombra de que sea posible que tengamos programa para generar un conjunto pero no para generar su complementario, no debe preocuparse, ya que el mismo Hoftadster confiesa su asombro al ver que no todos los complementos de conjuntos recursivamente enumerables eran recursivamente enumerables. Lo compara a una figura, tal que su borde se pudiera discernir, pero no pudiera verse el borde del fondo que hay entorno a la figura.

“Resultó que yo estaba acertado acerca de los primos, pero equivocado en general, lo cual me asombró, y continúa asombrándome todavía hoy”

Por ejemplo, para todo programa, el conjunto de los inputs para los cuales el programa se para es recursivamente enumerable. Pero no es necesariamente recursivo. Por ejemplo, hay muchos programas, que para determinados inputs, se pierden en un bucle infinito.

Gödel supuso que el conjunto de las verdades matemáticas era recursivamente enumerable. y se dispuso a fabricar un sistema lógico (el equivalente de un programa informático) para generar todas las verdades y sólo las verdades de la matemática. Este programa, además, decidiría, dada una proposición matemática, si ésta era verdaera o no.

La idea de Gödel puede parecer, en principio, muy alejada de la de la Biblioteca de Babel, pero, como veremos, tiene algunas semejanzas. (en realidad algo análogo a lo que lo que Gödel se planteaba parece incompatible con la idea que tenemos de la Biblioteca de Babel: se trataría de buscar un procedimiento para discriminar todos los volúmenes de la Biblioteca que dicen verdad). La Biblioteca de Babel no existía en la realidad, pero era un objeto que podíamos imaginar. Del mismo modo, la Biblioteca de Gödel, es decir aquella Biblioteca que contiene todas las verdades de la aritmética es un objeto concebible, ya que Gödel dio las reglas de su codificación. De hecho, para ser más exactos habría que decir que el procedimiento para discriminar cuáles son las verdades en el mundo de la Biblioteca de Gödel es la demostración lógica, que viene a ser una forma restringida y más técnica de la demostración filosófica. La forma de codificar la Biblioteca de Gödel puede parecer alambicada. En primer lugar hay que reducir todas las verdades de la aritmética (en principio, restrinjámoslas a las afirmaciones acerca de números naturales) a fórmulas lógicas. Esto es esencial, ya que si queremos que las verdades de la aritmética sean demostradas hay que reducirlas inevitablemente a fórmulas lógicas. En segundo lugar, Gödel inventa un código por el cual reduce las fórmulas lógicas a números naturales. Tenemos pues tres niveles:

1) En primer lugar todas las verdades aritméticas sobre los números naturales
2) En segundo lugar las fórmulas lógicas que expresan cada una de esas verdades
3) En tercer lugar los números naturales que codifican esas fórmulas lógicas

Aquí encontramos una suerte de autorreflexión, ya que los números naturales sirven para codificar verdades sobre los números naturales. Como veremos, esto dará lugar a una paradoja que será el resultado fundamental de Gödel.

jueves, 1 de marzo de 2007

Las paradojas de la lógica y los ordenadores

Uno de los problemas fundamentales de las matemáticas son las paradojas. Un ejemplo visual de lo que es una paradoja es la llamada paradoja del mapa, citada por Borges en su ensayo “Magias parciales del Quijote”

“Las invenciones de la filosofía no son menos fantásticas que las del arte: Josiah Royce, en el primer volumen de la obra The world and the individual (1899), ha formulado la siguiente: ‘Imaginemos que una porción del suelo de Inglaterra ha sido nivelada perfectamente y que en ella traza un cartógrafo un mapa de Inglaterra. La obra es perfecta; no hay detalle del suelo de Inglaterra, por diminuto que sea, que no esté registrado en el mapa; todo tiene ahí su correspondencia. Este mapa, en tal caso, debe contener un mapa del mapa, que debe contener un mapa del mapa del mapa, y así hasta lo infinito’...”

Un ejemplo literario de paradoja autorreflexiva aparece en la novela Cien años de soledad. Al final de Cien años de soledad de García Márquez, un personaje descifra unas escrituras cuyo contenido es precisamente Cien años de soledad. ¿Cómo la novela Cien años de soledad puede ser un libro que está dentro de la propia novela? Igualmente, el Quijote aparece dentro del Quijote como una novela.

Estas paradojas son formas gráficas de visualizar lo que son las verdaderas paradojas de la matemática.

La mayoría de las paradojas están relacionadas con el tema de la autorreflexión. Se trata de oraciones que, de algún modo, se refieren a sí mismas (del mismo modo que el mapa de Inglaterra contenía un mapa de sí mismo). Una paradoja célebre surge de la siguiente frase:

El número más pequeño que no se puede expresar con menos de 25 símbolos

Pero esta frase define a ese número con menos de 25 símbolos (si una palabra es igual a un símbolo), por lo que se produce, una situación paradójica. Algo parecido sucede con la siguiente frase:

Los números a los que no se hace referencia en esta frase

Efectivamente, si la frase no hace referencia a un número, entonces hace referencia a él. Y si hace referencia a él, entonces no hace referencia a él. Hay otra frase muy curiosa, la siguiente:

Estha fraze tiene tres errores

¿Dónde está el tercer error? Resulta que el tercer error es que el enunciado de la frase dice que la frase tiene tres errores, cuando solo tiene dos. Pero si esto es verdadero, ¡entonces decir que hay tres errores ya no es un error! Por tanto habría dos errores. Un momento ¡pero entonces hay tres errores! Esto no acaba nunca.

Otras paradojas, más al nivel del lenguaje común, pueden ser: Perdonen las disculpas. O la frase ¿Contestará a esta pregunta con un no? (esto me recuerda el chiste del gallego al que le preguntan si es verdad que los gallegos nunca contestan claramente con un sí o un no, y el gallego contesta: “No sé, puede”).

Imaginemos la frase:

Este enunciado no es autorreferente

No existe una forma de que un enunciado explicite el hecho de no ser autorreferente, sin que el enunciado sea autorreferente. De parejo modo, no hay forma de decir que un objeto no existe sin otorgarle una existencia como objeto del lenguaje (pensemos que tenemos símbolos para hablar de cosas que nadie ha visto, como Dios o el conjunto vacío).

El problema de las proposiciones autorreflexivas es que pueden analizarse de dos formas contradictorias. Por ejemplo, véase la proposición “Este enunciado es falso”.

1) Este enunciado Es falso
-----sujeto----------- predicado

Ésta sería una lectura sintáctica (hablando según lo haría un lingüista más que como un lógico). Hasta aquí no hay ningún problema. No es para hacerse ilusiones, ciertamente, ya que esto también es cierto para “Las ideas verdes duermen furiosamente”. Bien, desde el punto de vista sintáctico la frase es correcta. Ahora bien, si hacemos una lectura semántica, nos encontramos con que, la estructura profunda de esta oración sería:

2) “Este enunciado es falsoEs falso
----------sujeto------------------ predicado

Puesto que el enunciado es autorreferente. Si el argumento “Este enunciado es falso” es falso, entonces, por el principio del tercio excluso, no tiene más remedio que ser verdadero. Pero, en cuanto verdadero, no hace otra cosa que afirmar su propia falsedad.

.¿Qué sucede con nuestros amigos los ordenadores? ¿Entienden las paradojas? Pues va a ser que no. Un computador tiene unos transistores, cada uno de los cuales, tiene dos estados, encendido y apagado. No puede ser que un transistor esté, a la vez, encendido y apagado. El computador asigna un valor de verdad a una proposición, 1 ó 0, pero no puede asignarle, a la vez, los dos valores de verdad. Suponiendo que pudiéramos comunicar al computador una paradoja (algo complicado) lo más probable es que éste quedara en un estado en el que se perdería en un bucle infinito.

¿Qué es un bucle infinito? Una analogía se encuentra en el ensayo de Borges “Magias parciales del Quijote”.

“Algo parecido ha obrado el azar en Las Mil y Una Noches. Esta compilación de historias fantásticas duplica y reduplica hasta el vértigo la ramificación de un cuento central en cuentos adventicios, pero no trata de graduar sus realidades, y el efecto (que debió ser muy profundo) es superficial, como una alfombra persa. Es conocida la historia liminar de la serie: el desolado juramento del rey, que cada noche se desposa con una virgen que hace decapitar en el alba, y la resolución de Shahrazad, que lo distrae con fábulas, hasta que encima de los dos han girado mil y una noches y ella le muestra su hijo. La necesidad de copiar mil y un secciones obligó a los copistas de la obra a interpolaciones de todas clases. Ninguna tan perturbadora como la de la noche 602, mágica entre las noches. En esta noche, el rey oye de boca de la reina su propia historia. Oye el principio de la historia, que abarca a todas las demás, y también -de monstruoso modo- a sí misma. ¿Intuye claramente el lector la vasta posibilidad de esa interpolación, el curioso peligro? Que la reina persista y el inmóvil rey oirá para siempre la trunca historia de Las Mil y Una Noches, ahora infinita y circular...”

En un bucle infinito, el ordenador hace lo siguiente: Se encuentra en un proceso que, en un momento dado X, le manda recomenzar el proceso hasta que llega a X donde vuelve a recomenzar el proceso hasta que llega a X...¿tiene esto final? No, naturalmente, salvo que en muchos casos el ordenador nos dice que la memoria ha sido desbordada.

El hecho de que los ordenadores se metan en un bucle infinito cuando aparece una paradoja nos indica que no pueden entenderla. Esto aparece explicitado en famosos descubrimientos matemáticos como el teorema de Gödel o el problema de la parada de las máquinas de Turing.