Epistemología e informática, Claudio Gutiérrez, Costa Rica

La lógica y el conocimiento

Claudio Gutiérrez book


Propósitos:

Este capítulo busca familiarizar al estudiante con el papel fundante de la lógica en el método científico y en la elaboración y presentación de los resultados de la ciencia. En particular, se busca agudizar su percepción de las funciones reciprocamente complementarias del apoyo empírico y la coherencia lógica como los dos elementos arquitecturales de los sistemas de conocimientos científicos. Asimismo, se persigue hacerle comprender la función de la ontología en la ciencia, a saber, la confección de conceptos que se presten a una adecuada categorización de los distintos campos del conocimiento. Igualmente se busca poner en contacto a los estudiantes con las limitaciones inherentes a la lógica, especialmente en relación con los problemas derivados del intento de comprender el cambio en un universo poblado por agentes que interactúan entre sí.


Introducción

El ser humano tiene una tendencia avasalladora hacia la integración de sus creencias en redes de conexiones estrechamente armadas. A esas redes de creencias las solemos llamar el "sistema de conocimiento" de cada persona. La epistemología se interesa por ellas, desde el punto de vista del valor de verdad que puedan poseer, e indaga por su validez usando dos criterios complementarios: el empírico y el lógico. Estos dos criterios, la correspondencia con la realidad del mundo (criterio empírico) y la congruencia recíproca entre las distintas creencias (criterio lógico) están basados a su vez en un fundamento pragmático más profundo: la necesidad que tiene el ser humano de actuar eficientemente para poder sobrevivir en su entorno. Podríamos decir que el material de que están hechas nuestras creencias está destilado de nuestra experiencia, pero es organizado por la lógica, que busca armonizar en forma coherente y simple sus distintas partes para poder emplearlas exitosamente en la satisfacción de nuestras necesidades y aspiraciones.

Los filósofos suelen hacer una distinción, un poco problemática, entre "conocimiento" y "creencia". Quienes postulan la distinción consideran el conocimiento como creencia verdadera . Según eso, puede haber creencias que no son conocimiento (las creencias erróneas) pero todo conocimiento es creencia. Esta distinción presenta muy serios problemas. En primer lugar, es muy discutible la aceptación de algo como verdadero . Ténganse en cuenta al respecto todo lo que hemos dicho sobre el carácter conjetural del conocimiento mejor fundado que tenemos, el conocimiento científico (por ejemplo, según Popper). Nuestras mejores teorías, que tomamos como verdaderas (mejor sería decir, en las que creemos o confiamos) pueden resultar más tarde o más temprano desbancadas por otras teorías más refinadas o en algún sentido más confiables. Por otro lado, la creencia, si es suficientemente viva, nos parece "desde adentro" indistinguible del conocimiento (o sea de la creencia verdadera).

Otra manera de decir esto es afirmar que todo el mundo que cree en serio, considera sus creencias como verdaderas, o sea –según la distinción discutida–, como conocimiento. De ahí que en la práctica, podemos hacer epistemología muy completa sin siquiera mencionar la palabra conocimiento ; podríamos, por ejemplo, hablar de creencias más o menos bien confirmadas, creencias sistemáticas, creencias contradictorias, y entenderíamos perfectamente que estamos hablando del grado de justificación de los enunciados con que –nosotros u otras personas– nos sentimos comprometidos.

Más importante que el uso de la palabra verdad , que pareciera más bien pertenecer al vocabulario religioso, nos parece el uso de expresiones epistemológicas como "enunciados congruentes" o "incongruentes", enunciados con "apoyo experimental", "que han demostrado su temple" o que son "aceptados por la comunidad científica" (como los paradigmas). En particular, cuando nos preocupamos por el sistema de creencias de una persona, una sociedad, o una comunidad científica, nos interesará fundamentalmente destacar tres cosas: su relación con la experiencia (si están dotadas de apoyo experimental u observacional controlado); si son congruentes entre sí (de modo que se refuercen recíprocamente) y, finalmente, si la red de enunciados que las expresa es suficientemente simple (si no es redundante, si no hay "epiciclos" en el sistema o partes que sólo sirven para evitar la refutación empírica de una teoría). El apoyo empírico, la sistematicidad, y la simplicidad parecen ser las virtudes cardinales de los sistemas científicos y, por ende, de las redes de creencias que mejor garantizan nuestra supervivencia.

En el presente capítulo concentramos nuestra atención en el requisito de sistematicidad. El que unas creencias se apoyen unas a otras, que no tengan oposiciones entre sí (de modo que una niegue lo que otra afirme), que algunas puedan expresar de manera compendiosa a muchas otras (ser más general que ellas), son propiedades muy especiales de las creencias (o del conocimiento) que nos interesa destacar con un nombre y un punto de vista. Se trata del punto de vista lógico; y estamos hablando de la disciplina que llamamos lógica . La lógica interesa a la ciencia de dos maneras: como herramienta analítica fundamental, para examinar qué se sigue de qué y –en consecuencia– si algo corrobora otra cosa, la refuta o es indiferente con respecto a ella; todo esto se necesita determinar para decidir si una creencia, o grupo de creencias, está justificada. Pero también le interesa a la ciencia la lógica para asegurarse de que la presentación del conocimiento es eficiente e integral. Cuando un científico, o grupo de científicos, desea comunicar sus creencias, debe hacerlo organizando el cuerpo de conocimientos de una manera lógica, es decir, ordenada, organizada, jerarquizada, coherente, y lo más completa posible. Nótese, de paso, que estas inquietudes no tienen nada que ver con el contenido mismo de las creencias que queremos presentar: cualquiera que este sea, nos interesa que los oyentes –o lectores– encuentren la presentación (oral o escrita) ordenada, jerarquizada, no repetitiva, coherente, etc.

La omnipresencia de la lógica en el quehacer del científico experimental y del científico teórico, del que crea ciencia y del que la presenta o trasmite, tiene dos consecuencias importantes que nos interesa resaltar. Una es, la extraordinaria uniformidad que produce entre las distintas disciplinas científicas: todas ellas –sea física, biología, sociología, matemáticas, o cualquiera otra– necesitan las herramientas del análisis lógico para decidir qué se sigue de qué, qué refuta a qué, qué apoya a qué, etc. Ninguna de tales disciplinas puede eximirse de ninguno de los dos criterios fundamentales de la justificación: todas dependen de la experiencia y de la congruencia para afirmarse ante nosotros.

Pero además, todas ellas necesitan del discurso lógico para ordenar y presentar sus resultados obtenidos de una manera articulada que solemos llamar sistemática . Y hay algo más: la sistematicidad de cada ciencia clama por la sistematicidad del conjunto de las ciencias, y la hace posible y, de hecho, fácil de producir. Si cada ciencia se expresa de manera lógica, la presentación de los nexos entre las ciencias puede hacerse también de una manera lógica. La misma jerarquización que se da entre las teorías o hipótesis propias de una ciencia se puede dar, o por lo menos presentir, entre teorías de distintas ciencias. En algunos casos privilegiados, esta aspiración a la "unidad de la ciencia" ha tenido un gran éxito: así, la astronomía de Kepler quedó integrada a la física por obra de la axiomatización de Newton; la termodinámica de los gases quedó convertida en un capítulo de la cinemática (con el apoyo de algunas hipótesis estadísticas sobre el movimiento de las moléculas de los cuerpos). La biología molecular ha logrado la unificación entre la biología y la fisico-química. En cambio, la unificación de la psicología con la neurología no es todavía más que un presentimiento, o programa de investigación.

La otra consecuencia de la omnipresencia de la lógica tiene que ver con un tema dominante de la reflexión epistemológica en todas las disciplinas científicas: es el tema de la ontología, de la existencia de objetos científicos, o –dicho con otras palabras– el tema de los niveles de abstracción. La lógica nos guía de la mano en la confección de nuestros conceptos, es decir, de esas agrupaciones mentales de propiedades determinadas que decidimos denominar con un solo nombre. A tales agrupaciones complejas de notas o características preferimos manejarlas como un haz, el cual tiene una unidad e identidad facticia que simplifica nuestras manipulaciones. Sus detalles íntimos, después de recibir un nombre envolvente, van a permanecer ocultos al trajinar cotidiano del pensamiento: es lo que en informática llamamos abstracción, como cuando a un procedimiento o subrutina le damos un nombre, y de ahí en adelante nos olvidamos de sus detalles, invocándolo cuando lo necesitamos simplemente con el nombre dado. Los filósofos consideran a esto como ontología , o sea la doctrina de los entes u objetos, porque este proceso de agrupación de características hace nacer los objetos, como en etapas prefilosóficas –míticas– surgían dioses especiales para encarnar a cada serie de fenómenos naturales, como el trueno y la tormenta, o la floración, la fecundidad de la tierra y la producción de las cosechas.

A esa abstracción u ontología, que es un artilugio del lenguaje, la asociamos con la labor jerarquizante de la lógica, en el siguiente sentido. Así como un procedimiento más global puede descomponerse en llamadas encadenadas a procedimientos más sencillos, y estos a su vez llaman a otros procedimientos más elementales, la ontología nos da niveles de abstracción en los cuales podemos descomponer el universo NOTA 1.

Un caso candente, dentro de las ciencias cognoscitivas, en que se discuten temas ontológicos, es el de la relación polémica entre la psicología y la neurociencia. En efecto, las abstracciones de la psicología, sus objetos, son cosas como deseos, planes, temores, esperanzas, egos y superegos. Las abstracciones de la neurociencia son muy diferentes: neuronas, sinapsis, umbrales de activación, excitaciones e inhibiciones, neurotrasmisores. Nada parecería más diferente que los dos juegos de abstracciones u objetos. Y sin embargo, es un hecho que cuando hay un deseo (o un temor, o cualquier otra cosa psicológica) hay también una correspondiente transmisión (o excitación, o inhibición, o neurotrasmisión...) en un nivel diferente de la realidad.

La informática nos ayuda a comprender la relación entre estos dos niveles en competencia con el –muy útil– concepto de máquina virtual . En este momento escribo este capítulo usando un procesador de textos, de modo que en un cierto nivel me enfrento con el funcionamiento de la máquina virtual que llamo "procesador de textos"; pero al mismo tiempo estoy ejecutando instrucciones en un lenguaje de programación –probablemente el lenguaje C– en que el procesador de textos fue escrito; hay aquí (por lo menos) dos máquinas virtuales trabajando simultáneamente, como mis deseos y mis neuronas deben funcionar simultáneamente. Notemos en esta situación el carácter inseparable de la forma y el contenido en el lenguaje; cómo las palabras, los conceptos fraguados en el yunque de la lógica, contienen todo el fuego de la significación que asociamos con nuestra interpretación del universo.

El sistema de conocimiento, creación y razón de ser misma de la ciencia, es creado mediante el uso del lenguaje; es decir, está hecho de palabras (que representan conceptos) y oraciones (que representan pensamientos completos, afirmaciones o negaciones que ligan conceptos). Decimos de todo lenguaje que tiene tres dimensiones: su sintaxis, la relación legal de unos signos con otros; su semántica, la relación significativa de los signos con lo que significan en el mundo (lingüístico o extralingüístico); y finalmente su pragmática, la relación de esos mismos signos con los propósitos que tienen los seres humanos al usarlos. En un cierto sentido podríamos calificar a la propia ciencia como lenguaje, como el estado más avanzado del lenguaje humano, enriquecido por innumerables experiencias controladas y el espíritu organizador y jerarquizante de la lógica. La sintaxis de ese lenguaje es el método científico, mientras que su semántica la encontramos en el fundamento empírico de sus hipótesis y teorías. La pragmática de este lenguaje se identifica con la empresa misma de supervivencia de la sociedad humana, que esgrime a la ciencia como su mejor arma de combate.


Explicación de textos


Ejercicio de lectura

Para mejor seguir el comentario siguiente, leer ahora el texto de W.V.O. Quine (QUINE 60) o la selección del mismo en el capítulo tercero de la Antología.


Comentario

Quine presenta en este texto una vista epistemológica global de lo que significa para el hombre moderno el conocimiento como conjunto de enunciados verdaderos importantes para su vida. Esta presentación reviste particular relieve por varias razones.

  1. Nos presenta una visión del sistema de conocimiento (o del sistema de creencias) que es compatible en términos generales con los análisis de los filósofos contemporáneos cuyas ideas hemos analizado en el capítulo primero de esta obra.

  2. Constituye un punto de vista eminentemente epistemológico del conocimiento, en el sentido de que contempla los resultados de la ciencia desde el punto de vista del valor de verdad que puedan poseer e insiste en la posible justificación de su validez por medios empíricos y lógicos.

  3. Ofrece un fundamento pragmatista para la justificación de nuestras creencias, a base de la posibilidad de sostener nuestras doctrinas en la vida práctica. En este contexto, los conflictos entre creencias se deciden por medio de dos principios de escogimiento: la sistematicidad y el apoyo experiencial (en caso de conflictos entre los dos principios, entra en juego un tercero, a saber: el principio de simplicidad).

  4. El sistema del conocimiento es para Quine totalmente homogéneo, en el sentido de que no separa ninguna de las disciplinas científicas como especialmente privilegiadas en cuanto a su necesidad de justificación teórica y empírica. Para este filósofo, la lógica, la matemática, la física, y todas las otras ciencias constituyen creencias válidas en la medida en que proveen una manera de armonizar en forma coherente y simple los distintos ingredientes de nuestra experiencia.

Uno de los primeros puntos en que el autor insiste es en el carácter eminentemente selectivo de la actividad científica. El progreso de la ciencia no consiste en una acumulación indiscriminada de verdades. No todo lo que es verdad (en algún sentido de la palabra "verdad") es interesante para la ciencia. La ciencia busca únicamente las verdades importantes, es decir, las que son pertinentes a los intereses vitales de los hombres. Esto no quiere decir que a la ciencia le interesen solamente los enunciados con valor utilitario: ¡lejos de ello! Su interés puede ser puramente intelectual o académico. Pero de algún modo lo que conocemos debe estar relacionado con los intereses humanos, con los propósitos que el ser humano persigue en su vida. Vemos aquí resaltado un doble carácter esencial en las actividades científicas. Por una parte, la ciencia tiene un fundamento pragmático; se enraiza en el quehacer, en las preocupaciones del cerebro humano. Por otra, la ciencia actúa a fuerza de construir abstracciones: es decir, a fuerza de agrupar las notas que nos interesan bajo etiquetas o nombres, que son los objetos sobre los que hacemos ciencia.

Y con esto queda planteado un tema fundamental de la teoría de la ciencia: el tema de la ontología. Ontología es teoría de los objetos. La ontología de la ciencia, o de una ciencia en particular, es la lista de objetos cuya existencia tiene el científico que postular para poder practicar su disciplina. Una ontología es la colección de entes (objetos) a que se refieren los enunciados de cada disciplina particular. El surgimiento de una ontología es inseparable del fenómeno de la abstracción que tocamos en el párrafo anterior, porque es por abstracción que se constituyen los objetos. No son nuestras experiencias subjetivas, de colores, sonidos o cualquier otra clase de sensación, en lo que consisten nuestras creencias (científicas o no); son más bien los objetos físicos, experimentados en forma social y no solitaria, los que dan base para esas creencias.

El autor nos dice que los objetos físicos, si no existieran, habría que inventarlos (con esta expresión parodia al pensador francés del siglo XVIII, el enciclopedista Voltaire, que en una oportunidad escribió que si Dios no existiera habría que inventarlo). Esta afirmación tiene mucha miga filosófica. En el fondo, lo que Quine quiere decir es que en verdad los objetos los inventamos nosotros, pero que son tan esenciales para nuestra vida mental y práctica que no podríamos imaginar esas vidas sin que se hubiera dado ese acto de invención. Dicho de otro modo, los objetos no tienen una existencia absoluta, independiente de nuestras necesidades intelectuales (en esto vemos una muestra del pragmatismo filosófico del autor NOTA 2), sino más bien una existencia relativa a todo el contexto de nuestras creencias y de nuestras necesidades vitales.

Parte de las consecuencias de esta posición pragmatista, en que los objetos son "inventados" más que descubiertos, es que no hay nada sagrado sobre la ontología que escojamos. En realidad, la selección de los objetos en que creemos no es sino una sola cosa con la selección de las doctrinas (teorías, hipótesis, sistemas de creencias) a que nos adherimos. Hay tanta latitud en nuestra escogencia de los objetos en cuya existencia creemos como en la escogencia de las teorías e hipótesis en que figuran referencias a esos objetos y, en realidad, cada una de estas escogencias condiciona a la otra. Por ejemplo, si nuestras teorías suponen una Tierra inmóvil alrededor de la cual giran todos los astros, tenemos que creer en unos ciertos objetos llamados epiciclos, en los cuales no tenemos ninguna razón de creer si aceptamos que la Tierra gira alrededor del Sol; igualmente si creemos en las teorías físicas de Newton, debemos reconocer un objeto llamado éter, por el cual se desplazan los planetas produciendo un "viento etéreo", en el cual no tenemos que creer si nuestros axiomas físicos son los de la teoría de la relatividad de Einstein. La ontología se sostiene o cae con las teorías en que figura y a las cuales sustenta. Por supuesto, esto deja pendiente la cuestión de cuál sea el criterio para escoger un par ontología-teoría sobre un par alternativo, tema que examinaremos enseguida.

El autor se detiene a subrayar explícitamente que es inexacto, pero no mal fundado, el lugar común que considera verdadero a un enunciado cuando corresponde a la realidad, cuando, por así decirlo, refleja fielmente al mundo. Esta teoría epistemológica, conocida como teoría de la correspondencia, igualmente popular entre los filósofos positivistas como entre sus rivales los filósofos popperianos, es una teoría ingenua. Nuestros enunciados sobre los objetos físicos cuya existencia aceptamos son usos lingüísticos ni refutables (contra Popper) ni verificables (contra Carnap) por comparación independiente directa con la realidad. Aspiran a describir no una experiencia particular –separada del resto de nuestra experiencia y de nuestra reflexión– sino el mundo exterior, en alguno de sus aspectos infinitamente interconectados. Pueden ser comparados con la realidad –ese mundo exterior– solo por medio de esa experiencia y esa reflexión en su integralidad.

Pero además, la experiencia y la reflexión (el ejercicio de la deducción lógica, por ejemplo) están íntimamente conectadas, de modo que el conocimiento experimental incluye siempre algún elemento discursivo, algún proceso de razonamiento: siento el calor del sol, pero mi calificación de la temperatura ligeramente tórrida que siento en mi espalda está matizada por la imagen de la luz solar que veo reflejada en la pantalla de mi computadora mientras escribo estas líneas; entonces, no es completamente exacto que siento el calor del sol en mi espalda, pues en alguna medida he deducido que ese calor procede del sol y no, por ejemplo, del incendio de la canasta de papeles que se encuentra detrás de mí (para sentir el calor de mi espalda como procedente de un fuego debiera experimentar simultáneamente un olor característico, etc.). Así, "la conexión entre nuestra experiencia y el mundo ya incluye un paso de hipótesis o inferencia que impide cualquier confrontación directa y concluyente del uso lingüístico con su objeto".

¿Cuál es, entonces, nuestro criterio de verdad? ¿Cómo haremos para distinguir lo real de lo ilusorio, lo verdadero de lo falso? La respuesta de Quine es que "los objetos físicos nos son conocidos solo como parte de una estructura conceptual sistemática"; este criterio recibe corrientemente el calificativo de teoría coherencial de la verdad , y representa la teoría epistemológica opuesta a la teoría de la correspondencia comentada antes.

Esa estructura sistemática, que conecta muchos enunciados entre sí de manera congruente, "toca la experiencia únicamente en sus bordes". Piénsese en una tela, en proceso de elaboración en el centro de un marco: en análisis final, toda la tela se sostiene del marco, pero cada parte de ella (por ejemplo, un lindo bordado de una flor en alguna parte de la tela) se sostiene de otras partes de la tela, y solo indirecta y tortuosamente, de los pernos anclados en el marco. Así, debemos admitir que nuestro conocimiento, el conjunto de nuestras creencias, viene a ser no más que una manera compleja de "relacionar experiencias con experiencias". "El sistema como un todo está infradeterminado por la experiencia": es decir, la experiencia sola no bastaría para definirlo, ni esta podría ser elucidada unívocamente a partir de nuestras creencias.

Pero ese sistema implica que, dadas ciertas experiencias, otras deberán producirse. Este es el anclaje fundamental de nuestro conocimiento en nuestra experiencia: que "cuando tales predicciones de experiencias no se cumplen, el sistema tiene que ser modificado de alguna manera". Disponemos, sin embargo, de gran amplitud en nuestra selección de cuáles enunciados del sistema corregir, preservar o abandonar; y bastará una sola de muchas revisiones posibles para hacer desaparecer las conclusiones lógicas que hubieren puesto al sistema de creencias en problemas. Quine es claro: no se trata de que podemos afirmar cualquier cosa e ignorar cualquier refutación de nuestras predicciones. Muy al contrario: si las predicciones experimentales fallan, debemos modificar al sistema; pero una refutación nunca nos dirá que rechacemos este en vez de aquel enunciado particular. Muy bellamente nos lo confirma con estas palabras: "Nuestros enunciados sobre la realidad exterior enfrentan el tribunal de la experiencia sensible no individualmente sino en forma corporativa".

Uno de los conceptos más interesantes de la epistemología de Quine es la noción de prioridad en el caso de conflicto entre criterios de verdad. Esta noción no es clara y precisa sino por el contrario vaga e indeterminada. En el fondo, depende de un juicio muy personal de parte del sujeto cognoscente que se arriesga a preferir uno de los criterios sobre otro en circunstancias concretas específicas. En el caso de los enunciados sobre objetos físicos, por ejemplo, "mi computadora está frente a mí", "el viento sopla ahora en mi ventana", son en cierta forma más cercanos a mi experiencia que muchos otros, por ejemplo, "el universo comenzó su existencia con una gran explosión". Los primeros enunciados deben ser defendidos con gran celo, una vez que las experiencias que les sirven de fundamento se han producido. Si la coherencia lógica dicta que entran en conflicto con nuestras teorías, y una revisión del sistema de creencias resulta pues necesaria, serán otros enunciados y no estos los que deberán ser afectados.

Pero existe también otra prioridad, de signo contrario: esta nos recomienda más bien preferir los enunciados más centrales en el sistema de creencias, es decir, los más alejados del contacto con la experiencia. Cuanto más fundamental sea una ley en nuestro esquema conceptual, menos consideración debemos dar a la posibilidad de revisarla. Cuando se necesita una revisión en nuestro sistema de creencias, preferiremos, en igualdad de circunstancias, la revisión que perturbe menos al sistema, lo cual es lo mismo que decir que los axiomas básicos de esta arquitectura deben tratar de preservarse. Esta prioridad de la teoría (en contraposición con la prioridad de la experiencia), admite muchos grados. Así, las conjeturas de la historia o de las otras ciencias sociales serán más fácilmente revisables que las leyes de la física, y la leyes de la física más susceptibles de revisión que las leyes de las matemáticas y la lógica. Quine se niega a conceder una indemnidad de revisión a estas últimas, como lo harían los positivistas, para los cuales las matemáticas y la lógica resultan verdaderas a priori o "por definición".

Nuestro autor es un convencido de la continuidad de la ciencia, es decir, de que todas nuestras creencias son de la misma clase, sin enunciados privilegiados por derecho de nacimiento. En cambio, introduce esta noción de gradualismo frente a la necesidad de revisión, como una inclinación a querer preservar lo que se halla más conectado con la totalidad de nuestras creencias, como ocurre con las convicciones más centrales. Así, las matemáticas y la lógica, por su carácter central en nuestro esquema conceptual, tienden a eximirse de revisión, en vista de nuestra preferencia conservadora por aquellas revisiones que perturben el sistema mínimamente; es solo ahí donde debemos encontrar la "necesidad" que asociamos con las leyes de las matemáticas y de la lógica, no en un estatuto especial que las ponga por encima de toda posibilidad de revisión.

Incluso acepta Quine la posibilidad de que en algún momento futuro la humanidad llegue a encontrar una lógica mejor que la que poseemos actualmente, y su aceptación en vez de la vigente tendría amplísimas repercusiones en todas nuestras ideas sobre el mundo físico y los asuntos humanos. En realidad, aunque Quine no lo menciona en su texto, una cosa parecida ya sucedió por lo menos en una ocasión: la lógica moderna (también llamada lógica simbólica), producto de los trabajos de Peano, Frege, Whitehead y Russell –entre otros grandes lógicos de los últimos dos siglos– sustituyó a la lógica clásica creada por Aristóteles en el siglo IV antes de Cristo, y las consecuencias pueden considerarse amplísimas, tan grandes como las que separan la concepción del mundo medieval (basada en la lógica aristotélica) y la concepción del mundo contemporáneo.

Es de notar que la posibilidad de una revisión de las creencias lógicas o matemáticas no podría darse por un simple conflicto con la experiencia: la teoría bien establecida siempre será preferida frente a la experiencia, incluso a la más viva y directa. En efecto, siempre podríamos aludir a la alucinación para explicar las experiencias vívidas pero erróneas. No otra cosa hicieron los clérigos adversos a las teorías heliocéntricas de Galileo, cuando se negaron a mirar por el telescopio que, si les iba a mostrar algo contrario a la física de Aristóteles, tendría que ser un instrumento de engaño, quizás con intervención diabólica. Esta revisión solo puede empezar a considerarse por intervención del tercer criterio de selección de creencias.

Enumeremos de nuevo estos criterios: el primero postula la preferencia por los enunciados muy cercanos a nuestra experiencia. El segundo estipula una preferencia por los enunciados más centrales y básicos del sistema. El tercer criterio –que en el fondo constituye un criterio último y supremo– es la preferencia por la simplicidad del sistema: debemos preferir los cambios que hagan más sencillo nuestro sistema de creencias, por ejemplo, reduciendo el número de tipos de objetos (categorías ontológicas) que debemos aceptar, o hagan más breves y matematizables las leyes en que tenemos que creer. Un hermoso ejemplo de esa preferencia por la simplicidad, mencionado por Quine, el cual ha llevado recientemente a cambios drásticos en nuestras concepciones científicas, es la sustitución de la física de Newton por la de Einstein frente a los resultados experimentales de Michelson y Morley, que comentamos en el capítulo primero.

Es importante mencionar un criterio de preferencia entre creencias que no es referido por Quine (ni por ningún filósofo de la ciencia respetable), lo cual puede ser muy ilustrativo para los lectores. Es el criterio de claridad intuitiva o cercanía con el sentido común de la sociedad, o incluso de la comunidad de científicos. De hecho, las grandes sustituciones de teorías en la ciencia han ido casi siempre en un sentido de alejamiento de la claridad intuitiva o de conformidad con el sentido común. Piénsese en la idea de la Tierra esférica frente a la Tierra plana. O la idea de que la Tierra se mueve (alrededor del Sol) frente a la noción intuitiva de que el Sol sale todas las mañanas. La cinemática de Newton era menos intuitiva que la de Aristóteles, por ejemplo, al considerar que un cuerpo en movimiento uniforme continuará en ese estado indefinidamente mientras una fuerza no cambie su movimiento, frente a la noción intuitiva de que el movimiento se gasta (como el combustible de un vehículo) NOTA 3.

Las teorías de la relatividad de Einstein, sin duda mucho más simples y elegantes que las de Newton, son no obstante mucho más alejadas del sentido común, por ejemplo al declarar severamente limitada la determinación de simultaneidad a distancia, o al declarar el espacio real como no euclídeo (curvo o arrugado ); además, las leyes de Einstein son más abstractas que las de Newton y estas lo eran más que las de Aristóteles. La conciliación de la ciencia con el sentido común es una aspiración vana: por el contrario, lo único factible con las nuevas fórmulas (por ejemplo las que determinan la equivalencia de energía y materia en Einstein) es acostumbrarse a ellas, como todos nos hemos acostumbrado a "sentir" que rotamos sobre el eje de la Tierra una vez cada veinticuatro horas.


Ejercicio de aprendizaje

Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.


Respuesta al ejercicio de aprendizaje

Si su resumen incluye las siguientes ideas puede considerarlo correcto.

La epistemología se interesa por el valor de verdad de los sistemas de conocimiento, con la ayuda de dos criterios complementarios: la correspondencia con la realidad del mundo (criterio empírico) y la congruencia recíproca entre las distintas creencias (criterio lógico). Estos criterios, a su vez, descansan en la necesidad del ser humano de sobrevivir en su entorno. Nuestras creencias están destiladas de la experiencia, pero organizadas por la lógica.

Ejercicio de lectura

Leer un segundo texto de W.V.O. Quine (QUINE 53) o la selección del mismo incluida en el capítulo tercero de la Antología.


Comentario

En este segundo texto, Quine se refiere de una manera especial al problema, ya mencionado, de la ontología. Recordemos que la ontología tiene que ver con la confección de conceptos que se presten para clasificar adecuadamente los datos empíricos de los distintos campos del conocimiento. Es la ontología la que presta su existencia a los objetos de la ciencia. Dicho en otras palabras, la ontología nos da los niveles de abstracción en que podemos descomponer el universo; y dentro de cada campo particular, la lista de objetos cuya existencia tiene el científico que postular para poder practicar su disciplina. Una ontología es la colección de entes (objetos) a que se refieren los enunciados de cada rama científica. En el artículo anterior Quine nos asegura que no hay nada sacrosanto sobre la ontología específica que escojamos. Se selecciona la ontología que conviene para la mejor organización de la disciplina. En realidad, la selección de los objetos en que creemos no es nada distinto de la selección de las doctrinas (teorías, hipótesis, sistemas de creencias) a que el científico se adhiere.

En este nuevo artículo, que complementa el anterior ampliando y reforzando sus conclusiones, el autor aplica un análisis muy riguroso y completo para llegar a la conclusión de que toda teoría científica –y en este calificativo, como habíamos visto a propósito del primer artículo, incluye también a las teorías lógicas y matemáticas– compromete a sus adherentes con la existencia de un cierto tipo de entes, sean éstos números, elementos químicos o especies biológicas determinadas. El análisis aquí presentado nos servirá de base para una mejor fundamentación de lo que en el capítulo siguiente enfocaremos como niveles de abstracción internos a las diversas ciencias, o que definen a una ciencia en relación con otra en su integridad. Este tema de los niveles de abstracción lo examinaremos con amplitud en el próximo capítulo, pero vale la pena tenerlo presente mientras examinamos los planteamientos conexos de este importante artículo: tengamos presente que aceptar una ontología es crear los niveles de abstracción dentro de los cuales deberemos realizar nuestro trabajo reflexivo de construcción del conocimiento.

El tema de la ontología es el tema de lo que hay . El tema de lo que hay es el viejo tema filosófico del "ser", y también del "no ser". El filósofo griego Parménides lo planteó por primera vez hace muchos siglos, y ha sido tomado y retomado reiteradamente por diversos filósofos de la cultura occidental. En el fondo, el problema del ser es inseparable del conocimiento, porque intentamos conocer lo que hay, pero también porque para aceptar algo como existente debemos tener un juego de categorías o marco de referencia para captarlo como tal. Por otra parte, es necesario poder negar el ser de ciertos supuestos entes, como cuando decimos que Pegaso, o la Unión Soviética de hoy, no existen. También queremos decir que la redonda cúpula cuadrada de Berkeley College no es , independientemente de que hayamos estado alguna vez en ese colegio o de que hayamos visto fotografías o dibujos de dicha extraña cúpula. Afirmaciones aparentemente tan sencillas como estas han planteado a lo largo de la historia de la filosofía intensas discusiones. Platón, por ejemplo, enseñó que el "no ser" tiene que ser de alguna manera, puesto que de otro modo, ¿qué podría ser lo que no es? Lo que no es (por ejemplo, la Unión Soviética de hoy) tiene que ser en algún sentido, pues, de lo contrario, ¿cómo podríamos hablar de ello?

Una de las ventajas de la lógica matemática contemporánea, cuya introducción en los últimos dos siglos saludábamos en el comentario al texto anterior, ha sido que su utilería nos ha permitido despejar definitivamente este problema. La labor la realizó Bertrand Russell, lógico matemático inglés, uno de los científicos que más contribuyó a la revolución que produjo la lógica contemporánea. En su teoría de las descripciones singulares nos explica cómo es posible usar nombres aparentes (como Pegaso) sin necesidad de suponer que exista algo nombrado por ellos. Esto lo hace ofreciéndonos una manera alternativa de decir todo lo que querríamos decir con ayuda de esos supuestos nombres, mediante fórmulas que no usan esos nombres pero que por lo demás son enteramente satisfactorias y compatibles con los propósitos comunicativos que deseábamos cumplir con las fórmulas originales.

Otros ejemplos de nombres a los que se aplica esta teoría de Russell son los nombres complejos siguientes: "el autor de Waverley", "el actual Rey de Francia". Nótese que la descripción singular atribuye un predicado a un cierto ente y, al mismo tiempo, dice que ese ente es el único en el universo que admite tal predicado. La técnica de Russell consiste en hacer explícito este contenido mediante el análisis de las frases problemáticas como fragmentos de enunciados completos en los que aparecen. Por ejemplo, "el autor de Waverley" podría figurar en el enunciado "el autor de Waverley fue un poeta" NOTA 4. El sentido del enunciado, como un todo, estaría dado por la significación "un cierto ente escribió Waverley y fue un poeta, y ningún otro ente escribió Waverley".

"La virtud de ese análisis", nos dice Quine, "es que el nombre aparente, que es una frase descriptiva, queda parafraseado en el contexto " y en consecuencia desaparece como tal nombre. Si desaparece como nombre, ya no tiene sentido preguntarnos si lo que nombra existe o no (pues no se nombra nada). Por supuesto que en este ejemplo la pregunta por el ser o la existencia no ofrecería una dificultad particular, pero sí la ofrecería en el caso de, por ejemplo, "la cúpula cuadrada redonda" o el "actual rey de Francia". Así, este último supuesto nombre podría quedar parafraseado en el contexto "el actual rey de Francia será guillotinado mañana" como "un cierto ente rige actualmente Francia y será guillotinado mañana, y ningún otro ente rige actualmente Francia". En esta paráfrasis, enunciado falso por ser una conjunción uno de cuyos subenunciados es falso (a saber, "cierto ente es el actual rey de Francia"), no hay, como se ve, ningún nombre compuesto que pueda significar algo, existente o no. El problema de suponer que algo que no es al mismo tiempo sea, ha desaparecido: lo ha disuelto el análisis.

Nos volvemos a encontrar aquí con una estrategia muy interesante de reforma del lenguaje con el objeto de resolver problemas, que ya habíamos encontrado en dos ocasiones anteriores: en relación con el problema del pensamiento de las máquinas, en el primer capítulo; y en relación con la definición de algoritmo, en el segundo. En ambos casos, quien hacía la propuesta era Alan Turing, pero la técnica es suficientemente general en la filosofía e historia de la lógica. La estrategia consiste en librarse de un concepto vago e intuitivo mediante una modificación del lenguaje, con la introducción de un concepto preciso y formal en vez del concepto incómodo; el concepto nuevo debe ser capaz de realizar las mismas funciones –tener el mismo valor instrumental– que el concepto objetado. En el caso del primer capítulo, Turing se libraba del impreciso problema "¿podrán pensar las máquinas?" sustituyéndolo por "ganar el juego de la imitación" –sustituía el concepto de "inteligencia mecánica" por "capacidad mecánica de jugar tal y tal juego"–; en el caso del segundo capítulo, el concepto intuitivo "algoritmo" era sustituido por el concepto estrictamente formal "máquina Turing".

Nótese que en ninguno de estos casos se trataba de una traducción en el sentido usual de un término a otro: los dos términos, el inicial y el final, no podían ser declarados equivalentes por ser uno impreciso y vago mientras que el otro preciso y formal; precisamente se introducía el nuevo porque poseía condiciones nuevas (precisión, carácter formal) de que el término original carecía. Por eso, preferimos en estos casos hablar no de traducción sino de transformación del lenguaje. Si esa propuesta de transformación es aceptada por la comunidad científica correspondiente (como lo fue en los dos casos de las propuestas de Turing) el lenguaje queda modificado en consecuencia. En este nuevo ejemplo, en que el proponente de la transformación del lenguaje fue Bertrand Russell, la propuesta consiste en transformar en contexto los nombres complejos o descripciones singulares (descripciones que se refieren a un solo individuo en el universo, como "el actual rey de Francia" o el "círculo cuadrado") en enunciados donde no aparezca ninguna de estas descripciones singulares. Como en el caso de las propuestas de Turing, esta también ha sido aceptada por la comunidad científica.


El papel de las variables en las teorías científicas

Recordemos el análisis de Russell del enunciado

a saber,

Las expresiones "un cierto ente" y "ningún otro ente" son parte de la estructura lógica de este nuevo enunciado, palabras que no tienen contenido semántico sino sólo sintáctico, es decir que no señalan nada en el mundo exterior sino sólo algo interno al enunciado mismo. Podemos también decir que pertenecen a la estructura lógica de la proposición. Para ver más claramente esa estructura podemos reescribir el enunciado haciendo uso de algunas convenciones que usan los lógicos para hacer resaltar los aspectos puramente estructurales de los enunciados. Así:

Aquí hemos sustituido las expresiones "un cierto ente" y "otro ente" por expresiones matemáticas como "X" y "Z" y parafraseado "ningún" con un "si ... entonces ..." y el signo "=". "X" y "Z" son lo que en lógica y matemáticas se denomina variables . Son simplemente marcadores de lugar que aseguran congruencia en la sustitución. Cada aparición de una de estas variables en un texto es una alusión indeterminada a un individuo del universo. Pero una vez que ha aparecido una variable en particular, por ejemplo "X", las ulteriores veces que aparece la misma variable dentro del mismo contexto de discurso NOTA 5 debemos entender que se refiere a exactamente el mismo individuo designado por la primera aparición de la misma variable. Así, en el enunciado 3 la segunda X se refiere al mismo individuo que la primera, pero cuando leemos "Z" tenemos de nuevo libertad, por tratarse de una variable que todavía no ha aparecido en el enunciado, de escoger a cualquier individuo del universo, igual o distinto del designado por "X". No obstante, inmediatamente decimos que ese Z es igual a X, con lo que volvemos en este caso, por razones que no tienen que ver con la escogencia de variables, a estar hablando del mismo individuo.

No hay que saber muchas matemáticas para concluir, por lectura cuidadosa, que los enunciados 2 y 3 dicen lo mismo. Pero el enunciado 3 tiene la ventaja de que manifiesta muy conspicuamente su estructura lógica. Por ejemplo, nos revela que existe uso de variables, o sea, que estamos de algún modo refiriéndonos a un dominio de individuos que designamos de manera general, no por nombre sino en forma indeterminada. Si el uso de nombres nos permite referirnos cualitativamente a los individuos del dominio (diciendo cuáles son), el uso de variables (y de los cuantificadores que las gobiernen, como veremos enseguida) nos permite referirnos a ellos cuantitativamente (diciendo cuántos son).

Podemos ahora hacer más preciso el enunciado, por la introducción de cuantificadores, así:

Las expresiones {existe un X del cual digo que} y {de cualquier Z digo que} son cuantificadores , el primero de tipo existencial y el segundo de tipo universal . Cada cuantificador rige un cierto alcance, algo que al ser completado por el cuantificador constituye un enunciado; puede, por supuesto, haber enunciados que son parte de otros, y en consecuencia, cuantificadores que rigen partes de enunciado que contienen otros cuantificadores. Hagamos explícitos los alcances de los cuantificadores en nuestro enunciado, mediante la siguiente nueva versión:

Comparemos ahora los enunciados 1 y 5. ¿En qué se diferencian? Podemos decir que cada uno de estos enunciados se refiere a objetos en el mundo de muy distintas maneras. En el 1, la carga de la referencia objetiva la lleva la frase descriptiva singular o nombre compuesto; en el 5, en cambio, corresponde a las variables cuantificadas, es decir a los equivalentes formales de las expresiones "cierto ente" y "ningún otro ente" que aparecen ya en el enunciado 2. Ahora bien: esas expresiones no pretenden ser nombres, no nombran en absoluto; más bien nos refieren a las correspondientes entidades de un modo genérico (cuantitativa y no cualitativamente).

La referencia, el acto de referir, propio de los nombres y de los cuantificadores, es un acto de naturaleza estrictamente ontológica: los nombres –nos referimos expresamente a los nombres propios, no a los sustantivos comunes– y los cuantificadores nos remiten a los objetos, a los entes que pueblan el universo. Solo los nombres propios y las variables cuantificadas nos abren la puerta de la ontología. Los nombres comunes y los adjetivos –llamados colectivamente predicados por los lógicos– no acceden al mundo ontológico (se quedan en el mundo lógico).

Tomemos unos ejemplos de predicados: perro (sustantivo común) y blanco (adjetivo). Cuando digo que Gitano es un perro blanco, las palabras "perro" y "blanco" no me refieren por ellas mismas a nada realmente existente. Es "Gitano" la que me remite a un individuo del universo, el cual tiene las propiedades de ser perro y ser blanco. Pero también podrían referirme a entes del universo los cuantificadores, como en estos enunciados: "Existe al menos un perro" o "Todo (en el universo) es blanco". Así, la lógica nos hace distinguir una fuerte línea divisoria entre lo que denota (refiere objetivamente), que son los nombres propios y las variables cuantificadas, y lo que connota (predica la riqueza de un significado), a saber, los sustantivos comunes y los adjetivos. Solo la primera de esas categorías tiene contenido ontológico. Si queremos introducir otros términos filosóficos populares, podríamos decir que la primera categoría lidia con la existencia (nos enseña que la cosa es ), mientras que la segunda lidia con la esencia (nos habla de lo que la cosa –referida por otros medios– es).

Si ahora nos concentramos en la categoría ontológica, en los nombres propios y las variables cuantificadas, notamos una situación muy curiosa. Aunque parecería que entre nombres propios y variables cuantificadas los primeros son más fundamentales, lo cierto es que nos sería muy difícil hablar, e incluso pensar, si no tuviéramos variables sino solo nombres. ¡Solo podríamos hablar de lo que conocemos directamente y por su nombre! En cambio, como lo demuestra Quine en su texto, es perfectamente posible prescindir de los nombres propios y hacer todas nuestras referencias por medio de variables cuantificadas. El secreto está en el artilugio de Russell que nos permite prescindir de los nombres complejos o descripciones singulares como "el autor de Waverley": si podemos prescindir de un nombre complejo, con más razón, y por el mismo método, podemos prescindir de un nombre simple, como por ejemplo Pegaso. Siempre podemos trocarlo por una expresión descriptiva singular, como "el caballo volador de la antigua mitología griega" o algo por el estilo, y proceder enseguida a aplicarle la transformación de Russell. Esto nos lleva a la curiosa conclusión de que los identificadores objetivos primarios son las variables y no los nombres propios y, como dice Quine, de que los pronombres (que son las variables del lenguaje ordinario) representan a los objetos con más propiedad que los sustantivos.

Finalmente, el autor llega a proponer una tesis filosófica fundamental: es el uso que haga de variables (cuantificadas) lo único que compromete a una teoría científica con una ontología determinada, no el uso que haga de nombres propios, que no son más que una manera de expresarse derivada y secundaria. Por ejemplo, "cuando decimos que hay números primos mayores que un millón nos comprometemos con una ontología que contiene números". "Esta es esencialmente la única vía por la cual podemos contraer compromisos ontológicos: nuestro uso de las variables ligadas [a un cuantificador]". Ser significa pura y simplemente ser asumido como valor posible de una variable. Para usar las categorías de la gramática tradicional, ser consiste en "encontrarse en el campo de referencia de un pronombre". Los pronombres son los medios de referencia básicos.

El asunto tiene especial importancia cuando consideramos la posibilidad de que nuestra ontología tenga niveles. Veámoslos con las propias palabras de Quine:

El autor sostiene que la matemática clásica está profundamente comprometida con una ontología de entidades abstractas. En efecto, los números no se dan ontológicamente al nivel de los objetos físicos. Primero tenemos que suponer la existencia de objetos físicos, como el continente americano o el sentido de la vista en el cuerpo humano; después podemos suponer clases de estos objetos, por ejemplo, la clase de todos los continentes de la Tierra (que incluiría, además de América, Euroasia, Africa, Oceanía y Antártida); y la clase de los sentidos humanos (supongamos que incluya solo vista, oído, olfato, gusto y tacto); finalmente, podemos pensar en la clase de todas las clases cuyos objetos puedan asignarse uno a uno con los miembros de estas dos clases, con lo cual obtenemos el número cinco. Para poder reconocer filosóficamente al número cinco, como una propiedad común a los continentes de la Tierra y a los sentidos del cuerpo humano, tenemos que admitir como existentes, como objetos, a la clase de los continentes y a la clase de los sentidos (que son, por supuesto, objetos abstractos, al ser clases y no objetos físicos).


Ontología de las matemáticas

Las personas legas en matemáticas tienden a suponer que los matemáticos son las personas más pacíficas del mundo, en el sentido de que nunca pelean entre sí. Después de todo, cuando surgiera una discrepancia, lo único que tendrían que hacer para saber quién tiene la razón es revisar las sumas y multiplicaciones, o aplicar la "prueba de los nueves" o algo parecido, o en definitiva, tomar un calculador y hacer las operaciones a máquina. ¡Nada más lejos de la verdad! Los matemáticos están entre las personas más conflictivas de la raza humana. Y precisamente las contiendas entre ellos tienden a ser más que todo conflictos sobre ontología. Por lo que se pelean los matemáticos es sobre todo por qué es lo que hay, por cuáles objetos admitir en su universo de discurso. Dicho más técnicamente, las contiendas más importantes en el terreno de la fundamentación de la matemática "apuntan de modo muy explícito a desacuerdos sobre el tipo de entidades que pueden admitirse como objetos de referencia de las variables ligadas". Aunque esta es la forma que el desacuerdo ontológico reviste en nuestro tiempo, los partidismos que dividen hoy a los matemáticos corresponden muy aproximadamente con las divisiones de los matemáticos medievales sobre la ontología. En el artículo que comentamos se da una compendiosa pero correcta definición de tres corrientes ontológicas de las matemáticas, en sus versiones medieval y contemporánea. La compendiamos aún más en el siguiente cuadro:

REALISMO

La mente descubre las ideas abstractas universales, no las crea.

LOGICISMO Frege, Russell ,...

Las variables ligadas se refieren a toda clase de entidades abstractas.

CONCEPTUALISMO

Hay universales, pero son producidos por la mente.

INTUICIONISMO Poincaré, Brower

Las variables ligadas se refieren solo a entidades abstractas previamente especificadas.

NOMINALISMO

Los universales son simples nombres. No existen entidades abstractas.

FORMALISMO Hilbert

La matemática es un juego de reglas formales, sin ningún contenido de realidad.

[la columna celeste se refiere a las corrientes medievales; la columna amarilla, a sus equivalentes contemporáneas]


El realismo, es la doctrina medieval de que los universales, o entidades abstractas, son independientes de la mente. Recuérdese a Platón, con su idea de la preexistencia de las ideas en un mundo ultraterreno, accesible solo a la razón, no a la sensibilidad. El logicismo, versión contemporánea de la anterior, considera legítimo usar las variables cuantificadas para referirse a cualquier tipo de entidades abstractas, conocidas o desconocidas, especificadas o no especificadas. El realismo y el logicismo sostiene que las ideas abstractas se descubren, no se crean.

El conceptualismo es la doctrina medieval que aceptaba que hay universales, pero que son producidos por la mente. El intuicionismo es su versión contemporánea, pues defiende el uso de variables cuantificadas para referirse a entidades abstractas sólo en el caso de que tales entidades puedan ser elaboradas a partir de ingredientes previamente especificados. Tanto el conceptualismo como el intuicionismo afirman que las ideas abstractas se inventan. La oposición entre logicistas e intuicionistas tiene importantes consecuencias prácticas sobre la extensión de las matemáticas, ya que los intuicionistas le otorgan una menor extensión, sobre todo porque rechazan la realidad de varios órdenes de infinitud y desconocen incluso algunas de las leyes sobre números reales.

El nominalismo fue la doctrina que negaba toda realidad a las ideas abstractas, aceptando como existentes sólo los objetos físicos; los universales, para ellos, eran simples nombres (de ahí que se les conozca con ese apelativo). El formalismo, su versión contemporánea, concibe las matemáticas como un simple conjunto de notaciones y manipulaciones formales, que por sí mismas no tienen sentido semántico. Las consideran como un juego útil, sin embargo, a pesar de que carecen de significación literal.


Cómo decidir debates ontológicos

La fórmula semántica Ser es ser el valor de una variable, que podríamos denominar "principio de tolerancia", no nos permite de manera directa resolver los conflictos entre distintas ontologías. En realidad, cuando dos puntos de vista afirman diversas ontologías, en el fondo o desde la superficie están en desacuerdo también en otros aspectos de sus compromisos de teoría. La fórmula quineana nos sirve, sin embargo, para comprobar la coherencia de una serie de afirmaciones teóricas; nos ofrece el criterio para juzgar cuáles son los compromisos ontológicos implicados por un determinado sistema de creencias.

Los criterios para aceptar una ontología no son diferentes de los criterios para aceptar un sistema de creencias. Dijimos antes que estos criterios son primordialmente la coherencia teórica y la conformidad con la experiencia; pero que los conflictos entre estos dos criterios son dirimidos en definitiva por un criterio supremo de simplicidad. Este principio fue concebido inicialmente más bien para reducir el número de los entes u objetos con cuya existencia nos comprometemos, que para dar preferencia a teorías más sencillas; así quedó formulado por algún monje precursor de Guillermo de Occam, el gran nominalista del siglo XIV –y bautizado por la tradición "navaja de Occam"–:

Entia non multiplicanda praeter necessitatem
(no multiplicar los entes más allá de lo indispensable).

En resumen pues, el principio de Quine enunciado arriba nos permite decidir cuáles son los supuestos ontológicos de una teoría particular. El principio no nos permite, sin embargo, por él mismo, decidir cuál sea la ontología que debe adoptarse en un campo dado del conocimiento. Para decidir esta cuestión Quine sólo nos da el consejo de ser tolerantes y tener un espíritu experimental. Ser tolerante; es decir, comprender que hay muchas posibilidades de reorganizar el sistema de creencias frente a la embestida de la experiencia. Y tener espíritu experimental; es decir, probar tentativamente distintas ontologías para ver qué consecuencias se siguen, en la complejidad de los enunciados y en su operacionalidad para la vida práctica, y elegir finalmente aquella con la que podamos vivir más confortablemente.


Ejercicio de aprendizaje

Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.


Respuesta al ejercicio de aprendizaje

Si su resumen incluye las siguientes ideas puede considerarlo correcto.


Ejercicio de lectura

Leer el texto de Claudio Gutiérrez y Abelardo Brenes, disponible en este hipertexto (GUTIÉRREZ Y BRENES 71).


Comentario

El conocimiento, como sistema de creencias elaborado y mantenido por el ejercicio del método científico, se formula con ayuda esencial del lenguaje. La liga entre el conocimiento y el lenguaje es tan fuerte, que algunos autores prefieren referirse a la ciencia misma como un lenguaje, cuya dimensión semántica sería su anclaje experimental y su dimensión sintáctica la coherencia lógica NOTA 6. El artículo de Gutiérrez y Brenes analiza la ciencia bajo esa luz y pone de manifiesto dos aspectos perfectamente distinguibles en ella: las palabras estructurales y sus relaciones (el mundo de la sintaxis), por una parte; y las palabras de contenido y sus relaciones (el mundo de la semántica), por la otra. Una gran parte de la arquitectura del conocimiento puede explicarse mediante el análisis sistemático de la estructura de ese lenguaje: es lo que llamamos lógica y teoría del método científico.

La lógica, una disciplina que normalmente asociamos con las matemáticas NOTA 7, puede verse –desde otra perspectiva– como un conjunto de reglas de acción para obtener ciertos resultados específicos, en este caso el rigor del pensamiento y la preservación del valor de verdad de lo que conocemos. Los autores del texto que comentamos describen la lógica con un énfasis en su dimensión pragmática –es decir, en relación con las diversas acciones en que sus usuarios puedan estar interesados– como algo similar a un juego de competencia o a una actividad guerrera, en que podemos distinguir tácticas y estrategias adecuadas a nuestros propósitos. Las tácticas y estrategias de razonamiento que se consignan en el texto pueden considerarse como un resumen muy apropiado de la substancia de muchos tratados de lógica.

Dentro de las tácticas de inferencia podemos subrayar como especialmente importantes el modus ponendo ponens , epítome del método deductivo:

Si A entonces B
A
____________

B

así como el silogismo disyuntivo:

o bien A o bien B
no A
_____________

B

ambos patrones de inferencia con especial importancia para la filosofía de la ciencia.

En cuanto a las grandes estrategias deductivas, el texto enfatiza dos: la directa y la indirecta. En la estrategia directa trabajamos con las premisas que tenemos a nuestra disposición; pasamos, con la sucesiva aplicación de varias tácticas, de una conclusión provisional a otra conclusión provisional, hasta llegar finalmente a la conclusión definitiva. En la estrategia indirecta pedimos prestada una premisa, que agregamos a las que ya tenemos, como cuando suponemos lo contrario de lo que queremos demostrar, como lo hace Turing en su famosa prueba de la imposibilidad de tener un algoritmo que resuelva todos los problemas de la matemática. Otra aplicación de la estrategia indirecta la veremos más adelante en este capítulo: la introducción de supuestos plausibles en ausencia de información en contrario, para completar nuestra información parcial sobre asuntos en que estamos vivamente interesados y en que tenemos que sacar conclusiones urgentes necesarias para la acción.

De especial valor en ese texto es el tratamiento de la relación entre deducción e inducción. Recomendamos al lector leerlo en forma coordinada con los textos del primer capítulo, especialmente los textos de Grimes, Popper y Kuhn, como la mejor manera de integrar los conceptos sobre el tema de la filosofía de la ciencia contemporánea. Igualmente, recomendamos estudiar las secciones sobre axiomática e integración de la ciencias en coordinación con los textos sobre teoría de la computabilidad del primer capítulo y las referencias al teorema de Gödel en los textos de Penrose y McCarthy del capítulo sexto. Finalmente, el tema de la reducción de teorías tiene gran relación con la discusión sobre reducción de la psicología a la neurofisiología propugnada por Patricia Smith Churchland en el capítulo cuarto.

No necesitamos repetir aquí toda la presentación de los conceptos básicos de la lógica y la teoría del método realizada en el texto que comentamos; remitimos al lector más bien al cuidadoso estudio de sus exposiciones. En cambio, nos interesa hacer resaltar las correlaciones que existen entre ese texto y ciertos problemas que ya hemos analizado en esta guía. En primer lugar, el examen del método hipotético-deductivo realizado en el capítulo primero es completamente congruente con los conceptos básicos de este texto. En segundo lugar, la distinción entre deducción e inducción, y la disolución del pseudoproblema de esta última, es otro punto de concordancia entre el texto que comentamos y el análisis del clásico problema de la inducción, en el mismo capítulo primero; la reducción, propuesta en este texto, del problema de la inducción a un caso de silogismo disyuntivo y el agotamiento de la imaginación del teórico para proponer nuevos miembros de esa disyunción, es completamente compatible con las ideas de Popper sobre este tema analizadas anteriormente.

Pero antes de entrar en los detalles más finos de este asunto, conviene que nos fijemos en una distinción especialmente importante dentro de la postura filosófica del logicismo –que, como vimos en el capítulo primero, comparten Carnap y sus seguidores con Popper y sus seguidores–. Se trata de la distinción entre explicación y predicción . Estos dos conceptos corresponden a un mismo fenómeno lógico pero a dos diferentes nociones de la metodología científica. Desde el punto de vista de la lógica pura, explicar un fenómeno es simplemente poder demostrar el enunciado que lo describe, a partir de otros enunciados que sirven como premisas de un razonamiento cuya conclusión es el enunciado que queremos explicar. Explicar algo es mostrar que se deduce de hipótesis que, por el momento, no tenemos razón alguna para rechazar. Predicción, por su parte, es el mismo fenómeno visto desde otra perspectiva. Predecir algo es derivar de ciertos enunciados que creemos verdaderos, el enunciado en cuestión, para el cual no tenemos otro apoyo, por el momento, que el que provee esa deducción.

La explicación y la predicción, entonces, son ambos el mismo fenómeno lógico de la deducción de conclusiones a partir de hipótesis o premisas. La distinción entre las dos no es cuestión ni de sintaxis (leyes de la lógica) ni de semántica (conexión con la realidad empírica), sino que es eminentemente pragmática: tiene que ver solamente con los propósitos de la persona que está haciendo la explicación o la predicción. Esta persona puede considerar más segura la premisa que la conclusión del razonamiento, y entonces hacer una predicción que consista en esa conclusión. O puede más bien estar convencida de la verdad de la conclusión, en la forma por ejemplo de un enunciado protocolario surgido de su laboratorio, y entonces tratar de explicar ese enunciado dentro de un contexto más amplio, buscando hipótesis plausibles (las premisas del razonamiento) desde donde pueda deducirse como su consecuencia lógica, en cuyo caso estará forjando una explicación . En ambos casos, predicción y explicación, lo que el usuario está haciendo es un razonamiento deductivo, que blande de manera distinta para lograr propósitos diferentes.

Esta doble función pragmática del razonamiento –servir tanto de predicción como de explicación– les abre la puerta a Gutiérrez y Brenes para proponer en su trabajo un concepto del método científico que no utiliza la noción de inducción y que, sin embargo, hace honor al apoyo empírico de las teorías e hipótesis científicas. Para ellos, la debilidad fundamental de los enfoques inductivistas consiste en no otorgar suficiente atención al carácter hipotético de las explicaciones científicas. Si estas son hipótesis, como lo son, deben juzgarse en simultaneidad alternativa con todas las otras hipótesis disponibles para explicar los mismos fenómenos. Una vez hecha esta lista de hipótesis, en la forma de una disyunción (porque suponemos que por lo menos una de ellas es verdadera), nuestra máquina deductiva puede comenzar a trabajar usando el patrón de inferencia –conocido desde muy antiguo– llamado silogismo disyuntivo, a saber, la forma siguiente:

o bien H 1 ... o bien H n
no H 2
...
no H n
__________________

H 1 .

Como un ejemplo, sacado de la historia de la física, tendríamos:

premisas :

conclusión :

La manera de escoger una de las hipótesis de esta lista, como la única aceptable (provisionalmente verdadera, mientras no surja una hipótesis mejor que resista todos los intentos de refutación) consiste en encontrar razones para desechar todas las otras hipótesis de la lista menos una.

Los autores nos advierten que en esta interpretación del método científico, aunque su estructura lógica –el silogismo disyuntivo– merece absoluta confianza, los resultados a que se llega están sometidos a una serie de condiciones, allende la lógica, que pueden debilitar la seguridad de su uso. Por ejemplo, debemos tener en cuenta la destreza de los experimentadores (que impone repetidas pruebas en diversos laboratorios, realizadas por distintas personas, etc.); la honestidad de todas las personas que intervienen en el proceso de investigación (lamentablemente, se han dado casos de fraudes científicos, aunque la crítica de las conclusiones y la capacidad de repetir los experimentos son un escudo normalmente eficaz contra esta clase de prevaricaciones); finalmente, debemos suponer que los científicos han pensado en todas las posibles explicaciones alternativas, lo que normalmente es cierto, por lo menos en cierto grado de detalle (no obstante, es obvio que a Newton y sus contemporáneos no se les ocurrió la explicación alternativa de los fenómenos gravitatorios que supone que la presencia de masas materiales "arruga" el espacio de las inmediaciones de esas masas; se necesitó el genio de Einstein para atreverse a pensar en esos términos).

Existen varias maneras de conocer; podemos conocer directamente, a través de los sentidos, o indirectamente, por procesos de inferencia. El artículo de Gutiérrez y Brenes contiene una detallada elaboración de la diferencia entre estas dos formas básicas de conocimiento. Queremos agregar aquí, sin embargo, que existe además una manera indirecta de conocer diferente de la aplicación de reglas de inferencia. Se trata de la analogía: en ella la mente salta de un conocimiento a otro cuando nos decimos a nosotros mismos (o decimos a otros) que un fenómeno nuevo que queremos entender es como otro fenómeno que entendemos muy bien, y predecimos aspectos del comportamiento de éste a partir de lo que podemos observar en el comportamiento del primero, al cual podemos considerar un modelo NOTA 9 del segundo.

La analogía y los modelos

La construcción de modelos es una de las maneras más poderosas de usar el método de la analogía en la ciencia, ya que los modelos son más fácilmente examinables que los fenómenos del dominio a que ellos se refieren. Estos modelos suelen usarse en combinación con la teoría más abstracta que sirve de explicación a los fenómenos, que muchas veces, precisamente por su carácter abstracto, ofrece dificultades para su plena comprensión e incluso para la determinación de su congruencia. En muchos casos, la teoría puede ser satisfactoriamente entendida, y su congruencia establecida, en el caso más simple que provee el modelo, y los resultados obtenidos pueden ser trasladados sin dificultad al dominio de la teoría abstracta y al dominio de la realidad correspondiente.

Pueden servir de modelos tanto objetos o configuraciones de estos hallados directamente en la naturaleza, como objetos construidos especialmente para el propósito cognoscitivo de la modelización. Por ejemplo, el filósofo griego Platón nos informa al principio de su obra maestra La República que intentará explicar la naturaleza del alma humana usando como modelo la estructura de la sociedad; en este caso el modelo es obviamente preexistente. En el caso de un electricista que intenta arreglar un aparato de radio con el que no está familiarizado, él mismo suele construir su modelo, dibujando un esquema de circuitos; para validar ese modelo –es decir, para asegurarse que corresponde a la cosa modelada– hará diversos experimentos de aplicación de corriente eléctrica a los distintos cables de entrada del aparato, tratando de entender los resultados de esa aplicación mediante estudio del modelo.

¿Qué es entonces un modelo? El caso del modelo artificial es el más fácil de analizar. Se dice que el fenómeno que deseamos conocer o explicar es una "caja negra", es decir, un sistema cerrado cuyas interioridades ignoramos (por ejemplo, un aparato de radio sellado cuyos circuitos internos no conocemos). Pero todo sistema tiene entradas y salidas (por ejemplo, los cables que entran al radio y los sonidos que salen o dejan de salir de él). El investigador produce hipótesis sobre la estructura interna de la caja negra, por ejemplo en la forma de un diagrama de conexiones internas; por medio de experimentos con la caja negra se determinan las funciones de entrada y salida del aparato, es decir, las respuestas (en los canales de salida) producidas por la presencia o ausencia de estímulos (en los canales de entrada) sobre el sistema.

Cuando se logra establecer que un cierto diagrama representa la misma función de entrada y salida que la caja negra, decimos que la caja negra y el diagrama son isomórficos, o que hemos encontrado (construido) un modelo del sistema en cuestión. El modelo, sea encontrado en la naturaleza o diseñado para el efecto de entender una caja negra, nos ofrece una explicación del fenómeno; es la "caja transparente" que satisface nuestra curiosidad sobre el contenido ignorado de la caja negra.

El caso del modelo real encontrado en la naturaleza, como el que usa Platón en La República , es un poco más complicado. El diagrama que dibuja el electricista es claro por definición (si no fuera claro, no se estaría usando para ayudar a entender el fenómeno no conocido); además, existe solamente para el propósito de brindar explicación a otra cosa. En cambio, explicar el alma humana –o la mente, la inteligencia– con ayuda del fenómeno social es un proceso riesgoso, pues a lo mejor la sociedad no es un fenómeno tan transparente como el autor hubiera querido. Por otra parte, no podemos suponer en todos los casos que el fenómeno natural que pretendemos usar como modelo sea totalmente inteligible; al usarlo como modelo de otro fenómeno, quizás haya aspectos de cada uno con distinto grado de inteligibilidad inmediata. En tal caso ambos fenómenos pueden resultar aclarados recíprocamente por la relación de isomorfismo, o –por el contrario– ambos resultar oscurecidos por dicha relación. Karl Popper, en su libro La sociedad abierta y sus enemigos , alega que es precisamente esto último lo que produce como resultado la comparación que Platón pretende hacer entre la sociedad y el alma humana.

En todo caso, el uso de modelos en filosofía ha sido muy abundante a través de la historia de la filosofía. Piénsese por ejemplo en el uso de los relojes como referencia para la armonía preestablecida entre las mónadas del universo postuladas por Leibniz, o en la tabla rasa postulada por los empiristas ingleses como punto de referencia para el estado inicial de la inteligencia humana. Pareciera que la filosofía es el lugar natural para emplear modelos, pues no es fácil en este terreno recurrir a experimentos. Sin embargo, hay también otras ciencias en las que el modelo ha jugado un papel importante: considérense los planetas de Kepler, de los cuales se dice que barren áreas iguales en tiempos iguales, o los modelos del interior del átomo producidos por los físicos del siglo XX, o –finalmente– los modelos de las conexiones entre los elementos químicos que componen las proteínas o la doble hélice que modeliza el ADN.

El uso de modelos, como algunos de los ejemplos citados lo demuestran, es muy anterior a la invención de las computadoras. No obstante, es obvio que la introducción de estas "máquinas universales" ha hecho mucho más disponible y más poderoso este método de conocimiento. Piénsese, por ejemplo, en los complicados modelos matemáticos de la meteorología que, aunque no puede experimentar con el clima, lo crea en forma simbólica y juega con él dentro de una computadora. Por otra parte, aunque toda clase de objetos se presta a ser estudiada mediante este enfoque, no hay duda que ciertos objetos –como el clima– se prestan más a la modelización, dada la dificultad de ser estudiados con otras metodologías. El caso que más nos interesa a este respecto es, sin duda, el de las ciencias cognoscitivas, donde la totalidad de una ciencia –la inteligencia artificial– ofrece un modelo para varias otras –la psicología, la epistemología, la neurofisiología–, como un intento de aclarar los misterios de la mente humana mediante el procedimiento de tratar de construir (aunque sea parcialmente) una mente artificial.


Ejercicios de aprendizaje

1) Haga un extracto de las principales técnicas de inferencia discutidas en el texto a que se refiere el comentario precedente. Dé un ejemplo de cada una, distinto del ofrecido en el texto.

2) Haga un resumen de lo explicado en la Antología o en el comentario precedente sobre el método de conocimiento analógico.

3) El modus ponendo ponens parece la mejor muestra del método deductivo, es decir, del que nos permite pasar de ciertas premisas a ciertas conclusiones, a la manera en que los matemáticos justifican las verdades de su ciencia. Otro esquema de inferencia bautizado en latín por los lógicos medievales es el modus tollendo tollens que tiene esta forma:

Si A entonces B
no B
____________

no A .

Como usted lo podrá notar si recuerda la teoría de la ciencia de Karl Popper, este esquema corresponde al método de falsación de hipótesis por incumplimiento de sus consecuencias. ¿Podría idear usted el esquema lógico que correspondería al método (no válido) de confirmación de hipótesis por cumplimiento de sus consecuencias?

4) ¿Qué relación lógica interesante podría notar usted entre los esquemas de inferencia modus ponendo ponens y modus tollendo tollens ? Para tratar de encontrarla, escriba los dos esquemas uno contiguo al otro y compare su forma.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes técnicas puede considerarlo correcto.


2) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

3) Falacia de afirmación del consecuente:

Si A entonces B
B
____________

A .

4)

Modus ponendo ponens

Si A entonces B
A
____________

B

Modus tollendo tollens

Si A entonces B
no B
____________

no A

En realidad, el modus tollens es un caso particular del modus ponens , si tomamos en cuenta el llamado principio de contraposición, que nos permite sustituir cualquier expresión del tipo

Si A entonces B

por una expresión del tipo

Si no B entonces no A.

Si hacemos esa transformación en el modus tollens , su esquema se ve así:

Si no B entonces no A
no B
_________________

no A

que, como se puede notar por simple inspección, no es otra cosa que el mismo modus ponens .


Ejercicio de lectura

Como mejor preparación para el siguiente comentario, recomendamos leer el texto de Verónica Dahl (DAHL 83); una selección del mismo traducción al español puede encontrarse en el capítulo tercero de nuestra Antología.


Comentario

En el capítulo segundo ilustramos ampliamente la íntima relación que existe entre los algoritmos y la computabilidad. En este capítulo consideramos a los algoritmos bajo otra luz, como un producto del razonamiento lógico y en cierta forma como la encarnación práctica de ese razonamiento. Cuando probamos una conclusión a partir de ciertas premisas (por ejemplo, usando las tácticas y estrategias de razonamiento presentadas en el texto de Gutiérrez y Brenes), formamos una "línea de prueba". Esa línea de prueba es asimilable a un algoritmo, pues encarna un procedimiento eficaz para llegar de las premisas a la conclusión, por medio de la aplicación de las respectivas reglas de inferencia.

Los programas de computación son el enlace esencial entre construcciones intelectuales como algoritmos y estructuras de datos, y las máquinas que producen los respectivos poderosos efectos computacionales. En la práctica, sin embargo, necesitamos de un apoyo muy particular para pasar de la lógica y el razonamiento al programa que hace realidad esa lógica en las operaciones físicas de una computadora. La razón de esta necesidad estriba en el carácter sumamente simple de las instrucciones que entiende directamente una computadora. Recuérdese que las computadoras son la encarnación posible de la máquina abstracta universal que concibió Turing. Recuérdese también que esa máquina, concebida como un modelo general de un algoritmo capaz de imitar a cualquier otro algoritmo, obedecía instrucciones sumamente simples, como "moverse un espacio a la izquierda", "leer el cuadro que está bajo la cabeza lectora" y "estampar el signo X en el cuadro que está bajo la cabeza lectora".

La razón para que Turing dotara a su máquina de un lenguaje tan simple tenía que ver con su deseo de demostrar que todo algoritmo podía expresarse en ese lenguaje; su propósito, naturalmente, estaba relacionado con el intento de demostrar que no podía existir un algoritmo para resolver todos los problemas matemáticos (problema decisorio de Hilbert). Era un propósito dialéctico o demostrativo, eminentemente teórico, un ejercicio dentro de la ciencia de las metamatemáticas. Curiosamente, la existencia de ese lenguaje tan simple pasaría a cumplir una función muy útil en el momento en que los ingenieros de los años cuarenta se dedicaran a tratar de construir una máquina electrónica que realizara en la práctica la idea de la máquina universal de Turing. En efecto, es mucho más fácil y más barato construir una computadora con unas pocas instrucciones muy simples que una con muchas instrucciones, cada una de ellas relativamente complicada. Desde luego, el carácter elemental de las operaciones exige el empleo de muchas de ellas para expresar un procedimiento con un mínimo de complejidad; sin embargo, ello no afecta el rendimiento de la máquina, dada la alta velocidad de las operaciones electrónicas. Así, lo que originalmente estaba motivado en un imperativo científico y teórico, resultó justificado en el terreno práctico de la tecnología y de la economía.

Pero volvamos al tema del enlace práctico entre los razonamientos y las máquinas. Decíamos que ese enlace requiere un apoyo muy particular que permita pasar eficazmente de la lógica y el razonamiento concebidos por el matemático, al programa alambrado que realiza operaciones físicas dentro de la computadora. Ese enlace o apoyo lo ofrecen los lenguajes de programación, que permiten construir puentes entre las instrucciones que obedece directamente la máquina (como vimos, excesivamente simples) y el algoritmo expresado en términos de una lógica humana mucho más compendiosa que el lenguaje binario de una máquina Turing. Estos lenguajes de programación son ellos mismos implantables en una máquina física en calidad de programas de computación, y tienen como objetivo traducir los algoritmos o razonamientos de alto nivel al lenguaje simple instaurado eléctricamente en las entrañas de la computadora.

Ya antes en este capítulo nos referimos a los lenguajes de programación como máquinas virtuales . Hagamos ahora este concepto un poco más preciso. Una máquina física, al igual que la máquina de Turing, se define por su lenguaje; ese lenguaje es muy simple, y los programas escritos en él son muy largos y difíciles de comprender para un ser humano. Recordemos del capítulo segundo que las máquinas universales pueden imitar el funcionamiento de otras máquinas; para ello necesitan recibir como dato la descripción de la máquina que deben imitar, como lista de quintetos escritos en el lenguaje que ellas pueden entender. Igualmente, una computadora puede recibir un programa, escrito en lenguaje de máquina, que para todos los efectos conductuales la transforman en otra máquina (que no sería física sino aparente o virtual). La máquina que funciona en último término es la máquina física, pero se comporta de hecho como la máquina definida en el programa, o sea, como la máquina virtual. Si la máquina definida por el programa es un lenguaje de programación de alto nivel, como por ejemplo Logo, el programador no tendrá necesidad de usar el lenguaje de bajo nivel –el lenguaje de máquina– para utilizar la computadora. En cambio, podrá dar las instrucciones que desee ver ejecutadas en el lenguaje de nivel superior, sin molestarse en pensar de qué manera el programa del lenguaje de programación transforme las instrucciones dadas por el usuario en instrucciones del nivel básico que la máquina puede comprender y obedecer.

Los lenguajes de programación proveen una forma de representar un algoritmo de manera compacta, pero con toda la precisión requerida para que su ejecución sea eficaz, en una descripción de "alto nivel" (esto es, fácilmente entendible por un ser humano) que puede ser traducida ("compilada") a una versión de "bajo nivel" (esto es, que la computadora pueda llevar a cabo o ejecutar). La ejecución del programa por la computadora es lo que hace que el algoritmo cobre vida, dándole instrucciones a la máquina para que realice las tareas solicitadas por el usuario; pero de hecho ese programa solo puede ser escrito gracias a la existencia de los lenguajes de programación que ofrecen al programador una manera cómoda para concebir y representar sus algoritmos.

Uno de los acontecimientos más notables de la historia de los lenguajes de programación fue la invención de Prolog, realización de una idea de Robert Kowalski (KOWALSKI 82) y de varios otros investigadores europeos que concibieron la idea de usar la lógica común (sometida a un formato especial –llamado cláusulas Horn–, muy fácilmente comprensible y manipulable) como un lenguaje de programación. La idea es impresionante por su simplicidad: si programar es normalmente la conjunción de dos actividades, a saber, diseñar el programa desde el punto de vista de su lógica y enseguida codificar esa lógica en un lenguaje de programación, ¿por qué no ahorrarse este segundo paso haciendo de la lógica misma un lenguaje de programación? ¡Idea a la vez simple y poderosa! Prolog explota la identidad fundamental que existe entre el razonamiento o la prueba de teoremas, por una parte, y el algoritmo o el procedimiento eficaz (programa), por la otra. El artículo de Dahl explica con mucha claridad las características generales de este extraordinario lenguaje.

Los algoritmos (los razonamientos) nos son útiles como una manera de resolver problemas; en realidad, es la capacidad de razonar (o producir algoritmos) la que ha dado la ventaja a la especie Homo sapiens para sobresalir sobre todas las otras especies y enseñorearse de la Tierra. Si ahora deseamos poner esos algoritmos en forma de programa, en último término obedecible por una máquina, nuestra tarea consistirá fundamentalmente en desmenuzar el problema para expresarlo en términos de un conjunto de estados del universo de discurso de que se trate, por una parte (las llamadas estructuras de datos) y un conjunto de acciones capaces de transformar ese universo o estructuras de datos en la dirección deseada (los llamados procedimientos).

Una clase particular de problemas, entonces, podrá especificarse mediante la descripción de un estado inicial del universo y de un estado final o deseado. Supondremos que nuestro solucionador de problemas (el conjunto de procedimientos, debidamente ejecutados por la máquina) logrará la transformación del estado inicial en un estado final mediante el ensamblaje de ejecuciones particulares de los procedimientos debidamente encadenados para obtener ese objetivo. La especificación lógica de nuestra solución al problema planteado consistirá entonces en la lista de hechos actuales del universo de discurso y la lista de procedimientos que, debidamente ejecutados, transformará esos hechos para producir el estado buscado. El lenguaje de programación –Prolog en este caso– se encargará de ejecutar en cadena los procedimientos y ofrecernos la solución al problema concreto.

Tomemos un ejemplo muy sencillo: nuestro problema podría ser el de producir una lista larga de elementos, a partir de dos listas parciales de sus elementos. Por ejemplo, podríamos desear que la lista [A B C] fuera concatenada con la lista [D E F] para producir una lista total con los elementos en ese mismo orden. Quisiéramos redactar un programa que sirviera para darnos la respuesta correspondiente a este caso, pero que fuera suficientemente general para concatenar cualesquiera dos listas, dándonos como resultado la lista concatenada correspondiente.

En Prolog, los algoritmos se expresan en forma declarativa, es decir, describiendo la forma de nuestro universo en dos estilos o maneras: como colección de hechos (si los hay) y como colección de reglas o procedimientos (por así decirlo, las leyes que rigen esa parte de la realidad). En el ejemplo de la concatenación de listas no tendríamos una colección de hechos, pero sí de reglas. La lista de reglas sería la siguiente:

Con un poquito de atención se puede ver que estas dos reglas son una definición perfecta del algoritmo que permite concatenar dos listas, de cualquier tamaño que estas sean. Dicho de otra manera, aquí tenemos un procedimiento eficaz o, si preferimos decirlo así, un razonamiento concluyente que nos dice cómo formar una lista a partir de otras dos, una por lo menos de las cuales sería más corta que la lista resultante. La forma específica en que Prolog usa el algoritmo la dejamos como un ejercicio de aprendizaje para el estudiante, que será más sencillo de realizar después de la explicación sobre un algoritmo más sencillo que presentaremos enseguida.

Las reglas anteriores 1 y 2 están expresadas en formato Horn, que se caracteriza de la siguiente manera: una cláusula es Horn si contiene dos partes, separadas entre sí por la partícula conectora "si", cada una de las cuales puede ser vacía (en cuyo caso no necesitamos expresar la partícula conectora). La parte izquierda (llamada usualmente cabeza de la cláusula) contiene a lo más un miembro, de la forma

La parte derecha (llamada normalmente cola de la cláusula) puede contener cualquier número de estos elementos (llamados literales), separados por comas. Un ejemplo de cláusula Horn con parte derecha formada por más de un literal sería la siguiente:

La cláusula Horn con parte izquierda pero sin parte derecha es una regla incondicional, como por ejemplo la regla 1 escrita antes. También serían cláusulas Horn sin parte derecha los siguientes hechos de un universo posible:

La cláusula Horn sin parte izquierda pero con parte derecha equivale a una pregunta:

que, por razones obvias Prolog prefiere escribir:

La cláusula Horn sin parte izquierda ni derecha es también una posibilidad lógica, que representa la contradicción, o el enunciado absurdo; le resulta útil a Prolog para indicarnos cuándo, en sus procesos automáticos de inferencia, ha llegado a demostrar algo por reducción al absurdo NOTA 10.

Tratemos de seguir lo que haría Prolog para contestar la pregunta 8. Primeramente, trataría de encontrar un hecho en la lista de hechos y reglas (lista que puede ser denominada indiferentemente "el programa" o "la base de conocimientos") que tenga literalmente la misma forma de la pregunta. Si lo pudiera encontrar, contestaría la pregunta afirmativamente. Si no puede encontrarlo, siempre podría encontrar, como en este caso, una cláusula Horn cuya parte izquierda corresponda rigurosamente a la pregunta; recuérdese que la pregunta es siempre una parte derecha, y que de lo que se trata es de aparear una parte derecha con una parte izquierda. En nuestro programa, la pregunta de si Ana e Inés son hermanas comenzaría a tener éxito al encontrar la cláusula 3, donde, para lograr apareamiento, tendría que hacer algunas unificaciones de constantes con variables, dando como resultado la siguiente cláusula deducida:

Ahora la pregunta original va a quedar sustituida por tres preguntas subordinadas (recuérdese que los lados derechos son preguntas y los lados izquierdos son respuestas o hechos), a saber, la cola de la cláusula. Si esas tres preguntas subordinadas pueden contestarse positivamente, la pregunta original quedará contestada por la cabeza (parte izquierda) de esta cláusula, que podemos interpretar como un hecho condicionado (condicionado a que las tres preguntas de la cola de la cláusula encuentren respuesta afirmativa).

Ahora tomamos la primera de las preguntas subordinadas, a saber

y nos dedicamos a buscar un hecho (incondicional o condicionado) que pueda aparearse con ella. Enseguida lo encontramos, a saber, la cláusula 4. Al aparearla con la pregunta, las variables w y v reciben como valores, respectivamente, "claudio" y "marlene", valores que se extienden a la segunda pregunta subordinada, la cual reza ahora así:

Como ya la pregunta 10 tuvo éxito, Prolog busca contestar la pregunta 11, y lo hace afirmativamente al encontrar la cláusula 5. Ya solo queda por contestar la subpregunta

que, para simplificar el ejemplo, vamos a suponer que Prolog puede contestar directamente de manera afirmativa NOTA 11.

Para los lectores familiarizados con lenguajes de programación más tradicionales, de tipo imperativo, el estilo de programación de Prolog, de carácter declarativo, parecerá sorprendente. Su ventaja fundamental, como se explicó antes, consiste en el ahorro del paso de codificación una vez que se ha especificado –usando el formalismo Horn– la naturaleza del problema. Una vez expresado el problema en términos de los hechos y reglas pertinentes, la redacción del programa está prácticamente concluida NOTA 12 y se puede comenzar a utilizar el programa.

Pero además, el hecho de que Prolog consista en sí mismo en una máquina de inferencia, tiene como notable efecto la creación de "cláusulas virtuales" que podemos considerar como parte del conocimiento existente en el programa. Así por ejemplo, en el programa que hemos usado como demostración, la fraternidad entre todos los hijos de los mismos padres no necesita ser directamente incluida en la base de conocimientos: de todos modos está presente, como derivación automática de las premisas adecuadas que sí se incluyen expresamente entre las cláusulas del programa. Esta característica convierte a Prolog en un lenguaje muy favorable para el almacenamiento de información; podemos decir que los sistemas de información programados en Prolog constituyen bases de conocimientos y no simplemente bases de datos , dada esta posibilidad de derivar automáticamente, cuando se requiere, las consecuencias no explícitas de la información que el sistema contiene. Nótese que esta capacidad para deducir consecuencias de la información almacenada no tiene que programarse especialmente: el lenguaje mismo la provee, sin esfuerzo alguno de programación por parte del usuario.

Otra característica de Prolog muy útil e interesante estriba en la posibilidad de extraer de la base de conocimientos respuestas múltiples. Por ejemplo, con base en la información de las cláusulas 3-7 anteriores, es posible dirigirle la pregunta

y obtener primero como respuesta

Pero si le pedimos que continúe la búsqueda de contestaciones, nos dará enseguida

Y si insistimos una vez más, nos dará finalmente

siguiendo el orden de las cláusulas que sirven de premisas para esta deducción.

Otra característica útil e interesante de Prolog consiste en la no distinción entre argumentos de entrada y de salida: cualquier argumento –o combinación de ellos– puede ser escogido para ser recuperado. Por ejemplo, en la anterior pregunta, escogimos tener el primer argumento como entrada y el segundo como salida; pero bien podemos preguntar con una escogencia inversa, así:

Y los efectos serán semejantes.

Pero además podríamos preguntar usando los dos argumentos como entrada, en la forma siguiente:

lo que nos daría como respuesta, sucesivamente, todas las relaciones de fraternidad que conoce el sistema, a saber:

Todas estas singulares propiedades hacen de Prolog mucho más que un lenguaje de programación ordinario. Su estrecha relación con la lógica, y la compenetración esencial de la lógica y el conocimiento, lo convierten en el instrumento ideal para la representación del conocimiento, lo que ha estimulado su uso por los investigadores en aplicaciones de inteligencia artificial.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Usando el procedimiento de Prolog

trate de seguir el razonamiento que haría Prolog para contestar afirmativamente la pregunta

Recuerde que en la sintaxis de Prolog, la expresión "A|[B C]" es equivalente por definición a la expresión "[A B C]" y que la expresión "[]" es la lista vacía.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) La pregunta encuentra que puede aparearse con la parte izquierda de la segunda cláusula del procedimiento, dando la siguiente unificación:

Ahora hay una pregunta subordinada que debe tratarse de contestar, a saber:

Prolog tratará de contestarla, y se encuentra que solo se aparea con la segunda cláusula del procedimiento, dando la siguiente unificación:

Ahora hay una pregunta subsubordinada que debemos contestar para poder contestar las dos preguntas de mayor rango, a saber:

Prolog tratará de contestarla, y se encuentra con que se aparea con la primera cláusula del procedimiento, produciendo la siguiente unificación:

La unificación lograda aquí se extiende a la cabeza de la pregunta de rango inmediato superior 3, que ahora luce así por sustitución de la variable "z" por "[C D]":

Esto es equivalente a

de acuerdo con la definición del signo "|". Esta última fórmula es la respuesta a la subpregunta, y extiende su unificación a la cabeza de la cláusula unificada inicial 1, que ahora lucirá así:

Esto es equivalente a

de acuerdo con la definición del signo "|", y constituye la respuesta afirmativa a nuestra pregunta original.


La insatisfacción con la lógica clásica

A pesar del poder expresivo y rigor sin par de la lógica de predicados clásica, muchos investigadores que tratan de comprender o de simular el comportamiento del cerebro humano, la han encontrado insatisfactoria o insuficiente para enmarcar sus trabajos. Algunos de ellos argumentan que el propio carácter estricto de la deducción lógica la hace incompatible con aplicaciones de la vida real, ya que en esta encontramos, no el rigor, sino la ambigüedad, la vaguedad, la indeterminación, el conocimiento parcial, la probabilidad y la aproximación. Estas inquietudes los han llevado no a un rechazo de la lógica –demasiado valiosa para prescindir de ella–, pero sí al intento de desarrollar lógicas alternativas que en alguna medida llegan a diferir, a veces drásticamente, del cálculo de predicados clásico. Según Raymond Turner (TURNER 84) tales lógicas alternativas pueden dividirse en dos grupos. En el primero están las lógicas rivales de la lógica clásica y en el segundo las lógicas que la extienden o que aumentan su expresividad.

Los sistemas rivales no difieren de la lógica clásica en el lenguaje empleado, sino en que ciertos teoremas de la lógica clásica son inválidos en los sistemas no estándares. El ejemplo más notorio es la ley de tercero excluido (o bien p o bien no p) que es válida en la lógica clásica pero no en las lógicas intuicionista o de 3 valores (falso, verdadero, ni falso ni verdadero) NOTA 13.

Las lógicas que extienden la lógica clásica aceptan todos sus teoremas, pero agregan otros, construidos con símbolos que incluyen operadores introducidos especialmente para ellas. Así, estos sistemas tienen un vocabulario más rico que el cálculo de predicados. Por ejemplo, la lógica modal se enriquece con los operadores L (es necesario que) y M (es posible que), con lo cual resulta válida la ley A => MA (si A entonces es posible que A ). En estos casos, las reglas de inferencia tienen también que ser extendidas para incluir reglas que permitan trabajar con tales nuevos operadores.

Las lógicas alternativas han encontrado muchas aplicaciones en la informática, en especial en lo que se refiere a la especificación y verificación de programas. La lógica modal, por ejemplo, se ha aplicado en la forma de lógica dinámica (HAREL 79) para facilitar el enunciado y prueba de propiedades de los programas. Los programas son considerados como relaciones entre estados y, consecuentemente, cada programa puede expresarse con ayuda de un operador modal.

La lógica temporal se aplica con éxito en la especificación y verificación de programas concurrentes (paralelos). Manna & Pnueli (MANNA 79) introducen una forma de lógica temporal como una manera de razonar sobre secuencias de estados en esos programas.

La lógica intuicionista, en la forma de la teoría de tipos de Martin-Löf, provee una teoría completa del proceso de especificación, construcción y verificación de programas. Los proponentes de la lógica intuicionista consideran que las matemáticas constructivistas (basadas en la lógica intuicionista) son un marco de referencia más adecuado para la informática que las matemáticas clásicas (TURNER 84).

En el campo específico de la inteligencia artificial, el tópico de las lógicas no estándares ha estado en discusión desde la publicación de McCarthy y Hayes (MCCARTHY & HAYES 69). La lógica borrosa y la lógica polivalente (por ejemplo, con valores de verdad VERDADERO, DUDOSO, FALSO) han sido introducidas para lidiar con información incompleta o vaga. Otras lógicas alternativas son las lógicas modales –en la forma de lógicas del conocimiento, de la creencia o de la acción– introducidas por Moore (MOORE 84 ) y Konolige (KONOLIGE 82 ). Moore emplea su lógica modal en un programa que razona sobre el conocimiento de un agente y Konolige usa la suya para modelar agentes computacionales capaces de realizar tareas cooperativas que involucran la interacción de conocimiento, acción y planeamiento. También han sido introducidas recientemente otras lógicas alternativas, llamadas lógicas temporales, que lidian con la sucesión entre eventos (MCDERMOTT 82).

Pero sin duda la lógica alternativa que tiene más aplicaciones en este momento en inteligencia artificial, y sobre la que ha habido más discusión en el último decenio, es la llamada lógica no monotónica. Se trata de una especie de lógica modal, que permite derivar conclusiones plausibles, con la peculiaridad de que los teoremas, introducidos con ayuda de los operadores o reglas agregados a la lógica clásica, son retractables. El resultado es que el conjunto de teoremas no crece monotónicamente, como en la lógica clásica, sino que crece y decrece, conforme los teoremas plausibles que se hayan probado deban ser retractados a la luz de nuevos elementos de juicio.


Ejercicio de lectura

Como preparación para el comentario, recomendamos leer el texto de Raymond Reiter sobre el razonamiento no monotónico (REITER 87); una selección traducida al español aparece en el capítulo tercero de nuestra Antología.


Comentario

De acuerdo con la definición de Reiter, el campo del razonamiento no monotónico consiste en la derivación de conclusiones plausibles no infalibles, a partir de un conjunto de conocimientos codificados como fórmulas de una lógica conveniente. Esta lógica contiene por lo menos una regla que permite agregar teoremas que pueden ser retractados posteriormente, a la luz de nueva información adquirida por el agente razonador. Las conclusiones obtenidas por este razonamiento, entonces, se entienden siempre como tentativas; el razonador puede tener que abandonarlas en el momento en que se añada información a la base de conocimientos de un tipo que entre en conflicto con dichas conclusiones tentativas. Esta característica discrepa de un rasgo esencial de la lógica clásica, esencialmente monotónica. "Monotónica" quiere decir, aplicada la palabra a la lógica, que toda nueva información que agreguemos al sistema deja intacta la posibilidad de demostrar las viejas conclusiones. La única lógica monotónica es la que trabaja siempre con verdades de carácter infalible, que nunca dejan de ser verdades.

Por alguna razón particular, el ejemplo universalmente empleado dentro de la comunidad de practicantes de la inteligencia artificial para explicar el razonamiento no monotónico tiene que ver con el vuelo de los pájaros. El ejemplo comienza con una llamada de atención en el sentido de que el enunciado "los pájaros vuelan" no es necesariamente equivalente al enunciado, más contundente, "todos los pájaros vuelan". La razón de la no equivalencia estriba en el hecho de que, a pesar de nuestro compromiso práctico con el primer enunciado, tenemos que reconocer que existe infinidad de excepciones a él, por lo que el segundo enunciado afirma más de lo que estaríamos inclinados a aceptar. En efecto, ni las avestruces, ni los pingüinos, ni los patos de Peking, ni los pájaros untados de asfalto en las costas de Kuwait durante la Guerra del Golfo, ni los pájaros recién nacidos, ni los pájaros de madera, son capaces de volar. Sin embargo, eso no debilita nuestro compromiso con la afirmación de que, en la mayoría de los casos no calificados, es verdad que los pájaros vuelan. Así, si se nos habla de un pájaro específico (llamémoslo Piolín), y no se nos dice nada más sobre él, tenemos toda la razón del mundo para esperar que, si se le deja abierta la jaula, podrá escapar volando de ella. Nuestra confianza en esta predicción, sin embargo, no es invulnerable: solo vale mientras no nos enteremos que Piolín es uno de los pájaros excepcionales, por ejemplo, que es un pájaro disecado o un pingüino. En otras palabras, mientras no tengamos razones para considerarlo de otra forma, tratamos a Piolín o a cualquier otro pájaro que se nos mencione, como un pájaro típico o normal , una de cuyas características es la capacidad de vuelo.

Si ahora hacemos un intento de representar la proposición con cuya verdad básica nos sentimos comprometidos, "los pájaros vuelan" por medio de un patrón de razonamiento plausible, podremos decir algo como esto:

La intención de estos patrones, como de cualquier otro patrón de razonamiento (por el ejemplo, el modus ponens o el silogismo disyuntivo estudiados en este mismo capítulo) es permitirnos sacar consecuencias de lo que sabemos, es decir, hacer explícito nuestro conocimiento virtual. La diferencia entre los patrones clásicos y estos nuevos patrones (llamémoslos no clásicos) consiste en que los primeros conducen a conclusiones definitivas, mientras que los segundos conducen a conclusiones provisionales o retractables. Son razonamientos plausibles, no razonamientos completamente seguros. No obstante, es importante tener acceso a ellos, porque las necesidades de la vida nos urgen todo el tiempo a tomar decisiones que no pueden esperar hasta el momento en que tengamos conocimientos seguros sobre la materia (momento que, a lo mejor, no se llegará a presentar nunca). Decimos en estos caso que "nos la jugamos" o "saltamos a conclusiones" o, más técnicamente, que hacemos una hipótesis por omisión , es decir, por falta de conocimiento en contrario.

Si sabemos que Piolín es un pájaro vivo y nadie nos ha dicho que sea un pingüino o una avestruz o que le hayan cortado las alas, etc., esperamos que sea verdadero que vuela. Esta condicionalización a no saber algo contrario es, desde luego, lo que hace de los patrones no clásicos reglas plausibles en vez de reglas deductivas; respaldan suposiciones razonables en lugar de conclusiones infalibles. Las conclusiones que producen quedarán marcadas para siempre como conclusiones débiles, que debemos estar preparados para abandonar en el momento en que la hipótesis por omisión que les sirvió de base quede falsada por descubrimiento de nueva información.

Todo esto nos lleva a concebir otra posible formulación de la proposición "los pájaros vuelan", a saber:

O más generalmente, lo que constituiría nuestra regla de razonamiento por valor de omisión:

Nótese que todas estas formulaciones adolecen de falta de carácter formal: tanto "típicamente" como "normalmente" como "ausencia de información contraria". Una manera natural de leer esto es algo así como "no se conoce nada que sea incongruente con A". Por ejemplo, en la teoría de bases de datos hay una convención explícita en relación con la representación de información negativa que consiste en abstenerse de representarla, y en cambio suponer que la ausencia de información positiva equivale a la correspondiente negación. Por ejemplo, todos estamos familiarizados con la manera en que los agentes de viajes representan las conexiones de vuelos entre ciudades: simplemente se ponen en una lista las ciudades conectadas, con el número del vuelo y las horas y días de la semana. En ninguna parte aparece que, por ejemplo, ninguna línea aérea conecta las ciudades de San José, Costa Rica y París, Francia. La razón para proceder así consiste en lo absolutamente dispendioso y difícil de mantener que sería un sistema en que toda la información negativa estuviese explícitamente representada. Definitivamente, la información negativa es muchísimo más abundante que la afirmativa y, además, nunca podríamos estar completamente seguros de que tendríamos representada toda la información importante (¿habría que poner que no existe conexión aérea entre Cartago, Costa Rica y París, Francia?).

En vez de representar explícitamente la información negativa, las bases de datos la representan implícitamente, apelando al supuesto de mundo cerrado que nos dice, de manera general, que toda la información positiva pertinente ha sido expresamente representada. Si algo no está representado daremos por un hecho que no existe, aunque, ocasionalmente esto nos ponga en problemas (por ejemplo, la falta de información sobre una conexión aérea entre Miami, USA y Alajuela, Costa Rica nos puede hacer concluir que no existe tal conexión, lo cual sería falso, ya que el aeropuerto de San José está en Alajuela). En el caso de bases de datos sencillas, que guardan hechos sencillos o atómicos, este supuesto de mundo cerrado no plantea mayores problemas. En cambio, en bases de datos deductivas –al estilo Prolog– el supuesto de mundo cerr