La inteligencia artificial, disciplina de las ciencias de la computación, nace en los años 50 con los trabajos sobre probadores de teoremas de, entre otros, H. Simon y A. Newell. Sin embargo, es concebida un decenio antes, durante los años 40. A. Turing escribe en esa época un artículo, recogido en la colección Computers and Thought de Feigenbaum et alia, en que entre otras cosas propone una prueba para decidir sobre la inteligencia de las máquinas. La prueba consiste en adaptar un juego de salón a la interacción hombre/máquina; si la persona cree tener como interlocutora a otra persona, es indicio de que la máquina actúa de manera inteligente. El juego consiste en adivinar el sexo del jugador contrario, invisible y empeñado en engañar a su adversario. Implica no sólo la capacidad de manejar los estereotipos sexuales, sino también la habilidad de manipular los mecanismos de la simulación y el engaño. Es muy revelador que Turing prefiera escoger esta prueba como criterio de la inteligencia, en vez de utilizar una prueba que mida experticia, como habría sido por ejemplo la capacidad de jugar ajedrez. El tiempo le ha dado la razón; en 1986, Hitech y SUPREM, programa y arquitectura de los autores C. Ebeling y H. Berliner respectivamente, juegan ajedrez a nivel de "maestro", y están peligrosamente cerca de disputar el campeonato de USA; en cambio, no hay ninguna máquina capaz ni lejanamente de engañar a un ser humano sobre sus características personales.
Los mismos A. Newell y H. Simon que crean los programas "serios" para probar teoremas lógicos, son de los primeros en desarrollar programas menos académicos que simulan al jugador de ajedrez. Unos años después, ellos mismos producen el programa "Solucionador general de problemas" ("General Problem Solver" en inglés, mejor conocido como GPS), en el que tratan de emular los métodos más generales de la inteligencia humana, lo que comúnmente identificamos como sentido común. El GPS tiene tres objetivos: el primero es construir un modelo de la inteligencia humana; es un interés científico, de comprensión del fenómeno; el segundo es crear herramientas inteligentes, la aplicación es lo importante, el provecho que se pueda obtener; el tercero, el de mayor fuste académico, es descubrir en qué consiste la inteligencia en general, independientemente de su incorporación en un ser humano o en cualquier otro organismo o mecanismo.
Refiriéndonos a este último objetivo, cabe decir que los investigadores en IA no son los primeros en enfocar el problema de la inteligencia con tal grado de generalidad. Los psicólogos conductistas nos ofrecen un paradigma de interpretación del comportamiento en que no se distingue entre sistemas humanos y sistemas animales. En efecto, el conductismo trata de entender los fenómenos psicológicos humanos partiendo de principios muy generales obtenidos en el estudio de la conducta de los animales, a partir de los experimentos de Pavlov. Es una aplicación particular de la famosa máxima de Bacon: Busca en los fenómenos más simples las leyes que actúan en los fenómenos más complejos". La misma situación vuelve a ocurrir con los modelos de Newell y Simon, pero en este caso los fenómenos más simples se encuentran en el funcionamiento de las máquinas, no en el comportamiento de los animales.
La historiadora británica M. Boden considera que el paradigma computacional es definitivamente superior al paradigma conductista. ¿Por qué? ¿Cuál es el contraste entre ambos? Con el conductismo la introspección caen en el descrédito; se generaliza la prohibición de hablar de procesos mentales; sólo lo externo, lo observable, es materia de estudio científico. El paradigma computacional reivindica los procesos internos; hay un estado interno en la máquina, además de entradas y salidas que corresponden al estímulo y respuesta del conductismo. Los conductistas son ciegos a la etapa intermedia porque no tienen ninguna analogía a qué apelar para esa etapa. Ahora sí: tenemos un proceso interno en la máquina, si no directamente observable en el momento de su funcionamiento, empíricamente asegurado por su proceso mismo de construcción.
Dado que aceptamos la existencia de esos estados intermedios entre estímulo y respuesta, entrada (input) y salida (output), ¿cual sería el criterio para considerar que un sistema tiene estados internos –que en el caso del ser humano llamaremos "estados mentales"–? Varios candidatos que han sido propuestos serían los siguientes, expresados con modismos progresivamente menos cargados hacia el entendimiento humano:
Todos estos modismos pueden unificarse en su mínimo común denominador, el concepto de representación, presente en todos los anteriores de la lista. El co9ncepto de representación viene a ser reconocido como un elemento fundamental del comportamiento, que constituye el estado intermedio entre el estímulo y la respuesta. Con la introducción de este concepto la actitud del científico del comportamiento se transforma: reconoce que la base de lo mental y de la inteligencia es la representación, que en todo acto mental está implicado un proceso representativo. Una vez comprendido esto, podemos hablar de inteligencia humano, de inteligencia de la máquina, de inteligencia extraterrestre, como capacidad de manipular representaciones. Se abre así la posibilidad de elaborar una teoría de la inteligencia en general, independiente de su "encarnación" en humano, animal, máquina o marciano.
Muchos años después de su labor pionera de los años 50, con ocasión de recibir una distinción cobijada por el nombre de Turing (hermosa coincidencia), Newell (científico de la computación) y N Simon (psicólogo y premio Nobel en economía), proponen la teoría de los sistemas físicos de símbolos como explicación última de la inteligencia.
"Símbolos" es otra forma de llamar a las representaciones; "físicos" subraya su carácter material; "sistema" alude a la inmensa complejidad de los fenómenos involucrados. La teoría de Newell y Simon insiste en que el uso de la computadora nos ha puesto en contexto, por primera vez, con la naturaleza física de los símbolos. Los lenguajes de computación, especialmente los no numéricos (LISP, lenguaje para la manipulación de listas, por ejemplo), están constituidos por dos clases de símbolos: los que representan procesos o acciones y los que representan valores (otros símbolos). Los símbolos que representan procesos los llamamos "funciones" y los que representan valores los llamamos "variables" (las variables en computación son algo distinto que en matemática: denotan un lugar de la memoria yi no un elemento que debe ser sustituido de manera uniforme para garantizar la congruencia de las ecuaciones).
El concepto de símbolo adquiere en computación un significado muy concreto: es un puntero, una flecha almacenada en un lugar de la memoria que señala a otro lugar de la memoria (donde se encuentra el valor del símbolo o el proceso con que el símbolo está asociado). La inteligencia consiste en la capacidad de manipular símbolos, entes que no nos interesan por lo que son sino por lo que representan, en la aptitud para manejar las cosas indirectamente. Inteligencia es indirección, dirección indirecta, la indirección propia del simbolismo, y esta indirección es la que constituye la fuerza del pensamiento.
La diferencia entre dos clases de símbolos, reconocida por el paradigma de los sistemas físicos de símbolos, vierte luz sobre una polémica importante en la filosofía contemporánea, especialmente de la tradición wittgensteiniana, a saber, si existen "primitivos" en el lenguaje, para explicar nuestra comprensión de los cuales sólo podemos decir: "Es parte de nuestra historia natural". Se trata del problema de si la lingüística implica necesariamente constreñimientos no lingüísticos, es decir biológicos, con los que tenemos que contar. El paralelo computacional es clarísimo: Hay símbolos, del tipo función, que están definidos en el nivel de hardware, más allá de la programación (software), que corresponden muy directamente a lo que es la biología en el caso del lenguaje humano.
El paradigma computacional se ha mostrado ya fecundo en el apoyo a la imaginación creadora del científico para concebir importantes leyes que rigen la inteligencia. Por ejemplo, los mismos Newell y Simon descubren la ley de proporcionalidad inversa entre potencia y alcance los métodos de pensar. El GLPS no es exitoso como instrumento para replicar la capacidad de resolver problemas que asociamos con el sentido común; pero en cambio, resulta sumamente productivo al revelar los constreñimientos necesarios a que está sometido el pensamiento. Veamos. El GPS funciona a base de análisis de medios y fines. Consiste en especificar un estado inicial del que se parte y un estado final al que se quiere llegar, en el espacio lógico de los estados posibles en relación con el problema (tales estados deben ser expresables, desde luego, en una forma de representación adecuada al caso). Una lista de operadores o métodos tiene como objetivo reducir las diferencias entre el estado actual de la evolución del problema y el
estado final o estado meta. Parte esencial de la operación del programa es una tabla de diferencias donde se determina qué métodos sirven para reducir qué diferencias. Cada operador tiene como requisito para su aplicación el que se den ciertas circunstancias en el estado actual. Si tales circunstancias no se dan, el proceso en curso se interrumpe para dar lugar a la aplicación de uno de los recursos más poderosos del arsenal de los sistemas físicos de símbolos: la recursión. El GPS es llamado de nuevo, pero ahora para transformar el estado actual en un estado final provisional que sea igual al estado en que alguno de los operadores resulta aplicable, dentro del proceso principal interrumpido. A primera vista parecería que Newell y Simon hubieran realmente encontrado, en el análisis de fines y medios, la fórmula mágica para la solución de cualquier problema, el verdadero y auténtico solucionador general de problemas, piedra filosofal de la edad electrónica. Pero, lamentablemente, esto es solo apariencia: más bien, su mérito consiste en haber descubierto una ley que dice que no es posible construir un programa que sea capaz de resolver todos los problemas (o un programa que resuelva mal un grupo grande de problemas) Esta es la ley de proporcionalidad entre poder y alcance, sobre lo que volveremos en seguida.
En la Edad Media, y mucho después, científicos dedicados y tecnólogos ilusos se han afanado en vano para descubrir una máquina de movimiento perpetuo; la historia de la ciencia no les da crédito por sus esfuerzos, pero en cambio consagra como grandes realizadores a quienes en el siglo XIX descubrieron las leyes de la termodinámica, que no son otra cosa sino una forma letrada de expresar el enunciado negativo "no es posible construir una máquina de movimiento perpetuo". El intento de construir un resolvedor general de problemas es un fallo parecido, pero sus intérpretes fueron a la vez capaces de formular la ley negativa correspondiente, que es la famosa ley de proporcionalidad a que nos hemos venido refiriendo. Lo que sucede es lo siguiente. El GPS es capaz, en teoría, de resolver cualquier problema, con tal de que le proveamos de una "tabla de diferencias" adecuada para el dominio de que se trate. Surge aquí una importante diferencia conceptual, o más bien la formulación dentro del paradigma computacional de una distinción reconocida por el sentido común: la distinción entre habilidad general y conocimiento (piénsese en las pruebas de inteligencia que aplicamos en los exámenes de admisión a nuestras universidades, y en la eterna polémica sobre si debemos medir habilidad general o conocimientos particulares por medio de esos instrumentos). La habilidad es el análisis de fines y medios, mientras que los conocimientos son la tabla de diferencias.
Hoy por hoy la situación está así: los métodos del pensamiento son o métodos débiles, pero aplicables a cualquier dominio (por ejemplo el método "genere y pruebe": produzca candidatos a solución y aplíqueles el criterio de éxito para ver si alguno lo llena), o métodos fuertes, pero aplicables solamente a cierto tipo de problemas. De ahí han surgido dos ramas en la inteligencia artificial: la dedicada a simular la experticia de los espertos humanos, a pase de acumulación de reglas que representan conocimiento (herederas de las "tablas de diferencias" del GPS), y la dedicada a desentrañar el misterio del sentido común, una habilidad que aparentemente es completamente no especializada. Existe la grave sospecha, que estaría respaldada en la ley de proporcionalidad entre poder y alcance, de que el sentido común como tal no existe, que lo que así llamamos no es otra cosa que una acumulación, en una memoria sumamente flexible y con poderes de recuperación de información excelentes, de experticias superficiales sobre miles de campos especializados, como relaciones humanas, física ingenua, y otras mucha dimensiones en que se desenvuelve el ser humano desde su infancia. Sabremos si ello es así cuando podamos replicar en un programa suficientemente versátil esa capacidad maravillosa del sentido común que pareciera no habernos costado nada, pero que por supuesto es resultado de una evolución milenaria y del aprendizaje espontáneo de muchos años de observación, ensayo y error, y reflexión por parte de los especímenes jóvenes del género sapiens.
Por el momento, cabe decir que la investigación en inteligencia artificial ha comenzado a dar frutos tecnológicos importantes en el otro extremo del espectro de la ley de proporcionalidad. Los sistemas expertos requieren muchos conocimientos sobre un dominio reducido (mínimo alcance), pero con ello obtienen máximo poder, resultan por lo menos tan efectivos como los expertos humanos correspondientes, a los cuales tratan de imitar y muchas veces superan. Veamos el ejemplo del sistema experto FALCON, desarrollado por mis colegas de la Universidad de Delaware, Chester y Lamb. Tiene por objeto el supervisar el funcionamiento de una planta de productos químicos, velando porque todos los indicadores muestren valores compatibles con la seguridad de la planta, y dando la alarma, y un diagnóstico del problema, cuando algo empieza a andar mal. Para realizar su función el sistema usa un intérprete, que controla los procesos de observación y deducción, una serie de reglas de inferencia, y una amplia base de conocimientos obtenidos con paciencia de los expertos humanos que han realizado el trabajo de supervisión hasta ahora. Un sistema parecido, pero de un dominio diferente, es MYCIN, desarrollado por científicos de la Universidad de Stanford, el cual realiza diagnóstico médico sobre cierto tipo de enfermedades. ¿Cuál es la diferencia entre FALCON y MYCIN? Básicamente difieren por el tipo de conocimientos que cada uno de los sistemas usa; pero además, la "dirección" de la inferencia es inversa: FALCON infiere hacia adelante, mientras que MYCIN infiere hacia atrás. MYCIN se dirige de los efectos (síntomas) a las causas para hacer el diagnóstico médico. En FALCON, la planta produce todos los valores que se necesitan; basta seguir la pista a la cadena de deducción para llegar a las situaciones que se observan.
Los sistemas expertos son muy complejos en cuanto al número de reglas que aplican. Son en cambio muy sencillos en la arquitectura de programación. Básicamente todos ellos descansan en alguna forma de sistema de producción, un método básico que Simon y Newell descubren como operativo en casi todas las actividades intelectuales de los seres humanos. El método tiene un antecedente conceptual en la obra matemática de Post, en la primera parte del siglo XX. Su versión computacional puede describirse brevemente de la siguiente manera.
Un sistema de producción se compone de tres partes: la memoria de largo plazo, donde se encuentran reglas de condición-acción; la memoria de corto plazo, correspondiente a los datos de los sentidos en el caso humano, un canal muy estrecho por medio del cual se comunican entre sí todas las reglas; y el intérprete, que revisa en cada ciclo todas las reglas para ver si alguna combinación de los datos en la memoria de corto plazo corresponde a la definición de la acción de alguna de las reglas; si corresponde, tal regla quedará entre las reglas seleccionadas en ese ciclo. El intérprete aplica luego ciertos criterios de resolución de conflictos para escoger una sola regla del conjunto de reglas seleccionadas; tal regla escogida será la que en definitiva sea ejecutada, para realizar la acción definida en la misma regla. Normalmente la acción de una regla consistirá en alguna transformación de los datos existentes en la memoria de corto plazo, por lo que se dice que esa memoria es el canal de comunicación entre las diversas reglas. Es de notar que en ningún caso una regla puede invocar a otra regla, a la manera en que un programa principal en FORTRAN o PASCAL invoca a una subrutina. En realidad, observar el programa no puede darnos ninguna indicación directa sobre cuál regla será la que se disparará en el próximo ciclo: todo depende de las circunstancias en que se encuentre la memoria de corto plazo.
Comentando los sistemas de producción, otro de los grandes de la IA, M. Minsky, hace notar que de este tipo de programa no es cierto que la computadora haga sólo lo que se le ha dicho que haga; en realidad, el programador sólo da un inventario de métodos que vale la pena intentar, sin ninguna seguridad de que tengan éxito, en determinada combinación de circunstancias. Será el sistema mismo el que, llevado por la dinámica de la situación, decida lo que en concreto se haga.
A pesar del éxito de los sistemas expertos, es lo cierto que su rendimiento es todavía demasiado inflexible y compartamentalizado si lo comparamos con sus contrapartes humanas. No obstante, su misma existencia vierte mucha luz sobre los procesos intelectuales del ser humano y sobre la naturaleza de la inteligencia, y vindica el nuevo paradigma de las ciencias del comportamiento como un conjunto de teorías y prácticas científicas que auguran mucho fruto en la frontera de las ciencias para los próximos decenios.