El Proyecto del Genoma Humano (HGP en inglés) es un consorcio académico internacional con el objetivo de mapear y caracterizar los cromosomas humanos, para determinar en la enorme longitud de su ADN aquellas relativamente pocas secuencias en que consisten las instrucciones genéticas de nuestra especie. Ello supone el inmenso trabajo de poner en orden tres mil millones de pares de bases (las “letras” del lenguaje genético), una pequeña minoría de las cuales solamente conforman nuestros genes. Tan importante tarea dio inicio en el año 1990. El consorcio incluye científicos de veinte instituciones localizadas en Francia, Alemania, Japón, China, Gran Bretaña y los Estados Unidos. El proyecto busca ofrecer acceso a todos los científicos del mundo a ese importante conocimiento sin costo ni restricciones. Debe desarrollarse en dos etapas:
Mucho más tarde se une competitivamente al esfuerzo la empresa comercial Celera Genomics. Sus grandes recursos le permiten terminar el borrador de trabajo en 18 meses, una semana antes que el HGP, quien logra lo mismo en el término previsto de diez años. Las noticias de ambos acontecimientos son anunciadas casi simultáneamente, el 15 de febrero de 2001 en Nature por HGP y al día siguiente en Science por Celera. Los dos borradores difieren algo, en alelos(a) polimórficos, a causa de que las muestras de ADN donadas anónimamente provienen de personas de diversas etnias.
La técnica básica para secuenciar el genoma consiste en la creación y utilización de una biblioteca BAC (Bacterial Artificial Chromosome), población de bacterias cuyo único cromosoma circular ha sido modificado genéticamente de modo que contenga un trozo de tamaño considerable de ADN extraño, en este caso el humano. La idea es amplificarlo mediante el propio mecanismo reproductivo de la bacteria, la cual al replicar su cromosoma artificial amplificará indefinidamente el ADN requerido para las operaciones deseadas. Si se seleccionan los fragmentos de ADN con vistas a tener un mínimo de traslapo entre ellos, se necesitarán unos veinte mil diferentes clones BAC para contener los tres mil millones de pares de bases del genoma humano. Cada clon se mantiene identificado para saber de qué sección de un cromosoma, y de cuál cromosoma en particular, procede exactamente. Para secuenciarlo, el clon BAC se corta en fragmentos de unos dos mil pares de bases. Cada uno de estos trozos es sometido a una reacción preparatoria cuyo producto se carga en una máquina químico-electrónica llamada secuenciador. El secuenciador produce una representación de secuencia de entre 500 y 800 "letras" por cada operación. Un proceso informático encuentra y ensambla las secuencias contiguas entre sí –con base en sus traslapos– hasta representar la secuencia completa de cada BAC. El ensamblaje de la representación del cromosoma es trivial, dada la información disponible sobre el origen en el genoma humano de cada uno de los tomos de la biblioteca BAC.
Estas mismas técnicas son usadas tanto por el proyecto académico como por el comercial. En lo que difieren es en su empleo estratégico. El proyecto académico utiliza una estrategia “de arriba para abajo”, según la cual fragmentos considerablemente largos, de posición en el cromosoma claramente conocida, se dividen en trozos más pequeños para ser secuenciados y después reensamblados. Celera, por su parte, emplea una estrategia “de abajo para arriba”, despedazando el genoma total de una vez en fragmentos pequeños que son inmediatamente secuenciados y ensamblados. La ventaja del primer enfoque es que se conoce con certeza la localización global de cada subsecuencia, con el inconveniente de que requiere la previa construcción de un mapa de los fragmentos más largos. El método “de abajo para arriba” no requiere de este paso, pero a la hora de ensamblar le es más difícil identificar sin ambigüedad los traslapos entre fragmentos, mucho más abundantes.
La secuenciación en borrador de trabajo ha sido suficiente para reconocer la mayoría de los genes humanos(1) y para que los científicos se atrevan a pronosticar que en total no pasarán de unos 35 000. Su caracterización definitiva, cuantitativa y cualitativa, deberá esperar la secuencia terminada, cuya exactitud e integridad del 99,99% la convierte en digna meta de renovado esfuerzo, para alcanzar a corto plazo. Mientras tanto, la nueva estimación del número de genes humanos la coloca en aproximadamente el doble de los de la lombriz. La diferencia con los genes de la mosca drosófila es solo de 10 000, relacionados con el sistema nervioso, la homeostasis (control del medio interno) y el sistema inmunológico.
¿Cómo explicar la complejidad del organismo humano a partir de un genoma neto tan pequeño? Parte de la explicación es que nuestras células son avaras en genes pero espléndidas en proteínas. En comparación con otros organismos cuyos genomas han sido ya secuenciados, los humanos tenemos abundancia de proteínas que participan en la estructura celular y el sistema inmunológico, la replicación del ADN y la síntesis de ARN y de proteínas, así como la comunicación intercelular. Un alto número de ellas son complejas y van empotradas en la superficie de las células. Para producir tantas, la célula humana debe multiplicar la efectividad de sus genes, lo que logra por el “episaje alternativo” (alternative splicing, en inglés) de sus mensajes de ARN. En vez de producir una proteína cada gen, como en otras especies no vertebradas, se las arregla para producir tres en promedio. El truco consiste en reordenar el ARN mensajero en el momento de eliminar sus intrones (en eso consiste el episaje), de modo que el ribosoma reciba mensajes diversos procedentes del mismo gen y produzca así distintas arquitecturas como variaciones de la misma receta(2). En otras palabras, la evolución nos ha capacitado para recombinar los planos de inventos muy bien probados por seres más sencillos que nosotros, con el resultado innovador revolucionario de aumentar enormemente el número y variedad de nuestras proteínas.
Se ha hecho la siguiente clasificación de genes encontrados hasta ahora y por encontrar:
Desde hace varios años, incluso antes de que se terminara el borrador de trabajo, se han venido identificando un buen número de genes implicados en diversas enfermedades hereditarias. Es seguro que habrá más descubrimientos de este tipo y que, como resultado, la genética revolucionará a corto plazo la teoría y práctica de la medicina.
Los genes existen en familias. Muchas de las familias se relacionan con el sistema inmunológico. Casi la mitad del genoma la constituyen secuencias repetidas. Todo esto sugiere que la duplicación de genes ha sido un recurso importante en la evolución de los vertebrados. Esto confirma una posición científica más general que se venía abriendo paso desde hace tiempo, a saber, que la manera en que los genomas crecen es por duplicación, pues la redundancia de genes permite a algunos de ellos, sin exponer nada, variar y experimentar recursos novedosos.
Sorprendentemente, los científicos han identificado más de 200 genes en el genoma humano cuyos homólogos más cercanos están en las bacterias. Genes análogos no han sido encontrados en los invertebrados, como la lombriz, la mosca o la levadura, lo que sugiere que tales genes fueron adquiridos en época relativamente reciente de nuestro pasado evolutivo, en todo caso después de la aparición de los vertebrados. La transferencia de esos genes no parece haber ocurrido en bloque, sino más bien por medio de varios actos de comercio de genes independientes, con procedencia de diferentes bacterias. Todo esto tiene que haber ocurrido con anterioridad a que nuestras células sexuales estuvieran tan protegidas como lo están ahora y antes también de que el sistema inmunológico hubiera alcanzado niveles de seguridad cercanos a los de que ahora disfruta. Presumiblemente, entonces, la transferencia habría ocurrido por sucesivas infecciones, probablemente venéreas. Tortuosa manera usada por la evolución para enriquecer nuestro genoma.
Ha quedado confirmado que al ser humano le gusta coleccionar materiales que no necesita. Todos los exones (la parte codificante de nuestros genes) constituyen solamente un exiguo 1,1% del genoma. Los intrones, las partes que deben ser podadas de los genes para producir el mensaje ARN, representan en contraste todo un 24%. Abundan los trasposones y retrovirus, en su mayoría formas de pseudogenes. Se han esbozado diversas teorías para explicar esta extraña situación, que contrasta con la parsimonia por ejemplo de las bacterias, pero ninguna ha alcanzado suficiente aceptación. Lo más probable es que simplemente no ha existido en la historia evolutiva una presión selectiva suficiente para que nos deshiciéramos de ella, o tal vez el volumen mismo que nos da tenga algún oculto valor adaptativo. En todo caso, esa amplísima extensión de material genético vacante sirve hoy de maravillas a los genetistas de las poblaciones y contribuye muchísimo a la arqueología de la historia evolutiva.
Mencionamos antes que las pequeñas diferencias
entre los resultados de los dos proyectos de secuenciación del genoma humano se
debieron al polimorfismo de las poblaciones representadas en las muestras de
ADN. Agreguemos ahora, a este propósito, que la biblioteca de clones BAC ha
resultado tener un inmenso valor más allá de su rol como instrumento de
secuenciación. En efecto, constituye un recurso permanente para la
investigación que puede ser usado en estudios genéticos sin necesidad de
laboriosa preparación previa para cada caso. En vez de gastar un año
coleccionando variaciones de un gen de cierta enfermedad, el investigador puede
obtener estas variaciones con un solo clic y poner manos a su obra esa misma
tarde. El recurso ya ha servido para identificar más de 150 mil lugares de
variación o "polimorfismos de un solo nucleótido" (SNPs, según
iniciales en inglés)(3)
y para crear un catálogo de 1,4 millones de estos polimorfismos, con
especificación exacta de su ubicación en el genoma. Tal catálogo o mapa promete
revolucionar tanto el combate de enfermedades hereditarias(b) como la investigación sobre la evolución de la
especie; por ejemplo, ya se ha podido confirmar que toda la población humana
existente desciende de un grupo de aproximadamente diez mil personas salidas
del África, así como la cronología de su ocupación progresiva de toda
Con todos sus méritos, la secuenciación del genoma ha sido básicamente, por así decirlo, un estudio longitudinal: su objetivo ha sido presentar una especie de radiografía genética del ser humano típico. Viniendo las muestras de ADN usadas en ambos proyectos de unos pocos individuos(4), no representa el panorama riquísimo de la variedad humana, una de sus fundamentales fortalezas. Para eso será necesario emprender un estudio "a lo ancho" del genoma, que busque inventariar la pluralidad alélica de cada uno de nuestros genes(5). Si hay una verdad última sobre la unidad o diversidad del género humano es que todos somos iguales y al mismo tiempo somos todos diferentes. Conforme se vaya avanzando en la investigación de todo lo investigable sobre el genoma humano, se habrá ido construyendo un monumento tanto a la unidad de la única raza humana como a la inmensa variedad de las diferencias humanas individuales. La secuenciación lograda es un imponente comienzo. Lo ya logrado nos permite afirmar con suficiente fundamento que si tomamos dos personas completamente al azar podemos estar seguros de que diferirán entre sí en uno de cada 1250 pares de bases, y no en más. El apoyo que esto confiere al esfuerzo para liquidar de una vez por todas los pretendidos racismos científicos no es nada menos que irrefragable.
Se llama sintenia al hecho de que en dos genomas diferentes un considerable número de genes comunes aparezcan aproximadamente en el mismo orden. Este hecho no puede tener otra explicación sino que ambos genomas se encuentran en una cierta relación filogenética: o ambos descienden de un genoma común en el lejano pasado (hipótesis más probable) o bien uno es simplemente antecesor del otro. La secuenciación del genoma humano, aun antes de la conclusión del borrador de trabajo, ha producido por lo menos un ejemplo de este importante fenómeno: el cromosoma humano 21 corresponde parcialmente de manera estricta al cromosoma 16 del ratón, complementado con parte de sus cromosomas 17 y 10. La clara sintenia encontrada no ha producido sorpresa a los científicos, dado que el hombre y el ratón son suficientemente cercanos como para que haya entre sus genes considerable correspondencia (MORANGE 98). En cambio, ofrece alimento para el pensamiento a los fijistas de buena voluntad que todavía puedan quedar desperdigados por el mundo.
La imagen siguiente presenta una vista esquemática del fenómeno: a la izquierda se muestra la secuencia de genes del cromosoma humano 21 (HSA21) mientras que a la derecha las regiones respectivas de los cromosomas 16 (MMU16), 17 (MMU17) y 10 (MMU10) del ratón. Los marcadores de las dos especies que se corresponden se muestran unidos por una línea continua. La imagen fue publicada en Nature el 18 de mayo de 2000, Vol. 405.

Por muchos años venideros los científicos seguirán explorando los detalles del nuevo territorio que han descubierto. No será sino dentro de largo tiempo que se puedan llegar a entender plenamente los secretos que la secuenciación del genoma humano ha hecho descifrables, así como la riqueza de sus implicaciones filosóficas.
Notas
Nota 1: Para encontrar los
genes se buscan en el genoma sus “signos de puntuación”, comunes para amplias
clases de genes y con estructuras moleculares bien conocidas. La búsqueda se
hace usando como “cebo” la secuencia monofilar de esos “signos de puntuación”
empotrada en un bloque de silicio (técnica in silico). Con tal cebo se
pesca en el otro hilo la secuencia del promotor acompañada del gen respectivo.
Nota 2: Básicamente lo que se hace
es armar en distintas combinaciones las instrucciones para producir dominios
(partes tridimensionales de las proteínas). Tomando en cuenta que cada proteína
puede contener una multitud de esos dominios, cada uno determinado por una
secuencia de un gen, un mismo gen puede en principio originar distintas
proteínas si se eliminan del ARN mensajero en el momento de cribar los intrones
algunas de esas secuencias.
Nota 3: Se trata de loci
(plural latino de locus) donde pueden ocurrir doce o más diferentes
alelos.
Nota 4: El líder del proyecto
comercial de secuenciación ha declarado en los últimos días que el genoma
secuenciado por su compañía fue mayormente el suyo propio.
Nota 5: La compañía
norteamericana Genaissance ha anunciado recientemente el lanzamiento de un
masivo esfuerzo para inventariar todos los SNP del genoma humano, que calcula
en una cifra cercana a los treinta millones. Sus científicos suponen que cada
gen humano se presenta en un promedio de 12 variedades (alelos) diferentes,
cifra que otros científicos consideran algo exagerada.
Referencias
Nota a: Alelos
en Apéndices de la segunda colección.
Nota b: Nuevas fronteras de la
medicina en El futuro de la
medicina de la tercera colección, bloque b.
Nota c: La gran diáspora humana en bloque b de la primera colección.
Copyright © 2002 Claudio Gutiérrez