Capítulo 133. El Proyecto 1000 Genomas

Como os conté en el capítulo 87, el año 2001 fue un hito para la ciencia porque por primera vez en la historia se obtuvo la secuencia completa del Genoma Humano. Ya sabéis, el código de 3000 millones de letras A, C, G y T combinadas donde se aloja la mayor parte de la información genética de las células. Esto que menciono es correcto pero es algo impreciso. En realidad lo que se obtuvo fue una primera versión del Genoma Humano. Un primer borrador completo. En la actualidad vamos por la versión 19 del genoma (según la numeración del navegador genómico de la Universidad de California en Santa Cruz). ¿Y esto qué significa? Bueno, básicamente que, por motivos técnicos asociados a la propia secuencia del genoma, no todas las partes del genoma se secuencian con la misma precisión y fiabilidad y por eso la secuencia completa se ha ido revisando y mejorando desde entonces. 

A día de hoy, toda la comunidad científica trabaja con esta versión del genoma humano heredera de aquella proporcionada proyecto Genoma Humano. Sin embargo, sabemos que no es todo lo precisa que nos gustaría y es que, si bien es útil, no se corresponde completamente con la realidad. Para empezar no es el genoma de un individuo en particular, es un mosaico de genomas de muchos individuos de diferente origen geográfico y condición. Y además es un genoma haploide (1 juego de cromosomas) mientras que los humanos somos seres diploides, es decir, que portamos 2 juegos de cromosomas en todas nuestras células (uno procedente de nuestro padre y otro de nuestra madre).

Este genoma imperfecto nos ha servido como modelo durante la última década. Las personas que trabajamos en estas cosas lo llamamos "el genoma de referencia"  y, de hecho, sigue siendo una buena aproximación para muchos experimentos aunque, insuficiente y limitada, si deseamos realizar un estudio genómico que tenga en cuenta la diversidad genética de la especie humana. 

Fijaos, desde el punto de vista genético, la diferencia entre dos seres humanos es que, aproximadamente, 1 de cada 1000 letras de sus genomas son diferentes. Esas pequeñas diferencias son responsables, junto a otros elementos que no trataremos aquí (CNVs, etc.), de que seamos únicos como individuos a pesar de ser miembros de la misma especie. Conocer este tipo de información acerca de la variabilidad intraespecie puede ser muy útil desde el punto de vista clínico y, en ocasiones, explica por qué algunas personas responden a algunos tratamientos y otras no. 

Por este motivo un consorcio internacional constituido por cientos de científicos lanzó en 2008 el Proyecto 1000 Genomas que, básicamente, consiste en secuenciar completamente el genoma de ~1000 individuos pertenecientes a 14 poblaciones humanas diferentes (desde afroamericanos hasta chinos pasando por británicos, sudamericanos, japoneses, escandinavos, africanos, e, incluso, individuos de la Península Ibérica). 

Muy brevemente, uno de los objetivos finales del proyecto es obtener algo así como un genoma de referencia que incluya frecuencias para cada una de las letras del genoma según los tipos poblacionales humanos y que recoja la mayor cantidad de variantes genómicas asociadas a la diversidad de nuestra especie. Es decir, sustituir el  actual genoma de referencia único y estático por un genoma de referencia probabilístico que incorpore la información asociada  a las diversas poblaciones humanas. 

De esa manera, cuando vuestro médico pida la secuencia de vuestro genoma junto a otras pruebas clínicas (y creedme que eso lo veréis si tenéis menos de 50 años) buscarán qué letras de vuestro genoma están alteradas en comparación con ese genoma con frecuencias poblacionales. Simplificando, que si tenéis una A donde suele haber una C y esa variante no aparece frecuentemente (menos del 1% de frecuencia) en vuestra población pueden pasar 2 cosas: (a) que tienes una mutación o (b) que tienes antepasados de otra población si esa variante si que aparece frecuentemente en esa otra población.

Bien. Todo esto os lo cuento porque hoy se han publicado en la revista Nature los resultados del Proyecto 1000 Genomas. En concreto el consorcio ha secuenciado 1092 genomas humanos completos y las principales conclusiones del trabajo inciden en lo que os comenté en el capítulo 87. Todos tenemos mutaciones y variantes de baja frecuencia en nuestro genoma. Todos somos mutantes independientemente de nuestra raza u origen, algo que ya sabíamos. Además, han visto que nuestras variantes individuales en el genoma están, sobre todo, en sitios de regulación de la actividad del genómica y no en las zonas codificantes en sí (los genes). Algo que ya apuntaba también el proyecto ENCODE. Lo interesante es que el proyecto ha descrito el 98% de las variantes del genoma que aparecen con una frecuencia mayor del 1% en cada una de las poblaciones. Variantes específicas de población para entendernos. Catálogos de variantes que aparecen específicamente con mas de 1% de frecuencia en el genoma para los chinos, los subsaharianos, los españoles, etc.

Como podéis ver ya están puestos los andamios para generar el nuevo genoma de referencia con información poblacional. Ahora a ver cómo nos las apañamos para trabajar con él...

PS. Por cierto, esto aún no ha acabado. El siguiente paso del proyecto 1000 genomas será incorporar 1500 genomas mas pertenecientes a 15 nuevas poblaciones poblaciones humanas. Os mantendré informados.


Comentarios