Volver

Volver



Buscar por números

Búsquedas

 

Genética
 


DOS CIENTÍFICOS ESPAÑOLES DIBUJAN EL MAPA GRÁFICO DEL GENOMA DE LA EMPRESA CELERA

URL: http://www.elpais.es/p/d/

La revista 'Science' distribuye la primera representación del código del ser humano

Roderic Guigó y Josep Francesc Abril, del Instituto de Investigaciones Médicas (IMIM) de Barcelona, son los únicos científicos españoles que firman la secuencia del genoma humano, porque se han encargado de dar forma gráfica a la lograda por la compañía Celera Genomics. Los investigadores han desarrollado una herramienta bioinformática que permite integrar los miles de datos contenidos en la secuencia en una única figura. El dibujo, el primero que representa el código genético de los seres humanos, se distribuye en forma de póster en la revista Science.

El póster elaborado por Guigó y Abril ha sido generado con el programa informático gff2ps (del inglés General Feature Formatted to PostScript) desarrollado durante 1999 en los laboratorios del IMIM en Barcelona. Una versión de este mismo programa, distribuido en Internet para su uso libre por cualquier laboratorio especializado en secuenciación genómica, ya se había utilizado con anterioridad para dar forma al genoma de la mosca del vinagre, igualmente publicada por Science.
"El programa permite integrar miles de datos y obtener una representación gráfica", relata Guigó. Algo que, añade Abril, no es tan trivial. "Nos sentimos como los primeros cartógrafos", compara. La comparación, dicen ambos, tiene sentido. Los cartógrafos del pasado recopilaban infinidad de datos sobre tierras desconocidas con el objetivo de elaborar un mapa que reflejara los más fidedignamente posible la realidad. Y eso es lo que han tratado de hacer con el genoma humano por encargo de Celera. Sólo que los datos se cuentan por millones y la realidad a contar es mucho más abstracta.

El póster de los bioinformáticos catalanes resume los 3.000 millones de pares de bases del genoma humano y los algo más de 38.000 genes predichos por Celera. Dado el volumen de información recogida y el que pretendía ofrecerse, Guigó y Abril idearon un algoritmo informático que permitiera reproducir a un tiempo una visión de conjunto del genoma y amplificara automáticamente la estructura de cada uno de los genes, especialmente, el área que codifica la expresión de proteínas, los llamados exones.

Este planteamiento, expresado por el propio fundador de Celera, Craig Venter, les llevó a idear un mecanismo de visualización de datos basado en dos escalas. En la primera se trabaja a un nivel de resolución de 600.000 bases químicas por centímetro o, lo que es lo mismo, se representan el equivalente a más de medio millón de letras en un solo centímetro. De este modo pueden representarse cajas equivalentes a los genes, al tiempo que visualizar gracias a un código de colores e iconográfico qué tipo de genes son, cual es su función conocida, la distancia entre ellos y cómo se agrupan.

En la segunda la escala, concebida a modo de zoom, la resolución es de 30.000 bases por centímetro. Con ella se logra ver la estructura de cada uno de los genes. El resultado final es un póster de 100 centímetros de ancho por 140 de largo.

Las claves del programa gff2ps, resumen los científicos del IMIM, son fundamentalmente su capacidad para manejar enormes volúmenes de datos de origen biológico y traducirlos a un formato, el Post Script, que permite elaborar gráficos vectoriales y presentarlos de forma escalable, es decir, en distintos tamaños de acuerdo con los requerimientos del usuario o de las capacidades de los dispositivos de impresión. "El formato", puntualiza Abril, "permite imprimir indistintamente en una hoja de papel o, si existiera una impresora suficientemente grande, en una superficie equivalente a un edificio de varias plantas".

Pese al éxito, Guigó y Abril no ven el diseño y la visualización de datos como parte central. "Nuestra colaboración con Celera fue puramente académica y para un desarrollo concreto", puntualiza Guigó, responsable del área bioinformática del IMIM. "Teníamos el programa a punto en el momento preciso", añade Abril. Los principales desarrollos del departamento, matizan, corresponden a programas (software) pensados para el análisis y la predicción de genes, campo en el que han puesto a punto productos que se emplean en distintos laboratorios de todo el mundo.

 
   

 
© 2002 - ARP-Sociedad para el Avance del Pensamiento Crítico