El proyecto internacional Encyclopedia of DNA Elements (Encode) ha logrado identificar hasta 4 millones de interruptores en el genoma humano implicados en la activación de genes, lo que representa que hasta el 80% del genoma que se creía menos importante en realidad está implicado activamente en cuándo y dónde se producen las proteínas.
La investigación ha contado con la participación de 442 científicos de 32 laboratorios de Reino Unido, Estados Unidos, España, Singapur, Japón y Suiza, entre ellos 20 investigadores del Centro de Regulación Genómica (CRG) de Barcelona.
De hecho, los descubrimientos se han publicado en 30 artículos diferentes de acceso abierto conectados entre sí a través de las revistas “Nature”, “Genome Biology” y “Genome Research”, y conforman una información tan “exhaustiva y compleja” que ha dado lugar a un nuevo modelo de publicación.
El proyecto Encode está liderado por el National Genome Research Institute (NHGRI) de EE.UU. y el European Bioinformatics Institute (EMBL-EBI) de Reino Unido, y para el presente descubrimiento se han analizado unos 15 billones de bytes de datos en bruto.
Fruto del hallazgo, los científicos saben ahora que los lugares del genoma que determinan si un gen se enciende o se apaga son en realidad la mayor parte del mismo y tienen un papel útil y muy importante, lejos de lo que se pensaba en un inicio.
De hecho, el primigenio Proyecto Genoma Humano mostró que solo el 2% del genoma contiene genes y con ello fabrica proteínas, si bien ahora se conoce que la activación de dichos genes es en realidad mucho más compleja.
Más allá del trabajo de los 20 científicos del CRG, algunos de ellos actualmente en otros centros como el Centro Nacional de Análisis Genómico, a nivel español también han participado dos investigadores del Centro Nacional de Investigaciones Oncológicas (Cnio) y el Instituto Nacional de Bioinformática.
El CRG ha participado en dos de los manuscritos publicados en “Nature”, en cuatro publicados en “Genome Research” y en dos de “Genome Biology”, principalmente en relación con la actividad transcripcional del genoma.
“El CRG ha sido la base para almacenar los datos sobre ARN, y eso a menudo ha puesto a prueba la capacidad de la infraestructura informática del centro”, señaló en el comunicado el responsable de informática para el proyecto del CRG, Julien Lagarde.