EL APRENDIZ INFORMÁTICO: Secuenciamiento de genes

Autor:
PhD. Guillermo Choque Aspiazu
http://www.eldiario.net/
Publicado en:
Septiembre 20 de 2010

La bioinformática es una ciencia aplicada donde se usa teoría y tecnología matemática computacional para procesar, relacionar y derivar predicciones e inferencias a partir de datos obtenidos en biología molecular. Pretende sobre todo entender y analizar el flujo de información y el control de esta en los organismos. Pero es mucho más que eso, es un campo de fertilización cruzada donde interactúan sinérgicamente las ciencias de la computación y la biología, con todas la riquezas y limitantes que puedan aportar cada una de ellas, además, estas dos aúnan esfuerzos para formar un campo donde diariamente se expanden las fronteras de la ciencia, en beneficio directo de la humanidad y el entendimiento de la vida en general. La bioinformática se construye con los siguientes conceptos: (1) El primero y más importante es la base del dogma central de la biología molecular. El archivo de información de cada organismo, la huella digital para el desarrollo potencial o la actividad de cualquier individuo, es el material genético que subyace en su interior celular; de manera concreta es una molécula llamada ácido desoxirribonucleico. (2) El segundo concepto es el de vida. “Un organismo vivo es uno complejo y organizado, que ocurre naturalmente, efectúa manipulaciones de materia, energía e información homeostática y se auto reproduce sobre el mismo principio molecular, lo que le permite, tomados como un todo, la capacidad de evolucionar”

En uno de los campos más apasionantes y complejos de la biología, la taxonomía, la ciencia de imponer orden en el aparente caos de la vida, la bioinformática cumple un papel estelar. Con el tiempo, se ha establecido que el análisis de secuencias da la evidencia menos ambigua para la relación entre especies. Para organismos avanzados es muy adecuada, e integrando datos de la paleontología, anatomía comparada y embriología se logra el mejor panorama que se pueda esperar. Las moléculas de ácido desoxirribonucleico son cadenas largas, lineales, donde se encuentra un mensaje compuesto por un alfabeto de cuatro símbolos: Adenina, Timina, Guanina y Citosina. Implícita en su estructura se encuentra su función, es decir, los mecanismos para su auto replicación y su expresión de genes en proteínas. El ácido desoxirribonucleico contiene información necesaria para construir proteínas, las cuales son las moléculas responsables de la gran mayoría de estructuras y actividades de los organismos vivos. Ciertos fragmentos de ácido desoxirribonucleico descifran secuencias de aminoácidos que codifican proteínas. El dogma central de la biología molecular es entonces el siguiente: (1) La secuencia del ácido desoxirribonucleico determina la secuencia de la proteína. (2) La secuencia de la proteína determina la estructura proteica. (3) La estructura proteica determina la función proteica.

Desde que hace más de medio siglo se descubriese que el ácido desoxirribonucleico era la molécula portadora de la información genética, su secuenciación ha supuesto un permanente reto tecnológico para los científicos. Pero sin lugar a dudas el reto que supuso a finales del siglo veinte la secuenciación del genoma humano, y el avance que ha de suponer para la Biología en general y para la Medicina en particular, la posibilidad de conocer a un costo razonable la secuencia individual de cada ser vivo, incluidos los organismos patógenos, ha disparado una carrera tecnológica para abaratar el costo de la secuenciación y ofrecer a un ritmo que se acelera por momentos, rebajas continuas en la secuenciación masiva de genomas, incluidas las del genoma humano. En el año 1977, los investigadores Sanger y Coulson desarrollaron un método para secuenciar el ácido desoxirribonucleico, basado en una reacción enzimática de terminación de cadena, lo que transformó la biología, permitiendo descifrar genes y más tarde, genomas completos.

En la década de 1980 aumenta la secuenciación de genes y genomas mediante el método de Sanger, aunque la secuenciación en esta época es tediosa y manual. Hacia el año 1997 se publica la primera secuencia de ácido desoxirribonucleico de un genoma completo, el bacteriófago PhiX174. De esta forma surge la era genómica, es decir, el estudio de los genomas desde una visión global, su secuencia, los genes, sus funciones y regulación. El planteamiento de la secuenciación del genoma humano promovió que a final de los años 1980 aparecieran los primeros secuenciadores automáticos de ácido desoxirribonucleico de la empresa “Applied Biosystems”. Una comparación de genes en una especie o entre especies puede mostrar similitudes entre funciones de proteínas, o relaciones entre especies, a través del uso de filogenética molecular para construir árboles filogenéticos. Con la creciente cantidad de datos, desde hace mucho se ha vuelto poco práctico analizar secuencias de ácido desoxirribonucleico manualmente. Actualmente se usan programas de computadora para estudiar el genoma de miles de organismos, conteniendo miles de millones de nucleótidos. Estos programas pueden compensar mutaciones en la secuencia del ácido desoxirribonucleico, para identificar secuencias que están relacionadas, pero que no son idénticas. Una variante de este alineamiento de secuencias se usa en el proceso de secuenciación. Esta tecnología fue aplicada en la secuenciación del genoma humano, proyecto que duró diez años, culminando el año 2000 y, en el que se invirtieron unos tres mil millones de dólares.

La posibilidad de secuenciar el genoma humano estimuló la imaginación de ingenieros, químicos, y biólogos, y a finales de la década de 1980 aparecen los primeros secuenciadores automáticos de ácido desoxirribonucleico. La firma Applied Biosystems pone en el mercado, hacia el año 1987, el secuenciador automático ABI 370A que tres años más tarde se convertiría en el ABI 377. Estos secuenciadores utilizaban la electroforesis en placas de poliacrilamida para la separación de los fragmentos de ácido desoxirribonucleico y permitían la secuenciación en unas pocas horas de hasta noventa y seis muestras de ácido desoxirribonucleico al mismo tiempo con longitudes de secuencia de más de quinientos pares de bases. Los nucléotidos se leían y registraban automáticamente gracias a un sistema de detección láser y a un complejo programa de análisis informático. El uso de cuatro fluorocromos diferentes para marcar los terminadores de secuencia, permitía utilizar el mismo canal para separar los fragmentos generados en las cuatro reacciones de terminación de polimerización que utiliza el método de Sanger.

El proyecto genoma humano motivó el perfeccionamiento y desarrollo de técnicas en el campo de la biología y en el de la bioinformática para la obtención de la secuencia completa del ácido desoxirribonucleico, el genoma o “conjunto de genes”. Se determino la secuencia del genoma y se cartografiaron los genes a través de un mapeo genético. Tras el proyecto Genoma Humano, además de la Genómica, surgieron la Proteómica, Metabolómica, etc. El elevado costo de secuenciación de los primeros genomas completos, que tenían un costo de un dólar por nucleótido, y de los casi tres mil millones de dólares que se estima costó el primer borrador del genoma humano con los tres mil millones de nucleótidos, sirvió para estimular la imaginación de los científicos en busca de soluciones más baratas para la secuenciación masiva de ácido desoxirribonucleico. Así surgieron los secuenciadores de alto rendimiento.

La secuenciación conocida como “perdigonada” fue utilizada por el Instituto de Investigación Genómica, para secuenciar el primer genoma de bacteria, el “haemophilus influenzae”, la cual no proporciona una lista secuencial de nucleótidos, pero en cambio ofrece las secuencias de miles de pequeños fragmentos de ácido desoxirribonucleico, cada uno de aproximadamente seiscientos a ochocientos nucleótidos de largo. Las terminaciones de estos fragmentos se superponen y, cuando son alineados de la manera correcta, constituyen el genoma completo del organismo en cuestión. El secuenciamiento perdigonado proporciona datos de secuencia rápidamente, pero la tarea de ensamblar los fragmentos puede ser bastante complicada para genomas muy grandes. En el caso del Proyecto Genoma Humano, llevó varios meses de tiempo de procesador, en una computadora DEC Alpha, para ensamblar los fragmentos. El secuenciamiento perdigonado es el método de elección para todos los genomas secuenciados y los algoritmos de ensamblado genómico son un área crítica de la investigación en bioinformática.

Otro aspecto de la bioinformática en el análisis de secuencias es la búsqueda automática de genes y secuencias reguladoras dentro de un genoma. No todos los nucleótidos dentro de un genoma son genes. Dentro del genoma de organismos más avanzados, grandes partes del ácido desoxirribonucleico no sirven a ningún propósito obvio. Este ácido desoxirribonucleico, conocido como “ácido desoxirribonucleico basura", puede, sin embargo, contener elementos funcionales todavía no reconocidos. La bioinformática sirve para estrechar la brecha entre los proyectos de genoma y proteoma, por ejemplo, en el uso de secuencias de ácido desoxirribonucleico para identificación de proteínas.

Para conocer más acerca del Doctor Choque y sus publicaciones, haz clic en el siguiente vínculo:

MenteErrabunda.blogspot.com

Páginas

jueves, 20 de noviembre de 2014

Secuenciamiento de genes

No hay comentarios:

Publicar un comentario