include_once("common_lab_header.php");
Excerpt for Estructura y claves del Genoma humano by , available in its entirety at Smashwords

Estructura y claves del Genoma humano

Academic Scientists

Cambridge Stanford Books

Índice de contenido

Página de título

Consultas o sugerencias

Estructura y función del genoma

ARN no codificantes de proteínas: Vínculos entre genes y regiones transcritas

Ordenamiento de genes dentro del ADN

Piezas que dominan la expresión génica

Grandes estructuras en el ADN

Claves del Genoma

Información del Genoma humano

ADN no codificante

Proyecto ENCODE

ADN codificante: Genes que codifican proteínas

Dogma central (de ADN a ARN a proteína)

Información existente en las secuencias biológicas

Métodos universales de transmisión de información biológica

Métodos generales de transmisión de información

Métodos especiales de transmisión de información

Cambios epigenéticos

Organización y estructura de genes

Organización genes procariotas

Organización genes eucariotas

Cambridge Stanford Books

Academic Scientists

"Estructura y claves del Genoma humano"

Copyright © 2019 Cambridge Stanford Books

Todos los derechos reservados. Prohibida su reproducción total o parcial en forma alguna, sea electrónica o mecánica, incluyendo fotocopias, grabaciones o cualquier sistema de almacenamiento y recuperación.

Estructura y función del genoma

El Proyecto Genoma Humano produjo las primeras secuencias completas de genomas humanos individuales, y el primer borrador de secuencia y el análisis inicial se publicaron el 12 de febrero de 2001 simultáneamente con Celera Corporation. El genoma humano fue el primero de todos los vertebrados en secuenciarse por completo. A partir de 2012, miles de genomas humanos han sido secuenciados completamente, y muchos más se han mapeado en niveles más bajos de resolución. Los datos resultantes se utilizan en todo el mundo en ciencias biomédicas, antropología, medicina forense y otras ramas de la ciencia. Existe la expectativa generalizada de que los estudios genómicos conducirán a avances en el diagnóstico y tratamiento de enfermedades, y a nuevos conocimientos en muchos campos de la biología, incluida la evolución humana.

Aunque la secuencia del genoma humano ha sido (casi) completamente determinada por la secuenciación del ADN, aún no se ha comprendido completamente. La mayoría de los genes (aunque probablemente no todos) se han identificado mediante una combinación de enfoques experimentales y bioinformáticos de alto rendimiento, pero aún queda mucho trabajo por hacer para dilucidar las funciones biológicas de sus productos de proteínas y ARN. Los resultados recientes sugieren que la mayoría de las vastas cantidades de ADN no codificante dentro del genoma tienen actividades bioquímicas asociadas, incluida la regulación de la expresión génica, la organización de la arquitectura del cromosoma y las señales que controlan la herencia epigenética .

Se estima que hay entre 19.000 y 20.000 genes codificantes de proteínas humanas. La estimación del número de genes humanos se ha revisado repetidamente a partir de predicciones iniciales de 100.000 o más a medida que la calidad de la secuencia del genoma y los métodos de búsqueda de genes han mejorado, y podrían seguir disminuyendo. Las secuencias de codificación de proteínas representan solo una fracción muy pequeña del genoma (aproximadamente 1,5%), y el resto está asociado con moléculas de ARN no codificantes, secuencias de ADN reguladoras, LINE, SINE, intrones y secuencias para el cual aún no se ha determinado ninguna función.

En junio de 2016, los científicos anunciaron formalmente HGP-Write, un plan para sintetizar el genoma humano. Ha habido dos proyectos principales para secuenciar el genoma humano.

El Proyecto del Genoma Humano (HGP) es el nombre de un consorcio internacional de proyectos financiados con fondos públicos para secuenciar el genoma humano y mapear cada gen en cada cromosoma. El consorcio incluye el Departamento de Energía de EE.UU., Los Institutos Nacionales de Salud de EE. UU. Y el Wellcome Trust del Reino Unido, junto con grupos en Japón, Francia, Alemania, China y otros países. Los principales objetivos del Proyecto Genoma Humano son:

  • Determinar la secuencia de los tres mil millones de nucleótidos que constituyen el genoma humano.

  • Identificar los 20.000 a 25.000 genes en el genoma humano.

  • Desarrollar herramientas para almacenar y analizar esta información.

  • transferir algunas de las tecnologías involucradas al sector privado, para producir una industria de biotecnología que pueda desarrollar nuevas aplicaciones médicas

  • Examinar las implicaciones éticas, sociales y legales de la información obtenida.

El HGP utiliza la llamada técnica de secuenciación jerárquica de la escopeta, en la cual el genoma se divide en secciones relativamente grandes que se mapean en los cromosomas apropiados antes de ser secuenciados.



Fig. 054A En la secuenciación de la escopeta del genoma completo (parte superior), el genoma completo se corta aleatoriamente en pequeños fragmentos (tamaño apropiado para la secuenciación) y luego se vuelve a ensamblar. En la secuencia jerárquica de escopeta (parte inferior), el genoma se divide primero en segmentos más grandes. Después de deducir el orden de estos segmentos, se cortan en fragmentos de tamaño apropiado para la secuenciación. Commins, J., Toft, C., Fares, M. A. (CC BY-SA 2.5 (https://creativecommons.org/licenses/by-sa/2.5)), de Wikimedia Commons

El otro proyecto se inició más tarde, en 1998, por el grupo industrial privado Celera Genomics, dirigido por el Dr. Craig Venter. Celera Genomics utilizó la técnica de secuenciación de escopeta de genoma completo, en lugar de dividir el genoma en secciones como el HGP.

En marzo de 2000, el entonces presidente de los Estados Unidos, Bill Clinton, anunció que los genes humanos no podían ser patentados. En junio del mismo año, Clinton y el entonces primer ministro británico Tony Blair anunciaron un borrador de secuencia del genoma humano. La secuencia estaba esencialmente completa en mayo de 2003, con una versión 'Gold Standard' lanzada en octubre de 2004, aunque la secuencia completa del último cromosoma se publicó en la revista Nature solo en mayo de 2006. El proceso aún no está terminado: por ejemplo Existen áreas altamente repetitivas de ADN, especialmente alrededor de los centrómeros y los telómeros de los cromosomas, que están resultando difíciles de secuenciar.

La secuenciación del genoma humano es solo el primer paso en el proceso. La siguiente etapa es identificar los genes y las proteínas (o moléculas de ARN) que codifican, así como los elementos del genoma que regulan la expresión de los genes, desempeñan un papel en la replicación del ADN y mantienen la estructura de los genes. cromosomas Hasta ahora, se han identificado unos 22.000 'loci génicos', incluyendo aproximadamente 20.000 genes que codifican proteínas. Sin embargo, encontrar todos los genes no será fácil. Los genes relativamente pequeños son difíciles de detectar, algunos genes pueden superponerse y algunos genes pueden codificar varios productos diferentes. El genoma también contiene 'pseudogenes', que son copias defectuosas de genes que se encuentran en otras partes del genoma: estables, heredadas, pero no expresadas en términos de formación de proteínas.

El trabajo de Encode Consortium (Encyclopedia of DNA Elements) indica que aproximadamente el 3% de los tres mil millones de pares de bases en el genoma humano están asociados con los 22.000 genes identificados hasta ahora. Se cree que el 97 por ciento restante, considerado anteriormente como "ADN basura" con poco o ningún propósito, desempeña un papel importante en la regulación de genes. Parte de este ADN es químicamente activo: produce moléculas de ARN que no desempeñan un papel en la producción de proteínas, pero que parecen desempeñar un papel en la activación y desactivación de otros genes.

Se espera que los desarrollos en nuestra comprensión del genoma humano mejoren nuestra capacidad para diagnosticar, tratar y prevenir enfermedades al mejorar nuestra comprensión de los mecanismos moleculares involucrados, incluidas las complejas interacciones entre los factores genéticos y los factores ambientales. Una visión de estos mecanismos moleculares revelará nuevas dianas moleculares, a nivel de ADN y proteínas, para medicamentos, vacunas y pruebas genéticas. Los regímenes de medicamentos individuales pueden diseñarse a la luz de la composición genética de un individuo y, con el tiempo, la terapia génica puede llevar a la posibilidad de reemplazo o reparación de genes defectuosos.

La identificación de genes, el proceso conocido como "anotación", se ha logrado predominantemente a través de la bioinformática, en particular mediante análisis de homología y algunas predicciones genéticas de novo. Se puede acceder fácilmente a estos datos a través de varios “navegadores” de gran genoma (para una revisión, consulte Karolchik et al. 2003; Birney et al. 2004). El reciente análisis detallado del 1% del genoma humano en el proyecto ENCODE (ENCyclopedia Of DNA Elements) (ENCODE Project Consortium 2004; http://www.genome.gov/10005107) indica que estos enfoques tienen una tasa de éxito relativamente alta en identificar la presencia de un gen dentro de una región pero un éxito mucho menor en la predicción correcta de la estructura del gen (ver, por ejemplo, Brent y Guigo 2004); esto sugiere que la anotación puede subestimar el número de genes pero no sustancialmente. El bajo número de genes provocó comentarios de la prensa sobre la dificultad de equiparar la complejidad humana con la aparente simplicidad genética; Este comentario parece ignorar las extraordinarias posibilidades combinatorias que pueden generarse a partir de la interacción de incluso un pequeño número de productos genéticos, un hecho observado mucho antes de que se publicara la cifra final (Ewing y Green 2000).

El extenso proceso de anotación también confirmó la importancia del empalme alternativo en la creación de diversidad de proteomas. Actualmente, las estimaciones para la frecuencia por gen del empalme alternativo varían de 35% a ∼60% (Johnson et al. 2003), pero sigue existiendo una incertidumbre sustancial en la determinación del grado en que estas estimaciones reflejan empalmes o errores de empalme funcionalmente significativos (para revisión)., ver Sorek et al. 2004). La influencia del empalme alternativo en la complejidad del proteoma (para una revisión, ver Southan 2004) es una cuestión de importancia biológica sustancial, y la falta de precisión en la predicción de genes, estructuras genéticas y empalmes alternativos necesariamente limita la utilidad actual de la información genómica; estas son áreas que deben experimentar una experimentación directa sustancial antes de que pueda surgir un conjunto de datos casi completo.



Fig. 055A Cronología del proyecto GENCODE. (CC BY-SA 3.0 (https://creativecommons.org/licenses/by-sa/3.0/)), de Wikimedia Commons

ARN no codificantes de proteínas: Vínculos entre genes y regiones transcritas

En paralelo con el bajo número de genes, hay evidencia acumulada de que hay muchas transcripciones que parecen no estar codificadas por proteínas y no tener una función conocida (Cheng et al. 2005; Kapranov et al. 2005; para una revisión, ver Johnson et al. 2005), una observación que se refleja en el mouse (para una revisión, ver Suzuki y Hayashizaki 2004). En los seres humanos, las observaciones originales fueron controvertidas porque el nivel de ARN producido a partir de estos llamados transfragmentos (fragmentos transcritos) puede ser bajo y también porque los transfragmentos a menudo no están anotados como genes; Ambas preocupaciones suscitaron dudas sobre la importancia biológica de dicha transcripción. Hay varias razones por las que estas preocupaciones pueden ser innecesarias. J. Manak y T. Gingeras (com. Pers.) Han demostrado que en el desarrollo temprano en Drosophila, muchas de estas transfragmas son, de hecho, sitios de inicio 5 'sin anotar alternativos de genes anotados de otra manera. Si este hallazgo es cierto para los humanos, es tentador creer que la transcripción puede estar involucrada, por ejemplo, en la reorganización de un dominio de cromatina para que luego pueda transcribirse de forma controlada más adelante en el desarrollo. En segundo lugar, estos transfragmentos necesariamente secuestran la ARN polimerasa y las proteínas accesorias relevantes, y es posible que la relevancia biológica de la transcripción sea simplemente en relación con el control de la disponibilidad de los factores de transcripción basales y específicos de la célula. Estas especulaciones aún no han sido probadas.

También ha habido una considerable especulación de que los ARN no codificantes podrían tener una función reguladora, y en parte estas propuestas se han visto influenciadas por la creciente evidencia de que el ADN de muchos genes se transcribe tanto de las cadenas codificantes como no codificantes (véase, por ejemplo, Kapranov et al. 2005). Un papel esencial para algunas transcripciones de ARN no codificantes en el desarrollo embrionario temprano se había demostrado mediante la transgénesis mucho antes de que el análisis más general del genoma (Brunkow y Tilghman 1991), y el papel de las transcripciones antisentido en la regulación de genes humanos esté bien documentado (para una revisión reciente, ver O'Neill 2005). El desafío de estudiar la función de los muchos ejemplos nuevos de transcripciones no codificantes y no codificantes es considerable, ya que requerirá una manipulación sofisticada de las regiones relevantes para establecer una función probable; Algunos de estos análisis pueden surgir del proyecto ENCODE que se analiza a continuación (ENCODE Project Consortium 2004).



Fig. 056A Las funciones de los ARN no codificantes en el dogma central de la biología molecular: las ribonucleoproteínas se muestran en rojo, los ARN no codificantes en azul. ​English Wikipedia user Paul (GFDL (http://www.gnu.org/copyleft/fdl.html))

Los microARN son una clase de ARN no codificante que es el foco de atención creciente desde su descripción inicial en animales (véase, por ejemplo, Lagos-Quintana et al. 2001). El número de genes de microARN humanos en el genoma puede ser> 800 (Bentwich et al. 2005), y una mayoría significativa de ellos tiene una función desconocida. Los datos crecientes que apoyan un papel fundamental para esta clase de ARN no codificantes (ver, por ejemplo, He et al. 2005; Lu et al. 2005) están impulsando la investigación en esta área, y los próximos años verán descripciones progresivamente más claras de Número y papel biológico de estos ARNs.


Purchase this book or download sample versions for your ebook reader.
(Pages 1-8 show above.)