Información

14: ADN repetitivo - Un fenómeno genómico eucariota - Biología

14: ADN repetitivo - Un fenómeno genómico eucariota - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

  • 14.1: Introducción
    Debido a su pequeño tamaño, los genomas bacterianos tienen pocas secuencias de ADN repetitivas. Por el contrario, las secuencias repetitivas de ADN constituyen una gran parte de un genoma eucariota. Gran parte de este ADN repetido consta de secuencias idénticas o casi idénticas de longitud variable repetidas muchas veces en un genoma. Los ejemplos incluyen ADN satélite (ADN minisatélite y microsatélite) y transposones, o elementos transponibles. Aquí analizamos los experimentos que revelaron por primera vez la existencia y la proporción de ADN repetido.
  • 14.2: La complejidad del ADN genómico
    En la década de 1960, cuando Roy Britten y Eric Davidson estaban estudiando la regulación de genes eucariotas, sabían que había ADN más que suficiente para explicar los genes necesarios para codificar un organismo. También era probable que el ADN fuera más complejo estructuralmente de lo que se pensaba originalmente. Sabían que la centrifugación en gradiente de densidad de cloruro de cesio (CsCl) separaba las moléculas en función de las diferencias de densidad y que el ADN fragmentado se separaría en una banda principal y una banda secundaria de diferente densidad en la centrifugadora.
  • 14.3: Los 'genes saltarines' del maíz
    El informe de Barbara McClintock de que fragmentos de ADN podían saltar e integrarse en nuevos loci del ADN era tan dramático y misterioso que muchos pensaron que el fenómeno era único o no real. ¡Solo con el posterior descubrimiento de transposones en bacterias (y en otros eucariotas) se reconocieron finalmente los genes saltarines de McClintock por lo que eran!
  • 14.4: Transposones desde McClintock
    Los transposones existen en todos los lugares donde miramos en procariotas y representan gran parte del ADN repetitivo eucariota. Como tales, pueden ser una gran proporción de genomas eucariotas, incluidos algunos que ya ni siquiera se transponen. Los transposones alguna vez se consideraron ADN inútil o basura, sin función obvia ..., o genes egoístas sin otro propósito que la autorreplicación. Pero a la luz de alguna nueva evidencia, ¡quizás no!
  • 14.5: Sobre la evolución de transposones, genes y genomas
    Notamos que los transposones en las bacterias portan genes de resistencia a los antibióticos, un claro ejemplo de los beneficios de la transposición en procariotas. Por supuesto, los genomas procariotas son pequeños, al igual que la carga típica de transposones bacterianos. Las especies de levadura también tienen baja carga de transposones. Pero, ¿qué podemos hacer con la alta carga de transposones en eucariotas?
  • 14.6: Roles de la transposición en la evolución y la diversidad
    El papel de la recombinación desigual en el movimiento de exones dentro y fuera de diferentes genes divididos eucariotas se describió anteriormente. Este tipo de mezcla de exones podría ocurrir cuando secuencias cortas de ADN en dos intrones diferentes se desalinean durante la sinapsis meiótica, lo que permite un cruce desigual. La expresión de un gen con un "nuevo" exón produce una proteína con un nuevo dominio y una nueva actividad. Si el evento no es dañino, ¡la diversidad aumenta!
  • 14.7: Hacer frente a los peligros de la transposición desenfrenada
    La mayoría de los organismos no tienen la alta carga de transposones que tenemos. Para aquellos como nosotros, y dada la tendencia general de los transposones a insertarse al azar en nuevos loci de ADN, ¿cómo es que existimos? ¿No se magnifica el peligro de la transposición en secuencias de genes esenciales por la posibilidad de múltiples transposiciones simultáneas de elementos generados por mecanismos de cortar y pegar y especialmente de replicación? De hecho, se han encontrado transposones en genes que están inactivos como resultado.
  • 14.8: Palabras y términos clave

Miniatura: Granos de maíz (Hopi Blue) con pigmentación modificada por la acción de transposones. (CC BY-SA 3.0 Unported; Abrahami y modificado por a través de Wikipedia)


Inestabilidad de repetición de transcripción y triplete

I. INTRODUCCIÓN

Las secuencias de ADN repetitivas cortas, denominadas repeticiones de microsatélites y minisatélites, son inestables en todos los genomas, pero en varios loci del genoma humano la inestabilidad de las repeticiones se asocia con la enfermedad [1-4]. Las expansiones de las repeticiones de trinucleótidos (triplete) CAG · CTG son la causa de varias enfermedades neurológicas humanas, incluida la distrofia miotónica, la enfermedad de Huntington y varias ataxias espinocerebelosas [5, 6]. Estas enfermedades se caracterizan por la expansión de una repetición triplete más allá de un umbral de alrededor de 25 a 35 repeticiones hasta una longitud que tiene consecuencias patológicas [1, 6].

La herencia de enfermedades de secuencia repetida típicamente muestra un empeoramiento progresivo del fenotipo de la enfermedad en las generaciones posteriores a medida que el tracto repetido continúa expandiéndose, lo que indica un período crítico de inestabilidad en la línea germinal. La propensión de las secuencias repetidas a expandirse en la línea germinal es la característica definitoria de este grupo de enfermedades. Sin embargo, los tejidos somáticos de los individuos afectados también muestran un patrón característico de inestabilidad repetida, por ejemplo, las repeticiones CAG en la enfermedad de Huntington & # x27s suelen ser muy inestables en el cuerpo estriado, moderadamente inestables en el hígado y los riñones y estables en el corazón y los músculos [7]. La complejidad de los patrones específicos de tejido de la inestabilidad repetida, desde la línea germinal hasta varios tejidos somáticos, presenta un desafío para comprender los mecanismos subyacentes. ¿Por qué la inestabilidad repetida varía de un tejido a otro? ¿Surgen estos patrones de inestabilidad por la modulación de un mecanismo fundamental, o operan distintos mecanismos en diferentes tejidos? ¿Los mismos tipos de repeticiones en diferentes lugares del genoma se desestabilizan por el mismo mecanismo o por otros diferentes?

La base de la inestabilidad repetida en humanos se ha investigado mediante el uso de sistemas modelo, que incluyen Escherichia coli, levadura, células de mamíferos y ratones. En bacterias y levaduras, se ha demostrado que prácticamente todos los procesos que exponen hebras simples de ADN desestabilizan las repeticiones de tripletes, incluida la replicación del ADN, la recombinación homóloga, la reparación del ADN y la transcripción, siendo la replicación y la recombinación los efectos más dramáticos [1, 4]. Se cree que la exposición de ADN monocatenario permite que las repeticiones CAG · CTG formen horquillas y dúplex de ADN de cadena deslizada, como lo hacen in vitro [1, 3, 4, 8, 9]. Estas estructuras secundarias interfieren con los procesos metabólicos normales del ADN o desencadenan otros aberrantes, lo que en última instancia conduce a cambios en la longitud del tracto repetido. Por lo tanto, la inestabilidad de repetición triplete probablemente surge a través de una vía en la que un proceso metabólico del ADN normal expone hebras simples, lo que les permite formar una estructura secundaria, que a su vez pone en juego un proceso de reparación del ADN normal o aberrante que provoca el cambio en el tracto repetido. largo.

Los estudios en bacterias y levaduras han proporcionado información crítica sobre las posibles vías que conducen a la inestabilidad repetida, pero no identifican las vías que son responsables de la inestabilidad en los seres humanos. Por ejemplo, los procesos identificados como más importantes en bacterias y levaduras (la replicación del ADN y la recombinación homóloga) no tienen en cuenta ciertas observaciones clave en células de mamíferos y ratones, que posiblemente proporcionan los modelos más relevantes para la inestabilidad mitótica de las repeticiones que se observa. en la línea germinal humana y los tejidos somáticos. La observación más difícil de acomodar en los modelos basados ​​en la replicación es la inestabilidad continua que se produce con el tiempo en las células que se dividen lentamente (por ejemplo, en el hígado) y en las células que no se dividen, como las neuronas del cuerpo estriado [10-13]. Además, el grado de inestabilidad no se correlaciona con las tasas de proliferación celular específicas de tejido [14-16]. Además, se ha informado que se produce inestabilidad durante la detención meiótica en la línea germinal femenina [17] y en precursores de esperma no proliferantes [18, 19]. Los estudios en ratones también sugieren un papel menor para la recombinación homóloga en el mejor de los casos, ya que la estabilidad de repetición no se vio afectada en ratones deficientes para las proteínas de recombinación RAD52 y RAD54 [20]. Además, la inestabilidad en curso en las neuronas diferenciadas terminalmente [10-13, 21] debe ocurrir en ausencia de una cromátida hermana, los socios ampliamente preferidos para la recombinación homóloga en células de mamíferos [22]. Por tanto, la replicación y la recombinación son fuentes poco probables de la inestabilidad observada en las células somáticas, especialmente en las neuronas detenidas en G1 / G0.

Estas consideraciones sugieren que es probable que otras vías, además de o en lugar de la replicación y recombinación, contribuyan a la inestabilidad de repetición triplete en tejidos específicos. Este capítulo examinará la posibilidad de que la transcripción a través de una repetición de triplete provoque inestabilidad. Los efectos de la transcripción se han estudiado en bacterias [23-27], pero la vía que conduce desde la transcripción al cambio de longitud repetida aún no está definida. La mayoría de los resultados en bacterias se han interpretado en términos de interacción entre la transcripción y la replicación [23-26], lo que parece poco probable que se aplique a la inestabilidad observada en neuronas que no se dividen, por ejemplo. Se ha propuesto una vía inducida por la transcripción, independiente de la replicación [26], y en la figura 44-1 se muestra una versión modificada de esa vía. Es probable que la transcripción desencadene una inestabilidad repetida al exponer el ADN monocatenario a medida que la ARN polimerasa se mueve a través de las repeticiones, lo que permite que las repeticiones formen horquillas y estructuras de hebra deslizada [1, 4, 8, 9]. Estas estructuras aberrantes podrían participar en los procesos de reparación del ADN durante la transcripción o en un proceso físicamente desvinculado de la transcripción, como una forma de lidiar con las estructuras que quedan como consecuencia del paso de una polimerasa. Son los propios procesos de reparación los que producirían cambios en la longitud del tracto repetido.

FIGURA 44-1. Vía de inestabilidad de repetición de triplete inducida por transcripción. El paso de la ARN polimerasa separa las hebras del dúplex permitiendo que se forme una estructura secundaria en la hebra no transcrita. Si la estructura está presente cuando las dos hebras se vuelven a recocer, se puede formar una estructura de hebra deslizada como la que se muestra aquí. Aunque se muestran estructuras equivalentes en cada hebra, CTG y CAG no forman horquillas con la misma facilidad y, por lo tanto, las dos hebras pueden no tener la misma estructura. Se proponen procesos de reparación del ADN como MMR y NER para reconocer las horquillas e iniciar la reparación. La eliminación de los bucles provocaría una contracción. La escisión de las hebras opuestas a los bucles, junto con la síntesis de reparación del ADN utilizando los bucles como plantillas, provocaría expansiones.

Dos procesos de reparación del ADN, la reparación por escisión de nucleótidos (NER) y la reparación de errores de apareamiento (MMR), o componentes de los mismos, son candidatos lógicos para participar en una vía de inestabilidad repetida inducida por la transcripción. La NER tiene una conexión bien definida con la transcripción a través de una subvía conocida como reparación acoplada a la transcripción (TC-NER) [28, 29]. Además, la estabilidad de las repeticiones de tripletes se altera significativamente en cepas bacterianas con mutaciones en NER [25, 30], así como en células humanas al eliminar los componentes de NER utilizando ARNip (Lin et al.). La MMR se ha relacionado en algunos informes con TC-NER en bacterias [31] y en células humanas [32-34]. Además, se ha demostrado que Msh2 interactúa con componentes de NER en levadura [35] y se une a estructuras de hebra deslizada CAG · CTG [36], y la MMR se ha relacionado con la inestabilidad de repetición triplete en bacterias [27, 37-39] , levadura [40, 41], células humanas (Lin et al.) y ratones [10, 18, 20, 42-48].

Este capítulo examina la base para considerar que una vía mediada por transcripción podría contribuir a la inestabilidad de repetición del triplete CAG · CTG observada en humanos. En el capítulo se revisan los datos existentes sobre la inestabilidad inducida por la transcripción y se presentan nuevos datos que muestran que los elementos de la vía esbozada en la figura 44-1 operan en las células humanas.


14: ADN repetitivo - Un fenómeno genómico eucariota - Biología

LA ORGANIZACIÓN Y CONTROL DE GENOMOS EUCARIÓTICOS

La expresión génica en eucariotas tiene dos diferencias principales del mismo proceso en procariotas.

El genoma eucariota multicelular típico es mucho más grande que el de una bacteria.
La especialización celular limita la expresión de muchos genes a células específicas.
Los 35.000 genes estimados en el genoma humano incluyen una enorme cantidad de ADN que no programa la síntesis de ARN o proteínas.

El ADN eucariota se combina con precisión con grandes cantidades de proteínas.
Durante la interfase, las fibras de cromatina están muy extendidas.
Si se extiende, cada molécula de ADN tendría unos 6 cm de largo.

Primer nivel: proteínas histonas
Sus aminoácidos cargados positivamente se unen estrechamente al ADN cargado negativamente.
Los cinco tipos de histonas son muy similares de un eucariota a otro e incluso están presentes en las bacterias.
La cromatina desplegada tiene la apariencia de perlas en una cuerda, un nucleosoma, en el que el ADN se enrolla alrededor de un núcleo de proteínas histonas.
La cadena de cuentas parece permanecer esencialmente intacta durante todo el ciclo celular.
Las histonas abandonan el ADN solo de forma transitoria durante la replicación del ADN.
Permanecen con el ADN durante la transcripción.
Al cambiar de forma y posición, los nucleosomas permiten que las polimerasas que sintetizan ARN se muevan a lo largo del ADN.

Nivel dos: a medida que los cromosomas entran en la mitosis, la cuerda con cuentas se enrolla para formar la fibra de cromatina de 30 nm.
Nivel tres: esta fibra forma dominios en bucle unidos a un andamio de proteínas que no son histonas.
Nivel cuatro: los dominios en bucle se enrollan y pliegan para producir el cromosoma en metafase característico.
La cromatina de interfase generalmente está mucho menos condensada que la cromatina de mitosis, y las fibras de 30 nm y los dominios en bucle permanecen intactos.
La cromatina de cada cromosoma ocupa un área restringida dentro del núcleo en interfase.
Los cromosomas en interfase tienen áreas que permanecen altamente condensadas, heterocromatina, y áreas menos compactadas, eucromatina.

Organización del genoma a nivel del ADN

En eucariotas, la mayor parte del ADN (alrededor del 97% en humanos) no codifica proteínas o ARN.
1. Las regiones no codificantes son secuencias reguladoras.
2. intrones.
3. ADN repetitivo, presente en muchas copias en el genoma.
En los mamíferos, alrededor del 10-15% del genoma es ADN repetitivo en tándem o ADN satélite.
Estos difieren en densidad de otras regiones, por lo que forman una banda separada después de la ultracentrifugación diferencial.
Hay tres tipos de ADN satélite, diferenciados por la longitud total de ADN en cada sitio. Cuadro 19.1.
Algunos trastornos genéticos son causados ​​por tramos anormalmente largos de tripletes de nucleótidos repetidos en tándem dentro del gen afectado.
El síndrome del X frágil es causado por cientos o miles de repeticiones de CGG en el gen X frágil.
La enfermedad de Huntington se produce debido a repeticiones de CAG que se traducen en proteínas con una larga cadena de glutaminas.
La gravedad de la enfermedad y la edad de aparición de estas enfermedades se correlacionan con el número de repeticiones.
Aproximadamente el 25-40% de la mayoría de los genomas de mamíferos consiste en ADN repetitivo intercalado.
Aparecen en múltiples sitios del genoma.
Son similares pero generalmente no idénticos entre sí.

Si bien la mayoría de los genes están presentes como una sola copia por conjunto haploide de cromosomas, las familias multigénicas existen como una colección de genes idénticos o muy similares.
Estos probablemente evolucionaron a partir de un solo gen ancestral.
Los miembros de familias multigénicas pueden agruparse o dispersarse en el genoma.
Los genes idénticos son familias multigénicas que se agrupan en tándem. Figura 19.2.
Por lo general, constan de genes de productos de ARN o de proteínas histonas.
Las tres moléculas de ARNr más grandes están codificadas en una sola unidad de transcripción que se repite en tándem de cientos a miles de veces.
Esta transcripción se escinde para producir tres moléculas de ARNr que se combinan con proteínas y otro tipo de ARNr para formar subunidades ribosómicas.
Genes no idénticos
Dos familias relacionadas de genes de globina, a (alfa) y & szlig (beta), de hemoglobina, que se encuentran en diferentes cromosomas. Figura 19.3.
Las diferentes versiones de cada subunidad de globina se expresan en diferentes momentos del desarrollo.
Dentro de ambas familias hay secuencias que se expresan durante la etapa de desarrollo embrionaria, fetal y / o adulta.
Las hemoglobinas embrionarias y fetales tienen una mayor afinidad por el oxígeno que las formas adultas, lo que garantiza la transferencia de oxígeno de la madre al feto en desarrollo.
Las diferencias en los genes surgen de mutaciones que se acumulan en las copias del gen durante generaciones.
Estas mutaciones pueden incluso dar lugar a cambios suficientes para formar pseudogenes, segmentos de ADN que tienen secuencias similares a los genes reales pero que no producen proteínas funcionales.

Amplificación, pérdida o reordenamiento de genes

La secuencia de nucleótidos del genoma de un organismo puede alterarse de forma sistemática durante su vida.
No afecta a los gametos
Sus efectos se limitan a células y tejidos particulares.
En la amplificación de genes, ciertos genes se replican como una forma de aumentar la expresión de estos genes.
En los anfibios, los genes del ARNr no solo tienen un complemento normal de múltiples copias, sino que se sintetizan millones de copias adicionales en un óvulo en desarrollo.
Esto ayuda a la célula a producir una enorme cantidad de ribosomas para la síntesis de proteínas después de la fertilización.
En algunas células de insectos, la totalidad o parte de los cromosomas se pierden al principio del desarrollo.
El reordenamiento de los loci de genes en células somáticas puede tener un efecto poderoso sobre la expresión génica.
Los transposones son genes que pueden moverse de un lugar a otro dentro del genoma.
El 10% del genoma humano son transposones.
Si uno "salta" a una secuencia codificante de otro gen, puede impedir la función normal del gen.
Si el transposón se inserta en un área reguladora, puede aumentar o disminuir la transcripción.
La mayoría de los transposones son retrotransposones (Fig. 19.5), en los que el ARN transcrito incluye el código de una enzima que cataliza la inserción del retrotransposón y puede incluir un gen para la transcriptasa inversa.
La transcriptasa inversa utiliza la molécula de ARN originalmente transcrita del retrotransposón como templete para sintetizar una copia de ADN de doble hebra.
Esto puede poblar el genoma eucariota con múltiples copias de su secuencia.
Los principales reordenamientos de al menos un conjunto de genes ocurren durante la diferenciación del sistema inmunológico.
Los linfocitos B producen inmunoglobinas o anticuerpos que reconocen y combaten específicamente virus, bacterias y otros invasores. Figura 19.6.
Cada célula diferenciada produce un tipo específico de anticuerpo que ataca a un invasor específico.
Los genes de anticuerpos funcionales se reconstruyen a partir de regiones de ADN separadas físicamente.
Cada inmunoglobina consta de cuatro cadenas polipeptídicas, cada una con una región constante y una región variable, lo que confiere a cada anticuerpo su función única.
A medida que se diferencia un linfocito B, uno de varios cientos de posibles segmentos variables se conecta a la sección constante eliminando el ADN interviniente.
Las combinaciones aleatorias de diferentes regiones variables y constantes crean una enorme variedad de polipéptidos diferentes, que se combinan con otros para formar moléculas de anticuerpos completas.
Como resultado, el sistema inmunológico maduro puede producir millones de diferentes tipos de anticuerpos a partir de millones de subpoblaciones de linfocitos B.

El control de la expresión genética

Cada célula expresa solo una pequeña fracción de sus genes.
Se encienden y apagan continuamente en respuesta a las señales de sus entornos internos y externos.
La expresión génica debe controlarse a largo plazo durante la diferenciación celular.
Las células altamente especializadas expresan solo una pequeña fracción de sus genes.
Los problemas con la expresión y el control de genes pueden provocar desequilibrios y enfermedades, incluido el cáncer.

El control de la expresión génica puede ocurrir en cualquier paso de la ruta del gen a la proteína funcional. Figura 19.7
Estos niveles de control incluyen empaquetamiento de cromatina, transcripción, procesamiento de ARN, traducción y diversas alteraciones del producto proteico.

Modificaciones del empaque de cromatina

Los genes de heterocromatina densamente condensada generalmente no se expresan.

Las modificaciones químicas de la cromatina juegan un papel clave en la estructura de la cromatina y la regulación de la transcripción.
Metilación del ADN
El ADN inactivo generalmente está altamente metilado en comparación con el ADN que se transcribe activamente.
Por ejemplo, el cromosoma X de mamífero inactivado en las hembras está muy metilado.
Las enzimas de metilación metilan correctamente las hebras hijas.
Esto explica la impronta genómica en la que la metilación apaga los alelos materno o paterno.
La acetilación y desacetilación de histonas parecen desempeñar un papel directo en la regulación de la transcripción de genes.
Las histonas acetiladas agarran el ADN con menos fuerza, lo que facilita el acceso a las proteínas de transcripción en esta región.
Algunas de las enzimas responsables de la acetilación o desacetilación están asociadas o son componentes de factores de transcripción que se unen a los promotores.
La metilación del ADN y la desacetilación de histonas pueden cooperar para reprimir la transcripción.

El inicio de la transcripción es el punto de control más importante y utilizado universalmente en la expresión génica.

Los elementos de control son segmentos de ADN no codificantes que regulan la transcripción uniendo factores de transcripción. Figura 19.8
La ARN polimerasa eucariota depende de factores de transcripción antes de que comience la transcripción.
Un factor de transcripción reconoce la caja TATA.

Los elementos de control distales, potenciadores, pueden estar a miles de nucleótidos del promotor o incluso corriente abajo del gen o dentro de un intrón. Figura 19.9.
La flexión del ADN permite que los factores de transcripción, los activadores, unidos a los potenciadores, se pongan en contacto con el complejo de iniciación de la proteína en el promotor.

Los genes eucariotas también tienen proteínas represoras que se unen a elementos de control del ADN llamados silenciadores.
La represión puede operar principalmente a nivel de modificación de la cromatina.

Cada proteína generalmente tiene un dominio de unión al ADN que se une al ADN y un dominio de unión a proteínas que reconoce otros factores de transcripción.

Los genes que codifican las enzimas de una vía metabólica pueden estar dispersos en diferentes cromosomas.
La expresión génica coordinada depende de la asociación de un elemento de control específico o colección de elementos de control con cada gen de un grupo disperso.
Un grupo común de factores de transcripción se une a ellos y promueve la transcripción simultánea de genes.

Mecanismos postranscripcionales
La expresión génica puede bloquearse o estimularse mediante cualquier paso postranscripcional.

En el empalme de ARN alternativo, se producen diferentes moléculas de ARNm a partir del mismo transcrito primario, dependiendo de qué segmentos de ARN se tratan como exones y cuáles como intrones. Figura 19.11. ¡Película! Regulación de la degradación del ARNm.
Las moléculas de ARNm procariotas pueden degradarse después de solo unos minutos.
Los ARNm eucariotas suelen durar horas e incluso pueden durar días o semanas.
Por ejemplo, en los glóbulos rojos, los ARNm de los polipéptidos de hemoglobina son inusualmente estables y se traducen repetidamente en estas células.
Una vía común de degradación del ARNm comienza con el acortamiento enzimático de la cola de poli (A).
Esto desencadena la eliminación enzimática de la tapa 5 '.
A esto le sigue una rápida degradación del ARNm por las nucleasas.

Control de la traducción La traducción de ARNm específicos puede bloquearse mediante proteínas reguladoras que se unen a secuencias o estructuras específicas dentro de la región líder 5 'del ARNm. ¡Película!
Esto evita el apego a los ribosomas.
Los factores proteicos necesarios para iniciar la traducción en eucariotas ofrecen objetivos para controlar simultáneamente la traducción de todo el ARNm en una célula.
Esto permite que la celda apague la traducción si las condiciones ambientales son malas.
Los polipéptidos eucariotas a menudo deben procesarse para producir proteínas funcionales. ¡Película!
La regulación puede ocurrir en la escisión, modificaciones químicas y transporte al destino apropiado.
Por ejemplo, la fibrosis quística es el resultado de mutaciones en los genes de una proteína del canal de iones cloruro que evita que llegue a la membrana plasmática.
La proteína defectuosa se degrada rápidamente.
La célula limita la vida útil de las proteínas normales por degradación selectiva.

Las proteínas destinadas a la degradación están marcadas por la unión de proteínas de ubiquitina. Figura 19.12.
Los proteosomas gigantes reconocen la ubiquitina y degradan la proteína marcada.

La biología molecular del cáncer

El cáncer es una enfermedad en la que las células escapan a los métodos de control que normalmente regulan el crecimiento y la división celular.
Los cambios pueden ser mutaciones espontáneas aleatorias o influencias ambientales como carcinógenos químicos o mutágenos físicos.
Los genes que causan cáncer, los oncogenes, son productos de protooncogenes, que codifican proteínas que estimulan el crecimiento y la división celular normales y tienen funciones esenciales en las células normales. Figura 19.13.
Un oncogén surge de un cambio genético que conduce a un aumento en la proteína del protooncogén o en la actividad de cada molécula de proteína.
Estos cambios genéticos incluyen movimientos de ADN dentro del genoma, amplificación de protooncogenes y mutaciones puntuales en el gen.
Las células malignas suelen tener cromosomas que se han roto y se han vuelto a unir de forma incorrecta.
Esto puede trasladar un fragmento a una ubicación cercana a un promotor activo u otro elemento de control.
La amplificación aumenta el número de copias de genes.
Una mutación puntual puede conducir a la traducción de una proteína que es más activa o de mayor duración. Las mutaciones en genes cuyos productos normales inhiben la división celular, genes supresores de tumores, también contribuyen al cáncer.
Algunas proteínas supresoras de tumores normalmente reparan el ADN dañado.
Otros controlan la adhesión de las células entre sí o a una matriz extracelular, crucial para los tejidos normales.
Otros más son componentes de vías de señalización celular que inhiben el ciclo celular.

Las proteínas oncogénicas y las proteínas supresoras de tumores defectuosas interfieren con las vías de señalización normales. Figura 19.14.

Las mutaciones en los productos de dos genes clave, el protooncogén ras y el gen supresor de tumores p53, ocurren en el 30% y el 50% de los cánceres humanos, respectivamente.
Ambos son componentes de vías de transducción de señales que transmiten señales externas al ADN.
Ras, producto del gen ras, es una proteína G que proporciona la síntesis de una proteína que estimula el ciclo celular.
Muchos oncogenes ras tienen una mutación puntual que conduce a una versión hiperactiva de la proteína Ras que puede emitir señales por sí sola, lo que resulta en una división celular excesiva.
La proteína supresora de tumores codificada por el gen p53 normal es un factor de transcripción que promueve la síntesis de proteínas inhibidoras del crecimiento.
Una mutación que anula el gen p53 puede provocar un crecimiento celular excesivo y cáncer.

El gen p53 a menudo se denomina "ángel de la guarda del genoma".
El daño al ADN de la célula conduce a la expresión del gen p53.
La proteína p53 puede:
activar el gen p21, que detiene el ciclo celular.
activar genes implicados en la reparación del ADN.
activar & quotsuicide genes & quot cuyos productos proteicos provocan la muerte celular.

Múltiples mutaciones subyacen al desarrollo del cáncer.

Si el cáncer es el resultado de una acumulación de mutaciones, y si las mutaciones ocurren a lo largo de la vida, cuanto más vivamos, más probabilidades tenemos de desarrollar cáncer.


Métodos

Descripción general del flujo de trabajo REPCLASS

El flujo de trabajo de REPCLASS se esquematiza en la figura 1. El archivo de entrada para el programa es un archivo de texto único que contiene las secuencias de ADN que se clasificarán en formato Fasta. Luego, cada entrada es procesada por los tres módulos de clasificación: homología (HOM), estructura (STR) y la duplicación del sitio de destino (TSD). Cada uno de los módulos implica varios pasos y procesos, que se describen en detalle a continuación. El paso final es un paso de integración que tiene como objetivo comparar, clasificar y combinar los resultados de los tres módulos, proporcionando una única clasificación tentativa para cada entrada de Fasta en el archivo de entrada. La salida de REPCLASS es un archivo de texto que informa la clasificación de cada entrada de Fasta en el archivo de entrada, si se obtiene alguna clasificación. Los términos de clasificación están precedidos por un código de letras que indica los módulos que se utilizaron para producir la clasificación (H, S o T). La clasificación va acompañada de una descripción de las características estructurales identificadas (por ejemplo, longitud de TIR, LTR y terminal poli A) y de la longitud de consenso del TSD, si se identificó alguna. Al final del archivo de salida, se da el número total de entradas clasificadas por REPCLASS y el desglose de este recuento por módulo o combinación de módulos. Tenga en cuenta que el usuario también tiene la opción de ejecutar cada uno de los módulos de REPCLASS por separado o en cualquier combinación por pares (consulte la guía del usuario y la documentación).

Descripción general del flujo de trabajo REPCLASS. Las subrutinas se muestran en cursiva en recuadros negros. Las bases de datos se muestran en cilindros grises. Cada secuencia de consulta de entrada (normalmente un consenso) es analizada por los tres módulos de clasificación de REPCLASS. HOM: basado en homología, busca similitudes con repeticiones conocidas depositadas en Repbase usando TBlastX y extrae la clasificación del archivo de índice de palabras clave STR: basado en estructura, varias subrutinas buscan características estructurales de diferentes grupos de TE, como repeticiones terminales invertidas (TIR_search), LTR (LTR_search), secuencias similares a ARNt (tRNAscan-SE) o poliA / SSR (polyA / SSR_search) TSD: duplicación del sitio diana, se extraen copias individuales de la secuencia del genoma diana usando BlastN y se busca TSD en sus secuencias flanqueantes. Si no se encuentran TSD, la subrutina Helitron_scan se ejecuta para buscar características estructurales de Helitrones. El paso final intenta comparar e integrar los resultados de los tres módulos, lo que resulta en una clasificación tentativa para cada secuencia de entrada. Para obtener una descripción completa del flujo de trabajo y las subrutinas, consulte Resultados y métodos.

Descripción general del flujo de trabajo REPCLASS. Las subrutinas se muestran en cursiva en recuadros negros. Las bases de datos se muestran en cilindros grises. Cada secuencia de consulta de entrada (normalmente un consenso) es analizada por los tres módulos de clasificación de REPCLASS. HOM: basado en homología, busca similitudes con repeticiones conocidas depositadas en Repbase usando TBlastX y extrae la clasificación del archivo de índice de palabras clave STR: basado en la estructura, varias subrutinas buscan características estructurales de diferentes grupos de TE, como repeticiones terminales invertidas (TIR_search), LTR (LTR_search), secuencias similares a ARNt (tRNAscan-SE) o poliA / SSR (polyA / SSR_search) TSD: duplicación del sitio diana, se extraen copias individuales de la secuencia del genoma diana usando BlastN y se busca TSD en sus secuencias flanqueantes. Si no se encuentran TSD, la subrutina Helitron_scan se ejecuta para buscar características estructurales de Helitrones. El paso final intenta comparar e integrar los resultados de los tres módulos, lo que resulta en una clasificación tentativa para cada secuencia de entrada. Para obtener una descripción completa del flujo de trabajo y las subrutinas, consulte Resultados y métodos.

HOM Módulo

Este módulo utiliza cada secuencia de entrada como una consulta en una búsqueda TBlastX (consulta traducida contra base de datos traducida) de todas las bibliotecas de repetición de referencia depositadas en Repbase Update (Jurka et al. 2005) o cualquier biblioteca de repetición personalizada anotada e indexada como en Repbase. La última versión de Repbase Update utilizada en este estudio fue la versión 13.03, descargada de http://www.girinst.org/. La búsqueda de TBlastX se realiza con los parámetros predeterminados mediante una instalación local de WU-Blast versión 2.0 (http://blast.wustl.edu/). Usamos TBlastX (en lugar de BlastN) ya que proporciona una mayor sensibilidad para detectar motivos proteicos conservados, así como coincidencias breves pero significativas en secuencias no codificantes. El usuario tiene la opción de modificar el código fuente para ejecutar cualquier otra aplicación de la suite WU-Blast.

Los archivos de salida de TBlastX se analizan y el primer X (predeterminado de 10) hits con un mi valor menor que mi −5 son elegidos. La clasificación de estos X Los TE se recuperan de un archivo de índice de palabras clave creado para la base de datos Repbase y se analizan mediante una subrutina llamada Key_match. Este programa extrae palabras clave y descripciones de Repbase Update en formato EMBL para cada una de las secuencias de TE de éxito (tema). La herramienta de indexación busca palabras clave específicas como subclase, superfamilia, familia, etc. El índice consiste en el ID asignado por Repbase para el TE, junto con los términos que definen la clasificación: subclase (SC), superfamilia (SF), familia (FM ), grupo (GP), subgrupo (SG) y palabras clave (KW). Para cada palabra clave, dos puntuaciones de confianza, PAGmi y PAGk, se calculan de la siguiente manera. PAGmi es el promedio ponderado de la mi valores para todos los hits que contienen la palabra clave, después de transformar cada mi valor con la fórmula PAGmi = | ln (mi value) | / 100 y con mi valores & lt mi −100 establecido en mi −100 . PAGk es el promedio ponderado de la ocurrencia de una palabra clave en particular con respecto al número total de visitas, es decir, PAGk = número de palabras clave / no. de hits. El programa ordena las palabras clave por PAGmi y PAGk puntuaciones y asigna una clasificación tentativa basada en la palabra clave de puntuación más alta para ambas puntuaciones.

STR Módulo

Este módulo consta de varias subrutinas diseñadas para buscar características estructurales de diferentes subclases de elementos. Cuatro subrutinas (descritas a continuación) se ejecutan de forma independiente, y REPCLASS informa los resultados de cada subrutina junto con estadísticas descriptivas de las características encontradas, si las hubiera. Una quinta subrutina, Helitron_scan, se ejecuta si no se han identificado TSD a través del TSD módulo (descrito a continuación).

LTR_search

LTR_search busca LTR, utilizando un procedimiento de ventana deslizante, con un tamaño de ventana predeterminado inicial de 10 pb, incrementado en 1 pb al coincidir, y deslizándose en dirección opuesta desde cada término de la secuencia de consulta (+/− 20 pb). Se permite un desajuste de 1 pb por cada 10 pb. El usuario tiene la opción de especificar el tamaño de ventana inicial. El programa considera una región como una LTR putativa si la longitud total de la repetición directa es superior a 100 pb y comienza / termina dentro de los 20 pb de cada término de la consulta.

TIR_search

TIR_search utiliza una versión modificada del einvertido programa, que es parte del paquete EMBOSS 6.0 (Olson 2002), para identificar las repeticiones invertidas más largas posibles que ocurren dentro de los 30 pb de los extremos de la secuencia de consulta. Los parámetros para einvertido son brecha = 12, umbral = 50, coincidencia = 3, desajuste = 4 y maxrepeat = 10,000. El programa informa el tamaño del TIR, si se identifica alguno y si tiene una longitud de & gt10 pb.

TRNAscan-SE

El objetivo de esta subrutina es buscar la presencia de una estructura secundaria similar a ARNt dentro de la secuencia de consulta. Tal estructura es indicativa de un SINE ya que la mayoría de ellos se derivan de secuencias de tRNA. Usamos el programa tRNAscan-SE versión 1.23 (Lowe y Eddy 1997), cuyo código fuente UNIX está disponible en http://lowelab.ucsc.edu/tRNAscan-SE/. Aplicamos tRNAscan-SE a cada secuencia de consulta utilizando los parámetros predeterminados. El resultado del programa informa una serie de estadísticas, incluido el número de tRNA encontrados y el número de pseudogenes de tRNA. Nuestras pruebas empíricas sugirieron que tRNAscan-SE fue capaz de reconocer la parte derivada de tRNA de muchos SINE conocidos, que normalmente se predecían como pseudogenes de tRNA.

PolyA / SSR_search

Esta subrutina utiliza un algoritmo de ventana deslizante simple para detectar la presencia de repeticiones de secuencia simple (SSR) con unidades que varían en tamaño de 1 a 5 nt en o cerca de los extremos de la secuencia de consulta. La presencia de estas características en uno (pero no en ambos) extremos de la consulta es indicativa de un potencial retrotransposón no LTR. Para los SSR, aplicamos un umbral variable para retener solo aquellos con un número mínimo de unidades repetidas, dependiendo de la longitud de la unidad (al menos 10 unidades perfectas para mononucleótidos [incluyendo poliA / T], 7 para dinucleótidos, 5 para trinucleótidos, 4 para tetranucleótidos y 3 para pentanucleótidos). Para cada secuencia de consulta (consenso), los SSR se buscan en una muestra de elementos individuales (1 a 10 según el número de copias) extrayendo el primer y el último 50 nt que coinciden con el consenso más 50 pb de secuencias genómicas flanqueantes en cada lado, extraídas de el genoma objetivo (ver también TSD módulo, a continuación). Esto se hace debido a la variación inherente en la longitud del SSR en cada locus, lo que puede evitar la inclusión de SSR largos en el consenso. La presencia y la longitud promedio de las colas de poliA / T se informa en el archivo de salida REPCLASS, ya que es muy indicativo de elementos retropuestos.

Helitron_scan

Este programa está diseñado para buscar las características de secuencia de terminales características de Helitrones, que incluyen conservados 5′-TC y CTRR-3 ′ (R = A o G) en sus extremos 5 ′ y 3 ′, respectivamente, y un motivo subminal en forma de horquilla rico en GC (16 a 20 pb de largo con un bucle de 2 a 5 pb) ubicado a 10-12 nt del terminal CTRR-3 ′ (Kapitonov y Jurka 2001). Helitrones no crean TSD, pero se insertan preferentemente entre los nucleótidos A y T, lo que da como resultado una disposición de secuencia terminal conservada en general (5′-A | TC… / x nt /… gcctgcggt / 2–5 nt / accgcaggc… / 2-8 nt / CTRR | T-3 ′).

Si se encuentran varios motivos de horquilla en la misma repetición, se retiene el motivo de puntuación más alta. La puntuación final HT por Helitron_scan es la suma de la H53 y HPAG puntuaciones. A HT una puntuación de 0,75 y superior se toma como indicativo de un Helitron.

TSD Módulo

Este módulo está diseñado para identificar TSD potenciales creados por la inserción de secuencias TE individuales. Con pocas excepciones (por ejemplo, TA en Tc1 /marinero elementos), la secuencia y / o la longitud del TSD no se conservan entre los elementos individuales (Wicker et al. 2007). Por tanto, el TSD no se incluye generalmente dentro de la secuencia de consulta (consenso) pero se encuentra flanqueando cada inserción. por lo tanto, el TSD_search La subrutina primero realiza una búsqueda BlastN (a través de una instalación local de WU-Blast) con cada consulta contra una base de datos de nucleótidos del genoma objetivo (según lo definido y cargado por el usuario) para recuperar copias individuales de la repetición. A continuación, se analiza la salida de BlastN para retener solo las copias que coinciden con ambos extremos de la consulta y se extraen los primeros y últimos 10 pb de cada elemento más 50 pb de secuencia genómica flanqueante en cada lado. Luego se usa un algoritmo de ventana deslizante para escanear secuencias flanqueantes 5 ′ y 3 ′ en direcciones opuestas (comenzando con el final del flanco 5 ′ y el comienzo del flanco 3 ′) para secuencias de motivos de longitud & gt2 pb que coinciden en orientación directa .Permitimos un desajuste de 1 pb / motivo de 6-10 y 2 pb / motivo de & gt10 pb. La inclusión de 10 pb de las secuencias terminales del elemento permite la recuperación de TSD que se conservan en longitud y secuencia y pueden haber sido incluidos como parte del consenso. El primer motivo coincidente se interpreta como el potencial TSD. Si & gt50% de los elementos examinados tienen un TSD potencial, se recupera el número máximo de elementos que tienen la misma longitud de TSD y se genera un consenso de esas secuencias de TSD. La secuencia y la duración del consenso se almacenan y se informan en el archivo de salida REPCLASS. Si se encuentran TSD en & gt50% de las copias examinadas, pero no se puede reconstruir la longitud de TSD consensuada, la búsqueda informa "longitud de TSD variable", lo cual es indicativo de elementos no LTR. Si se encuentran TSD en menos del 50% de las copias examinadas, se considera que el elemento no crea TSD. Debido a que la falta de TSD es una característica de Helitrones, las repeticiones sin TSD están sujetas a una búsqueda adicional de características estructurales de Helitrones (descrito arriba).

Paso de integración

El paso final en el flujo de trabajo REPCLASS es un proceso de integración que interpreta, compara, pondera y sintetiza los resultados de los tres módulos en el contexto del sistema de clasificación TE actual para llegar a una clasificación tentativa para cada secuencia de consulta. Para hacer esto, creamos una base de datos de clasificación personalizada que refleja en gran medida el “sistema de clasificación unificado para elementos transponibles eucariotas” (Wicker et al. 2007). Esta base de datos relacional se utiliza para integrar los diferentes niveles de clasificación y validar los resultados producidos por los tres módulos upstream. Por ejemplo, cuando dos o tres de los módulos convergen en la misma subclase, esta subclase se adopta como clasificación final. Si uno de los módulos produce una clasificación a nivel de superfamilia, esta información se extrae y se agrega a la clasificación de subclase. La base de datos de clasificación también se utiliza para aumentar o completar la información recibida de los módulos. Por ejemplo, el HOM El módulo puede informar la superfamilia pero no la subclase o clase. Esto se debe a que el índice de palabras clave extraído de Repbase Update durante el HOM la búsqueda no siempre es completa o precisa, especialmente para las entradas más antiguas.

Otro objetivo del paso de integración es resolver clasificaciones conflictivas que pueden producir los diferentes módulos. En este caso, el programa de integración aplica una estrategia jerárquica basada en una clasificación de los tres módulos en nivel de confianza decreciente: HOM & gt STR & gt TSD (ver también Resultados). La regla jerárquica se aplica por separado en cada nivel de la clasificación. Nuestras pruebas empíricas mostraron que la clasificación resolvió la mayoría de los casos de clasificaciones en conflicto. El usuario también puede encontrar útil modificar la clasificación entre módulos o deshabilitar el paso de integración, que luego permite la visualización de las clasificaciones producidas por cada módulo, y permite que el usuario realice manualmente la integración de los resultados para cada repetición clasificada.

Tiempo de procesamiento y computación

La mayoría de los resultados informados en este documento se obtuvieron al ejecutar REPCLASS en el clúster de computación paralela y distribuida de UT Arlington, que consta de 81 nodos de cómputo Xeon de doble procesador a 2.667 GHZ con 2 GB de memoria cada uno. El software se ejecutó en un número variable de procesadores para medir el rendimiento informático en términos de escalabilidad y equilibrio de carga (para obtener más detalles, consulte Ranganathan et al. 2006). En resumen, el tiempo de procesamiento se correlacionó linealmente con el número de entradas de Fasta en el archivo de entrada y con el número de procesadores utilizados. Por ejemplo, tomó alrededor de 2 h con 2 procesadores o 40 min con 10 procesadores para ejecutar REPCLASS en el Caenorhabditis elegans Repbase Update library (116 entradas) y 21 o 2 h usando 2 y 10 procesadores, respectivamente, para el C. elegans Biblioteca sin filtrar RepeatScout (1851 entradas). Por lo tanto, para un genoma relativamente pequeño con una biblioteca de repetición filtrada, REPCLASS se puede ejecutar en una computadora de escritorio estándar en solo unas pocas horas. Para genomas más grandes y ricos en repeticiones, el tiempo de respuesta se mejora significativamente mediante el uso de la computación en grupo paralelo o Grid (Ranganathan et al. 2006).

Disponibilidad de software

REPCLASS 1.0 está disponible como un paquete basado en UNIX descargable en http://www3.uta.edu/faculty/cedric/repclass.htm, con documentación completa, incluida la guía del usuario e instrucciones para la instalación, configuración inicial y filtrado. El paquete y el código fuente también están disponibles como software de código abierto a través de http://sourceforge.net/projects/repclass/.

RepeatScout y filtrado

La versión 1.0.5 de RepeatScout (RepeatScout Price et al. 2005) se descargó de http://bix.ucsd.edu/repeatscout/ y se ejecutó con los parámetros predeterminados. La salida de RepeatScout consiste en una biblioteca de secuencias de consenso para cada una de las familias repetidas identificadas. Antes de ejecutar REPCLASS, se aplican tres filtros diferentes a la salida de RepeatScout. Primero, Tandem Repeats Finder versión 4.0 (Benson 1999 http://tandem.bu.edu/trf/trf.html) y nseg (Wootton y Federhen 1996 ftp://ftp.ncbi.nih.gov/pub/seg/nseg ) se utilizan para eliminar secuencias consenso compuestas predominantemente o en su totalidad por repeticiones en tándem, SSR y otras repeticiones de baja complejidad. En este estudio, descartamos todas las secuencias enmascaradas como SSR / baja complejidad para más del 70% de su longitud. En segundo lugar, filtramos las secuencias consenso repetidas de longitud menor o igual a 100 pb porque el tamaño de los ET conocidos generalmente excede los 100 pb (ver Resultados). Consideramos que este punto de corte es el umbral mínimo que debe aplicarse a cualquier genoma, independientemente del tamaño del genoma y el número de secuencias consenso repetidas. Sin embargo, un umbral más alto puede ser apropiado para genomas que son más grandes y contienen un mayor número de repeticiones. Para facilitar la tarea de determinar el umbral de longitud más apropiado para el panorama genómico analizado, REPCLASS genera un gráfico de distribución de longitud de repetición para las secuencias compiladas en el archivo de consulta de entrada. Un ejemplo de la distribución de longitud de repetición para la biblioteca RepeatScout obtenida para C. elegans se muestra en la figura complementaria 4 (Material complementario en línea). El tercer y último filtro se basa en el número de copias por familia repetida. En principio, cuando se ejecuta RepeatScout con los parámetros predeterminados, no se informa de las repeticiones presentes en menos de 10 copias. Sin embargo, el recuento de repeticiones determinado por RepeatScout puede incluir fragmentos de repetición muy pequeños y es posible que no refleje con precisión el número de copias de buena fe de las familias de TE. Por lo tanto, aplicamos un segundo filtro basado en una estimación más estricta del número de copias basada en una búsqueda BlastN del genoma objetivo con cada repetición de consenso como una consulta utilizando el paquete WU-Blast. Contamos todos esos aciertos como copias válidas cuando abarcan al menos la mitad de la longitud de la secuencia de consulta con una similitud de nucleótidos ≥80%. Este límite es similar al utilizado tradicionalmente para definir las familias de TE (Feschotte y Pritham 2007a Wicker et al. 2007). Para ayudar al usuario a determinar el límite del número de copias para este paso de filtrado, REPCLASS genera un gráfico de la distribución del número de copias de las secuencias de consulta contenidas en la biblioteca de entrada. Un ejemplo de la gráfica obtenida para el C. elegans La biblioteca RepeatScout se muestra en la figura complementaria 5 (Material complementario en línea). En el presente estudio, solo conservamos familias repetidas con un número de copias superior a 10. El valor de corte puede variar según el tamaño del genoma y el contenido general de repetición del genoma analizado.

Datos de la secuencia del genoma

Los detalles sobre las secuencias del genoma analizadas en este estudio se proporcionan en la tabla complementaria 1 (Material complementario en línea), incluido el tamaño del genoma, la versión del ensamblaje analizado, la cobertura del genoma completo (WGS), los centros de secuenciación que producen la secuencia y el ensamblaje, y referencias relacionadas. . Todos los ensamblajes de secuencias se descargaron del NCBI o del Genome Browser de la Universidad de California-Santa Cruz (UCSC) o del Broad Institute.


Contenido

En la gran matriz de rDNA, los polimorfismos entre las unidades de repetición de rDNA son muy bajos, lo que indica que las matrices de rDNA en tándem están evolucionando a través de una evolución concertada. [2] Sin embargo, el mecanismo de evolución concertada es imperfecto, de modo que los polimorfismos entre las repeticiones dentro de un individuo pueden ocurrir en niveles significativos y pueden confundir los análisis filogenéticos de organismos estrechamente relacionados. [4] [5]

Secuencias de repetición en tándem 5S en varios Drosophila se compararon entre sí, el resultado reveló que las inserciones y deleciones ocurrieron con frecuencia entre especies y, a menudo, flanqueadas por secuencias conservadas. [6] Pueden ocurrir por deslizamiento de la hebra recién sintetizada durante la replicación del ADN o por conversión de genes. [6]

Los tractos de transcripción de ADNr tienen una baja tasa de polimorfismo entre especies, lo que permite la comparación interespecífica para dilucidar la relación filogenética utilizando solo unas pocas muestras. Las regiones codificantes de ADNr están muy conservadas entre las especies, pero las regiones ITS son variables debido a inserciones, deleciones y mutaciones puntuales. Entre especies remotas como el ser humano y la rana, la comparación de secuencias en los tractos ITS no es apropiada. [7] Las secuencias conservadas en las regiones codificantes de rDNA permiten comparaciones de especies remotas, incluso entre levaduras y humanos. El ARNr 5.8S humano tiene un 75% de identidad con el ARNr 5.8S de levadura. [8] En los casos de especies hermanas, la comparación del segmento de ADNr, incluidos los tractos ITS entre las especies, y el análisis filogenético se realizan satisfactoriamente. [9] [10] Las diferentes regiones de codificación de las repeticiones de rDNA suelen mostrar distintas tasas de evolución. Como resultado, este ADN puede proporcionar información filogenética de especies pertenecientes a amplios niveles sistemáticos. [11]

Un fragmento de ADNr de levadura que contiene el gen 5S, ADN espaciador no transcrito y parte del gen 35S tiene una actividad estimulante de la recombinación mitótica localizada que actúa en cis. [12] Este fragmento de ADN contiene un hotspot de recombinación mitótica, denominado HOT1. HOT1 expresa actividad estimulante de la recombinación cuando se inserta en ubicaciones novedosas en el genoma de la levadura. HOT1 incluye un promotor de transcripción de ARN polimerasa I (PolI) que cataliza la transcripción del gen de ARNr ribosómico 35S. En un mutante defectuoso de PolI, se suprime la actividad estimulante de la recombinación del hotspot HOT1. El nivel de transcripción de PolI en HOT1 parece determinar el nivel de recombinación. [13]

Las enfermedades pueden asociarse con mutaciones del ADN en las que el ADN puede expandirse, como la enfermedad de Huntington, o perderse debido a mutaciones por deleción. Lo mismo ocurre con las mutaciones que ocurren en las repeticiones de rDNA. Se ha encontrado que si los genes que están asociados con la síntesis de ribosomas se alteran o mutan, puede resultar en diversas enfermedades asociadas con el esqueleto o la médula ósea. Además, cualquier daño o alteración de las enzimas que protegen las repeticiones en tándem del ADNr puede resultar en una menor síntesis de ribosomas, lo que también conduce a otros defectos en la célula. Las enfermedades neurológicas también pueden surgir de mutaciones en las repeticiones en tándem de rDNA, como el síndrome de Bloom, que ocurre cuando el número de repeticiones en tándem aumenta cerca de cien veces en comparación con el número normal de repeticiones en tándem. También pueden nacer varios tipos de cánceres a partir de mutaciones de las repeticiones en tándem en el ADN ribosómico. Las líneas celulares pueden volverse malignas por un reordenamiento de las repeticiones en tándem o una expansión de las repeticiones en el ADNr. [14]


Genética actual

El ADN eucariota y también humano contiene una gran parte de secuencias no codificantes. En cuanto al ADN codificante, el ADN no codificante puede ser único o en copias más idénticas o similares. Las secuencias de ADN con un elevado número de copias se denominan secuencias repetitivas. Si las copias de un motivo de secuencia se encuentran adyacentes entre sí en un bloque o una matriz, estamos hablando de repeticiones en tándem, las secuencias repetitivas dispersas por todo el genoma como unidades individuales flanqueadas por una secuencia única son repeticiones intercaladas.

La naturaleza de las repeticiones intercaladas: elementos transponibles

La mayoría de las repeticiones intercaladas se originan mediante un proceso de transposición, que consiste en "saltar" de un segmento de ADN a otro lugar del genoma. Básicamente, existen dos tipos de elementos de ADN transponibles o transposones: transposones de ADN y retrotransposones. Las principales clases de repeticiones intercaladas con capacidad de transposición se muestran en la fig. 1.

Transposones de ADN

Se considera que los transposones de ADN están inactivos en el genoma humano debido a la acumulación de mutaciones durante la filogénesis de los vertebrados, por lo que solo podemos encontrar sus restos antiguos o "fósiles". Sin embargo, el transposón activo derivado de los elementos fósiles humanos se puede diseñar con la información recopilada de los genomas humanos y de otros vertebrados. Un ejemplo es el transposón de la Bella Durmiente, que es un componente prometedor de la terapia génica de próxima generación, debido a su sitio de integración más específico (que el observado, por ejemplo, para los retrovirus). ¿Cómo funciona un transposón de ADN típico? El núcleo del elemento transponible codifica una enzima transposasa. Esta enzima se une a los extremos del elemento. Los extremos del transposón están formados por repeticiones invertidas, que por lo tanto pueden intercambiar hebras de ADN y estabilizar la estructura de tallo-bucle necesaria para la acción de la transposasa. La transposasa luego corta el transposón y liga los extremos del ADN cromosómico libre resultante. [Se emplea un mecanismo casi idéntico durante la maduración de los genes de inmunoglobulina (recombinación V-D-J) y TCR (receptor de células T) para la escisión de las secuencias intermedias. Curiosamente, la enzima que cataliza esta reacción (hecha de dos componentes RAG1 y RAG2) de hecho probablemente evolucionó a partir de una transposasa.] El complejo libre transposón-transposasa se une a un motivo de secuencia específico en otra parte del genoma, la transposasa escinde el ADN del hospedador y liga el transposon al nuevo lugar. Por lo tanto, el transposón se mueve mediante un mecanismo de cortar y pegar y el número de copias permanece estable.

Retrotransposones

Los retrotransposones son los elementos transponibles más importantes del genoma humano. Primero, son mucho más abundantes, formando directamente al menos el 45% del genoma humano (las estimaciones varían, pero la mayoría de los investigadores cree que debe ser aún más, ya que los antiguos retrotransposones que han sido inactivados han divergido por mutación hasta el punto de que donde no son identificables). En segundo lugar, los retrotransposones todavía están activos en el genoma humano.

Para saltar, requieren polimerasas de ARN celulares (II o III) mediante las cuales se transcriben en ARN, mientras que la copia de ADN original se mantiene en el mismo lugar. La copia de ARN se transcribe de forma inversa en ADN y el ADN se inserta en el genoma en una nueva ubicación. Por lo tanto, estos elementos se expanden en número mediante un mecanismo de duplicación (copiar y pegar). Como se describe para el retrotransposón L1, el proceso de retrotransposición es propenso a varios errores, por lo que las nuevas copias de un retrotransposón se inactivarían en gran medida debido al truncamiento o mutación puntual. Debido a que la mayoría de las copias de transposones están inactivas, la expansión adicional de la familia de los retrotransposones está gobernada por los pocos elementos activos de longitud completa. Sin embargo, incluso si todos los elementos activos se perdieran más tarde durante la evolución, el genoma podría estar literalmente invadido por los miembros fósiles de la familia de secuencias.

Los retrotransposones se pueden clasificar además en autónomos y no autónomos. Los retrotransposones autónomos codifican las proteínas necesarias para su transposición, aunque también dependen de las ARN polimerasas del hospedador y de las enzimas reparadoras del ADN para un salto exitoso. Los retrotransposones no autónomos no codifican ninguna proteína y deben secuestrar las enzimas de otros transposones para poder realizar la transposición.

Retrotransposones LTR - Retrovirus endógenos

Los retrovirus endógenos, también llamados retrotransposones LTR, se asemejan a los provirus de los retrovirus verdaderos en la composición: contienen repeticiones terminales largas (LTR), genes gag, pol, env y prt, pero al menos una de las proteínas necesarias para el ensamblaje de partículas virales infecciosas es mutado o realmente ausente, env en particular. Por tanto, los retrovirus endógenos solo pueden moverse dentro de las células; de lo contrario, su ciclo de vida es similar al de los retrovirus infecciosos, p. Ej. Virus del VIH. Aunque los retrovirus endógenos son activos en muchos mamíferos, incluido el chimpancé, los seres humanos actualmente solo contienen fósiles (mutados e incapaces de transposición), que ocupan aproximadamente el 8% del genoma. Los retrovirus endógenos de longitud completa suelen tener una longitud de 7-9 kb, pero como en el caso de L1 (ver más adelante), muchos están truncados, especialmente en el extremo 5 . Con frecuencia, solo podemos encontrar LTR independientes, como resultado de la inserción retroviral y la posterior recombinación intracromosómica entre las LTR o la recombinación desigual de los cromosomas homólogos, lo que lleva a la deleción de la parte codificante del retrovirus (fig. 5).

Retrotransposones no LTR

Los LINE (elementos nucleares intercalados largos) son retrotransposones autónomos. Comprenden aproximadamente el 21% del genoma humano. Los elementos activos pertenecen a la familia LINE-1 o L-1 más abundante, que por sí sola comprende el 17% del genoma. De aproximadamente medio millón de L1 en nuestro genoma, cerca de 10,000 son de longitud completa y alrededor de 100 todavía son capaces de retrotransposición. El elemento L1 activo tiene una longitud aproximada de 6 kb y contiene dos marcos de lectura abiertos, ORF1 y ORF2. La 5 UTR (región no traducida) también funciona como un promotor, la 3 UTR contiene la señal poliA. La función de ORF1 no está clara, solo se sabe que se une al ARNm de L1, ORF2 contiene transcriptasa inversa y dominio de endonucleasa y es la enzima responsable de la integración. El ciclo de vida de L1 comienza con la transcripción del ADN de L1 por la ARN polimerasa II celular y la maduración estándar en una molécula de ARNm. El ARNm de L1 se transporta al citoplasma y se traduce ORF1. Luego, la traducción se reinicia en un sitio de entrada ribosómico interno (IRES) para traducir ORF2 (proceso no canónico e ineficaz en eucariotas, por lo que solo una parte de los ARNm de L1 obtienen su proteína ORF2). Ambas proteínas se unen inmediatamente al ARNm de L1. Este complejo proteína-ARNm se transporta al núcleo. ORF2 corta el ADN cromosómico en el sitio objetivo (el sitio objetivo no es absolutamente específico como es cierto para las endonucleasas de restricción, pero existe cierta preferencia por las secuencias ricas en AT, el sitio de escisión es aproximadamente TT / AAAA). El corte de ADN es desigual (creando extremos pegajosos). El grupo 3OH libre en un lado, la molécula de ADN escindida es utilizada por la transcriptasa inversa de ORF2 para cebar la síntesis de la primera hebra de ADNc (transcripción inversa cebada por diana). El mecanismo detallado de la síntesis de la segunda cadena de ADNc todavía está sujeto a discusión, pero el proceso termina con la integración estable del ADN de L1 de doble cadena en un nuevo lugar del genoma. Debido a la rotura escalonada del ADN producida por la endonucleasa del transposón, el elemento L1 integrado está flanqueado por una duplicación del sitio diana de 7 a 20 pb (figura 2). La transcriptasa inversa a menudo es incapaz de terminar la síntesis de la primera hebra, lo que resulta en el truncamiento de la copia recién formada (Fig. 3A). La transcriptasa inversa también carece de actividad de corrección de pruebas (endonucleasa 3 a 5), ​​lo que a menudo introduce una mutación en la nueva copia.Curiosamente, el ARNm de L1 se expresa predominantemente en espermatocitos meióticos y posmeióticos, lo que aumenta el potencial de L1 para la expansión de copias (las copias introducidas en la línea germinal pueden heredarse, a diferencia de los eventos de transposición somática).

Retrotransposones no autónomos - SINE

Los elementos nucleares cortos intercalados de SINE tienen típicamente menos de 500 pb de longitud y no tienen potencial de codificación de proteínas. La principal familia SINE en humanos está formada por elementos Alu (el nombre se deriva de su descubrimiento basado en un par de sitios de restricción AluI conservados). Los más de 1 millón de elementos Alu en el genoma humano representan aproximadamente el 11% de su masa.

Los elementos Alu comparten un consenso de 282 pb, que está relacionado con la subunidad de ARN SRP (partícula de reconocimiento de señales) (llamada ARN 7SL) y se presume que se derivó de ella. SRP es un complejo ribonucleo-proteico, que reconoce el péptido señal, se une a él y transloca el complejo ribosoma-mRNA-péptido naciente al canal del retículo endoplásmico (RE), a través del cual la proteína naciente se transloca al lumen del RE o se integra en la membrana. . Alus son, como el gen de ARN 7SL, transcrito por la ARN polimerasa III. Alu RNA puede unirse a dos proteínas SRP (9 y 14). Presumiblemente, Alu puede unirse a los ribosomas y, por su cola poliA, puede unirse (si el ribosoma simplemente traduce el ARNm de LINE-1) a la proteína ORF2 naciente, y forzar a la proteína ORF2 a realizar una transcripción inversa e integrar su ARN y no el LINE-1. ARNm (figura 4).

Función de los elementos transponibles

Desde el punto de vista inmediato, los transposones no tienen una función necesaria en la célula - denominada ADN basura "o" ADN egoísta ", ya que los transposones se propagan en nombre de los recursos celulares. En una escala más amplia, la motilidad de los elementos retrotransponibles puede ser importante para la plasticidad del genoma. La inserción ocasional en genes puede alterar la función del gen y causar una enfermedad hereditaria (Fig. 3C). Los elementos LTR y LINE también pueden cambiar la expresión génica, si se insertan cerca de un gen, ya que LTR y LINE 5 UTR tienen fuertes actividad promotora en ambas direcciones (Fig. 3F).

Debido a que el retrotransposón LINE-1 tiene una señal de poliadenilación relativamente débil, sucede que la ARN polimerasa II lo lee, uniendo la secuencia de ADN flanqueante al ARNm de L1, que luego se retrotranscribe y se mueve a una nueva posición. Entonces, LINE-1 puede ser un vector para la mezcla de ADN. Como las copias retrotranspuestas de L1 a menudo se truncan en 5, el ADN movilizado puede moverse a una nueva posición incluso sin ninguna secuencia del vector L1. Esto podría ser importante para mezclar fragmentos de ADN más pequeños, como para el intercambio de exones entre genes (Fig. 3D).

La retrotransposición de L1 puede conducir incluso a deleciones e inversiones, como se muestra en la fig. 3E.

Muy raramente, un ARNm celular está sujeto a transcripción inversa y transposición por una enzima de L1 u otros retrotransposones. En este caso, el gen está duplicado. La nueva copia se denomina pseudogén procesada, ya que se deriva de ARNm procesado que carece de intrones y, por lo general, no es funcional debido a la falta de un promotor (Fig. 3B). Rara vez un pseudogén procesado puede adoptar una función bajo presión selectiva. Un ejemplo bien conocido es el gen de la piruvato deshidrogenasa, subunidad E1 alfa. Este gen (PDHA1) está en el cromosoma X en mamíferos euterios. Pero la expresión de muchos genes que residen en el cromosoma X se detiene durante la espermatogénesis, incluido PDHA1, aunque es esencial para la función de todas las células. Esta función ausente aparentemente fue rescatada por retrotransposición (hay un gen PDHA2 estrechamente relacionado en el cromosoma 4) y este gen no tiene intrones, una característica típica de los pseudogenes procesados. Los genes de mantenimiento altamente expresados ​​tienen, por supuesto, una mayor probabilidad de retrotransposición. Por lo tanto, encontramos muchos pseudogenes procesados ​​para proteínas ribosómicas, enzimas glucolíticas, beta-actina, etc. Los pseudogenes procesados ​​no deben confundirse con pseudogenes "ordinarios", que surgieron por duplicaciones del ADN genómico (por ejemplo, pseudogenes en el grupo de hemoglobina) y, por lo tanto, retienen el gen original. estructura (exones, intrones, promotor,. aunque con función alterada). Se descubrieron varios genes derivados directamente de un retrotransposón. La última incorporación es el gen Peg10 (expresado paternalmente 10) que se deriva de un retrotransposón LTR de la familia Ty3 / gypsy (el retrotransposón más similar se encontró en forma activa en peces fugu ). Peg10 es necesario para el desarrollo placentario en ratones, lo mismo probablemente sería cierto para los humanos. Otros ejemplos incluyen genes de sincitina derivados de retrovirus endógenos de la familia HERV-W. Estos son importantes en la formación de sincitios a partir de las células del trofoblasto, el mecanismo de fusión de la membrana de hecho se asemeja a la entrada retroviral a la célula.

Incluso los elementos repetidos inactivos aumentan la plasticidad del genoma al promover el entrecruzamiento desigual intercromosómico o la recombinación intracromosómica, lo que conduce a deleciones / duplicaciones o inversiones (fig. 5).

Por último, pero no menos importante, se especula que los transposones tienen alguna función fisiológica real, ya que, p. Ej. su expresión se regula al alza durante la respuesta al estrés. Pero las diversas hipótesis que pueden extraerse de esta observación están lejos de ser dilucidas.

Repeticiones en tándem

Las repeticiones en tándem están formadas por unidades repetidas sucesivas idénticas o casi idénticas (degeneradas). Varían tanto en la longitud de la unidad de repetición como en la duración de la repetición total, por lo que no todas las clasificaciones son satisfactorias y deben tomarse "cum grano salis". Las repeticiones más grandes, que tienden a estar compuestas por unidades de repetición grandes, se denominan satélites. El nombre de satélites proviene de la centrifugación del ADN en gradientes de densidad. En primer lugar, durante los métodos convencionales de aislamiento de ADN, el ADN está sujeto a un esfuerzo cortante, con la fragmentación resultante del ADN (tenga en cuenta que in vivo un cromosoma de la fase G1 contiene 1 molécula de ADN). Estos fragmentos se pueden centrifugar luego en gradientes de densidad para que las moléculas de ADN ocupen lugares en el gradiente con la misma densidad que la molécula de ADN. La masa de ADN formará una banda. Pero los fragmentos de ADN con contenido de CG / AT significativamente diferente causaron e. gramo. por grandes repeticiones monótonas formarán bandas "satélite" menores. La denominación de ADN satélite se amplió más tarde para incorporar secuencias repetitivas similares que no forman estas bandas satélite. Las unidades de repetición primarias de los satélites son varias, desde GGAAT que se encuentra en los satélites 2 y 3 hasta 171 pb en el satélite alfa. Pero estas unidades primarias a menudo están degeneradas y contienen ciertas irregularidades. Estas irregularidades pueden ser periódicas, formando así unidades de repetición secundarias. El ADN satélite es abundante en los centrómeros y la heterocromatina constitutiva. Aunque el genoma humano se considera completamente ensamblado, las regiones del centrómero y las secuencias satélite que contienen heterocromatina no están incluidas, ya que la secuenciación de tales regiones es desafiante por varias razones (ausencia de sitios de restricción, secuenciación difícil, ensamblaje de contig casi imposible). De los diversos satélites que se encuentran en o cerca del centrómero, una familia de repetición de satélite alfa (con unidad primaria de 171 pb) probablemente forma el núcleo funcional de los centrómeros, ya que son importantes para el ensamblaje del cinetocoro durante la división celular (algunas proteínas del cinetocoro se unen al alfa -satelital en el centrómero y, por lo tanto, el ensamblaje del cinetocoro nucleado). Se desconoce la función de otros satélites, considerados principalmente como ADN basura.

Minisatélites son repeticiones en tándem más cortas, en el rango de kb, que están enriquecidas en regiones subteloméricas de los cromosomas. A menudo son muy polimórficos en cuanto al número de unidades repetidas en una repetición (muchos alelos en la población) y se pueden usar como marcadores genéticos: VNTR, número variable de repeticiones en tándem. Los VNTR a menudo son demasiado grandes para amplificarse mediante PCR y, por lo tanto, normalmente se analizan mediante transferencia Southern. A veces, se plantea la hipótesis de que ciertos minisatélites tienen funciones reguladoras, como p. Ej. un VNTR en el promotor de insulina, donde la duración diferente de la repetición se asoció con diferentes tipos de diabetes. Un alelo de la insulina VNTR se muestra en la fig. 7. Los telómeros de los cromosomas humanos, formados por varias kilobases de la repetición hexámera TTAGGG, pertenecen también a la gama de minisatélites de repeticiones en tándem, aunque surgen por un mecanismo específico: la enzima telomerasa. La telomerasa está compuesta por una subunidad proteica con actividad de transcriptasa inversa y una subunidad de ARN con una secuencia complementaria a TTAGGG, que sirve como molde para el alargamiento de los telómeros (la subunidad de la proteína telomerasa está relacionada con la transcriptasa inversa de retrotransposones no LTR). Sin embargo, los telómeros pueden alargarse incluso mediante el mecanismo general pasivo de entrecruzamiento desigual (ver fig. 5D), p. en las células cancerosas.

Quizás conviene señalar aquí una vez más, que la secuencia del genoma humano comprende las regiones eucromáticas, limitadas proximalmente, pero sin incluir los centrómeros y la heterocromatina pericentromérica, y distalmente por los telómeros, que además, junto con las regiones subteloméricas, no están incluidas.

Microsatélites tienen unidades de repetición típicamente de 1 a 5 pb, con una longitud de repetición que rara vez excede los cientos de repeticiones en orden. La familia más común de estas repeticiones son las repeticiones de 2 pb, de las cuales prevalecen las repeticiones (CA) n. Los microsatélites son muy comunes en el genoma, muy polimórficos y se utilizan muy a menudo como marcadores genéticos. En el capítulo que trata sobre la vinculación se encuentran ejemplos de tales marcadores genéticos.

Enfermedades por expansión de trinucleótidos

Si está en los genes o cerca de ellos, la longitud de los microsatélites puede tener profundas consecuencias, p. Ej. en las llamadas enfermedades de expansión de trinucleótidos, un grupo de síndromes mendelianos hereditarios heterogéneos. El ejemplo más conocido es la corea de Huntington, una enfermedad neurológica mortal con inicio en la edad adulta que se presenta como demencia y deterioro del control del movimiento extrapiramidal. En el gen de la huntingtina, hay una secuencia repetida CAG, que codifica un tramo de residuos de glutamina (tracto de poliglutamina) en la proteína de la huntingtina. Normalmente, las personas tienen menos de 20 trinucleótidos CAG y, en consecuencia, glutaminas en la huntingtina, donde sirve como un dominio importante para la interacción proteína-proteína. Sin embargo, si por mutación este número se expande a más de 30 glutaminas, la proteína no funciona correctamente, lo que resulta en la muerte progresiva de neuronas en el núcleo caudatus. En otra enfermedad de expansión de trinucleótidos, distrofia miotónica (distrofia muscular con debilidad muscular acompañada paradójicamente de aumento del tono muscular), la expansión patológica del trinucleótido CTG tiene lugar en la región 3 no traducida de DMPK (distrofia miotónica proteína quinasa). El propio ARNm mutante tiene, por tanto, el potencial patológico y probablemente causa estragos a través del secuestro de varios factores de transcripción. Para ver otros ejemplos de enfermedades de "expansión", consulte el capítulo Herencia no mendeliana.

Mecanismos de expansión / contracción repetida en tándem

El primer mecanismo que contribuye al polimorfismo de la longitud de repetición en tándem es el cruce desigual. Eso es típico en particular para las repeticiones más grandes (Fig. 5D). Las repeticiones de microsatélites pequeños a menudo cambian su longitud por errores de síntesis de ADN, p. gramo. un mecanismo denominado deslizamiento de la polimerasa (Fig. 8). En el frente de la replicación, la doble hélice del ADN aún no es extremadamente estable y está sujeta a fluctuaciones térmicas sustanciales. Si la polimerasa simplemente se replica en el microsatélite, es posible que las cadenas de ADN no se vuelvan a asociar exactamente (durante las fluctuaciones), sino con un cambio de varias unidades repetidas. Este mecanismo se mejora en algunos tipos de repeticiones que pueden estabilizar los estados de transición formando bucles de doble hebra, p. el trinucleótido CAG / CTG.

Enlaces

Las secuencias repetitivas se almacenan en una base de datos central, Repbase (desafortunadamente, el uso directo de RepBase solo es posible para instituciones académicas). http://www.girinst.org/

También existen bases de datos especializadas, que cubren solo algunos aspectos, como la base de datos de retrovirus endógenos humanos. http://herv.img.cas.cz/

RepeatMasker es un programa informático que realiza la identificación de secuencias repetitivas utilizando Repbase y, finalmente, su enmascaramiento en la secuencia (por ejemplo, para facilitar el descubrimiento de genes). http://www.repeatmasker.org/cgi-bin/WEBRepeatMasker

SRPDB (base de datos de partículas de reconocimiento de señales) proporciona secuencias y estructuras relacionadas con las funciones de SRP. http://psyche.uthct.edu/SRPDB/SRPDB.html

AluGene es una base de datos de elementos Alu incorporados en genes codificadores de proteínas http://alugene.tau.ac.il/

L1Xplorer es una base de datos dedicada a la detección y anotación de elementos L1 intactos de longitud completa http://l1xplorer.molgen.mpg.de

Enlaces

Fig.1: Varias clases de transposones que se encuentran en el genoma humano.
A: retrotransposones no LTR. Las LÍNEAS (repeticiones largas intercaladas) están representadas por LÍNEA-1 (L1). El elemento de 6 kb contiene dos marcos de lectura abiertos. El ORF2 contiene endonucleasa (en), dominio de transcriptasa inversa (rvt) así como un dominio rico en cisteína (rico en C). La región no traducida 5 (5 UTR) también contiene el promotor interno de la ARN polimerasa II (en un gen habitual, el promotor está aguas arriba de la 5 UTR). La región 3 no traducida (3 UTR) contiene la señal de poliadenilación canónica (AATAAA) y una cola de poliA (que normalmente también está ausente de los genes ordinarios y solo se agrega al ARNm por acción de la polimerasa poliA). L1 está flanqueada por la duplicación del sitio objetivo (TSD) que surge durante la transcripción inversa cebada por el objetivo.
B: LTR-retrotransposón - retrovirus endógeno. Se representa una estructura típica de un retrovirus, o más precisamente de un provirus, la forma integrada en el ADN. Los retrovirus endógenos se pueden distinguir de los infecciosos solo por medio de mutaciones puntuales o deleciones en los genes necesarios para el ensamblaje de partículas infecciosas; en la mayoría de los casos, es el gen env (envoltura). gag (antígeno específico de grupo) es la proteína de la nucleocápside. pol (polimerasa) tiene la actividad de transcriptasa inversa (rvt) para la síntesis de ADN de la primera y segunda hebra, actividad RnasaH para la escisión del RNA en el híbrido RNA / DNA después de la síntesis de la primera hebra y actividad de integrasa (int) (escinde el DNA diana y liga el retrovirus en el sitio escindido). prt (proteasa) es indispensable para el ensamblaje de virus mediante precursores de proteínas de escisión traducidos a partir de ARNm de retrovirus (por ejemplo, gag y pol a menudo se traducen como una poliproteína grande). Las LTR (repeticiones terminales largas) son secuencias idénticas en los extremos del retrovirus. Cada LTR se compone de U3 (región no traducida 3 ), R (región de recombinación) y U5 (región no traducida 5 ). Esto se deriva de la estructura del ARNm del retrovirus, que se extiende solo desde la cadena R hacia arriba a la cadena R. Aunque los retrovirus endógenos se transcriben de forma inversa en el citoplasma, por lo que los mecanismos de integración en teoría no requieren duplicaciones de sitios diana, estos a menudo se forman, aunque más cortos que en L1.
C: el transposón de ADN está representado por la familia de marineros de 1,2 kb. El transposón de ADN sintético La Bella Durmiente también pertenece a esta familia. La región central de la transposasa está flanqueada por repeticiones invertidas. Tras la integración, se forma la duplicación del sitio diana a partir del ADN del huésped. La duplicación del sitio objetivo se deja en el genoma como una firma de transposón, cuando el transposón salta a otro lugar.
D: los retrotransposones no LTR no autónomos pertenecen al SINE (repetición corta intercalada). La subfamilia activa en humanos está representada por un elemento Alu típico de 282 pb. Alu es un atenuador compuesto por dos monómeros casi idénticos (gris claro e intermedio). El monómero de la izquierda tiene una deleción del cuadro gris oscuro. El monómero se deriva del gen de ARN 7SL, que codifica la subunidad de ARN de SRP (partícula de reconocimiento de señales). SRP es un péptido señal de reconocimiento complejo de las Sproteínas que se van a transportar a la luz o membrana del retículo endoplásmico. ¡Tenga en cuenta que el gen 7SL se dibuja en una escala del 50%! La región PolyA de Alu no es parte del gen 7SL, pero es importante para el éxito de Alu en la retrotransposición.

Figura 2. Transcripción inversa cebada por objetivo (TPRT)
La proteína ORF2 escinde primero una hebra de ADN en la diana (la secuencia diana es rica en A + T y la secuencia suele ser similar a la TTAAAA de consenso, la escisión se produce entre T y A en la hebra complementaria). La hebra escindida se disocia y se une a la cola poliA del ARNm de L1 (línea discontinua naranja). El grupo 3 OH libre de la cadena de ADN ceba la síntesis de la primera cadena de ADNc. La escisión de la segunda hebra de ADN se produce de 7 a 20 nt aguas abajo del primer corte y el grupo 3 OH libre generado por este evento se utiliza para cebar la síntesis de la segunda hebra de ADNc de L1. El mecanismo de síntesis de la segunda hebra no está completamente aclarado. Todo el proceso termina con la formación de una nueva copia de ADN de L1, flanqueada por la duplicación del sitio objetivo.

Figura 3. LINE-1 altera el genoma de varias formas
A: Retrotransposición en cis. L1 hace copias retrotranspuestas de sí mismo. Las copias pueden estar completas, o más a menudo 5 truncadas o 5 truncadas con inversión. B: La proteína ORF2 de L1 puede retrotransponer elementos SINE (como Alu) u otros ARNm celulares, creando pseudogenes procesados ​​(Retrotransposición en trans). Los exones codificantes están representados por recuadros marrones, 5 y 3 UTR (regiones no traducidas) están en un color más claro, el empalme de exones en mRNA indicado por líneas discontinuas. C: El retrotransposón puede insertarse en un gen. La inserción en el exón generalmente conduce a la interrupción del marco de lectura abierto y al truncamiento de la proteína (el asterisco representa el lugar de un nuevo codón de terminación). Pero incluso la inserción en un intrón puede tener consecuencias perjudiciales, p. Ej. omisión de exón o creación de un nuevo exón, que a menudo también interrumpe la proteína. La inserción de retrotransposones es una causa bien documentada de varias enfermedades hereditarias. Los elementos que se insertan con mayor frecuencia son elementos Alu, seguidos de L1. D: 3 transducción. L1 tiene una señal de poliadenilación relativamente débil. Por lo tanto, la ARN polimerasa puede leer y transcribir también un segmento de ADN del cromosoma flanqueante. Este ARNm híbrido luego se retrotranspone, lo que resulta en el movimiento de L1 (que, sin embargo, generalmente está parcialmente truncado en 5 ° o incluso completamente eliminado) y el ADN que lo flanquea. Este puede ser un mecanismo de intercambio de exones entre genes. MI: La inserción de un retrotransposón suele ir acompañada de un reordenamiento; en este caso, la eliminación del segmento verde y la inversión del segmento rojo que incluye un exón, con la consiguiente omisión de este exón durante el empalme. F: El promotor L1 puede promover la transcripción no solo de su propio elemento, sino también de los genes vecinos, tanto en sentido ascendente como descendente.

Figura 4 Las secuencias de Alu son hiperparásitos
A: Estructura del gen de ARN 7SL y elemento Alu (izquierda) y estructura secundaria de las respectivas moléculas de ARN (derecha). La transcripción del gen de ARN 7SL está dirigida por el promotor interno de la ARN polimerasa III (A) y el potenciador (EN). El gen Alu tiene un promotor interno compuesto (A + B). El terminador natural de la ARN polimerasa III es el tetranucleótido TTTT. La transcripción se interrumpe después de los primeros tres T. El ARN 7SL se compone del dominio Alu (azul) y el dominio S (amarillo). Las proteínas SRP 9 y 14 se unen al dominio Alu, que sirve para el anclaje al ribosoma. Otras proteínas se unen al dominio S, incluida la proteína 54, que colabora en el reconocimiento del péptido señal (línea roja). Alu RNA está formado básicamente por dos dominios Alu de 7SL RNA, con la adición de una secuencia poliA.
B: Alu RNA se une al ribosoma.Si el ribosoma simplemente está traduciendo el ORF2 del ARNm de LINE-1 (línea verde), la cola poliA del elemento Alu compite con la cola poliA de L1 por la unión del ORF2 naciente. Las proteínas de unión a poliA median la interacción. Si ORF2 se une a Alu, ORF2 traducirá y transpondrá inversamente Alu en lugar de L1 y, por lo tanto, será parásito en L1. Si consideramos a L1 como un parásito genómico, Alu es un hiperparásito - i. mi. parásito del parásito. Otros ARNm celulares (línea azul) pueden competir con el ARNm de L1 por la unión de ORF2 también, aunque con una eficiencia mucho menor (se estima que de 3000 retrotransposiciones de L1, 300 serían secuestrados por elementos Alu y solo cca 1 por otro ARNm.

Figura 5. Las repeticiones promueven reordenamientos genómicos.
A + B: región genómica que contiene repeticiones directas (en la misma dirección, la misma secuencia en la misma hebra de ADN). Las dos repeticiones pueden emparejarse y recombinarse. La recombinación intracromosómica (A) conduce a la deleción. Se pierde un hipotético fragmento circular: no posee centrómero. El entrecruzamiento desigual con la recombinación intercromosómica resultante (B) provoca deleción y duplicación.
C: La recombinación intracromosómica entre dos repeticiones invertidas (en la dirección opuesta, la misma secuencia está en la hebra de ADN opuesta) conduce a la inversión de la secuencia de ADN que interviene. Las consecuencias funcionales de tales reordenamientos dependen del contexto, de silenciosas a letales, como es de esperar.
D: Los polimorfismos de repetición en tándem pueden surgir por cruces desiguales.

Figura 6. Satélites
A: unidades primarias y unidades de orden superior (secundarias) de repetición en tándem. Probable "historia evolutiva" de las repeticiones, ejemplificada por la secuencia GGAAT. Esta secuencia se multiplica y forma así una repetición monótona perfecta. Algunas posiciones luego se someten a mutación (rojo) creando una repetición imperfecta (degenerada). Luego, la secuencia se vuelve a multiplicar, pero ahora varias unidades degeneradas se multiplican juntas como una unidad, creando así una repetición perfecta de esta unidad secundaria más grande (flecha). La secuencia GGAAT es la base de los satélites humanos 2 y 3. Estos satélites se diferencian por la unidad secundaria.
B: Estructura del cromosoma mitótico humano con respecto a secuencias satélite. El satélite alfa forma heterocromatina en el núcleo del centrómero. Además de las proteínas asociadas con la heterocromatina, las proteínas de unión al satélite alfa se ensamblan en las secuencias satélite alfa para formar la placa interna del cinetocoro. Algunas de estas proteínas están asociadas con el centrómero durante todo el ciclo celular. En la placa de cinetocoro interior se ensambla una placa de cinetocoro exterior que interactúa con los microtúbulos del huso mitótico. El centrómero suele estar flanqueado por heterocromatina pericéntrica formada por otros tipos de secuencias satélite. Las puntas del cromosoma (telómeros) están formadas por la repetición telomérica TTAGGG, las regiones subteloméricas adyacentes también son muy repetitivas.

Figura 7. VNTR en el gen de la insulina
A: Segmento de ADN (hebra codificante, dirección 5 ° a 3 °) que contiene el gen de la insulina. El gen de la insulina contiene tres exones (mayúsculas) que forman el ARNm maduro. Los motivos importantes de la secuencia reguladora están en rojo: cuadro TATA aguas arriba del sitio de inicio de la transcripción, ATG como inicio de la traducción (transcrito en AUG en el ARNm, que sirve como codón de inicio, insertando la primera metionina de la hebra polipeptídica), los dinucleótidos conservados GT y AG en los sitios de corte y empalme de intrones, codón de parada TAG y señal de poliadenilación AATAAA. Los sitios de polimorfismos de un solo nucleótido están en negrita (eso significa que muchos sujetos tienen un nucleótido diferente en esa posición, no el que se muestra). El minisatélite está en azul, por supuesto, solo se muestra un alelo, los demás alelos se diferencian por el número de repeticiones. B: Este alelo del VNTR consta de 29 repeticiones del motivo de secuencia GGGGTGTGGGGACA, aunque no todas las unidades repetidas coinciden perfectamente con el consenso (las bases que no coinciden están en negro). Tenga en cuenta que la repetición contiene un palíndromo TGTnnnnACA, que puede estabilizar las estructuras de "tallo-bucle" y promover así la inestabilidad del número de repeticiones (ver fig. 8). La longitud variable del minisatélite justo corriente arriba del gen de la insulina en la región promotora puede interactuar de manera diferencial con el promotor de unión al factor de transcripción y causar, por tanto, la expresión diferencial del gen de la insulina. De hecho, algunos alelos se asociaron con el desarrollo de diabetes (sin embargo, es muy difícil diferenciar el efecto directo de la vinculación "única"; consulte el capítulo que trata sobre la vinculación.

Fig. 8. El polimorfismo en microsatélites puede deberse al deslizamiento de la polimerasa.
Durante la polimerización, la fluctuación térmica puede disociar las cadenas de ADN. La reasociación suele ser perfecta y no produce cambios. Sin embargo, ocasionalmente, el ADN puede alinearse de manera desigual, debido a la repetición. O la hebra de polimerización se vuelve hacia atrás, lo que puede resultar en la expansión de la repetición (que es más frecuente) o la hebra que se alarga se une más distalmente a la plantilla (la plantilla se vuelve hacia atrás) con la subsiguiente contracción de la repetición. Recuadro: algunas repeticiones pueden promover este procedimiento debido a la estabilización del estado de transición al formar una estructura de tallo-bucle a partir de la doble hélice imperfecta, especialmente la repetición CAG / CTG, que está involucrada en la patogénesis de varias enfermedades de expansión de trinucleótidos. Cuanto más largo sea el microsatélite, mayor probabilidad de deslizamiento de la polimerasa, lo que crea, en combinación con la tendencia más pronunciada de alargamiento de la repetición, un bucle de retroalimentación positiva (reforzante).


14.5 Replicación del ADN en eucariotas

En esta sección, explorará las siguientes preguntas:

  • ¿Cuáles son las similitudes y diferencias entre la replicación del ADN en eucariotas y procariotas?
  • ¿Cuál es el papel de la telomerasa en la replicación del ADN?

Conexión para cursos AP ®

Los conceptos y ejemplos descritos en esta sección no están dentro del alcance de AP. Sin embargo, las funciones de los telómeros y la telomerasa en el envejecimiento y el cáncer son informativas y se basan en su conocimiento de la replicación del ADN en procariotas.

Apoyo a los profesores

Compare la replicación del ADN eucariota con la replicación procariota. La tabla 14.2 es útil. Obtenga ilustraciones del proceso en células eucariotas que permitan a los estudiantes ver los detalles.

Combine estos temas en una discusión sobre telómeros, envejecimiento y cáncer. Los estudiantes pueden pensar que la longitud de los telómeros explica las diferencias en la esperanza de vida entre diferentes animales, como los humanos y los perros. Explique que esta podría ser una conclusión tentadora, pero algunas especies longevas, como los humanos, tienen telómeros más cortos que los ratones, que viven solo unos pocos años.

Los genomas eucariotas son mucho más complejos y de mayor tamaño que los genomas procariotas. El genoma humano tiene tres mil millones de pares de bases por conjunto haploide de cromosomas, y 6 mil millones de pares de bases se replican durante la fase S del ciclo celular. Existen múltiples orígenes de replicación en el cromosoma eucariota. Los seres humanos pueden tener hasta 100.000 orígenes de replicación. La tasa de replicación es de aproximadamente 100 nucleótidos por segundo, mucho más lenta que la replicación procariota. En la levadura, que es un eucariota, se encuentran secuencias especiales conocidas como secuencias de replicación autónoma (ARS) en los cromosomas. Estos son equivalentes al origen de la replicación en E. coli.

El número de ADN polimerasas en eucariotas es mucho más que en procariotas: se conocen 14, de las cuales se sabe que cinco tienen funciones importantes durante la replicación y han sido bien estudiadas. Se les conoce como pol α, pol β, pol γ, pol δy pol ε.

Los pasos esenciales de la replicación son los mismos que en los procariotas. Antes de que pueda comenzar la replicación, el ADN debe estar disponible como plantilla. El ADN eucariota se une a proteínas básicas conocidas como histonas para formar estructuras llamadas nucleosomas. La cromatina (el complejo entre el ADN y las proteínas) puede sufrir algunas modificaciones químicas, de modo que el ADN pueda deslizarse fuera de las proteínas o ser accesible a las enzimas de la maquinaria de replicación del ADN. En el origen de la replicación, se elabora un complejo de prerreplicación con otras proteínas iniciadoras. Luego, se reclutan otras proteínas para iniciar el proceso de replicación (tabla 14.2).

Una helicasa que utiliza la energía de la hidrólisis de ATP abre la hélice de ADN. Las horquillas de replicación se forman en cada origen de replicación a medida que el ADN se desenrolla. La apertura de la doble hélice provoca un enrollamiento excesivo, o superenrollamiento, en el ADN antes de la horquilla de replicación. Estos se resuelven con la acción de las topoisomerasas. Los cebadores están formados por la enzima primasa y, utilizando el cebador, el ADN pol puede iniciar la síntesis. Mientras que la cadena principal es sintetizada continuamente por la enzima pol δ, la hebra rezagada es sintetizada por pol ε. Una proteína de abrazadera deslizante conocida como PCNA (antígeno nuclear de células proliferativas) mantiene el ADN pol en su lugar para que no se deslice del ADN. La RNasa H elimina el cebador de ARN, que luego se reemplaza con nucleótidos de ADN. Los fragmentos de Okazaki en la hebra rezagada se unen después de la sustitución de los cebadores de ARN por ADN. Los espacios que quedan están sellados por ADN ligasa, que forma el enlace fosfodiéster.

Replicación de telómeros

A diferencia de los cromosomas procariotas, los cromosomas eucariotas son lineales. Como ha aprendido, la enzima ADN pol puede agregar nucleótidos solo en la dirección 5 'a 3'. En la cadena principal, la síntesis continúa hasta que se alcanza el final del cromosoma. En la hebra rezagada, el ADN se sintetiza en tramos cortos, cada uno de los cuales es iniciado por un cebador separado. Cuando la horquilla de replicación llega al final del cromosoma lineal, no hay lugar para hacer un cebador para copiar el fragmento de ADN al final del cromosoma. Por lo tanto, estos extremos permanecen sin aparear y, con el tiempo, estos extremos pueden acortarse progresivamente a medida que las células continúan dividiéndose.

Los extremos de los cromosomas lineales se conocen como telómeros, que tienen secuencias repetitivas que no codifican ningún gen en particular. En cierto modo, estos telómeros protegen a los genes para que no se eliminen a medida que las células continúan dividiéndose. En los seres humanos, una secuencia de seis pares de bases, TTAGGG, se repite de 100 a 1000 veces. El descubrimiento de la enzima telomerasa (Figura 14.16) ayudó a comprender cómo se mantienen los extremos de los cromosomas. La enzima telomerasa contiene una parte catalítica y una plantilla de ARN incorporada. Se adhiere al final del cromosoma y se agregan bases complementarias a la plantilla de ARN en el extremo 3 'de la cadena de ADN. Una vez que el extremo 3 'de la plantilla de la hebra rezagada está lo suficientemente alargado, la ADN polimerasa puede agregar los nucleótidos complementarios a los extremos de los cromosomas. Por tanto, se replican los extremos de los cromosomas.

La telomerasa suele estar activa en células germinales y células madre adultas. No es activo en células somáticas adultas. Por su descubrimiento de la telomerasa y su acción, Elizabeth Blackburn (Figura 14.16) recibió el Premio Nobel de Medicina y Fisiología en 2009.

Telomerasa y envejecimiento

Las células que se someten a división celular continúan teniendo sus telómeros acortados porque la mayoría de las células somáticas no producen telomerasa. Esto esencialmente significa que el acortamiento de los telómeros está asociado con el envejecimiento. Con el advenimiento de la medicina moderna, la atención médica preventiva y estilos de vida más saludables, la esperanza de vida humana ha aumentado y existe una demanda cada vez mayor de que las personas se vean más jóvenes y tengan una mejor calidad de vida a medida que envejecen.

En 2010, los científicos encontraron que la telomerasa puede revertir algunas condiciones relacionadas con la edad en ratones. Esto puede tener potencial en la medicina regenerativa. En estos estudios se utilizaron 2 ratones con deficiencia de telomerasa, estos ratones tienen atrofia tisular, agotamiento de células madre, insuficiencia del sistema de órganos y respuestas dañadas de daño tisular. La reactivación de la telomerasa en estos ratones provocó la extensión de los telómeros, redujo el daño del ADN, invirtió la neurodegeneración y mejoró la función de los testículos, el bazo y los intestinos. Por tanto, la reactivación de los telómeros puede tener potencial para tratar enfermedades relacionadas con la edad en humanos.

El cáncer se caracteriza por la división celular descontrolada de células anormales. Las células acumulan mutaciones, proliferan sin control y pueden migrar a diferentes partes del cuerpo a través de un proceso llamado metástasis. Los científicos han observado que las células cancerosas tienen telómeros considerablemente más cortos y que la telomerasa está activa en estas células. Curiosamente, solo después de que los telómeros se acortaron en las células cancerosas, la telomerasa se activó. Si la acción de la telomerasa en estas células puede ser inhibida por fármacos durante la terapia contra el cáncer, entonces las células cancerosas podrían detenerse potencialmente para que no se dividan más.


Alteraciones de la metilación del ADN en cánceres humanos

5.2.3.2 Hipometilación del promotor de oncogenes

La hipometilación del ADN de algunos oncogenes está implicada en la tumorigénesis. LINE (elemento nuclear intercalado largo) es la secuencia de transposón o ADN móvil más activa y abundante, cuya hipometilación podría conducir a la activación transcripcional en algunos tipos de cánceres [49]. La mutagénesis insercional de LINE destruyó la expresión de APC (poliposis coli adenomatosa) en CC [50]. Otros genes de copia única también están hipometilados en cánceres humanos. Por ejemplo, dominio PR que contiene 16 (PRDM16) está hipometilado, y el estado de hipometilación del PRDM16 El promotor podría predecir un mal pronóstico para los pacientes con astrocitoma [51]. Alta expresión de la proteasa transmembrana, serina 4 (TMPRSS4), es un factor pronóstico independiente en los carcinomas de células escamosas (CCE), y su hipometilación aberrante se correlaciona con una alta TMPRSS4 expresión, que se ha demostrado como un factor pronóstico independiente en el CCE [52]. La hipometilación del promotor da como resultado la activación de protooncogenes. Un ejemplo es MAT2A (metionina adenosiltransferasa), un gen promotor de tumores hipometilado identificado en el CHC humano primario [53]. S100A8 La proteína (proteína de unión a calcio S100 A8), conocida como calciclina, estaba frecuentemente hipermetilada en tejidos no tumorales pero hipometilada en tejidos de CHC. El nivel de metilación del sitio (cg2007009) en S100A8 los niveles de expresión disminuyeron significativamente en HCC. Además, la hipometilación de S100A8 se asoció con una reducción de la SSP (supervivencia libre de progresión) y la SG (supervivencia general) apoyó un papel potencial para S100A8 hipometilación como biomarcador de diagnóstico de CHC [54]. los S100A4 El gen, también conocido como gen asociado a metástasis, se desmetila con frecuencia y su expresión de proteínas aumenta en CC [55]. Además, el factor de ribosilación de ADP (ARF), como 4C (ARL4C) sobreexpresión, debido a la hipometilación del ADN en la región 3 'no traducida (3'UTR), promueve la tumorigénesis del CCE pulmonar [56].


Contenido

Los SINE se clasifican como retrotransposones no LTR porque no contienen repeticiones terminales largas (LTR). [4] Hay tres tipos de SINE comunes a los vertebrados e invertebrados: CORE-SINE, V-SINE y AmnSINE. [3] Los SINE tienen regiones internas de 50-500 pares de bases que contienen un segmento derivado de tRNA con cajas A y B que sirven como un promotor interno para la RNA polimerasa III. [5] [3]

Estructura interna Editar

Los SINE se caracterizan por sus diferentes módulos, que son esencialmente una sección de su secuencia. Los SINE pueden, pero no necesariamente tienen que poseer una cabeza, un cuerpo y una cola. La cabeza, se encuentra en el extremo 5 'de elementos nucleares intercalados cortos y es un derivado evolutivo de un ARN sintetizado por la ARN polimerasa III, como los ARN ribosomales y los ARNt, la cabeza 5' indica de qué elemento endógeno se derivó SINE y fue capaz de utilizar parasitariamente su maquinaria transcripcional. [1] Por ejemplo, el 5 'del seno de Alu se deriva del ARN 7SL, una secuencia transcrita por la ARN polimerasa III que codifica el elemento ARN de SRP, una ribonucleoproteína abundante. [6] El cuerpo de SINEs posee un origen desconocido pero a menudo comparte mucha homología con una LINE correspondiente, lo que permite a SINEs cooptar parasitariamente endonucleasas codificadas por LINEs (que reconocen ciertos motivos de secuencia). Por último, la cola 3 'de los SINE se compone de repeticiones simples cortas de longitudes variables, estas repeticiones simples son sitios donde dos (o más) elementos nucleares entremezclados cortos pueden combinarse para formar un SINE dimérico. [7] Los elementos nucleares intercalados cortos que no solo poseen una cabeza y una cola se denominan SINE simples, mientras que los elementos nucleares intercalados cortos que también poseen un cuerpo o son una combinación de dos o más SINE son SINE complejos. [1]

Los elementos nucleares intercalados cortos son transcritos por la ARN polimerasa III, que se sabe que transcribe ARN ribosómico y ARNt, dos tipos de ARN vitales para el ensamblaje ribosómico y la traducción del ARNm. [8] Los SINE, como los ARNt y muchos ARN de núcleos pequeños, poseen un promotor interno y, por lo tanto, se transcriben de manera diferente a la mayoría de los genes que codifican proteínas. [1] En otras palabras, los elementos nucleares intercalados cortos tienen sus elementos promotores clave dentro de la propia región transcrita. Aunque transcritos por la ARN polimerasa III, los SINE y otros genes que poseen promotores internos, reclutan diferentes mecanismos y factores de transcripción que los genes que poseen promotores cadena arriba. [9]

Los cambios en la estructura cromosómica influyen en la expresión génica principalmente al afectar la accesibilidad de los genes a la maquinaria transcripcional. El cromosoma tiene un sistema jerárquico y muy complejo de organizar el genoma. Este sistema de organización, que incluye histonas, grupos metilo, grupos acetilo y una variedad de proteínas y ARN, permite que diferentes dominios dentro de un cromosoma sean accesibles a polimerasas, factores de transcripción y otras proteínas asociadas en diferentes grados. [10] Además, la forma y densidad de ciertas áreas de un cromosoma pueden afectar la forma y densidad de regiones vecinas (o incluso distantes) en el cromosoma a través de la interacción facilitada por diferentes proteínas y elementos. Los ARN no codificantes, como los elementos nucleares intercalados cortos, que se sabe que se asocian con la estructura de la cromatina y contribuyen a ella, pueden desempeñar un papel muy importante en la regulación de la expresión génica. [11] De manera similar, los elementos nucleares intercalados cortos pueden estar involucrados en la regulación de genes modificando la arquitectura genómica.

De hecho Usmanova et al. 2008 sugirió que los elementos nucleares intercalados cortos pueden servir como señales directas en el reordenamiento y estructura de la cromatina. El artículo examinó la distribución global de SINE en cromosomas humanos y de ratón y determinó que esta distribución era muy similar a las distribuciones genómicas de genes y motivos CpG. [12] La distribución de los SINE a los genes fue significativamente más similar que la de otros elementos genéticos no codificantes e incluso difirió significativamente de la distribución de elementos nucleares intercalados durante mucho tiempo. [12] Esto sugirió que la distribución SINE no era un mero accidente causado por la retrotransposición mediada por LINE, sino que los SINE tenían un papel en la regulación genética. Además, los SINE contienen con frecuencia motivos para las proteínas polycomb YY1. [12] YY1 es una proteína con dedos de zinc que actúa como represor transcripcional para una amplia variedad de genes esenciales para el desarrollo y la señalización. [13] Se cree que la proteína Polycomb YY1 media la actividad de las histonas desacetilasas y las histonas acetiltransferasas para facilitar la reorganización de la cromatina, lo que a menudo facilita la formación de heterocromatina (estado de silenciamiento de genes).[14] Por lo tanto, el análisis sugiere que los elementos nucleares intercalados cortos pueden funcionar como un "refuerzo de señal" en el silenciamiento dependiente de polycomb de conjuntos de genes a través de la reorganización de la cromatina. [12] En esencia, es el efecto acumulativo de muchos tipos de interacciones lo que conduce a la diferencia entre la eucromatina, que no está compacta y generalmente es más accesible para la maquinaria transcripcional, y la heterocromatina, que está compacta y generalmente no es accesible para la transcripción. Los SINE de maquinaria parecen jugar un papel evolutivo en este proceso.

Además de afectar directamente a la estructura de la cromatina, existen varias formas en las que los SINE pueden potencialmente regular la expresión génica. Por ejemplo, el ARN largo no codificante puede interactuar directamente con represores y activadores transcripcionales, atenuando o modificando su función. [15] Este tipo de regulación puede ocurrir de diferentes maneras: la transcripción de ARN puede unirse directamente al factor de transcripción como un co-regulador también, el ARN puede regular y modificar la capacidad de los co-reguladores para asociarse con el factor de transcripción. [15] Por ejemplo, se sabe que Evf-2, un ARN largo no codificante, funciona como coactivador de ciertos factores de transcripción homeobox que son críticos para el desarrollo y la organización del sistema nervioso. [16] Además, las transcripciones de ARN pueden interferir con la funcionalidad del complejo transcripcional al interactuar o asociarse con las ARN polimerasas durante los procesos de transcripción o carga. [15] Además, los ARN no codificantes como los SINE pueden unirse o interactuar directamente con el dúplex de ADN que codifica el gen y así evitar su transcripción. [15]

Además, muchos ARN no codificantes se distribuyen cerca de los genes que codifican proteínas, a menudo en la dirección inversa. Esto es especialmente cierto para los elementos nucleares intercalados cortos como se ve en Usmanova et al. Estos ARN no codificantes, que se encuentran adyacentes o se superponen a conjuntos de genes, proporcionan un mecanismo mediante el cual se pueden reclutar factores de transcripción y maquinaria para aumentar o reprimir la transcripción de genes locales. El ejemplo particular de SINE que potencialmente reclutan el represor transcripcional polycomb YY1 se analiza anteriormente. [12] Alternativamente, también proporciona un mecanismo por el cual la expresión de genes locales puede ser restringida y regulada porque los complejos transcripcionales pueden dificultar o prevenir la transcripción de genes cercanos. Hay investigaciones que sugieren que este fenómeno se observa particularmente en la regulación genética de células pluripotentes. [17]

En conclusión, los ARN no codificantes, como los SINE, pueden afectar la expresión génica en una multitud de niveles diferentes y de diferentes formas. Se cree que los elementos nucleares intercalados cortos están profundamente integrados en una red reguladora compleja capaz de ajustar la expresión génica en todo el genoma eucariota.

El ARN codificado por el elemento nuclear intercalado corto no codifica ningún producto proteico pero, no obstante, se transcribe de forma inversa y se inserta de nuevo en una región alternativa del genoma. Por esta razón, se cree que los elementos nucleares cortos intercalados han coevolucionado con los elementos nucleares intercalados largos (LINE), ya que los LINE de hecho codifican productos proteicos que les permiten ser transcritos de forma inversa e integrados de nuevo en el genoma. [4] Se cree que los SINE han cooptado las proteínas codificadas por LINE que están contenidas en 2 marcos de lectura. El marco de lectura abierto 1 (ORF 1) codifica una proteína que se une al ARN y actúa como acompañante para facilitar y mantener la estructura del complejo LINE proteína-ARN. [18] El marco de lectura abierto 2 (ORF 2) codifica una proteína que posee actividades tanto de endonucleasa como de transcriptasa inversa. [19] Esto permite que el ARNm de LINE se transcriba de forma inversa en el ADN y se integre en el genoma basándose en los motivos de secuencia reconocidos por el dominio de endonucleasa de la proteína.

LINE-1 (L1) se transcribe y retrotranspone con mayor frecuencia en la línea germinal y durante el desarrollo temprano, como resultado, los SINE se mueven más alrededor del genoma durante estos períodos. La transcripción SINE está regulada negativamente por factores de transcripción en las células somáticas después del desarrollo temprano, aunque el estrés puede causar una regulación positiva de los SINE normalmente silenciosos. [20] Los SINE se pueden transferir entre individuos o especies mediante transferencia horizontal a través de un vector viral. [21]

Se sabe que los SINE comparten homología de secuencia con LINES, lo que proporciona una base mediante la cual la maquinaria LINE puede transcribir e integrar transcripciones SINE. [22] Alternativamente, se cree que algunos SINE utilizan un sistema mucho más complejo de integración de nuevo en el genoma. Este sistema implica el uso de roturas aleatorias de ADN de doble hebra (en lugar de la endonucleasa codificada por elementos nucleares intercalados largos relacionados que crean una inserción). sitio). [22] Estas roturas de ADN se utilizan para cebar la transcriptasa inversa, integrando finalmente la transcripción SINE de nuevo en el genoma. [22] No obstante, los SINE dependen de enzimas codificadas por otros elementos del ADN y, por lo tanto, se conocen como retrotransposones no autónomos, ya que dependen de la maquinaria de los LINE, que se conocen como retrotransposones autónomos. & Lt [23]

La teoría de que los elementos nucleares intercalados cortos han evolucionado para utilizar la maquinaria de retrotransposón de elementos nucleares intercalados durante mucho tiempo está respaldada por estudios que examinan la presencia y distribución de LINE y SINE en taxones de diferentes especies. [24] Por ejemplo, LINE y SINE en roedores y primates muestran una homología muy fuerte en el motivo del sitio de inserción. [24] Dicha evidencia es una base para el mecanismo propuesto en el que la integración de la transcripción SINE puede cooptarse con productos proteicos codificados en LINE. Esto se demuestra específicamente mediante un análisis detallado de más de 20 especies de roedores perfiladas LINE y SINE, principalmente L1 y B1 respectivamente, estas son familias de LINE y SINE que se encuentran en altas frecuencias en roedores junto con otros mamíferos. [24] El estudio buscó proporcionar claridad filogenética dentro del contexto de la actividad LINE y SINE.

El estudio llegó a un taxón candidato que se cree que es el primer caso de extinción de L1 LINE y, como era de esperar, descubrió que no había evidencia que sugiriera que la actividad B1 SINE ocurriera en especies que no tenían actividad L1 LINE. [24] Además, el estudio sugirió que el silenciamiento de elementos nucleares intercalados cortos de B1 de hecho ocurrió antes de la extinción de elementos nucleares intercalados largos de L1, esto se debe al hecho de que los SINE B1 están silenciados en el género más estrechamente relacionado con el género que lo hace. no contiene LÍNEAS L1 activas (aunque el género con silenciamiento SINE B1 todavía contiene LÍNEAS L1 activas). [24] También se encontró otro género que de manera similar contenía elementos nucleares L1 activos intercalados largos, pero no contenía elementos nucleares B1 intercalados cortos, el escenario opuesto, en el que los SINE B1 activos estaban presentes en un género que no poseía LINE L1 activos era extraviado. [24] Este resultado era esperado y apoya firmemente la teoría de que los SINE han evolucionado para cooptar las proteínas de unión al ARN, endonucleasas y transcriptasas inversas codificadas por LINE. En los taxones que no transcriben y traducen activamente productos de proteínas de elementos nucleares intercalados durante mucho tiempo, los SINE no tienen la base teórica para retrotransponerse dentro del genoma. Los resultados obtenidos en Rinehart et al. son, por tanto, muy favorables al modelo actual de retrotransposición SINE.

La inserción de un SINE corriente arriba de una región codificante puede dar como resultado la reorganización del exón o cambios en la región reguladora del gen. La inserción de un SINE en la secuencia codificante de un gen puede tener efectos deletéreos y la transposición no regulada puede causar una enfermedad genética. Se cree que la transposición y recombinación de SINE y otros elementos nucleares activos es una de las principales contribuciones de la diversidad genética entre linajes durante la especiación. [21]

Se cree que los elementos nucleares intercalados cortos tienen orígenes parásitos en genomas eucariotas. Estos SINE se han mutado y replicado un gran número de veces en una escala de tiempo evolutiva y, por lo tanto, forman muchos linajes diferentes. Su origen evolutivo temprano ha hecho que sean ubicuos en muchos linajes eucariotas.

Los elementos Alu, elemento nuclear intercalado corto de aproximadamente 300 nucleótidos, son el SINE más común en humanos, con & gt1,000,000 copias en todo el genoma, que es más del 10 por ciento del genoma total, esto no es infrecuente entre otras especies. [25] Las diferencias en el número de copias del elemento Alu pueden usarse para distinguir y construir filogenias de especies de primates. [21] Los caninos se diferencian principalmente por la abundancia de repeticiones SINEC_Cf en todo el genoma, en lugar de otras mutaciones a nivel de genes o alelos. Estos SINE específicos para perros pueden codificar un sitio aceptor de empalme, alterando las secuencias que aparecen como exones o intrones en cada especie. [26]

Aparte de los mamíferos, los SINE pueden alcanzar un alto número de copias en una variedad de especies, incluidos los vertebrados no óseos (tiburón elefante) y algunas especies de peces (celacantos). [27] En las plantas, los SINE a menudo se restringen a especies estrechamente relacionadas y han surgido, decaído y desaparecido con frecuencia durante la evolución. [28] Sin embargo, algunas familias SINE como las Au-SINEs [29] y las Angio-SINEs [30] están inusualmente extendidas en muchas especies de plantas a menudo no relacionadas.

Hay & gt50 enfermedades humanas asociadas con los SINE. [20] Cuando se insertan cerca o dentro del exón, los SINE pueden causar un empalme inadecuado, convertirse en regiones de codificación o cambiar el marco de lectura, lo que a menudo conduce a fenotipos de enfermedades en humanos y otros animales. [26] La inserción de elementos Alu en el genoma humano se asocia con cáncer de mama, cáncer de colon, leucemia, hemofilia, enfermedad de Dent, fibrosis quística, neurofibromatosis y muchos otros. [4]

MicroARN editar

El papel de los elementos nucleares intercalados cortos en la regulación génica dentro de las células ha sido respaldado por múltiples estudios. Uno de esos estudios examinó la correlación entre cierta familia de SINE y microARN (en el pez cebra). [31] La familia específica de SINE que se examinó fue la Anamnia V-SINE. Esta familia de elementos nucleares cortos intercalados se encuentra a menudo en la región no traducida del extremo 3 'de muchos genes y está presente en los genomas de vertebrados. [31] El estudio implicó un análisis computacional en el que la distribución genómica y la actividad de los Anamnia V-SINE en Danio rerio Además, se examinó el pez cebra y se analizó el potencial de estos V-SINE para generar nuevos loci de microARN. [31] Se encontró que los genes que se predijo que poseían V-SINE fueron dirigidos por microARN con valores E de hibridación significativamente más altos (en relación con otras áreas del genoma). [31] Los genes que tenían valores de E de hibridación elevados eran genes particularmente implicados en las vías metabólicas y de señalización. [31] Se ha identificado (en mamíferos) que casi todos los miARN identificados con una gran capacidad para hibridar con motivos de secuencia V-SINE putativos en genes tienen funciones reguladoras. [31] Estos resultados, que establecen una correlación entre elementos nucleares intercalados cortos y diferentes microARN reguladores, sugieren fuertemente que los V-SINE tienen un papel significativo en la atenuación de las respuestas a diferentes señales y estímulos relacionados con el metabolismo, la proliferación y la diferenciación. Se deben realizar muchos otros estudios para establecer la validez y el alcance del papel de los retrotransposones de elementos nucleares intercalados cortos en las redes reguladoras de expresión génica. En conclusión, aunque no se sabe mucho sobre el papel y el mecanismo por el cual los SINE generan loci de genes de miARN, en general se entiende que los SINE han desempeñado un papel evolutivo significativo en la creación de "genes de ARN", esto también se abordó anteriormente en los SINE. y pseudogenes.

Con tal evidencia que sugiere que los elementos nucleares intercalados cortos han sido fuentes evolutivas para la generación de loci de microARN, es importante discutir más a fondo las posibles relaciones entre los dos, así como el mecanismo por el cual el microARN regula la degradación del ARN y, más ampliamente, la expresión génica. Un microARN es un ARN no codificante que generalmente tiene una longitud de 22 nucleótidos. [32] Este oligonucleótido que no codifica proteínas está codificado en sí mismo por una secuencia de ADN nuclear más larga, generalmente transcrita por la ARN polimerasa II, que también es responsable de la transcripción de la mayoría de los ARNm y snRNA en eucariotas. [33] Sin embargo, algunas investigaciones sugieren que algunos microARN que poseen elementos nucleares cortos intercalados en sentido ascendente son transcritos por la ARN polimerasa III, que está ampliamente implicada en el ARN ribosómico y el ARNt, dos transcripciones vitales para la traducción del ARNm. [34] Esto proporciona un mecanismo alternativo por el cual elementos nucleares intercalados cortos podrían interactuar o mediar en redes de regulación de genes que involucran microARN.

Las regiones que codifican miARN pueden ser genes de ARN independientes que a menudo son antisentido para los genes codificadores de proteínas vecinos, o pueden encontrarse dentro de los intrones de genes codificadores de proteínas. [35] La co-localización de microARN y genes codificadores de proteínas proporciona una base mecanicista mediante la cual el microARN regula la expresión génica. Además, Scarpato et al. revela (como se discutió anteriormente) que los genes que se predice que poseen elementos nucleares intercalados cortos (SINE) a través del análisis de secuencia fueron dirigidos e hibridados por microARN significativamente mayores que otros genes. [31] Esto proporciona una ruta evolutiva mediante la cual los SINE parásitos fueron cooptados y utilizados para formar genes de ARN (como microARN) que han evolucionado para desempeñar un papel en redes complejas de regulación de genes.

Los microARN se transcriben como parte de cadenas de ARN más largas de aproximadamente 80 nucleótidos que, a través del emparejamiento de bases complementarias, pueden formar estructuras de bucle en horquilla [36]. Estas estructuras son reconocidas y procesadas en el núcleo por la proteína nuclear DiGeorge Syndrome Critical Region 8 ( DGCR8) que recluta y se asocia con la proteína Drosha. [37] Este complejo es responsable de escindir algunas de las estructuras en forma de horquilla del pre-microARN que se transporta al citoplasma. El pre-miARN es procesado por la proteína DICER en un nucleótido bicatenario de 22. [38] A partir de entonces, una de las cadenas se incorpora a un complejo silenciador inducido por ARN de múltiples proteínas (RISC). [39] Entre estas proteínas se encuentran las proteínas de la familia Argonaute que son fundamentales para la capacidad del complejo para interactuar y reprimir la traducción del ARNm diana. [40]

Comprender las diferentes formas en que el microARN regula la expresión génica, incluida la traducción y degradación del ARNm, es clave para comprender el papel evolutivo potencial de los SINE en la regulación génica y en la generación de loci de microARN. Esto, además del papel directo de los SINE en las redes reguladoras (como se analiza en los SINE como ARN largos no codificantes) es crucial para comenzar a comprender la relación entre los SINE y ciertas enfermedades. Múltiples estudios han sugerido que el aumento de la actividad SINE se correlaciona con ciertos perfiles de expresión génica y la regulación postranscripción de ciertos genes. [41] [42] [43] De hecho, Peterson et al. 2013 demostró que una alta expresión de ARN SINE se correlaciona con la regulación negativa postranscripcional de BRCA1, un supresor de tumores implicado en múltiples formas de cáncer, a saber, el cáncer de mama. [43] Además, los estudios han establecido una fuerte correlación entre la movilización transcripcional de SINE y ciertos cánceres y afecciones como la hipoxia; esto puede deberse a la inestabilidad genómica causada por la actividad de SINE, así como a efectos más directos aguas abajo. [42] Los SINE también se han relacionado con otras innumerables enfermedades. En esencia, los elementos nucleares intercalados cortos se han integrado profundamente en innumerables vías reguladoras, metabólicas y de señalización y, por lo tanto, desempeñan un papel inevitable en la causa de la enfermedad. Aún queda mucho por saber sobre estos parásitos genómicos, pero está claro que desempeñan un papel importante en los organismos eucariotas.

Sin embargo, la actividad de los SINE tiene vestigios genéticos que no parecen jugar un papel significativo, positivo o negativo, y se manifiestan en el genoma como pseudogenes. Sin embargo, los SINE no deben confundirse con los pseudogenes de ARN. [1] En general, los pseudogenes se generan cuando los ARNm procesados ​​de genes que codifican proteínas se transcriben de forma inversa y se vuelven a incorporar al genoma (los pseudogenes de ARN son genes de ARN de transcripción inversa). [44] Los pseudogenes generalmente carecen de función ya que descienden de ARN procesados ​​independientemente de su contexto evolutivo, que incluye intrones y diferentes elementos reguladores que permiten la transcripción y el procesamiento. Estos pseudogenes, aunque no funcionales, pueden, en algunos casos, poseer promotores, islas CpG y otras características que permiten la transcripción, por lo que aún pueden transcribirse y pueden desempeñar un papel en la regulación de la expresión génica (como SINE y otros elementos no codificantes). ). [44] Por tanto, los pseudogenes se diferencian de los SINE en que se derivan de ARN funcional transcrito, mientras que los SINE son elementos de ADN que se retrotransponen mediante la cooptación de genes de ARN por la maquinaria transcripcional. Sin embargo, hay estudios que sugieren que los elementos retrotransponibles, como los elementos nucleares intercalados cortos, no solo son capaces de copiarse a sí mismos en regiones alternas del genoma, sino que también pueden hacerlo para genes aleatorios. [45] [46] Por lo tanto, los SINE pueden desempeñar un papel vital en la generación de pseudogenes, que se sabe que están involucrados en redes reguladoras. Este es quizás otro medio por el cual los SINE han podido influir y contribuir a la regulación genética.


Ver el vídeo: CARACTERÍSTICAS GERAIS DOS SERES VIVOS. Biologia com Samuel Cunha (Julio 2022).


Comentarios:

  1. Ya'qub

    Excelente idea, de acuerdo contigo.

  2. Galm

    Escucha, amigo, ¿te has apegado a este tema durante mucho tiempo? ¡Entonces le contó todo en detalle! Incluso aprendí algo nuevo. Gracias))))

  3. Williamon

    Se quita (tiene tema enredado)



Escribe un mensaje