miércoles, 8 de septiembre de 2021

Alineamiento de secuencias

 En esta época de pandemis aprender a alinear secuencias de ADN es una herramienta básica para saber de qué virus se trata el que está aquejando a nuestra comunidad y si está mutando, si la nueva mutación está cubierta por la inmunidad inducida por las vacunas que se han suministrado. Por eso vamos a aprender a distinguir las distintas secuencias, nucleotídicas o aminoacídicas, determinar si tienen un origen común...

Las secuencias biológicas pueden estar en nt o en aminoácidos

1 PREGUNTA: Encuentra un ORF (marco abierto de lectura) si lo hubiere, transcríbelo a mRNA y tradúcelo a su secuencia de aminoácidos

5’ ATGTTATTGTCGTATGCGACGTACATGTTTCATGCCCGT 3’

Solución: 



2 PREGUNTA: En esta secuencia existen dos ORFs mayores de 30 nt (normalmente por debajo de esta longitud no se consideran los posibles ORFs, es decir, no suelen llevar secuencias reguladoras, como la caja TATAA, RBS ect y por lo tanto no son ORFs que se transcriban). Uno en la secuencia que ves y el otro en su complementaria. Localízalos y tradúcelos a su secuencia de aminoácidos

5’CGCGGCATGATACGACGTCAGTCCACACGTCCACGTACACGACACCAATATCCGATACACTGATACCTAAAGGGGGACCGACAAAGACGACCGCCAGACGACCGGCGATACGAGCATAATACGATCTCTAGACGACCATACGACTAGACCTA 3’

Lo primero que vamos a hacer es separar de diez en diez los nucleótidos para poder contarlos con mayor facilidad

CGCGGCATGA TACGACGTCA GTCCACACGT CCACGTACAC GACACCAATA TCCGATACAC TGATACCTAA AGGGGGACCG ACAAAGACGA CCGCCAGACG ACCGGCGATA CGAGCATAAT ACGATCTCTA GACGACCATA CGACTAGACC TA
Vamos a encontrar un ORF en la secuencia 5’--> 3’

CGCGGCATGA TACGACGTCA GTCCACACGT CCACGTACAC GACACCAATA TCCGATACAC TGATACCTAA AGGGGGACCG ACAAAGACGA CCGCCAGACG ACCGGCGATA CGAGCATAAT ACGATCTCTA GACGACCATA CGACTAGACC TA

Esta secuencia en negrilla
ATG ATA CGA CGT CA G TCC ACA CGT CCA CGT ACA CGA CAC CAA TAT CCG ATA CAC TGA
Se traduce como: MIRRQSTRPRTRHQYPIH

Y otro ORF en la secuencia complementaria 3’-->5´. El truco para encontrar estas secuencias sin necesidad de hacer la secuencia complementaria es encontrar primero un CAT de derecha a izquierda y luego, buscando de tres en tres, encontrar un triplete CTA, TTA o un TCA, como se puede ver abajo resaltado en azul.

5’ CGCGGCATGA TACGACGTCA GTCCACACGT CCACGTACAC GACACCAATA TCCGATACAC TGATACCTAA AGGGGGACCG ACAAAGACGA CCGCCAGACG ACCGGCGATA CGAGCATAAT ACGATCTCTA GACGACCATA CGACTAGACC TA3’

Esta secuencia en azul si se escribiese como ADN codificante sería:
5’ATG CTC GTA TCG CCG GTC GTC TGG CGG TCG TCT TTG TCG GTC CCC CTT TAG 3’

Traducción: MLVSPVVWRSSLSVPL

3 PREGUNTA: Busca los ORFs en esta secuencia utilizando el programa https://www.ncbi.nlm.nih.gov/orffinder/ (Ojo los ORFs tienen que ser mayores de 30 nt)


5’CGCGGCATGATACGACGTCAGTCCACACGTCCACGTACACGACACCAATATCCGATACACTGATACCTAAAGGGGGACCGACAAAGACGACCGCCAGACGACCGGCGATACGAGCATAATACGATCTCTAGACGACCATACGACTAGACCTA 3’

ORF1: 5’ATGATACGACGTCAGTCCACACGTCCACGTACACGACACCAATATCCGAT
ACACTGA 3’

ORF2: 5'ATGCTCGTATCGCCGGTCGTCTGGCGGTCGTCTTTGTCGGTCCCCCTTTA
G 3'


4 PREGUNTA: Busca los ORFs en esta secuencia utilizando el programa https://www.ncbi.nlm.nih.gov/orffinder/ (Ojo los ORFs tienen que ser mayores de 30 nt). Poner en las opciones: Minimal ORF length (nt): 30

La secuencia
5’CGCGGCATGATACGACGTCAGTCCACACGTCCACGTACACGACACCAATATCCGATACACTGATACCTAAAGGGGGACCGACAAAGACGACCGCCAGACGACCGGCGATACGAGCATAATACGATCTCTAGACGACCATACGACTAGACCTA 3’

Se produce un cambio en la posición 51. Un cambio de T a G
Se produce un cambio en la posición 115. Un cambio de C a G
Y queda de la siguiente manera
5’CGCGGCATGATACGACGTCAGTCCACACGTCCACGTTGACGACACCAATATCCGATACACTGATACCTAAAGGGGGACCGACAAAGACGACCGCCAGACGACCGGCGATACGAGGATAATACGATCTCTAGACGACCATACGACTAGACCTA 3’

¿Cuántos ORFs existen?


El ORF1 anterior ahora es más corto por que el codon ACA se ha transformado en un codon de stop TGA
El ORF2 ha desaparecido al mutar el codon de inicio



5 PREGUNTA: Encuentra y traduce el ORF que se encuentra en esta secuencia (enlace tabla código genético):

5’ GGATGCTTAGCGTACGAGCGCCGACGCACCCGACCACATTTTATCTTACGGG 3’

Solución: Pincha aquí

5’ GGATGCTTAGCGTACGAGCGCCGACGCACCCGACCACATTTTATCTTACGGG 3’
El ORF empieza en el nt39 y acaba en el 7
ATGTGGTCGGGTGCGTCGGCGCTCGTACGCTAA
MWSGASALVR

6 PREGUNTA: Encuentra el ORF, tradúcelo y di cuáles son las propiedades químicas de sus aminoácidos
5’ TTATTGTCGTATGCGACGTACATGTTTCAT 3’
Solución:


7 PREGUNTA: en la secuencia que se encuentra en la pregunta anterior se observan dos aminoácidos que están codificados por dos codones distintos ¿Por qué ocurre esto?
Solución: Pincha aquí

¿Por qué una secuencia genética comienza a generar distintas secuencias?

8 PREGUNTA: ¿Por qué aparece en la 3 generación una secuencia diferente? ¿Por adaptación?



No todas las diferencias en secuencias tienen la misma importancia


9 PREGUNTA: Supongamos que la secuencia A es la secuencia ancestral de donde parten B, C, D y E. a) Ordena estas secuencias de mayor a menor diferencias genéticas b) Ordénalas ahora de mayor a menor diferencias aminoacídicas. Enlace al código genético. Programa para traducir DNA en proteínas

A 5´ATGCAAGCTTGGCGTAATCATGACTACTAA 3´

B 5´ATGCAGGCTTGGCGTAATCATGACTACTAA 3

C 5´ATGCATGCGTGACGTAATCATGACTACTAA 3

D 5´ATGCAAGCTTGGCGCTAATCATGACTACTAA 3

E 5´ATGCATGTGTTACATAACCACGATTACTAA 3

Solución: 

A             MQAWRNHDY

B             MQAWRNHDY Similitud 9/9 100%

C             MHA-RNHDY Similitud 2/9

D             MQAWR-S-LL Similitud 4/9

E              MHVLHNHDY- Similitud 5/9

 A 5´ATG CAA GCT TGG CGT AAT CAT GAC TAC TAA

B 5´ATG CAG GCT TGG CGT AAT CAT GAC TAC TAA 3

C 5´ATG CAT GCG TGA CGT AAT CAT GAC TAC TAA 3´

D 5´ATG CAA GCT TGG CGC TAA TCA TGA CTA CTA A 3´

E 5´ATG CAT GTG TTA CAT AAC CAC GAT TAC TAA

En ambos casos, nt y aminoácidos, la B es la secuencia más similar, seguida de la E, la D y por último la C 

¿Cómo se puede ordenar las secuencias para ver si tienen un antepasado común?

Árbol genealógico de los Restrepo

Árbol genealógico de Leonardo Da Vinci

10 PREGUNTA: ¿Cómo puedo rastrear mi linaje materno? ¿Y el paterno?


11 PREGUNTA: ¿De qué depende que en 2020 haya una frecuencia de clones determinada y en 2021 haya otra frecuencia?

Blast una herramienta bioinformática para alinear secuencias según similitud

Tutorial BLAST en español

Ejecutar y analizar los resultados de un Blast (Parte 1 de 2)

Ejecutar y analizar los resultados de un Blast (Parte 2 de 2)

12 PREGUNTA: Con el genoma del plásmido pUC19 encuentra el gen de la betalactamasa, el que le da resistencia a la ampicilina, y haz un blast con su secuencia. ¿Existe ese gen en otros plásmidos, bacterias? 

No hay comentarios:

Publicar un comentario

Cada vez que lees un artículo y no dejas un comentario, alguien mata a un gatito en alguna parte del mundo...