; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cmc08g0224101 (gene) of Melon (Charmono) v1.1 genome

Gene IDCmc08g0224101
OrganismCucumis melo var. cantalupensis cv. Charmono (Melon (Charmono) v1.1)
DescriptionGag/pol protein
Genome locationCMiso1.1chr08:13931470..13932147
RNA-Seq ExpressionCmc08g0224101
SyntenyCmc08g0224101
Gene Ontology termsGO:0006508 - proteolysis (biological process)
GO:0015074 - DNA integration (biological process)
GO:0003676 - nucleic acid binding (molecular function)
GO:0008234 - cysteine-type peptidase activity (molecular function)
GO:0008270 - zinc ion binding (molecular function)
InterPro domainsIPR001584 - Integrase, catalytic core
IPR012337 - Ribonuclease H-like superfamily
IPR025724 - GAG-pre-integrase domain
IPR036397 - Ribonuclease H superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
ADJ18449.1 gag/pol protein, partial [Bryonia dioica]1.6e-10182.67Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSSNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSLPP
        +LEH+Y ISFE+NE FI  K I +CS+I ENNLYKLRPTRAN VLNTEMFRT ETQNK+QKVSSNA LWHLRLGHINLN I RLVKSG+LNQLEDNSLPP
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSSNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSLPP

Query:  CDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGGKY
        C+SCLEGK+TKR FTGKGLRAK PLEL+H DLC PMNVKA+GGYEYFISFIDD+SRYGHVYL+ +KS+SFEKFKEYKAEVENE GKTI  TLRSDRGG+Y
Subjt:  CDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGGKY

Query:  MDLRFQDYLIEHGIQSQLSAPSTPQ
        MD +FQDYLIE GIQSQLSAPSTPQ
Subjt:  MDLRFQDYLIEHGIQSQLSAPSTPQ

KAA0025945.1 gag/pol protein [Cucumis melo var. makuwa]4.2e-8972.25Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY I+F +NEAFI++  +H+CS+ LENNLY LRP  A  VLN EMFRT  TQNKRQ++S  +N  LWHLRLGHINL+ IGRLVK+GLLN+L+D SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGKG RAK PLELIH DLC PMNVKA+GG+EYFISFIDDYSRYG++YL+++KS++ EKFKEYK EVEN   K I   LRSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDLRFQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

KAA0035907.1 gag/pol protein [Cucumis melo var. makuwa]6.7e-8770.93Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY I+F +NEAFI++  +H+CS+ LENNLY LRP  A  VLN EMFRT  TQNKRQ++S  +N  LWHLRLGHINL+ IGRLVK GLLN+L+D SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGKG RAK PLELIH DLC PMNVKA+G +EYFISFIDDYSRYG++YL+++KS++ EKFKEYK EVEN   K I    RSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDL FQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

KAA0060534.1 gag/pol protein [Cucumis melo var. makuwa]1.3e-8772.25Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSS--NALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY ISF +NEAFI +  +H+CS  LE+NLY L+P     VLN EMFRT  TQNKRQ++SS  N  LWHLRLGHINL+ IGRLVK+GLLN+LED+SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSS--NALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGKG RAK PLELIH DLC PMNVKA GG+EYFISFIDDYS YG++YLI++KS++ EKFKEYK EVEN   K I   LRSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDLRFQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

KAA0067938.1 gag/pol protein [Cucumis melo var. makuwa]3.2e-8169.16Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY I+F +NEAFI +       + LE+NLY LRP  A  VLN EMFRT  TQNKRQ++S  +N  LWHLRL HINL+ IGRLVK+GLLN+L+D+SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGK  RAK PLELIH DLC PMNVKA+GG+EYFISFIDDYSRYG++YL+++K ++ EKFKEYK EVEN   K I   LRSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDLRFQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

TrEMBL top hitse value%identityAlignment
A0A5A7T2V9 Gag/pol protein3.2e-8770.93Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY I+F +NEAFI++  +H+CS+ LENNLY LRP  A  VLN EMFRT  TQNKRQ++S  +N  LWHLRLGHINL+ IGRLVK GLLN+L+D SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGKG RAK PLELIH DLC PMNVKA+G +EYFISFIDDYSRYG++YL+++KS++ EKFKEYK EVEN   K I    RSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDL FQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

A0A5A7TZD0 Gag/pol protein2.0e-8972.25Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY I+F +NEAFI++  +H+CS+ LENNLY LRP  A  VLN EMFRT  TQNKRQ++S  +N  LWHLRLGHINL+ IGRLVK+GLLN+L+D SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGKG RAK PLELIH DLC PMNVKA+GG+EYFISFIDDYSRYG++YL+++KS++ EKFKEYK EVEN   K I   LRSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDLRFQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

A0A5A7VJG3 Gag/pol protein1.6e-8169.16Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY I+F +NEAFI +       + LE+NLY LRP  A  VLN EMFRT  TQNKRQ++S  +N  LWHLRL HINL+ IGRLVK+GLLN+L+D+SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVS--SNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGK  RAK PLELIH DLC PMNVKA+GG+EYFISFIDDYSRYG++YL+++K ++ EKFKEYK EVEN   K I   LRSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDLRFQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

A0A5D3BNE1 Gag/pol protein6.5e-8872.25Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSS--NALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL
        ++EHMY ISF +NEAFI +  +H+CS  LE+NLY L+P     VLN EMFRT  TQNKRQ++SS  N  LWHLRLGHINL+ IGRLVK+GLLN+LED+SL
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSS--NALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL

Query:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG
        PPC+SCLEGK+TKR FTGKG RAK PLELIH DLC PMNVKA GG+EYFISFIDDYS YG++YLI++KS++ EKFKEYK EVEN   K I   LRSDRGG
Subjt:  PPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGG

Query:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ
        +YMDLRFQDY+IEHGIQSQLSAP TPQ
Subjt:  KYMDLRFQDYLIEHGIQSQLSAPSTPQ

E2GK51 Gag/pol protein (Fragment)7.9e-10282.67Show/hide
Query:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSSNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSLPP
        +LEH+Y ISFE+NE FI  K I +CS+I ENNLYKLRPTRAN VLNTEMFRT ETQNK+QKVSSNA LWHLRLGHINLN I RLVKSG+LNQLEDNSLPP
Subjt:  MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSSNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSLPP

Query:  CDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGGKY
        C+SCLEGK+TKR FTGKGLRAK PLEL+H DLC PMNVKA+GGYEYFISFIDD+SRYGHVYL+ +KS+SFEKFKEYKAEVENE GKTI  TLRSDRGG+Y
Subjt:  CDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGGKY

Query:  MDLRFQDYLIEHGIQSQLSAPSTPQ
        MD +FQDYLIE GIQSQLSAPSTPQ
Subjt:  MDLRFQDYLIEHGIQSQLSAPSTPQ

SwissProt top hitse value%identityAlignment
P04146 Copia protein2.9e-1632.2Show/hide
Query:  KVSSNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL--------PPCDSCLEGKITKRCFTGKGLRAKT----PLELIHLDLCEPMNVKAQGGYEYFI
        K  +N  LWH R GHI   + G+L++    N   D SL          C+ CL GK  +  F  K L+ KT    PL ++H D+C P+         YF+
Subjt:  KVSSNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSL--------PPCDSCLEGKITKRCFTGKGLRAKT----PLELIHLDLCEPMNVKAQGGYEYFI

Query:  SFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ
         F+D ++ Y   YLI+ KSD F  F+++ A+ E      +   L  D G +Y+    + + ++ GI   L+ P TPQ
Subjt:  SFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-941.9e-2837.97Show/hide
Query:  LWHLRLGHINLNTIGRLVKSGLLNQLEDNSLPPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKS
        LWH R+GH++   +  L K  L++  +  ++ PCD CL GK  +  F     R    L+L++ D+C PM +++ GG +YF++FIDD SR   VY+++ K 
Subjt:  LWHLRLGHINLNTIGRLVKSGLLNQLEDNSLPPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKS

Query:  DSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ
          F+ F+++ A VE E+G+ +   LRSD GG+Y    F++Y   HGI+ + + P TPQ
Subjt:  DSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ

Q12491 Transposon Ty2-B Gag-Pol polyprotein3.8e-0825.84Show/hide
Query:  TTETQNKRQKVSSNAL-LWHLRLGHINLNTIGRLVKSGLLNQLEDNSLP-------PCDSCLEGKITKRCFTGKGLRAK-----TPLELIHLDLCEPMNV
        T    NK + V+     L H  LGH N  +I + +K   +  L+++ +         C  CL GK TK     KG R K      P + +H D+  P++ 
Subjt:  TTETQNKRQKVSSNAL-LWHLRLGHINLNTIGRLVKSGLLNQLEDNSLP-------PCDSCLEGKITKRCFTGKGLRAK-----TPLELIHLDLCEPMNV

Query:  KAQGGYEYFISFIDDYSRYGHVYLIQNKSDS--FEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGI
          +    YFISF D+ +R+  VY + ++ +      F    A ++N+    +   ++ DRG +Y +     +    GI
Subjt:  KAQGGYEYFISFIDDYSRYGHVYLIQNKSDS--FEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGI

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE13.0e-1330.38Show/hide
Query:  WHLRLGHINLNTIGRLVKSGLLNQLE-DNSLPPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKS
        WH RLGH   + +  ++ +  L+ L   +    C  CL  K  K  F+   + +  PLE I+ D+     + +   Y Y++ F+D ++RY  +Y ++ KS
Subjt:  WHLRLGHINLNTIGRLVKSGLLNQLE-DNSLPPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKS

Query:  DSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ
           E F  +K  +EN   +T   T  SD GG+++ L   +Y  +HGI    S P TP+
Subjt:  DSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE21.9e-1533.54Show/hide
Query:  WHLRLGHINLNTIGRLVKSGLLNQLE-DNSLPPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKS
        WH RLGH +L  +  ++ +  L  L   + L  C  C   K  K  F+   + +  PLE I+ D+     + +   Y Y++ F+D ++RY  +Y ++ KS
Subjt:  WHLRLGHINLNTIGRLVKSGLLNQLE-DNSLPPCDSCLEGKITKRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKS

Query:  DSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ
           + F  +K+ VEN   +T   TL SD GG+++ LR  DYL +HGI    S P TP+
Subjt:  DSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSAPSTPQ

Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTTAGAACATATGTACAGAATATCTTTTGAAATTAATGAAGCGTTCATTTTCCGAAAAGATATTCATGTTTGTTCTTCTATACTTGAAAACAACTTATATAAGTTAAG
ACCAACACGAGCAAACTTTGTCTTAAATACTGAAATGTTTAGAACAACTGAAACTCAGAATAAAAGACAAAAAGTTTCTTCCAATGCCTTATTATGGCACTTAAGACTTG
GTCACATAAATCTCAATACGATTGGGAGATTGGTTAAAAGTGGACTTCTAAATCAGTTAGAAGATAACTCTTTACCTCCATGTGATTCCTGTCTTGAAGGAAAAATTACC
AAAAGATGTTTTACTGGAAAAGGTCTTAGAGCTAAAACACCTTTAGAGCTCATACATTTGGACCTTTGTGAACCAATGAATGTCAAAGCTCAGGGAGGATACGAATATTT
CATCAGTTTTATTGATGATTATTCAAGGTATGGTCATGTTTACCTAATTCAGAACAAGTCTGATTCTTTTGAAAAGTTCAAAGAATATAAGGCTGAAGTTGAAAATGAAT
CAGGTAAAACAATAAATAGTACACTTCGATCAGATAGAGGTGGAAAGTATATGGACTTGCGATTCCAAGACTATTTGATAGAACATGGAATCCAATCACAACTCTCTGCA
CCTAGTACGCCTCAATAG
mRNA sequenceShow/hide mRNA sequence
ATGTTAGAACATATGTACAGAATATCTTTTGAAATTAATGAAGCGTTCATTTTCCGAAAAGATATTCATGTTTGTTCTTCTATACTTGAAAACAACTTATATAAGTTAAG
ACCAACACGAGCAAACTTTGTCTTAAATACTGAAATGTTTAGAACAACTGAAACTCAGAATAAAAGACAAAAAGTTTCTTCCAATGCCTTATTATGGCACTTAAGACTTG
GTCACATAAATCTCAATACGATTGGGAGATTGGTTAAAAGTGGACTTCTAAATCAGTTAGAAGATAACTCTTTACCTCCATGTGATTCCTGTCTTGAAGGAAAAATTACC
AAAAGATGTTTTACTGGAAAAGGTCTTAGAGCTAAAACACCTTTAGAGCTCATACATTTGGACCTTTGTGAACCAATGAATGTCAAAGCTCAGGGAGGATACGAATATTT
CATCAGTTTTATTGATGATTATTCAAGGTATGGTCATGTTTACCTAATTCAGAACAAGTCTGATTCTTTTGAAAAGTTCAAAGAATATAAGGCTGAAGTTGAAAATGAAT
CAGGTAAAACAATAAATAGTACACTTCGATCAGATAGAGGTGGAAAGTATATGGACTTGCGATTCCAAGACTATTTGATAGAACATGGAATCCAATCACAACTCTCTGCA
CCTAGTACGCCTCAATAG
Protein sequenceShow/hide protein sequence
MLEHMYRISFEINEAFIFRKDIHVCSSILENNLYKLRPTRANFVLNTEMFRTTETQNKRQKVSSNALLWHLRLGHINLNTIGRLVKSGLLNQLEDNSLPPCDSCLEGKIT
KRCFTGKGLRAKTPLELIHLDLCEPMNVKAQGGYEYFISFIDDYSRYGHVYLIQNKSDSFEKFKEYKAEVENESGKTINSTLRSDRGGKYMDLRFQDYLIEHGIQSQLSA
PSTPQ