; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cmc07g0186121 (gene) of Melon (Charmono) v1.1 genome

Gene IDCmc07g0186121
OrganismCucumis melo var. cantalupensis cv. Charmono (Melon (Charmono) v1.1)
DescriptionRetrotransposon protein
Genome locationCMiso1.1chr07:4098765..4106042
RNA-Seq ExpressionCmc07g0186121
SyntenyCmc07g0186121
Gene Ontology termsGO:0005634 - nucleus (cellular component)
GO:0016787 - hydrolase activity (molecular function)
GO:0046872 - metal ion binding (molecular function)
InterPro domainsIPR027806 - Harbinger transposase-derived nuclease domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0031556.1 retrotransposon protein [Cucumis melo var. makuwa]1.0e-10591.94Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

KAA0035776.1 retrotransposon protein [Cucumis melo var. makuwa]4.6e-10692.42Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYF MIHES+LMCRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCLDALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

KAA0056561.1 retrotransposon protein [Cucumis melo var. makuwa]1.0e-10591.94Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

KAA0058874.1 retrotransposon protein [Cucumis melo var. makuwa]8.9e-11891.6Show/hide
Query:  MDQQTLIGVLTAFTLAQRQILLTLELLMNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMF
        MD+QTLIGVLTAFT AQRQILLTLELLMNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MF
Subjt:  MDQQTLIGVLTAFTLAQRQILLTLELLMNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMF

Query:  LHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVC
        LHVLAHDVKNR+IQREFVRSGETVSRHFNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI TNVLGVC
Subjt:  LHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVC

Query:  DTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVPKG
        DTKGDF YVLAGWEGSAAD RILR+A+S ENGLQVPKG
Subjt:  DTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVPKG

TYK27061.1 retrotransposon protein [Cucumis melo var. makuwa]1.0e-10591.94Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

TrEMBL top hitse value%identityAlignment
A0A5A7T0N7 Retrotransposon protein2.2e-10692.42Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYF MIHES+LMCRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCLDALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

A0A5A7UST8 Retrotransposon protein4.9e-10691.94Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

A0A5A7UUT3 Retrotransposon protein4.3e-11891.6Show/hide
Query:  MDQQTLIGVLTAFTLAQRQILLTLELLMNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMF
        MD+QTLIGVLTAFT AQRQILLTLELLMNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MF
Subjt:  MDQQTLIGVLTAFTLAQRQILLTLELLMNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMF

Query:  LHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVC
        LHVLAHDVKNR+IQREFVRSGETVSRHFNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI TNVLGVC
Subjt:  LHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVC

Query:  DTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVPKG
        DTKGDF YVLAGWEGSAAD RILR+A+S ENGLQVPKG
Subjt:  DTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVPKG

A0A5D3D7X8 Retrotransposon protein4.9e-10691.94Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

A0A5D3DTQ4 Retrotransposon protein4.9e-10691.94Show/hide
Query:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH
        MNNNKRLPHTP DTRHRIRELAYFRMIHES+L+CRQSTRMDRRT AILCHLLRNVAGLSSTEIVDVEEMV MFLHVLAHDVKNR+IQREFVRSGETVSRH
Subjt:  MNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRH

Query:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL
        FNIVLLAVLRLYEELI RPV VT+NCNDQRWKCFENCL ALDGTYIKVNVPA DRPTFRT KGEI+TNVLGVCDTKGDF YVLAGWEGSAAD RILRDA+
Subjt:  FNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDAL

Query:  SGENGLQVPKG
        S ENGLQVPKG
Subjt:  SGENGLQVPKG

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G43722.1 unknown protein8.8e-1529.02Show/hide
Query:  FRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPV---
        +R + +    C Q  RM       LC++L+    L  T  + +EE V MFL +  H+   R +   F R+ ETV R F  VL A   L  + I  P    
Subjt:  FRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPV---

Query:  ---LVTNNCNDQR-WKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVP
           +      DQR W  F   + A+DGT++ V V    +  +       S N++ +CD K  F Y+  G  GS  D  +L+ A   ++   +P
Subjt:  ---LVTNNCNDQR-WKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVP

AT5G28730.1 unknown protein7.7e-1131.15Show/hide
Query:  IHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVTNNC
        I+ + + C+   RM       LC +L    GL S+  + ++E V +FL + A +   R I   F  + ET+ R F+ VL A+ RL  E I RP  V    
Subjt:  IHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVTNNC

Query:  NDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVP
          +  +   N L   D T        R  P      G  S NVL +CD    F Y   G  GS  D R+L  A+S +    VP
Subjt:  NDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVP

AT5G28950.1 unknown protein2.6e-1446.15Show/hide
Query:  FENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALS-GENGLQVPK
        F++C+ A+D T+I   V  +  P+FR  KG+IS N+L  C+   +F YVL+GWEGSA D ++L DAL+   N L VP+
Subjt:  FENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALS-GENGLQVPK

AT5G41980.1 CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (InterPro:IPR006912)7.7e-2735.11Show/hide
Query:  FRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVT
        +++++  N  C ++ RMD+     LC LL+    L  T  + +E  + +FL ++ H+++ R +Q  F  SGET+SRHFN VL AV+ + ++         
Subjt:  FRMIHESNLMCRQSTRMDRRTSAILCHLLRNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVT

Query:  NNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVPKG
           ND  +  F++C+  +D  +I V V   ++  FR   G ++ NVL        F YVLAGWEGSA+D ++L  AL+  N LQVP+G
Subjt:  NNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCKGEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVPKG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCCGATGGAGCTTGGTAGGAAGCTTTTGCGGCCATGTGACATCGCGATTCACGAGTTTACCATTCGAAGAGGAAACTTTACATACATTTTAATGGATCAACAAACACT
TATTGGAGTCCTAACTGCATTCACGTTGGCTCAACGTCAGATTTTACTAACGTTGGAGCTATTAATGAACAACAATAAGCGTCTCCCACATACACCTTCCGATACACGCC
ATAGAATTAGGGAGCTTGCGTACTTTCGCATGATACACGAGTCAAATCTTATGTGTCGGCAGAGCACGCGGATGGATAGGCGAACATCCGCAATTTTATGCCATTTACTT
AGAAATGTGGCTGGTCTTTCGTCGACTGAGATTGTCGATGTTGAGGAAATGGTAGTAATGTTCTTGCACGTCCTTGCTCATGACGTGAAGAACCGCATCATCCAACGAGA
ATTTGTACGGTCCGGTGAGACAGTATCTCGACATTTTAACATCGTATTGTTGGCTGTTCTTCGACTGTACGAGGAGTTGATAATGAGACCTGTTCTGGTAACAAATAACT
GCAATGATCAACGTTGGAAGTGTTTCGAGAATTGCCTTGACGCGTTAGACGGAACGTACATAAAGGTCAACGTCCCCGCAAGAGATCGGCCTACATTCAGAACGTGTAAG
GGGGAAATTTCCACAAACGTTCTGGGGGTGTGTGACACGAAAGGGGATTTCGGTTATGTCCTCGCCGGTTGGGAAGGATCCGCAGCAGACTTGCGGATCCTACGTGATGC
CCTTTCAGGAGAAAATGGACTACAAGTGCCAAAGGGTATATCTTCTTTATAA
mRNA sequenceShow/hide mRNA sequence
TAGAAGTGAATACTCAAGAAGGAATTCGTCCAACGACAAAATTCAACTTTTACCTAGTGGTTCGGTTCATGACGCTTCTATGGTTGCAAGGTTTCTTATTTCTACTATTG
TTCGTTCTCGTGCTACTTTCTAACTTGAGAATATTGTTGATCTGATTTAGTGTTTTTTCTTCTTTTTGCTTGTTTTGCATGATGTTTTGTGCTTGAGGTGTTTTCCTCGA
CGATTTTGTATTTTGTTGTGCATTTTATTTTATGCCTTGAAATCGGATTCCAAGATCCTAGTGTTGTTTGTACTTACCAGAAATCACTAGTATTTTTTTTTTTTTTTTTT
TGGAAAAAAAGGTTTTCAAATCAAATGAAAAATTAAACCCATTTTAAAATGGGATAATTATGATGTATTGAATTTCTTTGACCATTTAAAATAGAACTAATAAAGTAAAA
TATGCTATAAATGGAATATGAACTAACCACCGTATTTTACAAATAAATATTAGGTCGAGAGAGATGGATGCATTTATTTATTTTTCTCGCTTTTTAAATAGAGAAAGTTA
TTTTTTATCTTTTTAGAATATATGAATGTAAAAGGAAAGAGTCTCAACTTTTAACCTCACGAGAGCAATATTATAAATTTTAAAATTAGTAAATTATGTTCATTTTTCAA
TTATTTAAAGACAATAGCAGATCAACAAAATTTATATAGGGATCATTGTACAATAAACACACTAAAATATGATTAAAAAATATTAATAGCTTCAAAAATTAATTAATTTA
ATATGTATTACAATCATCATCTATGAATTTTTATGTTTTGAAATCGATTTCGGATAAATTTATTATCTACCTTATCCAATAAATCTAATGATGAATGAAAAATATTATCG
TATAGCCTTTAATTTTGAAATTAAATAAAATAAATATATACATACTTAAGTATGTAAATGTGAATTTAAAAATTACATAAAAAAAGAAAAGAAAAAGAAAAGAATATTAT
CTATTTCATGAAGTATTGTTGAGAGAATGGAAGTTTAGATCACTGCATTTTTTTTTCTAAATGTTTGTTAGATAACAAATGATGATTAGAAAATAAGTTAGGATTTTATC
TTAGTTAATTTTTTTCCTCTTTTTAAAAGATTATCTTTCTCTTATGACATTATTGAAATTTGAGGATAAAATTGAAACTCAGAGTCTTTGGCACAATCATTATGATACAA
TCATACTTTGTTTAAAATAAAACATTATTTAATACATATTATAGTTTGACACTTTAAAATAAAGACTAAAATACACAATTCGATAATATGAATGGGGGCATATGCCCCCG
CTGGACCTTTAGTAAATCTTCCTCGTTTAAAGACACATTTAGTTTATGTGTGTTAAGTTAATTATTATACCTATATCAAATAACGACATATCTATTAACGCCTTTGGAAA
AAGTAATTTCCATCTATTAAACTATGTTTAGGGTAATTATATTCCAATTTCATTATAAACCTAGGTGGAAAGGGTGTTAGTTAAAAGTTTATAGTTAAAATGAATTTGAA
TATCATTTTGTTGGTTAAATTTTTTACTAAAAAAGTTTATAAGCATTAATCAAGTATGAGACGCGATGATTATATATTCTAAAAAGGGCAAAAAGAAAAAATATTAAAAA
TGGGAGTGTATAAATATAAAAGGTTAATTTTCATAAATATAACAAAATATCAATAATTTCAAGTTTCTTTTCTCTTTCTACAATTTTCTTTTTCAAACTATTATTTGGTT
ATTCAAGATCGTGTACCAAATATAAAGATTATTTGATCGTGTACCATAATCTAAAAAATAATCATTTAGATCTTGCTAACCGAATTTAAACGATAAAATCGATTGTCTAC
CAAATCTAAACGATCGTTAATAAAAAATAGTCAAACAAATCTAAACGTGTAACAAAGAATCTTAAAAAAATCTAAATAACTATTTACCAAATATATTATACGTTACATGT
AATTAATCATGAGATATGAGATATTTTTTGTATTTTCTATTGTAGATCTCTAGACAGTGTAAATATTTTAGCCCTTTATTATATTTTTGAAAAACCTAAAATATAAGGGA
TAGTTGCAAATATAGCAATTATAATCAAAATAATGAAGTATATAGCAAAATTTTAAAAAAATTGCAAATATAGCAAAATCTGTCAAAATCTATCAATGTTAGGAATCTAT
CACTGATAGACCATGTAACAAATGTTGGTCTATCATTGATAAACCTTAAGAGTCTATCAATGTTATCTATCACCGATAGACTTTGTTATATTTGCAATTTTTTAAAAATA
TTGCTACATACTTAATAATTATTCTAAAAATTGCTACCTATTATAATAACCCAAAATATAAACAGTAAGGGCATGTTTAAGGTTAGGGTTAACTCTACGGGTTTAGGTTA
GCCCAACCCTAACCCCTGTTTGGGCTAAGGTTTTAGGGTTTTCATAAACCCGTTTTAACCGTTTTCTTCTTTCAAATCGTATCTGCCGAAATCCCCCTTCAATTCGTGTT
GCGCCTCCTTTCAACTCGTGTTGCCACCTCCCTCCAACCCGTGTTTTCGCCTCCCTCTGATCTGTGTTTACGCCTCTGTTTGTCAATCTTCTTCCTTCACTTCCGTCTCC
CTGTCATTATTGTCTCTAATTACGTTCCATTTAGATTTCCACATTCGATTCACCATAATTTCCCTCAATTGTTTTTTCTGAAATCCACTGCGAATGGAAAAATCCCTTCA
ACCCACATTTCTTCTTTTCGGCTTCCGACTCCTTTGCTTTATTGTTCTCCGGATTCACTTCTATATTCGATTTTGGTCGATTCCTTGTAGGGTAGTTCGGCTAGTCTCGA
AATTTTGGCCGAAAATCCCCTTTTATTTATTTACTTTAAGTACTCATTTGCTCTTTTTAAATAGTACACTGCACTGCCATACTATACTTCTCCATCTCCAATTGCAACCT
TGTAGGTTTCCCCATTTCATAAAAATACCCACCTAACCCTTTCCTCAAACAATTCTTATCATAAAATTCACATAAACCTACCCACATAATCATTCTTCCAAACACATCTT
ATCATAACACTACTATAACACTACTTACACAACCCTTCCCACAAACACACATCTTGTTCATAACACTATTATAACTCTTCCCACATAATCATTTCTCCAAACACATTTTA
TCACAAAACTACATTTTTAAACATTTCCTCCAAACAAGGATTATGATAAAATTAGGTTTATCATAACACTAAGGGCCCGTTTGGGGTTAGGGTTGGGACTGTGGGCTTAG
GTTAGCCCAACCCTAACCCCCGTTTGGGCCGAAGGTTAAGGAAACATGGGTTTCCTTAACCCGTTTTTGTCTGCCACAAAGAACGCTGATTCGCATCTTCCCCATTTTCA
TTAATCCGGTTTCGTCGTTTTCCTCAATTCGTCTTCCATTTTCATGTTGAAACAGTATTAAATCTTCTCCTCCATTCGTCTTCATCGAAAATATTTTTGTTTTTCTGTTC
TTTCTGTCATCTCCCTCAAGGAAAGAAGTTCTCCTTCTTTCGATTCGTCTTCTCCCTCAACGAATCGAGGGTTTCTGTTCGTTCTGTGTTCTCCGCTCCATTTCGTTTTG
TTTCGTCTTCATCCTTTAATCCATTTCGTTCGTTTTGTATCGTCGTCTCCCTCAACGAATCGAGTTCTCCTTATTATTTCCTTCTGTGTTGTCTGTAATGAAATCAACTT
CTCCTTCTATCGTTTTATCTTCTCCCTCAATCCATCTGCATGCAAAATCCATGGATCCTAACCCGCATTTTCTGTATATTTTCTTCCTTCATTCGACCGTTGCGTTTTCG
CGATGAAACCCGATTTCGTTACGCCGAATTTCTCTCTACATCTCTCTCGCTCTCGAAAGGTTTTCTGTGTTTGTTGAAGCCGACCGTTCAACGTCGTTGGCTCCAAACAC
GATTTTCTTTTGGAATCTAGGGTTTTGCCTCCTTATTTACTCCTTGCCGCTCGCGGTTCCATTGTTGCGGCCGGGTGTTTCGCTTGCGATTTGGTGATTCCCTTCACTGA
TAAGACAGAAACTTCACACCATTGTTGTCTGCCATTGGATGCCGATGGAGCTTGGTAGGAAGCTTTTGCGGCCATGTGACATCGCGATTCACGAGTTTACCATTCGAAGA
GGAAACTTTACATACATTTTAATGGATCAACAAACACTTATTGGAGTCCTAACTGCATTCACGTTGGCTCAACGTCAGATTTTACTAACGTTGGAGCTATTAATGAACAA
CAATAAGCGTCTCCCACATACACCTTCCGATACACGCCATAGAATTAGGGAGCTTGCGTACTTTCGCATGATACACGAGTCAAATCTTATGTGTCGGCAGAGCACGCGGA
TGGATAGGCGAACATCCGCAATTTTATGCCATTTACTTAGAAATGTGGCTGGTCTTTCGTCGACTGAGATTGTCGATGTTGAGGAAATGGTAGTAATGTTCTTGCACGTC
CTTGCTCATGACGTGAAGAACCGCATCATCCAACGAGAATTTGTACGGTCCGGTGAGACAGTATCTCGACATTTTAACATCGTATTGTTGGCTGTTCTTCGACTGTACGA
GGAGTTGATAATGAGACCTGTTCTGGTAACAAATAACTGCAATGATCAACGTTGGAAGTGTTTCGAGAATTGCCTTGACGCGTTAGACGGAACGTACATAAAGGTCAACG
TCCCCGCAAGAGATCGGCCTACATTCAGAACGTGTAAGGGGGAAATTTCCACAAACGTTCTGGGGGTGTGTGACACGAAAGGGGATTTCGGTTATGTCCTCGCCGGTTGG
GAAGGATCCGCAGCAGACTTGCGGATCCTACGTGATGCCCTTTCAGGAGAAAATGGACTACAAGTGCCAAAGGGTATATCTTCTTTATAATAAAACACTGT
Protein sequenceShow/hide protein sequence
MPMELGRKLLRPCDIAIHEFTIRRGNFTYILMDQQTLIGVLTAFTLAQRQILLTLELLMNNNKRLPHTPSDTRHRIRELAYFRMIHESNLMCRQSTRMDRRTSAILCHLL
RNVAGLSSTEIVDVEEMVVMFLHVLAHDVKNRIIQREFVRSGETVSRHFNIVLLAVLRLYEELIMRPVLVTNNCNDQRWKCFENCLDALDGTYIKVNVPARDRPTFRTCK
GEISTNVLGVCDTKGDFGYVLAGWEGSAADLRILRDALSGENGLQVPKGISSL