; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

PI0004881 (gene) of Melon (PI 482460) v1 genome

Gene IDPI0004881
OrganismCucumis metuliferus PI 482460 (Melon (PI 482460) v1)
DescriptionProtein of unknown function (DUF1997)
Genome locationchr03:7346802..7349331
RNA-Seq ExpressionPI0004881
SyntenyPI0004881
Gene Ontology termsNA
InterPro domainsIPR018971 - Protein of unknown function DUF1997


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004138686.1 uncharacterized protein LOC101206849 isoform X1 [Cucumis sativus]1.9e-11992.65Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MAFSSCSPSSISLHYKNPKTPFSLT KPFLILASSANDS RPSLPISTNSNPKARFIARRSES TVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RC+VYRFKFFAFEVCPVLVV+VE+QPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRGNS  QKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

XP_008456550.1 PREDICTED: uncharacterized protein SYNPCC7002_A1590 isoform X1 [Cucumis melo]2.9e-12092.65Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MAFSSCSPSSISLHYKN KTPFS T KPFLILASSANDS RPSLPISTNSNPKARF+ARRSES TVRQL RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVLVVRVE+QPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRF AQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

XP_022939662.1 uncharacterized protein LOC111445487 isoform X2 [Cucurbita moschata]2.2e-11588.57Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MA SSCSP+SISLH ++P+T FS+T++PF+ILASSA+DSPRPSL IS NSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

XP_022992978.1 uncharacterized protein LOC111489142 isoform X2 [Cucurbita maxima]1.1e-11488.16Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MA SSCSP+SISLH ++P+  FS+T++PF+ILASSA+DSPRPSL IS NSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

XP_038883978.1 uncharacterized protein SYNPCC7002_A1590 isoform X1 [Benincasa hispida]2.6e-11690.2Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MA SSCSPSSISL  KNP+T FSLT +PFLILASSA+DSPRPSL ISTNSNPKARFIARRSES TVRQLARPLNEYMSLPASQYSVLDAERIER+DD TF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTS+TVIEV   +    FAFRAIP+QAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

TrEMBL top hitse value%identityAlignment
A0A0A0LPW1 Uncharacterized protein2.5e-11790.4Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPL-----NEYMSLPASQYSVLDAERIERI
        MAFSSCSPSSISLHYKNPKTPFSLT KPFLILASSANDS RPSLPISTNSNPKARFIARRSES TVRQLARPL     +EYMSLPASQYSVLDAERIERI
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPL-----NEYMSLPASQYSVLDAERIERI

Query:  DDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAI
        DDCTFRC+VYRFKFFAFEVCPVLVV+VE+QPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRGNS  QKLTSDTVIEV   +    FAFRAI
Subjt:  DDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAI

Query:  PVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        PVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  PVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

A0A1S3C468 uncharacterized protein SYNPCC7002_A1590 isoform X11.4e-12092.65Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MAFSSCSPSSISLHYKN KTPFS T KPFLILASSANDS RPSLPISTNSNPKARF+ARRSES TVRQL RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVLVVRVE+QPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRF AQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

A0A5D3BDM7 Uncharacterized protein1.4e-12092.65Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MAFSSCSPSSISLHYKN KTPFS T KPFLILASSANDS RPSLPISTNSNPKARF+ARRSES TVRQL RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVLVVRVE+QPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRF AQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

A0A6J1FHF9 uncharacterized protein LOC111445487 isoform X21.1e-11588.57Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MA SSCSP+SISLH ++P+T FS+T++PF+ILASSA+DSPRPSL IS NSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

A0A6J1K0U6 uncharacterized protein LOC111489142 isoform X25.2e-11588.16Show/hide
Query:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
        MA SSCSP+SISLH ++P+  FS+T++PF+ILASSA+DSPRPSL IS NSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI
        RCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEV   +    FAFRAIPVQAI
Subjt:  RCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAI

Query:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
        ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTG+I
Subjt:  ESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT4G31115.1 Protein of unknown function (DUF1997)1.2e-1828.21Show/hide
Query:  YKNPKTPFSLTQKPFLILASSANDSPRPSLPI-STNSNPKARFIA---RRSESATVRQLAR---------PLNEYMSLPASQYSVLDAERIER---IDDC
        ++ PKT  S       +L S  N  PR  + + + +S  +A  I+   + + SA+ +Q  +           +E++  P+   +V++A+ ++    +DD 
Subjt:  YKNPKTPFSLTQKPFLILASSANDSPRPSLPI-STNSNPKARFIA---RRSESATVRQLAR---------PLNEYMSLPASQYSVLDAERIER---IDDC

Query:  --TFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIP
          T+RC + + +  +FEV PVLV+RV      C ++LLSCKLEGS ++  Q+++F A M N +++++     P   L  D  + V   +    F    +P
Subjt:  --TFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIP

Query:  VQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW
        V A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  VQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW

AT4G31115.2 Protein of unknown function (DUF1997)9.0e-1931.48Show/hide
Query:  NEYMSLPASQYSVLDAERIER---IDDC--TFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNS
        +E++  P+   +V++A+ ++    +DD   T+RC + + +  +FEV PVLV+RV      C ++LLSCKLEGS ++  Q+++F A M N +++++     
Subjt:  NEYMSLPASQYSVLDAERIER---IDDC--TFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNS

Query:  PLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW
        P   L  D  + V   +    F    +PV A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  PLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW

AT5G04440.1 Protein of unknown function (DUF1997)2.2e-8162.88Show/hide
Query:  MAFSSCSPSSISLHY------KNPKTP---FSLTQKPFLILASSANDSPRPS----------LPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPA
        MA SS +    SL +      +NP+ P   F++T       +SS ++SP+PS          + +S++S PKARFIAR+ +S +VRQL RPL EYMSLPA
Subjt:  MAFSSCSPSSISLHY------KNPKTP---FSLTQKPFLILASSANDSPRPS----------LPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPA

Query:  SQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEV
        SQYSVLDAERIER+DD TFRCYVY FKFF FEVCPVL+VRVE QPNGCCIKLLSCKLEGSP+VVAQNDKFDA MVN++S D  +  S  Q++TSD VIEV
Subjt:  SQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEV

Query:  MAMLFNNSFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI
           +    FAFR  PV AIE+ GTQVL+QILKLMLPRF +QL KDY AWASGDTSRQPLGTG+I
Subjt:  MAMLFNNSFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGKI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCCTTCAGTTCTTGCTCTCCGTCTTCCATTTCCCTGCACTACAAAAACCCTAAAACCCCTTTTTCTCTCACCCAGAAACCATTCCTTATACTTGCTTCCTCTGCAAA
CGATTCTCCCAGGCCTTCACTGCCAATCTCCACGAATTCCAATCCCAAAGCCCGCTTCATCGCCCGGAGGAGCGAGTCCGCCACGGTTCGGCAGCTGGCACGGCCTCTAA
ATGAGTATATGAGTTTGCCAGCTAGTCAGTACTCGGTGTTAGATGCGGAGAGGATTGAACGGATTGATGATTGTACTTTTAGGTGTTATGTTTATAGATTTAAGTTCTTT
GCTTTTGAGGTTTGCCCTGTTTTGGTTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTTTCATGTAAGCTTGAGGGCTCCCCAATTGTGGTTGCACA
GAATGATAAATTTGACGCTTATATGGTGAACCAGATCTCTTACGATGTGAATCGAGGCAACTCACCCTTGCAGAAACTCACATCAGACACAGTCATTGAGGTAATGGCAA
TGTTATTCAACAATTCCTTTGCCTTCCGTGCAATTCCTGTACAAGCAATTGAATCAGCTGGGACCCAAGTCCTTGAACAGATATTGAAGCTTATGCTTCCTCGCTTCACA
GCCCAGCTTGTGAAGGACTATCAAGCATGGGCCTCTGGTGATACATCAAGGCAACCTCTTGGAACAGGTAAAATCTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCCTTCAGTTCTTGCTCTCCGTCTTCCATTTCCCTGCACTACAAAAACCCTAAAACCCCTTTTTCTCTCACCCAGAAACCATTCCTTATACTTGCTTCCTCTGCAAA
CGATTCTCCCAGGCCTTCACTGCCAATCTCCACGAATTCCAATCCCAAAGCCCGCTTCATCGCCCGGAGGAGCGAGTCCGCCACGGTTCGGCAGCTGGCACGGCCTCTAA
ATGAGTATATGAGTTTGCCAGCTAGTCAGTACTCGGTGTTAGATGCGGAGAGGATTGAACGGATTGATGATTGTACTTTTAGGTGTTATGTTTATAGATTTAAGTTCTTT
GCTTTTGAGGTTTGCCCTGTTTTGGTTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTTTCATGTAAGCTTGAGGGCTCCCCAATTGTGGTTGCACA
GAATGATAAATTTGACGCTTATATGGTGAACCAGATCTCTTACGATGTGAATCGAGGCAACTCACCCTTGCAGAAACTCACATCAGACACAGTCATTGAGGTAATGGCAA
TGTTATTCAACAATTCCTTTGCCTTCCGTGCAATTCCTGTACAAGCAATTGAATCAGCTGGGACCCAAGTCCTTGAACAGATATTGAAGCTTATGCTTCCTCGCTTCACA
GCCCAGCTTGTGAAGGACTATCAAGCATGGGCCTCTGGTGATACATCAAGGCAACCTCTTGGAACAGGTAAAATCTGA
Protein sequenceShow/hide protein sequence
MAFSSCSPSSISLHYKNPKTPFSLTQKPFLILASSANDSPRPSLPISTNSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFF
AFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVMAMLFNNSFAFRAIPVQAIESAGTQVLEQILKLMLPRFT
AQLVKDYQAWASGDTSRQPLGTGKI