; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0010847 (gene) of Snake gourd v1 genome

Gene IDTan0010847
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionHD domain-containing protein
Genome locationLG04:82320275..82323536
RNA-Seq ExpressionTan0010847
SyntenyTan0010847
Gene Ontology termsGO:0046856 - phosphatidylinositol dephosphorylation (biological process)
GO:0005783 - endoplasmic reticulum (cellular component)
GO:0005524 - ATP binding (molecular function)
GO:0043812 - phosphatidylinositol-4-phosphate phosphatase activity (molecular function)
InterPro domainsIPR003607 - HD/PDEase domain
IPR006674 - HD domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_008461844.1 PREDICTED: uncharacterized protein YpgQ [Cucumis melo]9.2e-11394.17Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MA+RETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLA+EEGLSS+TDSME+VELAALLHDIGDYKYLRD SEEK+VENFL EEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+VEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAI PRT LSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWDGKA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

XP_022153187.1 uncharacterized protein LOC111020741 [Momordica charantia]3.2e-11393.72Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MARRETVKKAE+LVE+AMGGNDASHDPSHVWRVR LALSLAEEEGLSSS DSME+VELAALLHDIGDYKYLRDP+EEK+VENFLEEEGI ENKKQ+ILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+ EYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSK+ YMNK+EQTTVNHFHEKLLKIKDLMKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWDGKA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

XP_022949582.1 uncharacterized protein LOC111452893 [Cucurbita moschata]8.3e-11494.62Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MARRETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLA+EEGLSS TDSME+VELAALLHDIGDYKYLRDPSEEK+VENFLEEEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+V+YSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKR LHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKD+MKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWD KA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

XP_022998496.1 uncharacterized protein LOC111493111 [Cucurbita maxima]5.4e-11394.62Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MARRETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLAEEEGLSS TDSME+VELAALLHDIGDYKYLRDPSEEK+VENFLEEEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+V+YSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAI PRTSLSKEAYMNKEEQTTVNHFHEKLLKIK +MKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWD KA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

XP_023523543.1 uncharacterized protein LOC111787737 [Cucurbita pepo subsp. pepo]3.7e-11495.07Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MARRETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLAEEEGLSS TDSME+VELAALLHDIGDYKYLRDPSEEK+VENFLEEEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+V+YSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKR LHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKD+MKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWD KA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

TrEMBL top hitse value%identityAlignment
A0A1S3CFI0 uncharacterized protein YpgQ4.4e-11394.17Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MA+RETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLA+EEGLSS+TDSME+VELAALLHDIGDYKYLRD SEEK+VENFL EEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+VEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAI PRT LSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWDGKA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

A0A5D3BWV0 Metal-dependent phosphohydrolase4.4e-11394.17Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MA+RETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLA+EEGLSS+TDSME+VELAALLHDIGDYKYLRD SEEK+VENFL EEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+VEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAI PRT LSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWDGKA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

A0A6J1DI90 uncharacterized protein LOC1110207411.5e-11393.72Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MARRETVKKAE+LVE+AMGGNDASHDPSHVWRVR LALSLAEEEGLSSS DSME+VELAALLHDIGDYKYLRDP+EEK+VENFLEEEGI ENKKQ+ILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+ EYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSK+ YMNK+EQTTVNHFHEKLLKIKDLMKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWDGKA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

A0A6J1GCI5 uncharacterized protein LOC1114528934.0e-11494.62Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MARRETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLA+EEGLSS TDSME+VELAALLHDIGDYKYLRDPSEEK+VENFLEEEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+V+YSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKR LHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKD+MKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWD KA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

A0A6J1KAC3 uncharacterized protein LOC1114931112.6e-11394.62Show/hide
Query:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI
        MARRETVKKAEELVE+AMGGNDASHDPSHVWRVR LALSLAEEEGLSS TDSME+VELAALLHDIGDYKYLRDPSEEK+VENFLEEEGI ENKKQKILAI
Subjt:  MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAI

Query:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR
        IKGMGFKEEIAGLS+V+YSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAI PRTSLSKEAYMNKEEQTTVNHFHEKLLKIK +MKTKAGQRR
Subjt:  IKGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRR

Query:  AEKRHKFMEEFLKEFYDEWDGKA
        AEKRHKFMEEFLKEFYDEWD KA
Subjt:  AEKRHKFMEEFLKEFYDEWDGKA

SwissProt top hitse value%identityAlignment
P46144 Uncharacterized protein YedJ7.5e-0928.5Show/hide
Query:  DASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDY----------KYLRDPSEEKLVENFLEEEGIGENKKQKILAIIKGMGFKEEIA
        DA+HD  H  RV   A  LA ++ +      M ++  A   HDI               L      +L+    E E     K + +   I    F  +IA
Subjt:  DASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDY----------KYLRDPSEEKLVENFLEEEGIGENKKQKILAIIKGMGFKEEIA

Query:  GLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVL---HDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRRAEKRHKFM
         L     + E  +VQDADRL+A+GAIG+AR F   G+    L    DP  + R           +++  ++HF  KLLK+   M+T  G++ A+    F+
Subjt:  GLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVL---HDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRRAEKRHKFM

Query:  EEFLKEFYDEWDGK
         EF+ +   E  G+
Subjt:  EEFLKEFYDEWDGK

P54168 Uncharacterized protein YpgQ6.6e-2134.55Show/hide
Query:  VKKAEEL---VELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENF--LEEEGIGENKKQKILAII
        +K+AE++   V+  +    + HD  HV RV  LA  + E+E        + +VE AAL+HD+ D K L D     + E +  L   G+G+    +++ II
Subjt:  VKKAEEL---VELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENF--LEEEGIGENKKQKILAII

Query:  KGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRRA
          M F++    L++   S E   VQDADRLDAIGA+GIAR F F G+K   L+                  +EQ+   HF  KLL++KD+M T   +  A
Subjt:  KGMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRRA

Query:  EKRHKFMEEFLKEFYDEWDG
        E+RH FM +F+++   +  G
Subjt:  EKRHKFMEEFLKEFYDEWDG

Q5UR59 Uncharacterized protein L8031.9e-0728.43Show/hide
Query:  ELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGD------------YKYLRDPSEEKLVENFLEEEGIGENKKQKILAIIK
        E     N A HD  H   VR  A+   + E +S+S      VE AA+LHD+ D             KY+ D    K+    +  +   +  KQ I+ +I 
Subjt:  ELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGD------------YKYLRDPSEEKLVENFLEEEGIGENKKQKILAIIK

Query:  GMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLH-DPAIRPRTSLSKEAYMNKE----------EQTTVNHFHEKLLKI
         +   +   G   VE S    + +DADRL+AIG IGI RC  +    K   + D   R +TS    ++ N++            + ++H+++KLL I
Subjt:  GMGFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLH-DPAIRPRTSLSKEAYMNKE----------EQTTVNHFHEKLLKI

Arabidopsis top hitse value%identityAlignment
AT1G17330.1 Metal-dependent phosphohydrolase9.8e-9778.8Show/hide
Query:  ETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAIIKGM
        +T++KAEELVE AM GNDASHD  HVWRVR LALS+A EEGLSS++DSME+VELAALLHDIGDYKY+RDPSEEKLVENFL++EGI E KK KIL II GM
Subjt:  ETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAIIKGM

Query:  GFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRRAEKR
        GFK+E+AG++  E  PEFGVVQDADRLDAIGAIGIARCFTFGGS+ RVLHDP I+PRT L+KE Y+ +EEQTT+NHFHEKLLK+K LMKT+AG+RRAEKR
Subjt:  GFKEEIAGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRRAEKR

Query:  HKFMEEFLKEFYDEWDG
        HKFMEE+LKEFY+EWDG
Subjt:  HKFMEEFLKEFYDEWDG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGAGAAGAGAAACAGTGAAGAAGGCGGAGGAGCTGGTGGAGTTGGCGATGGGCGGTAACGACGCGTCACACGATCCTTCTCACGTCTGGAGAGTTCGAGGCCTTGC
TCTCTCACTGGCCGAAGAAGAAGGCCTCTCTTCCAGCACCGACTCCATGGAAATGGTGGAACTTGCTGCGCTACTCCACGATATAGGTGATTACAAGTACTTGAGAGACC
CAAGTGAGGAAAAACTTGTGGAGAATTTTCTTGAGGAAGAGGGAATAGGGGAAAACAAGAAACAAAAGATATTAGCGATCATAAAGGGCATGGGCTTCAAGGAGGAGATT
GCTGGCCTTTCAGAAGTTGAATATTCTCCCGAGTTTGGGGTGGTTCAAGATGCTGATCGTTTAGATGCAATTGGTGCTATTGGAATTGCAAGATGCTTCACTTTCGGTGG
AAGCAAGAAGAGAGTGCTGCACGATCCTGCAATTCGTCCTCGAACAAGTTTATCGAAAGAAGCATACATGAACAAAGAAGAGCAGACTACCGTGAATCACTTCCATGAGA
AGCTACTAAAAATAAAGGATTTAATGAAAACAAAGGCTGGACAGAGGAGGGCAGAGAAAAGGCACAAGTTCATGGAGGAATTCCTGAAGGAATTTTATGATGAATGGGAT
GGAAAAGCTTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCGAGAAGAGAAACAGTGAAGAAGGCGGAGGAGCTGGTGGAGTTGGCGATGGGCGGTAACGACGCGTCACACGATCCTTCTCACGTCTGGAGAGTTCGAGGCCTTGC
TCTCTCACTGGCCGAAGAAGAAGGCCTCTCTTCCAGCACCGACTCCATGGAAATGGTGGAACTTGCTGCGCTACTCCACGATATAGGTGATTACAAGTACTTGAGAGACC
CAAGTGAGGAAAAACTTGTGGAGAATTTTCTTGAGGAAGAGGGAATAGGGGAAAACAAGAAACAAAAGATATTAGCGATCATAAAGGGCATGGGCTTCAAGGAGGAGATT
GCTGGCCTTTCAGAAGTTGAATATTCTCCCGAGTTTGGGGTGGTTCAAGATGCTGATCGTTTAGATGCAATTGGTGCTATTGGAATTGCAAGATGCTTCACTTTCGGTGG
AAGCAAGAAGAGAGTGCTGCACGATCCTGCAATTCGTCCTCGAACAAGTTTATCGAAAGAAGCATACATGAACAAAGAAGAGCAGACTACCGTGAATCACTTCCATGAGA
AGCTACTAAAAATAAAGGATTTAATGAAAACAAAGGCTGGACAGAGGAGGGCAGAGAAAAGGCACAAGTTCATGGAGGAATTCCTGAAGGAATTTTATGATGAATGGGAT
GGAAAAGCTTGA
Protein sequenceShow/hide protein sequence
MARRETVKKAEELVELAMGGNDASHDPSHVWRVRGLALSLAEEEGLSSSTDSMEMVELAALLHDIGDYKYLRDPSEEKLVENFLEEEGIGENKKQKILAIIKGMGFKEEI
AGLSEVEYSPEFGVVQDADRLDAIGAIGIARCFTFGGSKKRVLHDPAIRPRTSLSKEAYMNKEEQTTVNHFHEKLLKIKDLMKTKAGQRRAEKRHKFMEEFLKEFYDEWD
GKA