; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lag0014387 (gene) of Sponge gourd (AG-4) v1 genome

Gene IDLag0014387
OrganismLuffa acutangula AG-4 (Sponge gourd (AG-4) v1)
DescriptionS-adenosyl-L-methionine-dependent methyltransferases superfamily protein
Genome locationchr12:238182..249622
RNA-Seq ExpressionLag0014387
SyntenyLag0014387
Gene Ontology termsNA
InterPro domainsIPR029063 - S-adenosyl-L-methionine-dependent methyltransferase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004148295.1 uncharacterized protein LOC101213378 isoform X1 [Cucumis sativus]4.1e-9678.57Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYALAP IN RPWSFGFVT  +S   LSRSLN + F   + YSSVGKLT+ATG+ SFRRV         EDEDE+E+VFQVLT++TS+YNDIVIVDTPK
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SR+LLLDSS    +NVHSIL KEQMWTGSYWDEFASLPAIIP+GPIAI GLGGGTTAHLMLASWPSLQLEGWEIDGILID+AR+F GLS LEKHS DGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPSVRISGGYAGIVIDLFS+G +L QLQQ
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

XP_022147905.1 uncharacterized protein LOC111016725 isoform X1 [Momordica charantia]3.7e-9780.25Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYA APQINSRPWS   VT+ A SLC   SLNF KF  D + S  GKLTRATG+ SFRRVADEEE+E      E+ED FQVLT+ITSNYNDIVIV+TPK
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SRVLLLDSS    +NVHSIL KEQ WTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLML SWPSLQLEGWEIDGILID+ARDF GLS LEKHS DGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPSVRISGGYAGIV+DLFSDG IL QLQ+
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

XP_022969379.1 uncharacterized protein LOC111468401 isoform X1 [Cucurbita maxima]5.9e-9578.15Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYALAPQI +RPWSFG V +  S   L  SLNF K  SD  YSSVGKLTRATG+PSFR V +  EE+E+         FQVLT+ TS YNDIVIVDTP+
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SR+LLLDSS    +NVHSIL KEQ+WTGSYWDEFASLPAIIP+GPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILID+ARDFFGLS LEKHSDDGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPS RISGGYAGIVIDLFSDG+IL QLQQ
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

XP_031744714.1 uncharacterized protein LOC101213378 isoform X2 [Cucumis sativus]4.1e-9678.57Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYALAP IN RPWSFGFVT  +S   LSRSLN + F   + YSSVGKLT+ATG+ SFRRV         EDEDE+E+VFQVLT++TS+YNDIVIVDTPK
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SR+LLLDSS    +NVHSIL KEQMWTGSYWDEFASLPAIIP+GPIAI GLGGGTTAHLMLASWPSLQLEGWEIDGILID+AR+F GLS LEKHS DGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPSVRISGGYAGIVIDLFS+G +L QLQQ
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

XP_038876684.1 uncharacterized protein LOC120069080 isoform X1 [Benincasa hispida]2.2e-9779.92Show/hide
Query:  MAYALAPQINSRPWSFGFV-TVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTP
        MAYA+APQI+SRPWSFGFV ++ +S+  LS SLN  KF SD+ YSSVG+LTRATGE SFRRV DEEEEE          VFQVLT++TSNYNDIVIVDTP
Subjt:  MAYALAPQINSRPWSFGFV-TVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTP

Query:  KSRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGG
        KSR+LLLDSS    +NVHSIL K+QMWTGSYWDEF SLPAIIP+GPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILID+AR F GLS LEKHSDDGG
Subjt:  KSRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGG

Query:  ILNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        ILNI+IGDALDPSVRISGGYAGIVIDLFSDG IL QLQQ
Subjt:  ILNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

TrEMBL top hitse value%identityAlignment
A0A0A0K7K7 Uncharacterized protein2.0e-9678.57Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYALAP IN RPWSFGFVT  +S   LSRSLN + F   + YSSVGKLT+ATG+ SFRRV         EDEDE+E+VFQVLT++TS+YNDIVIVDTPK
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SR+LLLDSS    +NVHSIL KEQMWTGSYWDEFASLPAIIP+GPIAI GLGGGTTAHLMLASWPSLQLEGWEIDGILID+AR+F GLS LEKHS DGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPSVRISGGYAGIVIDLFS+G +L QLQQ
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

A0A6J1D1F5 uncharacterized protein LOC111016725 isoform X11.8e-9780.25Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYA APQINSRPWS   VT+ A SLC   SLNF KF  D + S  GKLTRATG+ SFRRVADEEE+E      E+ED FQVLT+ITSNYNDIVIV+TPK
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SRVLLLDSS    +NVHSIL KEQ WTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLML SWPSLQLEGWEIDGILID+ARDF GLS LEKHS DGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPSVRISGGYAGIV+DLFSDG IL QLQ+
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

A0A6J1GJG8 uncharacterized protein LOC111454843 isoform X12.9e-9578.15Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYALAPQI +RPWSFG V +  S   L  SLNF K  SD  YSSVGKLTRATG+PSFR V +  EE+E+         FQVLT+ TS YNDIVIVDTP+
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SR+LLLDSS    +NVHSIL KEQ+WTGSYWDEFASLPAIIP+GPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILID+ARDFFGLS LEKHSDDGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPS RISGGYAGIVIDLFSDG+IL QLQQ
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

A0A6J1GKS0 uncharacterized protein LOC111454843 isoform X32.9e-9578.15Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYALAPQI +RPWSFG V +  S   L  SLNF K  SD  YSSVGKLTRATG+PSFR V +  EE+E+         FQVLT+ TS YNDIVIVDTP+
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SR+LLLDSS    +NVHSIL KEQ+WTGSYWDEFASLPAIIP+GPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILID+ARDFFGLS LEKHSDDGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPS RISGGYAGIVIDLFSDG+IL QLQQ
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

A0A6J1I2F1 uncharacterized protein LOC111468401 isoform X12.9e-9578.15Show/hide
Query:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK
        MAYALAPQI +RPWSFG V +  S   L  SLNF K  SD  YSSVGKLTRATG+PSFR V +  EE+E+         FQVLT+ TS YNDIVIVDTP+
Subjt:  MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK

Query:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI
        SR+LLLDSS    +NVHSIL KEQ+WTGSYWDEFASLPAIIP+GPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILID+ARDFFGLS LEKHSDDGGI
Subjt:  SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGI

Query:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        LNIHIGDALDPS RISGGYAGIVIDLFSDG+IL QLQQ
Subjt:  LNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

SwissProt top hitse value%identityAlignment
Q8G4L4 Probable polyamine aminopropyl transferase3.8e-0431.65Show/hide
Query:  SSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIA-IFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFF
        S+     V S+  K++  TG Y+D   + PA+      A I G+G GT A  +   +P + + G EID  + D A ++F
Subjt:  SSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIA-IFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFF

Arabidopsis top hitse value%identityAlignment
AT5G44590.1 S-adenosyl-L-methionine-dependent methyltransferases superfamily protein1.3e-4451.55Show/hide
Query:  EEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPKSRVLLLDSSSTTAHNVHSILCK-EQMWTGSYW------------------DEFASLPAIIPKG
        + E   ++ E+E+E+ F V+T++ S YN+IVIVDT  SR LLLDS+     NVHS++ K  Q WTG+YW                  DE A LP IIP G
Subjt:  EEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPKSRVLLLDSSSTTAHNVHSILCK-EQMWTGSYW------------------DEFASLPAIIPKG

Query:  PIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGILNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ
        PIAI+GLGGGT A L+L  WPS +LEGWEID ILI++ARD+ GLS LE  +  GG L IH+ DAL P    S  YAGI++DLF+DG +L QLQ+
Subjt:  PIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGILNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQQ

AT5G44600.1 S-adenosyl-L-methionine-dependent methyltransferases superfamily protein2.4e-5450.44Show/hide
Query:  SSLCLSRSLNFNKFPSDILYSSVGK---LTRATGEPSF-------RRVADEEEEEED--EDEDEDEDVFQVLTSITSNYNDIVIVDTPKSRVLLLDSSST
        S L +S   + +++ +  L S   K   L ++  +P F       +   DE + ++D  ++E+E+E+ + V+T++ S YN+IVIVDT  SR LLLDS+  
Subjt:  SSLCLSRSLNFNKFPSDILYSSVGK---LTRATGEPSF-------RRVADEEEEEED--EDEDEDEDVFQVLTSITSNYNDIVIVDTPKSRVLLLDSSST

Query:  TAHNVHSILCK-EQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGILNIHIGDALD
           NVHS++ K  Q WTGSYWDEFASLP IIP GP+AI+GLGGGT A LML  WP++QLEGWEID ILI++ARD+ GLS LEK +  GG L +H+ DAL 
Subjt:  TAHNVHSILCK-EQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGILNIHIGDALD

Query:  PSVRISGGYAGIVIDLFSDGNILSQLQQ
        PS  +SG YAGI++DLF+DG +L QLQ+
Subjt:  PSVRISGGYAGIVIDLFSDGNILSQLQQ

AT5G63100.1 S-adenosyl-L-methionine-dependent methyltransferases superfamily protein4.8e-2638.22Show/hide
Query:  PSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK--------SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIA
        P F R      +   +D     +  + +    S +N I +++  +        SR+LLLD+      N+HSI    +  T SY+D FA+LP IIP GPI 
Subjt:  PSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPK--------SRVLLLDSSSTTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIA

Query:  IFGLGGGTTAHLMLASW-PSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGILNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQ
        I G G G+TA L+L  + P + + GWE+D  +ID  R+FFGLS LE+   D   + I+IGDAL+ SV+   G++GI++DLFS G+++ +LQ
Subjt:  IFGLGGGTTAHLMLASW-PSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGILNIHIGDALDPSVRISGGYAGIVIDLFSDGNILSQLQ


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGTACGCACTTGCCCCTCAAATTAACTCACGTCCATGGAGTTTTGGATTTGTAACTGTACATGCAAGTAGTCTATGCCTATCTAGATCACTAAACTTCAACAAATT
TCCGAGCGATATACTCTATTCCTCCGTTGGAAAATTGACGAGGGCCACTGGTGAGCCCAGCTTCCGGAGGGTTGCGGACGAAGAAGAAGAAGAAGAAGACGAGGACGAGG
ACGAGGACGAGGACGTATTTCAAGTGTTGACCTCTATAACTAGCAATTACAATGACATTGTAATTGTAGACACTCCCAAATCCAGAGTGCTGCTTCTCGATTCTTCTAGT
ACTACTGCTCATAATGTCCACAGCATTCTTTGCAAGGAGCAGATGTGGACAGGTTCTTACTGGGATGAGTTTGCTAGCTTGCCAGCTATAATACCAAAGGGTCCAATTGC
TATATTTGGCTTGGGAGGGGGAACTACTGCCCATTTGATGCTTGCTTCATGGCCCTCCTTGCAGCTTGAAGGTTGGGAGATTGATGGAATCCTAATTGATCAAGCAAGAG
ATTTTTTCGGGCTATCTGGTCTTGAGAAGCATTCTGATGATGGTGGGATACTTAACATTCATATTGGCGATGCCCTTGATCCATCGGTCAGAATCTCTGGGGGTTATGCT
GGAATTGTTATTGACTTGTTTTCTGATGGAAATATTTTGTCTCAGCTGCAACAGGATTATAATCAAAACAAAGGTAGCCTTTATGATGCAAACTACATCTTAGGGAAAGC
ACACTCAGTGGATTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCGTACGCACTTGCCCCTCAAATTAACTCACGTCCATGGAGTTTTGGATTTGTAACTGTACATGCAAGTAGTCTATGCCTATCTAGATCACTAAACTTCAACAAATT
TCCGAGCGATATACTCTATTCCTCCGTTGGAAAATTGACGAGGGCCACTGGTGAGCCCAGCTTCCGGAGGGTTGCGGACGAAGAAGAAGAAGAAGAAGACGAGGACGAGG
ACGAGGACGAGGACGTATTTCAAGTGTTGACCTCTATAACTAGCAATTACAATGACATTGTAATTGTAGACACTCCCAAATCCAGAGTGCTGCTTCTCGATTCTTCTAGT
ACTACTGCTCATAATGTCCACAGCATTCTTTGCAAGGAGCAGATGTGGACAGGTTCTTACTGGGATGAGTTTGCTAGCTTGCCAGCTATAATACCAAAGGGTCCAATTGC
TATATTTGGCTTGGGAGGGGGAACTACTGCCCATTTGATGCTTGCTTCATGGCCCTCCTTGCAGCTTGAAGGTTGGGAGATTGATGGAATCCTAATTGATCAAGCAAGAG
ATTTTTTCGGGCTATCTGGTCTTGAGAAGCATTCTGATGATGGTGGGATACTTAACATTCATATTGGCGATGCCCTTGATCCATCGGTCAGAATCTCTGGGGGTTATGCT
GGAATTGTTATTGACTTGTTTTCTGATGGAAATATTTTGTCTCAGCTGCAACAGGATTATAATCAAAACAAAGGTAGCCTTTATGATGCAAACTACATCTTAGGGAAAGC
ACACTCAGTGGATTGA
Protein sequenceShow/hide protein sequence
MAYALAPQINSRPWSFGFVTVHASSLCLSRSLNFNKFPSDILYSSVGKLTRATGEPSFRRVADEEEEEEDEDEDEDEDVFQVLTSITSNYNDIVIVDTPKSRVLLLDSSS
TTAHNVHSILCKEQMWTGSYWDEFASLPAIIPKGPIAIFGLGGGTTAHLMLASWPSLQLEGWEIDGILIDQARDFFGLSGLEKHSDDGGILNIHIGDALDPSVRISGGYA
GIVIDLFSDGNILSQLQQDYNQNKGSLYDANYILGKAHSVD