CuGenDBv2

Gene ID	Spg032563
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Reverse transcriptase domain-containing protein
Genome location	scaffold3:23257453..23261541
RNA-Seq Expression	Spg032563
Synteny	Spg032563
Gene Ontology terms	GO:0044237 - cellular metabolic process (biological process) GO:0044238 - primary metabolic process (biological process) GO:0071704 - organic substance metabolic process (biological process) GO:0016301 - kinase activity (molecular function)
InterPro domains	IPR025558 - Domain of unknown function DUF4283 IPR026960 - Reverse transcriptase zinc-binding domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0035739.1 hypothetical protein E6C27_scaffold403G00100 [Cucumis melo var. makuwa]

2.0e-43

44.19

Show/hide

Query:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS
        +L +L +  V +SDD R WS+E+ G+F+  SLS  L ++  +   LF AI +S SP+RINIL+WI++   + +S++LQ+K P  +  PSICPLCLKA  +
Subjt:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS

Query:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS
          H+F  C  S   W + F++FN+ W F +S+  +V+QLL G +    PR++W    KAL+ EIW+ERNQR+F DKA      + +A L A++WC+L K 
Subjt:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS

Query:  FVAFSPQDICFNWHS
        FV +S QDIC NW++
Subjt:  FVAFSPQDICFNWHS

KAA0047189.1 hypothetical protein E6C27_scaffold83G00690 [Cucumis melo var. makuwa]

9.5e-41

Show/hide

Query:  SSVLQKRKVSYWIRKNQEVLNVNFADFWVVSRLFAHNSWKDIIEVLEFHFKSKISINPLFADKALLKFEDDNVVSSLDMVGKWKVFGNFHLLLEKWNKER
        SS L   K   W+ +N EV++ NF + W++++LFA +  + I ++LE +F++KI INPLF + AL+  ++ ++   +   GKW+V G+F+L  EKW+K +
Subjt:  SSVLQKRKVSYWIRKNQEVLNVNFADFWVVSRLFAHNSWKDIIEVLEFHFKSKISINPLFADKALLKFEDDNVVSSLDMVGKWKVFGNFHLLLEKWNKER

Query:  HSHPCFMEGYGGWISIKNLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMPATIELKDSFRGNVYLHFGDVSTLDSPKIIHHS
        +S P  M+GYGGW+ IKNL    W   + E                      SEARIQVK NLCGF+P+TIE+ D  RGN++L+FGD   L+ P     +
Subjt:  HSHPCFMEGYGGWISIKNLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMPATIELKDSFRGNVYLHFGDVSTLDSPKIIHHS

Query:  LELSDFSNPMDLFRIKQVMEDEGFD
        + +SDF   + L RI +V++DEG D
Subjt:  LELSDFSNPMDLFRIKQVMEDEGFD

TYK21876.1 hypothetical protein E5676_scaffold494G00090 [Cucumis melo var. makuwa]

6.3e-45

44.7

Show/hide

Query:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS
        +L +L +  V +SDD R WS+E+ G+F+  SLS  L ++  +   LF AI +S SP+RINIL+WI++   +N+S++LQ+K P  +  PSICPLCLKA  +
Subjt:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS

Query:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS
          H+F  C  S   W + F++FN+ W F +S+  +V+QLL G +    PR++W    KAL+ EIW+ERNQR+F DKA      + +A L A++WC+L K 
Subjt:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS

Query:  FVAFSPQDICFNWHSFI
        FV +S QDIC NW+ F+
Subjt:  FVAFSPQDICFNWHSFI

XP_038903695.1 uncharacterized protein LOC120090219 [Benincasa hispida]

2.9e-50

42.44

Show/hide

Query:  GPSPFRFLNSWLNLSECVEIMENSLA---GDRSYGWAVQFRNF---GIVNIILGVLDSLVVGS---SDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDL
        G SPF  L S  +L     +   S+A    +    W++ FR       V+    +L  +V  S   S D RVWS+ N+ Q+TV SL + L     ++  +
Subjt:  GPSPFRFLNSWLNLSECVEIMENSLA---GDRSYGWAVQFRNF---GIVNIILGVLDSLVVGS---SDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDL

Query:  FWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFS
        F  IWK+KSP+R+NIL+WI+L G LN ++VLQ+K P  S  P++CP CL   + +LHLFF C YS  CW+K    FN+     N  K NV QLL  P+  
Subjt:  FWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFS

Query:  SRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKSFVAFSPQDICFNWHSFI
           RLLW N VKAL++++W ERNQR+F +KA     RLE+A  +ASSWC LS  F A+S  D   NW +FI
Subjt:  SRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKSFVAFSPQDICFNWHSFI

XP_038904899.1 uncharacterized protein LOC120091119 isoform X2 [Benincasa hispida]

4.5e-43

52.9

Show/hide

Query:  EDDNVVSSLDMVGKWKVFGNFHLLLEKWNKERHSHPCFMEGYGGWISIKNLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMP
        E +++   +++ GKW+ FG+FHL  E+WN   H  P ++ GYGGWISIKNLPLDYWC+Q+FEAIG+YFGGL +I+ + LN+  V +A I+VK NLCGF+P
Subjt:  EDDNVVSSLDMVGKWKVFGNFHLLLEKWNKERHSHPCFMEGYGGWISIKNLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMP

Query:  ATIELKDSFRGNVYLHFGDVSTLDSPKIIHHSLELSDFSNPMDLFRIKQVMEDEG
        ATIE+ +  RG++YL+FGD+ST + P  +   L  SDF+NP+DL R+ +V   EG
Subjt:  ATIELKDSFRGNVYLHFGDVSTLDSPKIIHHSLELSDFSNPMDLFRIKQVMEDEG

TrEMBL top hits

e value

%identity

Alignment

A0A5A7T2Y0 zf-RVT domain-containing protein

9.9e-44

44.19

Show/hide

Query:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS
        +L +L +  V +SDD R WS+E+ G+F+  SLS  L ++  +   LF AI +S SP+RINIL+WI++   + +S++LQ+K P  +  PSICPLCLKA  +
Subjt:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS

Query:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS
          H+F  C  S   W + F++FN+ W F +S+  +V+QLL G +    PR++W    KAL+ EIW+ERNQR+F DKA      + +A L A++WC+L K 
Subjt:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS

Query:  FVAFSPQDICFNWHS
        FV +S QDIC NW++
Subjt:  FVAFSPQDICFNWHS

A0A5A7U128 Uncharacterized protein

4.6e-41

Show/hide

Query:  SSVLQKRKVSYWIRKNQEVLNVNFADFWVVSRLFAHNSWKDIIEVLEFHFKSKISINPLFADKALLKFEDDNVVSSLDMVGKWKVFGNFHLLLEKWNKER
        SS L   K   W+ +N EV++ NF + W++++LFA +  + I ++LE +F++KI INPLF + AL+  ++ ++   +   GKW+V G+F+L  EKW+K +
Subjt:  SSVLQKRKVSYWIRKNQEVLNVNFADFWVVSRLFAHNSWKDIIEVLEFHFKSKISINPLFADKALLKFEDDNVVSSLDMVGKWKVFGNFHLLLEKWNKER

Query:  HSHPCFMEGYGGWISIKNLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMPATIELKDSFRGNVYLHFGDVSTLDSPKIIHHS
        +S P  M+GYGGW+ IKNL    W   + E                      SEARIQVK NLCGF+P+TIE+ D  RGN++L+FGD   L+ P     +
Subjt:  HSHPCFMEGYGGWISIKNLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMPATIELKDSFRGNVYLHFGDVSTLDSPKIIHHS

Query:  LELSDFSNPMDLFRIKQVMEDEGFD
        + +SDF   + L RI +V++DEG D
Subjt:  LELSDFSNPMDLFRIKQVMEDEGFD

A0A5A7V878 DUF4283 domain-containing protein

1.5e-36

34.3

Show/hide

Query:  GWFLRCVVSPFSGGRQFIHVPIGNSKMGCSLFKELVVDSIRSLMVSNAPVASGEVPPMSFAETLKFPLKSLVQGSGAVGVSKNSSVLQKRKVSYWIRKNQ
        GW LRC V P SGGR ++H+P+G ++ G   F  ++ D    L VS     S E   M   + L+ P         A   S       K K S W+ KN 
Subjt:  GWFLRCVVSPFSGGRQFIHVPIGNSKMGCSLFKELVVDSIRSLMVSNAPVASGEVPPMSFAETLKFPLKSLVQGSGAVGVSKNSSVLQKRKVSYWIRKNQ

Query:  EVLNVNFADFWVVSRLFAHNSWKDIIEVLEFHFKSKISINPLFADKALLKFEDDNVVSSLDMVGKWKVFGNFHLLLEKWNKERHSHPCFMEGYGGWISIK
        EVL  +F               K I++V                                                             ++GYGGWISIK
Subjt:  EVLNVNFADFWVVSRLFAHNSWKDIIEVLEFHFKSKISINPLFADKALLKFEDDNVVSSLDMVGKWKVFGNFHLLLEKWNKERHSHPCFMEGYGGWISIK

Query:  NLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMPATIELKDSFRGNVYLHFGDVSTLDSPKIIHHSLELSDFSNPMDLFRIKQ
        NLPLDYW    ++AIG +FGG  +IS KT+N+   SEA+I+V  NLCGF+PA +EL+D+FR N++L+FGD+  L++PK+I  +L +S  +N +DL RI Q
Subjt:  NLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMPATIELKDSFRGNVYLHFGDVSTLDSPKIIHHSLELSDFSNPMDLFRIKQ

Query:  VMEDEGFDS
        V+ DEG +S
Subjt:  VMEDEGFDS

A0A5D3DE60 zf-RVT domain-containing protein

3.1e-45

44.7

Show/hide

Query:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS
        +L +L +  V +SDD R WS+E+ G+F+  SLS  L ++  +   LF AI +S SP+RINIL+WI++   +N+S++LQ+K P  +  PSICPLCLKA  +
Subjt:  ILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDS

Query:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS
          H+F  C  S   W + F++FN+ W F +S+  +V+QLL G +    PR++W    KAL+ EIW+ERNQR+F DKA      + +A L A++WC+L K 
Subjt:  ALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKS

Query:  FVAFSPQDICFNWHSFI
        FV +S QDIC NW+ F+
Subjt:  FVAFSPQDICFNWHSFI

A0A6J1DIE2 uncharacterized protein LOC111020765

3.3e-39

45.79

Show/hide

Query:  VSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYSQLCWSKFFAIFNMQWVF
        V+SL  + GS+  +  + F A+WK+KSP+R+N+  WI+  G LNT+D++Q+K P  +  PS C LC K+G+   HLFF C ++  CW+  F  FN+ W F
Subjt:  VSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYSQLCWSKFFAIFNMQWVF

Query:  SNSVKENVLQLLIG-PSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKSFVAFSPQDICFNWHSFI
             +NV QLL G P  SS  R LW+N VKAL+SE+W ERN R+FE+K         SA  KAS WC+L  SF+  SP  I  NW +FI
Subjt:  SNSVKENVLQLLIG-PSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKSFVAFSPQDICFNWHSFI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G04650.1 RNA-directed DNA polymerase (reverse transcriptase)-related family protein

8.6e-08

26.7

Show/hide

Query:  IMENSLAGDRSYGWAVQFRNFGIVNI--ILGVLDSLVVGSSDDARVWSLE---NSGQFTVSSLSHQLGSSFHIQSDLF-W--AIWKSKSPKRINILMWII
        ++ ++L G   +  + + RN  IV +  +L     L+    DD+ +W  +    S +F+    + +  S+ H QS    W  A+W      +   + W++
Subjt:  IMENSLAGDRSYGWAVQFRNFGIVNI--ILGVLDSLVVGSSDDARVWSLE---NSGQFTVSSLSHQLGSSFHIQSDLF-W--AIWKSKSPKRINILMWII

Query:  LNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWL
            L+T D LQ    +    P+ C LC    DS  HLFFEC +S + W  F A  N+      +   + L  L+ PS      L+      + +  IW 
Subjt:  LNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWL

Query:  ERNQRV
        ERNQR+
Subjt:  ERNQRV

AT5G18880.1 RNA-directed DNA polymerase (reverse transcriptase)-related family protein

1.2e-04

25.15

Show/hide

Query:  DARVWSLENSGQFTVSSLSHQLGSSFHIQSDLF-WA--IWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYS
        D+ +W    +G +  S  S        + S    WA  +W  +   R +++ W+     L T D L+    +    PS   LC    ++  HLFFEC++S
Subjt:  DARVWSLENSGQFTVSSLSHQLGSSFHIQSDLF-WA--IWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSICPLCLKAGDSALHLFFECAYS

Query:  QLCWSKFFAIFNMQWVFSNSVKEN-VLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVF
           W  F + F     F      + +LQL +    ++  +LL    +++ +  +W ERN R+F
Subjt:  QLCWSKFFAIFNMQWVFSNSVKEN-VLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVF

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAGGTGATAAGCCGCAAGATTATGAATTCTTTTTATTGTGTTTGGTCCGAAGAGGAATGCTTTTTTGTGGAAGATGTGGCTTTCAACAAGGTGATTTCTCTTTCTTC
TTCCCTTTTGCTTTGGTTGGAGCGTTCGTTGGTTGAGATTTTATGCCAGCCTATTCAGAAATTTTTTCGTAAGCAGTTTCGGGATGCTTTTGGGTTAATTCGTTTAGGTA
AACTTCGTTCTTCTTCAGGCTGGTTTTTGCGCTGTGTTGTTTCGCCTTTTTCAGGTGGTAGACAATTCATCCATGTGCCAATTGGAAATTCCAAAATGGGTTGTTCTTTA
TTCAAGGAGCTTGTGGTCGATTCCATTAGGAGTTTAATGGTTTCTAATGCTCCAGTTGCTTCTGGGGAGGTACCTCCTATGAGTTTTGCTGAAACTCTAAAGTTTCCCTT
GAAATCATTAGTGCAAGGTTCTGGGGCTGTTGGTGTTTCTAAGAATTCTTCAGTTCTTCAAAAACGAAAGGTTTCTTACTGGATTAGAAAAAATCAGGAGGTTTTGAATG
TTAATTTTGCAGATTTTTGGGTGGTGTCCAGATTATTTGCCCACAATAGTTGGAAAGATATTATTGAGGTTTTGGAGTTTCATTTCAAATCAAAGATTTCGATCAATCCG
CTTTTTGCAGATAAAGCATTACTCAAATTTGAAGATGATAATGTTGTTAGTTCATTAGATATGGTTGGGAAATGGAAGGTCTTTGGTAATTTTCATCTTTTGCTTGAAAA
ATGGAACAAAGAGCGTCATAGTCATCCCTGTTTTATGGAGGGTTATGGTGGTTGGATTTCAATCAAGAATTTGCCTTTAGATTATTGGTGTCGACAATCTTTTGAAGCAA
TTGGAGAATATTTTGGGGGTTTAGTAAACATTTCAAGTAAAACTCTTAACATGACTATTGTTTCAGAAGCTAGAATTCAGGTTAAAACAAATTTATGTGGTTTTATGCCG
GCTACAATTGAACTTAAAGATAGTTTTAGAGGGAATGTTTATCTTCATTTTGGCGATGTGTCTACTCTGGATTCTCCGAAAATTATTCACCATAGTCTTGAGTTGAGCGA
TTTTTCCAACCCAATGGACCTTTTTCGAATCAAACAAGTAATGGAAGATGAAGGGTTTGATTCTCAAATTCAAAATCCAGATGTTGAACACTATGGAAAAATTCTGGAAA
TTCCTTCTGTATCAAGGGACCCTAAGGTAATTTACAAGTTTGTTCAATTACCTTGTGATGATAGTAATATTAAAGGGTTTTCTGTTTTGCCAAATATTTCTGAAGTTGAA
GAGTCAACGAGATTTAATTTTGATGATGCTTTATTATCAAGAAAGTCCTTTTCAGATTCCCCTGTAATTGGAAAGGCCTTTTCGAATATTGTAAAGGCCCGTGGTAATTT
TCAAGAACATGTAGTAATTGAGAAAGAGAAAGAGTTATTTAATGTTGAAGACCATGCAGTAATTGAGAAAGAGAAGGAGTTATTAAATGCCAATGGGCTGCATGTCTTTG
GTTTTCCTTCTGCCGAGAGTATATTTTCCAAGGAGCCTTTGCATGAAGTGGGGGAGGTTTTTAAAAAAAATAAGGAGGATGCTGTATTTATTGAAGAGATAGTAAATGAT
GGGGAGGTTCTTAAGAATAAGGAGGATGCTGCATTTATTGATGAGTTAGTAAATGATATTTTAACCCAAGTTTCAAATATGGCTGATAAGTCTTTAACTCAGGGGCAATC
TTTCAATTGTCCAGCAATTAATAACCCAAAGGCTTCTTCAAATGTGAACTCGGTTCAGGATATTTTCAATTCCGATTTAAATGAAAATTATTCTTTGTCTGAATACTTGG
ACTCCGGTATTCCACCTAGTGTTAAAGAAGTGCATGATAATTTCTGTAAATCTTATTCTAAATATTATGTGCGAAAGAAAGGGCCAAGTGTGGAAGGTGATATTTTAAAG
GTTAATGCTGATGTTTTGGAAGAAGTTGTCTCTAAGGTATTGGCTCCTCAAGAGTCTATTTTAAATCAGGATTCTTCAAAGGCAGCAGACAAGTCAAATGATTTTGCAAT
CAATAGTTGTAATATTGGGCCAGAAGGTGTGCTTTTCACAAGAGTTCTTTTTCCCTCTTCTAAAGATAGTTTGTCGGCAAATGCTTCATCACATTGTGGTAATGAAAATA
CAGATGATGAGTCAGAGGTTAGTATGAGCAGTGAAGAGATTGATTTTCCTCCGGAAAATCTTTTGAATGTTGATAGTTGTGATATCTCGGTAAATGATGATTTGAATTTG
CTCTTTACTTCTCCATCAAAATCTAATGCTTCAAGCAAGAAGATTGTGGATGACTTTAAGACTTCAATTCCAACTGCTTCAGATAATTTAGATACTTTTTCTGCTCTTAT
TAAAGCCAGTGGTCTACAGTTCAAGGAAATTCTATCGGGTGGAATGTTAATTATGTGGGATGAAAGTAGAGTCAATGTGGTTGAGGTGCGTACAATTTCAGATCATTTTC
CTATTCTTTTAGAAGCTGGAGGCTTTTCTTGGGGGCCTTCTCCTTTTCGTTTTTTGAATTCCTGGCTAAATCTGAGTGAATGTGTTGAGATTATGGAGAATTCTCTTGCT
GGAGATCGATCGTATGGATGGGCAGTTCAGTTTCGGAATTTTGGGATTGTCAACATAATTCTTGGTGTTTTGGACTCTTTGGTGGTTGGTTCATCTGATGATGCTCGTGT
TTGGTCTCTTGAAAATTCTGGACAGTTTACCGTTAGCTCTTTGTCTCATCAACTTGGTTCGAGTTTTCACATTCAATCGGATTTGTTTTGGGCCATTTGGAAATCTAAAA
GCCCTAAACGAATAAATATTTTGATGTGGATTATTTTGAATGGTAGTTTGAATACTTCTGATGTTCTTCAAAGAAAATTGCCGTTCTTCAGCTTTTTTCCTTCGATTTGT
CCTCTTTGTTTGAAGGCAGGAGACTCCGCATTGCATTTGTTCTTTGAGTGTGCTTATTCACAACTTTGTTGGTCAAAGTTCTTTGCTATTTTCAATATGCAGTGGGTTTT
TTCAAATTCCGTAAAAGAGAATGTGCTTCAACTGCTTATTGGTCCTTCTTTTTCTTCAAGACCGAGATTATTATGGATTAATGGTGTTAAAGCTTTGATATCAGAAATTT
GGTTGGAAAGAAATCAGAGGGTTTTTGAAGATAAAGCGTGGCATTCTTTAGCTCGTCTGGAATCAGCTTGCTTAAAGGCTTCTTCCTGGTGCACTCTTTCTAAATCTTTT
GTAGCTTTCTCTCCACAGGATATTTGTTTTAATTGGCATTCTTTTATTTTTCCCCTGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MEVISRKIMNSFYCVWSEEECFFVEDVAFNKVISLSSSLLLWLERSLVEILCQPIQKFFRKQFRDAFGLIRLGKLRSSSGWFLRCVVSPFSGGRQFIHVPIGNSKMGCSL
FKELVVDSIRSLMVSNAPVASGEVPPMSFAETLKFPLKSLVQGSGAVGVSKNSSVLQKRKVSYWIRKNQEVLNVNFADFWVVSRLFAHNSWKDIIEVLEFHFKSKISINP
LFADKALLKFEDDNVVSSLDMVGKWKVFGNFHLLLEKWNKERHSHPCFMEGYGGWISIKNLPLDYWCRQSFEAIGEYFGGLVNISSKTLNMTIVSEARIQVKTNLCGFMP
ATIELKDSFRGNVYLHFGDVSTLDSPKIIHHSLELSDFSNPMDLFRIKQVMEDEGFDSQIQNPDVEHYGKILEIPSVSRDPKVIYKFVQLPCDDSNIKGFSVLPNISEVE
ESTRFNFDDALLSRKSFSDSPVIGKAFSNIVKARGNFQEHVVIEKEKELFNVEDHAVIEKEKELLNANGLHVFGFPSAESIFSKEPLHEVGEVFKKNKEDAVFIEEIVND
GEVLKNKEDAAFIDELVNDILTQVSNMADKSLTQGQSFNCPAINNPKASSNVNSVQDIFNSDLNENYSLSEYLDSGIPPSVKEVHDNFCKSYSKYYVRKKGPSVEGDILK
VNADVLEEVVSKVLAPQESILNQDSSKAADKSNDFAINSCNIGPEGVLFTRVLFPSSKDSLSANASSHCGNENTDDESEVSMSSEEIDFPPENLLNVDSCDISVNDDLNL
LFTSPSKSNASSKKIVDDFKTSIPTASDNLDTFSALIKASGLQFKEILSGGMLIMWDESRVNVVEVRTISDHFPILLEAGGFSWGPSPFRFLNSWLNLSECVEIMENSLA
GDRSYGWAVQFRNFGIVNIILGVLDSLVVGSSDDARVWSLENSGQFTVSSLSHQLGSSFHIQSDLFWAIWKSKSPKRINILMWIILNGSLNTSDVLQRKLPFFSFFPSIC
PLCLKAGDSALHLFFECAYSQLCWSKFFAIFNMQWVFSNSVKENVLQLLIGPSFSSRPRLLWINGVKALISEIWLERNQRVFEDKAWHSLARLESACLKASSWCTLSKSF
VAFSPQDICFNWHSFIFPL

Spg032563 (gene) of Sponge gourd (cylindrica) v1 genome