CuGenDBv2

Gene ID	Tan0017922
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Basic secretory protein
Genome location	LG02:957548..959358
RNA-Seq Expression	Tan0017922
Synteny	Tan0017922
Gene Ontology terms	NA
InterPro domains	IPR007541 - Uncharacterised protein family, basic secretory protein

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6572454.1 hypothetical protein SDJN03_29182, partial [Cucurbita argyrosperma subsp. sororia]

4.8e-122

79.44

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLL  T        SAAA PTS ++SPFLSN A+AVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRL+L
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NAS+F+ENLIYPSQ FPKK VKSVHLTLS RDL SNVAVE L D GVDFVV+LSPSIFN+RN N AMSAA+ RGMSRVWLW+GE +APPSLLAGMVEHIT
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV
        A AGF E+KYSG VVTTL  CDP WWKDK+P EVA FLD+ E +QKGFIQRLNQGLKSRWHDRTVEDA+G+P +R    FNSSGI+V
Subjt:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

KAG7012046.1 hypothetical protein SDJN02_26954, partial [Cucurbita argyrosperma subsp. argyrosperma]

4.1e-121

79.09

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLL  T        SAAA PTS ++SPFLSN A+AVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRL+L
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NAS+F+ENLIYPSQ FPKK VKSVHLTLS RDL SNVAVE L D GVDFVV+LSPSIFN+RN N AMSAA+ RGMSRVWLW+GE +APPSLLAGMVEHIT
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV
        A AGF E+KYSG VVTTL  CDP WWKDK+P EVA FLD+ E +Q GFIQRLNQGLKSRW DRTVEDA+G+P +R   SFNSSGI+V
Subjt:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

XP_022952992.1 uncharacterized protein LOC111455507 [Cucurbita moschata]

5.9e-120

78.4

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLL  T        SAA  PTS ++SP LSN A+AVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRL+L
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NAS+F+ENLIYPSQ FPKK VKSVHLTLS RDL SNVAVE L D GVDFVV+LSPSIFN+RN N AMSAA+ RGMSRVWLW+GE +APPSLLAGMVEHIT
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV
        A AGF E+KYSG VVTTL  CDP WWKDK+P EVA FL++ E +QKGFIQRLNQGLKSRW DRTVEDA+G+P +R   SFNSSGI+V
Subjt:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

XP_022989196.1 uncharacterized protein LOC111486342 [Cucurbita maxima]

2.0e-120

80.14

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLLS            AA PTSA++SPFLSNQAIA+RLLLVAF+GITSL ANHEASKGFDITILNNAK SPAGQRF LFYVSNDEATRLIL
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NASSFIENLIYPSQAFPKKPVKSVHLTLSR DLSS+ AVEKL D G DFV+HLSPSIFNE+NANRAMS AVFRGMSRVWLWDGEAHAPPSLLAGMVEHI 
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLT-TCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFN
        A AG   EKYSG V +TLT  CDPTWWKDK+P E+A FLDH E E++GF+QRLNQGLK+RWHDRTVEDA+G+P Q P GS N
Subjt:  AVAGFAEEKYSGAVVTTLT-TCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFN

XP_023553976.1 uncharacterized protein LOC111811392 [Cucurbita pepo subsp. pepo]

2.6e-120

79.09

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLL  T        SAAA PTS ++SPFLSN A+AVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NAS+F+ENLIYPSQ FPKK VKSVHLTLS RDL SNVAVE L D GVDFVV+LSPSIFN+RN N AMSAA+ RG+SRVWLW+GE +APPSLLAGMVEHIT
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV
        A AGF E+KYSG VVTTL  CDP WWKDK+P EVA FL++ E +QKGFIQRLNQ LKSRW DRTVE+A+GMP +R   SFNSSGIRV
Subjt:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D3U3 uncharacterized protein LOC111016776

3.1e-111

72.32

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSP-FLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLI
        MED +SLSLPLL  T +G        + PT  ++S  F SN  IAVRLLL+AFIG+TSLWANHEASKGF+IT++N AK SPAGQRFDLFYVSNDEATR++
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSP-FLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLI

Query:  LNASSFIENLIYPSQ-AFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEH
        LNAS+F+ENLIYPSQ AFPKK VK V LTL+ RDLS NVAV K DD GVDF + LSPSIF+E N N AMSAAV RGMSRVWLWDG++HAPPSLLAGMVEH
Subjt:  LNASSFIENLIYPSQ-AFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEH

Query:  ITAVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV
        I A AGF ++KYSG V++T T CDP WWKDKNPMEVA FL +HE+++ GFIQRLNQGLKSRW DRTV+DALGMP QRP GSFN SGI V
Subjt:  ITAVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

A0A6J1EXI2 uncharacterized protein LOC111437081

1.5e-116

78.01

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLLS            AA PT A++SPFL NQAIA+RLLLVAF+GITSL ANHEASKGF+ITILNNAK SPAGQRF LFYVSNDEATRLIL
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NASSFIENLIYPS AFPKKPVKSVHLTLSR DLSS+ AVEKL D G DFV+HLSPSI NE++ANRAMS AVFRGMSRVWLWDGEA APP+LLAGMVEHI 
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLT-TCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFN
        A AGF  EKYSG VV+ LT  CDPTWWKDK+P E+A FLDH E E++GFIQRLNQGLK RWHDRTVEDA+G+P Q P GS N
Subjt:  AVAGFAEEKYSGAVVTTLT-TCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFN

A0A6J1GLY7 uncharacterized protein LOC111455507

2.8e-120

78.4

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLL  T        SAA  PTS ++SP LSN A+AVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRL+L
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NAS+F+ENLIYPSQ FPKK VKSVHLTLS RDL SNVAVE L D GVDFVV+LSPSIFN+RN N AMSAA+ RGMSRVWLW+GE +APPSLLAGMVEHIT
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV
        A AGF E+KYSG VVTTL  CDP WWKDK+P EVA FL++ E +QKGFIQRLNQGLKSRW DRTVEDA+G+P +R   SFNSSGI+V
Subjt:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

A0A6J1I2J5 uncharacterized protein LOC111468436

8.5e-117

76.66

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLL  T        SAAA PTS ++SPFLSN A+AVRLLLVAFIGITSLWANHEASKGF +TILNNAKGSPAGQRFDLFYVSNDEATRL+L
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NAS+F+ENLIYPSQ FPKK VKSVHLTLS RDL SNVAVE L D GVDFVV+LSPSIFN+RN N AMSAA+ RGMS VWLW+GE HAPPSLLAGMVEHIT
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV
        A AGF E+K  G VV+T+  CDP WWKDK P EVA FL + E +QKGFIQRLNQGL+SRW DRTVEDA+GM  +R   SFNSSGI+V
Subjt:  AVAGFAEEKYSGAVVTTLTTCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

A0A6J1JJD5 uncharacterized protein LOC111486342

9.7e-121

80.14

Show/hide

Query:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL
        MED QSLSLPLLS            AA PTSA++SPFLSNQAIA+RLLLVAF+GITSL ANHEASKGFDITILNNAK SPAGQRF LFYVSNDEATRLIL
Subjt:  MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLIL

Query:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT
        NASSFIENLIYPSQAFPKKPVKSVHLTLSR DLSS+ AVEKL D G DFV+HLSPSIFNE+NANRAMS AVFRGMSRVWLWDGEAHAPPSLLAGMVEHI 
Subjt:  NASSFIENLIYPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHIT

Query:  AVAGFAEEKYSGAVVTTLT-TCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFN
        A AG   EKYSG V +TLT  CDPTWWKDK+P E+A FLDH E E++GF+QRLNQGLK+RWHDRTVEDA+G+P Q P GS N
Subjt:  AVAGFAEEKYSGAVVTTLT-TCDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFN

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G42900.1 Plant basic secretory protein (BSP) family protein

1.1e-39

39.57

Show/hide

Query:  SNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLILNASSFIENLIYPSQAFPKKPVKSV-HLTLSRRDLSSNV
        S+  I +RL  +  +G  SLWANHEASKGF I+I+N+AK SP+G+RF LF+ S+D A R++L+AS F+E  +Y  +  P +  K V H+T+     SS+ 
Subjt:  SNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLILNASSFIENLIYPSQAFPKKPVKSV-HLTLSRRDLSSNV

Query:  AVEKLDDAGV---DFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHITAVAGFAE--EKYSGAVVTTLTTCDPTWWKDK-NP
               +G    ++V+ LSPS+   +  + A+ +A+ R M R+WLW  E+ A P L+AGMVE++   +      EK+ G             WKDK   
Subjt:  AVEKLDDAGV---DFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHITAVAGFAE--EKYSGAVVTTLTTCDPTWWKDK-NP

Query:  MEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVE
        + V   LD+ E   +GFI+RLN G++ RW DRTV+
Subjt:  MEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVE

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGACCTCCAATCCCTCTCTCTCCCTCTCCTTTCCGAAACCAGCTCCGGCACCGTCGCCGCCGTCTCCGCCGCTGCCCGTCCCACTTCTGCAGACAAATCCCCCTT
CCTCTCAAATCAGGCCATCGCCGTCCGCCTCCTTCTGGTGGCCTTCATCGGAATCACTTCACTGTGGGCCAATCACGAAGCCTCAAAAGGCTTCGATATCACCATTCTTA
ACAACGCCAAAGGCTCTCCCGCCGGTCAACGCTTCGATCTCTTCTACGTCTCTAATGACGAAGCCACGCGCCTCATCCTCAACGCGAGTAGCTTCATCGAGAATCTGATC
TACCCTTCTCAAGCCTTTCCAAAGAAACCAGTCAAGAGCGTGCATCTCACGCTCTCCCGCCGCGATCTCTCCTCTAATGTCGCCGTCGAGAAGCTCGACGACGCCGGAGT
TGACTTCGTCGTTCATTTGAGCCCTTCGATTTTCAATGAGAGAAACGCGAATCGCGCCATGTCAGCGGCGGTTTTTAGAGGGATGTCCCGCGTGTGGCTGTGGGATGGAG
AGGCCCACGCGCCGCCCTCACTCCTAGCCGGAATGGTCGAGCATATAACCGCGGTGGCCGGATTTGCCGAGGAGAAATATTCCGGTGCGGTCGTTACTACGTTGACGACA
TGTGATCCCACGTGGTGGAAGGATAAGAATCCCATGGAAGTCGCCCGGTTTCTCGACCATCACGAAAGCGAACAGAAGGGTTTCATCCAACGGTTAAATCAAGGGTTGAA
GTCCAGGTGGCATGATCGGACGGTGGAGGATGCGCTTGGTATGCCAGCTCAGCGTCCATCTGGTTCGTTCAATTCTTCCGGAATTAGGGTTTAG

mRNA sequence

Show/hide mRNA sequence

CTAAATCATAATTATACAGTTACGTATTTGGGTTTTTTTTTTCAAAAAATAATAATGGAATATGTGAGTATAAAATGATAAATATGAATAAAACCAAAAGAAAAAGAAAA
GGTGAAAAGAAATGCAACCAAATTATACATGAATTTAAGACACAAAGTTAAGACCCGCGAATCCGTCCATTTTTTATCAATCCTATAATTATCTTAAATGTTCAATCCCC
TTCAACCATGGAAGACCTCCAATCCCTCTCTCTCCCTCTCCTTTCCGAAACCAGCTCCGGCACCGTCGCCGCCGTCTCCGCCGCTGCCCGTCCCACTTCTGCAGACAAAT
CCCCCTTCCTCTCAAATCAGGCCATCGCCGTCCGCCTCCTTCTGGTGGCCTTCATCGGAATCACTTCACTGTGGGCCAATCACGAAGCCTCAAAAGGCTTCGATATCACC
ATTCTTAACAACGCCAAAGGCTCTCCCGCCGGTCAACGCTTCGATCTCTTCTACGTCTCTAATGACGAAGCCACGCGCCTCATCCTCAACGCGAGTAGCTTCATCGAGAA
TCTGATCTACCCTTCTCAAGCCTTTCCAAAGAAACCAGTCAAGAGCGTGCATCTCACGCTCTCCCGCCGCGATCTCTCCTCTAATGTCGCCGTCGAGAAGCTCGACGACG
CCGGAGTTGACTTCGTCGTTCATTTGAGCCCTTCGATTTTCAATGAGAGAAACGCGAATCGCGCCATGTCAGCGGCGGTTTTTAGAGGGATGTCCCGCGTGTGGCTGTGG
GATGGAGAGGCCCACGCGCCGCCCTCACTCCTAGCCGGAATGGTCGAGCATATAACCGCGGTGGCCGGATTTGCCGAGGAGAAATATTCCGGTGCGGTCGTTACTACGTT
GACGACATGTGATCCCACGTGGTGGAAGGATAAGAATCCCATGGAAGTCGCCCGGTTTCTCGACCATCACGAAAGCGAACAGAAGGGTTTCATCCAACGGTTAAATCAAG
GGTTGAAGTCCAGGTGGCATGATCGGACGGTGGAGGATGCGCTTGGTATGCCAGCTCAGCGTCCATCTGGTTCGTTCAATTCTTCCGGAATTAGGGTTTAGGCCAATTGG
GCCCGTCCACATGGGTCAATCATCCCAATCCAGCGGGGCGGTCCCCACCACTGGGACCATTCTTGAATTGCCACGTCGGATCGGTTTGTCTTGGAAATTCTCGTGCCTTT
TTTTTTTCCGGCATTTCTTTTTACAATTTTGTTTATTGTTTATATCCGATTTTTAAATTTTTTTAAGCTCTGAATTGTACAACTTGACGTGTTAAATACTCGTGATGCTA
CAGAAAATTGTTGGTGGTCTGTTAAATAGTTTTTTGCTTCATTGCTTTTTTATTCATTTGTATTTTCTGGAAAATTAATGAATATTTTGATTTTTGAAAATATTATCTTC
TTAAGATGTTGCCAAAAAGGAATAATTTTTTAGCCCAACCTTAATCAATTTGTATGAAAATAATAATGTCGACAAAATAAATATTGGCCCACCATAGTTGTCACTTTCAT
CTAAGAAAATTTGTGAAAAAAAATTAAAGGATTAGTCTCCTGTGAATTACCATATTCAATTATGTTATTCTCCTTTTCATTTTATCATTATTGTCCACTTGTAATTTTTT
TAATACCATTTTTTTTTTTTGTTAACTCCCAAACTCTTTTCATTTTTCTTTTCATTTTATCTGATGTGAGAGAGAGTTTTCTTTTTTATTAATTTTGAAAATATTCTTTT
ACCGTTCTAAATGTATTATGGAATTTTAACTCGAGATATGGCTAATGGGCA

Protein sequence

Show/hide protein sequence

MEDLQSLSLPLLSETSSGTVAAVSAAARPTSADKSPFLSNQAIAVRLLLVAFIGITSLWANHEASKGFDITILNNAKGSPAGQRFDLFYVSNDEATRLILNASSFIENLI
YPSQAFPKKPVKSVHLTLSRRDLSSNVAVEKLDDAGVDFVVHLSPSIFNERNANRAMSAAVFRGMSRVWLWDGEAHAPPSLLAGMVEHITAVAGFAEEKYSGAVVTTLTT
CDPTWWKDKNPMEVARFLDHHESEQKGFIQRLNQGLKSRWHDRTVEDALGMPAQRPSGSFNSSGIRV

Tan0017922 (gene) of Snake gourd v1 genome