CuGenDBv2

Gene ID	HG10020219
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	Unknown protein
Genome location	Chr04:29944839..29947663
RNA-Seq Expression	HG10020219
Synteny	HG10020219
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6580620.1 hypothetical protein SDJN03_20622, partial [Cucurbita argyrosperma subsp. sororia]

2.2e-111

91.45

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG
        MLSSMAD SLSLCFSS SS FCISRSLHLS          SPRFS+ HHRPSRLLRFSVKSS+SGSF GDDSFGLFPW DGD+EIHWVPEERVTLFTPDG
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG

Query:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
        LVQIGGSIVPRRIS SDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
Subjt:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG

Query:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

KAG7017377.1 hypothetical protein SDJN02_19242 [Cucurbita argyrosperma subsp. argyrosperma]

5.0e-111

91.03

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG
        MLSSMAD SLSLCFSS SS FCI+RSLHLS          SPRFS+ HHRPSRLLRFSVKSS+SGSF GDDSFGLFPW DGD+EIHWVPEERVTLFTPDG
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG

Query:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
        LVQIGGSIVPRRIS SDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
Subjt:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG

Query:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

XP_022934142.1 uncharacterized protein LOC111441404 isoform X1 [Cucurbita moschata]

2.2e-111

91.45

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG
        MLSSMAD SLSLCFSS SS FCISRSLHLS          SPRFS+ HHRPSRLLRFSVKSS+SGSF GDDSFGLFPW DGD+EIHWVPEERVTLFTPDG
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG

Query:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
        LVQIGGSIVPRRIS SDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
Subjt:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG

Query:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

XP_022983093.1 uncharacterized protein LOC111481743 [Cucurbita maxima]

2.2e-111

91.03

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG
        MLSSM D SLSLCFSS SS FCISRSLHLS          SPRFS+ HHRPSRLLRFS+KSS+SGSF GDDSFGLFPW DGD+EIHWVPEERVTLFTPDG
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG

Query:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
        LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
Subjt:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG

Query:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

XP_038905101.1 uncharacterized protein LOC120091234 [Benincasa hispida]

6.7e-116

94.87

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG
        MLSSMAD SLSLCFSSFS    ISRSLHLSPSFLLHPFL+SPRFSV HHRPSRLLRFS+K SSSGSF GDDSFGLFPW+DGDSEIHWVPEERVTLFTPDG
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG

Query:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
        LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCI+GFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
Subjt:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG

Query:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

TrEMBL top hits

e value

%identity

Alignment

A0A1S3B735 uncharacterized protein LOC103486501

7.7e-110

91.06

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGD-DSFGLFPWADGDSEIHWVPEERVTLFTPD
        MLSSMAD SLS  FSSFSS      SLHLSPSFL HPFLFSP+F + HHRPS LLRFS+KSSSSG F GD DSFGLFPWADGDSEIHWVPEERVTLFTPD
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGD-DSFGLFPWADGDSEIHWVPEERVTLFTPD

Query:  GLVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASK
        GLVQIGGSIVPRRISSSDKKQGKSK  QRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASK
Subjt:  GLVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASK

Query:  GGLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GGLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GGLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

A0A5D3DPB2 Uncharacterized protein

7.7e-110

91.06

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGD-DSFGLFPWADGDSEIHWVPEERVTLFTPD
        MLSSMAD SLS  FSSFSS      SLHLSPSFL HPFLFSP+F + HHRPS LLRFS+KSSSSG F GD DSFGLFPWADGDSEIHWVPEERVTLFTPD
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGD-DSFGLFPWADGDSEIHWVPEERVTLFTPD

Query:  GLVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASK
        GLVQIGGSIVPRRISSSDKKQGKSK  QRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASK
Subjt:  GLVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASK

Query:  GGLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GGLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GGLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

A0A6J1CTU7 uncharacterized protein LOC111014232 isoform X1

2.8e-107

90.87

Show/hide

Query:  MADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDGLVQI
        MA+ S +LCFSSFSS  CISRSL LSPSFL  P  FS  FSV HHRPSRLLRFSV+SS SGSF GDDS GLFPWADG SEIHWVPEERVTLFTPDGLVQI
Subjt:  MADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDGLVQI

Query:  GGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGLQE
        GGSIVPRRISSSDKKQGKSK YQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGLQE
Subjt:  GGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGLQE

Query:  KLTMTVAVPLLWGVPPASETLHLAVQSGGG
        KLTMTVAVPLLWGVPPASETLH AVQSGGG
Subjt:  KLTMTVAVPLLWGVPPASETLHLAVQSGGG

A0A6J1F1V4 uncharacterized protein LOC111441404 isoform X1

1.1e-111

91.45

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG
        MLSSMAD SLSLCFSS SS FCISRSLHLS          SPRFS+ HHRPSRLLRFSVKSS+SGSF GDDSFGLFPW DGD+EIHWVPEERVTLFTPDG
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG

Query:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
        LVQIGGSIVPRRIS SDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
Subjt:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG

Query:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

A0A6J1J6S7 uncharacterized protein LOC111481743

1.1e-111

91.03

Show/hide

Query:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG
        MLSSM D SLSLCFSS SS FCISRSLHLS          SPRFS+ HHRPSRLLRFS+KSS+SGSF GDDSFGLFPW DGD+EIHWVPEERVTLFTPDG
Subjt:  MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDG

Query:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
        LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG
Subjt:  LVQIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKG

Query:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
Subjt:  GLQEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G36895.1 unknown protein

3.6e-75

64.66

Show/hide

Query:  MADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFS--VPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDGLV
        MA+ S +L FS+FSS   IS      PS        + RFS  +   RPS   RF+VK+S  G+F+ DD+F  FPW+D ++EI WVPEER+TLFT DGLV
Subjt:  MADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFS--VPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDGLV

Query:  QIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGL
        QIGG++VPRRI SS+KK G+S++ ++ Q+F ES YMDP Q +CLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVED VLE GGE+VA E  S  GL
Subjt:  QIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGL

Query:  QEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        QEKLTMTVAVP LWGVPPA+E LHLAV++GGG
Subjt:  QEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

AT2G36895.2 unknown protein

3.4e-73

64.22

Show/hide

Query:  MADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFS--VPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDGLV
        MA+ S +L FS+FSS   IS      PS        + RFS  +   RPS   RF+VK+S  G+F+ DD+F  FPW+D ++EI WVPEER+TLFT DGLV
Subjt:  MADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFS--VPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDGLV

Query:  QIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGL
        QIGG++VPRRI SS+ K G+S++ ++ Q+F ES YMDP Q +CLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVED VLE GGE+VA E  S  GL
Subjt:  QIGGSIVPRRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGL

Query:  QEKLTMTVAVPLLWGVPPASETLHLAVQSGGG
        QEKLTMTVAVP LWGVPPA+E LHLAV++GGG
Subjt:  QEKLTMTVAVPLLWGVPPASETLHLAVQSGGG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCTCTCATCCATGGCTGACCTTTCTCTTTCCTTATGTTTCTCTTCCTTCTCTTCCTCCTTCTGCATTTCCCGCTCCCTCCACCTTTCCCCTTCTTTCCTTTTACACCC
TTTTCTTTTTTCTCCTAGATTCTCGGTCCCCCATCATCGCCCATCTCGTCTCCTTCGTTTCTCCGTCAAATCCTCTTCCTCTGGAAGCTTCACAGGGGACGATTCCTTCG
GATTGTTTCCTTGGGCTGATGGTGATAGCGAAATCCATTGGGTTCCCGAGGAGAGAGTCACATTGTTCACCCCTGATGGGCTTGTTCAGATTGGAGGCTCCATCGTCCCT
AGACGAATTTCTTCTTCAGATAAAAAACAAGGGAAATCAAAGGCTTACCAAAGATTCCAACGGTTTCAAGAGAGTGATTACATGGATCCAAAACAGAGCATATGTCTTGG
TGCTCTATTTGATATTGCAGCTACCAATGGACTTGACATGGGAAGAAGACTTTGTATCTTTGGTTTTTGCCGTTCTGTTGAGATGCTAAGTGATGTTGTGGAGGACATTG
TTTTGGAGCAAGGTGGAGAGGTTGTAGCAGCAGAGAAGGCAAGTAAAGGGGGTTTGCAGGAAAAACTAACCATGACAGTTGCTGTGCCACTTCTATGGGGGGTTCCTCCT
GCTTCTGAAACTCTTCATTTAGCTGTTCAGAGTGGTGGAGGGGGAAAGAAGAAAGCACCTAAAGGAGCGAAGGTTGCTTGTCAAGAACGTTGGCTCTCGTTGGGTGGTGG
CTTAGGTGGACGTATACGTCCTGTCCTATGCCAAAGACCCCTGCATCATGACCCACAAGGTCTTATGGGCCCAAGTGCCAAAGGTAGAAGGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MLSSMADLSLSLCFSSFSSSFCISRSLHLSPSFLLHPFLFSPRFSVPHHRPSRLLRFSVKSSSSGSFTGDDSFGLFPWADGDSEIHWVPEERVTLFTPDGLVQIGGSIVP
RRISSSDKKQGKSKAYQRFQRFQESDYMDPKQSICLGALFDIAATNGLDMGRRLCIFGFCRSVEMLSDVVEDIVLEQGGEVVAAEKASKGGLQEKLTMTVAVPLLWGVPP
ASETLHLAVQSGGGGKKKAPKGAKVACQERWLSLGGGLGGRIRPVLCQRPLHHDPQGLMGPSAKGRR

HG10020219 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome