CuGenDBv2

Gene ID	HG10022543
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	N-acetyltransferase domain-containing protein
Genome location	Chr05:25276399..25287712
RNA-Seq Expression	HG10022543
Synteny	HG10022543
Gene Ontology terms	GO:0005737 - cytoplasm (cellular component) GO:0008080 - N-acetyltransferase activity (molecular function)
InterPro domains	IPR000182 - GNAT domain IPR016181 - Acyl-CoA N-acyltransferase

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004139678.1 uncharacterized protein LOC101214390 isoform X2 [Cucumis sativus]

2.0e-112

86.8

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWR-NGGIKVSSAVVVRCSSDYSSPITAAT-TEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE
        MVHLLPNPLRV SHLRSEPP T VPTRSKS    G +WR  GGIKV SAVVVRCSSDYSSPITAA  TEEE +GVSEEID+ EYLA EFGWKVRKL+EEE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWR-NGGIKVSSAVVVRCSSDYSSPITAAT-TEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE

Query:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV
        DDL+AVARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLKNYP DRYACLVAEPESE  ++EYNFVGVVDVTVAGDLK+KRLLP G KEYLFVTGIAV
Subjt:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV

Query:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
         Q ARRRKVAT LLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

XP_008461923.1 PREDICTED: uncharacterized protein LOC103500412 isoform X1 [Cucumis melo]

5.0e-111

87.2

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGG-IKVSSAVVVRCSSDYSSPITAA-TTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE
        MVHLLPNPLRVSSHLRSEPPRT VPTRSK      A+WR GG IKV SAVVVRCSSDYSSPITAA  TEEE I VSEE+ + EYLAREFGWKVRKL+EEE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGG-IKVSSAVVVRCSSDYSSPITAA-TTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE

Query:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV
        DDLRAVARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLKNYP +RYACLVAEPESE  ++EYNFVGVVDVTVAGDLKVKRLLP G KEYLFVTGIAV
Subjt:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV

Query:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
         Q ARRRKVAT LLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

XP_022976620.1 uncharacterized protein LOC111476967 [Cucurbita maxima]

2.9e-111

85.66

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEID---QKEYLAREFGWKVRKLMEE
        MVHLLPNPLRVSSHLRS+PPRT V  R+KSGTG   I RNGGIKV  AVVVRCSSDYSSPITAA      IG SEEI+   +  YLA EFGWKVRKL+EE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEID---QKEYLAREFGWKVRKLMEE

Query:  EDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIA
        EDDLR VARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESE CKDEYNFVGVVDVTVAGDLKV+RLLPAG KEYLFVTGIA
Subjt:  EDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIA

Query:  VPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
        V QTARRRKVAT LLKGCDML +VWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  VPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

XP_031744292.1 uncharacterized protein LOC101214390 isoform X1 [Cucumis sativus]

1.9e-110

84.77

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWR-NGGIKVSSAVVVRCSSDYSSPITAAT-TEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE
        MVHLLPNPLRV SHLRSEPP T VPTRSKS    G +WR  GGIKV SAVVVRCSSDYSSPITAA  TEEE +GVSEEID+ EYLA EFGWKVRKL+EEE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWR-NGGIKVSSAVVVRCSSDYSSPITAAT-TEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE

Query:  DDLRAVARIQAEAFHEPVLLFNDFFFQFF------QAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLF
        DDL+AVARIQAEAFHEPVLLFN FFFQFF      QAEVLSALIYRLKNYP DRYACLVAEPESE  ++EYNFVGVVDVTVAGDLK+KRLLP G KEYLF
Subjt:  DDLRAVARIQAEAFHEPVLLFNDFFFQFF------QAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLF

Query:  VTGIAVPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
        VTGIAV Q ARRRKVAT LLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  VTGIAVPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

XP_038897179.1 uncharacterized protein LOC120085320 [Benincasa hispida]

1.0e-119

90.73

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEEDD
        MVHLLPNPLRVS HLRSEPPRT V  R  SGTGG AIWRNGGIKV SAVV+RCSSDYSSP    TT EESIG+ EEI++ EYLAREFGW VRKL+EEEDD
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEEDD

Query:  LRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAVPQ
        LRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV Q
Subjt:  LRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAVPQ

Query:  TARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
        TARRRKVAT LLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  TARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K826 N-acetyltransferase domain-containing protein

9.8e-113

86.8

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWR-NGGIKVSSAVVVRCSSDYSSPITAAT-TEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE
        MVHLLPNPLRV SHLRSEPP T VPTRSKS    G +WR  GGIKV SAVVVRCSSDYSSPITAA  TEEE +GVSEEID+ EYLA EFGWKVRKL+EEE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWR-NGGIKVSSAVVVRCSSDYSSPITAAT-TEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE

Query:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV
        DDL+AVARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLKNYP DRYACLVAEPESE  ++EYNFVGVVDVTVAGDLK+KRLLP G KEYLFVTGIAV
Subjt:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV

Query:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
         Q ARRRKVAT LLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

A0A1S3CFP1 uncharacterized protein LOC103500412 isoform X1

2.4e-111

87.2

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGG-IKVSSAVVVRCSSDYSSPITAA-TTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE
        MVHLLPNPLRVSSHLRSEPPRT VPTRSK      A+WR GG IKV SAVVVRCSSDYSSPITAA  TEEE I VSEE+ + EYLAREFGWKVRKL+EEE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGG-IKVSSAVVVRCSSDYSSPITAA-TTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE

Query:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV
        DDLRAVARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLKNYP +RYACLVAEPESE  ++EYNFVGVVDVTVAGDLKVKRLLP G KEYLFVTGIAV
Subjt:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV

Query:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
         Q ARRRKVAT LLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

A0A1S4E3H1 uncharacterized protein LOC103500412 isoform X2

3.0e-109

86.8

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGG-IKVSSAVVVRCSSDYSSPITAA-TTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE
        MVHLLPNPLRVSSHLRSEPPRT VPTRSK      A+WR GG IKV SAVVVRCSSDYSSPITAA  TEEE I VSEE+ + EYLAREFGWKVRKL+EEE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGG-IKVSSAVVVRCSSDYSSPITAA-TTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEE

Query:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV
        DDLRAVARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLKNYP +RYACLVAEPESE  ++EYNFVGVVDVTVAGDLKVKRLLP G KEYLFVTGIAV
Subjt:  DDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAV

Query:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
         Q A RRKVAT LLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  PQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

A0A6J1F9A7 uncharacterized protein LOC111443273

2.0e-110

84.86

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEID---QKEYLAREFGWKVRKLMEE
        MVHLLPNPLRVSSHLR +PPRT V  R+KSGTG   I RNGGIKV  AVVVRCSSDYSSPI AA      IG SEEI+   +  YLA EFGWKVRKL+EE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEID---QKEYLAREFGWKVRKLMEE

Query:  EDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIA
        EDDLR VARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLK+YPPDRYACLVAEPESE+CKDEYNFVGVVDVTVAGDLKV+RLLPAG KEYLFVTGIA
Subjt:  EDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIA

Query:  VPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
        V QTARRRKVAT LLKGCDML KVWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  VPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

A0A6J1IJZ4 uncharacterized protein LOC111476967

1.4e-111

85.66

Show/hide

Query:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEID---QKEYLAREFGWKVRKLMEE
        MVHLLPNPLRVSSHLRS+PPRT V  R+KSGTG   I RNGGIKV  AVVVRCSSDYSSPITAA      IG SEEI+   +  YLA EFGWKVRKL+EE
Subjt:  MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEID---QKEYLAREFGWKVRKLMEE

Query:  EDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIA
        EDDLR VARIQAEAFHEPVLLFN FFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESE CKDEYNFVGVVDVTVAGDLKV+RLLPAG KEYLFVTGIA
Subjt:  EDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIA

Query:  VPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ
        V QTARRRKVAT LLKGCDML +VWGFKFLALSAYEDDYGARNLYSKAGYQ
Subjt:  VPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAGYQ

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G72030.1 Acyl-CoA N-acyltransferases (NAT) superfamily protein

3.1e-50

55.22

Show/hide

Query:  VVVRCSSDYSSPITAATTEEESIGVSEEIDQKEYLAREFGWKVRKL-MEEEDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRY
        V +RC+S  S  +T+ T        + EI+ K YL  + GW VR+L  ++ED++R V+ +QAEAFH P+ LF+DFFF FFQAEVLSAL+Y+LKN PPDRY
Subjt:  VVVRCSSDYSSPITAATTEEESIGVSEEIDQKEYLAREFGWKVRKL-MEEEDDLRAVARIQAEAFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRY

Query:  ACLVAEPESES-CKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAVPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAG
        ACLVAE  SE+      + VGVVDVT   +  V R  P G +EYL+V+G+AV ++ RR+K+A+TLLK CD+L  +WGFK LAL AYEDD  ARNLYS AG
Subjt:  ACLVAEPESES-CKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAVPQTARRRKVATTLLKGCDMLGKVWGFKFLALSAYEDDYGARNLYSKAG

Query:  Y
        Y
Subjt:  Y

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTCATTTGCTTCCAAATCCCCTCCGTGTTTCATCGCATCTCCGCTCGGAGCCACCGCGCACGGTGGTTCCGACAAGATCGAAGTCCGGCACCGGCGGCGGCGCGAT
CTGGAGAAATGGAGGAATTAAGGTGAGCTCGGCGGTGGTTGTGCGGTGTAGTAGTGACTATTCGAGTCCGATTACGGCGGCGACGACGGAGGAGGAATCGATCGGAGTAT
CGGAAGAAATTGATCAAAAAGAGTATTTGGCGAGAGAATTTGGATGGAAGGTGAGAAAATTGATGGAAGAAGAAGATGATTTGAGAGCGGTTGCAAGAATTCAAGCCGAA
GCTTTTCATGAACCTGTTCTTCTTTTCAACGATTTCTTCTTCCAATTTTTCCAGGCAGAAGTGCTTTCAGCGTTGATTTACAGACTGAAAAATTACCCTCCAGACAGGTA
TGCTTGTTTGGTTGCGGAGCCGGAAAGTGAAAGTTGTAAAGATGAATACAATTTTGTGGGAGTGGTGGACGTGACGGTGGCTGGAGATTTGAAAGTAAAACGCCTCCTTC
CCGCTGGCGAAAAGGAGTATCTCTTTGTAACTGGAATTGCCGTCCCACAAACTGCCAGAAGACGCAAAGTAGCAACGACACTACTGAAGGGGTGTGACATGCTTGGGAAG
GTTTGGGGATTCAAATTTTTGGCATTAAGTGCATATGAAGATGATTATGGGGCTCGTAATTTGTATAGTAAAGCAGGCTATCAGTCTAAAACTCAGATGAATTCCCTAAG
AAGAAACAAGAAAGAAAATGAAGTTTCAGAGATGAAGAAGAAGAAGAAGAAGAAGATTAAGAAGGGATCAATTATTATTCCATGGGAGCAAAAGAAAGAAATGATTGATA
AAGAAGAAATTCAACTCCACAAAGACTTGGATCAACTTACAAATTGGATAAAAATGGTGGATTCCATGAATGATGAGAAGCTGAAAGAATATCTACAAGATACACCACAA
AAATTCAAGATTCTCAAAATCCCAAAGTGCAACCCTAAGCGCACTGGGCAAAAAATTGAGGATTCTAAATATTGGGCTTCTTACGGGATAATGGCTTCTGTTTGGAAGTT
TCACAAGCAAGACAATGACCAGCAGCTTTCTTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVHLLPNPLRVSSHLRSEPPRTVVPTRSKSGTGGGAIWRNGGIKVSSAVVVRCSSDYSSPITAATTEEESIGVSEEIDQKEYLAREFGWKVRKLMEEEDDLRAVARIQAE
AFHEPVLLFNDFFFQFFQAEVLSALIYRLKNYPPDRYACLVAEPESESCKDEYNFVGVVDVTVAGDLKVKRLLPAGEKEYLFVTGIAVPQTARRRKVATTLLKGCDMLGK
VWGFKFLALSAYEDDYGARNLYSKAGYQSKTQMNSLRRNKKENEVSEMKKKKKKKIKKGSIIIPWEQKKEMIDKEEIQLHKDLDQLTNWIKMVDSMNDEKLKEYLQDTPQ
KFKILKIPKCNPKRTGQKIEDSKYWASYGIMASVWKFHKQDNDQQLS

HG10022543 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome