; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

HG10003041 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome

Gene IDHG10003041
OrganismLagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Descriptionlate embryogenesis abundant protein 6
Genome locationChr11:16654050..16656309
RNA-Seq ExpressionHG10003041
SyntenyHG10003041
Gene Ontology termsGO:0009793 - embryo development ending in seed dormancy (biological process)
InterPro domainsIPR005513 - Late embryogenesis abundant protein, LEA_1 subgroup


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6577696.1 Late embryogenesis abundant protein 6, partial [Cucurbita argyrosperma subsp. sororia]1.6e-3981.67Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSAMEKLSNMGSVAK+KLKICRAKLDEKV+KAS KT EERKI EERRKAA AEAKRELHEAKARHAAQKLR R+S VLG  LH HQPP+EG +A     
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  ANVPAYPIATPEGYYPGHKI
        ANVPAYPIA+PEGYYPGH+I
Subjt:  ANVPAYPIATPEGYYPGHKI

XP_004148757.1 late embryogenesis abundant protein 6 [Cucumis sativus]4.0e-4690.08Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKT EERKI+EERRKAATAEAKRELHEAKARHAAQKLRNRKS VLGGH H HQ PMEG AAT LGG
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  A-NVPAYPIATPEGYYPGHKI
        A NVPAYPI +PEGY+PGHKI
Subjt:  A-NVPAYPIATPEGYYPGHKI

XP_008448704.1 PREDICTED: uncharacterized protein LOC103490795 [Cucumis melo]1.5e-4590.16Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVL-GGHLHYHQPPMEGAAATQLG
        MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKT EERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKS VL GGHLH+H  P+EG AAT LG
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVL-GGHLHYHQPPMEGAAATQLG

Query:  G-ANVPAYPIATPEGYYPGHKI
        G  NVPAYPIA+PEGYYPGHKI
Subjt:  G-ANVPAYPIATPEGYYPGHKI

XP_022923386.1 late embryogenesis abundant protein 6-like isoform X1 [Cucurbita moschata]3.6e-3980.83Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSAMEKLSNMGSVAK+KLKICRAKLDEKV+KAS KT EERKI EERRKAA AEAKRELHEAKARHAAQKLR R+S V+G  LH HQPP+EG +A     
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  ANVPAYPIATPEGYYPGHKI
        ANVPAYPIA+PEGYYPGH+I
Subjt:  ANVPAYPIATPEGYYPGHKI

XP_038906206.1 late embryogenesis abundant protein 6-like [Benincasa hispida]1.2e-4590.08Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKT EERKI EERRKAATAEAKRELHEAKARHAAQKLR++KS VLGGHLH+H PPMEGAAAT LG 
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  ANVP-AYPIATPEGYYPGHKI
        ANVP AYPI T EGYYPGHKI
Subjt:  ANVP-AYPIATPEGYYPGHKI

TrEMBL top hitse value%identityAlignment
A0A1S3BKB4 uncharacterized protein LOC1034907957.3e-4690.16Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVL-GGHLHYHQPPMEGAAATQLG
        MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKT EERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKS VL GGHLH+H  P+EG AAT LG
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVL-GGHLHYHQPPMEGAAATQLG

Query:  G-ANVPAYPIATPEGYYPGHKI
        G  NVPAYPIA+PEGYYPGHKI
Subjt:  G-ANVPAYPIATPEGYYPGHKI

A0A5D3CHS9 Seed maturation protein7.3e-4690.16Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVL-GGHLHYHQPPMEGAAATQLG
        MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKT EERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKS VL GGHLH+H  P+EG AAT LG
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVL-GGHLHYHQPPMEGAAATQLG

Query:  G-ANVPAYPIATPEGYYPGHKI
        G  NVPAYPIA+PEGYYPGHKI
Subjt:  G-ANVPAYPIATPEGYYPGHKI

A0A6J1E5Y8 late embryogenesis abundant protein 6-like isoform X21.6e-3780.17Show/hide
Query:  MEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGGANVP
        MEKLSNMGSVAK+KLKICRAKLDEKV+KAS KT EERKI EERRKAA AEAKRELHEAKARHAAQKLR R+S V+G  LH HQPP+EG +A     ANVP
Subjt:  MEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGGANVP

Query:  AYPIATPEGYYPGHKI
        AYPIA+PEGYYPGH+I
Subjt:  AYPIATPEGYYPGHKI

A0A6J1E6N7 late embryogenesis abundant protein 6-like isoform X11.8e-3980.83Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSAMEKLSNMGSVAK+KLKICRAKLDEKV+KAS KT EERKI EERRKAA AEAKRELHEAKARHAAQKLR R+S V+G  LH HQPP+EG +A     
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  ANVPAYPIATPEGYYPGHKI
        ANVPAYPIA+PEGYYPGH+I
Subjt:  ANVPAYPIATPEGYYPGHKI

A0A6J1HN56 late embryogenesis abundant protein 6-like isoform X12.5e-3880Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSAMEKLSNMGSVAK+KLKICRAKL+EKV+KAS KT EERKIVEERRKAA AE KRELHEAKARHAAQKLR R+S VLG  LH HQPP+E  +A     
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  ANVPAYPIATPEGYYPGHKI
        ANVPAYPIA+PEGYYPGH+I
Subjt:  ANVPAYPIATPEGYYPGHKI

SwissProt top hitse value%identityAlignment
Q39138 Late embryogenesis abundant protein 61.1e-1142.98Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKS--QVLGGHLHYHQPPMEGAAATQL
        MQSA +K+S+M S AKEK+ IC+AK DEK E+A  +T EE++I  +RRKA  AEA  ++H AKA HA  KL  ++S   V     H  Q     A A  +
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKS--QVLGGHLHYHQPPMEGAAATQL

Query:  G---GANVPAYPIATPEGYYP
        G   G N        P+ Y+P
Subjt:  G---GANVPAYPIATPEGYYP

Q96273 Late embryogenesis abundant protein 183.1e-0944.23Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSA EK+S+M S AKEKL I  AK     EK   +T +E+K+ +ER K+  A+AK +LH++KA HAA       +QV G HL     P      T+  G
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  ANVP
        AN P
Subjt:  ANVP

Arabidopsis top hitse value%identityAlignment
AT1G32560.1 Late embryogenesis abundant protein, group 1 protein8.1e-1342.98Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKS--QVLGGHLHYHQPPMEGAAATQL
        MQSA +K+S+M S AKEK+ IC+AK DEK E+A  +T EE++I  +RRKA  AEA  ++H AKA HA  KL  ++S   V     H  Q     A A  +
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKS--QVLGGHLHYHQPPMEGAAATQL

Query:  G---GANVPAYPIATPEGYYP
        G   G N        P+ Y+P
Subjt:  G---GANVPAYPIATPEGYYP

AT2G35300.1 Late embryogenesis abundant protein, group 1 protein2.2e-1044.23Show/hide
Query:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG
        MQSA EK+S+M S AKEKL I  AK     EK   +T +E+K+ +ER K+  A+AK +LH++KA HAA       +QV G HL     P      T+  G
Subjt:  MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGG

Query:  ANVP
        AN P
Subjt:  ANVP


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCAATCTGCAATGGAGAAGCTGAGCAATATGGGAAGTGTTGCTAAAGAGAAGCTTAAAATTTGTAGAGCCAAACTCGACGAAAAGGTGGAGAAAGCGTCGGTGAAGAC
GGTGGAGGAGAGGAAGATTGTGGAGGAGAGAAGGAAGGCAGCGACGGCGGAGGCAAAGCGGGAGCTACATGAGGCGAAAGCTAGACATGCTGCTCAAAAGCTAAGGAATA
GGAAATCACAAGTACTTGGCGGCCATTTACACTATCATCAGCCTCCGATGGAAGGTGCCGCCGCCACACAGCTCGGCGGAGCAAATGTTCCGGCTTATCCTATAGCCACC
CCGGAGGGGTACTATCCCGGACATAAAATTTAA
mRNA sequenceShow/hide mRNA sequence
ATGCAATCTGCAATGGAGAAGCTGAGCAATATGGGAAGTGTTGCTAAAGAGAAGCTTAAAATTTGTAGAGCCAAACTCGACGAAAAGGTGGAGAAAGCGTCGGTGAAGAC
GGTGGAGGAGAGGAAGATTGTGGAGGAGAGAAGGAAGGCAGCGACGGCGGAGGCAAAGCGGGAGCTACATGAGGCGAAAGCTAGACATGCTGCTCAAAAGCTAAGGAATA
GGAAATCACAAGTACTTGGCGGCCATTTACACTATCATCAGCCTCCGATGGAAGGTGCCGCCGCCACACAGCTCGGCGGAGCAAATGTTCCGGCTTATCCTATAGCCACC
CCGGAGGGGTACTATCCCGGACATAAAATTTAA
Protein sequenceShow/hide protein sequence
MQSAMEKLSNMGSVAKEKLKICRAKLDEKVEKASVKTVEERKIVEERRKAATAEAKRELHEAKARHAAQKLRNRKSQVLGGHLHYHQPPMEGAAATQLGGANVPAYPIAT
PEGYYPGHKI