CuGenDBv2

Gene ID	PI0024033
Organism	Cucumis metuliferus PI 482460 (Melon (PI 482460) v1)
Description	glutamic acid-rich protein isoform X1
Genome location	chr09:20235863..20238570
RNA-Seq Expression	PI0024033
Synteny	PI0024033
Gene Ontology terms	NA
InterPro domains	IPR019351 - Protein of unknown function DUF2039

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6602535.1 Eukaryotic translation initiation factor 3 subunit M, partial [Cucurbita argyrosperma subsp. sororia]

1.7e-87

84.04

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQN+YAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE--DDNEITDDTDDDNYENEDEHE
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA  EE+K GDSI S TEEQA +GR E  DDNE TDDTD+D  E+ED  E
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE--DDNEITDDTDDDNYENEDEHE

Query:  CENEENDEDEDEK
        CENEE D+DE+E+
Subjt:  CENEENDEDEDEK

KAG7033212.1 hypothetical protein SDJN02_07266 [Cucurbita argyrosperma subsp. argyrosperma]

1.7e-87

84.04

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQN+YAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE--DDNEITDDTDDDNYENEDEHE
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA  EE+K GDSI S TEEQA +GR E  DDNE TDDTD+D  E+ED  E
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE--DDNEITDDTDDDNYENEDEHE

Query:  CENEENDEDEDEK
        CENEE D+DE+E+
Subjt:  CENEENDEDEDEK

XP_004141470.1 uncharacterized protein LOC101206376 [Cucumis sativus]

5.3e-102

94.34

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQN+YAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAV+EETK GDSIHSPTE QAEIGRNEDDNE TDDTD DNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE

Query:  NEENDEDEDEKE
        NE   +DED KE
Subjt:  NEENDEDEDEKE

XP_008459394.1 PREDICTED: uncharacterized protein LOC103498541 [Cucumis melo]

7.2e-107

98.07

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAV EETKVGDSIHSPTE+QAEIGRNEDDNEITDDTDDDNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE

Query:  NEENDED
        NEEND++
Subjt:  NEENDED

XP_022954477.1 glutamic acid-rich protein isoform X1 [Cucurbita moschata]

2.2e-87

83.64

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQN+YAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE---DDNEITDDTDDDNYENEDEH
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA  EE+K GDSI S TEEQA +GR E   DDNE TDDTD+D  E+ED  
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE---DDNEITDDTDDDNYENEDEH

Query:  ECENEENDEDEDEK
        ECENEE D+DE+E+
Subjt:  ECENEENDEDEDEK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KSJ8 Uncharacterized protein

2.6e-102

94.34

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQN+YAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAV+EETK GDSIHSPTE QAEIGRNEDDNE TDDTD DNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE

Query:  NEENDEDEDEKE
        NE   +DED KE
Subjt:  NEENDEDEDEKE

A0A1S3CAL0 uncharacterized protein LOC103498541

3.5e-107

98.07

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAV EETKVGDSIHSPTE+QAEIGRNEDDNEITDDTDDDNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECE

Query:  NEENDED
        NEEND++
Subjt:  NEENDED

A0A6J1BX54 uncharacterized protein LOC111006305

7.8e-83

83.33

Show/hide

Query:  KQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCRVDQ
        K GPPKHQNRYAWKPNAG KINETEVGGRFRPLS ITGVCLRCKDQIDWKRRYGKYKPL+EPAKCQLCSKR VRQAYHNLCPGCAKEQGVCAKCRCRVD 
Subjt:  KQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCRVDQ

Query:  TVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECEN
        TVGRD SEVEAEQKMLQEAI+NARERD+RTLLRAM KGK+K+S+K+KSAVKEETKVGD   S  EE A++GR EDDN+ITD +++D+ ENEDE E E+
Subjt:  TVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECEN

A0A6J1GR32 glutamic acid-rich protein isoform X1

1.1e-87

83.64

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQN+YAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE---DDNEITDDTDDDNYENEDEH
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA  EE+K GDSI S TEEQA +GR E   DDNE TDDTD+D  E+ED  
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE---DDNEITDDTDDDNYENEDEH

Query:  ECENEENDEDEDEK
        ECENEE D+DE+E+
Subjt:  ECENEENDEDEDEK

A0A6J1JP90 ribosome biogenesis protein BOP1 homolog isoform X1

1.4e-87

83.57

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        M++K G PKHQN+YAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE--DDNEITDDTDDDNYENEDEHE
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA  EE+K GDSI S TEEQA +GR E  DDNE TD TD+D YE+ED  E
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNE--DDNEITDDTDDDNYENEDEHE

Query:  CENEENDEDEDEK
        CENEE D+DE+E+
Subjt:  CENEENDEDEDEK

SwissProt top hits

e value

%identity

Alignment

Q68FU5 Uncharacterized protein C9orf85 homolog

3.3e-14

36.54

Show/hide

Query:  MSNKQG------PPKHQNRYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGV
        MS+++G      P KHQN + +K +   + +   ++  +        GVC RCK+ ++W+ +Y KYKPLS+P KC  C ++ V+ +YH +C  CA +  V
Subjt:  MSNKQG------PPKHQNRYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGV

Query:  CAKC
        CAKC
Subjt:  CAKC

Q96MD7 Uncharacterized protein C9orf85

8.8e-15

36.7

Show/hide

Query:  MSNKQG------PPKHQNRYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGV
        MS+++G      P KHQN +++K +   + +   ++  +        GVC RCK+ ++W+ +Y KYKPLS+P KC  C ++ V+ +YH +C  CA E  V
Subjt:  MSNKQG------PPKHQNRYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGV

Query:  CAKCRCRVD
        CAKC  + D
Subjt:  CAKCRCRVD

Q9CQ90 Uncharacterized protein C9orf85 homolog

1.1e-14

37.5

Show/hide

Query:  MSNKQG------PPKHQNRYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGV
        MS+++G      P KHQN + +K +   + +   ++  +        GVC RCK+ ++W+ +Y KYKPLS+P KC  C ++ V+ +YH +C  CA E  V
Subjt:  MSNKQG------PPKHQNRYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGV

Query:  CAKC
        CAKC
Subjt:  CAKC

Arabidopsis top hits

e value

%identity

Alignment

AT3G02220.1 unknown protein

1.2e-56

56.89

Show/hide

Query:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        M ++QGPPKHQN++AW P AG KINETEVGGRFRPLS+ITGVC RC++QI WKR+YGKYK L+E  KCQ C+KRNVRQAYH LCPGCAKEQ VCAKC   
Subjt:  MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPT-EEQAE--------IGRNEDDNEITDD-----T
        VDQ +GRD+ EVEAEQK+L E IKNARERDRRTLLRAM K    + +  +++  + +KVGD   S + EE A         IG     +   DD     +
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPT-EEQAE--------IGRNEDDNEITDD-----T

Query:  DDDNYENEDEHECENEENDEDEDEK
        D+D+   +DEH+   E++DE+E  +
Subjt:  DDDNYENEDEHECENEENDEDEDEK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCAACAAGCAGGGCCCTCCCAAGCACCAAAACAGATACGCTTGGAAACCCAACGCCGGCCGGAAAATCAACGAAACGGAGGTTGGAGGTAGGTTCCGCCCCTTATC
TGACATCACCGGAGTTTGTCTCCGTTGCAAGGACCAAATTGATTGGAAACGCCGTTACGGCAAGTACAAACCTCTTTCTGAACCTGCTAAATGTCAATTGTGTTCAAAGC
GGAATGTTCGTCAAGCGTATCATAATCTCTGCCCCGGTTGTGCCAAGGAGCAAGGTGTATGTGCAAAATGTCGCTGTCGTGTAGATCAAACTGTTGGGAGGGATTTGTCT
GAAGTGGAGGCTGAGCAAAAGATGCTTCAAGAGGCCATAAAGAATGCTCGAGAAAGGGATCGTAGAACTCTATTACGTGCTATGGAGAAAGGAAAAGCTAAGAGTTCAAA
TAAAAACAAATCAGCAGTTAAAGAAGAAACGAAGGTTGGAGATTCAATTCATTCACCAACTGAAGAGCAAGCTGAAATAGGTCGAAATGAGGATGATAATGAAATTACAG
ACGACACGGATGACGATAACTACGAAAATGAAGATGAACATGAATGTGAAAATGAAGAAAATGATGAAGATGAAGACGAGAAAGAGATGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSNKQGPPKHQNRYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPAKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCRVDQTVGRDLS
EVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVKEETKVGDSIHSPTEEQAEIGRNEDDNEITDDTDDDNYENEDEHECENEENDEDEDEKEM

PI0024033 (gene) of Melon (PI 482460) v1 genome