CuGenDBv2

Gene ID	Cucsat.G8527
Organism	Cucumis sativus L. var. sativus cv. B10 (Cucumber (B10) v3)
Description	glutamic acid-rich protein isoform X1
Genome location	ctg1557:3672226..3675297
RNA-Seq Expression	Cucsat.G8527
Synteny	Cucsat.G8527
Gene Ontology terms	NA
InterPro domains	IPR019351 - Protein of unknown function DUF2039

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7033212.1 hypothetical protein SDJN02_07266 [Cucurbita argyrosperma subsp. argyrosperma]

1.02e-112

84.88

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQNKYAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDD--NESTDDTDGDNYENEDEHE
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA +EE+K GDSI S TE QA +GR EDD  NESTDDTD D  E+EDE  
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDD--NESTDDTDGDNYENEDEHE

Query:  CENEK
        CENE+
Subjt:  CENEK

XP_004141470.1 uncharacterized protein LOC101206376 [Cucumis sativus]

1.39e-144

100

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE

Query:  NEKDEDGKE
        NEKDEDGKE
Subjt:  NEKDEDGKE

XP_008459394.1 PREDICTED: uncharacterized protein LOC103498541 [Cucumis melo]

4.27e-134

96.06

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQN+YAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAV EETK GDSIHSPTE QAEIGRNEDDNE TDDTD DNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE

Query:  NEK
        NE+
Subjt:  NEK

XP_022954477.1 glutamic acid-rich protein isoform X1 [Cucurbita moschata]

1.51e-112

84.47

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQNKYAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDD---NESTDDTDGDNYENEDEH
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA +EE+K GDSI S TE QA +GR EDD   NESTDDTD D  E+EDE 
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDD---NESTDDTDGDNYENEDEH

Query:  ECENEK
         CENE+
Subjt:  ECENEK

XP_023538167.1 glutamic acid-rich protein [Cucurbita pepo subsp. pepo]

1.51e-112

84.47

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQNKYAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNE---DDNESTDDTDGDNYENEDEH
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA +EE+K GDSI S TE QA +GR E   DDNESTDDTD D  E+EDE 
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNE---DDNESTDDTDGDNYENEDEH

Query:  ECENEK
         CENE+
Subjt:  ECENEK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KSJ8 Uncharacterized protein

6.71e-145

100

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE

Query:  NEKDEDGKE
        NEKDEDGKE
Subjt:  NEKDEDGKE

A0A1S3CAL0 uncharacterized protein LOC103498541

2.07e-134

96.06

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MSNKQGPPKHQN+YAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE
        VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAV EETK GDSIHSPTE QAEIGRNEDDNE TDDTD DNYENEDEHECE
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE

Query:  NEK
        NE+
Subjt:  NEK

A0A6J1BX54 uncharacterized protein LOC111006305

8.52e-103

80.71

Show/hide

Query:  KQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCRVDQ
        K GPPKHQN+YAWKPNAG KINETEVGGRFRPLS ITGVCLRCKDQIDWKRRYGKYKPL+EP KCQLCSKR VRQAYHNLCPGCAKEQGVCAKCRCRVD 
Subjt:  KQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCRVDQ

Query:  TVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE
        TVGRD SEVEAEQKMLQEAI+NARERD+RTLLRAM KGK+K+S+K+KSAV+EETK GD   S  E  A++GR EDDN+ TD ++ D+ ENEDE E E
Subjt:  TVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECE

A0A6J1GR32 glutamic acid-rich protein isoform X1

7.29e-113

84.47

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        MS+K G PKHQNKYAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDD---NESTDDTDGDNYENEDEH
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA +EE+K GDSI S TE QA +GR EDD   NESTDDTD D  E+EDE 
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDD---NESTDDTDGDNYENEDEH

Query:  ECENEK
         CENE+
Subjt:  ECENEK

A0A6J1JP90 ribosome biogenesis protein BOP1 homolog isoform X1

1.00e-112

84.39

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        M++K G PKHQNKYAWKPNAGRKINETEVGGRFRPLS+ITGVCLRCKDQIDWKRRYGKYKPLSEP KCQLCSKR VRQAYHNLCPGCAK+QGVCAKCRCR
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNE--DDNESTDDTDGDNYENEDEHE
        VDQT+GRD+SEVEAEQKMLQEAIKNARERD+RTLLRAMEKGK+K+SNKNKSA +EE+K GDSI S TE QA +GR E  DDNESTD TD D YE+EDE  
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNE--DDNESTDDTDGDNYENEDEHE

Query:  CENEK
        CENE+
Subjt:  CENEK

SwissProt top hits

e value

%identity

Alignment

Q68FU5 Uncharacterized protein C9orf85 homolog

3.3e-14

36.54

Show/hide

Query:  MSNKQG------PPKHQNKYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGV
        MS+++G      P KHQN + +K +   + +   ++  +        GVC RCK+ ++W+ +Y KYKPLS+P KC  C ++ V+ +YH +C  CA +  V
Subjt:  MSNKQG------PPKHQNKYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGV

Query:  CAKC
        CAKC
Subjt:  CAKC

Q96MD7 Uncharacterized protein C9orf85

8.6e-15

36.7

Show/hide

Query:  MSNKQG------PPKHQNKYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGV
        MS+++G      P KHQN +++K +   + +   ++  +        GVC RCK+ ++W+ +Y KYKPLS+P KC  C ++ V+ +YH +C  CA E  V
Subjt:  MSNKQG------PPKHQNKYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGV

Query:  CAKCRCRVD
        CAKC  + D
Subjt:  CAKCRCRVD

Q9CQ90 Uncharacterized protein C9orf85 homolog

1.1e-14

37.5

Show/hide

Query:  MSNKQG------PPKHQNKYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGV
        MS+++G      P KHQN + +K +   + +   ++  +        GVC RCK+ ++W+ +Y KYKPLS+P KC  C ++ V+ +YH +C  CA E  V
Subjt:  MSNKQG------PPKHQNKYAWKPNA-GRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGV

Query:  CAKC
        CAKC
Subjt:  CAKC

Arabidopsis top hits

e value

%identity

Alignment

AT3G02220.1 unknown protein

2.2e-58

56.82

Show/hide

Query:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR
        M ++QGPPKHQNK+AW P AG KINETEVGGRFRPLS+ITGVC RC++QI WKR+YGKYK L+E TKCQ C+KRNVRQAYH LCPGCAKEQ VCAKC   
Subjt:  MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCR

Query:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPT---------EVQAEIGRNEDDNESTDDTDG---
        VDQ +GRD+ EVEAEQK+L E IKNARERDRRTLLRAM K    + +  +++  + +K GD   S +          V   IG     + + DD  G   
Subjt:  VDQTVGRDLSEVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPT---------EVQAEIGRNEDDNESTDDTDG---

Query:  --DNYENEDEHECENEKDED
          D+   +DEH+   + DE+
Subjt:  --DNYENEDEHECENEKDED

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCAACAAGCAGGGCCCTCCCAAGCACCAGAACAAATACGCTTGGAAACCCAACGCCGGCCGCAAAATCAACGAAACGGAGGTTGGAGGTAGGTTCCGCCCCTTATC
TGACATCACCGGAGTTTGTCTCCGTTGTAAGGACCAAATTGATTGGAAACGCCGTTACGGAAAGTACAAACCTCTTTCTGAACCTACTAAATGTCAATTGTGTTCAAAGC
GGAATGTTCGTCAAGCGTATCACAATCTCTGCCCCGGTTGTGCCAAGGAGCAAGGTGTATGTGCAAAATGTCGTTGTCGTGTAGATCAAACTGTTGGAAGGGATTTGTCT
GAAGTGGAAGCTGAGCAAAAGATGCTTCAAGAGGCAATAAAGAATGCTCGAGAAAGGGATCGTAGAACTCTGTTACGTGCTATGGAGAAAGGAAAAGCTAAGAGTTCAAA
TAAAAACAAATCAGCAGTTGAAGAAGAAACGAAGGATGGAGATTCAATTCATTCACCAACTGAAGTGCAAGCTGAAATAGGTCGAAATGAGGATGATAATGAAAGTACAG
ACGACACGGATGGAGATAACTACGAAAATGAAGATGAACATGAATGTGAAAATGAGAAAGATGAAGATGGGAAAGAGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSNKQGPPKHQNKYAWKPNAGRKINETEVGGRFRPLSDITGVCLRCKDQIDWKRRYGKYKPLSEPTKCQLCSKRNVRQAYHNLCPGCAKEQGVCAKCRCRVDQTVGRDLS
EVEAEQKMLQEAIKNARERDRRTLLRAMEKGKAKSSNKNKSAVEEETKDGDSIHSPTEVQAEIGRNEDDNESTDDTDGDNYENEDEHECENEKDEDGKE

Cucsat.G8527 (gene) of Cucumber (B10) v3 genome