CuGenDBv2

Gene ID	CSPI03G35560
Organism	Cucumis sativus L. var. sativus cv. PI 183967 (Cucumber (PI 183967) v1)
Description	Hydroxyproline-rich glycoprotein family protein
Genome location	Chr3:30999758..31001581
RNA-Seq Expression	CSPI03G35560
Synteny	CSPI03G35560
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0043818.1 protein YLS9 [Cucumis melo var. makuwa]

1.5e-139

86.64

Show/hide

Query:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG
        MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPP GH GYSPAMGYPP P P YPPA GNYPPYN YYAQAPPAAYYNNPQNYRA T+SAG
Subjt:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG

Query:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK
        FLRGIV ALILLVA+MTLSSIITWI+LRP++PVFKVDSFSVSNFNISKLNYSGNW+ S+TV+NPNHKL VN+ERIQSFV+YK+NTLAMSYADPFF+DVEK
Subjt:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK

Query:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL
        S QM+VKLTSSSPDDPGNWLETEEK+G+E+A+GTVSFNLRFFAWT FR+GSWWTRR+VM+V CED+KL FTGPAA H VYLAD HSKTCSVL
Subjt:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL

XP_008442912.1 PREDICTED: uncharacterized protein LOC103486674 [Cucumis melo]

1.5e-139

86.64

Show/hide

Query:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG
        MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPP GH GYSPAMGYPP P P YPPA GNYPPYN YYAQAPPAAYYNNPQNYRA T+SAG
Subjt:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG

Query:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK
        FLRGIV ALILLVA+MTLSSIITWI+LRP++PVFKVDSFSVSNFNISKLNYSGNW+ S+TV+NPNHKL VN+ERIQSFV+YK+NTLAMSYADPFF+DVEK
Subjt:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK

Query:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL
        S QM+VKLTSSSPDDPGNWLETEEK+G+E+A+GTVSFNLRFFAWT FR+GSWWTRR+VM+V CED+KL FTGPAA H VYLAD HSKTCSVL
Subjt:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL

XP_011652032.1 uncharacterized protein LOC105434983 [Cucumis sativus]

1.6e-160

100

Show/hide

Query:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF
        MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF
Subjt:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF

Query:  LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS
        LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS
Subjt:  LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS

Query:  SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVLF
        SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVLF
Subjt:  SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVLF

XP_022983003.1 uncharacterized protein LOC111481675 [Cucurbita maxima]

1.8e-108

70.39

Show/hide

Query:  MASSSEDQ---QSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTY-YAQAPPAAYY-------NNPQ
        MASSS DQ   QSQSK TDPPPP P SAGNNPPP+YPPPTLGY PPH HGY PAMGYPP P PGYPPAPGNYPPYN Y Y QAPPAAYY       NNPQ
Subjt:  MASSSEDQ---QSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTY-YAQAPPAAYY-------NNPQ

Query:  NYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSY
         YR +T  AGFLRGI  AL+LLV +MT+SSIITWI+LRP+IP FKVDSFSV+NFNISK NYSG W+  +TV+NPNHKL ++ ERI+SFV+Y +NT+A S+
Subjt:  NYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSY

Query:  ADPFFIDVEKSSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFR--SGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKT
        +DPFF+D+EKS QM VK+TSSSPDDPGNW++TEEK+ +E+A+GTVSF LR  AWT FR  SGS WTRR++++VFCEDLKL FTG   T GVY   AH KT
Subjt:  ADPFFIDVEKSSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFR--SGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKT

Query:  CSVL
        C VL
Subjt:  CSVL

XP_038905898.1 uncharacterized protein LOC120091828 [Benincasa hispida]

5.0e-127

79.38

Show/hide

Query:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF
        MASSS+D QSQSKATDPPP  P SAGNNPPPVYPPPTLGYPPP GH Y PAMGYPP P PGYPPAPGNYPPYN YYAQAPPAAYYNN QNYRA+TV+ GF
Subjt:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF

Query:  LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS
        LRGIVTALIL VA+MTLSSI+TWI+LRP+IPVF++DSFSV NFNISK NYSGNW+G++TV+NPNH+L VN+ER+QSFV+YK+NTLAMSY DPFF+DVEKS
Subjt:  LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS

Query:  SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL
         QMRVKLTSSSPDDPG+W ETE+K+GQEKA+GTVSFNLRF AWT FR GSWWTRR+V++VFCEDLKL F GPAA   VY  + + K CSVL
Subjt:  SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LGS8 Uncharacterized protein

7.5e-161

100

Show/hide

Query:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF
        MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF
Subjt:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGF

Query:  LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS
        LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS
Subjt:  LRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKS

Query:  SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVLF
        SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVLF
Subjt:  SQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVLF

A0A1S3B6W4 uncharacterized protein LOC103486674

7.3e-140

86.64

Show/hide

Query:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG
        MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPP GH GYSPAMGYPP P P YPPA GNYPPYN YYAQAPPAAYYNNPQNYRA T+SAG
Subjt:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG

Query:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK
        FLRGIV ALILLVA+MTLSSIITWI+LRP++PVFKVDSFSVSNFNISKLNYSGNW+ S+TV+NPNHKL VN+ERIQSFV+YK+NTLAMSYADPFF+DVEK
Subjt:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK

Query:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL
        S QM+VKLTSSSPDDPGNWLETEEK+G+E+A+GTVSFNLRFFAWT FR+GSWWTRR+VM+V CED+KL FTGPAA H VYLAD HSKTCSVL
Subjt:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL

A0A5A7TLT1 Protein YLS9

7.3e-140

86.64

Show/hide

Query:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG
        MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPP GH GYSPAMGYPP P P YPPA GNYPPYN YYAQAPPAAYYNNPQNYRA T+SAG
Subjt:  MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGH-GYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAG

Query:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK
        FLRGIV ALILLVA+MTLSSIITWI+LRP++PVFKVDSFSVSNFNISKLNYSGNW+ S+TV+NPNHKL VN+ERIQSFV+YK+NTLAMSYADPFF+DVEK
Subjt:  FLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEK

Query:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL
        S QM+VKLTSSSPDDPGNWLETEEK+G+E+A+GTVSFNLRFFAWT FR+GSWWTRR+VM+V CED+KL FTGPAA H VYLAD HSKTCSVL
Subjt:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVL

A0A6J1F415 uncharacterized protein LOC111442188

5.7e-108

70.3

Show/hide

Query:  MASSSEDQ---QSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTY-YAQAPPAAYY------NNPQN
        MASSS DQ   QSQSK TDPPPP P SAGNNPPP+YPPPTLGY PPH HGY PAMGYPP P PGYPPAPGNYPPYN Y Y QAPPAAYY      NNPQ 
Subjt:  MASSSEDQ---QSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTY-YAQAPPAAYY------NNPQN

Query:  YRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYA
        YR +T  AGFLRGI  AL+LLV +MT+SSIITWI+LRP+IP FKVDSFSV+NFNISK NYSG W+  +TV+NPNHKL ++ ERI+SFV+Y +NT+A S++
Subjt:  YRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYA

Query:  DPFFIDVEKSSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFR--SGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTC
        DPFF+D+EKS QM+VK+TSSSPDDPGNW +TEEK+ +E+ +GTVSF LR  AWT FR  SGS WTRR++++VFCEDLKL FTG   T GVY   A SKTC
Subjt:  DPFFIDVEKSSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFR--SGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTC

Query:  SVL
         VL
Subjt:  SVL

A0A6J1J6I9 uncharacterized protein LOC111481675

8.7e-109

70.39

Show/hide

Query:  MASSSEDQ---QSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTY-YAQAPPAAYY-------NNPQ
        MASSS DQ   QSQSK TDPPPP P SAGNNPPP+YPPPTLGY PPH HGY PAMGYPP P PGYPPAPGNYPPYN Y Y QAPPAAYY       NNPQ
Subjt:  MASSSEDQ---QSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTY-YAQAPPAAYY-------NNPQ

Query:  NYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSY
         YR +T  AGFLRGI  AL+LLV +MT+SSIITWI+LRP+IP FKVDSFSV+NFNISK NYSG W+  +TV+NPNHKL ++ ERI+SFV+Y +NT+A S+
Subjt:  NYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSY

Query:  ADPFFIDVEKSSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFR--SGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKT
        +DPFF+D+EKS QM VK+TSSSPDDPGNW++TEEK+ +E+A+GTVSF LR  AWT FR  SGS WTRR++++VFCEDLKL FTG   T GVY   AH KT
Subjt:  ADPFFIDVEKSSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFR--SGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKT

Query:  CSVL
        C VL
Subjt:  CSVL

SwissProt top hits

e value

%identity

Alignment

Q9SJ52 NDR1/HIN1-like protein 10

6.6e-05

Show/hide

Query:  YYAQAPPAAYYNNPQNYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLT--VENPNHKLTVNIE
        Y    PP A     +    +      L   V  +I L+ ++ ++++I W+++RP+   F V   S++ F+ +  +    +N +LT  V NPN ++ +  +
Subjt:  YYAQAPPAAYYNNPQNYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLT--VENPNHKLTVNIE

Query:  RIQSFVNYKENTLAMSYADPFFIDVEKSSQMRVKLTSSSPDDPGNWL-----ETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKL
        RI++   Y+    +     PF+       Q     T  +P   G  L          +  E+ SG  +  ++F     F+ G    RRI  KV C+DL+L
Subjt:  RIQSFVNYKENTLAMSYADPFFIDVEKSSQMRVKLTSSSPDDPGNWL-----ETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKL

Arabidopsis top hits

e value

%identity

Alignment

AT2G27260.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

6.1e-14

32.49

Show/hide

Query:  PTLGYPPPHGHGYSPAMGYPPPPPPGYP-PAPGNYPPY---NTYYAQAPPAAYYNNPQNYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIP
        P  GYP P+ +   P      PP  GYP PA G   PY   N YYA  P         N RA  +   F+  + T  +LL+ ++     I ++++RPQ+P
Subjt:  PTLGYPPPHGHGYSPAMGYPPPPPPGYP-PAPGNYPPY---NTYYAQAPPAAYYNNPQNYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIP

Query:  VFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKSSQMRVKLTSSSPDDPGNWLETE--EKVGQEK
           ++S SVSNFN+S    SG W+  L   NPN K++++ E     + Y   +L+ +   PF  D  K  Q  V  T S     G +++    + +G+E+
Subjt:  VFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKSSQMRVKLTSSSPDDPGNWLETE--EKVGQEK

Query:  A-SGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDL
        +  G V F+LR  ++  FR G++  RR V  V+C+D+
Subjt:  A-SGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDL

AT2G35980.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

4.7e-06

Show/hide

Query:  YYAQAPPAAYYNNPQNYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLT--VENPNHKLTVNIE
        Y    PP A     +    +      L   V  +I L+ ++ ++++I W+++RP+   F V   S++ F+ +  +    +N +LT  V NPN ++ +  +
Subjt:  YYAQAPPAAYYNNPQNYRAQTVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLT--VENPNHKLTVNIE

Query:  RIQSFVNYKENTLAMSYADPFFIDVEKSSQMRVKLTSSSPDDPGNWL-----ETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKL
        RI++   Y+    +     PF+       Q     T  +P   G  L          +  E+ SG  +  ++F     F+ G    RRI  KV C+DL+L
Subjt:  RIQSFVNYKENTLAMSYADPFFIDVEKSSQMRVKLTSSSPDDPGNWL-----ETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKL

AT3G52460.1 hydroxyproline-rich glycoprotein family protein

4.2e-39

40.27

Show/hide

Query:  SSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPP--HGHGYSPAMGYP--PPPPPGYPPAPGNYP--PYNTY-YAQAPPAAYYNNPQNYRAQ--
        S  ++++Q K    P  +     N PPP  PPP    PPP      Y P MGYP    PPP YP    NYP  PY  Y YAQAPPA+YY +  +Y AQ  
Subjt:  SSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPP--HGHGYSPAMGYP--PPPPPGYPPAPGNYP--PYNTY-YAQAPPAAYYNNPQNYRAQ--

Query:  -----TVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNY-----KENT
               S+GF+RGI T LI+LV ++ +S+ ITW+VLRPQIP+F V++FSVSNFN++   +S  W  +LT+EN N KL    +RIQ  V +     ++  
Subjt:  -----TVSAGFLRGIVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNY-----KENT

Query:  LAMSYADPFFIDVEKSSQMRVKLTSSSPDDP--GNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYL
        LA ++  P F++ +KS  +   LT+   + P   +W+  E K  +E+ +GTV+F+LR   W  F++  W  R   +KVFC  LK+ F G +    V L
Subjt:  LAMSYADPFFIDVEKSSQMRVKLTSSSPDDP--GNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYL

AT5G22870.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

4.6e-09

22.54

Show/hide

Query:  IVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNY-SGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFF---IDVEK
        I   ++ L+ +  +  +ITW+  +P+   + V++ SV NFN++  N+ S  +  ++   NPNH+++V    ++ FV +K+ TLA    +PF    ++V++
Subjt:  IVTALILLVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNY-SGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFF---IDVEK

Query:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGP
          +  +    +     G  L ++  +G+      + F +   A   F+ G W +     K+ C  + ++ + P
Subjt:  SSQMRVKLTSSSPDDPGNWLETEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTTCCTCATCGGAGGATCAACAATCTCAATCCAAAGCCACTGACCCACCTCCTCCGCACCCCTCCTCTGCTGGAAACAACCCTCCTCCTGTCTATCCACCGCCCAC
ATTGGGGTACCCTCCTCCTCACGGCCATGGGTACTCTCCGGCGATGGGGTACCCTCCACCTCCACCTCCAGGGTACCCACCGGCTCCGGGGAATTACCCTCCTTACAATA
CGTACTACGCTCAGGCTCCCCCGGCGGCGTATTACAATAACCCTCAAAACTACAGAGCCCAGACCGTAAGCGCGGGATTCCTCCGAGGGATTGTGACGGCGTTGATTTTA
TTGGTGGCTGTAATGACTCTGTCCAGCATAATCACATGGATCGTCCTCCGCCCTCAAATCCCAGTGTTTAAAGTCGATTCATTCTCCGTTTCGAATTTCAATATCTCGAA
ATTGAATTACTCCGGAAATTGGAATGGGAGTCTGACGGTTGAAAATCCGAACCATAAACTGACTGTGAATATAGAGCGCATCCAGAGCTTCGTGAACTACAAAGAAAATA
CGTTGGCAATGTCTTACGCGGACCCATTTTTTATAGATGTGGAGAAGAGCAGTCAAATGAGGGTGAAATTGACGTCGAGTAGTCCCGATGATCCGGGAAATTGGTTAGAA
ACAGAGGAGAAGGTGGGGCAGGAGAAGGCGAGTGGAACGGTGAGTTTCAATTTGAGATTCTTTGCTTGGACGGCTTTCCGATCCGGTTCTTGGTGGACAAGGCGGATTGT
CATGAAAGTGTTTTGTGAAGATTTGAAGCTGGCCTTCACCGGACCCGCCGCCACTCATGGCGTTTACTTGGCCGACGCACACTCCAAGACTTGTTCTGTTCTCTTCTAG

mRNA sequence

Show/hide mRNA sequence

TAACCTTCCGTTTTTTTTCTAAGAAAAGCCTTAACGGATCTCCATATTCTAAATCCTCCTCCATTTCTGATTTCTCCTTTACCATTCTTCTCTCTCTCTCTCTCTCTCTC
TCTCTCCAAATCCTCTCACAGGGAGAGAGAAAAAGCCACAAACAGAGCATCCTTTCCAATGGCTTCCTCATCGGAGGATCAACAATCTCAATCCAAAGCCACTGACCCAC
CTCCTCCGCACCCCTCCTCTGCTGGAAACAACCCTCCTCCTGTCTATCCACCGCCCACATTGGGGTACCCTCCTCCTCACGGCCATGGGTACTCTCCGGCGATGGGGTAC
CCTCCACCTCCACCTCCAGGGTACCCACCGGCTCCGGGGAATTACCCTCCTTACAATACGTACTACGCTCAGGCTCCCCCGGCGGCGTATTACAATAACCCTCAAAACTA
CAGAGCCCAGACCGTAAGCGCGGGATTCCTCCGAGGGATTGTGACGGCGTTGATTTTATTGGTGGCTGTAATGACTCTGTCCAGCATAATCACATGGATCGTCCTCCGCC
CTCAAATCCCAGTGTTTAAAGTCGATTCATTCTCCGTTTCGAATTTCAATATCTCGAAATTGAATTACTCCGGAAATTGGAATGGGAGTCTGACGGTTGAAAATCCGAAC
CATAAACTGACTGTGAATATAGAGCGCATCCAGAGCTTCGTGAACTACAAAGAAAATACGTTGGCAATGTCTTACGCGGACCCATTTTTTATAGATGTGGAGAAGAGCAG
TCAAATGAGGGTGAAATTGACGTCGAGTAGTCCCGATGATCCGGGAAATTGGTTAGAAACAGAGGAGAAGGTGGGGCAGGAGAAGGCGAGTGGAACGGTGAGTTTCAATT
TGAGATTCTTTGCTTGGACGGCTTTCCGATCCGGTTCTTGGTGGACAAGGCGGATTGTCATGAAAGTGTTTTGTGAAGATTTGAAGCTGGCCTTCACCGGACCCGCCGCC
ACTCATGGCGTTTACTTGGCCGACGCACACTCCAAGACTTGTTCTGTTCTCTTCTAGAAGAATTCTTCGGAAAGTAGGCAAATTGTGTGTGGGGGCTTGAAGGAAAAGGG
GTATAGCAGAGAGATTTGCTTTCATGTTTGGAGATTATGAAACATTATATTCAACTTTAGGGATCTTTTTTTTTTTTTTT

Protein sequence

Show/hide protein sequence

MASSSEDQQSQSKATDPPPPHPSSAGNNPPPVYPPPTLGYPPPHGHGYSPAMGYPPPPPPGYPPAPGNYPPYNTYYAQAPPAAYYNNPQNYRAQTVSAGFLRGIVTALIL
LVAVMTLSSIITWIVLRPQIPVFKVDSFSVSNFNISKLNYSGNWNGSLTVENPNHKLTVNIERIQSFVNYKENTLAMSYADPFFIDVEKSSQMRVKLTSSSPDDPGNWLE
TEEKVGQEKASGTVSFNLRFFAWTAFRSGSWWTRRIVMKVFCEDLKLAFTGPAATHGVYLADAHSKTCSVLF

CSPI03G35560 (gene) of Cucumber (PI 183967) v1 genome