CuGenDBv2

Gene ID	Lsi06G010970
Organism	Lagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
Description	glycine-rich cell wall structural protein 2-like
Genome location	chr06:21243622..21244050
RNA-Seq Expression	Lsi06G010970
Synteny	Lsi06G010970
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6589745.1 hypothetical protein SDJN03_15168, partial [Cucurbita argyrosperma subsp. sororia]

1.8e-29

74.21

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSGGSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSY---------
        MASI  L +V+CFLLSFS ++S+ RVARKDLG+DLGG+GVG+G GIGLG GGSGSGSGSGSGSGSSSSSSSSSYSSSS SGSGAGS+AGSY         
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSGGSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSY---------

Query:  -------AGSYAGSQAGSGG--NRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG
               AGSYAGS+AGSG   NRNGG GSGSGYG GSG+GSGNGGGEGYGEGHGYG G
Subjt:  -------AGSYAGSQAGSGG--NRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG

XP_004146660.2 glycine-rich cell wall structural protein 2 [Cucumis sativus]

3.9e-32

84.25

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS
        MASIK LA+V+C LLSFSA+LSEGRVARKDLGIDLGGVGVGLG GIGLG G  GSGSGSGSGSGSGS SSSSSSSYSSSSSSGSGAGS+AGSYAGSYAGS
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS

Query:  QA--GSGGNRNGGLGSGSGYGEGSGKGSG-NGGGEGYGEGHGYGGG
        +A  GSGGNRNGG G GSGYG GSG+G G N  GEGYGEGHGYG G
Subjt:  QA--GSGGNRNGGLGSGSGYGEGSGKGSG-NGGGEGYGEGHGYGGG

XP_008443813.1 PREDICTED: glycine-rich cell wall structural protein 2-like [Cucumis melo]

1.3e-32

83.56

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS
        MASIK LA+V+C LLSFS  LSEGRVARKDLGIDLGG+GVGLGAGIGLG G  GSGSGSGSGSGSGS SSSSSSSYSSSSSSGSGAGS+AGSYAGSYAGS
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS

Query:  QA--GSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGGN
        +A  GSGGNRNGG G GSGYG GSG+G  NG GEGYGEGHGYG G+
Subjt:  QA--GSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGGN

XP_022921883.1 putative glycine-rich cell wall structural protein 1 isoform X3 [Cucurbita moschata]

2.4e-29

80.69

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG----GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYA
        MASI  L +V+CFLLSFS +LS+ RVARKDLG+DLGG+GVG+G GIGLG G    GSGSGSGSGSGSGSSSSSSSSSYSSSS SGSGAGS+AGSYAGS A
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG----GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYA

Query:  GSQAGSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG
        GS  GSG NRNGG GSGSGYG GSG+GSGNGGGEGYGEGHGYG G
Subjt:  GSQAGSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG

XP_038879748.1 glycine-rich cell wall structural protein 2-like [Benincasa hispida]

3.4e-36

88.03

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSGGSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQA
        MASIK LAVV+CFLLSFSA+LSEGRVARKDLGIDLGGVGVGLGAGIGLG GGSGSGSGSGSGS SSSSS SS  SSSSSSGSGAGS+AGSYAGSYAGS+A
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSGGSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQA

Query:  GSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGGN
        GSGGNRNGG GSG+GYG GSG+G GNGGGEGYGEGHGYG G+
Subjt:  GSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGGN

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LTK9 Uncharacterized protein

1.9e-32

84.25

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS
        MASIK LA+V+C LLSFSA+LSEGRVARKDLGIDLGGVGVGLG GIGLG G  GSGSGSGSGSGSGS SSSSSSSYSSSSSSGSGAGS+AGSYAGSYAGS
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS

Query:  QA--GSGGNRNGGLGSGSGYGEGSGKGSG-NGGGEGYGEGHGYGGG
        +A  GSGGNRNGG G GSGYG GSG+G G N  GEGYGEGHGYG G
Subjt:  QA--GSGGNRNGGLGSGSGYGEGSGKGSG-NGGGEGYGEGHGYGGG

A0A1S3B9N0 glycine-rich cell wall structural protein 2-like

6.5e-33

83.56

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS
        MASIK LA+V+C LLSFS  LSEGRVARKDLGIDLGG+GVGLGAGIGLG G  GSGSGSGSGSGSGS SSSSSSSYSSSSSSGSGAGS+AGSYAGSYAGS
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG--GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGS

Query:  QA--GSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGGN
        +A  GSGGNRNGG G GSGYG GSG+G  NG GEGYGEGHGYG G+
Subjt:  QA--GSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGGN

A0A6J1C497 putative glycine-rich cell wall structural protein 1

9.0e-27

77.93

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG-GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQ
        MA+I+  AVV   L   +A++SE RVARKDLGIDLGGVGVGLGAGIGLG G GSGSG+G+GSGSGS SSSSSSSYSSSSSSGSGAGS+AGSYAGSYAGS+
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG-GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQ

Query:  AGSGGNRNGGLGSGSGYGEGSGKGSGNGGGE--GYGEGHGYGGGN
        AGSG   N G GSGSGYG GSG+GSG G GE  GYGEGHGYGGGN
Subjt:  AGSGGNRNGGLGSGSGYGEGSGKGSGNGGGE--GYGEGHGYGGGN

A0A6J1E2L1 cell wall protein IFF6-like isoform X1

2.1e-28

73.01

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG----GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSY-----
        MASI  L +V+CFLLSFS +LS+ RVARKDLG+DLGG+GVG+G GIGLG G    GSGSGSGSGSGSGSSSSSSSSSYSSSS SGSGAGS+AGSY     
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG----GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSY-----

Query:  -----------AGSYAGSQAGSGG--NRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG
                   AGSYAGS+AGSG   NRNGG GSGSGYG GSG+GSGNGGGEGYGEGHGYG G
Subjt:  -----------AGSYAGSQAGSGG--NRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG

A0A6J1E521 putative glycine-rich cell wall structural protein 1 isoform X3

1.1e-29

80.69

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG----GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYA
        MASI  L +V+CFLLSFS +LS+ RVARKDLG+DLGG+GVG+G GIGLG G    GSGSGSGSGSGSGSSSSSSSSSYSSSS SGSGAGS+AGSYAGS A
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSG----GSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYA

Query:  GSQAGSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG
        GS  GSG NRNGG GSGSGYG GSG+GSGNGGGEGYGEGHGYG G
Subjt:  GSQAGSGGNRNGGLGSGSGYGEGSGKGSGNGGGEGYGEGHGYGGG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G30450.1 glycine-rich protein

8.7e-14

63.46

Show/hide

Query:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLG-SGGSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQ
        MA  + L ++   ++S   +L+E R+ARKDLGIDLGG+G+GLG G+G+G  GGSGSG+G+GSGSGS S SSSSS SSSSSS SG+G  AGS AGS+AGS+
Subjt:  MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLG-SGGSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQ

Query:  AGSG
        AGSG
Subjt:  AGSG

AT4G30460.1 glycine-rich protein

7.6e-18

62.33

Show/hide

Query:  VVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSGGSGSGSGSGSGS-GSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQAGSG-GNR
        +++  +L+ S ++SE RVARKDLG+DLGG+G G+G GIG+G GGSGSG+G+GSGS G  SSSSSSS SSSSSS  G G DAGS AGSYAGS AGSG G R
Subjt:  VVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSGGSGSGSGSGSGS-GSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQAGSG-GNR

Query:  NG-----GLGSGSGYGEGSGKGSGNGG------GEGYGEGHGYGGG
        +G     G G G G+G G G G G GG      GEGYGEG GYGGG
Subjt:  NG-----GLGSGSGYGEGSGKGSGNGG------GEGYGEGHGYGGG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTTCAATCAAGTTCCTGGCTGTTGTTCTTTGCTTTTTACTCTCTTTTTCCGCCGTTCTCTCTGAAGGTCGAGTGGCGAGAAAGGATCTCGGCATTGACCTCGGAGG
AGTCGGAGTTGGACTTGGAGCTGGAATTGGCTTAGGCTCAGGTGGAAGTGGTTCTGGCTCTGGCTCTGGCTCCGGATCTGGATCGAGTTCGTCTTCATCTTCATCATCAT
ACTCTTCAAGCTCAAGCTCTGGGTCTGGAGCTGGGTCCGACGCTGGCTCATACGCAGGCTCGTATGCAGGGTCTCAGGCAGGCTCAGGTGGAAATAGGAATGGAGGGTTG
GGGTCAGGTTCGGGATATGGCGAAGGTTCGGGCAAAGGAAGTGGCAATGGCGGTGGTGAAGGATATGGTGAAGGTCATGGCTATGGGGGAGGCAACTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASIKFLAVVLCFLLSFSAVLSEGRVARKDLGIDLGGVGVGLGAGIGLGSGGSGSGSGSGSGSGSSSSSSSSSYSSSSSSGSGAGSDAGSYAGSYAGSQAGSGGNRNGGL
GSGSGYGEGSGKGSGNGGGEGYGEGHGYGGGN

Lsi06G010970 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome