CuGenDBv2

Gene ID	Lsi06G008850
Organism	Lagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
Description	Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family
Genome location	chr06:18414262..18415167
RNA-Seq Expression	Lsi06G008850
Synteny	Lsi06G008850
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR004864 - Late embryogenesis abundant protein, LEA_2 subgroup

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0046596.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family isoform 1 [Cucumis melo var. makuwa]

1.3e-98

85.84

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MT+SS DDSVPVPYTLL  NAAQQNVVVLSLYRP PCRHRRLLRL A YSAAFLLLF VAFLLFPSDPSLQLVRLKLNRVKVHL+P V+LDLSF  SLRV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIKFAIIEWMNS
        RNKNFFSL+Y+++GVSVGYRGRRLGYVSS GGRVSARGSSYVNATLDLNG EVVHDVLYLL DLGKGIIPFDTETEVEGSMG+ FIK PIKFAII+W+NS
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIKFAIIEWMNS

Query:  SKTPFLCKQHDLNNAYSVL
        S++ FLCKQHD NN YS+L
Subjt:  SKTPFLCKQHDLNNAYSVL

XP_004148717.1 uncharacterized protein LOC101219269 [Cucumis sativus]

9.4e-89

89.53

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MTSSS DDSVPVPYTL+P NAAQQNVVVLSLYRPPPCRHRRLLRLCA YSAAFLLLF VAFLLFPSDPSLQLVRLKLNRVKVHL+PVV+LDLSF  SLRV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        RNKNFFSL+Y+++GVSVGYRGRRLGYVSS+GGRVSARGSSYVNATLDLNG EVVHDVLYLL DLGKGIIPFDTET+VEGSMG+ FIK PIK
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

XP_008463384.1 PREDICTED: uncharacterized protein LOC103501551 [Cucumis melo]

8.2e-85

87.96

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MT+SS DDSVPVPYTLL  NAAQQNVVVLSLYRP PCRHRRLLRL A YSAAFLLLF VAFLLFPSDPSLQLVRLKLNRVKVHL+P V+LDLSF  SLRV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        RNKNFFSL+Y+++GVSVGYRGRRLGYVSS GGRVSARGSSYVNATLDLNG EVVHDVLYLL DLGKGIIPFDTETEVEGSMG+ FIK PIK
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

XP_022144909.1 uncharacterized protein LOC111014473 [Momordica charantia]

6.1e-80

82.72

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MTSSSRDDSVPVPY+LLP NAA QNVVVLSLYRPP  R RRLLRLCA YSAAFLLL  VAFLLFP+DPSLQLVRLKLNR+KV LLPV+ LDLSF AS+RV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        RN NFFSLDY+Y+GVSVGYRGRRLG+VSS+GGRVSARG SYVNATLDLNGFEV+HD +YL+ DL  GI+PFDTETEVEG MG+ FIKFPIK
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

XP_038878687.1 uncharacterized protein LOC120070868 [Benincasa hispida]

3.3e-86

89.64

Show/hide

Query:  MTSSSR-DDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPV-VALDLSFFASL
        MTSSSR DDSVPVPYTLLPQNAAQQNVVVLSLYR PPC+H RLLRLCALYSAAFLLLF VAFLLFP+DPS QLVRLKLN VKVHL+P  V+LDLSFFASL
Subjt:  MTSSSR-DDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPV-VALDLSFFASL

Query:  RVRNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        RVRNKNFFSL YDYIGVSVGYRG+RLG+VSS+GGRVSARGSSYVNATLDLNG EVVHDVLYLL DLGKGIIPFDTETEVEGSMG+ FIKFPIK
Subjt:  RVRNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LTV4 LEA_2 domain-containing protein

4.6e-89

89.53

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MTSSS DDSVPVPYTL+P NAAQQNVVVLSLYRPPPCRHRRLLRLCA YSAAFLLLF VAFLLFPSDPSLQLVRLKLNRVKVHL+PVV+LDLSF  SLRV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        RNKNFFSL+Y+++GVSVGYRGRRLGYVSS+GGRVSARGSSYVNATLDLNG EVVHDVLYLL DLGKGIIPFDTET+VEGSMG+ FIK PIK
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

A0A1S3CJK6 uncharacterized protein LOC103501551

4.0e-85

87.96

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MT+SS DDSVPVPYTLL  NAAQQNVVVLSLYRP PCRHRRLLRL A YSAAFLLLF VAFLLFPSDPSLQLVRLKLNRVKVHL+P V+LDLSF  SLRV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        RNKNFFSL+Y+++GVSVGYRGRRLGYVSS GGRVSARGSSYVNATLDLNG EVVHDVLYLL DLGKGIIPFDTETEVEGSMG+ FIK PIK
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

A0A5A7TX90 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family isoform 1

6.3e-99

85.84

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MT+SS DDSVPVPYTLL  NAAQQNVVVLSLYRP PCRHRRLLRL A YSAAFLLLF VAFLLFPSDPSLQLVRLKLNRVKVHL+P V+LDLSF  SLRV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIKFAIIEWMNS
        RNKNFFSL+Y+++GVSVGYRGRRLGYVSS GGRVSARGSSYVNATLDLNG EVVHDVLYLL DLGKGIIPFDTETEVEGSMG+ FIK PIKFAII+W+NS
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIKFAIIEWMNS

Query:  SKTPFLCKQHDLNNAYSVL
        S++ FLCKQHD NN YS+L
Subjt:  SKTPFLCKQHDLNNAYSVL

A0A6J1CTN0 uncharacterized protein LOC111014473

3.0e-80

82.72

Show/hide

Query:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV
        MTSSSRDDSVPVPY+LLP NAA QNVVVLSLYRPP  R RRLLRLCA YSAAFLLL  VAFLLFP+DPSLQLVRLKLNR+KV LLPV+ LDLSF AS+RV
Subjt:  MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRV

Query:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        RN NFFSLDY+Y+GVSVGYRGRRLG+VSS+GGRVSARG SYVNATLDLNGFEV+HD +YL+ DL  GI+PFDTETEVEG MG+ FIKFPIK
Subjt:  RNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

A0A6J1JI07 uncharacterized protein LOC111485280

9.9e-76

79.27

Show/hide

Query:  SSSRDDSVPVPYTLLPQN-AAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRVR
        S S+D S+PVPY+ +P N AA QNVVVLSLYRPP  R RRLLRLCALYSAAFLLL  V FLLFPSDPSLQLVRLKLN VKV LLP V LDLSF AS+RVR
Subjt:  SSSRDDSVPVPYTLLPQN-AAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRVR

Query:  NKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIKFAI
        NKNFFSLDY+Y+GVSVG+RGRRLG+VSS GGRVSARGSSYVNATLDLNG +++HDV +LL DL KGIIPFDTETEVEGSMG+ FIKFPIK  +
Subjt:  NKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIKFAI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G52330.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.7e-32

37.78

Show/hide

Query:  YTLLPQNAAQQ--NVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRVRNKNFFSLDYD
        Y  LP +++ +  + V++S +  PP R R ++ +  +  A+ L+     ++ +PSDP ++++R+K++ V VH  PV ++D++   +L+V N + +S D+ 
Subjt:  YTLLPQNAAQQ--NVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRVRNKNFFSLDYD

Query:  YIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
         + V++ YRG+ LG+VSS GG V+A GSSY++A  +L+G  V  DV++L+ DL KG + FDT TE  G +G+LF +FP+K
Subjt:  YIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

AT1G52330.2 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.7e-32

37.78

Show/hide

Query:  YTLLPQNAAQQ--NVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRVRNKNFFSLDYD
        Y  LP +++ +  + V++S +  PP R R ++ +  +  A+ L+     ++ +PSDP ++++R+K++ V VH  PV ++D++   +L+V N + +S D+ 
Subjt:  YTLLPQNAAQQ--NVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRVRNKNFFSLDYD

Query:  YIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
         + V++ YRG+ LG+VSS GG V+A GSSY++A  +L+G  V  DV++L+ DL KG + FDT TE  G +G+LF +FP+K
Subjt:  YIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

AT4G13270.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

6.2e-46

48.97

Show/hide

Query:  SSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHR-----RLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFAS
        +SS+ +   +PYT LP +   Q+V++L+ YR    RHR     R LR   L++A  LLL    +LL+PSDP + + R+ LN + V     +ALDLSF  +
Subjt:  SSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHR-----RLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFAS

Query:  LRVRNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK
        ++VRN++FFSLDYD + VS+GYRGR LG V S+GG + AR SSY++ATL+L+G EVVHDV+YL+ DL KG+IPFDT  +V+G +G+L    PI+
Subjt:  LRVRNKNFFSLDYDYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACCTCCAGTTCCAGGGACGATTCTGTCCCTGTGCCCTACACTCTTCTTCCCCAAAATGCTGCACAGCAAAACGTCGTCGTTTTATCCCTCTACCGTCCCCCTCCATG
CCGACATCGGCGGCTTCTCCGCCTCTGTGCTCTCTACTCCGCCGCCTTCCTCCTCCTCTTCACCGTTGCTTTTCTACTTTTCCCCTCCGATCCTTCGCTCCAACTCGTCC
GATTGAAACTCAATCGTGTCAAAGTCCATTTGTTGCCTGTTGTCGCCCTTGACCTTTCTTTCTTTGCTTCTCTTAGGGTTCGCAATAAGAACTTCTTCTCTCTCGATTAC
GATTACATTGGGGTTTCGGTCGGCTACCGGGGAAGACGACTTGGATATGTGAGCTCTCAGGGCGGTCGAGTTTCTGCTCGAGGCTCTTCTTATGTGAATGCCACTCTCGA
CTTGAATGGGTTTGAAGTCGTTCACGACGTCTTGTACTTGCTTGTGGATCTGGGGAAGGGTATCATTCCCTTCGATACGGAGACGGAAGTGGAAGGATCCATGGGGATTC
TCTTTATCAAATTCCCGATTAAGTTTGCAATCATTGAATGGATGAACAGTAGTAAGACTCCATTCCTTTGCAAACAGCACGATTTAAATAATGCTTATTCTGTTCTGGCG
ACCATTACACGTTTCTTAGTATAG

mRNA sequence

Show/hide mRNA sequence

GTGTAAATCATTGATAGGCTGAAGCTACTACCTTAACCAAGGGCAAACGGAGTGTTTGGCTACAGCCACAATAAAACTCAGTTCCCATTTTAATTCTAATTCTCTCTAAG
CTTTAGCTAACAAACATGACCTCCAGTTCCAGGGACGATTCTGTCCCTGTGCCCTACACTCTTCTTCCCCAAAATGCTGCACAGCAAAACGTCGTCGTTTTATCCCTCTA
CCGTCCCCCTCCATGCCGACATCGGCGGCTTCTCCGCCTCTGTGCTCTCTACTCCGCCGCCTTCCTCCTCCTCTTCACCGTTGCTTTTCTACTTTTCCCCTCCGATCCTT
CGCTCCAACTCGTCCGATTGAAACTCAATCGTGTCAAAGTCCATTTGTTGCCTGTTGTCGCCCTTGACCTTTCTTTCTTTGCTTCTCTTAGGGTTCGCAATAAGAACTTC
TTCTCTCTCGATTACGATTACATTGGGGTTTCGGTCGGCTACCGGGGAAGACGACTTGGATATGTGAGCTCTCAGGGCGGTCGAGTTTCTGCTCGAGGCTCTTCTTATGT
GAATGCCACTCTCGACTTGAATGGGTTTGAAGTCGTTCACGACGTCTTGTACTTGCTTGTGGATCTGGGGAAGGGTATCATTCCCTTCGATACGGAGACGGAAGTGGAAG
GATCCATGGGGATTCTCTTTATCAAATTCCCGATTAAGTTTGCAATCATTGAATGGATGAACAGTAGTAAGACTCCATTCCTTTGCAAACAGCACGATTTAAATAATGCT
TATTCTGTTCTGGCGACCATTACACGTTTCTTAGTATAG

Protein sequence

Show/hide protein sequence

MTSSSRDDSVPVPYTLLPQNAAQQNVVVLSLYRPPPCRHRRLLRLCALYSAAFLLLFTVAFLLFPSDPSLQLVRLKLNRVKVHLLPVVALDLSFFASLRVRNKNFFSLDY
DYIGVSVGYRGRRLGYVSSQGGRVSARGSSYVNATLDLNGFEVVHDVLYLLVDLGKGIIPFDTETEVEGSMGILFIKFPIKFAIIEWMNSSKTPFLCKQHDLNNAYSVLA
TITRFLV

Lsi06G008850 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome