CuGenDBv2

Gene ID	CmoCh01G007730
Organism	Cucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Description	LEA_2 domain-containing protein
Genome location	Cmo_Chr01:4009949..4010671
RNA-Seq Expression	CmoCh01G007730
Synteny	CmoCh01G007730
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR004864 - Late embryogenesis abundant protein, LEA_2 subgroup IPR013783 - Immunoglobulin-like fold

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6607382.1 hypothetical protein SDJN03_00724, partial [Cucurbita argyrosperma subsp. sororia]

4.7e-123

99.17

Show/hide

Query:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
        MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFS L AFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
Subjt:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST

Query:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
        NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
Subjt:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF

Query:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
        HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
Subjt:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR

KAG7037051.1 hypothetical protein SDJN02_00672, partial [Cucurbita argyrosperma subsp. argyrosperma]

7.1e-103

87.45

Show/hide

Query:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
        MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFS L AFCAWICLAVFGIAITLLI             P   +K+         NST
Subjt:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST

Query:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
        NQN AVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
Subjt:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF

Query:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPT
        HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPT
Subjt:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPT

XP_008457557.1 PREDICTED: uncharacterized protein LOC103497223 [Cucumis melo]

1.1e-71

62.4

Show/hide

Query:  NNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS-----TSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQN
        NN  A +LDR+PS +KG+RRVAFSDSLPKHR+      S R  K     L A CAWIC+ +FGI + +LILGVIFVSFLQSGLPEITV+ML+LS  +I+N
Subjt:  NNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS-----TSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQN

Query:  STNQ--NVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVG
        STNQ  N A+LN K+ M+I+++NKNEK+ELSYS + + LVSE+++LGR+VIPSFS  PGNTT LNVT+NV+R S D+D++S LEDDRKK Q+ V++ M  
Subjt:  STNQ--NVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVG

Query:  SVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFP
         VGFH+GIF L  VPIHV C+FQQ LL+YR+ EPPC+I MFP
Subjt:  SVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFP

XP_022949169.1 uncharacterized protein LOC111452600 [Cucurbita moschata]

1.9e-124

100

Show/hide

Query:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
        MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
Subjt:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST

Query:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
        NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
Subjt:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF

Query:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
        HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
Subjt:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR

XP_022998792.1 uncharacterized protein LOC111493353 [Cucurbita maxima]

1.2e-121

97.92

Show/hide

Query:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
        MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS SLRATKFVFSHL AFCAWICLAVFGIAITLLILGVIFVSFLQS LPEITVKMLDLSKIQIQNST
Subjt:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST

Query:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
        NQNVAVLNTKVRMAIDI+NKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTL VDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
Subjt:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF

Query:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
        HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
Subjt:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3C5S1 uncharacterized protein LOC103497223

5.4e-72

62.4

Show/hide

Query:  NNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS-----TSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQN
        NN  A +LDR+PS +KG+RRVAFSDSLPKHR+      S R  K     L A CAWIC+ +FGI + +LILGVIFVSFLQSGLPEITV+ML+LS  +I+N
Subjt:  NNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS-----TSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQN

Query:  STNQ--NVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVG
        STNQ  N A+LN K+ M+I+++NKNEK+ELSYS + + LVSE+++LGR+VIPSFS  PGNTT LNVT+NV+R S D+D++S LEDDRKK Q+ V++ M  
Subjt:  STNQ--NVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVG

Query:  SVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFP
         VGFH+GIF L  VPIHV C+FQQ LL+YR+ EPPC+I MFP
Subjt:  SVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFP

A0A5A7V2C7 Putative transmembrane protein

5.4e-72

62.4

Show/hide

Query:  NNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS-----TSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQN
        NN  A +LDR+PS +KG+RRVAFSDSLPKHR+      S R  K     L A CAWIC+ +FGI + +LILGVIFVSFLQSGLPEITV+ML+LS  +I+N
Subjt:  NNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS-----TSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQN

Query:  STNQ--NVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVG
        STNQ  N A+LN K+ M+I+++NKNEK+ELSYS + + LVSE+++LGR+VIPSFS  PGNTT LNVT+NV+R S D+D++S LEDDRKK Q+ V++ M  
Subjt:  STNQ--NVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVG

Query:  SVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFP
         VGFH+GIF L  VPIHV C+FQQ LL+YR+ EPPC+I MFP
Subjt:  SVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFP

A0A6J1E0W1 uncharacterized protein LOC111024923

4.7e-52

50.88

Show/hide

Query:  DKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNSTNQ--NVAVLNTKVRMAI
        DKG RRV FS+SLP HR+TS   TK     L A+C  IC+  FGI + LLI+ VIF+SFLQSGLPEI++K L LSK +I +STNQ  N AVL+ +V +++
Subjt:  DKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNSTNQ--NVAVLNTKVRMAI

Query:  DIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGFHLGIFKLNKVPIHVT
         ++NKN+K+ELSY D+ + + S++++LG++VI  FS  PGNTT LNVT NV  D +DR++   +++++K+ ++V ++ M   +GFH GIF + KVPIHV 
Subjt:  DIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGFHLGIFKLNKVPIHVT

Query:  C-NFQQYLLLYRVKEPPCSITMFPTR
        C + QQ+LL+ R+KE  C+I MFP R
Subjt:  C-NFQQYLLLYRVKEPPCSITMFPTR

A0A6J1GC15 uncharacterized protein LOC111452600

9.3e-125

100

Show/hide

Query:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
        MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
Subjt:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST

Query:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
        NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
Subjt:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF

Query:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
        HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
Subjt:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR

A0A6J1K8Y2 uncharacterized protein LOC111493353

5.6e-122

97.92

Show/hide

Query:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST
        MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRS SLRATKFVFSHL AFCAWICLAVFGIAITLLILGVIFVSFLQS LPEITVKMLDLSKIQIQNST
Subjt:  MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNST

Query:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
        NQNVAVLNTKVRMAIDI+NKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTL VDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF
Subjt:  NQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGF

Query:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
        HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR
Subjt:  HLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMFPTR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G30505.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

6.6e-14

26.88

Show/hide

Query:  CAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNSTNQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFS
        CA  C+ V  + I +L++G+   S ++S LP++ V  L  S++ I  S+     ++N  +   + + N N+K  L YS +   + SENI LG+  +  F 
Subjt:  CAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNSTNQNVAVLNTKVRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFS

Query:  QEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMF
        Q+PGN TSL +   + +  +     +LL +  K  + +V + + G +      FK++ +PI + C   +   +    +P C + +F
Subjt:  QEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGFHLGIFKLNKVPIHVTCNFQQYLLLYRVKEPPCSITMF

AT4G01110.1 unknown protein

7.0e-08

26.29

Show/hide

Query:  PKHR--STSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGV-IFVSFLQSGLPEITVKMLDLSKIQIQ-NSTNQNVAVLNTKVRMAIDIKNKNEKLEL
        PKH   +      K  +S    FC  +C+ V  I I LLIL V +F  +    LP + +    +S            ++ L  +    +D +N N KL  
Subjt:  PKHR--STSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGV-IFVSFLQSGLPEITVKMLDLSKIQIQ-NSTNQNVAVLNTKVRMAIDIKNKNEKLEL

Query:  SYSDLNMKL-VSEN---IELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGFHLGIFKLNKVPIHVTC
         Y ++++ + V E+     LG   +  F ++PGN T + V + V +  +D  ++  L  D K  ++VVK+     VG  +G  K+  V + ++C
Subjt:  SYSDLNMKL-VSEN---IELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGFHLGIFKLNKVPIHVTC

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACTGATAACAATCATGTCGCCATTCAACTCGATCGAGTTCCAAGCACTGACAAAGGAGCCCGTCGCGTCGCCTTCTCCGATTCCCTCCCCAAACACCGCTCCACATC
CCTCCGCGCCACCAAATTCGTCTTCTCCCATCTGCTCGCCTTCTGCGCTTGGATTTGCCTCGCCGTGTTCGGAATCGCCATCACTCTTCTCATCCTCGGCGTAATCTTCG
TGTCATTCCTCCAATCCGGTTTGCCTGAAATCACCGTCAAAATGCTCGATCTCTCCAAAATCCAGATTCAAAACTCCACAAATCAAAATGTCGCTGTCCTAAACACAAAG
GTACGTATGGCGATCGATATAAAGAACAAGAACGAGAAATTGGAGTTGAGTTATAGCGATCTTAATATGAAATTAGTATCAGAAAACATCGAATTAGGCAGGAATGTGAT
ACCTAGTTTCTCTCAAGAACCTGGAAACACCACATCGCTAAATGTAACGCTGAATGTGGATCGAGATTCAATAGATCGAGACAGTATATCGCTGCTTGAAGATGACAGAA
AAAAGGCTCAAGTGGTTGTGAAGATCACGATGGTTGGTTCGGTTGGATTTCATCTTGGGATATTCAAGCTCAACAAGGTGCCGATCCATGTGACCTGTAATTTTCAGCAA
TATCTTCTTCTTTATCGCGTCAAGGAGCCGCCGTGTAGTATTACAATGTTTCCTACCAGGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTDNNHVAIQLDRVPSTDKGARRVAFSDSLPKHRSTSLRATKFVFSHLLAFCAWICLAVFGIAITLLILGVIFVSFLQSGLPEITVKMLDLSKIQIQNSTNQNVAVLNTK
VRMAIDIKNKNEKLELSYSDLNMKLVSENIELGRNVIPSFSQEPGNTTSLNVTLNVDRDSIDRDSISLLEDDRKKAQVVVKITMVGSVGFHLGIFKLNKVPIHVTCNFQQ
YLLLYRVKEPPCSITMFPTR

CmoCh01G007730 (gene) of Cucurbita moschata (Rifu) v1 genome