CuGenDBv2

Gene ID	Sgr015227
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	LEA_2 domain-containing protein
Genome location	tig00003063:900252..911826
RNA-Seq Expression	Sgr015227
Synteny	Sgr015227
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6589033.1 hypothetical protein SDJN03_17598, partial [Cucurbita argyrosperma subsp. sororia]

4.6e-20

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSRKV T+V+GHQVPLYGGIS IGNWR+QR +GVEV LNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

XP_022135688.1 uncharacterized protein LOC111007587 isoform X1 [Momordica charantia]

9.9e-23

89.23

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        M EFYE+R+SSR+VATAVAGHQVPLYGGI+VIGNWREQR EGVEVPLNLTV VRSRAYILGKLVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

XP_022928427.1 uncharacterized protein LOC111435243 [Cucurbita moschata]

4.6e-20

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSRKV T+V+GHQVPLYGGIS IGNWR+QR +GVEV LNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

XP_022989441.1 uncharacterized protein LOC111486495 [Cucurbita maxima]

4.6e-20

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSRKV T+V+GHQVPLYGGIS IGNWR+QR +GVEV LNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

XP_038888376.1 uncharacterized protein LOC120078225 [Benincasa hispida]

2.3e-19

76.12

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLE--GVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSR+V T+VAGHQ+PLYGGIS IGNWR+QR +  GVE+PLNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLE--GVEVPLNLTVGVRSRAYILGKLVK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K4T2 LEA_2 domain-containing protein

4.2e-19

77.61

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLE--GVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSR+V T+VAGHQVPLYGGIS IGNWR+QR +  GVEV LNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLE--GVEVPLNLTVGVRSRAYILGKLVK

A0A1S3BJ42 uncharacterized protein LOC103490245

9.3e-19

76.12

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLE--GVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSR++ T+VAGHQVPLYGGIS IGNWR+QR +  GVEV LNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLE--GVEVPLNLTVGVRSRAYILGKLVK

A0A6J1C5K4 uncharacterized protein LOC111007587 isoform X1

4.8e-23

89.23

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        M EFYE+R+SSR+VATAVAGHQVPLYGGI+VIGNWREQR EGVEVPLNLTV VRSRAYILGKLVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

A0A6J1EJW4 uncharacterized protein LOC111435243

2.2e-20

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSRKV T+V+GHQVPLYGGIS IGNWR+QR +GVEV LNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

A0A6J1JK28 uncharacterized protein LOC111486495

2.2e-20

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        MEEFY++R+SSRKV T+V+GHQVPLYGGIS IGNWR+QR +GVEV LNLTV VRSRAYILG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G45688.1 unknown protein

5.8e-05

32.04

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVI-------GNWREQRLEG------------VEVPLNLTVGVRSRAYILGKLVKLSDLQPHEAWISKRHR
        +++FY+ RKS R V   V G ++PLYG  S +          + ++ +G              VP+ L+  VRSRAY+LGKLV+    +  E  I+  H+
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVI-------GNWREQRLEG------------VEVPLNLTVGVRSRAYILGKLVKLSDLQPHEAWISKRHR

Query:  QRN
          N
Subjt:  QRN

AT2G41990.1 CONTAINS InterPro DOMAIN/s: Late embryogenesis abundant protein, group 2 (InterPro:IPR004864)

3.3e-08

45.31

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLV
        M +F   R     V T V GHQ+PLYGG+S         L+ + +PLNLT+ + S+AYILG+LV
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLV

AT4G35170.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

7.8e-10

49.23

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK
        M EF + RKS R + T V G Q+PLYGG+  +   R +  + V +PLNLT  +R+RAY+LG+LVK
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVK

AT5G42860.1 unknown protein

9.9e-05

34.94

Show/hide

Query:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVI-------GNWREQRLEG-----------VEVPLNLTVGVRSRAYILGKLVK
        +++FY+ RKS R V   V G ++PLYG  S +          + ++ +G             VP+ L   VRSRAY+LGKLV+
Subjt:  MEEFYEERKSSRKVATAVAGHQVPLYGGISVI-------GNWREQRLEG-----------VEVPLNLTVGVRSRAYILGKLVK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATAATGAAATGGGGGTGGGGGGGGGGGGATTGTATAAATTGAAGTATTTTTGGGGGGTGAGAGATGAAATTTGTGGAGAAATTCGGGGTGAGACTTTTCAGACATTGGGA
ATGGAAGAGTTCTATGAAGAAAGGAAGAGCTCGCGGAAGGTGGCAACGGCGGTGGCGGGGCATCAAGTTCCTCTGTACGGCGGGATCTCGGTGATCGGAAACTGGAGAGA
GCAGCGGCTGGAGGGGGTGGAGGTGCCGCTGAACCTGACGGTGGGGGTGAGGTCTAGGGCTTACATTCTGGGGAAACTGGTGAAGCTTTCTGATCTTCAGCCACATGAAG
CATGGATAAGCAAACGTCACCGGCAGCGCAATCCCGCCGACGAGCCCCGCCATGCTCCCCAGAAATGGGATCGCCACCGCCACGAAGAAACACAGATCTGGAACGAGCTC
ATGGCATTGATTATCACTAATAAGCTCGTTAAGCCGATGAGAAACTGTGAGGTGTCGCGGGCATGGAAGGCGTACAGAGCTGATTTGATCGTCAGTTACCTGTATCTCAA
GGACGAGATTGTGCCCTCTGAAAGCAAAAGCGACGATTCCCAGAGCGTTCAATGCGTCAAAGGCCCTAGCCATGTTGGTGTTGGCTTTCACCGGATCGTAGGAAACGCCG
GGCATTCTGCCCTTCACGACGGAGATCATCCATATCAACGTGCAGTAGCCGATGGCACTAACAGGACGGCGGCGCAGGTGAAAACCAAGTACCATTCGGTCGGCGTTAAG
GAATCCGCTCTGCAGTTGGTTCCGCAAACGATTTTGAAGAATGTGTTCGACGTTGAGCCTCCGATGATTATCAGAGCCACGCAGGTGCCGGCGGAGAGTATAAAGTTGCC
ATATGAACGCCACCGTCAAGCTTATGATCCCTCCGGCCCTGCAACCAGAAGCTTTCAAAAACCCATTGAATTCAAACTTATTGTAAACGATCAGTGGTTTTATTTACCAT
CCGAGAATGGTGAAGGCGACGGGGAGCACCAGAGCCTGGATTCCGATGCCGGAGCAGAGGGTGTGGAAGGCGGCGTAGAAGGCGTTGCCGTTTCTCGACTCGGTGATCGG
AAGCCAGGCGTCGTGGGGGTCCAGCCTCGTCAAGTTGAGGGCCCGTCGGATCGGACTTCCGATCGGAGTGATATTGAACCGCGGTCTAGGGCTCGACAGTCTCGGAGTTT
TGCTCGCAATTTCTATCTGGTCGTCGCCGGAGAGCAGCGGCGAGCGGAACCCACAAATCATGACTTGCTGGCCAGCCTCCGCCACCGTCGACGAGAACAAAGAAGAAACA
CAGCATCTGGCCGCCGGAGCAATGGACAAAACCAGAGCTTGCTCCACTTCCCGGTCGACTTGTCGTCGGATCAAAGACACAGCATAGTCCATGAACGCCGCATCACACGG
CAGCTTGATCGGCCCGTCCCTCGGCAGCCCGAACTCCTCCTCCGACATCTTCAACAGCTCCCTGAACACGTAGCTCCCCAGATATCTTATCGGAAAAACGAACCGCTTCT
GATCGACTGTGTAGACGACGAAGTGGCCCTTGTCAGCCACCGTGGAGGAGCTTCTGGTTCGCGGCAACGATATCCTCTTCCGCCGCTGAGAGGCGGCCGCCGTCTTCTGC
CATTTCCTGGCTATTCTAATTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

NEMGVGGGGLYKLKYFWGVRDEICGEIRGETFQTLGMEEFYEERKSSRKVATAVAGHQVPLYGGISVIGNWREQRLEGVEVPLNLTVGVRSRAYILGKLVKLSDLQPHEA
WISKRHRQRNPADEPRHAPQKWDRHRHEETQIWNELMALIITNKLVKPMRNCEVSRAWKAYRADLIVSYLYLKDEIVPSESKSDDSQSVQCVKGPSHVGVGFHRIVGNAG
HSALHDGDHPYQRAVADGTNRTAAQVKTKYHSVGVKESALQLVPQTILKNVFDVEPPMIIRATQVPAESIKLPYERHRQAYDPSGPATRSFQKPIEFKLIVNDQWFYLPS
ENGEGDGEHQSLDSDAGAEGVEGGVEGVAVSRLGDRKPGVVGVQPRQVEGPSDRTSDRSDIEPRSRARQSRSFARNFYLVVAGEQRRAEPTNHDLLASLRHRRREQRRNT
ASGRRSNGQNQSLLHFPVDLSSDQRHSIVHERRITRQLDRPVPRQPELLLRHLQQLPEHVAPQISYRKNEPLLIDCVDDEVALVSHRGGASGSRQRYPLPPLRGGRRLLP
FPGYSN

Sgr015227 (gene) of Monk fruit (Qingpiguo) v1 genome