CuGenDBv2

Gene ID	Sgr004541
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Exopolysaccharide production negative regulator
Genome location	tig00003038:1279..14206
RNA-Seq Expression	Sgr004541
Synteny	Sgr004541
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6596694.1 hypothetical protein SDJN03_09874, partial [Cucurbita argyrosperma subsp. sororia]

8.4e-78

90.36

Show/hide

Query:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP
        SF L   S+  LVAV VANSSIT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKD FSGKAR+ALAEAP
Subjt:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP

Query:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        NEALPHKCRPNFGAAWLAKDKFKVNETY CWYSS IS V+LDYDGFSSCQAQEP+KVEMIKRYYFL
Subjt:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

XP_004146124.1 uncharacterized protein LOC101211843 [Cucumis sativus]

7.6e-79

92.99

Show/hide

Query:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR
        + LVAV VANSSIT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKAR+ALAEAPNEALPHKCR
Subjt:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR

Query:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        PNFGAAWLAK KFKVNETYDCWYSSGISKV+LDYDGFS CQAQEP+ +EMIKRYYFL
Subjt:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

XP_022145339.1 uncharacterized protein LOC111014820 [Momordica charantia]

2.6e-79

94.27

Show/hide

Query:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR
        + LVAVLVANSSI N ISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARI LAEAP+EALPHKCR
Subjt:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR

Query:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        PNFGAAWLAKDKFKVNETYDCWYSSGISKV+LDYDGFSSCQ+QEP+KVEMIKRYYFL
Subjt:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

XP_022946874.1 uncharacterized protein LOC111450810 [Cucurbita moschata]

8.4e-78

90.36

Show/hide

Query:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP
        SF L   S+  LVAV VANSSIT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKD FSGKAR+ALAEAP
Subjt:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP

Query:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        NEALPHKCRPNFGAAWLAKDKFKVNETY CWYSS IS V+LDYDGFSSCQAQEP+KVEMIKRYYFL
Subjt:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

XP_038876581.1 uncharacterized protein LOC120069002 [Benincasa hispida]

3.4e-79

84.75

Show/hide

Query:  CAMVCRAYASSSFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFS
        CA +     S  F+      + LVA+ VANSSIT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFS
Subjt:  CAMVCRAYASSSFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFS

Query:  GKARIALAEAPNEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        GK+R+ALAEAPNEALPHKCRPNFGAAWLAK KFKVNETYDCWYSSGISKV+LDYDGFSSCQAQEP+K+EMIKRYYFL
Subjt:  GKARIALAEAPNEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0L6A9 Uncharacterized protein

3.7e-79

92.99

Show/hide

Query:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR
        + LVAV VANSSIT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKAR+ALAEAPNEALPHKCR
Subjt:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR

Query:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        PNFGAAWLAK KFKVNETYDCWYSSGISKV+LDYDGFS CQAQEP+ +EMIKRYYFL
Subjt:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

A0A1S3BKP1 uncharacterized protein LOC103490722

5.3e-78

84.18

Show/hide

Query:  CAMVCRAYASSSFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFS
        CA +     S  F+      + LVAV VANS IT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYP+ERNKFRCRYDYYWASVFKVEMKDHFS
Subjt:  CAMVCRAYASSSFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFS

Query:  GKARIALAEAPNEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        GKAR+ALAEAPNEALPHKCRPNFGAAWLAK KFKVNETYDCWYSSGISKV+LDYDGFSSCQAQEP+ +EMIKRYYFL
Subjt:  GKARIALAEAPNEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

A0A6J1CUY3 uncharacterized protein LOC111014820

1.3e-79

94.27

Show/hide

Query:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR
        + LVAVLVANSSI N ISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARI LAEAP+EALPHKCR
Subjt:  VELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCR

Query:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        PNFGAAWLAKDKFKVNETYDCWYSSGISKV+LDYDGFSSCQ+QEP+KVEMIKRYYFL
Subjt:  PNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

A0A6J1G561 uncharacterized protein LOC111450810

4.1e-78

90.36

Show/hide

Query:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP
        SF L   S+  LVAV VANSSIT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKD FSGKAR+ALAEAP
Subjt:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP

Query:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        NEALPHKCRPNFGAAWLAKDKFKVNETY CWYSS IS V+LDYDGFSSCQAQEP+KVEMIKRYYFL
Subjt:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

A0A6J1KU51 uncharacterized protein LOC111498274

4.1e-78

90.36

Show/hide

Query:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP
        SF L   S+  LVAV VANSSIT+PISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKD FSGKAR+ALAEAP
Subjt:  SFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAP

Query:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL
        NEALPHKCRPNFGAAWLAKDKFKVNETY CWYSS IS V+LDYDGFSSCQAQEP+KVEMIKRYYFL
Subjt:  NEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G19140.1 unknown protein

2.9e-52

63.87

Show/hide

Query:  IVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKC
        +V  +  L   SS +   SL S+CKIVSSSVDLRSSKVC +GLLN KA++VFYP+ER+KFRCRYDYYWASVFKVE KD+  G+ R+A +EAPNEALP +C
Subjt:  IVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYERNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKC

Query:  RPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRY
        RPNFGAA L KD FKVNETYDCWY+ GI K+ L  D F  CQA + S  ++ K+Y
Subjt:  RPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRY

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

AGGCACCACCAGTAGAACAGAAGCTCTATTTGATACATCCCTCCAACGGGATGAGCAGGACCACTCATGATACTTGGACAGTTAATCGAGCTGTGACCAGAGCTCCCACA
GCTGTTGCAGTACGTGTGGTTATGAAGTCCAGGATTATGTATAATGCTTTCCGCCTTGGGGGTAATAGAACTAGTGTTCTCTGCCTAAGCTTTTCCATCAAATCTAGAAG
AAACCTGGATTCCGTTGAAAAATTCACAGTTTCTGCTTTCACCACGGTTGACCTTACTCGCTGTTCATCACTAAAAGTTTCTTCCTTTATTTTCAACTTCATAATAAATT
TTGTGAAAAGAACCTTACGGATGATTTCTGCAATTTCTCATCATCTTGCTCTTCGTATTTCAAATAATACAATCTTTTTGCAGTTACCCAAGTTAAGCCAGTATGGTCCT
GTATTTGCAGCTGGAAAACTTCCCTGGATATGGAGAAAGAAGGAGTACTCCTCCCTTCCTTCTCAAACCAGTCTCTCAGCCTACGAGCCTCAGGACCATCTGGCTCTACA
AAAAGCTGACTTGTTGATATGGTTTCAGGCTTCCTTTAGAAATGAAGTAGACTTTACCAGATTCAATCTGGTTGTAAAACTGATCAGCTACCATATTGAAGCACGCCCCA
CAGAGGATTGGGGATTTCCACTGAATGCACCTGTTACTGATCTTGTTGCCGGACGAGGAGGTCTCAACCTCGGAGAGGACGACGAAGGGGGGTTATCTAGCTTTAATTGT
GCGATGGTGTGCCGTGCTTATGCTTCCAGTAGTTTCATTCTTTTTTGTGACTCTATCGTTGAGCTTGTTGCTGTGCTTGTCGCCAATTCGTCAATTACTAATCCCATTTC
TTTGCGCTCTCAGTGCAAGATTGTTTCCAGCAGTGTGGACCTTAGGTCATCTAAGGTTTGTGAACTTGGACTACTGAATTATAAAGCCAAGAATGTTTTCTACCCCTATG
AAAGAAATAAGTTTAGATGCCGTTATGATTACTACTGGGCGTCAGTATTCAAGGTAGAAATGAAGGATCATTTTTCTGGAAAGGCTCGGATTGCTTTGGCAGAGGCTCCA
AATGAGGCCCTTCCTCATAAATGCAGGCCTAATTTTGGTGCTGCGTGGTTGGCTAAAGATAAATTCAAGGTAAATGAAACATATGACTGCTGGTACTCATCTGGCATTTC
CAAAGTGAACTTAGACTATGATGGGTTTTCCAGTTGTCAAGCTCAAGAACCTTCAAAAGTTGAGATGATTAAAAGATACTACTTCCTCCGGAAGATTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

APPVEQKLYLIHPSNGMSRTTHDTWTVNRAVTRAPTAVAVRVVMKSRIMYNAFRLGGNRTSVLCLSFSIKSRRNLDSVEKFTVSAFTTVDLTRCSSLKVSSFIFNFIINF
VKRTLRMISAISHHLALRISNNTIFLQLPKLSQYGPVFAAGKLPWIWRKKEYSSLPSQTSLSAYEPQDHLALQKADLLIWFQASFRNEVDFTRFNLVVKLISYHIEARPT
EDWGFPLNAPVTDLVAGRGGLNLGEDDEGGLSSFNCAMVCRAYASSSFILFCDSIVELVAVLVANSSITNPISLRSQCKIVSSSVDLRSSKVCELGLLNYKAKNVFYPYE
RNKFRCRYDYYWASVFKVEMKDHFSGKARIALAEAPNEALPHKCRPNFGAAWLAKDKFKVNETYDCWYSSGISKVNLDYDGFSSCQAQEPSKVEMIKRYYFLRKI

Sgr004541 (gene) of Monk fruit (Qingpiguo) v1 genome