CuGenDBv2

Gene ID	Sgr027543
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Cystatin domain-containing protein
Genome location	tig00153054:2376953..2401593
RNA-Seq Expression	Sgr027543
Synteny	Sgr027543
Gene Ontology terms	GO:0010466 - negative regulation of peptidase activity (biological process) GO:0004869 - cysteine-type endopeptidase inhibitor activity (molecular function)
InterPro domains	IPR000010 - Cystatin domain IPR006525 - Cystatin-related, plant

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022137488.1 uncharacterized protein LOC111008920 isoform X1 [Momordica charantia]

6.1e-34

58.65

Show/hide

Query:  STDSEHNSPYHSDGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVRDI-LLTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQAS
        S  + +N  Y SDGYY+DGVR MNEEE + +Y A QESEGFDVP+FP +YAF +I P+  I L++ E++ C+ +AIKHYNNENG +FE VK++KAN QA+
Subjt:  STDSEHNSPYHSDGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVRDI-LLTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQAS

Query:  CGILYFITFEAKQTGTPSEYPTTAFQARVLFGI
         G L+F+TF+ KQTG P + PTT  QARVL GI
Subjt:  CGILYFITFEAKQTGTPSEYPTTAFQARVLFGI

XP_022137526.1 uncharacterized protein LOC111008952 [Momordica charantia]

6.5e-36

60.31

Show/hide

Query:  PSASAYHFDEYFADGLREMTDEEEMEYYLAFEKTQGFDMPTFPESYSMDRIEPVSERRLFSPELQECA--EEAIQHYNKENGTNFEFVKMVKANNGAACG
        P     H D YF +  REMT EEE+EYY+A +KT+GFDMP+FP+SY+  RIE ++  RL S ELQECA  ++A+ ++N++NGT+FEFVKMVKA N A  G
Subjt:  PSASAYHFDEYFADGLREMTDEEEMEYYLAFEKTQGFDMPTFPESYSMDRIEPVSERRLFSPELQECA--EEAIQHYNKENGTNFEFVKMVKANNGAACG

Query:  ILYYITFEVKQIGSPPNSPTTTFQAHVLFGI
        I+YY+TFEVKQ+GSPPNSPT T QA VL G+
Subjt:  ILYYITFEVKQIGSPPNSPTTTFQAHVLFGI

XP_022942206.1 uncharacterized protein LOC111447330 [Cucurbita moschata]

3.2e-27

52.03

Show/hide

Query:  DGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVR--DIL-LTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFITFE
        D +++DG  ++ ++EE E+YCA +ES+GFDVP F   YAF LI P++  ++  +  E+Q+ + EAIKHYNNENGTNFEVV IVKAN    CG +Y+ITF 
Subjt:  DGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVR--DIL-LTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFITFE

Query:  AKQTGTPSEYPTTAFQARVLFGI
         K  GTP E+P+  FQA+V + I
Subjt:  AKQTGTPSEYPTTAFQARVLFGI

XP_023521681.1 UPF0725 protein At4g29550-like [Cucurbita pepo subsp. pepo]

3.2e-27

45.45

Show/hide

Query:  MASSPKFCLSDSTDSECDSPCDSEEYYENGIRGMNKEEEEQYYRALEKSEGFDVPTFPESCAFGLIVPVC---DIPLTPGLRVCTEEAIKHYNNENGTNF
        MASS    LS+  + E DS    +E+Y++G   + K+EE +Y+RA+E+SEGFDVP F +  ++ LI P+    +  +   +R+   +AIKHYN ENGTNF
Subjt:  MASSPKFCLSDSTDSECDSPCDSEEYYENGIRGMNKEEEEQYYRALEKSEGFDVPTFPESCAFGLIVPVC---DIPLTPGLRVCTEEAIKHYNNENGTNF

Query:  EIVEIVKANQQGACGILYFITFEAKQIGTPPEYPTTTFQARVLFGILHKIEPITSSSLSDPPLKN
        E+VEIVKAN  G CG +Y+ITF  K IGT  E+P  TFQA+V + I   I+ I    L  P   N
Subjt:  EIVEIVKANQQGACGILYFITFEAKQIGTPPEYPTTTFQARVLFGILHKIEPITSSSLSDPPLKN

XP_023525925.1 uncharacterized protein LOC111789396 [Cucurbita pepo subsp. pepo]

5.7e-32

60.98

Show/hide

Query:  DSEEYYENGIRGMNKEEEEQYYRALEKSEGFDVPTFPESCAFGLIVPVCDIPLT-PGLRVCTEEAIKHYNNENGTNFEIVEIVKANQQGACGILYFITFE
        DS+E YE+G+R MN+EE  +YY+ L  ++GFDVPTFP + A GLIVP+C+  L+ P LR C E+AI HYN  NGTNFE V+IVKANQQ   G  Y+ITF+
Subjt:  DSEEYYENGIRGMNKEEEEQYYRALEKSEGFDVPTFPESCAFGLIVPVCDIPLT-PGLRVCTEEAIKHYNNENGTNFEIVEIVKANQQGACGILYFITFE

Query:  AKQIGTPPEYPTTTFQARVLFGI
         KQIGT  E+PTTTF+A+VL GI
Subjt:  AKQIGTPPEYPTTTFQARVLFGI

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C8H7 uncharacterized protein LOC111008952

3.1e-36

60.31

Show/hide

Query:  PSASAYHFDEYFADGLREMTDEEEMEYYLAFEKTQGFDMPTFPESYSMDRIEPVSERRLFSPELQECA--EEAIQHYNKENGTNFEFVKMVKANNGAACG
        P     H D YF +  REMT EEE+EYY+A +KT+GFDMP+FP+SY+  RIE ++  RL S ELQECA  ++A+ ++N++NGT+FEFVKMVKA N A  G
Subjt:  PSASAYHFDEYFADGLREMTDEEEMEYYLAFEKTQGFDMPTFPESYSMDRIEPVSERRLFSPELQECA--EEAIQHYNKENGTNFEFVKMVKANNGAACG

Query:  ILYYITFEVKQIGSPPNSPTTTFQAHVLFGI
        I+YY+TFEVKQ+GSPPNSPT T QA VL G+
Subjt:  ILYYITFEVKQIGSPPNSPTTTFQAHVLFGI

A0A6J1CAH1 uncharacterized protein LOC111008920 isoform X1

2.9e-34

58.65

Show/hide

Query:  STDSEHNSPYHSDGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVRDI-LLTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQAS
        S  + +N  Y SDGYY+DGVR MNEEE + +Y A QESEGFDVP+FP +YAF +I P+  I L++ E++ C+ +AIKHYNNENG +FE VK++KAN QA+
Subjt:  STDSEHNSPYHSDGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVRDI-LLTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQAS

Query:  CGILYFITFEAKQTGTPSEYPTTAFQARVLFGI
         G L+F+TF+ KQTG P + PTT  QARVL GI
Subjt:  CGILYFITFEAKQTGTPSEYPTTAFQARVLFGI

A0A6J1FN74 uncharacterized protein LOC111447330

1.6e-27

52.03

Show/hide

Query:  DGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVR--DIL-LTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFITFE
        D +++DG  ++ ++EE E+YCA +ES+GFDVP F   YAF LI P++  ++  +  E+Q+ + EAIKHYNNENGTNFEVV IVKAN    CG +Y+ITF 
Subjt:  DGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVR--DIL-LTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFITFE

Query:  AKQTGTPSEYPTTAFQARVLFGI
         K  GTP E+P+  FQA+V + I
Subjt:  AKQTGTPSEYPTTAFQARVLFGI

A0A6J1FPD6 UPF0725 protein At4g29550-like

2.3e-26

44.59

Show/hide

Query:  LSDSTDSECDSPCDSEEYYENGIRGMNKEEEEQYYRALEKSEGFDVPTFPESCAFGLIVPVC---DIPLTPGLRVCTEEAIKHYNNENGTNFEIVEIVKA
        LS+  + E DS    +E+Y++G   + K+EE +Y+RA+E+SEGFDVP F +  ++ LI P+    D  +   +R+   +AIK+YN ENGTNFE+VEIVKA
Subjt:  LSDSTDSECDSPCDSEEYYENGIRGMNKEEEEQYYRALEKSEGFDVPTFPESCAFGLIVPVC---DIPLTPGLRVCTEEAIKHYNNENGTNFEIVEIVKA

Query:  NQQGACGILYFITFEAKQIGTPPEYPTTTFQARVLFGILHKIEPITSSSLSDPPLKN
        N  G CG +Y+ITF  K IGT  E+   TFQA+V + I   I+ I    L  P   N
Subjt:  NQQGACGILYFITFEAKQIGTPPEYPTTTFQARVLFGILHKIEPITSSSLSDPPLKN

A0A6J1IJT3 uncharacterized protein LOC111475320

1.7e-26

51.22

Show/hide

Query:  DGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVR---DILLTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFITFE
        D +++DG  ++ ++EE E++CA  ES+GFDVP F   YAFGLI P++      L  E+Q+ + EAIKHYN+ENGTNFEVV IVKAN +  CG +Y+ITF 
Subjt:  DGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVR---DILLTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFITFE

Query:  AKQTGTPSEYPTTAFQARVLFGI
         K  GT +E+P+  FQA+V + I
Subjt:  AKQTGTPSEYPTTAFQARVLFGI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G50690.1 Cystatin/monellin superfamily protein

1.7e-05

Show/hide

Query:  YEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPES---YAFGLIVPVRDILLTPE-----LQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFIT
        Y +   S + E+E      +Q S  +D  T  +    + + +I    D+   PE     +   S+ A++ YN++   N E+V+ VKAN++   G +++IT
Subjt:  YEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPES---YAFGLIVPVRDILLTPE-----LQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFIT

Query:  FEAKQTGTPSEYPTTAFQARVLFGI
        FEAK   + ++  T     R L GI
Subjt:  FEAKQTGTPSEYPTTAFQARVLFGI

AT1G63190.1 Cystatin/monellin superfamily protein

9.7e-06

43.33

Show/hide

Query:  MDRIEPVSERRLFSPELQECAEEAIQHYNKENGTNFEFVKMVKANNGAACGILYYITFEV
        +D  E V E       L+  + +A+  YN+E+ T FEFVK+VKAN    C I++ ITFEV
Subjt:  MDRIEPVSERRLFSPELQECAEEAIQHYNKENGTNFEFVKMVKANNGAACGILYYITFEV

AT1G63200.1 Cystatin/monellin superfamily protein

1.5e-06

41.54

Show/hide

Query:  LQECAEEAIQHYNKENGTNFEFVKMVKANNGAACGILYYITFEVKQIGSPPNSPTTTFQAHVLFG
        L+  A+EA+  +N  +GT +EFVK+VKAN   AC +++ ITF+VK    P +     FQ  V  G
Subjt:  LQECAEEAIQHYNKENGTNFEFVKMVKANNGAACGILYYITFEVKQIGSPPNSPTTTFQAHVLFG

AT1G63205.1 Cystatin/monellin superfamily protein

2.1e-08

31.21

Show/hide

Query:  EEEEQYYRALEKSEGFDVPTFPESCAFGL-IVPVCDIPL-------TPG--LRVCTEEAIKHYNNENGTN-FEIVEIVKANQQGACGILYFITFEAKQIG
        EE       + KSEGFD+      C F   +V   D          T G  ++  ++E++K YN+E GTN +E  E+VKAN  G+CG ++ ITF   Q+ 
Subjt:  EEEEQYYRALEKSEGFDVPTFPESCAFGL-IVPVCDIPL-------TPG--LRVCTEEAIKHYNNENGTN-FEIVEIVKANQQGACGILYFITFEAKQIG

Query:  TPPEYPTTTFQARVLFGILHKIEPITSSSLSDPPLKNYTTS
         P +    TFQAR+ +   +  E +      +P + ++ T+
Subjt:  TPPEYPTTTFQARVLFGILHKIEPITSSSLSDPPLKNYTTS

AT2G37435.1 Cystatin/monellin superfamily protein

1.4e-07

29.6

Show/hide

Query:  EKEYY---RALEETQGFDVPTFPKSYAFGLIMPAPVELFSQKL-----------QACAEEAIKHYNKENDTNFEFVKIVKANHRAARGILYFITFEVKQI
        E+EYY   + +E+++GFD+        F      PV+L   +L                ++++H+N+ + T +EFV+ +KANH  + G++YFITFE K +
Subjt:  EKEYY---RALEETQGFDVPTFPKSYAFGLIMPAPVELFSQKL-----------QACAEEAIKHYNKENDTNFEFVKIVKANHRAARGILYFITFEVKQI

Query:  GTPLEFPTTTFQARV--LSGIPDTI
            +  +  FQA++    G P+ I
Subjt:  GTPLEFPTTTFQARV--LSGIPDTI

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTGGTCTTTGGCTTTGGTCTCTATGCGGTTGGTTCTTCTATACGCTGTCTGGTTACTTTAGTCTGCTTGTTAATTTGCTTTCTCATTTTCTGCTTATTGGTTGGTT
GACTCTCGACTGTGTGACACATTTTGAAGCAGGGGACTTTCTTAGGGTGGCGTTGATGGCTTCTTCACCCGAATTCAGCTTCTCTAACATATCCTCACCTGGCTCTGCAC
ACAATTCTCCAAATTATTTGGATGGATATGATGGAGACGGTATCCATGAGATGACTGAGGAAGAGGAGAAGGAATACTATCGTGCCTTAGAAGAAACCCAGGGTTTTGAT
GTACCGACTTTTCCTAAATCCTATGCTTTTGGTCTTATTATGCCTGCACCTGTGGAGCTATTTTCACAAAAGCTTCAAGCATGCGCAGAGGAAGCCATTAAACATTACAA
CAAGGAAAATGATACAAATTTTGAGTTTGTGAAAATTGTGAAGGCGAATCATCGAGCTGCTCGTGGTATCTTGTATTTCATCACTTTCGAGGTTAAGCAAATTGGAACAC
CTCTAGAGTTCCCAACCACAACCTTCCAAGCTCGGGTGCTATCTGGTATTCCTGATACTATAGAGCTTAGCTTCCCCCGGCCCTCTTCCTCCAACTCTACTGCTTTCATT
TCCTTGCGGGAGTCAGTTTGTTGGTGTTCCTTCGGCCTTGGTCTCTATGAGTATGATGTTGGTTCTTCTATTCTATTATATGCTGCTCTGCTATGGTTCCTTGCTTGTTA
TTGGCTGATTGTGTCACACATCACAAATACACCTTACACCCTAACAAATACTTTTGCATTTACTTTGAATCAATATTGTTTCTGCCTTCTTTTTTCCTTTTTCTTTTTTT
TTTTGTTTTTTTTTCCTGAGATCATCAAACAAAGGGTGGGGGATTCGGGAGGTTACCATACTGATGCCTTAACCGGGGACTTTCTTGCGTTGATGGCGTTTTCACCCAAA
CTCAGCCCATCTGCCTCTGCATATCATTTTGATGAATATTTTGCAGACGGTCTACGTGAGATGACTGATGAAGAGGAGATGGAATACTATCTTGCCTTTGAAAAAACCCA
GGGTTTTGATATGCCCACTTTTCCTGAATCCTATTCTATGGATCGTATTGAGCCTGTATCTGAGCGTCGATTATTTTCACCAGAGCTTCAAGAATGCGCAGAGGAAGCTA
TTCAACATTACAACAAGGAAAATGGTACAAATTTTGAATTTGTGAAGATGGTGAAGGCAAATAATGGAGCTGCTTGTGGTATATTATATTATATCACCTTCGAAGTCAAG
CAAATTGGATCACCTCCAAACTCCCCCACCACAACATTCCAAGCTCATGTGCTGTTTGGTATTGATGGTATAGAGGGTTTCTCCAATTTCTCAAGAGATAGAACTATCAA
CAAGATAAGAGACCTCGGACATCAGAAGGAGTCTGCTATTTATGCGAAGCAACTTCCGTTAGGGTTTTGTCCAATTTCTGAAAAGAGCTTCATTAATGTAGCTATCTTCT
TGCATGGATTATTTCTACTGACAGATTTTGAAGCTGGGGACTTTCTAGGGGCGGCTTTCATGGCTTCTTCACCCAAATTCTGTTTCTCTGACTCAACTGACTCTGAACAC
AATTCTCCGTATCACTCTGATGGATATTACGAAGACGGTGTCCGTTCGATGAATGAAGAAGAAGAAGACGAATTTTATTGTGCCTTCCAAGAAAGCGAGGGTTTTGATGT
ACCGACTTTTCCTGAATCCTATGCTTTTGGTCTTATTGTGCCTGTACGTGACATTCTACTTACCCCAGAGCTTCAAGTATGCTCAGAAGAAGCCATTAAACATTACAACA
ATGAAAATGGTACAAATTTTGAAGTTGTGAAGATTGTGAAGGCGAATCAACAAGCTTCTTGTGGTATTTTGTATTTCATTACCTTTGAGGCCAAACAAACTGGAACACCC
TCAGAGTACCCAACCACAGCCTTCCAAGCTCGAGTTCTTTTTGGAATTTTTCATAAAATAGAGGGGGTGGCTTTCATGGCTTCTTCACCCAAATTCTGCCTCTCTGACTC
AACTGACTCTGAATGCGATTCCCCATGTGATTCTGAAGAATATTATGAAAATGGTATCCGTGGGATGAATAAGGAAGAGGAAGAGCAATATTATCGTGCATTAGAAAAAA
GCGAGGGTTTTGATGTACCAACTTTTCCAGAATCCTGTGCTTTTGGTCTTATTGTTCCTGTCTGCGACATTCCACTTACCCCAGGACTTCGAGTGTGCACAGAGGAAGCT
ATTAAACATTACAACAACGAAAATGGTACAAATTTTGAAATTGTGGAGATTGTGAAGGCAAATCAACAAGGTGCGTGTGGTATTTTGTATTTCATCACTTTCGAGGCCAA
ACAAATTGGAACACCTCCAGAGTATCCAACCACAACCTTCCAAGCTCGAGTGCTGTTTGGAATTCTTCATAAAATAGAGCCTATAACGTCTTCTTCTCTCTCTGACCCAC
CACTGAAAAACTACACCACCTCCATTTTTTCTCTCAAGGTTTCTCCTTCTCTCACTCTTCTGTCTCTCTATCACTCTGTTTCTATGGCTACCTCCTCCAAGACATCAAGA
AATTCAAGATTTCAAATTCACCGGCAGCTTCTCCCGAAAGCTCCGATTCATATCTCCAGCTCTACAGCCAGCGGCTTAACAAGTAGAGGAATAGTGACTAGTCGGAGAGT
GAACGCTGATTCCAAAGCGACTTCGAGGTTGGTGGTCTGCTCGGTAGCCTCCGAGTCTATCAAGACAATATTGCGACGGCACATCAATGACAAACTGAATGAGGAGGCGG
CAACCAAGGAAATGGGAAAGTTGTTGCTGCGGCCATCAAATTACCACAGCGATCAGAACTTGAGCAGATTTTCTACTTACAGTTTACAGTATTTTGAAGAGCAGGGGACT
TTGTTGGTGGTGGTTTTGATGGCTTCTTATCCACCCGAATTCTACTTCTCCGACCACTCATCTGCCTCTGCAGTTGCACACAATTCTAATCCATGTGATTATGATTCTGA
TGGATGGATATTATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVGLWLWSLCGWFFYTLSGYFSLLVNLLSHFLLIGWLTLDCVTHFEAGDFLRVALMASSPEFSFSNISSPGSAHNSPNYLDGYDGDGIHEMTEEEEKEYYRALEETQGFD
VPTFPKSYAFGLIMPAPVELFSQKLQACAEEAIKHYNKENDTNFEFVKIVKANHRAARGILYFITFEVKQIGTPLEFPTTTFQARVLSGIPDTIELSFPRPSSSNSTAFI
SLRESVCWCSFGLGLYEYDVGSSILLYAALLWFLACYWLIVSHITNTPYTLTNTFAFTLNQYCFCLLFSFFFFFLFFFPEIIKQRVGDSGGYHTDALTGDFLALMAFSPK
LSPSASAYHFDEYFADGLREMTDEEEMEYYLAFEKTQGFDMPTFPESYSMDRIEPVSERRLFSPELQECAEEAIQHYNKENGTNFEFVKMVKANNGAACGILYYITFEVK
QIGSPPNSPTTTFQAHVLFGIDGIEGFSNFSRDRTINKIRDLGHQKESAIYAKQLPLGFCPISEKSFINVAIFLHGLFLLTDFEAGDFLGAAFMASSPKFCFSDSTDSEH
NSPYHSDGYYEDGVRSMNEEEEDEFYCAFQESEGFDVPTFPESYAFGLIVPVRDILLTPELQVCSEEAIKHYNNENGTNFEVVKIVKANQQASCGILYFITFEAKQTGTP
SEYPTTAFQARVLFGIFHKIEGVAFMASSPKFCLSDSTDSECDSPCDSEEYYENGIRGMNKEEEEQYYRALEKSEGFDVPTFPESCAFGLIVPVCDIPLTPGLRVCTEEA
IKHYNNENGTNFEIVEIVKANQQGACGILYFITFEAKQIGTPPEYPTTTFQARVLFGILHKIEPITSSSLSDPPLKNYTTSIFSLKVSPSLTLLSLYHSVSMATSSKTSR
NSRFQIHRQLLPKAPIHISSSTASGLTSRGIVTSRRVNADSKATSRLVVCSVASESIKTILRRHINDKLNEEAATKEMGKLLLRPSNYHSDQNLSRFSTYSLQYFEEQGT
LLVVVLMASYPPEFYFSDHSSASAVAHNSNPCDYDSDGWIL

Sgr027543 (gene) of Monk fruit (Qingpiguo) v1 genome