CuGenDBv2

Gene ID	Sgr004619
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Protein of Unknown Function (DUF239)
Genome location	tig00003114:46251..54306
RNA-Seq Expression	Sgr004619
Synteny	Sgr004619
Gene Ontology terms	NA
InterPro domains	IPR004314 - Neprosin

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0053047.1 uncharacterized protein E6C27_scaffold344G001630 [Cucumis melo var. makuwa]

5.6e-17

46.22

Show/hide

Query:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------
        VN  +NGD +TR FVYWTA+  A TGCY+M CQGFVQV+ +     PL+P+STYQGQQYDYQFT+ +I                W  E            
Subjt:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------

Query:  ---AFAKPSPYGMSPPLGN
             AKPS  GMSP LG+
Subjt:  ---AFAKPSPYGMSPPLGN

KAE8650029.1 hypothetical protein Csa_011504 [Cucumis sativus]

3.1e-15

59.42

Show/hide

Query:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK
        VN  +NGD +TR FVYWTA+    TGCY+M CQGFVQV+ +     PL P+STY+GQQYDYQFT+ +I+
Subjt:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK

TYK11502.1 neprosin 2 [Cucumis melo var. makuwa]

5.6e-17

46.22

Show/hide

Query:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------
        VN  +NGD +TR FVYWTA+  A TGCY+M CQGFVQV+ +     PL+P+STYQGQQYDYQFT+ +I                W  E            
Subjt:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------

Query:  ---AFAKPSPYGMSPPLGN
             AKPS  GMSP LG+
Subjt:  ---AFAKPSPYGMSPPLGN

XP_022145287.1 uncharacterized protein LOC111014775 [Momordica charantia]

5.4e-20

47.15

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK------------------WHGEAF------
        QVN  INGDS TR+FVYWTA+    TG Y+M C+ F+Q + +  PN PLYPSSTYQG+QYDY FTV++ +                  W  E F      
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK------------------WHGEAF------

Query:  ---------AKPSPYGMSPPLGN
                 AKPSP GMSPPLGN
Subjt:  ---------AKPSPYGMSPPLGN

XP_031738648.1 uncharacterized protein LOC105435061 [Cucumis sativus]

3.1e-15

59.42

Show/hide

Query:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK
        VN  +NGD +TR FVYWTA+    TGCY+M CQGFVQV+ +     PL P+STY+GQQYDYQFT+ +I+
Subjt:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK

TrEMBL top hits

e value

%identity

Alignment

A0A072TRZ0 Carboxyl-terminal peptidase

1.5e-12

42.7

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHGEAFAKPSPYGMSPPLG
        QVN  + GD+L RLF+YWTA+   +TGCYD+LC GFVQ ++ I     + P+STY G QY+    +Y+   +G  + +   YG+  P+G
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHGEAFAKPSPYGMSPPLG

A0A0A0L400 Neprosin domain-containing protein

1.6e-14

55.56

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWH
        QVN A+NGD+L R FVYWT +    TGCY+MLCQGFV V+  I     + P+S YQGQQYDYQF++ +   H
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWH

A0A5A7UEV4 Uncharacterized protein

2.7e-17

46.22

Show/hide

Query:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------
        VN  +NGD +TR FVYWTA+  A TGCY+M CQGFVQV+ +     PL+P+STYQGQQYDYQFT+ +I                W  E            
Subjt:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------

Query:  ---AFAKPSPYGMSPPLGN
             AKPS  GMSP LG+
Subjt:  ---AFAKPSPYGMSPPLGN

A0A5D3CJM0 Neprosin 2

2.7e-17

46.22

Show/hide

Query:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------
        VN  +NGD +TR FVYWTA+  A TGCY+M CQGFVQV+ +     PL+P+STYQGQQYDYQFT+ +I                W  E            
Subjt:  VNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK---------------WHGE------------

Query:  ---AFAKPSPYGMSPPLGN
             AKPS  GMSP LG+
Subjt:  ---AFAKPSPYGMSPPLGN

A0A6J1CW60 uncharacterized protein LOC111014775

2.6e-20

47.15

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK------------------WHGEAF------
        QVN  INGDS TR+FVYWTA+    TG Y+M C+ F+Q + +  PN PLYPSSTYQG+QYDY FTV++ +                  W  E F      
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIK------------------WHGEAF------

Query:  ---------AKPSPYGMSPPLGN
                 AKPSP GMSPPLGN
Subjt:  ---------AKPSPYGMSPPLGN

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G70550.1 Protein of Unknown Function (DUF239)

9.8e-12

38.36

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHG
        Q++  + GD+  R F YWT++    TGCY++LC GFVQ +R I     + P S+Y+G Q+D    +++   HG
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHG

AT1G70550.2 Protein of Unknown Function (DUF239)

9.8e-12

38.36

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHG
        Q++  + GD+  R F YWT++    TGCY++LC GFVQ +R I     + P S+Y+G Q+D    +++   HG
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHG

AT2G44210.1 Protein of Unknown Function (DUF239)

1.3e-11

42.65

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYR
        QV+  + GD+ TRLF YWT++    TGCY++LC GFVQ++R I     + P S Y   QYD    +++
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYR

AT2G44210.2 Protein of Unknown Function (DUF239)

1.3e-11

42.65

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYR
        QV+  + GD+ TRLF YWT++    TGCY++LC GFVQ++R I     + P S Y   QYD    +++
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYR

AT5G50150.1 Protein of Unknown Function (DUF239)

4.4e-12

31.25

Show/hide

Query:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHGEAFAKPSPYGMSPPLGNVWIVGTKGCL
        QV+  + GD+  R F YWT +    TGCY++LC GFVQ +  I     + P S+Y G+Q+D    +++   HG  + +         LGN  +VG     
Subjt:  QVNLAINGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHGEAFAKPSPYGMSPPLGNVWIVGTKGCL

Query:  IASPLEDQVERI
        + S L      +
Subjt:  IASPLEDQVERI

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGATATAAAACGCCGTCTTGTGCGACGGAAGCCGGTTTAGCGGTTGGTAGCCCCAACGAATGGGTGGCTATTGAAGGCGATTTTGTCGGAGAGACGGCCACCAAAGG
CAGTGAGGAGGGTGGTTTTTTCGCTGTCGGAAGGCCGGAGCATGGGGAGAATTTCGCCGGGGGAAGACGACGCTGCTTAACCAAAATGGTTTTTCTCTCTACTCACCCAA
TGATGAACTGCTGCTCCTCAAATCCTCAAACCCACACTGTTGACTATGCACAAACTTCATCCTATCTGGCACAGTTTATTACTATTTTTTGCCAAGTGAATCTGGCAATC
AACGGTGATAGTCTCACTAGATTGTTTGTGTACTGGACGGCTAATGAAGCTGCTAAAACAGGATGCTACGATATGCTTTGTCAAGGTTTTGTACAAGTAGATCGAACAAT
TACTCCAAACTTCCCTCTTTACCCATCCTCCACCTATCAAGGGCAACAATATGACTATCAATTTACAGTTTATCGGATCAAGTGGCATGGGGAGGCATTTGCAAAGCCTT
CACCATATGGAATGAGCCCTCCCTTAGGCAACGTGTGGATTGTGGGCACGAAAGGTTGTCTTATTGCTTCACCTTTGGAGGACCAGGTGGAAAGAATTGTAGAGCCAATT
AGGCTACATGTTGAAGCTCTTGTATGGGATTTTTCCCAATGCCTTCGCCAAAGGTTCGCTCTGCGTCAACACGCTCTTCAACTTCATTTACGACGATCCGATCCGTCTTA
TGGCCGTATCGTGCTAGACTACGGGTTAGTTAGAGGTCGATGCTATGGGATCGGTTCCTCGACCAAAGTGATCCACCTCGGCATCTCGGCACAGGCTCATAGGCACCTCA
AATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGYKTPSCATEAGLAVGSPNEWVAIEGDFVGETATKGSEEGGFFAVGRPEHGENFAGGRRRCLTKMVFLSTHPMMNCCSSNPQTHTVDYAQTSSYLAQFITIFCQVNLAI
NGDSLTRLFVYWTANEAAKTGCYDMLCQGFVQVDRTITPNFPLYPSSTYQGQQYDYQFTVYRIKWHGEAFAKPSPYGMSPPLGNVWIVGTKGCLIASPLEDQVERIVEPI
RLHVEALVWDFSQCLRQRFALRQHALQLHLRRSDPSYGRIVLDYGLVRGRCYGIGSSTKVIHLGISAQAHRHLK

Sgr004619 (gene) of Monk fruit (Qingpiguo) v1 genome