CuGenDBv2

Gene ID	Sgr012232
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Unknown protein
Genome location	tig00153284:95077..101524
RNA-Seq Expression	Sgr012232
Synteny	Sgr012232
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6593003.1 hypothetical protein SDJN03_12479, partial [Cucurbita argyrosperma subsp. sororia]

1.0e-62

58.33

Show/hide

Query:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC
        +E   +  G + R IKLFCPSLST+APF+ S DQ +D+GSIAT FGL+PSTVKLNG FLSRG DLVSSVTW SLLSFF +KRLPTG SD DA+VVDGKL 
Subjt:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC

Query:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG
        KIGVKRAH  QEI NGDCCEADEED NL+G R KPES+L+K                  LKC                           GF ELSDA   
Subjt:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG

Query:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        +   AN  P T YSCSYNSKNMKRMR +E LV AFCKRT+
Subjt:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

XP_022145086.1 uncharacterized protein LOC111014592 [Momordica charantia]

1.4e-67

60.5

Show/hide

Query:  LHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKI
        + ME T HKPRIIKL CPSLS +APFL SD   +D+G+IAT FGLQPSTVKLNG FLSRGPDL+SSVTWKSLLSFF +KRLP GNSD+D +VVDGKL KI
Subjt:  LHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKI

Query:  GVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGGLI
        G+KRA G QEIV+G CCEADEED NL+   Q    +L+  KKLK RD                                        G  ELSD + GL 
Subjt:  GVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGGLI

Query:  DAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        DAANVVP   YSCSYNSKNMKRMR +ETLVSAFCKRTR
Subjt:  DAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

XP_022959564.1 uncharacterized protein LOC111460597 isoform X1 [Cucurbita moschata]

1.0e-62

58.33

Show/hide

Query:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC
        +E   +  G + R IKLFCPSLST+APF+ S DQ +D+GSIAT FGL+PSTVKLNG FLSRG DLVSSVTW SLLSFF +KRLPTG SD DA+VVDGKL 
Subjt:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC

Query:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG
        KIGVKRAH  QEI NGDCCEADEED NL+G R KPES+L+K                  LKC                           GF ELSDA   
Subjt:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG

Query:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        +   AN  P T YSCSYNSKNMKRMR +E LV AFCKRT+
Subjt:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

XP_023513937.1 uncharacterized protein LOC111778382 isoform X1 [Cucurbita pepo subsp. pepo]

1.2e-63

58.75

Show/hide

Query:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC
        +E   +  G + R IKLFCPSLST+APF+ S DQ +D+GSIAT FGL+PSTVKLNG FLSRG DLVSSVTW SLLSFF +KRLPTG SD DA+VVDGKL 
Subjt:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC

Query:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG
        KIGVKRAH  QEI NGDCCEADEEDGNL+G R KPES+L+K                  LKC                           GF ELSDA   
Subjt:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG

Query:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        + + AN  P T YSCSYNSKNMKRMR +E LV AFCKRT+
Subjt:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

XP_038897803.1 uncharacterized protein LOC120085717 isoform X2 [Benincasa hispida]

9.9e-66

59.84

Show/hide

Query:  KGETLPETVGSKIRSSVWSPNQNDQSHSHFTFLLKEEHYSHSWVELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGR
        + ETLPET+  +      SP+   Q++         E+     +E+ ME T  K R I LFCPSLST+APFL SDD  +D+GSIA  FGL PS++KLNG 
Subjt:  KGETLPETVGSKIRSSVWSPNQNDQSHSHFTFLLKEEHYSHSWVELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGR

Query:  FLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDLGFGELSD
        FLSRG DLVS VTW SLLSFF +KRLP G+SD DA++VDGKL K+GVKRAHG QEIV+GDCC+ADEED N++  R KPES+L+  KK+K  DLGF ELSD
Subjt:  FLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDLGFGELSD

Query:  AIGGLIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
          GG+ DAANV     YSCS+NS NMKRMR  ETLVSA CKR+R
Subjt:  AIGGLIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3C6U5 uncharacterized protein LOC103497564

1.8e-52

52.92

Show/hide

Query:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC
        +++ ME T  K   I LFCPSLST APFL S D  +D+GSIA  FGL PS++KLNGRFLSRG DL+SSVTW SLLSFF +KRLP G+S  DA++VDGKL 
Subjt:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC

Query:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGG
        KIG KR HG QE V+GD  EADEE  +++  R KPES+L+  KK+K  D                                        GF ELSD  GG
Subjt:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGG

Query:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        + D ANV   T YSCS NS NMKRMR  ETLVSA CKR+R
Subjt:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

A0A5D3E3Q7 Uncharacterized protein

3.9e-52

53.81

Show/hide

Query:  METTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKIGV
        ME T  K   I LFCPSLST APFL S D  +D+GSIA  FGL PS++KLNGRFLSRG DL+SSVTW SLLSFF +KRLP G+S  DA++VDGKL KIG 
Subjt:  METTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKIGV

Query:  KRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGGLIDA
        KR HG QE V+GD  EADEE  +++  R KPES+L+  KK+K  D                                        GF ELSD  GG+ D 
Subjt:  KRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGGLIDA

Query:  ANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        ANV   T YSCS NS NMKRMR  ETLVSA CKR+R
Subjt:  ANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

A0A6J1CVB3 uncharacterized protein LOC111014592

6.7e-68

60.5

Show/hide

Query:  LHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKI
        + ME T HKPRIIKL CPSLS +APFL SD   +D+G+IAT FGLQPSTVKLNG FLSRGPDL+SSVTWKSLLSFF +KRLP GNSD+D +VVDGKL KI
Subjt:  LHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKI

Query:  GVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGGLI
        G+KRA G QEIV+G CCEADEED NL+   Q    +L+  KKLK RD                                        G  ELSD + GL 
Subjt:  GVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI--KKLKCRDL---------------------------------------GFGELSDAIGGLI

Query:  DAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        DAANVVP   YSCSYNSKNMKRMR +ETLVSAFCKRTR
Subjt:  DAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

A0A6J1H8F0 uncharacterized protein LOC111460597 isoform X1

5.0e-63

58.33

Show/hide

Query:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC
        +E   +  G + R IKLFCPSLST+APF+ S DQ +D+GSIAT FGL+PSTVKLNG FLSRG DLVSSVTW SLLSFF +KRLPTG SD DA+VVDGKL 
Subjt:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC

Query:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG
        KIGVKRAH  QEI NGDCCEADEED NL+G R KPES+L+K                  LKC                           GF ELSDA   
Subjt:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKK-----------------LKC------------------------RDLGFGELSDAIGG

Query:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        +   AN  P T YSCSYNSKNMKRMR +E LV AFCKRT+
Subjt:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

A0A6J1KVM1 uncharacterized protein LOC111498000 isoform X1

1.4e-62

57.92

Show/hide

Query:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC
        +E   +  G + R IKLFC SLST+APF+ S+DQ +D+GSIAT FGL+PSTVKLNG FLSRG DLVSSVTW SLLSFF +KRLPTG SD DA+VVDGKL 
Subjt:  VELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLC

Query:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI---------------------------------------KKLKCRDL--GFGELSDAIGG
        KIGVKRAH  QEI NGDCCEADEEDGNL+G R KPES+L+                                       KKLK  +   GF ELSDA   
Subjt:  KIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLI---------------------------------------KKLKCRDL--GFGELSDAIGG

Query:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR
        + + AN  P T  SCSYNSKNMKRMR +E LV AFCKRT+
Subjt:  LIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G07150.1 unknown protein

1.5e-27

39.22

Show/hide

Query:  RIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSS-VTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKIGVKRAHG--
        R IKLFCPS+S +  ++  +D+ LD  +IA  FGL+PSTVKLNG F+SRG DLV++ VTW+SLL+FF ++ L TG  + DA++V GKL K+G KRA    
Subjt:  RIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGLQPSTVKLNGRFLSRGPDLVSS-VTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKIGVKRAHG--

Query:  LQEIVNGDC-----------CEADEE--DGNLSGRRQKPESSLIKKLKCRDLGFGELSDAIGGLIDAANVVPCTTYSCSYNSKN-MKRMRVNETLVSAFC
        L++    D            C   E    G    +    +S  +KKLK        + D+ GG          T   CS+ S N +KR R ++ + SA C
Subjt:  LQEIVNGDC-----------CEADEE--DGNLSGRRQKPESSLIKKLKCRDLGFGELSDAIGGLIDAANVVPCTTYSCSYNSKN-MKRMRVNETLVSAFC

Query:  KRTR
        K+ R
Subjt:  KRTR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCCTTGGGCTTGGAGCAACCTCTGCGTTCCGCTCACCTCAATTGCCTTCCTTCAGCAAGGGCGAGACGCTTCCAGAGACCGTTGGAAGCAAAATCCGCAGCTCTGT
CTGGTCTCCAAACCAAAATGACCAGAGCCACAGCCATTTCACTTTCCTTCTCAAAGAAGAGCATTATTCTCACAGTTGGGTCGAGCTTCATATGGAGACGACAGGTCACA
AACCCAGAATCATCAAGCTATTTTGCCCCTCACTCTCCACCGTTGCCCCATTCCTCACATCCGACGACCAACCCCTCGATATGGGCTCCATAGCCACCACCTTCGGCCTC
CAACCCTCCACGGTGAAGCTCAATGGCCGCTTCCTCAGCCGAGGGCCCGATCTCGTCTCCTCCGTCACTTGGAAGTCCCTTCTCTCTTTCTTCTTTTCTAAACGACTGCC
TACTGGGAACTCCGACAAGGATGCGATAGTTGTTGATGGAAAGCTCTGTAAAATTGGCGTCAAGAGAGCTCATGGCCTTCAGGAAATTGTAAATGGTGATTGTTGCGAAG
CTGATGAAGAAGATGGAAATCTGAGTGGTAGAAGGCAAAAACCAGAAAGCAGCCTGATCAAGAAGTTGAAATGCAGGGACTTAGGTTTCGGTGAATTATCAGATGCAATT
GGAGGATTAATCGACGCAGCCAATGTCGTTCCATGCACGACATATTCGTGTAGCTACAATAGTAAGAATATGAAAAGGATGAGAGTAAATGAGACTCTTGTTTCAGCTTT
CTGCAAGAGAACTAGATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSLGLGATSAFRSPQLPSFSKGETLPETVGSKIRSSVWSPNQNDQSHSHFTFLLKEEHYSHSWVELHMETTGHKPRIIKLFCPSLSTVAPFLTSDDQPLDMGSIATTFGL
QPSTVKLNGRFLSRGPDLVSSVTWKSLLSFFFSKRLPTGNSDKDAIVVDGKLCKIGVKRAHGLQEIVNGDCCEADEEDGNLSGRRQKPESSLIKKLKCRDLGFGELSDAI
GGLIDAANVVPCTTYSCSYNSKNMKRMRVNETLVSAFCKRTR

Sgr012232 (gene) of Monk fruit (Qingpiguo) v1 genome