CuGenDBv2

Gene ID	Sgr022152
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	SASA domain-containing protein
Genome location	tig00153894:709234..714537
RNA-Seq Expression	Sgr022152
Synteny	Sgr022152
Gene Ontology terms	NA
InterPro domains	IPR005181 - Sialate O-acetylesterase domain IPR036514 - SGNH hydrolase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6578894.1 putative carbohydrate esterase, partial [Cucurbita argyrosperma subsp. sororia]

8.3e-40

62.5

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        LLAK G SI  IGLV CAIGG+ LREW+K T  YT LV ++K S++HG    GFFWYQGE DA+VE E+K Y+  L+KFFTDLR D+NH DLPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HD F SP   +KE+VW AQEAVT KLP VRMVD   AV N ++
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

KAG7016422.1 putative carbohydrate esterase, partial [Cucurbita argyrosperma subsp. argyrosperma]

8.3e-40

62.5

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        LLAK G SI  IGLV CAIGG+ LREW+K T  YT LV ++K S++HG    GFFWYQGE DA+VE E+K Y+  L+KFFTDLR D+NH DLPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HD F SP   +KE+VW AQEAVT KLP VRMVD   AV N ++
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

XP_022141681.1 probable carbohydrate esterase At4g34215 [Momordica charantia]

5.5e-44

68.75

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        L  ++G+SI VIGLV CAIGG  LREWIK T  YT L+++IKAS+KHG    GF WYQGE DASVE ESK Y+  LTKFFTDLR D N+L+LPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HDIFTSPIIN+KEDVWKAQE VT KL  VRMVD  EAV N E+
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

XP_022939276.1 probable carbohydrate esterase At4g34215 [Cucurbita moschata]

1.1e-39

61.81

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        LLAK G SI  IGLV CAIGG+ LREW+K T  YT LV ++K S++HG    GFFWYQGE DA+VE E+K Y+  L+KFFTDLR D+NH DLPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HD F SP   +KE+VW AQEAVT KLP +RMVD   AV N ++
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

XP_023550941.1 probable carbohydrate esterase At4g34215 [Cucurbita pepo subsp. pepo]

8.3e-40

62.5

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        LLAK G SI  IGLV CAIGG+ LREW+K T  YT LV ++K S++HG    GFFWYQGE DA+VE E+K Y+  L+KFFTDLR D+NH DLPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HD F SP   +KE+VW AQEAVT KLP VRMVD   AV N ++
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

TrEMBL top hits

e value

%identity

Alignment

A0A6J1BYJ2 probable carbohydrate esterase At4g34215

4.6e-36

58.11

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        LLAK  +SI VIGLV CAIGG  LREW+K T+NYT LV++I AS+ +GG    FFW+QGE DASV V+++FYK+NL KF TDLRKDLN   LPIIL  I 
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQKVIS
         +D   SPI+NY + + +A EAV HKLPK+  VDA +A+    Q+V+S
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQKVIS

A0A6J1CJZ1 probable carbohydrate esterase At4g34215

2.7e-44

68.75

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        L  ++G+SI VIGLV CAIGG  LREWIK T  YT L+++IKAS+KHG    GF WYQGE DASVE ESK Y+  LTKFFTDLR D N+L+LPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HDIFTSPIIN+KEDVWKAQE VT KL  VRMVD  EAV N E+
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

A0A6J1CKF9 probable carbohydrate esterase At4g34215

1.5e-39

62.24

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        +LAK G    VIGLV CAIGG  LREW+K T NYT LVN+IKAS+  G    G  WYQGE DA+VE ESKFY+ NLTKF+TDLR D NH DLPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLE
         HD F SP+IN+ +DVWKAQE +T  L  VR+VD  +AV N +
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLE

A0A6J1FFF9 probable carbohydrate esterase At4g34215

5.2e-40

61.81

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        LLAK G SI  IGLV CAIGG+ LREW+K T  YT LV ++K S++HG    GFFWYQGE DA+VE E+K Y+  L+KFFTDLR D+NH DLPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HD F SP   +KE+VW AQEAVT KLP +RMVD   AV N ++
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

A0A6J1K1G7 probable carbohydrate esterase At4g34215

1.2e-39

61.81

Show/hide

Query:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV
        LLAK G SI  IGLV CAIGG+ LREW+K T  YT LV ++K S++HG    GFFWYQGE DA+VE E+K Y+  L+KFFTDLR D+NH DLPIIL  IV
Subjt:  LLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHG----GFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIIL--IV

Query:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ
         HD F SP   +K++VW AQEAVT KLP VRMVD   AV N ++
Subjt:  PHDIFTSPIINYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQ

SwissProt top hits

e value

%identity

Alignment

Q8L9J9 Probable carbohydrate esterase At4g34215

1.3e-08

39.08

Show/hide

Query:  VIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI
        VIGLV CA GG  ++EW + +  Y  +V + + S+K GG      WYQGE D     +++ Y  N+ +   +LR DLN   LPII +
Subjt:  VIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI

Arabidopsis top hits

e value

%identity

Alignment

AT3G53010.1 Domain of unknown function (DUF303)

8.3e-14

44.32

Show/hide

Query:  IGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG------FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI
        +GLV C+IGG +L +W K    Y   V + KA+   GG        WYQGE D    V++  YK+ L KFF+DLR DL H +LPII +
Subjt:  IGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG------FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI

AT4G34215.1 Domain of unknown function (DUF303)

9.5e-10

39.08

Show/hide

Query:  VIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI
        VIGLV CA GG  ++EW + +  Y  +V + + S+K GG      WYQGE D     +++ Y  N+ +   +LR DLN   LPII +
Subjt:  VIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI

AT4G34215.2 Domain of unknown function (DUF303)

9.5e-10

39.08

Show/hide

Query:  VIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI
        VIGLV CA GG  ++EW + +  Y  +V + + S+K GG      WYQGE D     +++ Y  N+ +   +LR DLN   LPII +
Subjt:  VIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGG----FFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILI

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGTTGGACCCAGAATGGCTTTTGGCCAAACTTGGCGAGAGCATCGATGTCATTGGTCTCGTTTCGTGTGCCATTGGAGGAAATCAATTGAGGGAATGGATTAAATG
TACTGTTAATTACACCATATTGGTCAACCAAATTAAAGCTTCCAAAAAACATGGAGGATTTTTCTGGTATCAAGGAGAGTTTGATGCTTCAGTGGAAGTAGAATCTAAGT
TCTACAAAGAAAACCTTACCAAATTCTTCACTGACCTGCGCAAAGACCTGAACCACCTAGATCTACCCATCATCCTGATAGTACCTCATGATATTTTCACAAGTCCAATT
ATAAACTACAAGGAAGATGTATGGAAGGCTCAGGAGGCAGTCACACACAAGCTACCGAAAGTAAGAATGGTGGACGCCATGGAAGCGGTCGACAACCTTGAGCAAAAGGT
CATCTCAATGTCAAATCTAAGGTTTATCATAGGCCTGCCGACTCCCCGACTGAAAAGAAATACTGAGATTGCCGGAACATACACTACACCACATCAGTGTGGAGAGAACT
TGGGGATCCACGAGATTCAAAGAGTTGCGGATCCAGGATTTGAAGGTTTGGCGAGTGATATCGAGGTCCGATGGCTTCCGATGGCTCTAAAACTGCAAATGTGCTTTAGA
TTATACGGCAGTTTATCAACTTACTTACTCAAGAAGGCGGAGTTGGTTGGTTTACCTTCCCATCCAGAAGCAACGACCCTGCCGAGCGAAGGTCTTGATCGCAGTTCGAA
CGACGGAAGAGGCACTGTGATTCTGACTCGCAAAGAACCGAATGGGGTCGCCGCTCCCCGTCAGATTGACGCTGATCAGCCTCCATTGTTCTTCCGCTGCCTTCTTCTTC
ATCCTGATCTCCTCCTTCTGCTTTCGCTTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGLDPEWLLAKLGESIDVIGLVSCAIGGNQLREWIKCTVNYTILVNQIKASKKHGGFFWYQGEFDASVEVESKFYKENLTKFFTDLRKDLNHLDLPIILIVPHDIFTSPI
INYKEDVWKAQEAVTHKLPKVRMVDAMEAVDNLEQKVISMSNLRFIIGLPTPRLKRNTEIAGTYTTPHQCGENLGIHEIQRVADPGFEGLASDIEVRWLPMALKLQMCFR
LYGSLSTYLLKKAELVGLPSHPEATTLPSEGLDRSSNDGRGTVILTRKEPNGVAAPRQIDADQPPLFFRCLLLHPDLLLLLSL

Sgr022152 (gene) of Monk fruit (Qingpiguo) v1 genome