CuGenDBv2

Gene ID	Sgr019103
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Haloacid dehalogenase-like hydrolase domain-containing protein
Genome location	tig00153285:494049..505356
RNA-Seq Expression	Sgr019103
Synteny	Sgr019103
Gene Ontology terms	GO:0016787 - hydrolase activity (molecular function)
InterPro domains	IPR023198 - Phosphoglycolate phosphatase-like, domain 2 IPR023214 - HAD superfamily IPR036412 - HAD-like superfamily IPR044999 - Protein CbbY-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6581504.1 CBBY-like protein, partial [Cucurbita argyrosperma subsp. sororia]

2.6e-161

85.75

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA
        MEITSCS LYT P++RTTSCN  + +   N P +R + SSPHLSV SRS + +GKSLR+R   A S++S SN  SSQELAVLLEVEGVLVDAYRSTNRQA
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA

Query:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL
        FNEAF+KLGLDCANWTDP+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNAS ELM SQ LPLRPGVEDFIDNAY+EGIPVIIL
Subjt:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL

Query:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL
        TAYSKSGEEIARSI+NKLGPERISKVKIVGNEE R SLYS+VV GQAKHSGLDEQLAKEAMKAASAEKQ+IAEKVA+ LKLSVEINTTSSESLD II AL
Subjt:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL

Query:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        RAGAELA IPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANA+MDGFG
Subjt:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

XP_022146591.1 CBBY-like protein isoform X1 [Momordica charantia]

1.2e-163

87.15

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA
        MEITSCS LY RPL+RT +CN S SY+I NQPRSRL+ SSPHLSV SRS NF GKSLRL RL AFSS S S++DSSQELAVLLEVEGVLVDAYRSTNRQA
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA

Query:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL
        FNEAF+KLGLDCANWT+P+YSDLVRKNA+NEERMLI YFNRIGWPTSLPTNEKESFIK VL+EKKNAS ELM SQ LPLRPGVEDFIDNAYNEGIPVIIL
Subjt:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL

Query:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL
        TAYSK+GEEIARSI+NKLGPERISKVKIVGNEEAR SLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQ+IAEKVA+ LKLSVEIN TSSESL+ I  AL
Subjt:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL

Query:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        RAGAELAGIPVSNCILIAGTQ GVDGA +IGMP IVLRSSLTSRAEFPSANA+MDGFG
Subjt:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

XP_022925818.1 uncharacterized protein LOC111433112 isoform X1 [Cucurbita moschata]

4.4e-161

86.03

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA
        MEITSCS LYT P++RTTSCN  +S+   N P +R + SSPHLSV SRS + IGKSLR+R   A S++S SN  SSQELAVLLEVEGVLVDAYRSTNRQA
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA

Query:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL
        FNEAF+KLGLDCANWTDP+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNAS ELM SQ LPLRPGVEDFIDNAY+EGIPVIIL
Subjt:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL

Query:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL
        TAYSKSGEEIARSI+NKLGPERISKVKIVGNEE R SLYS+VV GQAKHSGLDEQLAKEAMKAASAEKQ+IAEKVA+ LKLSVEINTTSSESLD II AL
Subjt:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL

Query:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        RAGAELA IPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSA+A+MDGFG
Subjt:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

XP_022977624.1 uncharacterized protein LOC111477887 isoform X1 [Cucurbita maxima]

4.0e-162

86.31

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA
        MEITSCS LYT P++RTTSCN  +S+   N P +R + SSPHLSV SRS+   GKSLR+R   A S++S SN  SSQELAVLLEVEGVLVDAYRSTNRQA
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA

Query:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL
        FNEAF+KLGLDCANWTDP+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNAS ELM SQ LPLRPGVEDFIDNAYNEGIPVIIL
Subjt:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL

Query:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL
        TAYSKSGEEIARSI+NKLGPERISKVKIVGNEE R SLYS+VV GQAKHSGLDEQLAKEAMKAASAEKQ+IAEKVA+ LKLSVEINTTSSESLD II AL
Subjt:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL

Query:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        RAGAELA IPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANA+MDGFG
Subjt:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

XP_038881961.1 CBBY-like protein isoform X1 [Benincasa hispida]

6.4e-160

85.24

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLY-SSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQ
        ME+TS S+L+T P++RTT+CN S+S VI  QP SR Y SSSP LSV S++YNF GKSLR+ RLTAFSSSS SN DS+QELAVLLEVEGVLVDAYRSTNRQ
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLY-SSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQ

Query:  AFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVII
        AFNEAF+KLGLDCANWT+P+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKK AS ELM SQ LPLRPGVEDFIDNAYNEGIPVII
Subjt:  AFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVII

Query:  LTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRA
        LTAYSKSGEEIARSI+ KLGPERISKVKIVGNEE R SLYS+ V GQAK SGL+E+LAKEAMKAASAEKQ+IA+KVA+ LKLSVEINTTSSESLD II A
Subjt:  LTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRA

Query:  LRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        LRAGAELA  PVSNCILIAGTQSG+DGAERIGMPRIVLRSSLTSRAEFPSANA+MDGFG
Subjt:  LRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KJ23 Uncharacterized protein

9.3e-157

84.12

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFI-GKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQ
        MEIT  S+LYT P++RTT+CN S+S+ I     SR Y SSP LSV SRSYNFI   SLR+RRLTAFSSSS SN DS QELAVLLEVEGVLVDAYRSTNRQ
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFI-GKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQ

Query:  AFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVII
        AFNEAF+KLGLDCANWT+P+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREK  AS ELM SQ LPLRPGVEDFIDNA+NEGIPVII
Subjt:  AFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVII

Query:  LTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRA
        LTAYSKSGEEIARSI+NKLGPERISKVKIVGNEE R SLYS+ V GQAK SGL+E+LAKEAMKAASAEKQ+IA+KVA+ LKLSVEINTTSSESLD II A
Subjt:  LTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRA

Query:  LRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        LRAG+ELAG PVSNCIL+AGTQSG+DGAERIGMPRIV+RSSLTSRAEFPSANA+MDGFG
Subjt:  LRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

A0A5A7UG24 Haloacid dehalogenase-like hydrolase domain-containing protein

1.3e-155

82.73

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFI-GKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQ
        MEIT  S+LYT P++RTT+CN S+S+ I     S  Y SSP LSV  RSYNFI   SLR+RRLTAFSSSS SN DS QELAVLLEVEGVLVDAYRSTNRQ
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFI-GKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQ

Query:  AFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVII
        AFNEAF+KLGLDCANWT+P+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKK AS ELM SQ LPLRPGVEDFID+A+NEGIPV+I
Subjt:  AFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVII

Query:  LTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRA
        LTAYSKSGEEIARSI+NKLGPERISKVKIVGNEE R SLYS+ V  QA  SGL+E+LAKEAMKAASAEKQ+IA+KVA+ LKLSVEINTTSSESLD II A
Subjt:  LTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRA

Query:  LRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        LRAG+ELAG PVSNCIL+AGTQSG+DGAERIGMPR+VLRSSLTSRAEFPSANA+MDGFG
Subjt:  LRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

A0A6J1CZU3 CBBY-like protein isoform X1

6.0e-164

87.15

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA
        MEITSCS LY RPL+RT +CN S SY+I NQPRSRL+ SSPHLSV SRS NF GKSLRL RL AFSS S S++DSSQELAVLLEVEGVLVDAYRSTNRQA
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA

Query:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL
        FNEAF+KLGLDCANWT+P+YSDLVRKNA+NEERMLI YFNRIGWPTSLPTNEKESFIK VL+EKKNAS ELM SQ LPLRPGVEDFIDNAYNEGIPVIIL
Subjt:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL

Query:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL
        TAYSK+GEEIARSI+NKLGPERISKVKIVGNEEAR SLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQ+IAEKVA+ LKLSVEIN TSSESL+ I  AL
Subjt:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL

Query:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        RAGAELAGIPVSNCILIAGTQ GVDGA +IGMP IVLRSSLTSRAEFPSANA+MDGFG
Subjt:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

A0A6J1EGB6 uncharacterized protein LOC111433112 isoform X1

2.1e-161

86.03

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA
        MEITSCS LYT P++RTTSCN  +S+   N P +R + SSPHLSV SRS + IGKSLR+R   A S++S SN  SSQELAVLLEVEGVLVDAYRSTNRQA
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA

Query:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL
        FNEAF+KLGLDCANWTDP+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNAS ELM SQ LPLRPGVEDFIDNAY+EGIPVIIL
Subjt:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL

Query:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL
        TAYSKSGEEIARSI+NKLGPERISKVKIVGNEE R SLYS+VV GQAKHSGLDEQLAKEAMKAASAEKQ+IAEKVA+ LKLSVEINTTSSESLD II AL
Subjt:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL

Query:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        RAGAELA IPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSA+A+MDGFG
Subjt:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

A0A6J1IRX3 uncharacterized protein LOC111477887 isoform X1

1.9e-162

86.31

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA
        MEITSCS LYT P++RTTSCN  +S+   N P +R + SSPHLSV SRS+   GKSLR+R   A S++S SN  SSQELAVLLEVEGVLVDAYRSTNRQA
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQA

Query:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL
        FNEAF+KLGLDCANWTDP+YSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNAS ELM SQ LPLRPGVEDFIDNAYNEGIPVIIL
Subjt:  FNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIIL

Query:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL
        TAYSKSGEEIARSI+NKLGPERISKVKIVGNEE R SLYS+VV GQAKHSGLDEQLAKEAMKAASAEKQ+IAEKVA+ LKLSVEINTTSSESLD II AL
Subjt:  TAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRAL

Query:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
        RAGAELA IPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANA+MDGFG
Subjt:  RAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

SwissProt top hits

e value

%identity

Alignment

O33513 Protein CbbY

1.1e-05

27.17

Show/hide

Query:  AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPL
        A++ +V+G L +     +RQAFNE F   GLD   W+   Y  L+R     +ERM     N       L +   ++ I  + + K    VE++ S ++ L
Subjt:  AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPL

Query:  RPGVEDFIDNAYNEGIPVIILTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGL
         PGV + ID A   G+ + I T  +++  +   +         I +V   G+E A+      V L   +  GL
Subjt:  RPGVEDFIDNAYNEGIPVIILTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGL

P40119 Protein CbbY, chromosomal

1.7e-09

36.07

Show/hide

Query:  AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPL
        A++ +V+G L D   S + QAFN AF ++GLD   W  P+Y+ L+ K A  +ER  +M++ R+  P      + +  I +V   K     E +G+  LPL
Subjt:  AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPL

Query:  RPGVEDFIDNAYNEGIPVIILT
        RPG+   ID A   G+P+ I T
Subjt:  RPGVEDFIDNAYNEGIPVIILT

Q94K71 CBBY-like protein

9.4e-21

28.37

Show/hide

Query:  SCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSS-GSNIDSSQEL-----AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDC
        S +SS S +      S + +++P  +V  R   F GKSLR + +   SS S G    +S  L     A+L + +GVLVD  +  +R +FN+ F++  L+ 
Subjt:  SCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSS-GSNIDSSQEL-----AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDC

Query:  ANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKE--SFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIILTAYSKSGEEI
          W   +Y +L+ K    +ERM   YFN++GWP   P +E E   FI  + ++K    + L+  + LPLRPGV   +D A   G+ V +    S S E+ 
Subjt:  ANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKE--SFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIILTAYSKSGEEI

Query:  ARSIVN-KLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRALRAGAELAGI
          +IV+  LGPER  K+KI   +          V+ + K       LA                                              AE  G+
Subjt:  ARSIVN-KLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRALRAGAELAGI

Query:  PVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
          S C+++  +  G+  A+  GM  IV +S  T+  +F +A+AV D  G
Subjt:  PVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

Arabidopsis top hits

e value

%identity

Alignment

AT2G01640.1 unknown protein

9.9e-26

51.45

Show/hide

Query:  RSVDRSFRFEPQSWRTIAALNAQKTISKKKKLRSRKKQLKAFDLSTLSEFLPGLEA-PKQKSSAAELKVNCKSRLKFILKERKQLDTVLTHPAFQEDPLR
        +  ++  +F  +   T+ +L+ QK I KKKK+RSR+K+LKA+DL+ LSEFLP   A  K    A ELK+NCK R K +L E ++L+ VL HPAFQ DP+ 
Subjt:  RSVDRSFRFEPQSWRTIAALNAQKTISKKKKLRSRKKQLKAFDLSTLSEFLPGLEA-PKQKSSAAELKVNCKSRLKFILKERKQLDTVLTHPAFQEDPLR

Query:  AIHRHLESTQ-PVEEPKKKKTNKNGSKKRKEKKSKASA
        +I +HL S Q PVEE  KKKTN NGSKKR +KK K  +
Subjt:  AIHRHLESTQ-PVEEPKKKKTNKNGSKKRKEKKSKASA

AT2G01640.2 unknown protein

9.9e-26

51.45

Show/hide

Query:  RSVDRSFRFEPQSWRTIAALNAQKTISKKKKLRSRKKQLKAFDLSTLSEFLPGLEA-PKQKSSAAELKVNCKSRLKFILKERKQLDTVLTHPAFQEDPLR
        +  ++  +F  +   T+ +L+ QK I KKKK+RSR+K+LKA+DL+ LSEFLP   A  K    A ELK+NCK R K +L E ++L+ VL HPAFQ DP+ 
Subjt:  RSVDRSFRFEPQSWRTIAALNAQKTISKKKKLRSRKKQLKAFDLSTLSEFLPGLEA-PKQKSSAAELKVNCKSRLKFILKERKQLDTVLTHPAFQEDPLR

Query:  AIHRHLESTQ-PVEEPKKKKTNKNGSKKRKEKKSKASA
        +I +HL S Q PVEE  KKKTN NGSKKR +KK K  +
Subjt:  AIHRHLESTQ-PVEEPKKKKTNKNGSKKRKEKKSKASA

AT3G48420.1 Haloacid dehalogenase-like hydrolase (HAD) superfamily protein

6.6e-22

28.37

Show/hide

Query:  SCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSS-GSNIDSSQEL-----AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDC
        S +SS S +      S + +++P  +V  R   F GKSLR + +   SS S G    +S  L     A+L + +GVLVD  +  +R +FN+ F++  L+ 
Subjt:  SCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSS-GSNIDSSQEL-----AVLLEVEGVLVDAYRSTNRQAFNEAFQKLGLDC

Query:  ANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKE--SFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIILTAYSKSGEEI
          W   +Y +L+ K    +ERM   YFN++GWP   P +E E   FI  + ++K    + L+  + LPLRPGV   +D A   G+ V +    S S E+ 
Subjt:  ANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKE--SFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIILTAYSKSGEEI

Query:  ARSIVN-KLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRALRAGAELAGI
          +IV+  LGPER  K+KI   +          V+ + K       LA                                              AE  G+
Subjt:  ARSIVN-KLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRALRAGAELAGI

Query:  PVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG
          S C+++  +  G+  A+  GM  IV +S  T+  +F +A+AV D  G
Subjt:  PVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFG

AT5G45170.1 Haloacid dehalogenase-like hydrolase (HAD) superfamily protein

5.3e-104

54.26

Show/hide

Query:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSS----PHLSVSSRSYNFIGKSLRLRRLTAFS-SSSGSNIDSSQELAVLLEVEGVLVDAYRS
        MEI SCS+L    +    SC  +  +  +   RS   +      P  +   +S   +GK LRL+R ++   S+S  +++ S+E AV+LEV+ V++D + S
Subjt:  MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSS----PHLSVSSRSYNFIGKSLRLRRLTAFS-SSSGSNIDSSQELAVLLEVEGVLVDAYRS

Query:  TNRQAFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGI
        +NRQAFN AFQKLGLDCANW +P+YSDL+RK AA+EE+ML++YFN+IGWP+SLPT+EK SF+KSVLREKKNA  E + S+ LPLR GV++FIDNAY E +
Subjt:  TNRQAFNEAFQKLGLDCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGI

Query:  PVIILTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDN
        PV I+TAY KSG+++A SIV  LG ER+  VK++G+ E   S+Y Q+VLG+   S L+EQL KE  KAASAEKQ+IAE+VA++LKLSV+I+TTSSE L+ 
Subjt:  PVIILTAYSKSGEEIARSIVNKLGPERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDN

Query:  IIRALRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFGFSQTLRAKAGNQV
        I+ ALRA AE  G+PV+NC+L+AG+Q GV  A+ IGMP +V+RSSLT+R EFPSA  VMDGFG +     K  N++
Subjt:  IIRALRAGAELAGIPVSNCILIAGTQSGVDGAERIGMPRIVLRSSLTSRAEFPSANAVMDGFGFSQTLRAKAGNQV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAATAACTTCCTGCTCAATGCTATATACTCGTCCTTTGCAAAGAACCACAAGTTGCAACTCCTCCCACTCCTACGTGATATTTAATCAGCCAAGAAGCAGACTCTA
TTCGTCTTCTCCACATCTTTCTGTATCATCGAGAAGCTATAATTTCATTGGAAAGAGTTTACGCCTCAGAAGATTGACTGCTTTCAGCAGTTCCAGCGGTTCCAACATCG
ACTCATCCCAAGAACTCGCAGTTCTTCTTGAAGTTGAAGGAGTCCTCGTGGATGCATATCGCTCAACTAATCGACAAGCTTTCAATGAGGCATTTCAAAAGCTTGGACTT
GACTGTGCAAATTGGACTGATCCTATATATTCAGACCTTGTCAGGAAGAATGCTGCTAATGAGGAACGGATGCTAATTATGTATTTCAACCGTATTGGTTGGCCAACTTC
ACTGCCAACAAATGAGAAGGAATCATTTATTAAAAGTGTTCTGCGAGAAAAGAAAAATGCATCAGTTGAATTGATGGGCTCACAAAGGTTACCTTTACGGCCTGGAGTTG
AAGATTTCATTGACAATGCATATAATGAAGGAATACCTGTGATTATTCTCACAGCCTACAGCAAAAGTGGAGAAGAAATTGCTAGATCTATCGTTAATAAGCTTGGACCT
GAGAGAATATCCAAAGTAAAGATTGTTGGGAATGAGGAGGCAAGACTGAGTTTATATAGCCAAGTTGTGCTTGGTCAAGCAAAGCATTCAGGTTTGGATGAGCAACTAGC
TAAGGAAGCAATGAAAGCAGCCTCTGCCGAGAAACAAAAGATAGCTGAAAAGGTTGCAGCAGTGCTGAAGTTGAGTGTGGAAATTAATACTACCTCATCTGAAAGTTTGG
ACAATATCATACGTGCATTGCGTGCTGGAGCAGAGCTTGCAGGCATACCTGTTTCCAATTGCATCCTTATTGCAGGAACCCAATCTGGGGTTGATGGAGCTGAGCGAATA
GGGATGCCACGTATTGTACTACGTAGTAGTTTGACATCAAGAGCTGAGTTCCCTTCAGCAAATGCTGTCATGGATGGCTTTGGATTTTCTCAGACTCTGAGAGCGAAGGC
TGGGAACCAGGTATGCCATTGGTCTGCGAACAACCGAGTAAAACTGGAACTGGAGGTTTTCGTAAACCTTATTGTTTTTTTTTTCTTTTCTTTTTTTCGATCTGTGGACA
GAAGTTTCCGATTTGAGCCACAGAGTTGGAGAACTATTGCTGCCTTAAATGCTCAAAAGACTATTTCTAAGAAGAAAAAACTGCGAAGTCGAAAAAAGCAGTTAAAAGCT
TTCGATCTTTCTACTCTATCAGAGTTTCTTCCTGGATTGGAGGCTCCTAAACAAAAATCTTCCGCAGCCGAGTTAAAAGTAAATTGCAAGTCTAGGCTGAAGTTTATATT
GAAGGAAAGAAAGCAACTGGATACAGTTCTTACTCACCCTGCATTCCAGGAAGACCCCTTGAGAGCTATTCATCGACATTTAGAGAGCACCCAACCAGTTGAGGAACCGA
AGAAAAAGAAGACGAACAAAAATGGGAGCAAGAAGAGGAAAGAGAAAAAGTCGAAAGCCTCTGCAAGACCTTCATCTATGGAGACGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MEITSCSMLYTRPLQRTTSCNSSHSYVIFNQPRSRLYSSSPHLSVSSRSYNFIGKSLRLRRLTAFSSSSGSNIDSSQELAVLLEVEGVLVDAYRSTNRQAFNEAFQKLGL
DCANWTDPIYSDLVRKNAANEERMLIMYFNRIGWPTSLPTNEKESFIKSVLREKKNASVELMGSQRLPLRPGVEDFIDNAYNEGIPVIILTAYSKSGEEIARSIVNKLGP
ERISKVKIVGNEEARLSLYSQVVLGQAKHSGLDEQLAKEAMKAASAEKQKIAEKVAAVLKLSVEINTTSSESLDNIIRALRAGAELAGIPVSNCILIAGTQSGVDGAERI
GMPRIVLRSSLTSRAEFPSANAVMDGFGFSQTLRAKAGNQVCHWSANNRVKLELEVFVNLIVFFFFSFFRSVDRSFRFEPQSWRTIAALNAQKTISKKKKLRSRKKQLKA
FDLSTLSEFLPGLEAPKQKSSAAELKVNCKSRLKFILKERKQLDTVLTHPAFQEDPLRAIHRHLESTQPVEEPKKKKTNKNGSKKRKEKKSKASARPSSMET

Sgr019103 (gene) of Monk fruit (Qingpiguo) v1 genome