CuGenDBv2

Gene ID	Tan0000543
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Domain of unknown function (DUF303)
Genome location	LG02:82620979..82621683
RNA-Seq Expression	Tan0000543
Synteny	Tan0000543
Gene Ontology terms	NA
InterPro domains	IPR005181 - Sialate O-acetylesterase domain IPR036514 - SGNH hydrolase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6585833.1 Carbohydrate esterase, partial [Cucurbita argyrosperma subsp. sororia]

1.1e-84

80.98

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++ Q G+L+WDG VP ECQ DPSI+RLNPERQWE+A EPLH GIDIG   G+G GIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFM+HDTH+L AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_023002177.1 probable carbohydrate esterase At4g34215 [Cucurbita maxima]

3.5e-86

82.07

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_023002892.1 probable carbohydrate esterase At4g34215 [Cucurbita maxima]

3.5e-86

82.07

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_023537922.1 probable carbohydrate esterase At4g34215 [Cucurbita pepo subsp. pepo]

1.3e-85

80.98

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++NQ G+L+WDG VP ECQ DPSI+RLNPERQWE+A EPLH GIDI    G+GPGIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYKDNLKKFITDIRNDIKPRFLPVI+VKIALYDFFM+HDTH+L AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_038886442.1 probable carbohydrate esterase At4g34215 [Benincasa hispida]

5.0e-85

79.89

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ  +L WDG +PPECQ DPSI+RLNP  QWE+AREPLHEGIDI K  G+GPG+PFAHQL  K G + G VGLVPCARGGT+I+QWIKNP+NPDATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        Y+NFIERIKASDKEGGVVRALFWFQGESDAAMSDTA+RYKDNLK F TDIRNDIKPRFLP+I+VKIALYDF M+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

TrEMBL top hits

e value

%identity

Alignment

A0A6J1BQ38 probable carbohydrate esterase At4g34215

2.0e-84

79.89

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++N+TG L WDGYVPPE QPDPSI+RLNPERQWE+AREP+H GIDIGK  GVGP I FAHQLQAK G KVG VGLVPCARGGT+I+QW+KNP+NP+ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        Y+NFIERI+ASD+EGGVVRALFW QGESDAA SDTA RYK+NLKKF TDIRNDIKPR LP+I+VKIA+YD FM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1GK48 probable carbohydrate esterase At4g34215

1.6e-84

80.43

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++ Q G+L+WDG VP ECQ DPSI+RLNPERQWE+A EPLH GIDIG   G+G GIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYK+NLKKFITDIRNDIKPRFLPVIIVKIALYDFFM+HDTH+L AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1I774 probable carbohydrate esterase At4g34215

9.2e-85

80.11

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIG--KATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDA
        V++  TG+L+WDG VP ECQ DPSI+R NPERQWE+A EPLH GID+G  K  G+GPGIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP A
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIG--KATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDA

Query:  TFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        TFYQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFM+HDTH+L AVR
Subjt:  TFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1KIR8 probable carbohydrate esterase At4g34215

1.7e-86

82.07

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1KKV2 probable carbohydrate esterase At4g34215

1.7e-86

82.07

Show/hide

Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

SwissProt top hits

e value

%identity

Alignment

Q8L9J9 Probable carbohydrate esterase At4g34215

4.6e-33

40.57

Show/hide

Query:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN
        + H  +RWV         WD  +PPEC P+ SI+RL+ + +WE A EPLH  ID GK  GVGPG+ FA+ ++ +      V+GLVPCA GGT IK+W + 
Subjt:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN

Query:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
         +      Y+  ++R + S K GG ++A+ W+QGESD      A  Y +N+ + I ++R+D+    LP+I V IA
Subjt:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA

Arabidopsis top hits

e value

%identity

Alignment

AT3G53010.1 Domain of unknown function (DUF303)

3.0e-35

44.05

Show/hide

Query:  DENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATFY
        ++  T   +WDG +PPEC+ +PSI+RL  + +W+ A+EPLH  IDI K  GVGPG+PFA+++      + G VGLVPC+ GGT + QW K         Y
Subjt:  DENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATFY

Query:  QNFIERIKA--SDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
        +  ++R KA  +   GG  RA+ W+QGESD      AS YK  L KF +D+RND++   LP+I V +A
Subjt:  QNFIERIKA--SDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA

AT4G34215.1 Domain of unknown function (DUF303)

3.3e-34

40.57

Show/hide

Query:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN
        + H  +RWV         WD  +PPEC P+ SI+RL+ + +WE A EPLH  ID GK  GVGPG+ FA+ ++ +      V+GLVPCA GGT IK+W + 
Subjt:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN

Query:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
         +      Y+  ++R + S K GG ++A+ W+QGESD      A  Y +N+ + I ++R+D+    LP+I V IA
Subjt:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA

AT4G34215.2 Domain of unknown function (DUF303)

3.3e-34

40.57

Show/hide

Query:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN
        + H  +RWV         WD  +PPEC P+ SI+RL+ + +WE A EPLH  ID GK  GVGPG+ FA+ ++ +      V+GLVPCA GGT IK+W + 
Subjt:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN

Query:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
         +      Y+  ++R + S K GG ++A+ W+QGESD      A  Y +N+ + I ++R+D+    LP+I V IA
Subjt:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTACGATGTTATTTGGCTCTTCCCTTTCAAGGGCTACTTCTCCTACAAACATATTCATCCTTGCCGGTCAGAGCAACATGGCTGGTCGAGGTGGGTTGATGAAAATCA
AACGGGACAACTTATGTGGGATGGGTATGTGCCACCAGAGTGTCAACCCGACCCATCCATTGTACGATTGAACCCTGAGCGCCAATGGGAGCTAGCACGAGAGCCTCTCC
ACGAGGGAATTGATATCGGCAAGGCCACTGGGGTTGGTCCGGGAATACCATTTGCTCACCAACTACAAGCGAAAGCCGGGAAAAAGGTAGGTGTCGTGGGTTTAGTTCCT
TGTGCTAGAGGTGGCACTGTAATCAAACAATGGATTAAAAATCCTAACAATCCTGATGCAACGTTTTACCAAAATTTCATTGAACGAATCAAAGCATCAGATAAAGAAGG
TGGGGTTGTACGCGCTCTTTTCTGGTTTCAAGGGGAAAGTGATGCTGCTATGAGTGACACTGCTAGTAGATACAAAGACAACCTAAAGAAGTTCATTACCGACATCCGCA
ATGATATAAAGCCTAGATTTTTACCTGTCATTATTGTTAAGATAGCCCTCTATGACTTTTTTATGCAACATGATACGCATGATTTGGCAGCAGTGAGGCGGCCGAAGATG
CAGTCCAACAAGAGCTGCCAGACATCGTTACAATCGACTCCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MYDVIWLFPFKGYFSYKHIHPCRSEQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVP
CARGGTVIKQWIKNPNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVRRPKM
QSNKSCQTSLQSTP

Tan0000543 (gene) of Snake gourd v1 genome