; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0000543 (gene) of Snake gourd v1 genome

Gene IDTan0000543
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionDomain of unknown function (DUF303)
Genome locationLG02:82620979..82621683
RNA-Seq ExpressionTan0000543
SyntenyTan0000543
Gene Ontology termsNA
InterPro domainsIPR005181 - Sialate O-acetylesterase domain
IPR036514 - SGNH hydrolase superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6585833.1 Carbohydrate esterase, partial [Cucurbita argyrosperma subsp. sororia]1.1e-8480.98Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++ Q G+L+WDG VP ECQ DPSI+RLNPERQWE+A EPLH GIDIG   G+G GIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFM+HDTH+L AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_023002177.1 probable carbohydrate esterase At4g34215 [Cucurbita maxima]3.5e-8682.07Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_023002892.1 probable carbohydrate esterase At4g34215 [Cucurbita maxima]3.5e-8682.07Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_023537922.1 probable carbohydrate esterase At4g34215 [Cucurbita pepo subsp. pepo]1.3e-8580.98Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++NQ G+L+WDG VP ECQ DPSI+RLNPERQWE+A EPLH GIDI    G+GPGIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYKDNLKKFITDIRNDIKPRFLPVI+VKIALYDFFM+HDTH+L AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

XP_038886442.1 probable carbohydrate esterase At4g34215 [Benincasa hispida]5.0e-8579.89Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ  +L WDG +PPECQ DPSI+RLNP  QWE+AREPLHEGIDI K  G+GPG+PFAHQL  K G + G VGLVPCARGGT+I+QWIKNP+NPDATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        Y+NFIERIKASDKEGGVVRALFWFQGESDAAMSDTA+RYKDNLK F TDIRNDIKPRFLP+I+VKIALYDF M+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

TrEMBL top hitse value%identityAlignment
A0A6J1BQ38 probable carbohydrate esterase At4g342152.0e-8479.89Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++N+TG L WDGYVPPE QPDPSI+RLNPERQWE+AREP+H GIDIGK  GVGP I FAHQLQAK G KVG VGLVPCARGGT+I+QW+KNP+NP+ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        Y+NFIERI+ASD+EGGVVRALFW QGESDAA SDTA RYK+NLKKF TDIRNDIKPR LP+I+VKIA+YD FM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1GK48 probable carbohydrate esterase At4g342151.6e-8480.43Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V++ Q G+L+WDG VP ECQ DPSI+RLNPERQWE+A EPLH GIDIG   G+G GIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYK+NLKKFITDIRNDIKPRFLPVIIVKIALYDFFM+HDTH+L AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1I774 probable carbohydrate esterase At4g342159.2e-8580.11Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIG--KATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDA
        V++  TG+L+WDG VP ECQ DPSI+R NPERQWE+A EPLH GID+G  K  G+GPGIPFAHQL+ KAG+K G+VGLVPCARGGT+I+QWIKNP+NP A
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIG--KATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDA

Query:  TFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        TFYQNFIERIK S+KEGGVVRALFW+QGESDAAM+DTA RYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFM+HDTH+L AVR
Subjt:  TFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1KIR8 probable carbohydrate esterase At4g342151.7e-8682.07Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

A0A6J1KKV2 probable carbohydrate esterase At4g342151.7e-8682.07Show/hide
Query:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF
        V+ NQ G+L WDG VP ECQ DPSI+RLNP RQWE+A+EPLH GIDIGK  G+GPGIPFAHQ +AKAG+K G+VGLVPCARGGT+I+QWIKNP+NP ATF
Subjt:  VDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATF

Query:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR
        YQNFIERIK S+KEGGVVRALFW+QGESDAAMSDTA RYKDNLKKFITDIRNDIKPRFLPVIIVKI++YDFFM+HDTHDL AVR
Subjt:  YQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVR

SwissProt top hitse value%identityAlignment
Q8L9J9 Probable carbohydrate esterase At4g342154.6e-3340.57Show/hide
Query:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN
        + H  +RWV         WD  +PPEC P+ SI+RL+ + +WE A EPLH  ID GK  GVGPG+ FA+ ++ +      V+GLVPCA GGT IK+W + 
Subjt:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN

Query:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
         +      Y+  ++R + S K GG ++A+ W+QGESD      A  Y +N+ + I ++R+D+    LP+I V IA
Subjt:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA

Arabidopsis top hitse value%identityAlignment
AT3G53010.1 Domain of unknown function (DUF303)3.0e-3544.05Show/hide
Query:  DENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATFY
        ++  T   +WDG +PPEC+ +PSI+RL  + +W+ A+EPLH  IDI K  GVGPG+PFA+++      + G VGLVPC+ GGT + QW K         Y
Subjt:  DENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKNPNNPDATFY

Query:  QNFIERIKA--SDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
        +  ++R KA  +   GG  RA+ W+QGESD      AS YK  L KF +D+RND++   LP+I V +A
Subjt:  QNFIERIKA--SDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA

AT4G34215.1 Domain of unknown function (DUF303)3.3e-3440.57Show/hide
Query:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN
        + H  +RWV         WD  +PPEC P+ SI+RL+ + +WE A EPLH  ID GK  GVGPG+ FA+ ++ +      V+GLVPCA GGT IK+W + 
Subjt:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN

Query:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
         +      Y+  ++R + S K GG ++A+ W+QGESD      A  Y +N+ + I ++R+D+    LP+I V IA
Subjt:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA

AT4G34215.2 Domain of unknown function (DUF303)3.3e-3440.57Show/hide
Query:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN
        + H  +RWV         WD  +PPEC P+ SI+RL+ + +WE A EPLH  ID GK  GVGPG+ FA+ ++ +      V+GLVPCA GGT IK+W + 
Subjt:  EQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVPCARGGTVIKQWIKN

Query:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA
         +      Y+  ++R + S K GG ++A+ W+QGESD      A  Y +N+ + I ++R+D+    LP+I V IA
Subjt:  PNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIA


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTACGATGTTATTTGGCTCTTCCCTTTCAAGGGCTACTTCTCCTACAAACATATTCATCCTTGCCGGTCAGAGCAACATGGCTGGTCGAGGTGGGTTGATGAAAATCA
AACGGGACAACTTATGTGGGATGGGTATGTGCCACCAGAGTGTCAACCCGACCCATCCATTGTACGATTGAACCCTGAGCGCCAATGGGAGCTAGCACGAGAGCCTCTCC
ACGAGGGAATTGATATCGGCAAGGCCACTGGGGTTGGTCCGGGAATACCATTTGCTCACCAACTACAAGCGAAAGCCGGGAAAAAGGTAGGTGTCGTGGGTTTAGTTCCT
TGTGCTAGAGGTGGCACTGTAATCAAACAATGGATTAAAAATCCTAACAATCCTGATGCAACGTTTTACCAAAATTTCATTGAACGAATCAAAGCATCAGATAAAGAAGG
TGGGGTTGTACGCGCTCTTTTCTGGTTTCAAGGGGAAAGTGATGCTGCTATGAGTGACACTGCTAGTAGATACAAAGACAACCTAAAGAAGTTCATTACCGACATCCGCA
ATGATATAAAGCCTAGATTTTTACCTGTCATTATTGTTAAGATAGCCCTCTATGACTTTTTTATGCAACATGATACGCATGATTTGGCAGCAGTGAGGCGGCCGAAGATG
CAGTCCAACAAGAGCTGCCAGACATCGTTACAATCGACTCCTTGA
mRNA sequenceShow/hide mRNA sequence
ATGTACGATGTTATTTGGCTCTTCCCTTTCAAGGGCTACTTCTCCTACAAACATATTCATCCTTGCCGGTCAGAGCAACATGGCTGGTCGAGGTGGGTTGATGAAAATCA
AACGGGACAACTTATGTGGGATGGGTATGTGCCACCAGAGTGTCAACCCGACCCATCCATTGTACGATTGAACCCTGAGCGCCAATGGGAGCTAGCACGAGAGCCTCTCC
ACGAGGGAATTGATATCGGCAAGGCCACTGGGGTTGGTCCGGGAATACCATTTGCTCACCAACTACAAGCGAAAGCCGGGAAAAAGGTAGGTGTCGTGGGTTTAGTTCCT
TGTGCTAGAGGTGGCACTGTAATCAAACAATGGATTAAAAATCCTAACAATCCTGATGCAACGTTTTACCAAAATTTCATTGAACGAATCAAAGCATCAGATAAAGAAGG
TGGGGTTGTACGCGCTCTTTTCTGGTTTCAAGGGGAAAGTGATGCTGCTATGAGTGACACTGCTAGTAGATACAAAGACAACCTAAAGAAGTTCATTACCGACATCCGCA
ATGATATAAAGCCTAGATTTTTACCTGTCATTATTGTTAAGATAGCCCTCTATGACTTTTTTATGCAACATGATACGCATGATTTGGCAGCAGTGAGGCGGCCGAAGATG
CAGTCCAACAAGAGCTGCCAGACATCGTTACAATCGACTCCTTGA
Protein sequenceShow/hide protein sequence
MYDVIWLFPFKGYFSYKHIHPCRSEQHGWSRWVDENQTGQLMWDGYVPPECQPDPSIVRLNPERQWELAREPLHEGIDIGKATGVGPGIPFAHQLQAKAGKKVGVVGLVP
CARGGTVIKQWIKNPNNPDATFYQNFIERIKASDKEGGVVRALFWFQGESDAAMSDTASRYKDNLKKFITDIRNDIKPRFLPVIIVKIALYDFFMQHDTHDLAAVRRPKM
QSNKSCQTSLQSTP