; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0014372 (gene) of Snake gourd v1 genome

Gene IDTan0014372
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionAldo_ket_red domain-containing protein
Genome locationLG05:17197466..17220109
RNA-Seq ExpressionTan0014372
SyntenyTan0014372
Gene Ontology termsGO:0019853 - L-ascorbic acid biosynthetic process (biological process)
GO:0010349 - L-galactose dehydrogenase activity (molecular function)
InterPro domainsIPR020471 - Aldo-keto reductase
IPR036812 - NADP-dependent oxidoreductase domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7011583.1 L-galactose dehydrogenase, partial [Cucurbita argyrosperma subsp. argyrosperma]2.1e-2968.6Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        VVNETI ALQKL+EAGK RFIGITGL LEIFTYVLDRVPP  IDVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHCKKK K+ISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

XP_004136903.2 L-galactose dehydrogenase isoform X1 [Cucumis sativus]1.9e-3068.6Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +VNETI ALQKLKEAGKTRFIGITGL LEIFTYVLDRVPP  +DVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHC+KK KNISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

XP_022972473.1 L-galactose dehydrogenase isoform X1 [Cucurbita maxima]1.9e-3070.25Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        VVNETI ALQKLKEAGKTRFIGITGL LEIFTYVLDRVPP  IDVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHCKKK K+ISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

XP_031745184.1 L-galactose dehydrogenase isoform X2 [Cucumis sativus]1.9e-3068.6Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +VNETI ALQKLKEAGKTRFIGITGL LEIFTYVLDRVPP  +DVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHC+KK KNISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

XP_038888393.1 L-galactose dehydrogenase [Benincasa hispida]6.7e-3170.25Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +VNETI ALQKLKEAGKTRFIGITGL LEIFTYVLDRVPP  IDVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHCKKK KNISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

TrEMBL top hitse value%identityAlignment
A0A0A0K290 Aldo_ket_red domain-containing protein9.4e-3168.6Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +VNETI ALQKLKEAGKTRFIGITGL LEIFTYVLDRVPP  +DVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHC+KK KNISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

A0A1S3C0W3 L-galactose dehydrogenase3.0e-2966.12Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +VNETI ALQKLKEAGKTRF+GITGL LEIFTYVLDRVPP  IDVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAA HC+KK +NI+KLA
Subjt:  SACQAAAAHCKKKRKNISKLA

A0A5A7SPF2 L-galactose dehydrogenase3.0e-2966.12Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +VNETI ALQKLKEAGKTRF+GITGL LEIFTYVLDRVPP  IDVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAA HC+KK +NI+KLA
Subjt:  SACQAAAAHCKKKRKNISKLA

A0A6J1GJU5 L-galactose dehydrogenase1.0e-2968.6Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        VVNETI ALQKL+EAGK RFIGITGL LEIFTYVLDRVPP  IDVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHCKKK K+ISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

A0A6J1IA20 L-galactose dehydrogenase isoform X19.4e-3170.25Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        VVNETI ALQKLKEAGKTRFIGITGL LEIFTYVLDRVPP  IDVILSYCHYS+NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SACQAAAAHCKKK K+ISKLA
Subjt:  SACQAAAAHCKKKRKNISKLA

SwissProt top hitse value%identityAlignment
O81884 L-galactose dehydrogenase1.6e-2760.33Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +V+ETI ALQKLK+ GKTRFIGITGL L+IFTYVLDRVPP  +DVILSYCHY +NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SA +AA AHCK K K I+KLA
Subjt:  SACQAAAAHCKKKRKNISKLA

Arabidopsis top hitse value%identityAlignment
AT4G33670.1 NAD(P)-linked oxidoreductase superfamily protein1.1e-2860.33Show/hide
Query:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ
        +V+ETI ALQKLK+ GKTRFIGITGL L+IFTYVLDRVPP  +DVILSYCHY +NDSTLLDLLPYLK     +I  S L +                 L+
Subjt:  VVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTLLDLLPYLK-----MILFSNLKL-----------------LQ

Query:  SACQAAAAHCKKKRKNISKLA
        SA +AA AHCK K K I+KLA
Subjt:  SACQAAAAHCKKKRKNISKLA


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGTTCCCTCGCCGCGCAGAACCAACCCACCCGACTTCTTCTTCTTCTTCGTCTTCTTCGGGTTCTATCGCCAGCGACACGCCAACCAACCAGTTGTTTTCTTCTTCTC
GCGCGCCTCTAATTTCCCCATCCGTCCTCTCCGTCGACCGACCAACACGAAAGCTAACGTCTTCTTCTTCGCATTTTTGCGCAGCATAAGCCGTGGGAATCCTCGTATTT
TTCGATCGGTTTCTTCGTGTTTCGCCAACACCTCTTTCGATTCTCTTCTCTTCTTCCACCACCGTCCCTGCTCTGGCCAGCTTCCTCGCGAAATTTCAGTCCGATATATT
GTTGATTCTTCAGGGAAGATGACAGGTAAGGGTTCGTTGAACAGCTGCAGCTTTGGAGGAATTCATGTTCTCTATGATAGAGAGTTTGAAACATTTTTTAGGAATTCATA
CTCTCTCTTCACCCAGATGCACACGCAAACAAACATAGCCATCGTTGTGAACGAGACGATTCATGCACTTCAAAAGCTGAAGGAAGCTGGGAAGACTCGTTTCATTGGTA
TTACAGGACTTCTATTGGAAATTTTTACGTATGTGCTTGATCGAGTACCACCTAGCTACATTGATGTGATTCTTTCATATTGTCACTACAGTCTTAACGACTCAACATTG
TTAGATTTGCTACCTTACTTGAAGATGATATTATTCTCCAATTTAAAATTGCTACAGTCTGCATGTCAAGCTGCAGCTGCTCATTGTAAAAAGAAAAGGAAGAATATTTC
AAAGTTAGCCCCCAATGCAATCTCGTTGCAATGTCGAGCGTGCGGTGAAGCTGTATTGAAGACTACAGGCGATAGCGTTGCAACGCTATCTCGATAA
mRNA sequenceShow/hide mRNA sequence
ATGGTTCCCTCGCCGCGCAGAACCAACCCACCCGACTTCTTCTTCTTCTTCGTCTTCTTCGGGTTCTATCGCCAGCGACACGCCAACCAACCAGTTGTTTTCTTCTTCTC
GCGCGCCTCTAATTTCCCCATCCGTCCTCTCCGTCGACCGACCAACACGAAAGCTAACGTCTTCTTCTTCGCATTTTTGCGCAGCATAAGCCGTGGGAATCCTCGTATTT
TTCGATCGGTTTCTTCGTGTTTCGCCAACACCTCTTTCGATTCTCTTCTCTTCTTCCACCACCGTCCCTGCTCTGGCCAGCTTCCTCGCGAAATTTCAGTCCGATATATT
GTTGATTCTTCAGGGAAGATGACAGGTAAGGGTTCGTTGAACAGCTGCAGCTTTGGAGGAATTCATGTTCTCTATGATAGAGAGTTTGAAACATTTTTTAGGAATTCATA
CTCTCTCTTCACCCAGATGCACACGCAAACAAACATAGCCATCGTTGTGAACGAGACGATTCATGCACTTCAAAAGCTGAAGGAAGCTGGGAAGACTCGTTTCATTGGTA
TTACAGGACTTCTATTGGAAATTTTTACGTATGTGCTTGATCGAGTACCACCTAGCTACATTGATGTGATTCTTTCATATTGTCACTACAGTCTTAACGACTCAACATTG
TTAGATTTGCTACCTTACTTGAAGATGATATTATTCTCCAATTTAAAATTGCTACAGTCTGCATGTCAAGCTGCAGCTGCTCATTGTAAAAAGAAAAGGAAGAATATTTC
AAAGTTAGCCCCCAATGCAATCTCGTTGCAATGTCGAGCGTGCGGTGAAGCTGTATTGAAGACTACAGGCGATAGCGTTGCAACGCTATCTCGATAA
Protein sequenceShow/hide protein sequence
MVPSPRRTNPPDFFFFFVFFGFYRQRHANQPVVFFFSRASNFPIRPLRRPTNTKANVFFFAFLRSISRGNPRIFRSVSSCFANTSFDSLLFFHHRPCSGQLPREISVRYI
VDSSGKMTGKGSLNSCSFGGIHVLYDREFETFFRNSYSLFTQMHTQTNIAIVVNETIHALQKLKEAGKTRFIGITGLLLEIFTYVLDRVPPSYIDVILSYCHYSLNDSTL
LDLLPYLKMILFSNLKLLQSACQAAAAHCKKKRKNISKLAPNAISLQCRACGEAVLKTTGDSVATLSR