; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0000842 (gene) of Snake gourd v1 genome

Gene IDTan0000842
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionCupin_3 domain-containing protein
Genome locationLG02:3209011..3209445
RNA-Seq ExpressionTan0000842
SyntenyTan0000842
Gene Ontology termsNA
InterPro domainsIPR008579 - (S)-ureidoglycine aminohydrolase, cupin-3 domain
IPR011051 - RmlC-like cupin domain superfamily
IPR014710 - RmlC-like jelly roll fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0040221.1 RmlC-like cupins superfamily protein [Cucumis melo var. makuwa]2.5e-7193.62Show/hide
Query:  MLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS
        MLAAPTMASFHVNIG+KNY+ LNSTIKGSH I+AMRIEKPLEELYNV+VERKVSEERLSQLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS
Subjt:  MLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS

Query:  KQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        KQYMSF+AGDLVRYPKWFEADLFFNGPYQERYSFRAYGDD+
Subjt:  KQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

KAG6589149.1 hypothetical protein SDJN03_17714, partial [Cucurbita argyrosperma subsp. sororia]2.8e-7091.67Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMA+F VNIG+KN++ LNSTIKGS KI+AMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPYQERY F+AYGDDY
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

KAG7022849.1 hypothetical protein SDJN02_16585, partial [Cucurbita argyrosperma subsp. argyrosperma]2.8e-7091.67Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMA+F VNIG+KN++ LNSTIKGS KI+AMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPYQERY F+AYGDDY
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

XP_008455463.1 PREDICTED: uncharacterized protein LOC103495620 [Cucumis melo]1.9e-7192.36Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMASFHVNIG+KNY+ LNSTIKGSH I+AMRIEKPLEELYNV+VERKVSEERLSQLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPY ERYSFRAYGDD+
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

XP_023530936.1 uncharacterized protein LOC111793329 [Cucurbita pepo subsp. pepo]3.6e-7090.97Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMA+F VNIG+KN++ LNSTIKGS KI+AMRIEKPLEELYNVRVERKVSEERLSQLG+SRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPYQERY F+AYGDDY
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

TrEMBL top hitse value%identityAlignment
A0A0A0K6T4 Cupin_3 domain-containing protein1.4e-6486.11Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMASFHV+IG+KNY  L      SH ++AMRIEKPLEELYNV+VERKVSEERLSQL VS WS WKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPYQERYSFRAYGDD+
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

A0A1S3C0I6 uncharacterized protein LOC1034956209.3e-7292.36Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMASFHVNIG+KNY+ LNSTIKGSH I+AMRIEKPLEELYNV+VERKVSEERLSQLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPY ERYSFRAYGDD+
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

A0A5D3C5M8 RmlC-like cupins superfamily protein1.2e-7193.62Show/hide
Query:  MLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS
        MLAAPTMASFHVNIG+KNY+ LNSTIKGSH I+AMRIEKPLEELYNV+VERKVSEERLSQLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS
Subjt:  MLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS

Query:  KQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        KQYMSF+AGDLVRYPKWFEADLFFNGPYQERYSFRAYGDD+
Subjt:  KQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

A0A6J1EXN3 uncharacterized protein LOC1114371276.7e-7090.97Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMA+F VNIG+KN++  NSTIKGS KI+AMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPYQERY F+AYGDDY
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

A0A6J1JN52 uncharacterized protein LOC1114861925.7e-6989.58Show/hide
Query:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
        M SMLAAPTMA+F VNIG+KN++  NSTIKGS KI+AM IEKPLEELYNVRVER+VSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP
Subjt:  MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVP

Query:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY
        EGSKQYMSF+AGDLVRYPKWFEADLFFNGPYQERY F+AYGDDY
Subjt:  EGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT2G32180.1 plastid transcriptionally active 188.1e-5275.42Show/hide
Query:  NSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADL
        N +++ + ++  M+ EKPLEELYNV+VERKVS++RL +LGVSRWS WKTGKCKLPWDWQ DQLVYIE+GEVRVVPEGSK+YM F+AGDLVRYPKW EADL
Subjt:  NSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADL

Query:  FFNGPYQERYSFRAYGDD
        FFN PY ERY F+AYGDD
Subjt:  FFNGPYQERYSFRAYGDD

AT2G32650.1 RmlC-like cupins superfamily protein3.6e-5276.27Show/hide
Query:  NSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADL
        N +++ + K+  M+ EKPLEELYNV+VERKVS++RL +LGVSRWS WKTGKCKLPWDWQ DQLVYIE+GEVRVVPEGSK+YM F+AGDLVRYPKW EADL
Subjt:  NSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADL

Query:  FFNGPYQERYSFRAYGDD
        FFN PY ERY F+AYGDD
Subjt:  FFNGPYQERYSFRAYGDD

AT2G32650.2 RmlC-like cupins superfamily protein3.6e-5276.27Show/hide
Query:  NSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADL
        N +++ + K+  M+ EKPLEELYNV+VERKVS++RL +LGVSRWS WKTGKCKLPWDWQ DQLVYIE+GEVRVVPEGSK+YM F+AGDLVRYPKW EADL
Subjt:  NSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADL

Query:  FFNGPYQERYSFRAYGDD
        FFN PY ERY F+AYGDD
Subjt:  FFNGPYQERYSFRAYGDD

AT4G10290.1 RmlC-like cupins superfamily protein2.9e-0933.77Show/hide
Query:  ELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEG---SKQYMSFMAGDLVRYPK
        E++ V+V R+ S+ +L++LGV+ W  W++   K PW ++  + +Y  EG+++V  E      + + F+AGDLV +P+
Subjt:  ELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEG---SKQYMSFMAGDLVRYPK

AT4G10300.1 RmlC-like cupins superfamily protein2.6e-1030.69Show/hide
Query:  AMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYS
        A  I     E   + +E+   E +L+QLGV  W  W     K PW + A +  Y+ +G+V+V P GS + +   AGD V +PK        +    + Y 
Subjt:  AMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFMAGDLVRYPKWFEADLFFNGPYQERYS

Query:  F
        F
Subjt:  F


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGACGAGTATGCTTGCTGCTCCTACAATGGCCTCATTCCATGTGAATATAGGGACCAAAAACTATTCAAATTTGAATTCTACCATCAAGGGATCTCACAAAATAAAGGC
TATGCGGATTGAGAAACCTCTTGAGGAGTTGTACAATGTGAGAGTTGAACGTAAAGTATCGGAGGAGCGGCTTTCCCAGCTAGGAGTTTCGAGATGGTCGACATGGAAGA
CAGGGAAGTGCAAGTTGCCATGGGACTGGCAAGCAGACCAACTGGTTTACATTGAGGAAGGTGAAGTGAGAGTAGTCCCTGAGGGAAGCAAGCAGTACATGAGTTTCATG
GCTGGAGATCTCGTTCGGTATCCGAAGTGGTTCGAAGCTGACCTTTTTTTCAATGGACCGTATCAAGAACGTTACAGTTTCAGAGCATATGGTGATGACTACTAG
mRNA sequenceShow/hide mRNA sequence
ATGACGAGTATGCTTGCTGCTCCTACAATGGCCTCATTCCATGTGAATATAGGGACCAAAAACTATTCAAATTTGAATTCTACCATCAAGGGATCTCACAAAATAAAGGC
TATGCGGATTGAGAAACCTCTTGAGGAGTTGTACAATGTGAGAGTTGAACGTAAAGTATCGGAGGAGCGGCTTTCCCAGCTAGGAGTTTCGAGATGGTCGACATGGAAGA
CAGGGAAGTGCAAGTTGCCATGGGACTGGCAAGCAGACCAACTGGTTTACATTGAGGAAGGTGAAGTGAGAGTAGTCCCTGAGGGAAGCAAGCAGTACATGAGTTTCATG
GCTGGAGATCTCGTTCGGTATCCGAAGTGGTTCGAAGCTGACCTTTTTTTCAATGGACCGTATCAAGAACGTTACAGTTTCAGAGCATATGGTGATGACTACTAG
Protein sequenceShow/hide protein sequence
MTSMLAAPTMASFHVNIGTKNYSNLNSTIKGSHKIKAMRIEKPLEELYNVRVERKVSEERLSQLGVSRWSTWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSKQYMSFM
AGDLVRYPKWFEADLFFNGPYQERYSFRAYGDDY