CuGenDBv2

Gene ID	Tan0007528
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Heavy metal-associated domain containing protein
Genome location	LG04:7482817..7484077
RNA-Seq Expression	Tan0007528
Synteny	Tan0007528
Gene Ontology terms	GO:0046872 - metal ion binding (molecular function)
InterPro domains	IPR036163 - Heavy metal-associated domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7013033.1 hypothetical protein SDJN02_25789 [Cucurbita argyrosperma subsp. argyrosperma]

2.2e-32

66.91

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV
        MAER  K AA AGIGVRK KIFPHASSLASIESLSLPL                             VQEIV  ADIGCAECQKKLANIL+KMNDTESVV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV

Query:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR
        VNLLDKKVILTR+LQIP+      S+VSTIKRLLGSSFR
Subjt:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR

XP_022150612.1 uncharacterized protein LOC111018707 [Momordica charantia]

4.1e-34

67.63

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV
        MAER KKKAA   IGVRK +IFPHASSLASIESLSLPL                             VQEIVLTADI C ECQ KLANILSK+NDTESVV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV

Query:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR
        VNLL+KKVILTRRLQ+PSTC++S SKV+TIKRLLGSSFR
Subjt:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR

XP_022945537.1 uncharacterized protein LOC111449743 isoform X1 [Cucurbita moschata]

2.2e-35

72.66

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV
        MAER  K AA AGIGVRK KIFPHASSLAS+ESLSLPLVSAFSL+L    +       +N   S+I QVQEIV  ADIGCAECQKKLANIL+KMNDTESV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV

Query:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF
        VVNLLDKKVILTR+LQI +      S+VSTIKRLLGSSF
Subjt:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF

XP_022945538.1 uncharacterized protein LOC111449743 isoform X2 [Cucurbita moschata]

1.7e-32

71.22

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV
        MAER  K AA AGIGVRK KIFPHASSLAS+ESLSLPLVSAFSL+L    +       +N   S+I QVQEIV  ADIGCAECQKKLANIL+KMN  ESV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV

Query:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF
        VVNLLDKKVILTR+LQI +      S+VSTIKRLLGSSF
Subjt:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF

XP_022968296.1 uncharacterized protein LOC111467567 isoform X3 [Cucurbita maxima]

2.9e-32

67.86

Show/hide

Query:  MAER-GKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV
        MAER  K  AA AGIGVRK KIFPHASSLASIESLSLPL                             VQEIV TADIGCAECQKKLANILSKMNDTESV
Subjt:  MAER-GKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV

Query:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR
        VVNLLDKKVILTR+LQIPS      S+VST+KRLLGSSFR
Subjt:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DB71 uncharacterized protein LOC111018707

2.0e-34

67.63

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV
        MAER KKKAA   IGVRK +IFPHASSLASIESLSLPL                             VQEIVLTADI C ECQ KLANILSK+NDTESVV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV

Query:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR
        VNLL+KKVILTRRLQ+PSTC++S SKV+TIKRLLGSSFR
Subjt:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR

A0A6J1G168 uncharacterized protein LOC111449743 isoform X2

8.3e-33

71.22

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV
        MAER  K AA AGIGVRK KIFPHASSLAS+ESLSLPLVSAFSL+L    +       +N   S+I QVQEIV  ADIGCAECQKKLANIL+KMN  ESV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV

Query:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF
        VVNLLDKKVILTR+LQI +      S+VSTIKRLLGSSF
Subjt:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF

A0A6J1G176 uncharacterized protein LOC111449743 isoform X1

1.0e-35

72.66

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV
        MAER  K AA AGIGVRK KIFPHASSLAS+ESLSLPLVSAFSL+L    +       +N   S+I QVQEIV  ADIGCAECQKKLANIL+KMNDTESV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGP-SLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV

Query:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF
        VVNLLDKKVILTR+LQI +      S+VSTIKRLLGSSF
Subjt:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF

A0A6J1G188 uncharacterized protein LOC111449743 isoform X3

8.5e-30

65.22

Show/hide

Query:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV
        MAER  K AA AGIGVRK KIFPHASSLAS+ESLSLPL                             VQEIV  ADIGCAECQKKLANIL+KMNDTESVV
Subjt:  MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVV

Query:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF
        VNLLDKKVILTR+LQI +      S+VSTIKRLLGSSF
Subjt:  VNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSF

A0A6J1HUG9 uncharacterized protein LOC111467567 isoform X3

1.4e-32

67.86

Show/hide

Query:  MAER-GKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV
        MAER  K  AA AGIGVRK KIFPHASSLASIESLSLPL                             VQEIV TADIGCAECQKKLANILSKMNDTESV
Subjt:  MAER-GKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESV

Query:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR
        VVNLLDKKVILTR+LQIPS      S+VST+KRLLGSSFR
Subjt:  VVNLLDKKVILTRRLQIPSTCNDSPSKVSTIKRLLGSSFR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G68585.1 unknown protein

6.3e-09

37.39

Show/hide

Query:  SSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVVVNLLDKKVILT------RRLQIPST
        +SLAS+ SLS+PL                             +QEIVL+ADI C++CQ+K+A+I+++M +T S++V++L+KKV LT      RR+   S 
Subjt:  SSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVVVNLLDKKVILT------RRLQIPST

Query:  CNDSPSKVSTIKRLL
              K+STIKRL+
Subjt:  CNDSPSKVSTIKRLL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGGAGCGGGGAAAAAAGAAGGCGGCGCCGGCGGGAATCGGAGTTCGGAAGCAAAAGATTTTCCCTCATGCTTCTAGCCTTGCCTCCATTGAATCCTTATCACTGCC
TCTCGTCTCTGCTTTTTCTCTCCATCTTTACCATTCTTTTAAACTCCTACGGCTTAAATTAATCGTTAATGGCCCTTCCTTGATTTTCCAGGTTCAGGAAATTGTGTTAA
CGGCTGATATTGGATGTGCTGAATGTCAGAAAAAACTAGCGAATATTCTGTCCAAAATGAATGATACAGAGTCTGTGGTGGTGAATTTGCTGGATAAAAAAGTGATCTTG
ACTCGAAGATTGCAGATTCCATCCACGTGCAACGATTCTCCAAGTAAAGTTTCAACGATCAAGAGATTGCTTGGTTCTTCTTTCAGATAA

mRNA sequence

Show/hide mRNA sequence

CTATTTCTCATCATCATTTCACTCTCTCTCACAGCTTACCCCCCTTTTACTTATCTTCCTTCCCCTTCTTCCTTTTCACAATCCCATCATCATCCATGGCTCATAAAATC
ATCCCCTGTTTCACCGCCGGCGTTTAACCGGAGCATGGCGGAGCGGGGAAAAAAGAAGGCGGCGCCGGCGGGAATCGGAGTTCGGAAGCAAAAGATTTTCCCTCATGCTT
CTAGCCTTGCCTCCATTGAATCCTTATCACTGCCTCTCGTCTCTGCTTTTTCTCTCCATCTTTACCATTCTTTTAAACTCCTACGGCTTAAATTAATCGTTAATGGCCCT
TCCTTGATTTTCCAGGTTCAGGAAATTGTGTTAACGGCTGATATTGGATGTGCTGAATGTCAGAAAAAACTAGCGAATATTCTGTCCAAAATGAATGATACAGAGTCTGT
GGTGGTGAATTTGCTGGATAAAAAAGTGATCTTGACTCGAAGATTGCAGATTCCATCCACGTGCAACGATTCTCCAAGTAAAGTTTCAACGATCAAGAGATTGCTTGGTT
CTTCTTTCAGATAATGGTGAAGATATTGTAATATATAATGGAATATTTTCGGTCACGTTCGTAGATAAATAAATGAGCATATTGTTTGTTGTTTAGCTTCAAAGAAAAAG
GTTTTAGAGACATTGCCTTTTTTTTTTTTCTTTATGAAAATATTTGAAGGAATATTAAATATTGCCTTTTGATTTTTGAATGCAACAAAATCGTCGTACTTTAAAAGATG
ATTTTTGTCCGAATTGAGCACAGTTTGAAGAGCTGTGTTTAGCTGGAAACATAAACATGGTTCTGGCGCAACGTAATTATGTGTTTAATGGATGAATTTGCTCTGTATTG
GTCGGTGGTCTTGTTTTGATGTTCATGCGTCTGTCTCTTTGAAGGGCATTGAAAAGTATGTATACTTCATTGTCTGTTTGTGTCAATTTAGTTGTTGTATTTTTTTTTAA
GTTTTATTGTAATAATTGTATTTTAGTTAAATATATACAATAGACTTTGTCATTTATGAATGTAA

Protein sequence

Show/hide protein sequence

MAERGKKKAAPAGIGVRKQKIFPHASSLASIESLSLPLVSAFSLHLYHSFKLLRLKLIVNGPSLIFQVQEIVLTADIGCAECQKKLANILSKMNDTESVVVNLLDKKVIL
TRRLQIPSTCNDSPSKVSTIKRLLGSSFR

Tan0007528 (gene) of Snake gourd v1 genome