CuGenDBv2

Gene ID	Tan0009000
Organism	Trichosanthes anguina (Snake gourd v1)
Description	HMA domain-containing protein
Genome location	LG01:19844294..19844854
RNA-Seq Expression	Tan0009000
Synteny	Tan0009000
Gene Ontology terms	GO:0006259 - DNA metabolic process (biological process) GO:0061982 - meiosis I cell cycle process (biological process) GO:0016021 - integral component of membrane (cellular component) GO:0046872 - metal ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004151526.2 heavy metal-associated isoprenylated plant protein 34 [Cucumis sativus]

4.5e-45

67.83

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMPP
        GIYTITMDS+DG+VRICGRVNPRTFLKVIEKSGKHAEV+SIRFDGE GDRRYYP   D  S + SY +PYQ  +EQS+WFDR YP    PQ YPWQLM P
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMPP

Query:  QPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
        QP PQP  WPM+WP W     P  D   ++ +Q+N QRCCTVM
Subjt:  QPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

XP_008449023.1 PREDICTED: uncharacterized protein LOC103491020 isoform X1 [Cucumis melo]

1.3e-47

68.24

Show/hide

Query:  FWFVGIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPW
        F+ +GIYTITMDS+DG+VRICGRVNPRTFLKVIEKSGKHAEV+SIRFDGE GDRRYYP +G+D T+++ SY +PY   +EQS+WFDR+YP    PQ YPW
Subjt:  FWFVGIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPW

Query:  QLMPPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
        QLM PQP PQP PWPM+WP W     P  D   ++ +QDNNQRCCTVM
Subjt:  QLMPPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

XP_008449024.1 PREDICTED: uncharacterized protein LOC103491020 isoform X2 [Cucumis melo]

4.8e-47

69.44

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMP
        GIYTITMDS+DG+VRICGRVNPRTFLKVIEKSGKHAEV+SIRFDGE GDRRYYP +G+D T+++ SY +PY   +EQS+WFDR+YP    PQ YPWQLM 
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMP

Query:  PQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
        PQP PQP PWPM+WP W     P  D   ++ +QDNNQRCCTVM
Subjt:  PQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

XP_038905213.1 uncharacterized protein LOC120091309 isoform X1 [Benincasa hispida]

1.2e-45

65.82

Show/hide

Query:  VFLICWCGCFWFVGIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP--
        +FLI  C   + +G+YTITMDSEDG+VRICGRVNPRTFLKVIE SGKHAEVKSIRFDGE GDRRYYPYGDD ++Y LSYP+ YQ   EQ +WFDRTYP  
Subjt:  VFLICWCGCFWFVGIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP--

Query:  --PQTYPWQLM--PPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
          PQ YPWQLM   PQP PQP P P++WP W     P  D  ++  +++NNQRCCTVM
Subjt:  --PQTYPWQLM--PPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

XP_038905214.1 heavy metal-associated isoprenylated plant protein 42 isoform X2 [Benincasa hispida]

5.3e-46

68.97

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLM--
        G+YTITMDSEDG+VRICGRVNPRTFLKVIE SGKHAEVKSIRFDGE GDRRYYPYGDD ++Y LSYP+ YQ   EQ +WFDRTYP    PQ YPWQLM  
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLM--

Query:  PPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
         PQP PQP P P++WP W     P  D  ++  +++NNQRCCTVM
Subjt:  PPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

TrEMBL top hits

e value

%identity

Alignment

A0A0A0L264 Uncharacterized protein

6.6e-42

66.42

Show/hide

Query:  MDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMPPQPPPQP
        MDS+DG+VRICGRVNPRTFLKVIEKSGKHAEV+SIRFDGE GDRRYYP   D  S + SY +PYQ  +EQS+WFDR YP    PQ YPWQLM PQP PQP
Subjt:  MDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMPPQPPPQP

Query:  YPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
          WPM+WP W     P  D   ++ +Q+N QRCCTVM
Subjt:  YPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

A0A1S3BL42 uncharacterized protein LOC103491020 isoform X1

6.1e-48

68.24

Show/hide

Query:  FWFVGIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPW
        F+ +GIYTITMDS+DG+VRICGRVNPRTFLKVIEKSGKHAEV+SIRFDGE GDRRYYP +G+D T+++ SY +PY   +EQS+WFDR+YP    PQ YPW
Subjt:  FWFVGIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPW

Query:  QLMPPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
        QLM PQP PQP PWPM+WP W     P  D   ++ +QDNNQRCCTVM
Subjt:  QLMPPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

A0A1S3BLR2 uncharacterized protein LOC103491020 isoform X2

2.3e-47

69.44

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMP
        GIYTITMDS+DG+VRICGRVNPRTFLKVIEKSGKHAEV+SIRFDGE GDRRYYP +G+D T+++ SY +PY   +EQS+WFDR+YP    PQ YPWQLM 
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMP

Query:  PQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
        PQP PQP PWPM+WP W     P  D   ++ +QDNNQRCCTVM
Subjt:  PQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

A0A5A7VH99 Chitin-binding lectin 1-like

2.3e-47

69.44

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMP
        GIYTITMDS+DG+VRICGRVNPRTFLKVIEKSGKHAEV+SIRFDGE GDRRYYP +G+D T+++ SY +PY   +EQS+WFDR+YP    PQ YPWQLM 
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP-YGDDHTSYNLSYPHPYQKNHEQSNWFDRTYP----PQTYPWQLMP

Query:  PQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
        PQP PQP PWPM+WP W     P  D   ++ +QDNNQRCCTVM
Subjt:  PQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

A0A6J1EW45 uncharacterized protein LOC111438728

2.4e-44

66.9

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTY------PPQTYPWQLM
        GIYTITMDS+DG+VRICGRVNPRTFLKVIE+SGKHAEVKSIRFDGE GDRRYYPYGDD         HPYQ + EQS WFD  Y      PPQ YPWQ M
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTY------PPQTYPWQLM

Query:  PPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM
         PQP PQP PWPM+ P  P   P P++PS    D +N+QRCCT+M
Subjt:  PPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

SwissProt top hits

e value

%identity

Alignment

Q9M8K5 Heavy metal-associated isoprenylated plant protein 32

3.1e-04

47.37

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV
        G++T  +DSE G V + G V+P   +K + KSGKHAE+
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV

Arabidopsis top hits

e value

%identity

Alignment

AT3G05220.1 Heavy metal transport/detoxification superfamily protein

1.1e-04

35.19

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP
        G+Y++  D E G V + G ++P   +K + KSGKHAE+      G  G  + +P
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYP

AT3G06130.1 Heavy metal transport/detoxification superfamily protein

2.2e-05

47.37

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV
        G++T  +DSE G V + G V+P   +K + KSGKHAE+
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV

AT3G06130.2 Heavy metal transport/detoxification superfamily protein

2.2e-05

47.37

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV
        G++T  +DSE G V + G V+P   +K + KSGKHAE+
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV

AT3G13140.1 hydroxyproline-rich glycoprotein family protein

1.4e-04

29.46

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEV----GDRRYYP----YGDDHTSYNLSYPHPYQKNHEQSNW-FDRTYPPQTYPW
        G+Y++    +D ++++  RVNP   L V E+ G+H ++ ++RFDGEV    G   YY     Y    +  N +YP  YQ       +  +  +PP   P 
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEV----GDRRYYP----YGDDHTSYNLSYPHPYQKNHEQSNW-FDRTYPPQTYPW

Query:  QLMPPQPPPQPYPWPMLWPSWPLLLPPPQ
            P+    P+  P   P + L  PPP+
Subjt:  QLMPPQPPPQPYPWPMLWPSWPLLLPPPQ

AT5G19090.1 Heavy metal transport/detoxification superfamily protein

1.8e-04

44.74

Show/hide

Query:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV
        G++T  +D+E G V + G V+P   +K + KSGKHAE+
Subjt:  GIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTGAGCTATGTTTTGGCCTTTGTGTTTCTTATTTGTTGGTGTGGTTGTTTTTGGTTTGTAGGTATCTATACAATCACAATGGATTCAGAGGATGGGACAGTGAGAAT
CTGTGGAAGAGTGAATCCAAGAACATTCCTAAAAGTGATTGAAAAGTCAGGCAAACATGCAGAGGTGAAGAGCATAAGATTTGATGGTGAAGTTGGAGACAGAAGATACT
ACCCTTATGGAGATGATCACACTTCTTATAATCTTTCATATCCACATCCTTATCAGAAAAACCATGAACAATCTAATTGGTTTGACAGAACTTACCCGCCGCAGACATAC
CCTTGGCAACTAATGCCACCACAACCGCCCCCGCAGCCATACCCTTGGCCAATGCTATGGCCGAGCTGGCCGCTGCTGCTACCGCCGCCTCAAGATCCATCCGCTATGAA
TCCCGACCAAGATAACAATCAGAGATGTTGTACGGTTATGTGA

mRNA sequence

Show/hide mRNA sequence

CCTCTCTCTCTTTCTCTCTGTTTTTTATTTTTTGAGTTCTACAAACATGTGAGGAGGATAATCGAACTGGTTGAGGGTATGTTGAGCTATGTTTTGGCCTTTGTGTTTCT
TATTTGTTGGTGTGGTTGTTTTTGGTTTGTAGGTATCTATACAATCACAATGGATTCAGAGGATGGGACAGTGAGAATCTGTGGAAGAGTGAATCCAAGAACATTCCTAA
AAGTGATTGAAAAGTCAGGCAAACATGCAGAGGTGAAGAGCATAAGATTTGATGGTGAAGTTGGAGACAGAAGATACTACCCTTATGGAGATGATCACACTTCTTATAAT
CTTTCATATCCACATCCTTATCAGAAAAACCATGAACAATCTAATTGGTTTGACAGAACTTACCCGCCGCAGACATACCCTTGGCAACTAATGCCACCACAACCGCCCCC
GCAGCCATACCCTTGGCCAATGCTATGGCCGAGCTGGCCGCTGCTGCTACCGCCGCCTCAAGATCCATCCGCTATGAATCCCGACCAAGATAACAATCAGAGATGTTGTA
CGGTTATGTGA

Protein sequence

Show/hide protein sequence

MLSYVLAFVFLICWCGCFWFVGIYTITMDSEDGTVRICGRVNPRTFLKVIEKSGKHAEVKSIRFDGEVGDRRYYPYGDDHTSYNLSYPHPYQKNHEQSNWFDRTYPPQTY
PWQLMPPQPPPQPYPWPMLWPSWPLLLPPPQDPSAMNPDQDNNQRCCTVM

Tan0009000 (gene) of Snake gourd v1 genome