CuGenDBv2

Gene ID	CmoCh14G004700
Organism	Cucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Description	14 kDa zinc-binding protein-like
Genome location	Cmo_Chr14:2319274..2325254
RNA-Seq Expression	CmoCh14G004700
Synteny	CmoCh14G004700
Gene Ontology terms	GO:0006790 - sulfur compound metabolic process (biological process) GO:0009150 - purine ribonucleotide metabolic process (biological process) GO:0005737 - cytoplasm (cellular component) GO:0047627 - adenylylsulfatase activity (molecular function)
InterPro domains	IPR001310 - Histidine triad (HIT) protein IPR011146 - HIT-like domain IPR019808 - Histidine triad, conserved site IPR036265 - HIT-like superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6580845.1 Adenylylsulfatase HINT1, partial [Cucurbita argyrosperma subsp. sororia]

4.4e-67

100

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

KAG7017601.1 Adenylylsulfatase HINT1 [Cucurbita argyrosperma subsp. argyrosperma]

4.4e-67

100

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

XP_022934452.1 14 kDa zinc-binding protein-like [Cucurbita moschata]

4.4e-67

100

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

XP_022971276.1 14 kDa zinc-binding protein-like isoform X2 [Cucurbita maxima]

2.4e-65

96.15

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEKEAALAAVPSDSPTIFDKIINKEIPST+VFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILG LLY AKLIA+QEGLDDGFR+
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

XP_023521241.1 14 kDa zinc-binding protein-like [Cucurbita pepo subsp. pepo]

9.9e-67

99.23

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEK+AALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LC24 HIT domain-containing protein

2.0e-65

96.15

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSE+EAALAAVPSDSPTIFDKIINKEIPST+VFEDDKVLAFRDI+PQAPTHILIIPKVKDGLSGLSKAEERHTEILG LLY AKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

A0A5A7UFH9 14 kDa zinc-binding protein

4.5e-65

95.38

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSE+EAALAAVPSDSPTIFDKIINKEIPST+VFEDDKVLAFRDI+PQAPTHILIIP+VKDGLSGLSKAEERHTEILG LLY AKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

A0A6J1F2T2 14 kDa zinc-binding protein-like

2.2e-67

100

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

A0A6J1I2W3 14 kDa zinc-binding protein-like isoform X2

1.2e-65

96.15

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEKEAALAAVPSDSPTIFDKIINKEIPST+VFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILG LLY AKLIA+QEGLDDGFR+
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

A0A6J1J6X6 14 kDa zinc-binding protein

1.2e-65

97.69

Show/hide

Query:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV
        MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAE+RHTEILGQLLY AKLIAKQEGLDDGFRV
Subjt:  MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRV

Query:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG
        VINDGPSGCQSVYHLHVHLLGGRQMNW PG
Subjt:  VINDGPSGCQSVYHLHVHLLGGRQMNWPPG

SwissProt top hits

e value

%identity

Alignment

P32084 Uncharacterized HIT-like protein Synpcc7942_1390

3.9e-34

59.82

Show/hide

Query:  TIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGPSGCQSVYHLHVH
        TIF KII +EIP+ IV+EDD  LAFRD++PQAP HIL+IP  K  ++ L +A   H  +LG LL   K IA QEGL +G+R VIN GP+G Q+VYHLH+H
Subjt:  TIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGPSGCQSVYHLHVH

Query:  LLGGRQMNWPPG
        LLGGR + WPPG
Subjt:  LLGGRQMNWPPG

P42855 14 kDa zinc-binding protein (Fragment)

3.2e-52

81.25

Show/hide

Query:  TIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGPSGCQSVYHLHVH
        TIF KII+KEIPST+V+EDDKVLAFRDI+PQ P HIL+IPKV+DGL+GL KAEERH +ILG+LLY AKL+AKQEGLD+GFR+VINDGP GCQSVYH+HVH
Subjt:  TIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGPSGCQSVYHLHVH

Query:  LLGGRQMNWPPG
        L+GGRQMNWPPG
Subjt:  LLGGRQMNWPPG

P42856 14 kDa zinc-binding protein

7.9e-59

84.38

Show/hide

Query:  SSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVI
        SSEKEAAL  +  DSPTIFDKII KEIPST+V+ED+KVLAFRDI+PQAPTHILIIPKVKDGL+GL+KAEERH EILG LLY AK++AKQEGL+DG+RVVI
Subjt:  SSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVI

Query:  NDGPSGCQSVYHLHVHLLGGRQMNWPPG
        NDGPSGCQSVYH+HVHLLGGRQMNWPPG
Subjt:  NDGPSGCQSVYHLHVHLLGGRQMNWPPG

Q8GUN2 Adenylylsulfatase HINT1

1.1e-60

83.59

Show/hide

Query:  SSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVI
        +SEKEAALAA PSDSPTIFDKII+KEIPST+VFEDDKVLAFRDI+PQ P HIL+IPKV+DGL+GLSKAEERH +ILG+LLY AKL+AKQEGL +GFR+VI
Subjt:  SSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVI

Query:  NDGPSGCQSVYHLHVHLLGGRQMNWPPG
        NDGP GCQSVYH+HVHL+GGRQMNWPPG
Subjt:  NDGPSGCQSVYHLHVHLLGGRQMNWPPG

Q8SQ21 Histidine triad nucleotide-binding protein 2, mitochondrial

2.3e-34

54.03

Show/hide

Query:  EAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGP
        +A  AA    +PTIF +I+++ +P+ I++ED + LAFRD++PQAP H L+IP  K  +  +S+AEE   ++LG LL  AK  AK EGL DG+R+VINDG 
Subjt:  EAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGP

Query:  SGCQSVYHLHVHLLGGRQMNWPPG
         G QSVYHLH+H+LGGRQ+ WPPG
Subjt:  SGCQSVYHLHVHLLGGRQMNWPPG

Arabidopsis top hits

e value

%identity

Alignment

AT1G31160.1 HISTIDINE TRIAD NUCLEOTIDE-BINDING 2

6.4e-48

66.94

Show/hide

Query:  EAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGP
        +AA +   + +PTIFDKII KEIPS IV+ED+ VLAFRDI+PQAP H+L+IPK++DGL+ L KAE RH E+LGQLL+A+K++A++EG+ DGFRVVIN+G 
Subjt:  EAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGP

Query:  SGCQSVYHLHVHLLGGRQMNWPPG
          CQSVYHLH+H+LGGRQM WPPG
Subjt:  SGCQSVYHLHVHLLGGRQMNWPPG

AT3G56490.1 HIS triad family protein 3

7.8e-62

83.59

Show/hide

Query:  SSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVI
        +SEKEAALAA PSDSPTIFDKII+KEIPST+VFEDDKVLAFRDI+PQ P HIL+IPKV+DGL+GLSKAEERH +ILG+LLY AKL+AKQEGL +GFR+VI
Subjt:  SSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVI

Query:  NDGPSGCQSVYHLHVHLLGGRQMNWPPG
        NDGP GCQSVYH+HVHL+GGRQMNWPPG
Subjt:  NDGPSGCQSVYHLHVHLLGGRQMNWPPG

AT4G16566.1 histidine triad nucleotide-binding 4

1.4e-05

Show/hide

Query:  IFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVK-DGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGPSGCQSVYHLHVH
        IF +I+     + ++  D+KV+AF+DI P A  H L+IPK     ++ L + +E ++ ++  +L   + + +++      R   +  P    SV HLH+H
Subjt:  IFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVK-DGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGPSGCQSVYHLHVH

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCATCTTCCGAGAAGGAAGCGGCTCTTGCAGCTGTTCCCTCCGATTCCCCCACCATATTTGACAAAATCATTAATAAGGAAATTCCATCTACGATTGTCTTTGAGGA
TGATAAGGTTCTTGCTTTTAGGGACATATCTCCACAAGCTCCTACACATATTCTAATCATTCCAAAAGTTAAGGATGGGTTATCTGGATTATCTAAGGCTGAGGAGAGGC
ACACAGAGATTCTCGGTCAACTGCTTTACGCTGCCAAGCTCATTGCCAAACAAGAAGGGCTGGACGATGGCTTTAGGGTCGTAATTAATGATGGACCGAGTGGATGCCAA
TCGGTTTATCATCTTCATGTTCACCTTTTGGGGGGACGACAAATGAATTGGCCCCCAGGTTAA

mRNA sequence

Show/hide mRNA sequence

TCGACTCACAGTTCTAAGCTCCCACATTTCCCAATCTCTTTCCATTTCCATGGCATCTTCCGAGAAGGAAGCGGCTCTTGCAGCTGTTCCCTCCGATTCCCCCACCATAT
TTGACAAAATCATTAATAAGGAAATTCCATCTACGATTGTCTTTGAGGATGATAAGGTTCTTGCTTTTAGGGACATATCTCCACAAGCTCCTACACATATTCTAATCATT
CCAAAAGTTAAGGATGGGTTATCTGGATTATCTAAGGCTGAGGAGAGGCACACAGAGATTCTCGGTCAACTGCTTTACGCTGCCAAGCTCATTGCCAAACAAGAAGGGCT
GGACGATGGCTTTAGGGTCGTAATTAATGATGGACCGAGTGGATGCCAATCGGTTTATCATCTTCATGTTCACCTTTTGGGGGGACGACAAATGAATTGGCCCCCAGGTT
AAGATGGACACTTTTTCAACGTTGAAATACATCTAATAATGTTTTCATTACCTGTTCGAAAACTTTATCAACTTTATCAACTACTGCTCGTCCCTTGTGGTCTCTAACAT
CCCATTGAATATGTAAGCAGGGATGTAGACATGAACTGGTGGGAGTGGACGACATGGTTGAGCAGCAGGGCATTGCAAAAGCTGATGCCTGAGGAAATATGTCTGCTCTT
TCCAGGTACCTTGTTCTTGATCTTCTCATAGAATCCCCTTATTTCTCATGTTCCAAGATGCCCATTCATTGGATTTTAGCTTTTGAAAAATGATGGTATCCATGCCTAGT
TTATTGAAAGGAAGGAGGTGTTCTTTGGCCCATCATGAGGGAATTAGATAGAGTTTTGTTGCGAAAATATGACTGGTGAGGAGAATTAGGTAGCGTTTTGGTGTAAATAC
ATTAAGACAACAGCTAAATGTCAAGGAACTTAAGAAGGTACGATTAAAGATGTCACAATGAATCACAAAAGCTAAGGATGAGCTAAGGATGTCTAGAAAGATGTGGTGGT
GTAATGAGTGAAATTTTTTATGAAGAGTTGAGTCAAAGGACTATTAAGAAAACCATGTGCGTGGCTCCAG

Protein sequence

Show/hide protein sequence

MASSEKEAALAAVPSDSPTIFDKIINKEIPSTIVFEDDKVLAFRDISPQAPTHILIIPKVKDGLSGLSKAEERHTEILGQLLYAAKLIAKQEGLDDGFRVVINDGPSGCQ
SVYHLHVHLLGGRQMNWPPG

CmoCh14G004700 (gene) of Cucurbita moschata (Rifu) v1 genome