CuGenDBv2

Gene ID	Tan0003692
Organism	Trichosanthes anguina (Snake gourd v1)
Description	CCHC-type domain-containing protein
Genome location	LG02:14768966..14769763
RNA-Seq Expression	Tan0003692
Synteny	Tan0003692
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR025836 - Zinc knuckle CX2CX4HX4C IPR040256 - Uncharacterized protein At4g02000-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

TXG51551.1 hypothetical protein EZV62_024075 [Acer yangbiense]

1.9e-14

48.1

Show/hide

Query:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTL
        LGQ  GEV+ +D    G  +G++ RVRV ID+++PL+R L++ LD++G +  +  RYEKL   CF CGLLGH+ +EC L
Subjt:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTL

TXG69574.1 hypothetical protein EZV62_004509 [Acer yangbiense]

8.4e-15

41.58

Show/hide

Query:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECT--LDTVSKEKPKGPSYKSGLRV
        +GQ  GEV+ +D    G  +G++ R+RV ID++ PL+R L+++LDD G +  +  RYEK+   CF CGLLGH  KEC+  L  + KE  K   + + LR 
Subjt:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECT--LDTVSKEKPKGPSYKSGLRV

Query:  T
        +
Subjt:  T

XP_022156185.1 uncharacterized protein LOC111023135 [Momordica charantia]

2.4e-14

48.72

Show/hide

Query:  RLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKEC
        RLG   G  + VD +  G  WG   R+RV IDIT+PLRRG+KI +D      WIP +YE+L   C+FCG++GHS  +C
Subjt:  RLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKEC

XP_030957736.1 uncharacterized protein LOC115979822 [Quercus lobata]

1.4e-14

43.48

Show/hide

Query:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLD--TVSKEKPKGPSYKSGLRV
        +G + GEVL+VD +  G  WG+  RVRVKID+T+ L RG KIK+ +EGVDRW+  +YE+L   C+ CGLL H  KEC  +    ++ K +   Y + +R 
Subjt:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLD--TVSKEKPKGPSYKSGLRV

Query:  TEFKKQGDNKKFNRK
           KK G +  F +K
Subjt:  TEFKKQGDNKKFNRK

XP_031127667.1 uncharacterized protein LOC116029767 [Ipomoea triloba]

1.1e-14

41.75

Show/hide

Query:  SAVLRRLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSKEKPKGPSYKS
        +A ++ +G   G  ++VD +  GG W  F R+RV + +T+PL+R +K++L D G   W+  +YE+L+T CF CGLLGHS K C    +   +PK   Y S
Subjt:  SAVLRRLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSKEKPKGPSYKS

Query:  GLR
        GLR
Subjt:  GLR

TrEMBL top hits

e value

%identity

Alignment

A0A5C7H3R3 CCHC-type domain-containing protein

9.0e-15

48.1

Show/hide

Query:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTL
        LGQ  GEV+ +D    G  +G++ RVRV ID+++PL+R L++ LD++G +  +  RYEKL   CF CGLLGH+ +EC L
Subjt:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTL

A0A5C7IL40 CCHC-type domain-containing protein

4.1e-15

41.58

Show/hide

Query:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECT--LDTVSKEKPKGPSYKSGLRV
        +GQ  GEV+ +D    G  +G++ R+RV ID++ PL+R L+++LDD G +  +  RYEK+   CF CGLLGH  KEC+  L  + KE  K   + + LR 
Subjt:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECT--LDTVSKEKPKGPSYKSGLRV

Query:  T
        +
Subjt:  T

A0A5C7IT66 CCHC-type domain-containing protein

5.9e-14

Show/hide

Query:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLD-TVSKEKPKGPSYKSGLRVT
        LG   GEV +VD  P+G   G+F RVRV +++  PLRR L++ +  +G +  +P +YE+L + CF CGL+GHS +ECT        K  G  Y + LR T
Subjt:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLD-TVSKEKPKGPSYKSGLRVT

A0A6J1DU55 uncharacterized protein LOC111023135

1.2e-14

48.72

Show/hide

Query:  RLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKEC
        RLG   G  + VD +  G  WG   R+RV IDIT+PLRRG+KI +D      WIP +YE+L   C+FCG++GHS  +C
Subjt:  RLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKEC

A0A803N338 Uncharacterized protein

2.6e-14

46.24

Show/hide

Query:  SAVLRRLGQTSGEVLQVDTS-PMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSKEK
        S   R +G   GE L+VD S P+G  W  + RV+V ++IT+PLRRGLK+ + + GV +WI  +YE+L   C+FCG++GH+ K+C    V KEK
Subjt:  SAVLRRLGQTSGEVLQVDTS-PMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSKEK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G01050.1 zinc ion binding;nucleic acid binding

3.4e-06

31.82

Show/hide

Query:  VLRRLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSK
        +L  + +  G  L+VD + +    GRFARV +++++ +PL+  + I  D   V       YE LS +C  CG+ GH    C  + V K
Subjt:  VLRRLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSK

AT5G36228.1 nucleic acid binding;zinc ion binding

9.3e-04

27.78

Show/hide

Query:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSKEKPKGP
        +  T GEV+ +D +        F RV+V++D T+PLR   +++         I   YEKL  +C  C  + H    C      +E    P
Subjt:  LGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFCGLLGHSQKECTLDTVSKEKPKGP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGTTGACTCGTTGATCCCTAAGCGGAATAACCTGACATTGACAAAGGAAGAAGAAAAAGTTACTTATTTAAGGGAGTTCGTGAAAACGGAAAAGCCAGTGGACCT
ATCGGCAGTTTTGAGGAGACTAGGGCAAACATCAGGGGAAGTGCTACAGGTTGATACATCTCCTATGGGGGGAATATGGGGGAGATTTGCTAGGGTTAGGGTGAAAATTG
ACATAACGCAACCATTGAGAAGAGGGTTGAAAATCAAATTAGATGATGAGGGTGTTGATAGATGGATACCTTGTCGCTATGAAAAACTCTCAACCCTTTGCTTCTTTTGT
GGCCTACTTGGACATTCACAAAAAGAGTGTACTCTTGATACTGTTTCTAAAGAAAAACCTAAAGGGCCAAGCTATAAATCAGGGTTGAGGGTAACTGAATTTAAAAAACA
AGGAGACAACAAGAAATTCAATCGAAAACCTGAGACTAATTCCCCCTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MEVDSLIPKRNNLTLTKEEEKVTYLREFVKTEKPVDLSAVLRRLGQTSGEVLQVDTSPMGGIWGRFARVRVKIDITQPLRRGLKIKLDDEGVDRWIPCRYEKLSTLCFFC
GLLGHSQKECTLDTVSKEKPKGPSYKSGLRVTEFKKQGDNKKFNRKPETNSP

Tan0003692 (gene) of Snake gourd v1 genome