CuGenDBv2

Gene ID	Tan0021425
Organism	Trichosanthes anguina (Snake gourd v1)
Description	CCHC-type domain-containing protein
Genome location	LG05:13322714..13325827
RNA-Seq Expression	Tan0021425
Synteny	Tan0021425
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR025836 - Zinc knuckle CX2CX4HX4C IPR036691 - Endonuclease/exonuclease/phosphatase superfamily IPR040256 - Uncharacterized protein At4g02000-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

PPD84469.1 hypothetical protein GOBAR_DD18598 [Gossypium barbadense]

6.8e-15

26.85

Show/hide

Query:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRFG
        + R+T +  GN +G+   +D  D      + LR+++KI+I  P++RVV+F +G    E    + YE+LP  C+ CG++GH  ++C+ +  D    +    
Subjt:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRFG

Query:  AG---------SQREKETGQAQIDDQSLSGQPEKKKENI-------FGRRVQSKTGGVILKTKADNFQQPTNSPLFSNPD-------------LVGTNDL
         G         S +E+  G+  I+       P + KE          G+  Q +      +   DN      +  + N D             +  T   
Subjt:  AG---------SQREKETGQAQIDDQSLSGQPEKKKENI-------FGRRVQSKTGGVILKTKADNFQQPTNSPLFSNPD-------------LVGTNDL

Query:  PWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLID-QGFRGSCFTWFKNR
         W++GGDFN IL N EKEGG  +    I DF+  ++  +L+D +  +G    WF NR
Subjt:  PWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLID-QGFRGSCFTWFKNR

PPD94756.1 hypothetical protein GOBAR_DD08216 [Gossypium barbadense]

1.5e-14

30.17

Show/hide

Query:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRF--KIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGR
        + R T +  GN +G+   +D  D      K +R +VKID+ KPL+R+V+   K GS   E    I YEKLPD C+ CGI+GH  + C    +   AE+ +
Subjt:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRF--KIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGR

Query:  FGAGSQREKETGQAQIDDQSLSGQPEKKKENIFGRRVQSKTGGVILKTKADNFQQPTNSPLFSNPDLV--------GTNDLPWVMGGDFNEILYNNEKEG
           G  R+   G   +    L G      E       + K+GG+ L  +        N   F    L+           +  W++GGD N IL ++EKEG
Subjt:  FGAGSQREKETGQAQIDDQSLSGQPEKKKENIFGRRVQSKTGGVILKTKADNFQQPTNSPLFSNPDLV--------GTNDLPWVMGGDFNEILYNNEKEG

Query:  GATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRNNKNI
        G  ++   + +F+D +   NL D       FTW  NR+   +
Subjt:  GATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRNNKNI

PPR85699.1 hypothetical protein GOBAR_AA34985 [Gossypium barbadense]

1.5e-17

27.92

Show/hide

Query:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRF-
        + R+  +  GN +G+   +D  D      + +R++VKIDI KPLKRV+R  +     E    + YE+LPD C+ CG++GH  + C     +    +    
Subjt:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRF-

Query:  GAGSQREKETGQAQIDDQSLSGQPEKKK-----ENIFGRRVQSKTGGV-ILKTKADNFQQPTNSPLFSNPDLVGTN-DLPWVMGGDFNEILYNNEKEGGA
          G Q + +  +   +++S+S  P +++     E       + K+GG+ +L  K  N         +     V +  +  W++GGDF  IL N+EKEGG 
Subjt:  GAGSQREKETGQAQIDDQSLSGQPEKKK-----ENIFGRRVQSKTGGV-ILKTKADNFQQPTNSPLFSNPDLVGTN-DLPWVMGGDFNEILYNNEKEGGA

Query:  TQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRNNKNI
             Q+ +F + +   NL D       FTW  NR+   +
Subjt:  TQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRNNKNI

XP_022158377.1 uncharacterized protein LOC111024874 [Momordica charantia]

2.8e-16

26.91

Show/hide

Query:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILG------HGA------------
        I+R   +  GN +G FE  D DD     G +LRVRV +DI KPL+R ++  +   I  AW PI YE+LPD C+ CG+        +G+            
Subjt:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILG------HGA------------

Query:  ------QE--CEERG----SDQAAEIGRFGAGSQREKETGQAQIDDQSLSGQPEKK-----------------KENIFGRRVQS-----KTGGVILK-TK
              QE   ++ G    S   + +G    G Q    TG   I  +S   +  KK                 ++ I  + + +     K+G   ++ + 
Subjt:  ------QE--CEERG----SDQAAEIGRFGAGSQREKETGQAQIDDQSLSGQPEKK-----------------KENIFGRRVQS-----KTGGVILK-TK

Query:  ADNFQQPTNSPLFSN---------------------PDLVGTNDLPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKN
        +D+  +   SP FS                        +   +  PW++GGD N IL+N E    ++ +  QI+ F++ ++ C+L D GF+G  FTW  N
Subjt:  ADNFQQPTNSPLFSN---------------------PDLVGTNDLPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKN

Query:  R
        R
Subjt:  R

XP_027118730.1 uncharacterized protein LOC113735973 [Coffea arabica]

1.5e-14

28.4

Show/hide

Query:  GNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRFGAGSQREKET
        G+++G +EG D        GK LR+RVK+++  PLKR+++  I   + E      YE+LP  C  CG +GHG ++CE++     A       GS    + 
Subjt:  GNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRFGAGSQREKET

Query:  GQAQIDDQSLSGQPEKKKENIFGRRVQSKTGGVILKTKADNFQQPTN-----------SPLFSNPDLVGTND-------------LPWVMGGDFNEILYN
           QI    ++ Q          R +       IL T       PT            +  + +P+                   LPWV  GDFNE+L  
Subjt:  GQAQIDDQSLSGQPEKKKENIFGRRVQSKTGGVILKTKADNFQQPTN-----------SPLFSNPDLVGTND-------------LPWVMGGDFNEILYN

Query:  NEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRN
         E +G   +   QI +F+  ++ CNL D G  G+ FTW +NR+
Subjt:  NEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRN

TrEMBL top hits

e value

%identity

Alignment

A0A2N9E949 CCHC-type domain-containing protein

1.5e-20

28.17

Show/hide

Query:  KGISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIG-
        KG++ +T  + GN +G  E +D+ ++    G+ +RV+V+ID+  PL R  R K+G   E  W  + YEKLP  C+ CGILGH  +EC      + ++ G 
Subjt:  KGISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIG-

Query:  RFGAGSQREKETGQAQIDDQSLSGQPEKKKENIF-------GRRVQSKTGGVILKTKADNFQQP-----------TNSP---------------------
         +  GS      G+ +    +  G   K+   ++       G +  S T   IL         P            N+P                     
Subjt:  RFGAGSQREKETGQAQIDDQSLSGQPEKKKENIF-------GRRVQSKTGGVILKTKADNFQQP-----------TNSP---------------------

Query:  --LFSNPDLVG-------------TNDLPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNR
           +  P+  G              N LPWV+ GDFNEIL N+EK G A +   Q+  F++ + + +L D GFRG  +TW   R
Subjt:  --LFSNPDLVG-------------TNDLPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNR

A0A2N9FNT0 RNase H domain-containing protein

1.1e-15

27.5

Show/hide

Query:  GNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPL--KRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQEC----EERGSDQAAEIGRFGA--
        G  +G  E V   ++   G   +RVR++++I +PL   R+V+F+ G    + W    YE+LP+ C+ CG L HG ++C    ++R +    E  +FGA  
Subjt:  GNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPL--KRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQEC----EERGSDQAAEIGRFGA--

Query:  ----------------GSQREKETGQAQIDDQSLSG----QPEKKKENIFGRRVQSKTGGVILKTKAD--NFQQPTNSPLFSNPDLVGTND---------
                        G+Q +      + D          QP  + E++   R Q + G     T+ D  N  +   +P F  PD +  +D         
Subjt:  ----------------GSQREKETGQAQIDDQSLSG----QPEKKKENIFGRRVQSKTGGVILKTKAD--NFQQPTNSPLFSNPDLVGTND---------

Query:  -----------------------LPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNR
                               LPW   GDFNEI+ ++EK G   Q+  Q++ F+  I+ C  ID GFRG  FTW  NR
Subjt:  -----------------------LPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNR

A0A2N9HDU2 Uncharacterized protein

1.9e-15

25.91

Show/hide

Query:  PTSFDRAGKGISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECE----
        P S+D+    + ++  V+ G  +G+       DE   GG+ +R+RVK++I KPL R  +  + +  +++WA   YE+LP+ C+ CG+L HG ++C+    
Subjt:  PTSFDRAGKGISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECE----

Query:  ----ERGSDQA--AEIGRFGAGSQREKE---TGQAQ----------IDDQSLSGQPE-KKKENIFGRRVQSKTGGV--ILKTKADNFQQP----------
             R  DQA  A +   G    R+ E    G+AQ          + D+ +   P  K+  N+  R+ +   G    + K+   +F++           
Subjt:  ----ERGSDQA--AEIGRFGAGSQREKE---TGQAQ----------IDDQSLSGQPE-KKKENIFGRRVQSKTGGV--ILKTKADNFQQP----------

Query:  --TNSPLFSN-----PDLVGTND-----------------------------------------------LPWVMGGDFNEILYNNEKEGGATQNARQIK
           N     N     P   GTN+                                               LPW   GDFNEI+ N E  G   +  RQ++
Subjt:  --TNSPLFSN-----PDLVGTND-----------------------------------------------LPWVMGGDFNEILYNNEKEGGATQNARQIK

Query:  DFKDTINYCNLIDQGFRGSCFTWFKNRN
         F+D ++ C+L+D G+RGS FTW  NR+
Subjt:  DFKDTINYCNLIDQGFRGSCFTWFKNRN

A0A2P5W3R4 Uncharacterized protein

7.1e-18

27.92

Show/hide

Query:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRF-
        + R+  +  GN +G+   +D  D      + +R++VKIDI KPLKRV+R  +     E    + YE+LPD C+ CG++GH  + C     +    +    
Subjt:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSDQAAEIGRF-

Query:  GAGSQREKETGQAQIDDQSLSGQPEKKK-----ENIFGRRVQSKTGGV-ILKTKADNFQQPTNSPLFSNPDLVGTN-DLPWVMGGDFNEILYNNEKEGGA
          G Q + +  +   +++S+S  P +++     E       + K+GG+ +L  K  N         +     V +  +  W++GGDF  IL N+EKEGG 
Subjt:  GAGSQREKETGQAQIDDQSLSGQPEKKK-----ENIFGRRVQSKTGGV-ILKTKADNFQQPTNSPLFSNPDLVGTN-DLPWVMGGDFNEILYNNEKEGGA

Query:  TQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRNNKNI
             Q+ +F + +   NL D       FTW  NR+   +
Subjt:  TQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKNRNNKNI

A0A6J1DX30 uncharacterized protein LOC111024874

1.3e-16

26.91

Show/hide

Query:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILG------HGA------------
        I+R   +  GN +G FE  D DD     G +LRVRV +DI KPL+R ++  +   I  AW PI YE+LPD C+ CG+        +G+            
Subjt:  ISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILG------HGA------------

Query:  ------QE--CEERG----SDQAAEIGRFGAGSQREKETGQAQIDDQSLSGQPEKK-----------------KENIFGRRVQS-----KTGGVILK-TK
              QE   ++ G    S   + +G    G Q    TG   I  +S   +  KK                 ++ I  + + +     K+G   ++ + 
Subjt:  ------QE--CEERG----SDQAAEIGRFGAGSQREKETGQAQIDDQSLSGQPEKK-----------------KENIFGRRVQS-----KTGGVILK-TK

Query:  ADNFQQPTNSPLFSN---------------------PDLVGTNDLPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKN
        +D+  +   SP FS                        +   +  PW++GGD N IL+N E    ++ +  QI+ F++ ++ C+L D GF+G  FTW  N
Subjt:  ADNFQQPTNSPLFSN---------------------PDLVGTNDLPWVMGGDFNEILYNNEKEGGATQNARQIKDFKDTINYCNLIDQGFRGSCFTWFKN

Query:  R
        R
Subjt:  R

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCGAAGATTTGGAACCTAGATGCCCCAACCTCTTTTGATCGTGCTGGTAAAGGAATCTCTAGGAAAACTACAGTGGCTCATGGAAACGAGGTAGGTCAGTTTGAGGG
AGTGGATTTAGATGACGAAAGATGTAGGGGAGGCAAATCGCTAAGGGTGAGAGTGAAAATTGATATTCAAAAGCCTCTAAAGCGTGTTGTGAGGTTCAAAATTGGTTCAA
TGATAGAGGAGGCCTGGGCTCCCATAACCTATGAAAAACTTCCTGATTTGTGCTTTTGTTGCGGGATTTTAGGGCATGGAGCCCAAGAGTGTGAGGAAAGAGGATCGGAT
CAAGCTGCTGAAATAGGACGATTTGGGGCGGGAAGTCAACGAGAGAAGGAGACTGGGCAGGCTCAGATTGACGACCAGAGTTTAAGCGGCCAACCAGAAAAGAAAAAGGA
AAACATTTTTGGTCGGCGGGTTCAATCGAAAACGGGAGGGGTTATTCTCAAGACAAAAGCTGACAATTTCCAGCAGCCCACCAACTCTCCTTTATTTTCTAACCCAGATT
TGGTAGGTACTAATGATTTGCCTTGGGTGATGGGTGGAGACTTTAATGAAATTCTTTATAACAACGAAAAGGAGGGAGGCGCCACCCAGAATGCTAGACAAATAAAGGAC
TTCAAGGATACGATAAATTATTGCAACCTCATTGACCAGGGCTTCAGGGGAAGCTGTTTTACTTGGTTTAAAAATAGGAACAACAAAAATATCTCTGTAATGTCATCTAC
AAGATCATCGCTAAGGTTCTGGCAAATAGACTTAGAAACGTTTTGGACACGGTCATTTCTCCAACACAAGCAGCTTTTGTCCCTGACAGACAAATCTCTGACAATGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MPKIWNLDAPTSFDRAGKGISRKTTVAHGNEVGQFEGVDLDDERCRGGKSLRVRVKIDIQKPLKRVVRFKIGSMIEEAWAPITYEKLPDLCFCCGILGHGAQECEERGSD
QAAEIGRFGAGSQREKETGQAQIDDQSLSGQPEKKKENIFGRRVQSKTGGVILKTKADNFQQPTNSPLFSNPDLVGTNDLPWVMGGDFNEILYNNEKEGGATQNARQIKD
FKDTINYCNLIDQGFRGSCFTWFKNRNNKNISVMSSTRSSLRFWQIDLETFWTRSFLQHKQLLSLTDKSLTM

Tan0021425 (gene) of Snake gourd v1 genome