CuGenDBv2

Gene ID	Tan0016910
Organism	Trichosanthes anguina (Snake gourd v1)
Description	RNase H domain-containing protein
Genome location	LG08:72312815..72313899
RNA-Seq Expression	Tan0016910
Synteny	Tan0016910
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0004523 - RNA-DNA hybrid ribonuclease activity (molecular function)
InterPro domains	IPR002156 - Ribonuclease H domain IPR012337 - Ribonuclease H-like superfamily IPR036397 - Ribonuclease H superfamily IPR044730 - Ribonuclease H-like domain, plant type

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_015386106.1 uncharacterized protein LOC107177190 [Citrus sinensis]

2.8e-10

28.79

Show/hide

Query:  VWKHNNRRIFTVKSAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTY
        +WK  N+ +F  K    LG+         S  K +         GN    +QWSPP  GW  +  DA+   E    G+G +VR+  G    A    +   
Subjt:  VWKHNNRRIFTVKSAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTY

Query:  WPILVMELFGIIKGMRSISDKGIPL-MVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWLGE
          + + E   +  G++      I   + ESDSLE I LI  K    TE    I  I    +++ +   +H PR  N  AH LA+ A   ++  IWL E
Subjt:  WPILVMELFGIIKGMRSISDKGIPL-MVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWLGE

XP_022143535.1 uncharacterized protein LOC111013412 [Momordica charantia]

1.8e-17

40.74

Show/hide

Query:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDCTEARD
        QW PP    W L T+A+W  + N+GGIGW++R+ KG VI A    I     I  +E+  I +G+R+I  +   P+ +ESDSLEAI L+  + +D TE   
Subjt:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDCTEARD

Query:  FIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA
         ++ I  M +D   +  RHI R +N+ AH LA+RA
Subjt:  FIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA

XP_022148737.1 uncharacterized protein LOC111017329 [Momordica charantia]

1.3e-10

Show/hide

Query:  SIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRS-ISDKGIPLMVESDSLEAILLIEGKIEDCT
        S+ Q  SP    +W L TDA+W      GG+GW++RN K  +  A    I     I  +EL  I  G+ + +S   + L++ES+SLEAI LI+G  ++ T
Subjt:  SIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRS-ISDKGIPLMVESDSLEAILLIEGKIEDCT

Query:  EARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRAS
        E    +  I N  E      F+H+ R  N  A ++A RA+
Subjt:  EARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRAS

XP_022155262.1 uncharacterized protein LOC111022403 [Momordica charantia]

6.0e-21

31.16

Show/hide

Query:  IVWKHNNRRIFTVK-SAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYID
        ++W H N  IF  + S++   +         SS + +          N  +  +W PP    W+L  DASWSD  + GGIGW++R+W G ++ A + +++
Subjt:  IVWKHNNRRIFTVK-SAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYID

Query:  TYWPILVMELFGIIKGMRSISDKGI--PLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWL
            + ++E   I++G+R++++ G+  PL +E+DS E   L+  K ED T+    ++ I N+R+    + F  + R +N  AH LAQRAS L++  IW+
Subjt:  TYWPILVMELFGIIKGMRSISDKGI--PLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWL

XP_022156777.1 uncharacterized protein LOC111023608 [Momordica charantia]

1.1e-17

39.86

Show/hide

Query:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI---------PLMVESDSLEAILLIEGKI
        +W PP    W L TDA+W  + N+GGIGW++R+ KG VI A    I T   I  +E+  I +G+R+I  +           P+ +ESDSLEAI L+  + 
Subjt:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI---------PLMVESDSLEAILLIEGKI

Query:  EDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA
        +D TE    ++ I  M ED   +  RHI R +N+ AH LA+RA
Subjt:  EDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA

TrEMBL top hits

e value

%identity

Alignment

A0A5B7BU49 RNase H domain-containing protein (Fragment)

5.0e-13

29.23

Show/hide

Query:  WKHNNRRIFTVKSAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYW
        W H N  +F  +      +              ++R +  A++  Q     WSPP +G + L   ASW    + GGIG ++R+WKG VI      I T  
Subjt:  WKHNNRRIFTVKSAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYW

Query:  PILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWL
         I   E   I+ G+    D G+  L VE D L  ++ IE  +ED +E     D I   R+ +    F H+ R++N  AH++A  A  +     WL
Subjt:  PILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWL

A0A6J1CP26 uncharacterized protein LOC111013412

8.7e-18

40.74

Show/hide

Query:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDCTEARD
        QW PP    W L T+A+W  + N+GGIGW++R+ KG VI A    I     I  +E+  I +G+R+I  +   P+ +ESDSLEAI L+  + +D TE   
Subjt:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDCTEARD

Query:  FIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA
         ++ I  M +D   +  RHI R +N+ AH LA+RA
Subjt:  FIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA

A0A6J1D5W1 uncharacterized protein LOC111017329

6.1e-11

Show/hide

Query:  SIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRS-ISDKGIPLMVESDSLEAILLIEGKIEDCT
        S+ Q  SP    +W L TDA+W      GG+GW++RN K  +  A    I     I  +EL  I  G+ + +S   + L++ES+SLEAI LI+G  ++ T
Subjt:  SIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRS-ISDKGIPLMVESDSLEAILLIEGKIEDCT

Query:  EARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRAS
        E    +  I N  E      F+H+ R  N  A ++A RA+
Subjt:  EARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRAS

A0A6J1DNV9 uncharacterized protein LOC111022403

2.9e-21

31.16

Show/hide

Query:  IVWKHNNRRIFTVK-SAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYID
        ++W H N  IF  + S++   +         SS + +          N  +  +W PP    W+L  DASWSD  + GGIGW++R+W G ++ A + +++
Subjt:  IVWKHNNRRIFTVK-SAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYID

Query:  TYWPILVMELFGIIKGMRSISDKGI--PLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWL
            + ++E   I++G+R++++ G+  PL +E+DS E   L+  K ED T+    ++ I N+R+    + F  + R +N  AH LAQRAS L++  IW+
Subjt:  TYWPILVMELFGIIKGMRSISDKGI--PLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWL

A0A6J1DSV1 uncharacterized protein LOC111023608

5.1e-18

39.86

Show/hide

Query:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI---------PLMVESDSLEAILLIEGKI
        +W PP    W L TDA+W  + N+GGIGW++R+ KG VI A    I T   I  +E+  I +G+R+I  +           P+ +ESDSLEAI L+  + 
Subjt:  QWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI---------PLMVESDSLEAILLIEGKI

Query:  EDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA
        +D TE    ++ I  M ED   +  RHI R +N+ AH LA+RA
Subjt:  EDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRA

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G04420.1 Polynucleotidyl transferase, ribonuclease H-like superfamily protein

1.5e-06

27.11

Show/hide

Query:  QSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDC
        +S  Q+W  P  GW     D S++        GW++R+ KG    A  +   T    L  EL  ++  M+    +G   ++ E DS +   L+  K    
Subjt:  QSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILVMELFGIIKGMRSISDKGI-PLMVESDSLEAILLIEGKIEDC

Query:  TEARDFIDIIHNMREDWT------DIVFRHIPRSSNQEAHKLAQRASHLQQYDIWLGESFGLHYFI
           +      + +RE W+      +++F   PR++NQ A  LA+  SHL Q       SF  HYF+
Subjt:  TEARDFIDIIHNMREDWT------DIVFRHIPRSSNQEAHKLAQRASHLQQYDIWLGESFGLHYFI

AT4G29090.1 Ribonuclease H-like superfamily protein

2.5e-09

24.24

Show/hide

Query:  VWKHNNRRIFTVKSAYRLGLNHRCHLDASSSDKEKVRGRARALA------GNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARH
        +WK+ N  +F  +       N +  L  +  D E+ R R  A +       N+S   +W PP   W    TDA+W+ +    GIGW++RN KG V     
Subjt:  VWKHNNRRIFTVKSAYRLGLNHRCHLDASSSDKEKVRGRARALA------GNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARH

Query:  SYIDTYWPILVMELFGIIKGMRSISDKGIPLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYD
          +     +L  EL  +   + S+S      ++     + ++ I    E     +  I  +  +   +T++ F  IPR  N  A ++A+ +     YD
Subjt:  SYIDTYWPILVMELFGIIKGMRSISDKGIPLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAATGATGAAATAGTGTGGAAACATAACAATCGGAGAATCTTTACAGTCAAAAGTGCGTACCGACTAGGCCTTAATCACCGATGTCATCTAGATGCCTCAAGCTCTGA
TAAGGAGAAAGTCAGGGGACGAGCCCGTGCATTGGCGGGAAATCAAAGTATCCCTCAACAATGGAGCCCTCCCATTCAGGGCTGGTGGAGCCTTTGTACGGATGCCTCTT
GGAGTGACGAATTGAATAGTGGAGGTATTGGTTGGATGGTACGAAACTGGAAAGGTCGTGTGATCTGTGCAAGACATTCTTACATTGACACTTACTGGCCTATTTTGGTT
ATGGAACTATTTGGGATAATTAAAGGAATGAGATCGATCTCGGATAAAGGTATTCCTTTGATGGTGGAATCAGATTCTCTTGAAGCCATCCTTTTGATAGAAGGAAAGAT
TGAAGATTGCACAGAGGCACGAGATTTCATAGATATAATTCACAACATGCGAGAGGACTGGACTGACATTGTCTTCCGGCACATCCCTCGGTCATCGAATCAAGAAGCTC
ACAAGCTGGCACAAAGAGCATCTCATCTTCAACAATACGATATTTGGTTGGGGGAGTCTTTTGGACTCCATTACTTTATTTCATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNDEIVWKHNNRRIFTVKSAYRLGLNHRCHLDASSSDKEKVRGRARALAGNQSIPQQWSPPIQGWWSLCTDASWSDELNSGGIGWMVRNWKGRVICARHSYIDTYWPILV
MELFGIIKGMRSISDKGIPLMVESDSLEAILLIEGKIEDCTEARDFIDIIHNMREDWTDIVFRHIPRSSNQEAHKLAQRASHLQQYDIWLGESFGLHYFIS

Tan0016910 (gene) of Snake gourd v1 genome