CuGenDBv2

Gene ID	Spg036125
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Reverse transcriptase domain-containing protein
Genome location	scaffold5:43029538..43035679
RNA-Seq Expression	Spg036125
Synteny	Spg036125
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0004523 - RNA-DNA hybrid ribonuclease activity (molecular function)
InterPro domains	IPR002156 - Ribonuclease H domain IPR012337 - Ribonuclease H-like superfamily IPR036397 - Ribonuclease H superfamily IPR044730 - Ribonuclease H-like domain, plant type

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

TXG57245.1 hypothetical protein EZV62_018558 [Acer yangbiense]

2.0e-16

24.26

Show/hide

Query:  SRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYR--LGIQLQSANEASGLGNGYKEALK-----------------------
        S  W   LV   FL  DA  ILN+P    NR+D + W  D KG +SVRS Y+  +G++ ++ + +  L + ++   K                       
Subjt:  SRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYR--LGIQLQSANEASGLGNGYKEALK-----------------------

Query:  ------------------QPETISHLFWECKKTRGLDGLCL--------IIAKALGKEAEDR----DGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWV
                            E+I+H+ W C+    +  + L        ++  A+G  A D     D   S+FR A     +   +    W       + 
Subjt:  ------------------QPETISHLFWECKKTRGLDGLCL--------IIAKALGKEAEDR----DGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWV

Query:  LNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSV
        +NCD S+  +  + GVG I+R   G T+ A    +  C ++  +EA A + GL+ ++ +    +++E D+  VV LL       TEI   +  +  L + 
Subjt:  LNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSV

Query:  LGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFP
        + +  +  + RG+N + H LAQ A S    + W +  P
Subjt:  LGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFP

XP_015388020.1 uncharacterized protein LOC107177951 [Citrus sinensis]

9.6e-19

26.58

Show/hide

Query:  LSELLDASRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQSANEASGLGNGYKEALKQPETISHLFWECKKTRGL
        +S L+D    WR D ++  F ++DA  IL IP+ +    D+++W  D KG +SV+S Y+L +Q++  N  S      KE      +I +L    K  +  
Subjt:  LSELLDASRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQSANEASGLGNGYKEALKQPETISHLFWECKKTRGL

Query:  DGLCLIIAKALGKEAEDRDGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCW--NVSWMEA
          L +  A+A+ +  +     M + +     +    +AS   W+   +  + +N DA+     +  G+G ++R  +G  +TA  +  P+ W   + + EA
Subjt:  DGLCLIIAKALGKEAEDRDGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCW--NVSWMEA

Query:  CAVVEGLKSVPLAS-PKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIWFLQLNN
         A   GL+   +A    LI+E DS +V +L+  ++    EI   V E +     L    ++H+PR  N   H LA+ A +    + W ++ P   L L  
Subjt:  CAVVEGLKSVPLAS-PKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIWFLQLNN

Query:  E
        E
Subjt:  E

XP_021753633.1 uncharacterized protein LOC110719026 [Chenopodium quinoa]

1.5e-16

25.83

Show/hide

Query:  ELLDASRS-WRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQSANEASGLGNGYKEALKQPETISHLFWECKKTRGLD
        +L+D   + W+ DL+  LF   + D ++NIP+S     D + WDL+ KG FSV+SAY      +++    G      E +K  +                
Subjt:  ELLDASRS-WRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQSANEASGLGNGYKEALKQPETISHLFWECKKTRGLD

Query:  GLCLIIAKALGKEAEDRDGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAV
               K +G+ ++ RD   +E     +  G   +     WS  +     +N D  +   + + G+G ++R E G  V  G + I   W V   EA A+
Subjt:  GLCLIIAKALGKEAEDRDGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAV

Query:  VEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIWFLQLNNEDI
          GL+ +  L    L++E D +QV+  L+ K  DL+E+S+ +++   LCS        ++ RG NK+ HF A           W +  P   + +   D+
Subjt:  VEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIWFLQLNNEDI

Query:  VN
         N
Subjt:  VN

XP_022155262.1 uncharacterized protein LOC111022403 [Momordica charantia]

9.6e-19

38.82

Show/hide

Query:  RWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSVPLAS--PKLIIELDSIQVVHLLEGKEEDLTEIS
        +W       W LN DASW D    GG+GWI+R  DG  V AG R +  C NV  +EA A++EGL+++        L IE DS +V  LL  K EDLT+  
Subjt:  RWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSVPLAS--PKLIIELDSIQVVHLLEGKEEDLTEIS

Query:  IFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIW
          VEE   L     +     + R +N   H LAQ+A   + S+ W + FP W
Subjt:  IFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIW

XP_022156777.1 uncharacterized protein LOC111023608 [Momordica charantia]

3.4e-16

33.99

Show/hide

Query:  VGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSV------PLASP---KLIIELDSI
        + R G  +  RW   +S+ W LN DA+W     +GG+GWILR E G  + A  R I    N++++E  A+ EGL+++      P+       + +E DS+
Subjt:  VGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSV------PLASP---KLIIELDSI

Query:  QVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKA
        + +HLL  + +D TEI   +EE  ++   + +  +RHI R +NK+ H LA++A
Subjt:  QVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKA

TrEMBL top hits

e value

%identity

Alignment

A0A5C7HKG9 Uncharacterized protein

9.7e-17

24.26

Show/hide

Query:  SRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYR--LGIQLQSANEASGLGNGYKEALK-----------------------
        S  W   LV   FL  DA  ILN+P    NR+D + W  D KG +SVRS Y+  +G++ ++ + +  L + ++   K                       
Subjt:  SRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYR--LGIQLQSANEASGLGNGYKEALK-----------------------

Query:  ------------------QPETISHLFWECKKTRGLDGLCL--------IIAKALGKEAEDR----DGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWV
                            E+I+H+ W C+    +  + L        ++  A+G  A D     D   S+FR A     +   +    W       + 
Subjt:  ------------------QPETISHLFWECKKTRGLDGLCL--------IIAKALGKEAEDR----DGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWV

Query:  LNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSV
        +NCD S+  +  + GVG I+R   G T+ A    +  C ++  +EA A + GL+ ++ +    +++E D+  VV LL       TEI   +  +  L + 
Subjt:  LNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSV

Query:  LGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFP
        + +  +  + RG+N + H LAQ A S    + W +  P
Subjt:  LGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFP

A0A6J1DNV9 uncharacterized protein LOC111022403

4.7e-19

38.82

Show/hide

Query:  RWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSVPLAS--PKLIIELDSIQVVHLLEGKEEDLTEIS
        +W       W LN DASW D    GG+GWI+R  DG  V AG R +  C NV  +EA A++EGL+++        L IE DS +V  LL  K EDLT+  
Subjt:  RWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSVPLAS--PKLIIELDSIQVVHLLEGKEEDLTEIS

Query:  IFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIW
          VEE   L     +     + R +N   H LAQ+A   + S+ W + FP W
Subjt:  IFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPIW

A0A6J1DSV1 uncharacterized protein LOC111023608

1.7e-16

33.99

Show/hide

Query:  VGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSV------PLASP---KLIIELDSI
        + R G  +  RW   +S+ W LN DA+W     +GG+GWILR E G  + A  R I    N++++E  A+ EGL+++      P+       + +E DS+
Subjt:  VGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLKSV------PLASP---KLIIELDSI

Query:  QVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKA
        + +HLL  + +D TEI   +EE  ++   + +  +RHI R +NK+ H LA++A
Subjt:  QVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKA

A0A803P8R6 Uncharacterized protein

9.7e-17

26.2

Show/hide

Query:  ELLDASRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQSANEASGLGNGYKEALKQPETISHLFWECKKTRGLDG
        +LL  SR W  DL++ L L+ D + +L+IP++ +N++D ++W  ++ G  +V+S Y L ++L+   + S L +G  EA++        +W     +    
Subjt:  ELLDASRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQSANEASGLGNGYKEALKQPETISHLFWECKKTRGLDG

Query:  LCLIIAKALGKEAEDRDGTMSE-----FRGAYSYVGRF-------------------GIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGA
        L L       K   +R GT  +        AYSY+  F                     A    W    S C  LN DA+   +K+  G G ++R   G 
Subjt:  LCLIIAKALGKEAEDRDGTMSE-----FRGAYSYVGRF-------------------GIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGA

Query:  TVTAGFRHIPNCWNVSWMEACAVVEGLKSV-PLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGS
         V         C+    MEA A++  L+ +  L     +IE DS+ VV  L+  ++ +++    +     L S      I H+ R +N   H LAQ A S
Subjt:  TVTAGFRHIPNCWNVSWMEACAVVEGLKSV-PLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGS

Query:  TKSSISWSNDFPI
         +++ SW  + P+
Subjt:  TKSSISWSNDFPI

Q75M12 Reverse transcriptase domain-containing protein

2.8e-16

27.55

Show/hide

Query:  LAFLSELLDASRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQ-----SANEASGLGNGYKEALK--QPETISHL
        L ++S+L+    +W +  +   FL+ DAD I  I +S    ED I W  D  G FSVRSAY+L +QL      S++ +S L   ++   K   P+ +   
Subjt:  LAFLSELLDASRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQ-----SANEASGLGNGYKEALK--QPETISHL

Query:  FW----------ECKKTRGLD-----GLC-------------LIIAKALGKEAEDRDGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWVLNCDASWCDK
         W          E KK R L+     G+C              + A +L    E     +S      + +     A  RRW    +    LN D S+   
Subjt:  FW----------ECKKTRGLD-----GLC-------------LIIAKALGKEAEDRDGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWVLNCDASWCDK

Query:  KKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIP
         + GG+G ILR   G  + +  R + +C      E  A VEGL  ++      + +E D   V+ LL   ++D + ++   +EAK L +      I  + 
Subjt:  KKSGGVGWILRREDGATVTAGFRHIPNCWNVSWMEACAVVEGLK-SVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIP

Query:  RGSNKMTHFLAQKAGSTKSSISW
        R  N ++HFLA KA +   S  W
Subjt:  RGSNKMTHFLAQKAGSTKSSISW

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAGGAGACATCGACATCGCCATCACTTCCCTCTTCCACTTTCCATACTCTCTGTATTTCAGCGTCGACTGAGTGTGACAGGTGTGATCGGAGAAATCGTAGTTGGAC
GGAGAGTGGACCGGCGGCAAGGGATCTTTGCTGCTGGAAAGGGAATGGGGAGGTGAAGAGTGAGCAGAGAGAGGACGATGCCATTCGTTTTCGTTTTCGTTTTCTTCTGA
TTGGTTATGGTGGTGCTGTTGTTGTTGATGTTCTTCCATGGATTGTGAAGAGACGATGGCGACTATTTCTGTTTGTTCGTCCAACTAGTAGAAATCTCACCATTGACGAA
AGGCGCAGCTTCAAATCCGAAGGCCATGGGAATTCTGATCCACAGTTGTTGAAATCTGGTGGTGAGCTCAATTTTCCATCTTTGAGAAGCTTAATTGTTTGGAAGTTTTT
GCTTGCTTTTCTTTCTGAGCTTCTAGATGCATCTCGATCCTGGAGGGCGGATTTGGTTAAAACTTTGTTTCTGGAAAAGGATGCAGATGATATTCTCAATATCCCAGTTA
GTCAGCTCAACAGGGAGGATGAAATAATATGGGATCTGGATTCCAAGGGTCTGTTCTCAGTGAGAAGTGCTTATAGATTGGGCATCCAACTTCAAAGTGCTAATGAAGCA
TCAGGTTTAGGAAATGGTTATAAGGAAGCCTTGAAGCAGCCGGAAACAATTTCTCACTTGTTCTGGGAATGCAAGAAAACTAGAGGTCTGGATGGACTGTGCCTGATTAT
TGCGAAAGCCTTGGGAAAGGAAGCGGAGGATCGGGATGGAACCATGAGCGAATTCAGAGGAGCTTACTCATATGTTGGCAGATTTGGTATTGCTTCGGCCAGACGATGGT
CAGCGGGATCGTCGGATTGTTGGGTCCTCAACTGCGATGCATCCTGGTGTGATAAGAAGAAAAGTGGCGGTGTCGGCTGGATCCTTCGCCGGGAAGATGGAGCGACGGTG
ACTGCTGGGTTTCGACATATACCCAACTGTTGGAATGTAAGTTGGATGGAAGCTTGTGCTGTGGTAGAAGGTTTGAAATCGGTCCCTCTTGCCTCGCCCAAGTTGATTAT
CGAGCTTGACTCCATTCAGGTGGTACATCTTCTTGAGGGGAAGGAAGAGGATCTAACGGAGATCTCCATTTTTGTCGAGGAAGCCAAGCGACTTTGCTCTGTTTTGGGGG
TGAAGGATATTAGGCACATTCCAAGGGGGTCTAACAAGATGACCCACTTTTTGGCCCAAAAAGCGGGTTCAACTAAGTCTTCTATTAGTTGGTCTAATGATTTTCCTATC
TGGTTTCTCCAATTGAATAATGAGGATATTGTGAATGAGAGTAACTTTGGTGGGGGTGCCTGTCCCACTAATGATTGCCCAATGGGCGTTTTTGCTGGCTTTTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKETSTSPSLPSSTFHTLCISASTECDRCDRRNRSWTESGPAARDLCCWKGNGEVKSEQREDDAIRFRFRFLLIGYGGAVVVDVLPWIVKRRWRLFLFVRPTSRNLTIDE
RRSFKSEGHGNSDPQLLKSGGELNFPSLRSLIVWKFLLAFLSELLDASRSWRADLVKTLFLEKDADDILNIPVSQLNREDEIIWDLDSKGLFSVRSAYRLGIQLQSANEA
SGLGNGYKEALKQPETISHLFWECKKTRGLDGLCLIIAKALGKEAEDRDGTMSEFRGAYSYVGRFGIASARRWSAGSSDCWVLNCDASWCDKKKSGGVGWILRREDGATV
TAGFRHIPNCWNVSWMEACAVVEGLKSVPLASPKLIIELDSIQVVHLLEGKEEDLTEISIFVEEAKRLCSVLGVKDIRHIPRGSNKMTHFLAQKAGSTKSSISWSNDFPI
WFLQLNNEDIVNESNFGGGACPTNDCPMGVFAGF

Spg036125 (gene) of Sponge gourd (cylindrica) v1 genome