CuGenDBv2

Gene ID	Lag0005549
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Reverse transcriptase domain-containing protein
Genome location	chr6:21567263..21577775
RNA-Seq Expression	Lag0005549
Synteny	Lag0005549
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	IPR012337 - Ribonuclease H-like superfamily IPR036397 - Ribonuclease H superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

GEU96560.1 reverse transcriptase domain-containing protein [Tanacetum cinerariifolium]

2.4e-39

49.72

Show/hide

Query:  RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG---------------VYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPRA
        +F  D K ++WD+P+++K C D +IRRCVSG EA EIL+ CH  P G               V Y+SKWVEA A   NDA+ V +FL+ ++FARFGT RA
Subjt:  RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG---------------VYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPRA

Query:  LVSDE---------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRGSVAT
        ++SD                D+ALWA+RTAYKTP+G +PYRLVYGK+CHL +ELEHK  WALK  NFD    G + T
Subjt:  LVSDE---------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRGSVAT

GEW27269.1 reverse transcriptase domain-containing protein [Tanacetum cinerariifolium]

1.3e-37

46.2

Show/hide

Query:  HSKAFIPS--DRRHVQRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYGVYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPR
        H++ FI      +  ++F  D K ++WD+PF++K   D +IRRCVSG +A EIL+ CH  P GV Y+SKWVEA A   ND++ V +FL +++FARFGTPR
Subjt:  HSKAFIPS--DRRHVQRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYGVYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPR

Query:  ALVSDE-------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRG
        A++SD                          D+ALWA+R AYKT +G + Y+LVYGK+CHL +ELEHK  WALK  NFD    G
Subjt:  ALVSDE-------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRG

GFA68532.1 reverse transcriptase domain-containing protein [Tanacetum cinerariifolium]

1.0e-37

Show/hide

Query:  QRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYGVY---------------YVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPR
        Q+F  D + ++WD+P+++K C D IIRRCV+G EA +IL+ CH+ P   Y               Y+SKWVEA A   NDA+ V +FL+S +F+RFGTP+
Subjt:  QRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYGVY---------------YVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPR

Query:  ALVSDE--------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRGSVATLLRTRLGQQER
        A++SD                           ++ALWA+RTA+KTP+G +PYRLVY KSCHL LELEHK  WALK +NFD    G    L    L +   
Subjt:  ALVSDE--------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRGSVATLLRTRLGQQER

Query:  AASRRCL
         A   CL
Subjt:  AASRRCL

XP_016461948.1 PREDICTED: uncharacterized protein LOC107785214, partial [Nicotiana tabacum]

1.0e-37

40.45

Show/hide

Query:  SKAFIPSDRRHVQ--RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG-------------------------------VYYVSKW
        +   +P D   VQ  RF  +++L+YWDEP++++ C D +IRRC+S  E   IL+ CH+S YG                                YYVSKW
Subjt:  SKAFIPSDRRHVQ--RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG-------------------------------VYYVSKW

Query:  VEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE------------------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSC
        VEA+A   NDAK V  FL+ +IF  FGTPRA++SD                                     D+ALWAYRTA+KTP+GMSPY+LV+GK+C
Subjt:  VEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE------------------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSC

Query:  HLSLELEHKTLWALKKLNFD
        HL +ELEHK  W LK+LN D
Subjt:  HLSLELEHKTLWALKKLNFD

XP_019241380.1 PREDICTED: uncharacterized protein LOC109221357 [Nicotiana attenuata]

1.7e-37

36.3

Show/hide

Query:  ILLLLEFYAN-SEGKGERNQ--------ERHSKAFIPSD-RRHVQRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG--------
        +LLL EF     + KG  NQ        E H         ++  +RF HD   +YWDEP+++KQC D ++RRC+   E + +L  CH+SPYG        
Subjt:  ILLLLEFYAN-SEGKGERNQ--------ERHSKAFIPSD-RRHVQRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG--------

Query:  -------------------------VYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE--------------------------------
                                 V YVSKWVEAIA   NDA  V+ F++ +IF+RFGTPRAL+SDE                                
Subjt:  -------------------------VYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE--------------------------------

Query:  ----------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRG
                                    D+ALWAYRTAYKTP+G SPY+LVYGK+CHL +ELEHK  WA+KKLN D    G
Subjt:  ----------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRG

TrEMBL top hits

e value

%identity

Alignment

A0A1S3ZC27 uncharacterized protein LOC107785214

4.9e-38

40.45

Show/hide

Query:  SKAFIPSDRRHVQ--RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG-------------------------------VYYVSKW
        +   +P D   VQ  RF  +++L+YWDEP++++ C D +IRRC+S  E   IL+ CH+S YG                                YYVSKW
Subjt:  SKAFIPSDRRHVQ--RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG-------------------------------VYYVSKW

Query:  VEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE------------------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSC
        VEA+A   NDAK V  FL+ +IF  FGTPRA++SD                                     D+ALWAYRTA+KTP+GMSPY+LV+GK+C
Subjt:  VEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE------------------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSC

Query:  HLSLELEHKTLWALKKLNFD
        HL +ELEHK  W LK+LN D
Subjt:  HLSLELEHKTLWALKKLNFD

A0A1U7Z0W9 uncharacterized protein LOC104589888

9.2e-37

29.55

Show/hide

Query:  MGQVANELKARPQRKLPVDTKHPRTEGKDKVQAVTLRSGKPREEKRKPNNIQDVEKNIDKNVVVEKNLE-SGKSDGGINNNVGASSSVLDVEPPYVPPRL
        +GQ+AN + AR Q  LP + +   T  +++++A++LRSGK  E K+   ++Q      D  +  E+ ++ S  + G   N+  A  S      P+ P RL
Subjt:  MGQVANELKARPQRKLPVDTKHPRTEGKDKVQAVTLRSGKPREEKRKPNNIQDVEKNIDKNVVVEKNLE-SGKSDGGINNNVGASSSVLDVEPPYVPPRL

Query:  MHNIVD-PFTKALSAKVFEGHLESLGLLGPTGNSIRVMRNRAPISTFID-------YPKRIPVQLTSWCSCRIPSKIKILL------LLEFYANSEGKGE
             +  F+K L         + L +  P   ++  M   A    F +       +     V LT  CS  I SK+   L       +     S    +
Subjt:  MHNIVD-PFTKALSAKVFEGHLESLGLLGPTGNSIRVMRNRAPISTFID-------YPKRIPVQLTSWCSCRIPSKIKILL------LLEFYANSEGKGE

Query:  RNQERHSKAFIPSDRRHVQR--FKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPY-------------------------------GV
         +    +   +P D  + Q+  F  + K + W++P++YK C D IIRRCV  +E  +IL  CH S Y                               GV
Subjt:  RNQERHSKAFIPSDRRHVQR--FKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPY-------------------------------GV

Query:  YYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE----------------------------------------------------------
         YVSKWVEA+A   NDA+ V +FL+  +F+RFG PRA++SD                                                           
Subjt:  YYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDE----------------------------------------------------------

Query:  --DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRGSVATLLRTRLGQ
          D+ALWAYRTAYKTP+GMSPYRL+YGK+CHL +ELEH+  WA+K LNFD    G    L    L +
Subjt:  --DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRGSVATLLRTRLGQ

A0A699GTX9 Reverse transcriptase domain-containing protein

6.4e-38

46.2

Show/hide

Query:  HSKAFIPS--DRRHVQRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYGVYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPR
        H++ FI      +  ++F  D K ++WD+PF++K   D +IRRCVSG +A EIL+ CH  P GV Y+SKWVEA A   ND++ V +FL +++FARFGTPR
Subjt:  HSKAFIPS--DRRHVQRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYGVYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPR

Query:  ALVSDE-------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRG
        A++SD                          D+ALWA+R AYKT +G + Y+LVYGK+CHL +ELEHK  WALK  NFD    G
Subjt:  ALVSDE-------------------------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFDAWNRG

A0A6L2K816 Reverse transcriptase

1.9e-37

47.67

Show/hide

Query:  QRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG---------------------------------VYYVSKWVEAIACHQNDAK
        + F  D K ++WDEP++++ C + +IRRCV G EA  IL  CH+ P G                                 V Y+SKWVEA A   NDA+
Subjt:  QRFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG---------------------------------VYYVSKWVEAIACHQNDAK

Query:  TVSRFLQSHIFARFGTPRALVSDEDEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFD
         V +FL+S +FARFGTPRA++ D D+ALWA+RTA+KTP G SPY+LVYGK+CHL ++LEHK  WALK  NFD
Subjt:  TVSRFLQSHIFARFGTPRALVSDEDEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFD

A0A6L2NA98 Integrase catalytic domain-containing protein

5.4e-37

45.65

Show/hide

Query:  RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG-----------------------------------VYYVSKWVEAIACHQNDA
        +F  D K ++WD+PF++K C D +IRRCV G EA +ILE CH+   G                                   + Y SKWVEA A   NDA
Subjt:  RFKHDAKLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYG-----------------------------------VYYVSKWVEAIACHQNDA

Query:  KTVSRFLQSHIFARFGTPRALVSDE-----------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFD
        + V +FL+S +F RFG PRA++SD            D+ALWA+RTAYKTP+G +PY LVYGK+CHLS+ELEHK  WALK+ NFD
Subjt:  KTVSRFLQSHIFARFGTPRALVSDE-----------DEALWAYRTAYKTPLGMSPYRLVYGKSCHLSLELEHKTLWALKKLNFD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGTCAGGTAGCTAATGAGCTGAAGGCACGACCTCAAAGGAAACTTCCTGTGGATACTAAACACCCTAGAACGGAAGGTAAGGATAAGGTGCAGGCAGTGACT
CTAAGAAGTGGTAAGCCACGAGAAGAGAAAAGAAAGCCTAATAACATCCAGGATGTAGAGAAGAATATTGACAAAAATGTTGTTGTTGAGAAAAATTTGGAGTCT
GGTAAAAGTGATGGAGGCATCAATAATAATGTTGGAGCATCTAGTTCTGTTCTAGATGTAGAACCACCTTATGTACCGCCCCGCCTTATGCACAACATTGTTGAT
CCGTTTACGAAGGCCCTCTCGGCTAAAGTGTTCGAGGGTCATCTAGAAAGTCTAGGTCTATTAGGTCCCACTGGTAACTCTATTAGGGTGATGAGAAATCGTGCT
CCCATAAGCACCTTCATCGATTACCCCAAGAGGATACCGGTGCAACTTACGTCGTGGTGTTCTTGTCGAATTCCCAGCAAGATCAAGATCCTTTTGCTGCTGGAA
TTTTATGCAAATAGTGAAGGAAAAGGCGAAAGAAATCAAGAACGTCATTCAAAGGCTTTTATCCCTTCAGATAGGAGGCATGTGCAAAGGTTTAAGCATGATGCA
AAATTGTTTTATTGGGATGAGCCATTTATGTATAAGCAATGTTTTGATGGTATTATTCGAAGATGTGTTTCAGGTGATGAAGCAAAGGAAATCCTCGAGCAATGT
CACTCTTCCCCATATGGAGTTTACTATGTGTCCAAGTGGGTGGAGGCCATTGCATGTCATCAGAATGATGCTAAGACGGTGTCGAGGTTTCTTCAATCGCACATT
TTTGCGCGGTTTGGGACACCTAGGGCTCTTGTGAGCGATGAGGATGAGGCTCTATGGGCTTATAGGACAGCCTATAAGACTCCTTTAGGTATGTCTCCTTATAGG
CTAGTATATGGAAAGTCTTGCCATTTATCGTTAGAACTTGAGCATAAAACATTGTGGGCTCTAAAGAAATTGAATTTTGATGCCTGGAATAGGGGTAGCGTCGCG
ACGCTGCTGCGCACGCGGCTTGGGCAACAAGAAAGGGCAGCGTCGCGACGCTGCCTTGCTAAGCGTCTCGACGCTGTCCAGATTTTCCAGAAAAATCAGCTTCCT
TTTGGGCTGATTTTTGGGTCTTCTTCTTCATTTCTCTTGATTGTGCCGGAGCCGCCACGTCGTCGCTGCCGCAAGCAAGAGGCGGGACGAATCAAGGTGGTTAGG
ACAGACACTCCATCTCCGTCAACAACGGAATCTGAGAAGGAAAATGCAGAGAAAGAGGATCAAGAGAAAGAGAAAACTAAAAAGAAAACTAAAGAGGAGGCCTTG
ATGAAGCAACAAGTAGACAAGGGCAAAGGAGTTGCTGAAGCAACAGTCGAAGCAGAGGAGGCTGAGACTGAAGAACCAAGACTGTCGTATGAGCACTTCGTCAAC
AACCTTGCCAGAGCAAAATACTTGGCAATGCTAAGTGGGACTTCCTATTTGAGAGAGGAGTCAGTAAACTCCAACATAGTTCTCGAGTTCTACGCGAACATTGTT
GAAGAAGAAGACTCCCAAGCGGTTGTCTGTGGGACAACAGTAGACTGGAGCCCAGCATTGGTGAGAGTGGCAAATACGCAAATTCAATATGTCTTCCTTTTTGGA
GACAAGACCGAGTGGGAGGCTGGGGACATTTCGAAATCAAGCCATTGCCGCATCTCCCTCCCTTTGTATGTCTCTTTGCACCACCTGCTCCTTGCCATCGTCGCC
GCTCGTGCTTCAGCGCCGTCGTCGCCACCTCCCCTCGCAAGCCCTCTTCGTGAATCTCTCTCTCTCTCTCTCTCTCTCAATTTTTGGTTCGTGTGGAAGTCGCCG
CCTGTCCAGCCGCTGCCTCCTCGATGCGTCGTCACCACTACAGCAAGGTTGGATCTAAGTTCCTCTAGGTTTGTTTTGGTTAGATCTCCCGTGCCTAGCAATTCA
GAGTCCCGTCGACCTCGGTCTAGCCGATTCCGCCTCTGTCCAGCGACATTCTTGGGCGTTTCCAGCAACGATTTGCAGTTTTGGGAATTTGGAGTTGCTGTTCAA
CAAGGAAATAGTTTTTCTCGATTGAATTTGGCCTTTCAAGCATGTTTAAAGAATCTTCATCGGGTGCCTTGGGTAATATGGCCAAGAGGCGATGCACAGTTCGAG
GCCTTGGGTAATATGGTCAAGGGTCGAACACTGAGCTCCATAAAGAGCATTGTGGTCCTGGGTACAAATGGTCAGGGGACAGTGCGGCTCGAAGGGTCAGTCTTG
GAGAGTTTGGTGAGGGCTACGAGAATTAGAAGTCATCGGGTGCCTTGGGTAATATGGCCAAGGGGCGATGCAACAGTTCGAGGCCTTGGGGGTCAGTGTGACTCG
AAGGGTTTGTCTTGGAGAGCTTTGAAAGGACCCAGAGGAGTCGAGTTGAGAGGACTCAGAGGAGTCGAATTGAGAGAACTCCGTGGAGTTGAGAGGACCCAGAGG
AGTCAGATAGAGCTTGTGCGAGCCACTTACTCAGTACCGTGGTTTTGTACTAACCCACCACCAGGTTTTGCAGGTGCTGCAATCATATTCGAGCTTGGTGATGTA
GAGGAAACGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGQVANELKARPQRKLPVDTKHPRTEGKDKVQAVTLRSGKPREEKRKPNNIQDVEKNIDKNVVVEKNLESGKSDGGINNNVGASSSVLDVEPPYVPPRLMHNIVD
PFTKALSAKVFEGHLESLGLLGPTGNSIRVMRNRAPISTFIDYPKRIPVQLTSWCSCRIPSKIKILLLLEFYANSEGKGERNQERHSKAFIPSDRRHVQRFKHDA
KLFYWDEPFMYKQCFDGIIRRCVSGDEAKEILEQCHSSPYGVYYVSKWVEAIACHQNDAKTVSRFLQSHIFARFGTPRALVSDEDEALWAYRTAYKTPLGMSPYR
LVYGKSCHLSLELEHKTLWALKKLNFDAWNRGSVATLLRTRLGQQERAASRRCLAKRLDAVQIFQKNQLPFGLIFGSSSSFLLIVPEPPRRRCRKQEAGRIKVVR
TDTPSPSTTESEKENAEKEDQEKEKTKKKTKEEALMKQQVDKGKGVAEATVEAEEAETEEPRLSYEHFVNNLARAKYLAMLSGTSYLREESVNSNIVLEFYANIV
EEEDSQAVVCGTTVDWSPALVRVANTQIQYVFLFGDKTEWEAGDISKSSHCRISLPLYVSLHHLLLAIVAARASAPSSPPPLASPLRESLSLSLSLNFWFVWKSP
PVQPLPPRCVVTTTARLDLSSSRFVLVRSPVPSNSESRRPRSSRFRLCPATFLGVSSNDLQFWEFGVAVQQGNSFSRLNLAFQACLKNLHRVPWVIWPRGDAQFE
ALGNMVKGRTLSSIKSIVVLGTNGQGTVRLEGSVLESLVRATRIRSHRVPWVIWPRGDATVRGLGGQCDSKGLSWRALKGPRGVELRGLRGVELRELRGVERTQR
SQIELVRATYSVPWFCTNPPPGFAGAAIIFELGDVEET

Lag0005549 (gene) of Sponge gourd (AG-4) v1 genome