CuGenDBv2

Gene ID	Lag0026022
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Reverse transcriptase
Genome location	chr10:26980815..26982256
RNA-Seq Expression	Lag0026022
Synteny	Lag0026022
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022149380.1 uncharacterized protein LOC111017810 [Momordica charantia]

4.3e-37

34.53

Show/hide

Query:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC
        +R+H+ E P  R +  A+       V P++P G      PP P AAP         + + +EALQ + DN         + P       EE QFIRDFK 
Subjt:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC

Query:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN--RWQQPKTMLI------------------------------EWKIKRFIKG
        +GPP F+G SE P  AE W+ +LEAL+  + C++  K+RG VFML+G    W + +   +                              + KI +FI G
Subjt:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN--RWQQPKTMLI------------------------------EWKIKRFIKG

Query:  LREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPLINPP-IESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKG
        LR EI+G + L    T+  A+  AL+MDK + ++PQ     GS+S VKRK +   +       Q  V+     P CPSC K H G CWL +++CFKC K 
Subjt:  LREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPLINPP-IESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKG

Query:  GHYAKDC
        GH+A++C
Subjt:  GHYAKDC

XP_022155000.1 uncharacterized protein LOC111022144 [Momordica charantia]

1.1e-32

34.66

Show/hide

Query:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------
        E+ FI+DFK YGPP+FDG+SE    AE WI +LEA +  + C D  K++G VFML+G                     W + K +L ++           
Subjt:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------

Query:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSP-LI
                                            KIKRF+KGL + IRG + L R A++ EA+  ALIMDK+VS K     E GS+S VKRK  P   
Subjt:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSP-LI

Query:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
        +P + + Q Q +     P CP+C K H G+CW   K CF+C +  H+A++C
Subjt:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

XP_022155925.1 uncharacterized protein LOC111022925 [Momordica charantia]

1.4e-32

32.65

Show/hide

Query:  PPPTPSAAPLLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKG
        PP  P    LL  +EALQ + DN         + P+    + EE QFIRDFK +GPP F+G SE P  AE W+ +LEAL+  + C+D  K+RG VFML+G
Subjt:  PPPTPSAAPLLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKG

Query:  N-------------------RWQQPKTMLIEW-----------------------------------------------KIKRFIKGLREEIRGSIALSR
                             W + K +L E+                                               KI +FI GLR EI+G + L  
Subjt:  N-------------------RWQQPKTMLIEW-----------------------------------------------KIKRFIKGLREEIRGSIALSR

Query:  HATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
          T+  A+  AL+MDK + ++PQ     GS+S VKRK +    + P    Q   +     P CPSC K H G CW+ +++C++C K GH+A++C
Subjt:  HATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

2.6e-34

35.06

Show/hide

Query:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------
        E++FI+DFK YGPP+FDG+SE     E WI +LEAL+  + C D  K++G VFML+G                     W + K +L ++           
Subjt:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------

Query:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKL-SPLI
                                            KIKRF+KGLR+ IRG + L R  T+ EA+  AL+MDK+VS K  P  E GS+S VKRK  S   
Subjt:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKL-SPLI

Query:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
        +  + + Q+Q +     P CP+C K H G+CW   K CF+C + GH+A++C
Subjt:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

XP_022156328.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111023249 [Momordica charantia]

1.5e-34

31.38

Show/hide

Query:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC
        +R+H+ E P +R ++ A+       V+P++P G      PP P AAP         + + +EALQ +  N         + P       +E QFIRDFKC
Subjt:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC

Query:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN-------------------RWQQPKTMLIEW---------------------
        +GPP F+G SE P  AE W+ +LEAL+  + C+D  K+RG VFML+G                     W + K +L E+                     
Subjt:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN-------------------RWQQPKTMLIEW---------------------

Query:  --------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQ
                                  KI +FI GLR EI+G + L    T+  A+  AL+MDK + ++PQ     GS S VKRK +    +      Q  
Subjt:  --------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQ

Query:  VKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
         +     P CPSC K H   CWL +K+CFKC K GH+ ++C
Subjt:  VKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D5J7 uncharacterized protein LOC111017810

2.1e-37

34.53

Show/hide

Query:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC
        +R+H+ E P  R +  A+       V P++P G      PP P AAP         + + +EALQ + DN         + P       EE QFIRDFK 
Subjt:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC

Query:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN--RWQQPKTMLI------------------------------EWKIKRFIKG
        +GPP F+G SE P  AE W+ +LEAL+  + C++  K+RG VFML+G    W + +   +                              + KI +FI G
Subjt:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN--RWQQPKTMLI------------------------------EWKIKRFIKG

Query:  LREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPLINPP-IESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKG
        LR EI+G + L    T+  A+  AL+MDK + ++PQ     GS+S VKRK +   +       Q  V+     P CPSC K H G CWL +++CFKC K 
Subjt:  LREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPLINPP-IESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKG

Query:  GHYAKDC
        GH+A++C
Subjt:  GHYAKDC

A0A6J1DL73 uncharacterized protein LOC111022144

5.3e-33

34.66

Show/hide

Query:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------
        E+ FI+DFK YGPP+FDG+SE    AE WI +LEA +  + C D  K++G VFML+G                     W + K +L ++           
Subjt:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------

Query:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSP-LI
                                            KIKRF+KGL + IRG + L R A++ EA+  ALIMDK+VS K     E GS+S VKRK  P   
Subjt:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSP-LI

Query:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
        +P + + Q Q +     P CP+C K H G+CW   K CF+C +  H+A++C
Subjt:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

A0A6J1DNV8 uncharacterized protein LOC111022925

7.0e-33

32.65

Show/hide

Query:  PPPTPSAAPLLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKG
        PP  P    LL  +EALQ + DN         + P+    + EE QFIRDFK +GPP F+G SE P  AE W+ +LEAL+  + C+D  K+RG VFML+G
Subjt:  PPPTPSAAPLLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKG

Query:  N-------------------RWQQPKTMLIEW-----------------------------------------------KIKRFIKGLREEIRGSIALSR
                             W + K +L E+                                               KI +FI GLR EI+G + L  
Subjt:  N-------------------RWQQPKTMLIEW-----------------------------------------------KIKRFIKGLREEIRGSIALSR

Query:  HATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
          T+  A+  AL+MDK + ++PQ     GS+S VKRK +    + P    Q   +     P CPSC K H G CW+ +++C++C K GH+A++C
Subjt:  HATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

A0A6J1DQB9 Reverse transcriptase

7.5e-35

31.38

Show/hide

Query:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC
        +R+H+ E P +R ++ A+       V+P++P G      PP P AAP         + + +EALQ +  N         + P       +E QFIRDFKC
Subjt:  SRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQRRVDPPPTPSAAP---------LLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKC

Query:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN-------------------RWQQPKTMLIEW---------------------
        +GPP F+G SE P  AE W+ +LEAL+  + C+D  K+RG VFML+G                     W + K +L E+                     
Subjt:  YGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGN-------------------RWQQPKTMLIEW---------------------

Query:  --------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQ
                                  KI +FI GLR EI+G + L    T+  A+  AL+MDK + ++PQ     GS S VKRK +    +      Q  
Subjt:  --------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPL-INPPIESTQKQ

Query:  VKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
         +     P CPSC K H   CWL +K+CFKC K GH+ ++C
Subjt:  VKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

A0A6J1DUM2 uncharacterized protein LOC111023247

1.3e-34

35.06

Show/hide

Query:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------
        E++FI+DFK YGPP+FDG+SE     E WI +LEAL+  + C D  K++G VFML+G                     W + K +L ++           
Subjt:  ESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNR-------------------WQQPKTMLIEW-----------

Query:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKL-SPLI
                                            KIKRF+KGLR+ IRG + L R  T+ EA+  AL+MDK+VS K  P  E GS+S VKRK  S   
Subjt:  ------------------------------------KIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKL-SPLI

Query:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC
        +  + + Q+Q +     P CP+C K H G+CW   K CF+C + GH+A++C
Subjt:  NPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKCNKGGHYAKDC

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTACGTCGTCATGCTGCTGAAATTTTCGGTGCACACGGTTAGTTTTGGGTTAAGAGTTAGTAATGTCGCTAGGATAGCTATTAAAATCCTGGGGCGTTACAGTTGGTA
TCAGAGCGGACTTTTTCCTGTAGACTGGCCTAGGAAATCTAGGTTGTTTGGATGTTTAGGGTTATGGTCTTCATCGTTCTCCTCTCCATCACCAGTACCACCTTCTCAGG
CAATGTCTCGTAGTCATGATCCTGAAGTTCCAACTGTCAGGGAAGATGACCAAGCAGAGGAAGTTACTATGCTGCAAGAGGTTAATCCCCTGATTCCTCCCGGTCAGCGT
AGGGTTGATCCTCCTCCAACCCCTTCTGCAGCTCCTTTGCTGATCACTTCGGAAGCCCTCCAGACCATGTTCGATAACATGGCCCAGAGAAATGCTAGGCCACGGCGGAA
CCCTAATTGGGTACCTGAGAACGCGGAGGAATCCCAGTTCATTAGGGACTTCAAGTGCTACGGGCCTCCCTCCTTTGATGGGCAATCCGAAAATCCGTTGGTAGCAGAAC
GGTGGATCGCTGATTTGGAGGCACTGTTTGACCTCATGAACTGTAATGATTCCTTGAAGATTAGAGGACCAGTCTTCATGCTCAAGGGCAATCGATGGCAGCAGCCAAAG
ACCATGCTAATCGAGTGGAAGATCAAGAGGTTCATTAAAGGTCTTCGTGAGGAAATTCGTGGCTCTATAGCCCTGAGTAGGCATGCGACCTTTGTTGAAGCACTCATAAG
TGCATTGATCATGGATAAGAATGTTTCCAAGAAGCCACAACCTTATCTTGAGAAGGGATCAACCTCTAGAGTTAAAAGAAAGTTGTCTCCCCTGATAAACCCACCTATTG
AGTCTACTCAGAAGCAAGTGAAAGAGTACATTCCATATCCTCCTTGCCCTTCTTGTCACAAGCTTCACAAAGGAGAGTGTTGGCTAAAAAGAAAAGTTTGCTTCAAGTGC
AATAAGGGAGGTCACTATGCTAAGGATTGTTCATCATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MYVVMLLKFSVHTVSFGLRVSNVARIAIKILGRYSWYQSGLFPVDWPRKSRLFGCLGLWSSSFSSPSPVPPSQAMSRSHDPEVPTVREDDQAEEVTMLQEVNPLIPPGQR
RVDPPPTPSAAPLLITSEALQTMFDNMAQRNARPRRNPNWVPENAEESQFIRDFKCYGPPSFDGQSENPLVAERWIADLEALFDLMNCNDSLKIRGPVFMLKGNRWQQPK
TMLIEWKIKRFIKGLREEIRGSIALSRHATFVEALISALIMDKNVSKKPQPYLEKGSTSRVKRKLSPLINPPIESTQKQVKEYIPYPPCPSCHKLHKGECWLKRKVCFKC
NKGGHYAKDCSS

Lag0026022 (gene) of Sponge gourd (AG-4) v1 genome