CuGenDBv2

Gene ID	Lag0039038
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Reverse transcriptase
Genome location	chr2:34287783..34291371
RNA-Seq Expression	Lag0039038
Synteny	Lag0039038
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022151688.1 uncharacterized protein LOC111019603 [Momordica charantia]

5.3e-34

39.34

Show/hide

Query:  APPVLAAEALQAMLGNAF-LNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWN
        A   L   ALQA++ N+      Q +    A AL  E QFI+ F +  PP+F+G S+ +  V EW   LEA++ +LG + Q +V+GA FML+G A  WW+
Subjt:  APPVLAAEALQAMLGNAF-LNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWN

Query:  VVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAA
        VV   E+    PI+W+  K L++D++  +    E+E EF+ L Q TL V QY ++F E S     L+ TE  +I RFV GL   I+G + L RP T+A A
Subjt:  VVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAA

Query:  LASARMLDRDI
        +  A ++D+D+
Subjt:  LASARMLDRDI

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

3.3e-36

46.86

Show/hide

Query:  EVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQE
        E +FIK F +  PP+FDG S+ + AV EW   LEA++ +LG   Q +V+GA FML+G A  WW+ V   E+    PI W+ FK L++D++        +E
Subjt:  EVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQE

Query:  AEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAALASARMLDRDI
        AEF+ LVQGTLSV QY R+F ELS     L+ TE ++I RFV GLR  IRG V L RP T+A A+  A ++D+D+
Subjt:  AEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAALASARMLDRDI

XP_022156328.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111023249 [Momordica charantia]

2.0e-33

38.56

Show/hide

Query:  PPVPPPAPP---------VLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQ
        PPVP  AP           L AEALQ +L NA      Q      A    +EVQFI+ F    PP F+G S+   A  EW   LEA++ +LG +   +V+
Subjt:  PPVPPPAPP---------VLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQ

Query:  GAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEI
        GA FML+G A  WW  V   E+    P++W+ FK L+++++    A  E+  EF+ L QG+L+V QY R+F ELS      V TE+++I++F++GLR EI
Subjt:  GAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEI

Query:  RGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG
        +GL+ L  P T+AAA+  A ++D+  + P++ + +G
Subjt:  RGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG

XP_022156546.1 uncharacterized protein LOC111023424 [Momordica charantia]

6.3e-35

37.45

Show/hide

Query:  PDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNAFLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQ
        P  P +       PP PP A   LA     A +G A     +H+    +     E QFIK F +  PP+F G S+ +    EW   LEA++ +LG   Q 
Subjt:  PDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNAFLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQ

Query:  RVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLR
        +V+GA FML+  A  WW+ V  TE+    P+ W+ FK L++DH+     +  +E EF+ LVQGTL+V QY R+F ELS     L+ TE ++I RFV GL 
Subjt:  RVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLR

Query:  AEIRGLVRLCRPATFAAALASARMLDRDIP-------RTDRSLGLARHLVP
          IRG V L RP T+A A+    ++D+D+            SLG+ R + P
Subjt:  AEIRGLVRLCRPATFAAALASARMLDRDIP-------RTDRSLGLARHLVP

XP_022157413.1 uncharacterized protein LOC111024114 [Momordica charantia]

4.5e-33

37.96

Show/hide

Query:  GRSGPPDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFL
        GR  PP VP+  + P+  P V P     L AEALQ +L NA      Q      A    +EVQFI+ F +  PP F+G S+   A  EW   LEA++ +L
Subjt:  GRSGPPDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFL

Query:  GANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINR
        G +   +V+GA FML+G A  WW  V   E+    P++W+ FK L+++++       E+ AEF+ L QG+L+V QY R+F ELS      + TE+++I++
Subjt:  GANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINR

Query:  FVNGLRAEIRGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG
        F++GLR EI+GL+ +  P T+AAA+  A ++D+  + P++ + +G
Subjt:  FVNGLRAEIRGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DCW8 uncharacterized protein LOC111019603

2.6e-34

39.34

Show/hide

Query:  APPVLAAEALQAMLGNAF-LNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWN
        A   L   ALQA++ N+      Q +    A AL  E QFI+ F +  PP+F+G S+ +  V EW   LEA++ +LG + Q +V+GA FML+G A  WW+
Subjt:  APPVLAAEALQAMLGNAF-LNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWN

Query:  VVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAA
        VV   E+    PI+W+  K L++D++  +    E+E EF+ L Q TL V QY ++F E S     L+ TE  +I RFV GL   I+G + L RP T+A A
Subjt:  VVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAA

Query:  LASARMLDRDI
        +  A ++D+D+
Subjt:  LASARMLDRDI

A0A6J1DQB9 Reverse transcriptase

9.8e-34

38.56

Show/hide

Query:  PPVPPPAPP---------VLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQ
        PPVP  AP           L AEALQ +L NA      Q      A    +EVQFI+ F    PP F+G S+   A  EW   LEA++ +LG +   +V+
Subjt:  PPVPPPAPP---------VLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQ

Query:  GAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEI
        GA FML+G A  WW  V   E+    P++W+ FK L+++++    A  E+  EF+ L QG+L+V QY R+F ELS      V TE+++I++F++GLR EI
Subjt:  GAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEI

Query:  RGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG
        +GL+ L  P T+AAA+  A ++D+  + P++ + +G
Subjt:  RGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG

A0A6J1DTA8 uncharacterized protein LOC111024114

2.2e-33

37.96

Show/hide

Query:  GRSGPPDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFL
        GR  PP VP+  + P+  P V P     L AEALQ +L NA      Q      A    +EVQFI+ F +  PP F+G S+   A  EW   LEA++ +L
Subjt:  GRSGPPDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNA-FLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFL

Query:  GANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINR
        G +   +V+GA FML+G A  WW  V   E+    P++W+ FK L+++++       E+ AEF+ L QG+L+V QY R+F ELS      + TE+++I++
Subjt:  GANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINR

Query:  FVNGLRAEIRGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG
        F++GLR EI+GL+ +  P T+AAA+  A ++D+  + P++ + +G
Subjt:  FVNGLRAEIRGLVRLCRPATFAAALASARMLDR--DIPRTDRSLG

A0A6J1DUM2 uncharacterized protein LOC111023247

1.6e-36

46.86

Show/hide

Query:  EVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQE
        E +FIK F +  PP+FDG S+ + AV EW   LEA++ +LG   Q +V+GA FML+G A  WW+ V   E+    PI W+ FK L++D++        +E
Subjt:  EVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQE

Query:  AEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAALASARMLDRDI
        AEF+ LVQGTLSV QY R+F ELS     L+ TE ++I RFV GLR  IRG V L RP T+A A+  A ++D+D+
Subjt:  AEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAALASARMLDRDI

A0A6J1DVA0 uncharacterized protein LOC111023424

3.1e-35

37.45

Show/hide

Query:  PDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNAFLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQ
        P  P +       PP PP A   LA     A +G A     +H+    +     E QFIK F +  PP+F G S+ +    EW   LEA++ +LG   Q 
Subjt:  PDVPEVNSHPEANPPVPPPAPPVLAAEALQAMLGNAFLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQ

Query:  RVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLR
        +V+GA FML+  A  WW+ V  TE+    P+ W+ FK L++DH+     +  +E EF+ LVQGTL+V QY R+F ELS     L+ TE ++I RFV GL 
Subjt:  RVQGAAFMLKGHARTWWNVVGQTENRPENPISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLR

Query:  AEIRGLVRLCRPATFAAALASARMLDRDIP-------RTDRSLGLARHLVP
          IRG V L RP T+A A+    ++D+D+            SLG+ R + P
Subjt:  AEIRGLVRLCRPATFAAALASARMLDRDIP-------RTDRSLGLARHLVP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGGGATTGTCCTTTGATTTGTACGGGTGAGAGTGGCCAGTTCGCCGACTCAATAAGCCTACCATTTTGGGGACAAGACCGAATGGGGAGCTGGGAACGTAGTCTTAC
AAGATGGAATTCACTCCTTCCTGATATGAGGAGAATTCTCAGAAAAGAGAAAATCCAGAGAAAATCCTTAGAGTCTGTTGAGTTCCCACAAGCTCCCAACGCGTATCCTG
CTGAGAATACTGGTGAAACCACGTGGTGGTGTTCGTGGCAAACTCTTCCAGCGAAAAAGGAATTGGAAGTTGCTGTATTTTTAGGAAAAATTCAAAGAATTCGGCGAAAA
GTTCAAGGATTTCTTCAAAGTCCAATGTACGCCGTTATGCTGCCGAAATTTTCGGTGCTCACGGTTTGTTTTGGTCTAGGAGTTAGTAATGTCGCTGGGTTAGCTTTTAA
AATCCTGGGGCGTTACAGTTGGTATCAGAGCAGAGTTGTTCCTGTAGACTGGCCTAGGAAATCTAGGTTGTTTGGATGTTTAGGATTGTGGTCTTCCTCGTTCTCCTCTC
CATCACCAGCGATGAGTTCCAGTAGCAGTCAAGGTAGTGGACGTTCTGGCCCCCCAGACGTTCCCGAGGTTAATTCGCATCCTGAGGCGAATCCTCCTGTTCCTCCCCCA
GCGCCTCCTGTGCTGGCAGCAGAGGCATTGCAGGCGATGCTTGGCAATGCGTTCCTGAACAATCTGCAGCACGTCGGTGCAAATGGAGCCCCTGCTCTTGGCGAAGAAGT
GCAGTTTATCAAGAGCTTCATGAAGGCGAAGCCTCCTTCATTCGATGGGCACTCGGATAGTTCTGAAGCAGTGGTAGAATGGACCGCCGCATTGGAAGCGATATTTCAAT
TTCTTGGAGCTAATGCCCAACAGCGGGTCCAAGGAGCTGCCTTTATGCTCAAAGGCCACGCACGCACTTGGTGGAACGTTGTGGGTCAAACCGAGAACCGCCCAGAGAAT
CCCATTTCCTGGTCGGGGTTCAAAGGTCTTGTGTGGGACCATTTTGGTTGTCGTTTTGCTGATGTTGAGCAAGAAGCAGAGTTTGTCTCTCTTGTTCAAGGGACCTTGTC
TGTGGAGCAGTACGCCAGAAGGTTTGAAGAGTTATCCTGCCGAGTCCCAGGGTTGGTTGCCACCGAGGAGATTAGGATCAACCGATTCGTTAATGGGCTCCGCGCAGAAA
TTCGAGGTTTGGTCCGGCTTTGTCGACCGGCCACTTTTGCAGCAGCTCTAGCAAGCGCTCGGATGTTGGATAGGGACATCCCCAGGACGGATCGGTCCCTAGGGCTGGCA
CGTCATCTGGTGCCAAGAAGAAGAGCGAAGTGGAAGTGCTTGCAGCTAGTCAGAAGGTCAGAAGTTCTCCGTCAGGATCTAGCGCGTGCACTGAGGAGTTCTTGCCCTGT
GTCACCGATGTGGAGCTCAAGGCAGAATACCCAGAGCTTTACGATGTCGATGGTTCTGATGATGAAGATAGTTCCTAAGGTGGGGAGTCAGCATGCCCCTCGCTCAAGAT
CTTCTGTTCCTCAGTTCGTTCAAGGCTCGATTGGTGTCGTCGGGTTTCTAAGGATTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MRDCPLICTGESGQFADSISLPFWGQDRMGSWERSLTRWNSLLPDMRRILRKEKIQRKSLESVEFPQAPNAYPAENTGETTWWCSWQTLPAKKELEVAVFLGKIQRIRRK
VQGFLQSPMYAVMLPKFSVLTVCFGLGVSNVAGLAFKILGRYSWYQSRVVPVDWPRKSRLFGCLGLWSSSFSSPSPAMSSSSSQGSGRSGPPDVPEVNSHPEANPPVPPP
APPVLAAEALQAMLGNAFLNNLQHVGANGAPALGEEVQFIKSFMKAKPPSFDGHSDSSEAVVEWTAALEAIFQFLGANAQQRVQGAAFMLKGHARTWWNVVGQTENRPEN
PISWSGFKGLVWDHFGCRFADVEQEAEFVSLVQGTLSVEQYARRFEELSCRVPGLVATEEIRINRFVNGLRAEIRGLVRLCRPATFAAALASARMLDRDIPRTDRSLGLA
RHLVPRRRAKWKCLQLVRRSEVLRQDLARALRSSCPVSPMWSSRQNTQSFTMSMVLMMKIVPKVGSQHAPRSRSSVPQFVQGSIGVVGFLRI

Lag0039038 (gene) of Sponge gourd (AG-4) v1 genome