CuGenDBv2

Gene ID	Spg026221
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	LINE-1 retrotransposable element ORF2 protein
Genome location	scaffold13:14485360..14488706
RNA-Seq Expression	Spg026221
Synteny	Spg026221
Gene Ontology terms	GO:0016020 - membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0048674.1 Ankyrin repeat protein [Cucumis melo var. makuwa]

3.2e-27

43.88

Show/hide

Query:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC
        ++  CCA+V ATF D TGVV+ GLNHQFSFR FG    G P V G++  +V  Q   EAP GIAPVGL+T I+K+ KA S+ L+I           I + 
Subjt:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC

Query:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG
        KG   +S+ HE +  +G NI  S+GGKVS+KS GSV  S+GG I+      + K L SFG++ KK    S G + H+ K  + VS+   I++   G
Subjt:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG

KAA0048677.1 Ankyrin repeat protein [Cucumis melo var. makuwa]

1.9e-24

41.4

Show/hide

Query:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC
        ++  CCA+V ATF+D TGVV+ GLNHQFSFR FG    G P V GS+  +V  Q   EAP GIAPVGLETPI+K +K  S   +I           I + 
Subjt:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC

Query:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSL-FSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGGINA
        KG   VS+ HE    SG NI  S  GKVS+KS  SV  S+GG I+      + K L   FG+E KK    S G + HK           G+    G +N 
Subjt:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSL-FSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGGINA

Query:  KSKGSHRLSLNNKAS
               +S+N + S
Subjt:  KSKGSHRLSLNNKAS

KAE8646351.1 hypothetical protein Csa_023818, partial [Cucumis sativus]

1.8e-25

45.41

Show/hide

Query:  ATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIVVSHGH
        ATFNDVTGVV+L LNH FSFR FG    G P   GS+A +V+  +  EAP GIAPVGL+TPI+K +K  +FGLEI           I + +  +VVS  H
Subjt:  ATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIVVSHGH

Query:  EISKKSGVNIDISNGGKVSMKSSGSV----------LSNGGNIDVSKG-----GKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG
        EI+ KSG NI +S+GGK+S+K  G V          L + GN+ VS G      K+ K L SFG+E KK    S G +  K K    VSH   I++K  G
Subjt:  EISKKSGVNIDISNGGKVSMKSSGSV----------LSNGGNIDVSKG-----GKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG

Query:  INAKSKG
         +  SKG
Subjt:  INAKSKG

KAE8646352.1 hypothetical protein Csa_015951, partial [Cucumis sativus]

3.4e-29

48.6

Show/hide

Query:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC
        ++  CCA+V ATF+D TGVV+ GLNHQFSFR FG    G P V GS+  +V+ Q   EAP GIAPVGLET I+K++K  S+ L+I K +           
Subjt:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC

Query:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSK
         G  VVSH HE +  SG NI  S+GGKVS+KS GSV  S+GG I+  K   H     SFG+E KK    + G + HK K
Subjt:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSK

XP_023004881.1 uncharacterized protein LOC111498059 [Cucurbita maxima]

1.4e-17

33.86

Show/hide

Query:  CCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAPGIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIV
        CCA++ ATFNDVTGV+  G NH+FSFR FG H  GI K   +   S                  + +S D+KA SF  EIKKG    +G E+PK  G   
Subjt:  CCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAPGIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIV

Query:  VSHGHEISKKSGVNIDIS--------------NGGKVSMKSSGSVLSNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINL
         S GHEI +K G NI  S              NGG+ S K  G+ + +G NI +    K   ++     +   +  L  G+   KS G  V SH  GI+ 
Subjt:  VSHGHEISKKSGVNIDIS--------------NGGKVSMKSSGSVLSNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINL

Query:  KNGGINAKSKGSHRLSLNNKASRANSVPRIKKAILYLRNPDYSHLLCKNKG
         N G  A S G H +S N+  + A+         L     D  H +  + G
Subjt:  KNGGINAKSKGSHRLSLNNKASRANSVPRIKKAILYLRNPDYSHLLCKNKG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K5J0 Uncharacterized protein

9.1e-28

45.75

Show/hide

Query:  CAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIV
        C KV ATFNDVTGVV+L LNH FSFR FG    G P   GS+A +V+  +  EAP GIAPVGL+TPI+K +K  +FGLEI           I + +  +V
Subjt:  CAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIV

Query:  VSHGHEISKKSGVNIDISNGGKVSMKSSGSV----------LSNGGNIDVSKG-----GKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGIN
        VS  HEI+ KSG NI +S+GGK+S+K  G V          L + GN+ VS G      K+ K L SFG+E KK    S G +  K K    VSH   I+
Subjt:  VSHGHEISKKSGVNIDISNGGKVSMKSSGSV----------LSNGGNIDVSKG-----GKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGIN

Query:  LKNGGINAKSKG
        +K  G +  SKG
Subjt:  LKNGGINAKSKG

A0A0A0K7W7 Uncharacterized protein

8.8e-31

46.94

Show/hide

Query:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC
        ++  CCA+V ATF+D TGVV+ GLNHQFSFR FG    G P V GS+  +V  Q   EAP GIAPVGLET I+K++K  S+ L+I K +           
Subjt:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC

Query:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG
         G  VVSH HE +  SG NI  S+GGKVS+KS GSV  S+GG I+  K   H     SFG+E KK    + G + HK K  + VSH   I++   G
Subjt:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG

A0A0A0KAZ8 Uncharacterized protein

3.7e-29

47.89

Show/hide

Query:  TATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIVVSHG
        +ATF+D TGVV+ GLNHQFSFR FG    G P V GS+  +V+ Q   EAP GIAPVGLET I+K++K  S+ L+I K +            G  VVSH 
Subjt:  TATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKCKGDIVVSHG

Query:  HEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINL-KNGGIN
        HE +  SG NI  S+GGKVS+KS GSV  S+GG I+  K   H     SFG+E KK    + G + HK K  + VSH   I++ K G IN
Subjt:  HEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINL-KNGGIN

A0A5A7U057 Ankyrin repeat protein

1.6e-27

43.88

Show/hide

Query:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC
        ++  CCA+V ATF D TGVV+ GLNHQFSFR FG    G P V G++  +V  Q   EAP GIAPVGL+T I+K+ KA S+ L+I           I + 
Subjt:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC

Query:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG
        KG   +S+ HE +  +G NI  S+GGKVS+KS GSV  S+GG I+      + K L SFG++ KK    S G + H+ K  + VS+   I++   G
Subjt:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGG

A0A5A7U318 Ankyrin repeat protein

9.4e-25

41.4

Show/hide

Query:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC
        ++  CCA+V ATF+D TGVV+ GLNHQFSFR FG    G P V GS+  +V  Q   EAP GIAPVGLETPI+K +K  S   +I           I + 
Subjt:  SFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAP-GIAPVGLETPISKDNKALSFGLEIKKGLTTSLGFEIPKC

Query:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSL-FSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGGINA
        KG   VS+ HE    SG NI  S  GKVS+KS  SV  S+GG I+      + K L   FG+E KK    S G + HK           G+    G +N 
Subjt:  KGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVL-SNGGNIDVSKGGKHQKSL-FSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGGINA

Query:  KSKGSHRLSLNNKAS
               +S+N + S
Subjt:  KSKGSHRLSLNNKAS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G04650.1 RNA-directed DNA polymerase (reverse transcriptase)-related family protein

7.9e-08

30.39

Show/hide

Query:  PNGCFLCYKSLESMDYLFIRCDLAYPIWVFFHQATGFLLPIPLHVDQFYMEIFHW--KPNSQRHI--LIQSFFTATLWTLWNERNSRIFKGISRSSAQIR
        P  C LC    +S  +LF  C  +  +W FF  +T    P  L      M+  +W   P+ +++I  +I+  F + ++ +W ERN R+  G+SRS+  I 
Subjt:  PNGCFLCYKSLESMDYLFIRCDLAYPIWVFFHQATGFLLPIPLHVDQFYMEIFHW--KPNSQRHI--LIQSFFTATLWTLWNERNSRIFKGISRSSAQIR

Query:  ED
        +D
Subjt:  ED

AT4G05095.1 BEST Arabidopsis thaliana protein match is: RNA-directed DNA polymerase (reverse transcriptase)-related family protein (TAIR:AT4G04650.1)

5.7e-06

28.28

Show/hide

Query:  PNGCFLCYKSLESMDYLFIRCDLAYPIWVFFHQATGFLLPIPLHVDQFYMEIFHWKPNSQR----HILIQSFFTATLWTLWNERNSRIFKGISRSSAQI
        P+ C LC  + E  ++LF  C +++ +W        F+    L     +M+   W  +  R     ++I+  F A+++ LW ERN R+    SRSS  I
Subjt:  PNGCFLCYKSLESMDYLFIRCDLAYPIWVFFHQATGFLLPIPLHVDQFYMEIFHWKPNSQR----HILIQSFFTATLWTLWNERNSRIFKGISRSSAQI

AT5G18880.1 RNA-directed DNA polymerase (reverse transcriptase)-related family protein

1.1e-04

28.12

Show/hide

Query:  PNGCFLCYKSLESMDYLFIRCDLAYPIWVFFHQATGFLLPIPLHVDQFYMEIFHWKPNSQRHILIQSFFTATLWTLWNERNSRIFKGISRSSAQIR
        P+   LC    E+  +LF  C  +  IW FF  A+ F    P  +      I      S    +++    + ++ +W ERN+RIF  IS S++ +R
Subjt:  PNGCFLCYKSLESMDYLFIRCDLAYPIWVFFHQATGFLLPIPLHVDQFYMEIFHWKPNSQRHILIQSFFTATLWTLWNERNSRIFKGISRSSAQIR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATTAGCCCGAACGGGTGTTTCCTTTGCTACAAAAGTTTGGAAAGTATGGACTATCTCTTTATTCGTTGTGACCTTGCTTATCCCATTTGGGTGTTCTTCCATCAGGC
CACTGGTTTCCTTTTGCCGATTCCTCTCCATGTGGATCAATTTTATATGGAGATCTTTCATTGGAAGCCAAATTCTCAGAGGCATATTCTTATCCAATCATTCTTTACTG
CCACTTTGTGGACTTTGTGGAATGAGCGCAACAGTCGAATCTTCAAAGGGATCTCTCGCAGCTCTGCTCAAATTAGGGAGGATAGCTTTGCTCTTTCTGGATTTTGGCCG
TGTACCTCAAGCCTTTTTTGTAATTATGAAGCCTCTTCTATTTTCCTTATAATTGGGAGGCTTTCATGTAGCTTTTCCTTGTGTTGTGCAAAGGTAACTGCCACTTTCAA
CGATGTCACTGGTGTTGTCGATCTCGGCCTCAATCATCAATTTTCCTTCCGTGTATTTGGATCACATGGTTTTGGGATCCCAAAAGTTGGTGGTAGTGTCGCACCAAGTG
TAGACATGCAGAGTCCTGTAGAAGCACCAGGGATTGCCCCTGTTGGGCTTGAAACTCCAATAAGCAAAGACAATAAAGCTTTGTCTTTTGGTCTTGAAATTAAGAAGGGT
CTCACTACATCCCTTGGTTTTGAAATTCCCAAGTGTAAGGGCGACATTGTTGTTTCTCATGGTCACGAAATAAGTAAGAAGAGTGGCGTCAACATTGATATTTCCAATGG
TGGAAAAGTTAGTATGAAGAGCAGTGGTAGTGTTCTTTCAAATGGTGGCAACATTGATGTTTCCAAAGGTGGAAAACACCAAAAAAGCCTTTTCTCTTTTGGTCTTGAAA
CAAAGAAGAGCATGACCTTATCTCATGGTCAAAGAACTCACAAGAGTAAAGGTGGCATTGTTGTTTCTCATTGTCGTGGAATTAATCTTAAGAATGGAGGTATTAATGCA
AAGAGCAAAGGATCACATCGTCTGTCTTTAAATAACAAAGCGAGTCGCGCCAATAGTGTCCCCAGGATTAAGAAAGCAATCCTCTACCTCCGAAACCCTGATTATTCTCA
TCTTCTTTGCAAAAATAAGGGATGGGTCACAGTGGGAAATTTTTATGTTAAGTTCGAACGATGGGACTCTGAAATGCACGTTGCTGCTAAACTTGTTCCCAAATTACAGA
TGATCAAGGGTAATGCTTCACGGTTCGTACGGTGTTGCCGAACAAAGGAAAATGGATGGTTTGCTGAAACCCTAAGATCCATGGAACGTTTACTCGAGAAGCGTCTTTGG
AATATGATGAATTTGACGTCAAATCTGAATCATTTCTGTTCAGTGGAAATGAGGCATGCAGAGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MISPNGCFLCYKSLESMDYLFIRCDLAYPIWVFFHQATGFLLPIPLHVDQFYMEIFHWKPNSQRHILIQSFFTATLWTLWNERNSRIFKGISRSSAQIREDSFALSGFWP
CTSSLFCNYEASSIFLIIGRLSCSFSLCCAKVTATFNDVTGVVDLGLNHQFSFRVFGSHGFGIPKVGGSVAPSVDMQSPVEAPGIAPVGLETPISKDNKALSFGLEIKKG
LTTSLGFEIPKCKGDIVVSHGHEISKKSGVNIDISNGGKVSMKSSGSVLSNGGNIDVSKGGKHQKSLFSFGLETKKSMTLSHGQRTHKSKGGIVVSHCRGINLKNGGINA
KSKGSHRLSLNNKASRANSVPRIKKAILYLRNPDYSHLLCKNKGWVTVGNFYVKFERWDSEMHVAAKLVPKLQMIKGNASRFVRCCRTKENGWFAETLRSMERLLEKRLW
NMMNLTSNLNHFCSVEMRHAE

Spg026221 (gene) of Sponge gourd (cylindrica) v1 genome