CuGenDBv2

Gene ID	Lag0032227
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Retrovirus-related Pol polyprotein from transposon RE1
Genome location	chr11:27703331..27718014
RNA-Seq Expression	Lag0032227
Synteny	Lag0032227
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

TXG55646.1 hypothetical protein EZV62_020902 [Acer yangbiense]

9.5e-82

42.79

Show/hide

Query:  VATICKKKNL-----STWHCGPT-QPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQL
        V TI K   L     ST  C P   PS     ++DSG     NP +++W   DQ L GWL+ SM+  +A  V+   T+  +WKALE ++GA SKS+ N +
Subjt:  VATICKKKNL-----STWHCGPT-QPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQL

Query:  RDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLA
        R  +Q T+KGS  M EYL  MK  +++L +AG+P   + L +  LAGLDSEY+PIV  IE ++  TWQE    L++++  L     V    N    P  +
Subjt:  RDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLA

Query:  AHFAYNRNNQSTGQRHFSSNRG-NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGG
        AH A N+ N +      S+ +  NQG    P     NRG  RG GGR     GRNN    NS+PTCQ+CGK+GHSA  CY R+++ +     + N+N   
Subjt:  AHFAYNRNNQSTGQRHFSSNRG-NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGG

Query:  SSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTA
            S S ++ATPE ++D  W  DSGATNHVT D GNL  K+ Y G ESL+VGNG +L +SHVG  S+ S + + ++ L  +LHVP+I +NL+S++RL  
Subjt:  SSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTA

Query:  DNNVYVEFHPGFCLVKDKASRRVILHGTLKDGLYQLELPSIQNS
        DN+V++EFH   C VKDK +R  +L G LK+GLYQLE+P+ +++
Subjt:  DNNVYVEFHPGFCLVKDKASRRVILHGTLKDGLYQLELPSIQNS

TXG67243.1 hypothetical protein EZV62_008518 [Acer yangbiense]

5.2e-80

42.65

Show/hide

Query:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK
        P  PS     ++DSG     NP +++W   DQ L GWL+ SM+  +A  V+   T+  +WKALE ++GA SKS+ N +R  +Q T+KGS  M EYL  MK
Subjt:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK

Query:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG
          +++L +AG+P   + L + +LAGLDSEY+PIV  IE ++  TWQE    L++++  L     V    N    P  +AH A N+ N +      S+ + 
Subjt:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG

Query:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL
         NQG    P     NRG  RG GGR     GRNN    NS+PTCQ+CGK+GHSA  CY R+++ +     + N+N       S S ++ATPE ++D  W 
Subjt:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL

Query:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR
         DSGAT+HVT D GNL  K+ Y G ESL+VGNG +L +SHVG  S+ S + + ++ L  +LHVP+I +NL+S++RL  DN+V++EFH   C VKDK +  
Subjt:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR

Query:  VILHGTLKDGLYQLELPSIQNS
         +L G LK+GLYQLE+P+ +++
Subjt:  VILHGTLKDGLYQLELPSIQNS

TXG69253.1 hypothetical protein EZV62_004188 [Acer yangbiense]

1.4e-80

42.89

Show/hide

Query:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK
        P  PS     ++DSG     NP +++W   DQ L GWL+ SM+  +A  V+   T+  +WKALE ++GA SKS+ N +R  +Q T+KGS  M EYL  MK
Subjt:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK

Query:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG
          +++L +AG+P   + L + +LAGLDSEY+PIV  IE ++  TWQE    L++++  L     V    N    P  +AH A N+ N +      S+ + 
Subjt:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG

Query:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL
         NQG    P     NRG  RG GGR     GRNN    NS+PTCQ+CGK+GHSA  CY R+++ +     + N+N       S S ++ATPE ++D  W 
Subjt:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL

Query:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR
         DSGATNHVT D GNL  K+ Y G ESL+VGNG +L +SHVG  S+ S + + ++ L  +LHVP+I +NL+S++RL  DN+V++EFH   C VKDK +  
Subjt:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR

Query:  VILHGTLKDGLYQLELPSIQNS
         +L G LK+GLYQLE+P+ +++
Subjt:  VILHGTLKDGLYQLELPSIQNS

XP_022157748.1 uncharacterized protein LOC111024384 isoform X1 [Momordica charantia]

7.6e-79

53.53

Show/hide

Query:  LEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSD
        L+ NP + EW  VDQAL GWLFGSM+P+IA DVV F++SREVWKALE +YGATSK+RINQLR+VLQNTKK S+KM EYL +MKQASE+LKLAG PV+ + 
Subjt:  LEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSD

Query:  LISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRYTVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRGNQGQTTVPPNFSGNRGSN
        L+S  L+GL++EY+PIVC IE KD ++WQE  + L+ FE TL R  + +      + D + ++ +++ N S G R F  ++  QGQ     N +  + + 
Subjt:  LISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRYTVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRGNQGQTTVPPNFSGNRGSN

Query:  RGRGGRGRNNFQRG-NSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYH
        RGR GRGR +  RG NSKP+CQLCGKYGH A  CY RF+E FNN  +S NN         +SAY+A PEI+ +P WL DSGAT+HVT+D+ NL  K+ Y+
Subjt:  RGRGGRGRNNFQRG-NSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYH

Query:  GKESLIVGNGSK
        GK     G G+K
Subjt:  GKESLIVGNGSK

XP_022157750.1 uncharacterized protein LOC111024384 isoform X2 [Momordica charantia]

1.7e-78

53.97

Show/hide

Query:  LEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSD
        L+ NP + EW  VDQAL GWLFGSM+P+IA DVV F++SREVWKALE +YGATSK+RINQLR+VLQNTKK S+KM EYL +MKQASE+LKLAG PV+ + 
Subjt:  LEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSD

Query:  LISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRYTVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRGNQGQTTVPPNFSGNRGSN
        L+S  L+GL++EY+PIVC IE KD ++WQE  + L+ FE TL R  + +      + D + ++ +++ N S G R F  ++  QGQ     N +  + + 
Subjt:  LISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRYTVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRGNQGQTTVPPNFSGNRGSN

Query:  RGRGGRGRNNFQRG-NSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYH
        RGR GRGR +  RG NSKP+CQLCGKYGH A  CY RF+E FNN  +S NN         +SAY+A PEI+ +P WL DSGAT+HVT+D+ NL  K+ Y+
Subjt:  RGRGGRGRNNFQRG-NSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYH

Query:  GK
        G+
Subjt:  GK

TrEMBL top hits

e value

%identity

Alignment

A0A5C7HHE9 Uncharacterized protein

4.6e-82

42.79

Show/hide

Query:  VATICKKKNL-----STWHCGPT-QPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQL
        V TI K   L     ST  C P   PS     ++DSG     NP +++W   DQ L GWL+ SM+  +A  V+   T+  +WKALE ++GA SKS+ N +
Subjt:  VATICKKKNL-----STWHCGPT-QPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQL

Query:  RDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLA
        R  +Q T+KGS  M EYL  MK  +++L +AG+P   + L +  LAGLDSEY+PIV  IE ++  TWQE    L++++  L     V    N    P  +
Subjt:  RDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLA

Query:  AHFAYNRNNQSTGQRHFSSNRG-NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGG
        AH A N+ N +      S+ +  NQG    P     NRG  RG GGR     GRNN    NS+PTCQ+CGK+GHSA  CY R+++ +     + N+N   
Subjt:  AHFAYNRNNQSTGQRHFSSNRG-NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGG

Query:  SSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTA
            S S ++ATPE ++D  W  DSGATNHVT D GNL  K+ Y G ESL+VGNG +L +SHVG  S+ S + + ++ L  +LHVP+I +NL+S++RL  
Subjt:  SSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTA

Query:  DNNVYVEFHPGFCLVKDKASRRVILHGTLKDGLYQLELPSIQNS
        DN+V++EFH   C VKDK +R  +L G LK+GLYQLE+P+ +++
Subjt:  DNNVYVEFHPGFCLVKDKASRRVILHGTLKDGLYQLELPSIQNS

A0A5C7ID32 Uncharacterized protein

2.5e-80

42.65

Show/hide

Query:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK
        P  PS     ++DSG     NP +++W   DQ L GWL+ SM+  +A  V+   T+  +WKALE ++GA SKS+ N +R  +Q T+KGS  M EYL  MK
Subjt:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK

Query:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG
          +++L +AG+P   + L + +LAGLDSEY+PIV  IE ++  TWQE    L++++  L     V    N    P  +AH A N+ N +      S+ + 
Subjt:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG

Query:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL
         NQG    P     NRG  RG GGR     GRNN    NS+PTCQ+CGK+GHSA  CY R+++ +     + N+N       S S ++ATPE ++D  W 
Subjt:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL

Query:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR
         DSGAT+HVT D GNL  K+ Y G ESL+VGNG +L +SHVG  S+ S + + ++ L  +LHVP+I +NL+S++RL  DN+V++EFH   C VKDK +  
Subjt:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR

Query:  VILHGTLKDGLYQLELPSIQNS
         +L G LK+GLYQLE+P+ +++
Subjt:  VILHGTLKDGLYQLELPSIQNS

A0A5C7IJ06 Uncharacterized protein

6.7e-81

42.89

Show/hide

Query:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK
        P  PS     ++DSG     NP +++W   DQ L GWL+ SM+  +A  V+   T+  +WKALE ++GA SKS+ N +R  +Q T+KGS  M EYL  MK
Subjt:  PTQPSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMK

Query:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG
          +++L +AG+P   + L + +LAGLDSEY+PIV  IE ++  TWQE    L++++  L     V    N    P  +AH A N+ N +      S+ + 
Subjt:  QASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRG

Query:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL
         NQG    P     NRG  RG GGR     GRNN    NS+PTCQ+CGK+GHSA  CY R+++ +     + N+N       S S ++ATPE ++D  W 
Subjt:  -NQGQTTVPPNFSGNRGSNRGRGGR-----GRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWL

Query:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR
         DSGATNHVT D GNL  K+ Y G ESL+VGNG +L +SHVG  S+ S + + ++ L  +LHVP+I +NL+S++RL  DN+V++EFH   C VKDK +  
Subjt:  VDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRR

Query:  VILHGTLKDGLYQLELPSIQNS
         +L G LK+GLYQLE+P+ +++
Subjt:  VILHGTLKDGLYQLELPSIQNS

A0A803PEH4 Uncharacterized protein

2.9e-84

41.39

Show/hide

Query:  VATICKKKNLSTWHCGPTQ-PSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQ
        V+TI +   L  +  G    P EFV +    G     NP ++ W   DQ L GWL+ SM+  IA +V+   ++  + + LE +YGA SKS+++  R ++Q
Subjt:  VATICKKKNLSTWHCGPTQ-PSEFVEILTDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQ

Query:  NTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSR---YTVPTNTNTSDLPDLAAHF
         T+KGS  M EYL   K  S  L LAG+P   + L++  L GLD+EY+ IV  IE +  +TWQE   +L++F+  + R    T+ +N  TS  P   A+ 
Subjt:  NTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSR---YTVPTNTNTSDLPDLAAHF

Query:  AYNRNNQSTGQRHFSSNRGNQGQTTVPPNFSGNRGSNRGRGGRGRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEF-----NNPHASGNNNKGGSSTP
        A   NN   G+   S N      T     FS +RG++    GRGR       S+PTCQ+ GKYGH+A  CY RF+E +     NNPH   N NK G +  
Subjt:  AYNRNNQSTGQRHFSSNRGNQGQTTVPPNFSGNRGSNRGRGGRGRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEF-----NNPHASGNNNKGGSSTP

Query:  SSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNV
        + SA++ATPE+L    W  DSGA+NH+T+D  NL  K  Y+GKES++VGNGSKL ++H+GN  ++  SGN+++ L +ML VPKI++NL+S+++L  DNNV
Subjt:  SSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNV

Query:  YVEFHPGFCLVKDKASRRVILHGTLKDGLYQLELPSIQNSKSTVSPSSFLVDSAFN---KPSVNESIVKSPVVLQV
         +EF+  FCLVKDK +++V+LHG LKD LYQL+ P    S      S+FL  SAF      +VN+S   S ++ Q+
Subjt:  YVEFHPGFCLVKDKASRRVILHGTLKDGLYQLELPSIQNSKSTVSPSSFLVDSAFN---KPSVNESIVKSPVVLQV

A0A803QD97 Uncharacterized protein

7.1e-83

42.48

Show/hide

Query:  TQPSEFVEILTDSGK---KLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAV
        T P E++      G+     E NP F+ W   DQ L GWL+GSM+  IA +++   +S E+W +LE ++GA SK+++++ R  +Q  +KGSM MV+YL  
Subjt:  TQPSEFVEILTDSGK---KLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAV

Query:  MKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSN
         KQ S+ L LAG+P   S L+S  L+GLD EY+PIV  IE ++ +TWQ    +L++F+  L R  ++  N+  S+     A+ A    N+S    +   N
Subjt:  MKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIVCTIEDKDFSTWQEFSSVLINFEGTLSRY-TVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSN

Query:  RGNQGQTTVPPNFSGNRGSNRGR-GGRGRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDS
          N+G+        G+  ++RGR  GRGR+   RG  KPTCQ+CG+YGHSA YCY RF+E F      GN      S  +++A++ATPE+L D  W  +S
Subjt:  RGNQGQTTVPPNFSGNRGSNRGR-GGRGRNNFQRGNSKPTCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDS

Query:  GATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRRVIL
        GA+NHVT++  NL  KTKY+GK+SL VG+GSKL++ H G+  +S+++ + ++ L  MLHVPKI++NL+SI++LTADNNV VEF    C VKD  +++ +L
Subjt:  GATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRRVIL

Query:  HGTLKDGLYQLELPSIQNS
         G LK+GLYQ     +++S
Subjt:  HGTLKDGLYQLELPSIQNS

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

1.3e-36

28.64

Show/hide

Query:  TDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGN
        TD+  ++  NP +  W   D+ +   + G++S ++   V    T+ ++W+ L K+Y   S   + QLR  L+   KG+  + +Y+  +    + L L G 
Subjt:  TDSGKKLEPNPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGN

Query:  PVSLSDLISYALAGLDSEYIPIVCTIEDKDF-STWQEFSSVLINFEGTL----SRYTVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRGNQGQTTV
        P+   + +   L  L  EY P++  I  KD   T  E    L+N E  +    S   +P   N           A +  N +T   + + NR N+     
Subjt:  PVSLSDLISYALAGLDSEYIPIVCTIEDKDF-STWQEFSSVLINFEGTL----SRYTVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRGNQGQTTV

Query:  PPNFSGNRGSNRGRGGRGRNNFQRGN--SKP---TCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDSGATNH
            + N  +N     +   NF   N  SKP    CQ+CG  GHSA  C  + +   ++ ++    +      P ++  + +P   N+  WL+DSGAT+H
Subjt:  PPNFSGNRGSNRGRGGRGRNNFQRGN--SKP---TCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDSGATNH

Query:  VTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRRVILHGTLK
        +T+D  NL+    Y G + ++V +GS + +SH G++S+S+ S    + L+N+L+VP I +NLIS+ RL   N V VEF P    VKD  +   +L G  K
Subjt:  VTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRRVILHGTLK

Query:  DGLYQLELPSIQNSKSTVSPSSFLVDSAFN------KPSVNESIVKS
        D LY+  + S Q      SPSS    S+++       PS+  S++ +
Subjt:  DGLYQLELPSIQNSKSTVSPSSFLVDSAFN------KPSVNESIVKS

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

3.2e-32

27.96

Show/hide

Query:  NPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLIS
        NP +  W   D+ +   + G++S ++   V    T+ ++W+ L K+Y   S   + QLR + +                    + L L G P+   + + 
Subjt:  NPLFDEWNTVDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLIS

Query:  YALAGLDSEYIPIVCTIEDKDF-STWQEFSSVLINFEGTLSRYTVPTNTNTSDLPDLAAHFAYNRN-----NQSTGQRHFSSNRGNQGQTTVPPNFSGNR
          L  L  +Y P++  I  KD   +  E    LIN E  L         N++++  + A+   +RN     NQ+    + + N  N    +  P+ SG+R
Subjt:  YALAGLDSEYIPIVCTIEDKDF-STWQEFSSVLINFEGTLSRYTVPTNTNTSDLPDLAAHFAYNRN-----NQSTGQRHFSSNRGNQGQTTVPPNFSGNR

Query:  GSNRGRGGRGRNNFQRGNSKP---TCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSS-TP-SSSAYIATPEILNDPKWLVDSGATNHVTADVGNL
          NR               KP    CQ+C   GHSA  C      + +   ++ N  +  S  TP    A +A     N   WL+DSGAT+H+T+D  NL
Subjt:  GSNRGRGGRGRNNFQRGNSKP---TCQLCGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSS-TP-SSSAYIATPEILNDPKWLVDSGATNHVTADVGNL

Query:  ASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRRVILHGTLKDGLYQLEL
        +    Y G + +++ +GS + ++H G++S+ +SS +  + LN +L+VP I +NLIS+ RL   N V VEF P    VKD  +   +L G  KD LY+  +
Subjt:  ASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSGNFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRRVILHGTLKDGLYQLEL

Query:  PSIQNSKSTVSPSSFLVDSAFN
         S Q      SP S    S+++
Subjt:  PSIQNSKSTVSPSSFLVDSAFN

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTTGGCGGTGGGAAATGGTGGGAATGGAGGTTTTTGGCTCTCAAGGGTTTTTGGCGGTGGAAAATGGTGGGAATGGAAGTTCGTGGAAGACGAAGACGGACG
GACGGGCTGATGCATGAAGGTGGTTCTGGTGGGAGAGCATTTCCCTCGAAACGGAAGACAAAGTTACATCCAAGAGGGGATGGTCATTATCAAGTTCTTGAAAGT
ATTAACAACAATGCCTACAAGATTGATCTGTCGGGAGAATTTTCAGTAAGTTCTACTTTCAATGTTGTTGACTTGAGTCCTTTTGATGTAGGTGATGACTATCCT
GATTCGAGGATGAATCCTTTCGAAGAGGGGGAAGATGATAAGAATCATGGTGCTCCACACGTTCCAACTGGACCTATTACACATGCCAAGGCTAAGAAACTTCAA
CAAGCTAAGCATCATTTATTCACATACAAAATTGCTGGTGTTACGGACACTAGTGAAGGACTAACTAGTCGATATTGGTCTAGATCCGTGGACATAGAAAATATG
TCTGCAGTGAGAAGAGTGCAACTATTCTCAAAGACAAGACCTAGAATTCTCTCTAACCTCCCTCTTAGAGAAAGACTCCCACAAGTCTTTTGCCTCCTAGACTTA
GAGACATACCGGTGTAACCTCTGTGGTTATTGTGTCATTCAAAGAAGAAAATTCCAGCGATCAAGAGGCGAGGAGGCTGTTGCGTTTTCGTTCGTTGGAGCGTTG
TTGGCGAAGAACGGTCAAGTCTACAACGAAGTTCCCCATCTCCAGTTGTCTCCTCTGGCAAGTAGAGGCGGCGCAGTAGCGACAATTTGCAAGAAGAAGAACCTC
TCAACTTGGCACTGCGGACCGACCCAGCCGTCCGAATTTGTTGAGATTCTCACCGATTCAGGCAAGAAACTTGAGCCTAATCCTCTCTTTGATGAGTGGAACACT
GTCGATCAGGCATTATCTGGGTGGCTATTTGGCTCAATGTCACCTGCGATTGCAGCAGATGTAGTCAGTTTTAAGACATCTCGTGAAGTCTGGAAAGCCCTAGAG
AAGGTTTATGGAGCAACCAGCAAATCCAGAATTAATCAACTGAGAGACGTTCTTCAGAACACCAAGAAGGGTTCGATGAAGATGGTTGAGTACTTAGCGGTCATG
AAGCAAGCTTCGGAAAATCTTAAACTCGCTGGTAATCCTGTTTCTCTCAGTGACCTAATTTCTTATGCACTCGCTGGGTTGGATTCTGAGTATATCCCCATTGTT
TGTACGATTGAGGATAAAGATTTTAGCACTTGGCAGGAATTTTCCTCTGTTCTAATTAATTTTGAGGGAACATTATCTCGTTATACTGTGCCGACTAATACAAAT
ACTAGTGATCTTCCTGATCTTGCTGCACATTTTGCTTATAATCGCAACAACCAGTCTACGGGACAGCGCCATTTTAGTTCTAATCGAGGAAATCAAGGTCAGACT
ACCGTGCCTCCAAATTTCTCAGGAAACAGAGGCTCTAATCGTGGACGAGGTGGTCGCGGCAGGAACAATTTTCAGCGAGGAAATTCGAAACCCACTTGCCAACTT
TGCGGAAAATATGGGCATTCAGCCCCTTATTGTTATATGCGATTTGAGGAGGAGTTTAACAATCCTCATGCTTCTGGGAACAACAACAAAGGAGGGAGTTCCACA
CCTTCTTCTTCTGCGTACATAGCCACGCCAGAGATCTTGAATGACCCAAAGTGGTTGGTTGATAGTGGTGCAACGAACCATGTGACAGCGGACGTTGGTAATTTG
GCTTCTAAAACTAAGTATCATGGTAAAGAGTCCTTAATTGTGGGTAATGGATCTAAGTTAGTCGTCTCACATGTTGGTAATAGCTCCATAAGTAGTTCTTCTGGT
AATTTTATGGTGAAATTGAATAACATGCTTCATGTTCCCAAAATCAGTAGAAACCTGATTAGTATTGCCCGTTTGACTGCTGACAATAATGTATATGTTGAATTT
CACCCTGGTTTTTGTCTTGTGAAGGACAAGGCTTCAAGGAGGGTGATATTGCACGGAACGCTTAAGGACGGTCTATACCAGCTGGAGCTACCTTCAATTCAAAAT
TCTAAGTCCACTGTCAGCCCTAGTTCTTTTCTTGTTGATTCTGCTTTCAATAAGCCGTCTGTGAATGAGTCTATTGTCAAAAGTCCTGTTGTTCTCCAAGTTCAA
TGTTCCCCATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFGGGKWWEWRFLALKGFWRWKMVGMEVRGRRRRTDGLMHEGGSGGRAFPSKRKTKLHPRGDGHYQVLESINNNAYKIDLSGEFSVSSTFNVVDLSPFDVGDDYP
DSRMNPFEEGEDDKNHGAPHVPTGPITHAKAKKLQQAKHHLFTYKIAGVTDTSEGLTSRYWSRSVDIENMSAVRRVQLFSKTRPRILSNLPLRERLPQVFCLLDL
ETYRCNLCGYCVIQRRKFQRSRGEEAVAFSFVGALLAKNGQVYNEVPHLQLSPLASRGGAVATICKKKNLSTWHCGPTQPSEFVEILTDSGKKLEPNPLFDEWNT
VDQALSGWLFGSMSPAIAADVVSFKTSREVWKALEKVYGATSKSRINQLRDVLQNTKKGSMKMVEYLAVMKQASENLKLAGNPVSLSDLISYALAGLDSEYIPIV
CTIEDKDFSTWQEFSSVLINFEGTLSRYTVPTNTNTSDLPDLAAHFAYNRNNQSTGQRHFSSNRGNQGQTTVPPNFSGNRGSNRGRGGRGRNNFQRGNSKPTCQL
CGKYGHSAPYCYMRFEEEFNNPHASGNNNKGGSSTPSSSAYIATPEILNDPKWLVDSGATNHVTADVGNLASKTKYHGKESLIVGNGSKLVVSHVGNSSISSSSG
NFMVKLNNMLHVPKISRNLISIARLTADNNVYVEFHPGFCLVKDKASRRVILHGTLKDGLYQLELPSIQNSKSTVSPSSFLVDSAFNKPSVNESIVKSPVVLQVQ
CSP

Lag0032227 (gene) of Sponge gourd (AG-4) v1 genome