CuGenDBv2

Gene ID	Lag0005953
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Copia-like polyprotein
Genome location	chr6:34498825..34500645
RNA-Seq Expression	Lag0005953
Synteny	Lag0005953
Gene Ontology terms	GO:0016020 - membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

TXG55646.1 hypothetical protein EZV62_020902 [Acer yangbiense]

7.4e-79

40.09

Show/hide

Query:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE---RNPLFDEWVTVDRA
        S++   TP  +   S SS  SS FG+ L+    +KLD + F+LW+ MV  I++G ++DG++  T   P E +   T  G        NP +++W+  D+ 
Subjt:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE---RNPLFDEWVTVDRA

Query:  LSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPI
        L GWL+ SMT ++A  V+   T+  +WKALE ++GA SK++ N++R  +Q T+KG+  M EYL  MK  +++L +AG+P     L + +LAGLDSEY+PI
Subjt:  LSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPI

Query:  VCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGNRGRGRGRN
        V  IE ++  TWQE+   L++++  L    N S     +   +AH A+N+  P  T        +N  SN QN +Q  +   ++  +R GG R RGRG  
Subjt:  VCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGNRGRGRGRN

Query:  QRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLH
           +RP+CQ+CGK+GHSA  CY R+D+ +     T+N+    N+   S ++A+PE ++D  W ADSGATNHVT D GNL +K++Y G + L VGNG +L 
Subjt:  QRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLH

Query:  VSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL
        +SH+G   +PS+T K S++LK +LHVP+I++NL+S++RL
Subjt:  VSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL

TXG67243.1 hypothetical protein EZV62_008518 [Acer yangbiense]

1.8e-77

39.37

Show/hide

Query:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE-----------RNPLFD
        S++  +TP  +   S SS  SS FG+ L+    +KLD + F+LW+ MV  I++G ++DG++  T   P E +   T  G                NP ++
Subjt:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE-----------RNPLFD

Query:  EWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAG
        +W+  D+ L GWL+ SMT ++A  V+   T+  +WKALE ++GA SK++ N++R  +Q T+KG+  M EYL  MK  +++L +AG+P     L +  LAG
Subjt:  EWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAG

Query:  LDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGN
        LDSEY+PIV  IE ++  TWQE+   L++++  L    N S     +   +AH A+N+  P  T        +N  SN QN +Q  +   ++  +R GG 
Subjt:  LDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGN

Query:  RGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLT
        R RGRG     +RP+CQ+CGK+GHSA  CY R+D+ +     T+N+    N+   S ++A+PE ++D  W ADSGAT+HVT D GNL +K+DY G + L 
Subjt:  RGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLT

Query:  VGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL
        VGNG +L +SH+G   +PS+T K S++LK +LHVP+I++NL+S++RL
Subjt:  VGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL

TXG69253.1 hypothetical protein EZV62_004188 [Acer yangbiense]

4.8e-78

39.6

Show/hide

Query:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE-----------RNPLFD
        S++  +TP  +   S SS  SS FG+ L+    +KLD + F+LW+ MV  I++G ++DG++  T   P E +   T  G                NP ++
Subjt:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE-----------RNPLFD

Query:  EWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAG
        +W+  D+ L GWL+ SMT ++A  V+   T+  +WKALE ++GA SK++ N++R  +Q T+KG+  M EYL  MK  +++L +AG+P     L +  LAG
Subjt:  EWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAG

Query:  LDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGN
        LDSEY+PIV  IE ++  TWQE+   L++++  L    N S     +   +AH A+N+  P  T        +N  SN QN +Q  +   ++  +R GG 
Subjt:  LDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGN

Query:  RGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLT
        R RGRG     +RP+CQ+CGK+GHSA  CY R+D+ +     T+N+    N+   S ++A+PE ++D  W ADSGATNHVT D GNL +K+DY G + L 
Subjt:  RGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLT

Query:  VGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL
        VGNG +L +SH+G   +PS+T K S++LK +LHVP+I++NL+S++RL
Subjt:  VGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL

XP_022157748.1 uncharacterized protein LOC111024384 isoform X1 [Momordica charantia]

9.2e-98

54.64

Show/hide

Query:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS
        +N  + TP     + S   ++SFGHPL TVLTVKLDDK + LWRGMVLA+LRGQK DGYVLGT+A+P + +      G    L+ NP + EW  VD+AL 
Subjt:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS

Query:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC
        GWLFGSMTPSIA DVV+F++SREVWKALE++YGA+SKARIN LR +LQNTKK ++KM EYL +MKQASE+L+LAG PV+   L+S VL+GL++EY+PIVC
Subjt:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC

Query:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ
         IE KD  +WQEL + L+ FE TL R    S A       A   S+  S  +   +Q   G+      Q+G Q Q  G+  SN    N RGRGRGR    
Subjt:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ

Query:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSK
        RGN  +PSCQLCGKYGH A  CY RFDE FNN  ++SNNN+      +SAY+A PEI+ +P WLADSGAT+HVT+D+ NL +K+DYNGK     G G+K
Subjt:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSK

XP_022157750.1 uncharacterized protein LOC111024384 isoform X2 [Momordica charantia]

3.5e-97

55.01

Show/hide

Query:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS
        +N  + TP     + S   ++SFGHPL TVLTVKLDDK + LWRGMVLA+LRGQK DGYVLGT+A+P + +      G    L+ NP + EW  VD+AL 
Subjt:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS

Query:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC
        GWLFGSMTPSIA DVV+F++SREVWKALE++YGA+SKARIN LR +LQNTKK ++KM EYL +MKQASE+L+LAG PV+   L+S VL+GL++EY+PIVC
Subjt:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC

Query:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ
         IE KD  +WQEL + L+ FE TL R    S A       A   S+  S  +   +Q   G+      Q+G Q Q  G+  SN    N RGRGRGR    
Subjt:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ

Query:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGK
        RGN  +PSCQLCGKYGH A  CY RFDE FNN  ++SNNN+      +SAY+A PEI+ +P WLADSGAT+HVT+D+ NL +K+DYNG+
Subjt:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGK

TrEMBL top hits

e value

%identity

Alignment

A0A5C7HHE9 Uncharacterized protein

3.6e-79

40.09

Show/hide

Query:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE---RNPLFDEWVTVDRA
        S++   TP  +   S SS  SS FG+ L+    +KLD + F+LW+ MV  I++G ++DG++  T   P E +   T  G        NP +++W+  D+ 
Subjt:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE---RNPLFDEWVTVDRA

Query:  LSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPI
        L GWL+ SMT ++A  V+   T+  +WKALE ++GA SK++ N++R  +Q T+KG+  M EYL  MK  +++L +AG+P     L + +LAGLDSEY+PI
Subjt:  LSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPI

Query:  VCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGNRGRGRGRN
        V  IE ++  TWQE+   L++++  L    N S     +   +AH A+N+  P  T        +N  SN QN +Q  +   ++  +R GG R RGRG  
Subjt:  VCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGNRGRGRGRN

Query:  QRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLH
           +RP+CQ+CGK+GHSA  CY R+D+ +     T+N+    N+   S ++A+PE ++D  W ADSGATNHVT D GNL +K++Y G + L VGNG +L 
Subjt:  QRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLH

Query:  VSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL
        +SH+G   +PS+T K S++LK +LHVP+I++NL+S++RL
Subjt:  VSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL

A0A5C7IJ06 Uncharacterized protein

2.3e-78

39.6

Show/hide

Query:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE-----------RNPLFD
        S++  +TP  +   S SS  SS FG+ L+    +KLD + F+LW+ MV  I++G ++DG++  T   P E +   T  G                NP ++
Subjt:  SNAGISTPATIPV-SASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLE-----------RNPLFD

Query:  EWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAG
        +W+  D+ L GWL+ SMT ++A  V+   T+  +WKALE ++GA SK++ N++R  +Q T+KG+  M EYL  MK  +++L +AG+P     L +  LAG
Subjt:  EWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAG

Query:  LDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGN
        LDSEY+PIV  IE ++  TWQE+   L++++  L    N S     +   +AH A+N+  P  T        +N  SN QN +Q  +   ++  +R GG 
Subjt:  LDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYGNSSPAAE-VPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYR-GGN

Query:  RGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLT
        R RGRG     +RP+CQ+CGK+GHSA  CY R+D+ +     T+N+    N+   S ++A+PE ++D  W ADSGATNHVT D GNL +K+DY G + L 
Subjt:  RGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLT

Query:  VGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL
        VGNG +L +SH+G   +PS+T K S++LK +LHVP+I++NL+S++RL
Subjt:  VGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARL

A0A6J1DTZ7 uncharacterized protein LOC111024384 isoform X2

1.7e-97

55.01

Show/hide

Query:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS
        +N  + TP     + S   ++SFGHPL TVLTVKLDDK + LWRGMVLA+LRGQK DGYVLGT+A+P + +      G    L+ NP + EW  VD+AL 
Subjt:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS

Query:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC
        GWLFGSMTPSIA DVV+F++SREVWKALE++YGA+SKARIN LR +LQNTKK ++KM EYL +MKQASE+L+LAG PV+   L+S VL+GL++EY+PIVC
Subjt:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC

Query:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ
         IE KD  +WQEL + L+ FE TL R    S A       A   S+  S  +   +Q   G+      Q+G Q Q  G+  SN    N RGRGRGR    
Subjt:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ

Query:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGK
        RGN  +PSCQLCGKYGH A  CY RFDE FNN  ++SNNN+      +SAY+A PEI+ +P WLADSGAT+HVT+D+ NL +K+DYNG+
Subjt:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGK

A0A6J1DU77 uncharacterized protein LOC111024384 isoform X1

4.5e-98

54.64

Show/hide

Query:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS
        +N  + TP     + S   ++SFGHPL TVLTVKLDDK + LWRGMVLA+LRGQK DGYVLGT+A+P + +      G    L+ NP + EW  VD+AL 
Subjt:  SNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENG--KQLERNPLFDEWVTVDRALS

Query:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC
        GWLFGSMTPSIA DVV+F++SREVWKALE++YGA+SKARIN LR +LQNTKK ++KM EYL +MKQASE+L+LAG PV+   L+S VL+GL++EY+PIVC
Subjt:  GWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVC

Query:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ
         IE KD  +WQEL + L+ FE TL R    S A       A   S+  S  +   +Q   G+      Q+G Q Q  G+  SN    N RGRGRGR    
Subjt:  TIEDKDIHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGN-RGRGRGR--NQ

Query:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSK
        RGN  +PSCQLCGKYGH A  CY RFDE FNN  ++SNNN+      +SAY+A PEI+ +P WLADSGAT+HVT+D+ NL +K+DYNGK     G G+K
Subjt:  RGN--RPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSK

A0A803QD97 Uncharacterized protein

6.7e-78

38.43

Show/hide

Query:  GIEEIW-LAVRTMAYTTSSVFPELLKSLS--------SVFVIFSWYQNYSCLAMAGDLSSSSNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKF
        GI  +W +  +++    S  FP  ++  S         VF    W  N   +   G    ++        +   S+S++    FG  L+    +KLD   
Subjt:  GIEEIW-LAVRTMAYTTSSVFPELLKSLS--------SVFVIFSWYQNYSCLAMAGDLSSSSNAGISTPATIPVSASSIVSSSFGHPLSTVLTVKLDDKF

Query:  FLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGK---QLERNPLFDEWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKA
        F LW+ MV AI RG ++DGY+ G    P E +      G+     E NP F+ W+  D+ L GWL+GSMT  IA +++   +S E+W +LE ++GA SKA
Subjt:  FLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGK---QLERNPLFDEWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGASSKA

Query:  RINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYG-------NSS
        +++  R  +Q  +KG+M MV+YL   KQ S+ L LAG+P     L+S VL+GLD EY+PIV  IE ++  TWQ L  +L++F+  L R         +S+
Subjt:  RINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYG-------NSS

Query:  PAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGNRGRGRGRNQRGN-RPSCQLCGKYGHSAPYCYSRFDEEF---NN
         A+   +LA    S  ++P          G+N+N         +  G S SN RG  R  GRGR+ RG  +P+CQ+CG+YGHSA YCY+RFDE F     
Subjt:  PAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGNRGRGRGRNQRGN-RPSCQLCGKYGHSAPYCYSRFDEEF---NN

Query:  PHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQR
        P  T +NN+ G +  ++A++A+PE+L D  W A+SGA+NHVT++  NL  K  YNGK  LTVG+GSKL + H GS  + S    S L+LK +LHVP+I +
Subjt:  PHATSNNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQR

Query:  NLISIARLTA
        NL+SI++LTA
Subjt:  NLISIARLTA

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

1.7e-30

28.04

Show/hide

Query:  KLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLERNPLFDEWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGAS
        KL    +L+W   V A+  G ++ G++ G+   P   I   T+   ++  NP +  W   D+ +   + G+++ S+   V    T+ ++W+ L ++Y   
Subjt:  KLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLERNPLFDEWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGAS

Query:  SKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVCTIEDKDI-HTWQELGSILINFEGTLARYGNSSPAA
        S   +  LR  L+   KGT  + +Y+  +    + L L G P+   + +  VL  L  EY P++  I  KD   T  E+   L+N E  +     +  +A
Subjt:  SKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVCTIEDKDI-HTWQELGSILINFEGTLARYGNSSPAA

Query:  EVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGNRGRGRGRNQRGNRPSCQLCGKYGHSAPYC--YSRFDEEFNNPHATS
         V  + A+  S+R +   T        +N   N  N + S+ +  S +N+   N         +     CQ+CG  GHSA  C     F    N+    S
Subjt:  EVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGNRGRGRGRNQRGNRPSCQLCGKYGHSAPYC--YSRFDEEFNNPHATS

Query:  NNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISI
                  ++  + SP   N+  WL DSGAT+H+T+D  NL++   Y G   + V +GS + +SH GS+ +   T    L L NIL+VP I +NLIS+
Subjt:  NNNQGGNSGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISI

Query:  ARL
         RL
Subjt:  ARL

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

5.2e-27

27.72

Show/hide

Query:  KLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLERNPLFDEWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGAS
        KL    +L+W   V A+  G ++ G++ G+   P   I   T+   ++  NP +  W   D+ +   + G+++ S+   V    T+ ++W+ L ++Y   
Subjt:  KLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLERNPLFDEWVTVDRALSGWLFGSMTPSIAADVVNFKTSREVWKALEEVYGAS

Query:  SKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVCTIEDKDI-HTWQELGSILINFEGTLARYGNSSPAA
        S   +  LR I +                    + L L G P+   + +  VL  L  +Y P++  I  KD   +  E+   LIN E  L        +A
Subjt:  SKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVCTIEDKDI-HTWQELGSILINFEGTLARYGNSSPAA

Query:  EVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGNRGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNN
        EV  + A+  ++R +   T   Q   G N N N  N ++S S+  S S  R  N      R  +     CQ+C   GHSA  C      + +   +T+N 
Subjt:  EVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGNRGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNN

Query:  NQGGN---SGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLIS
         Q  +        A +A     N   WL DSGAT+H+T+D  NL+    Y G   + + +GS + ++H GS+ +P  T+  SL L  +L+VP I +NLIS
Subjt:  NQGGN---SGGSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLIS

Query:  IARL
        + RL
Subjt:  IARL

Arabidopsis top hits

e value

%identity

Alignment

AT1G34070.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162)

5.7e-05

22.39

Show/hide

Query:  NGKQLERNPLFDEWVTVDRALSGWLFGSMTP-SIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNP
        +G  L  N     W   D  +   L+G++TP       V   TSR++W  ++  +  +  AR   L   L+    G M++ +Y   MK+ +++L+    P
Subjt:  NGKQLERNPLFDEWVTVDRALSGWLFGSMTP-SIAADVVNFKTSREVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNP

Query:  VSLGDLISYVLAGLDSEYIPIVCTIEDKD-IHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQS
        V+  +L+ YVL GL+ ++  I+  I+ +    ++ +  ++L   E  L R    +P       ++   +   +P  T  Q+                   
Subjt:  VSLGDLISYVLAGLDSEYIPIVCTIEDKD-IHTWQELGSILINFEGTLARYGNSSPAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQS

Query:  YGNSQSNYRGGNRGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNP--HATSNNNQGGNSGG
         G +Q  YRG  RG    R + G      +      + P  Y    + +N+P  +    N  GGN  G
Subjt:  YGNSQSNYRGGNRGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNP--HATSNNNQGGNSGG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCGAACGTGGTGGTCGCCGGTGGGGTGACGACAACGGAAATATTCGATTCCGATGGGTTCACGTCCTTGGCCGGCGAGGCTCGTTTGAAACTCCACCGCTTCTTCTC
TTTAGGATTCGAAATCGGAGTGGTGGAATTTTCAGAGGGAATCGAAGAAATCTGGTTGGCTGTGAGGACTATGGCCTATACAACATCGTCTGTATTTCCTGAGCTGTTGA
AATCGTTATCCTCTGTGTTTGTTATTTTCTCTTGGTATCAGAACTATTCTTGCTTAGCCATGGCTGGTGATCTTTCCTCGTCATCAAATGCTGGTATTTCTACTCCAGCA
ACCATACCTGTGTCTGCTTCCTCCATTGTTAGTTCTTCATTTGGCCACCCCTTGAGCACTGTTCTTACAGTTAAGCTCGATGATAAATTTTTTTTGCTGTGGAGAGGAAT
GGTTCTTGCCATCCTTCGGGGCCAAAAGGTGGATGGATATGTGCTTGGGACTGTTGCCCAGCCATCAGAAATGATCGAGAAGGTTACGGAAAACGGAAAACAGCTTGAAC
GAAACCCATTATTTGATGAATGGGTAACAGTCGATAGGGCTCTGTCCGGGTGGCTCTTTGGTTCAATGACTCCGTCAATCGCAGCGGATGTAGTCAATTTCAAGACCTCC
CGAGAAGTTTGGAAGGCTCTGGAAGAAGTATATGGAGCATCAAGCAAGGCTCGCATCAACTCACTTCGTGGGATTCTACAGAATACTAAGAAAGGAACAATGAAAATGGT
TGAGTATTTGGCAATTATGAAGCAAGCGTCCGAAAATCTCCAACTAGCAGGTAACCCTGTTTCTTTAGGTGATTTAATCTCTTATGTGCTTGCTGGCCTGGACTCCGAAT
ACATACCCATCGTTTGCACGATTGAAGACAAAGACATTCATACTTGGCAAGAGCTCGGGTCTATTTTAATTAATTTTGAGGGAACCCTAGCTCGGTATGGGAATAGTTCT
CCAGCTGCAGAAGTACCTGATCTTGCGGCTCATTTTGCTTCAAATCGTTTCTCCCCGCGTTTCACTGGGGGACAACAACGGTTGTTTGGTTCAAATCACAATAGTAACAT
TCAGAATGGCTCTCAATCTCAGTCCTATGGAAACTCTCAGTCAAATTACAGAGGTGGAAATCGAGGAAGAGGCCGTGGGCGAAATCAGCGTGGGAATCGACCTTCATGTC
AACTTTGTGGTAAATATGGGCACTCCGCTCCTTATTGTTACTCTCGCTTTGATGAAGAGTTCAACAACCCACATGCCACCTCGAACAACAATCAAGGAGGGAATTCTGGA
GGTTCATCAGCATACATAGCCTCACCCGAAATTCTCAATGACCCAAAATGGTTAGCGGATAGTGGGGCAACGAATCATGTCACAACTGATATGGGAAATCTAGCTATTAA
AGCTGATTACAATGGTAAACAGAAGCTCACTGTTGGTAACGGTTCTAAACTCCATGTTTCTCATATTGGTAGTAGTGTGATACCTTCTGTTACTGCTAAGTCTTCTTTAT
TGCTCAAAAATATACTTCATGTGCCTCAAATTCAACGAAACTTGATTAGCATAGCTCGCTTAACTGCTATAACAATGCATTTGTTGAGTTTCACCCTCTTTTCTGTCTTG
TGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSNVVVAGGVTTTEIFDSDGFTSLAGEARLKLHRFFSLGFEIGVVEFSEGIEEIWLAVRTMAYTTSSVFPELLKSLSSVFVIFSWYQNYSCLAMAGDLSSSSNAGISTPA
TIPVSASSIVSSSFGHPLSTVLTVKLDDKFFLLWRGMVLAILRGQKVDGYVLGTVAQPSEMIEKVTENGKQLERNPLFDEWVTVDRALSGWLFGSMTPSIAADVVNFKTS
REVWKALEEVYGASSKARINSLRGILQNTKKGTMKMVEYLAIMKQASENLQLAGNPVSLGDLISYVLAGLDSEYIPIVCTIEDKDIHTWQELGSILINFEGTLARYGNSS
PAAEVPDLAAHFASNRFSPRFTGGQQRLFGSNHNSNIQNGSQSQSYGNSQSNYRGGNRGRGRGRNQRGNRPSCQLCGKYGHSAPYCYSRFDEEFNNPHATSNNNQGGNSG
GSSAYIASPEILNDPKWLADSGATNHVTTDMGNLAIKADYNGKQKLTVGNGSKLHVSHIGSSVIPSVTAKSSLLLKNILHVPQIQRNLISIARLTAITMHLLSFTLFSVL

Lag0005953 (gene) of Sponge gourd (AG-4) v1 genome