; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

IVF0021562 (gene) of Melon (IVF77) v1 genome

Gene IDIVF0021562
OrganismCucumis melo ssp. agrestis cv. IVF77 (Melon (IVF77) v1)
DescriptionGag/pol protein
Genome locationchr01:14704723..14714965
RNA-Seq ExpressionIVF0021562
SyntenyIVF0021562
Gene Ontology termsNA
InterPro domainsIPR025724 - GAG-pre-integrase domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0032972.1 gag/pol protein [Cucumis melo var. makuwa]1.49e-18459.1Show/hide
Query:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNSSIVQLLA +KLN DN       LNTILVVD L FVL EECPQTP+SN NR SRKAYDRWIK NEKA VYILASM DVLAKKHESLAT KEIMDSLKG
Subjt:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------
        MFGQP+WSLRH+AIKYIYTK+MKEG SVREHV+DMMMHFNIAEVN GAIDEANQ                                              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------

Query:  -------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSL
               E +S KRLS+G ITLKVGTGEMVSAKA+GDLKLF NDRYI+LKNVL                             IERLVK  LL+QLEDNSL
Subjt:  -------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSL

Query:  PPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYS-------------------------------------------
        PPCD CL+GKM+K SF GKGLRAKT  ELV+S+LCG MNVKA+GGYEYFISFIDDYS                                           
Subjt:  PPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYS-------------------------------------------

Query:  -------------------------SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTF
                                 SKL+LEEISKN+TDRPSSSTKVVDKTRNIGQTH  QEL EPRRSGRVIRQPDRYLGLSEAQI+ P++GIE+PL F
Subjt:  -------------------------SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTF

Query:  KQTMNDVDCDQWVKAMDLEMKSMYSNSVWTLMD
        K+ MNDVD DQW+K+MDL+M+SMYSN VWTL+D
Subjt:  KQTMNDVDCDQWVKAMDLEMKSMYSNSVWTLMD

KAA0035260.1 gag/pol protein [Cucumis melo var. makuwa]3.88e-17161.95Show/hide
Query:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNSSIVQLLA EKLN DN       LNTILVVDDLR VL +ECPQTPTSN NR SRKAYDRW+KA+EKA VYILA+M+DVLAKKH+ LAT K I+D+LK 
Subjt:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL
        MFG+PEWSLRH+AIKYIYTK+MK+  SVREHVLDMMMHFNI EVN GAIDEANQENNSWK LSEGEITLKVGTGEMVSAKA+G+LK              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL

Query:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGG-----YEY
                                     IERLVKSG LS+LEDNSLPPC+S LEGKM+KRSFTGKGLRAK   ELV+SD+CG MNVKARGG     YE 
Subjt:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGG-----YEY

Query:  ---------------------------FIS---------FIDDYS--SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDR
                                   F+S          I D+   +KLVL EISKN  D+PSSSTKVVDKT+  GQTH  QEL EPR S RV+ QP+R
Subjt:  ---------------------------FIS---------FIDDYS--SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDR

Query:  YLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWT
        YLGLSE+ +V PN+GIE+PLT+KQ MNDVD DQW+KAM+LE++SM+ N VWT
Subjt:  YLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWT

KAA0035827.1 gag/pol protein [Cucumis melo var. makuwa]7.81e-17057.56Show/hide
Query:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNS IVQLLA EKLN DN       LNTILVVDDLRF L EE  QTP SN NR SRKAYD+ IKAN+KARVYILASMSDVLAKKHESLAT K+IMDSLKG
Subjt:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------
        MFGQ EWS+RH+AIKYIYTK MK+G SVREHV+DMMMHFNI EVNGG IDEANQ                                              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------

Query:  -------------------------------------------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKV
                                                    N   K   +GEITLKV TG+MVSAKA+GDLKLF+NDRYI+LKNVL           
Subjt:  -------------------------------------------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKV

Query:  SSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYSS------
                          I RLVK+GLLSQLEDNSLPPCDSCLEGKM KRSFTGKGLR K S EL++SDLCG MNVKARGGYEYFISFIDDYS       
Subjt:  SSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYSS------

Query:  -----------KLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKA
                   K    EI +N +DRPSSSTKVVDKTRNIGQT+  Q+LGEPRRSGRV+RQPDRYLGLSEAQI+ P++GIE+PL++KQ MNDVD D+W+KA
Subjt:  -----------KLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKA

Query:  MDLEMKSMY
        MDLEM+S++
Subjt:  MDLEMKSMY

KAA0035987.1 gag/pol protein [Cucumis melo var. makuwa]3.07e-18763.28Show/hide
Query:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MN  IVQLLA EKLN DN       LNTILVVDDLRFVL EECPQTP SN NR SRK YDRWIKA+EKA VYILASMSDVLAKKHESLATTK+I+DSLKG
Subjt:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL
        MFGQ EWS+RH+ IKYIYTK+MKE  S+REHVLDMMMH NIAEVNGGAIDEANQEN+SWK+LSEGE+TLKVGTGEMVSAKA+GDLKLFF+DRYIMLKNVL
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL

Query:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKG-----LRAKTSSEL-------------VNSDLC
        T                             +RLVKSGLLSQLEDNSLPPCDSCLEGKM+KRSFTGKG     LR+    E              + S L 
Subjt:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKG-----LRAKTSSEL-------------VNSDLC

Query:  GSMNVKARGGYE-----YFISFIDDYS----------------------------------------------------SKLVLEEISKNTTDRPSSSTK
             +  GGY      Y ++ +   S                                                    SKLVLEEISKNTTDRPSSSTK
Subjt:  GSMNVKARGGYE-----YFISFIDDYS----------------------------------------------------SKLVLEEISKNTTDRPSSSTK

Query:  VVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSV
        VVDKTR+IGQTHL QELGEPRRSGRV+RQPDRYLGLSEAQIV P+NGI++PLT+KQTMNDVDCDQWVKAMDLE++SMYSNSV
Subjt:  VVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSV

TYK29680.1 putative polyprotein [Cucumis melo var. makuwa]1.14e-17458.77Show/hide
Query:  MNSSIVQLLAFEKLN-------RDNLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNS+IVQLL+ EKLN       + NLNTILVVDDLRF L ++CPQTPTSN NR S KAYDRWIKANEK RVYILASMSDVLAKKHESLAT KEIM+SLKG
Subjt:  MNSSIVQLLAFEKLN-------RDNLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL
        MFGQPEWSLRH+AIKYIYTK+MKEG SVREHVLDMMMHFNIAEVNGGAIDEANQ                                              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL

Query:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFI
                  VSSNAFLWHL LGHINLNRI RLV+SGLL+QLEDNSLPP DSC EGKM+KRSFTGKGLRAKT  ELV+SDLCG MNVKAR GYEYFISFI
Subjt:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFI

Query:  DDYS--SKLVLEEISKNTTDR-------------------PSSSTKVVDKTRNIGQTHLPQELGEPRRSG-----------RVIRQPDRYLGLSEAQIVT
        DDYS    + L +   N+ ++                     ++  +++   +      P EL + R+              V+  PDRYLGLSEAQI+ 
Subjt:  DDYS--SKLVLEEISKNTTDR-------------------PSSSTKVVDKTRNIGQTHLPQELGEPRRSG-----------RVIRQPDRYLGLSEAQIVT

Query:  PNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWTL------MDVKTTFLDGNLEESIYKVQPEGFIQKGQEQKAEKKFWNEEEVENYKVIAYI
         ++GIE+PLT+KQ MNDVDCDQW+K MDLEM+SMYSNSVWTL      MDVKT FL+GNLEESIY VQPEGFIQKG+EQK      N +E   YK I   
Subjt:  PNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWTL------MDVKTTFLDGNLEESIYKVQPEGFIQKGQEQKAEKKFWNEEEVENYKVIAYI

Query:  LAKVFRVLQAHAILM--ND
           VF VL A  IL+  ND
Subjt:  LAKVFRVLQAHAILM--ND

TrEMBL top hitse value%identityAlignment
A0A5A7T2N1 Gag/pol protein7.4e-13857.56Show/hide
Query:  MNSSIVQLLAFEKLNRD-------NLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNS IVQLLA EKLN D       NLNTILVVDDLRF L EE  QTP SN NR SRKAYD+ IKAN+KARVYILASMSDVLAKKHESLAT K+IMDSLKG
Subjt:  MNSSIVQLLAFEKLNRD-------NLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------
        MFGQ EWS+RH+AIKYIYTK MK+G SVREHV+DMMMHFNI EVNGG IDEANQ                                              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------

Query:  -------------------------------------------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKV
                                                    N   K   +GEITLKV TG+MVSAKA+GDLKLF+NDRYI+LKNVL           
Subjt:  -------------------------------------------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKV

Query:  SSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYSS------
                          I RLVK+GLLSQLEDNSLPPCDSCLEGKM KRSFTGKGLR K S EL++SDLCG MNVKARGGYEYFISFIDDYS       
Subjt:  SSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYSS------

Query:  -----------KLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKA
                   K    EI +N +DRPSSSTKVVDKTRNIGQT+  Q+LGEPRRSGRV+RQPDRYLGLSEAQI+ P++GIE+PL++KQ MNDVD D+W+KA
Subjt:  -----------KLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKA

Query:  MDLEMKSMY
        MDLEM+S++
Subjt:  MDLEMKSMY

A0A5D3C7X2 Gag/pol protein1.8e-13661.95Show/hide
Query:  MNSSIVQLLAFEKLNRD-------NLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNSSIVQLLA EKLN D       NLNTILVVDDLR VL +ECPQTPTSN NR SRKAYDRW+KA+EKA VYILA+M+DVLAKKH+ LAT K I+D+LK 
Subjt:  MNSSIVQLLAFEKLNRD-------NLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL
        MFG+PEWSLRH+AIKYIYTK+MK+  SVREHVLDMMMHFNI EVN GAIDEANQENNSWK LSEGEITLKVGTGEMVSAKA+G+LK              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL

Query:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGG-----YE-
                                     IERLVKSG LS+LEDNSLPPC+S LEGKM+KRSFTGKGLRAK   ELV+SD+CG MNVKARGG     YE 
Subjt:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGG-----YE-

Query:  --------------------------YFIS---------FIDDYS--SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDR
                                   F+S          I D+   +KLVL EISKN  D+PSSSTKVVDKT+  GQTH  QEL EPR S RV+ QP+R
Subjt:  --------------------------YFIS---------FIDDYS--SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDR

Query:  YLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWT
        YLGLSE+ +V PN+GIE+PLT+KQ MNDVD DQW+KAM+LE++SM+ N VWT
Subjt:  YLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWT

A0A5D3DE90 Gag/pol protein2.6e-15159.1Show/hide
Query:  MNSSIVQLLAFEKLNRD-------NLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNSSIVQLLA +KLN D       NLNTILVVD L FVL EECPQTP+SN NR SRKAYDRWIK NEKA VYILASM DVLAKKHESLAT KEIMDSLKG
Subjt:  MNSSIVQLLAFEKLNRD-------NLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------
        MFGQP+WSLRH+AIKYIYTK+MKEG SVREHV+DMMMHFNIAEVN GAIDEANQ                                              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQ----------------------------------------------

Query:  -------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSL
               E +S KRLS+G ITLKVGTGEMVSAKA+GDLKLF NDRYI+LKNVL                             IERLVK  LL+QLEDNSL
Subjt:  -------ENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSL

Query:  PPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYS-------------------------------------------
        PPCD CL+GKM+K SF GKGLRAKT  ELV+S+LCG MNVKA+GGYEYFISFIDDYS                                           
Subjt:  PPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYS-------------------------------------------

Query:  -------------------------SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTF
                                 SKL+LEEISKN+TDRPSSSTKVVDKTRNIGQTH  QEL EPRRSGRVIRQPDRYLGLSEAQI+ P++GIE+PL F
Subjt:  -------------------------SKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTF

Query:  KQTMNDVDCDQWVKAMDLEMKSMYSNSVWTLMD
        K+ MNDVD DQW+K+MDL+M+SMYSN VWTL+D
Subjt:  KQTMNDVDCDQWVKAMDLEMKSMYSNSVWTLMD

A0A5D3E2A3 Putative polyprotein1.9e-14158.83Show/hide
Query:  MNSSIVQLLAFEKLN-------RDNLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MNS+IVQLL+ EKLN       + NLNTILVVDDLRF L ++CPQTPTSN NR S KAYDRWIKANEK RVYILASMSDVLAKKHESLAT KEIM+SLKG
Subjt:  MNSSIVQLLAFEKLN-------RDNLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL
        MFGQPEWSLRH+AIKYIYTK+MKEG SVREHVLDMMMHFNIAEVNGGAIDEANQ                                              
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL

Query:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFI
                  VSSNAFLWHL LGHINLNRI RLV+SGLL+QLEDNSLPP DSC EGKM+KRSFTGKGLRAKT  ELV+SDLCG MNVKAR GYEYFISFI
Subjt:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFI

Query:  DDYS--SKLVLEEISKNTTDR-------------------PSSSTKVVDKTRNIGQTHLPQELGEPRRS-----------GRVIRQPDRYLGLSEAQIVT
        DDYS    + L +   N+ ++                     ++  +++   +      P EL + R+              V+  PDRYLGLSEAQI+ 
Subjt:  DDYS--SKLVLEEISKNTTDR-------------------PSSSTKVVDKTRNIGQTHLPQELGEPRRS-----------GRVIRQPDRYLGLSEAQIVT

Query:  PNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWTL------MDVKTTFLDGNLEESIYKVQPEGFIQKGQEQKAEKKFWNEEEVENYKVIAYI
         ++GIE+PLT+KQ MNDVDCDQW+K MDLEM+SMYSNSVWTL      MDVKT FL+GNLEESIY VQPEGFIQKG+EQK      N +E   YK I   
Subjt:  PNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWTL------MDVKTTFLDGNLEESIYKVQPEGFIQKGQEQKAEKKFWNEEEVENYKVIAYI

Query:  LAKVFRVLQAHAILM
           VF VL A  IL+
Subjt:  LAKVFRVLQAHAILM

A0A5D3E3F1 Gag/pol protein1.1e-14963.28Show/hide
Query:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG
        MN  IVQLLA EKLN DN       LNTILVVDDLRFVL EECPQTP SN NR SRK YDRWIKA+EKA VYILASMSDVLAKKHESLATTK+I+DSLKG
Subjt:  MNSSIVQLLAFEKLNRDN-------LNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKG

Query:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL
        MFGQ EWS+RH+ IKYIYTK+MKE  S+REHVLDMMMH NIAEVNGGAIDEANQEN+SWK+LSEGE+TLKVGTGEMVSAKA+GDLKLFF+DRYIMLKNVL
Subjt:  MFGQPEWSLRHKAIKYIYTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVL

Query:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKG-----LRAKTSSEL-------------VNSDLC
        T                             +RLVKSGLLSQLEDNSLPPCDSCLEGKM+KRSFTGKG     LR+    E              + S L 
Subjt:  TTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKG-----LRAKTSSEL-------------VNSDLC

Query:  GSMNVKARGGYE-----YFISFIDDYS----------------------------------------------------SKLVLEEISKNTTDRPSSSTK
             +  GGY      Y ++ +   S                                                    SKLVLEEISKNTTDRPSSSTK
Subjt:  GSMNVKARGGYE-----YFISFIDDYS----------------------------------------------------SKLVLEEISKNTTDRPSSSTK

Query:  VVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSV
        VVDKTR+IGQTHL QELGEPRRSGRV+RQPDRYLGLSEAQIV P+NGI++PLT+KQTMNDVDCDQWVKAMDLE++SMYSNSV
Subjt:  VVDKTRNIGQTHLPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSV

SwissProt top hitse value%identityAlignment
P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-941.1e-1331.14Show/hide
Query:  VNGGAIDEANQEN---NSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLS
        ++G A+D    E+   N   RL++G + +  G        A G L       Y     +   E    + ++S +  LWH  +GH++   ++ L K  L+S
Subjt:  VNGGAIDEANQEN---NSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKVSSNAFLWHLTLGHINLNRIERLVKSGLLS

Query:  QLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYSSKL
          +  ++ PCD CL GK  + SF     R     +LV SD+CG M +++ GG +YF++FIDD S KL
Subjt:  QLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYSSKL

Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAATAGCTCGATAGTTCAATTGTTAGCTTTCGAAAAACTTAACCGCGATAATCTTAACACAATACTAGTGGTTGATGATTTAAGGTTTGTCTTAATTGAGGAATGTCC
TCAAACCCCTACCTCAAATGTAAACCGAATTAGTCGGAAAGCATACGATCGATGGATAAAAGCAAATGAGAAAGCCCGTGTCTACATCCTTGCTAGCATGTCTGATGTTT
TAGCAAAGAAACATGAATCCTTAGCAACGACTAAAGAGATAATGGATTCATTAAAAGGAATGTTTGGGCAACCAGAATGGTCCTTGAGACACAAGGCAATTAAATACATT
TACACTAAGCAAATGAAGGAGGGGGCCTCTGTTAGAGAACATGTCCTGGACATGATGATGCACTTCAATATTGCTGAGGTAAATGGTGGTGCCATCGATGAGGCTAATCA
GGAAAATAATTCTTGGAAAAGACTTTCTGAGGGCGAGATTACTCTCAAAGTTGGAACTGGAGAAATGGTCTCAGCTAAAGCAATGGGAGACTTGAAGTTGTTTTTTAATG
ATAGATATATCATGCTCAAGAATGTCTTAACAACTGAAACTCAGGATAAAAGACAAAAAGTTTCTTCCAATGCCTTCTTGTGGCACTTAACACTTGGTCACATAAATCTC
AATAGGATTGAGAGATTGGTTAAGAGTGGACTTCTAAGTCAGTTAGAAGATAACTCTTTACCTCCATGTGATTCTTGTCTGGAAGGAAAAATGAGTAAAAGATCTTTTAC
TGGAAAAGGTCTTAGAGCCAAAACATCTTCAGAGCTCGTAAATTCGGACCTATGTGGATCAATGAATGTCAAAGCTCGGGGAGGATATGAATATTTCATTAGTTTTATTG
ATGATTATTCAAGTAAACTAGTATTAGAAGAAATTTCCAAAAATACTACAGATAGACCTAGTTCATCCACTAAAGTAGTTGATAAAACTAGGAATATTGGTCAAACACAT
CTTCCTCAAGAGTTGGGAGAACCTCGACGTAGTGGGAGGGTTATACGACAACCTGATCGCTATTTGGGTTTAAGTGAAGCTCAAATTGTCACACCTAATAATGGAATAGA
GAATCCATTGACCTTTAAACAGACAATGAATGATGTGGACTGTGACCAATGGGTCAAAGCCATGGACCTTGAAATGAAATCTATGTATTCCAATTCTGTTTGGACTCTAA
TGGATGTCAAGACAACCTTTTTGGATGGAAATCTTGAGGAGAGTATTTATAAGGTCCAACCAGAGGGGTTTATACAAAAGGGTCAAGAACAAAAGGCAGAGAAGAAGTTT
TGGAACGAAGAAGAAGTTGAGAACTACAAAGTTATAGCATATATCCTTGCCAAGGTTTTTCGGGTCTTGCAAGCACATGCTATATTAATGAATGATCCATCTGCATGTGG
TGCATTTCCCTACATCCCTTTTGTCATCAAAGATATTGAACTAGTAAATTTGGTGTTGTCAAGTCCATGTGAAGCTGCAGAAAAACAATGTCGTCCACATGAGGTTGGGT
ATGAACTTGAACGAGTGGCTGTCCAAGCGGAAGGACATGGACTCCTAGGTCATCGTTCTTGGATTTGCAATGAACGGCGATAG
mRNA sequenceShow/hide mRNA sequence
ATGAATAGCTCGATAGTTCAATTGTTAGCTTTCGAAAAACTTAACCGCGATAATCTTAACACAATACTAGTGGTTGATGATTTAAGGTTTGTCTTAATTGAGGAATGTCC
TCAAACCCCTACCTCAAATGTAAACCGAATTAGTCGGAAAGCATACGATCGATGGATAAAAGCAAATGAGAAAGCCCGTGTCTACATCCTTGCTAGCATGTCTGATGTTT
TAGCAAAGAAACATGAATCCTTAGCAACGACTAAAGAGATAATGGATTCATTAAAAGGAATGTTTGGGCAACCAGAATGGTCCTTGAGACACAAGGCAATTAAATACATT
TACACTAAGCAAATGAAGGAGGGGGCCTCTGTTAGAGAACATGTCCTGGACATGATGATGCACTTCAATATTGCTGAGGTAAATGGTGGTGCCATCGATGAGGCTAATCA
GGAAAATAATTCTTGGAAAAGACTTTCTGAGGGCGAGATTACTCTCAAAGTTGGAACTGGAGAAATGGTCTCAGCTAAAGCAATGGGAGACTTGAAGTTGTTTTTTAATG
ATAGATATATCATGCTCAAGAATGTCTTAACAACTGAAACTCAGGATAAAAGACAAAAAGTTTCTTCCAATGCCTTCTTGTGGCACTTAACACTTGGTCACATAAATCTC
AATAGGATTGAGAGATTGGTTAAGAGTGGACTTCTAAGTCAGTTAGAAGATAACTCTTTACCTCCATGTGATTCTTGTCTGGAAGGAAAAATGAGTAAAAGATCTTTTAC
TGGAAAAGGTCTTAGAGCCAAAACATCTTCAGAGCTCGTAAATTCGGACCTATGTGGATCAATGAATGTCAAAGCTCGGGGAGGATATGAATATTTCATTAGTTTTATTG
ATGATTATTCAAGTAAACTAGTATTAGAAGAAATTTCCAAAAATACTACAGATAGACCTAGTTCATCCACTAAAGTAGTTGATAAAACTAGGAATATTGGTCAAACACAT
CTTCCTCAAGAGTTGGGAGAACCTCGACGTAGTGGGAGGGTTATACGACAACCTGATCGCTATTTGGGTTTAAGTGAAGCTCAAATTGTCACACCTAATAATGGAATAGA
GAATCCATTGACCTTTAAACAGACAATGAATGATGTGGACTGTGACCAATGGGTCAAAGCCATGGACCTTGAAATGAAATCTATGTATTCCAATTCTGTTTGGACTCTAA
TGGATGTCAAGACAACCTTTTTGGATGGAAATCTTGAGGAGAGTATTTATAAGGTCCAACCAGAGGGGTTTATACAAAAGGGTCAAGAACAAAAGGCAGAGAAGAAGTTT
TGGAACGAAGAAGAAGTTGAGAACTACAAAGTTATAGCATATATCCTTGCCAAGGTTTTTCGGGTCTTGCAAGCACATGCTATATTAATGAATGATCCATCTGCATGTGG
TGCATTTCCCTACATCCCTTTTGTCATCAAAGATATTGAACTAGTAAATTTGGTGTTGTCAAGTCCATGTGAAGCTGCAGAAAAACAATGTCGTCCACATGAGGTTGGGT
ATGAACTTGAACGAGTGGCTGTCCAAGCGGAAGGACATGGACTCCTAGGTCATCGTTCTTGGATTTGCAATGAACGGCGATAG
Protein sequenceShow/hide protein sequence
MNSSIVQLLAFEKLNRDNLNTILVVDDLRFVLIEECPQTPTSNVNRISRKAYDRWIKANEKARVYILASMSDVLAKKHESLATTKEIMDSLKGMFGQPEWSLRHKAIKYI
YTKQMKEGASVREHVLDMMMHFNIAEVNGGAIDEANQENNSWKRLSEGEITLKVGTGEMVSAKAMGDLKLFFNDRYIMLKNVLTTETQDKRQKVSSNAFLWHLTLGHINL
NRIERLVKSGLLSQLEDNSLPPCDSCLEGKMSKRSFTGKGLRAKTSSELVNSDLCGSMNVKARGGYEYFISFIDDYSSKLVLEEISKNTTDRPSSSTKVVDKTRNIGQTH
LPQELGEPRRSGRVIRQPDRYLGLSEAQIVTPNNGIENPLTFKQTMNDVDCDQWVKAMDLEMKSMYSNSVWTLMDVKTTFLDGNLEESIYKVQPEGFIQKGQEQKAEKKF
WNEEEVENYKVIAYILAKVFRVLQAHAILMNDPSACGAFPYIPFVIKDIELVNLVLSSPCEAAEKQCRPHEVGYELERVAVQAEGHGLLGHRSWICNERR