; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Carg24059 (gene) of Silver-seed gourd (SMH-JMG-627) v2 genome

Gene IDCarg24059
OrganismCucurbita argyrosperma subsp. argyrosperma cv. SMH-JMG-627 (Silver-seed gourd (SMH-JMG-627) v2)
Descriptionprotein ANTAGONIST OF LIKE HETEROCHROMATIN PROTEIN 1-like
Genome locationCarg_Chr10:5958537..5960808
RNA-Seq ExpressionCarg24059
SyntenyCarg24059
Gene Ontology termsGO:0046872 - metal ion binding (molecular function)
InterPro domainsIPR027806 - Harbinger transposase-derived nuclease domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6605127.1 Protein ALP1-like protein, partial [Cucurbita argyrosperma subsp. sororia]7.0e-24099.77Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGEN
        PEPLKDPEETGPAPDILDSEKSLCYYGE+
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGEN

KAG7023919.1 Protein ANTAGONIST OF LIKE HETEROCHROMATIN PROTEIN 1, partial [Cucurbita argyrosperma subsp. argyrosperma]1.0e-259100Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGENSMLIREGIWFSEKIELQEWSNMALTDSLRYVS
        PEPLKDPEETGPAPDILDSEKSLCYYGENSMLIREGIWFSEKIELQEWSNMALTDSLRYVS
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGENSMLIREGIWFSEKIELQEWSNMALTDSLRYVS

XP_022148679.1 protein ALP1-like [Momordica charantia]9.7e-22692.06Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPS--------AASTTTPPPPTSSS----S
        MLSTLLH HN+LDPTISLLPSTPSSASSPSSASLNSPT LLSSSSAAPLLFFTIASVLSFIASSRPNS SSPS        AA+ TTPPPP+SSS    S
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPS--------AASTTTPPPPTSSS----S

Query:  NYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLL
        NYSVSAFRAFST+HIWSLEAPLRDAHWR+LYG+SHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLL
Subjt:  NYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLL

Query:  ATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSL
        ATKLYAEFIKIPVSRRRLIETTQAFE+LTSLPNMCGAID SPIKLRR+P DQ+ STNYNCRFGYPSVLLQVV+DNKKIFWDVCVKAPGGSDDASHFRDSL
Subjt:  ATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSL

Query:  MYHRLTSGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCV
        MYHRLTSGD+VWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGL+HAPQTIVACCV
Subjt:  MYHRLTSGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCV

Query:  LHNLCQIAKEPEPEPLKDPEETGPAPDILDSEKSLCYYGEN
        LHNLCQIAKEPEPEPL+DPEE+GPAP+ILDSEKSLCYYGE+
Subjt:  LHNLCQIAKEPEPEPLKDPEETGPAPDILDSEKSLCYYGEN

XP_022948193.1 protein ALP1-like [Cucurbita moschata]7.7e-23999.3Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        DKVINVRGHHVRPYI GDWGYPLLSFLLTPFS NGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGEN
        PEPLKDPEETGPAPDILDSEKSLCYYGE+
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGEN

XP_023007480.1 protein ALP1-like [Cucurbita maxima]2.6e-23999.53Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFS NGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGEN
        PEPLKDPEETGPAPDILDSEKSLCYYGE+
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGEN

TrEMBL top hitse value%identityAlignment
A0A0A0LLT7 DDE Tnp4 domain-containing protein1.2e-22493.27Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPN--SPSSPSAASTTTPPPPTSSSSNYSVSAFRAF
        MLSTLLH HNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPN  SPSSP+   T TPPPP   SS+YSVSAFRAF
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPN--SPSSPSAASTTTPPPPTSSSSNYSVSAFRAF

Query:  STDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIK
        STDHIWSLEAPLRDA WRSLYG+SHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHG SAKTLA+RFSLEPYLVSKITNMVTRLLATKLYAEFIK
Subjt:  STDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIK

Query:  IPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDI
        IPVSRRRLIETTQAFE+LTSLPNMCGAID SPIKLRRLPADQ+ STNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSL YHRLTSGD+
Subjt:  IPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDI

Query:  VWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKE
        VWD VINVRGHHVRPYIVGDWGYPLLSFLLTPFS NG+GTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKE
Subjt:  VWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKE

Query:  PEPEPLKDPEETGPAPDILDSEKSLCYYGEN
        PEPEPL+DP+ETGPAP+ILDSEKSLCYYGE+
Subjt:  PEPEPLKDPEETGPAPDILDSEKSLCYYGEN

A0A1S4E2D6 putative nuclease HARBI11.2e-22493.47Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLSTLLH HNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPN  S  S   T TPPPP  SSS+YSVSAFRAFST
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSLEAPLRDA WRSLYG+SHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHG SAKTLA+RFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        VSRRRLIETTQAFE+LTSLPNMCGAID SPIKLRRLPADQ+ STNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGD+VW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        D VINVRGHHVRPYIVGDWGYPLLSFLLTPFS NG+GTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGEN
        PEPL+DP+ETGPAP+ILDSEKSLCYYGE+
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGEN

A0A6J1D3K6 protein ALP1-like4.7e-22692.06Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPS--------AASTTTPPPPTSSS----S
        MLSTLLH HN+LDPTISLLPSTPSSASSPSSASLNSPT LLSSSSAAPLLFFTIASVLSFIASSRPNS SSPS        AA+ TTPPPP+SSS    S
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPS--------AASTTTPPPPTSSS----S

Query:  NYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLL
        NYSVSAFRAFST+HIWSLEAPLRDAHWR+LYG+SHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLL
Subjt:  NYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLL

Query:  ATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSL
        ATKLYAEFIKIPVSRRRLIETTQAFE+LTSLPNMCGAID SPIKLRR+P DQ+ STNYNCRFGYPSVLLQVV+DNKKIFWDVCVKAPGGSDDASHFRDSL
Subjt:  ATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSL

Query:  MYHRLTSGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCV
        MYHRLTSGD+VWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGL+HAPQTIVACCV
Subjt:  MYHRLTSGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCV

Query:  LHNLCQIAKEPEPEPLKDPEETGPAPDILDSEKSLCYYGEN
        LHNLCQIAKEPEPEPL+DPEE+GPAP+ILDSEKSLCYYGE+
Subjt:  LHNLCQIAKEPEPEPLKDPEETGPAPDILDSEKSLCYYGEN

A0A6J1G8Q0 protein ALP1-like3.7e-23999.3Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        DKVINVRGHHVRPYI GDWGYPLLSFLLTPFS NGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGEN
        PEPLKDPEETGPAPDILDSEKSLCYYGE+
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGEN

A0A6J1L0N1 protein ALP1-like1.3e-23999.53Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFS NGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGEN
        PEPLKDPEETGPAPDILDSEKSLCYYGE+
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGEN

SwissProt top hitse value%identityAlignment
Q94K49 Protein ANTAGONIST OF LIKE HETEROCHROMATIN PROTEIN 17.0e-1729.96Show/hide
Query:  KPHIALSNLS---LPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSP
        +P   L N+    L  +  VA+ L RL  G S  ++ A F +    VS++T      L  +     ++ P S  R+ E    FE++  LPN CGAID++ 
Subjt:  KPHIALSNLS---LPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSP

Query:  IKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVWDKVINV-RGHHVRPYIVGDWGYPLLSFLLT
        I +  LPA Q+     +    Y S+ LQ V D++  F ++    PGG   +   + S  +    +  I+      + +G  +R Y+VG   YPLL +L+T
Subjt:  IKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVWDKVINV-RGHHVRPYIVGDWGYPLLSFLLT

Query:  PFSSNGIGTPAQNL--FDGMLMKGRSVVVDAIGLLKARWKILQDL--NVGLSHAPQTIVACCVLHNL
        P  S+    P+ ++  F+    K RSV   A   LK  W+IL  +         P  I+ CC+LHN+
Subjt:  PFSSNGIGTPAQNL--FDGMLMKGRSVVVDAIGLLKARWKILQDL--NVGLSHAPQTIVACCVLHNL

Q9M2U3 Protein ALP1-like4.5e-1628.14Show/hide
Query:  SSPSAASTTTPPPPTSSSSNYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIAL--SNLS------LPSDYAVAMVLSRLCHGL
        +S SAA+          SS+ S+  +  FS         P     + S++ IS   F  I   +K       +N S      L  +  VA+ L RL  G 
Subjt:  SSPSAASTTTPPPPTSSSSNYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIAL--SNLS------LPSDYAVAMVLSRLCHGL

Query:  SAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVA
        S   +   F +    VS+IT      +  +     +  P    +L E    FEK++ LPN CGAID + I +  LPA +  +  +       S+ LQ V 
Subjt:  SAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVA

Query:  DNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGD-IVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIG
        D    F DV    PG  +D    ++S  Y  +  G  +  +K+       +R YIVGD G+PLL +LLTP+       P Q  F+    +       A+ 
Subjt:  DNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGD-IVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIG

Query:  LLKARWKILQDL--NVGLSHAPQTIVACCVLHNL
         LK RW+I+  +      +  P+ I  CC+LHN+
Subjt:  LLKARWKILQDL--NVGLSHAPQTIVACCVLHNL

Arabidopsis top hitse value%identityAlignment
AT3G19120.1 PIF / Ping-Pong family of plant transposases8.3e-17572.73Show/hide
Query:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST
        MLS LLH  N LDPT     ST  S++S SS S  +P+SLLS+SSAAPLLFFT+AS+LSF+A +R ++ SS S+ S +  PPP  +  +YSV+AFRA +T
Subjt:  MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFST

Query:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP
        DHIWSL+APLRDA WRSLYG+S+PVF T+VDKLKP I  SNLSLP+DYAVAMVLSRL HG SAKTLA+R+SL+PYL+SKITNMVTRLLATKLY EFIKIP
Subjt:  DHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIP

Query:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW
        V +RRLIETTQ FE+LTSLPN+CGAIDS+P+KLRR     +    Y C++GY +VLLQVVAD+KKIFWDVCVKAPGG DD+SHFRDSL+Y RLTSGDIVW
Subjt:  VSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVW

Query:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE
        +KVIN+RGHHVRPYIVGDW YPLLSFL+TPFS NG GTP +NLFDGMLMKGRSVVV+AIGLLKARWKILQ LNVG++HAPQTIVACCVLHNLCQIA+EPE
Subjt:  DKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPE

Query:  PEPLKDPEETGPAPDILDSEKSLCYYGEN
        PE  KDP+E G    +L+SE+   YYGE+
Subjt:  PEPLKDPEETGPAPDILDSEKSLCYYGEN

AT3G55350.1 PIF / Ping-Pong family of plant transposases3.2e-1728.14Show/hide
Query:  SSPSAASTTTPPPPTSSSSNYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIAL--SNLS------LPSDYAVAMVLSRLCHGL
        +S SAA+          SS+ S+  +  FS         P     + S++ IS   F  I   +K       +N S      L  +  VA+ L RL  G 
Subjt:  SSPSAASTTTPPPPTSSSSNYSVSAFRAFSTDHIWSLEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIAL--SNLS------LPSDYAVAMVLSRLCHGL

Query:  SAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVA
        S   +   F +    VS+IT      +  +     +  P    +L E    FEK++ LPN CGAID + I +  LPA +  +  +       S+ LQ V 
Subjt:  SAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVA

Query:  DNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGD-IVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIG
        D    F DV    PG  +D    ++S  Y  +  G  +  +K+       +R YIVGD G+PLL +LLTP+       P Q  F+    +       A+ 
Subjt:  DNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGD-IVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIG

Query:  LLKARWKILQDL--NVGLSHAPQTIVACCVLHNL
         LK RW+I+  +      +  P+ I  CC+LHN+
Subjt:  LLKARWKILQDL--NVGLSHAPQTIVACCVLHNL

AT3G63270.1 CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (InterPro:IPR006912)5.0e-1829.96Show/hide
Query:  KPHIALSNLS---LPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSP
        +P   L N+    L  +  VA+ L RL  G S  ++ A F +    VS++T      L  +     ++ P S  R+ E    FE++  LPN CGAID++ 
Subjt:  KPHIALSNLS---LPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSP

Query:  IKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVWDKVINV-RGHHVRPYIVGDWGYPLLSFLLT
        I +  LPA Q+     +    Y S+ LQ V D++  F ++    PGG   +   + S  +    +  I+      + +G  +R Y+VG   YPLL +L+T
Subjt:  IKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVWDKVINV-RGHHVRPYIVGDWGYPLLSFLLT

Query:  PFSSNGIGTPAQNL--FDGMLMKGRSVVVDAIGLLKARWKILQDL--NVGLSHAPQTIVACCVLHNL
        P  S+    P+ ++  F+    K RSV   A   LK  W+IL  +         P  I+ CC+LHN+
Subjt:  PFSSNGIGTPAQNL--FDGMLMKGRSVVVDAIGLLKARWKILQDL--NVGLSHAPQTIVACCVLHNL

AT4G29780.1 unknown protein7.2e-1726.09Show/hide
Query:  IASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAF----STDHIWSLEAP-LRDAHWRSLYGISHPVFTTIVDKLKPHIALSNL----SL
        +A+V+S +AS      +  +  +   P    +S S    S  R +    +TD    +  P   +  +R  + +S   F  I ++L   +   N     ++
Subjt:  IASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAF----STDHIWSLEAP-LRDAHWRSLYGISHPVFTTIVDKLKPHIALSNL----SL

Query:  PSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPI-----KLRRLPAD
        P+   V + + RL  G   + ++ RF L      K+   V R +   L  +++  P S   +  T   FE +  +PN+ G+I ++ I     K+      
Subjt:  PSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLPNMCGAIDSSPI-----KLRRLPAD

Query:  QSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGG-SDDASHFRDSLMYHRLTSGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGT
            T  N +  Y S+ +Q V +   IF DVC+  PG  +DD    + SL   R              RG     +IVG+ G+PL  +LL P++   + T
Subjt:  QSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGG-SDDASHFRDSLMYHRLTSGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGT

Query:  PAQNLFDGMLMKGRSVVVDAIGLLKARWKILQD-LNVGLSHAPQTIVACCVLHNLCQIAKEPEPEPLK
          Q+ F+  + + + +   A   LK RW  LQ    V L   P  + ACCVLHN+C++ KE     LK
Subjt:  PAQNLFDGMLMKGRSVVVDAIGLLKARWKILQD-LNVGLSHAPQTIVACCVLHNLCQIAKEPEPEPLK

AT5G12010.1 unknown protein1.8e-2326.77Show/hide
Query:  LEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSL----PSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPV
        L+ P  D  ++  + +S   F  I D+L   +A  + +L    P    VA+ + RL  G   + ++ +F L      K+   V + +   L  ++++ P 
Subjt:  LEAPLRDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSL----PSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPV

Query:  SRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRF-------GYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLT
            L    + FE ++ +PN+ G++ ++ I +  +    S+++ +N R         Y S+ +Q V + K +F D+C+  PG   D      SL+Y R  
Subjt:  SRRRLIETTQAFEKLTSLPNMCGAIDSSPIKLRRLPADQSISTNYNCRF-------GYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLT

Query:  SGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQD-LNVGLSHAPQTIVACCVLHNLC
        +G +       ++G     ++ G  G+PLL ++L P++   + T  Q+ F+  + + + V  +A G LK RW  LQ    V L   P  + ACCVLHN+C
Subjt:  SGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTPFSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQD-LNVGLSHAPQTIVACCVLHNLC

Query:  QIAKEP-EPE
        ++ +E  EPE
Subjt:  QIAKEP-EPE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCTCTCAACCCTCCTTCATTTCCACAACTACCTAGATCCCACCATTTCCCTCCTCCCCTCCACTCCCTCCTCCGCCTCCTCCCCTTCCTCCGCCTCCCTCAACTCCCC
CACCTCCCTCCTCTCCTCCTCCTCCGCCGCACCTCTCCTCTTCTTCACCATCGCCTCCGTTCTCTCCTTCATCGCCTCCTCTCGCCCCAACTCACCTTCCTCCCCTTCCG
CTGCCTCCACCACCACTCCCCCTCCTCCCACCTCCTCCTCCTCCAATTACTCCGTCTCCGCCTTCCGCGCCTTCTCCACTGACCACATCTGGTCCCTCGAAGCCCCTCTT
CGCGATGCCCATTGGCGCTCCCTCTATGGCATCTCCCACCCTGTCTTCACCACCATCGTTGACAAACTCAAACCCCACATTGCCCTCTCCAATCTCTCTCTCCCTTCCGA
TTACGCCGTTGCCATGGTCCTCTCCCGTCTCTGCCATGGCCTCTCCGCTAAAACCCTAGCTGCTCGTTTCTCTCTCGAACCCTATCTCGTTTCCAAAATCACCAACATGG
TCACCCGTCTTTTGGCCACCAAACTCTACGCTGAATTCATCAAAATTCCGGTCAGTCGTCGGCGCTTGATTGAAACAACTCAAGCTTTTGAAAAATTGACTTCTCTACCC
AATATGTGTGGTGCCATTGATAGCAGTCCAATCAAGCTTCGTCGATTGCCTGCCGACCAGAGCATTTCGACTAATTACAATTGCCGATTTGGGTATCCATCGGTTCTGCT
TCAGGTCGTTGCTGACAACAAGAAGATCTTCTGGGATGTATGCGTTAAAGCTCCTGGTGGCAGTGATGATGCCAGCCATTTTAGGGATAGTCTAATGTACCATAGGCTTA
CTTCTGGTGATATTGTATGGGACAAGGTTATCAATGTTAGGGGTCACCATGTTCGTCCTTACATTGTTGGAGATTGGGGCTATCCTCTGTTGTCTTTCCTGTTGACACCA
TTTTCGTCAAACGGCATCGGCACGCCTGCACAGAACCTGTTCGATGGAATGCTAATGAAGGGTCGGTCTGTTGTGGTTGACGCAATTGGGTTGCTGAAGGCTAGGTGGAA
GATTCTTCAGGATTTGAATGTGGGTTTAAGCCATGCTCCACAGACCATTGTTGCTTGTTGTGTATTGCATAATTTGTGTCAAATTGCGAAGGAGCCAGAGCCTGAACCTT
TGAAGGATCCAGAGGAGACTGGCCCTGCGCCTGACATCCTTGACAGTGAGAAATCCCTCTGTTACTATGGTGAAAATTCTATGTTGATTCGAGAAGGAATTTGGTTTTCT
GAGAAAATAGAACTGCAAGAATGGAGTAATATGGCATTGACAGATAGCTTGAGGTATGTAAGTTAG
mRNA sequenceShow/hide mRNA sequence
ATGCTCTCAACCCTCCTTCATTTCCACAACTACCTAGATCCCACCATTTCCCTCCTCCCCTCCACTCCCTCCTCCGCCTCCTCCCCTTCCTCCGCCTCCCTCAACTCCCC
CACCTCCCTCCTCTCCTCCTCCTCCGCCGCACCTCTCCTCTTCTTCACCATCGCCTCCGTTCTCTCCTTCATCGCCTCCTCTCGCCCCAACTCACCTTCCTCCCCTTCCG
CTGCCTCCACCACCACTCCCCCTCCTCCCACCTCCTCCTCCTCCAATTACTCCGTCTCCGCCTTCCGCGCCTTCTCCACTGACCACATCTGGTCCCTCGAAGCCCCTCTT
CGCGATGCCCATTGGCGCTCCCTCTATGGCATCTCCCACCCTGTCTTCACCACCATCGTTGACAAACTCAAACCCCACATTGCCCTCTCCAATCTCTCTCTCCCTTCCGA
TTACGCCGTTGCCATGGTCCTCTCCCGTCTCTGCCATGGCCTCTCCGCTAAAACCCTAGCTGCTCGTTTCTCTCTCGAACCCTATCTCGTTTCCAAAATCACCAACATGG
TCACCCGTCTTTTGGCCACCAAACTCTACGCTGAATTCATCAAAATTCCGGTCAGTCGTCGGCGCTTGATTGAAACAACTCAAGCTTTTGAAAAATTGACTTCTCTACCC
AATATGTGTGGTGCCATTGATAGCAGTCCAATCAAGCTTCGTCGATTGCCTGCCGACCAGAGCATTTCGACTAATTACAATTGCCGATTTGGGTATCCATCGGTTCTGCT
TCAGGTCGTTGCTGACAACAAGAAGATCTTCTGGGATGTATGCGTTAAAGCTCCTGGTGGCAGTGATGATGCCAGCCATTTTAGGGATAGTCTAATGTACCATAGGCTTA
CTTCTGGTGATATTGTATGGGACAAGGTTATCAATGTTAGGGGTCACCATGTTCGTCCTTACATTGTTGGAGATTGGGGCTATCCTCTGTTGTCTTTCCTGTTGACACCA
TTTTCGTCAAACGGCATCGGCACGCCTGCACAGAACCTGTTCGATGGAATGCTAATGAAGGGTCGGTCTGTTGTGGTTGACGCAATTGGGTTGCTGAAGGCTAGGTGGAA
GATTCTTCAGGATTTGAATGTGGGTTTAAGCCATGCTCCACAGACCATTGTTGCTTGTTGTGTATTGCATAATTTGTGTCAAATTGCGAAGGAGCCAGAGCCTGAACCTT
TGAAGGATCCAGAGGAGACTGGCCCTGCGCCTGACATCCTTGACAGTGAGAAATCCCTCTGTTACTATGGTGAAAATTCTATGTTGATTCGAGAAGGAATTTGGTTTTCT
GAGAAAATAGAACTGCAAGAATGGAGTAATATGGCATTGACAGATAGCTTGAGGTATGTAAGTTAGGAACAAAGGGATGCGTTTGTGTCTCCTTAACATGCTGAGGTGCT
GCAGATTATGGCTGAATGTTGATTTTAACTACGACATTTGAGATGGTTTAGAAAAATGGTCAGTTCCCGAATGTTGTGTTGAGCGGTTGTCTTTATTTTGTCGTGCTGCT
ATGATGTAACGTGTCTATCCCATAAAAGAACAATTCTAGGAGAGTTTTTGGATGATACGTTTTGGCTGCCTTGCATATTTTCATTCCTGAAAGTATTTAGCTCGATATAA
CTAGGAAAACGTTTCGAATACCATGCCCGAGTTTACAGGCATGCCAGCTTCATGTAGCCCATTTGATATTTTTTTGCCTCGGAGAACCAGCACACTTTTCACAAAATTAC
TAATGTTTTATTTTTTTTTACT
Protein sequenceShow/hide protein sequence
MLSTLLHFHNYLDPTISLLPSTPSSASSPSSASLNSPTSLLSSSSAAPLLFFTIASVLSFIASSRPNSPSSPSAASTTTPPPPTSSSSNYSVSAFRAFSTDHIWSLEAPL
RDAHWRSLYGISHPVFTTIVDKLKPHIALSNLSLPSDYAVAMVLSRLCHGLSAKTLAARFSLEPYLVSKITNMVTRLLATKLYAEFIKIPVSRRRLIETTQAFEKLTSLP
NMCGAIDSSPIKLRRLPADQSISTNYNCRFGYPSVLLQVVADNKKIFWDVCVKAPGGSDDASHFRDSLMYHRLTSGDIVWDKVINVRGHHVRPYIVGDWGYPLLSFLLTP
FSSNGIGTPAQNLFDGMLMKGRSVVVDAIGLLKARWKILQDLNVGLSHAPQTIVACCVLHNLCQIAKEPEPEPLKDPEETGPAPDILDSEKSLCYYGENSMLIREGIWFS
EKIELQEWSNMALTDSLRYVS