; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh07G004010 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh07G004010
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Descriptionaspartyl protease family protein 1-like
Genome locationCmo_Chr07:1839332..1842772
RNA-Seq ExpressionCmoCh07G004010
SyntenyCmoCh07G004010
Gene Ontology termsGO:0006508 - proteolysis (biological process)
GO:0004190 - aspartic-type endopeptidase activity (molecular function)
InterPro domainsIPR001461 - Aspartic peptidase A1 family
IPR001969 - Aspartic peptidase, active site
IPR021109 - Aspartic peptidase domain superfamily
IPR032799 - Xylanase inhibitor, C-terminal
IPR032861 - Xylanase inhibitor, N-terminal
IPR033121 - Peptidase family A1 domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6594755.1 Aspartyl protease family protein 1, partial [Cucurbita argyrosperma subsp. sororia]2.9e-30698.34Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MAWTFSSGVQMLLVLSVYLLACGLRSGEA SFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF
        YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF

Query:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAK------DSPPADDSPPAEDSPPAEDSPPAEDSPPTD
        PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAK      DSPPADDSPPA+DSPPAEDSPPAEDSPPTD
Subjt:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAK------DSPPADDSPPAEDSPPAEDSPPAEDSPPTD

Query:  DSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        DSPSPPS+PGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
Subjt:  DSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

XP_016899154.1 PREDICTED: aspartyl protease family protein 1-like [Cucumis melo]4.2e-22072.66Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MA TFSSG QMLL+LSV++LA  LRSG+AASFKFNIHHRFS+S+K +L SEGLPEKHTP YYATMVHRD LVRGRRLA++N DT+LTFAYGN+T +I  L
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        G+LYYAN+SVG+PS+DFLVALDTGSDL WLPCEC SC TYLNT++GGKF LNHYSP+DSTTS+ VPC++SLC    QCTSN NTCPYEINY+SANTSS G
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLV+DVLHLA DD  L PVE+KITFGCGTVQTG+F   AAPNGLIGLGM++ISVPS LA+QGLT+DSFSMCFG+DG GRIDFGD+G  GQ++TPFNTM  
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLFIG
        + SYNVT  EI VGGK NNV FTAIFDSGTSFTYL EP YS ISEQM+AGMKLKRF+  P FPF+YCYE+ P+  ++ RP LNFTM GGD+FVP+D+F+ 
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLFIG

Query:  FPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA----KDSPPAD----DSPPAEDSPPAEDSPPAEDSP
         P+D+T  A CL L KSTDI+LIGQNFMTGYRIIF+R +M LGWSPSDCYD+   TPS D+PPA     DSPP D    DSPP +D+PP+ DSPP++DSP
Subjt:  FPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA----KDSPPAD----DSPPAEDSPPAEDSPPAEDSP

Query:  PTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        P+ DSP  PS+PGG  GLP+IG  A RLNPL SVFVAVLAILAVV
Subjt:  PTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

XP_022926492.1 aspartyl protease family protein 1-like [Cucurbita moschata]2.1e-309100Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF
        YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF

Query:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP
        PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP
Subjt:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP

Query:  SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
Subjt:  SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

XP_023518254.1 aspartyl protease family protein 1-like [Cucurbita pepo subsp. pepo]1.3e-30195.98Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MAWTFSSGVQMLLVLSVYLLACGLR+GEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRD LVRGRRLASSNGDTKLTFAYGNETFYIENL
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLVQDVLHLATDDLKLDPVE+KITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGL+TDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF
        YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIIS+QMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVP+DLFIGF
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF

Query:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDT-----------PPAKDSPPADDSPPAEDSPPAEDSPPAED
        PIDDTTHAVCLTLIKS DINLIGQNFMTGYRIIFDREKM LGWSPSDCYDSDAGTPSGDT           PPA DSPPA+DSPPAEDSPPAEDSPPAED
Subjt:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDT-----------PPAKDSPPADDSPPAEDSPPAEDSPPAED

Query:  SPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        SPPTDDSPSPPS+PGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
Subjt:  SPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

XP_038882816.1 aspartyl protease family protein 1-like [Benincasa hispida]2.1e-23574.96Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MAWTF+SG QMLLVLS++LLA GLRSG+A+SFKF+IHHRFS+S+KGIL SEGLPEKHTP YYATMVHRD  VRGRRLA    DT+LTFAYGN+TF+I  L
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        G+LYYAN+SVG+PSLDF VALDTGSDL WLPCECRSC TYLNT+DGG+F LNHYSP DSTTS+ VPCS+SLCELSNQCTSN NTCPYEINYLSANTSS G
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLV+DVLHLATDD  L PVE+KITFGCG VQTG+F R AAPNGLIGLGM++ISVPS LA+QGLT+DSFSMCFG+D  GRIDFGD+G  GQ+ETPFN+M +
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDK-VERPILNFTMMGGDDFVPMDLFIG
        + SYNV+  +IIVG K NNV FTAIFDSGTSFTYL EPAYS ISEQM+AGM LKRFT D  FPFEYCYELP+N K V+RP+LNFTM GGDDFVP+DLFI 
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDK-VERPILNFTMMGGDDFVPMDLFIG

Query:  FPIDD--TTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA--------------------KDSPPADDSPPAED
         PIDD  ++ A CL ++KSTDI+LIGQNFMTGYRIIF+REKM LGWS SDCYD+  GTPSGDTPP+                     DSPP DDSPP+E 
Subjt:  FPIDD--TTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA--------------------KDSPPADDSPPAED

Query:  SPPAEDSPPAEDSPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        SPP+EDSPP+EDSPP++DSP  PS+PGG TGLP   GDATRLNPL SVFVAVLAILAVV
Subjt:  SPPAEDSPPAEDSPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

TrEMBL top hitse value%identityAlignment
A0A0A0KML0 Peptidase A1 domain-containing protein2.0e-21568.76Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MA TFSSG QMLLVLSV++LA  LRSG+AASFKF+IHHRFS+SIKGI  SEGLPEKHTP YYATMVHRD LVRGRRLA+S+ DT+LTFAYGN+T +I +L
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        G+LYYAN+SVG+PSLDFLVALDTGSDL WLPCEC SC TYLNT++GGKF LNHYSP+DSTTS+ VPC++SLC   N+CTSN N CPYE+ YLSANTSS G
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLV+DVLHLATDD  L PVE+KITFGCGTVQTG+F   AAPNGLIGLGM++ISVPS LA+QGLT++SFSMCFG DG GRIDFGD+G   Q++TPFNTM  
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTT-DPDFPFEYCYELPANDK-VERPILNFTMMGGDDFVPMDLFI
        Y SYNVT   I VGG+ N+V FTAIFDSGTSFTYL EPAYS I++QM+AGMKLKR++   P+FPFEYCYE+P   K  +   LNFTM GGD+F P D+F+
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTT-DPDFPFEYCYELPANDK-VERPILNFTMMGGDDFVPMDLFI

Query:  GFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA-----------------------------KDSPPA
          P+D+TTH  CL + KSTDI+LIGQNFMTGYRI F+R++M LGWS SDCYD+  GTPSGDTPPA                              D+PP+
Subjt:  GFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA-----------------------------KDSPPA

Query:  DDSPPAEDSPPAEDSPPAEDSPPTDDSP----SP--PSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        DDSPP+EDSPP+EDSPP+EDSPP+DDSP    SP  PS+PGG  GLP +GG A +LNPL  VF AVLAILA+V
Subjt:  DDSPPAEDSPPAEDSPPAEDSPPTDDSP----SP--PSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

A0A1S4DT41 aspartyl protease family protein 1-like2.0e-22072.66Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MA TFSSG QMLL+LSV++LA  LRSG+AASFKFNIHHRFS+S+K +L SEGLPEKHTP YYATMVHRD LVRGRRLA++N DT+LTFAYGN+T +I  L
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        G+LYYAN+SVG+PS+DFLVALDTGSDL WLPCEC SC TYLNT++GGKF LNHYSP+DSTTS+ VPC++SLC    QCTSN NTCPYEINY+SANTSS G
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLV+DVLHLA DD  L PVE+KITFGCGTVQTG+F   AAPNGLIGLGM++ISVPS LA+QGLT+DSFSMCFG+DG GRIDFGD+G  GQ++TPFNTM  
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLFIG
        + SYNVT  EI VGGK NNV FTAIFDSGTSFTYL EP YS ISEQM+AGMKLKRF+  P FPF+YCYE+ P+  ++ RP LNFTM GGD+FVP+D+F+ 
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLFIG

Query:  FPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA----KDSPPAD----DSPPAEDSPPAEDSPPAEDSP
         P+D+T  A CL L KSTDI+LIGQNFMTGYRIIF+R +M LGWSPSDCYD+   TPS D+PPA     DSPP D    DSPP +D+PP+ DSPP++DSP
Subjt:  FPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPA----KDSPPAD----DSPPAEDSPPAEDSPPAEDSP

Query:  PTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        P+ DSP  PS+PGG  GLP+IG  A RLNPL SVFVAVLAILAVV
Subjt:  PTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

A0A5A7SKI7 Aspartyl protease family protein 1-like2.2e-21970.28Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MA TFSSG QMLL+LSV++LA  LRSG+AASFKFNIHHRFS+S+K +L SEGLPEKHTP YYATMVHRD LVRGRRLA++N DT+LTFAYGN+T +I  L
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        G+LYYAN+SVG+PS+DFLVALDTGSDL WLPCEC SC TYLNT++GGKF LNHYSP+DSTTS+ VPC++SLC    QCTSN N CPYEINY+SANTSS G
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLV+DVLHLA DD  L PVE+KITFGCGTVQTG+F   AAPNGLIGLGM++ISVPS LA+QGLT+DSFSMCFG+DG GRIDFGD+G  GQ++TPFNTM  
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLFIG
        + SYNVT  EI VGGK NNV FTAIFDSGTSFTYL EP YS ISEQM+AGMKLKRF+  P FPF+YCYE+ P+  ++ RP LNFTM GGD+FVP+D+F+ 
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLFIG

Query:  FPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPS-------------------------GDTPPAKDSPPADDSPP
         P+D+T  A CL L KSTDI+LIGQNFMTGYRIIF+R +M LGWSPSDCYD+   TPS                          DTPP+ DSPP+ DSPP
Subjt:  FPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPS-------------------------GDTPPAKDSPPADDSPP

Query:  AEDSPPAEDSPPAEDSPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        + DSPP+ DSPP++DSPP+ DSP  PS+PGG  GLP+IG  A RLNPL SVFVAVLAILAVV
Subjt:  AEDSPPAEDSPPAEDSPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

A0A6J1BTF7 aspartyl protease family protein 1-like2.6e-22072.26Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MAWTFSSG QMLL LSV+LLA  LRSGEA SFKF+IHHRFS+SIKGIL SEGLPEK +P YYATMVHRD LV GRRLA++NGD  LTF YGN+TF I NL
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        G+LYYANISVG+P L FLVALDTGSDL WLPCEC SCLTYLNTT+GGKF LNHYSP DSTTS  VPCSNSLCEL+NQC+S T+TCPYEINYLSANTSS+G
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLVQDVLHLATDD +L PV++KITFGCG +QTG+F   AAPNGLIGLGM++ISVPS LA+QGLT+DSFSMCFG DG GRIDFGD GT GQRETPFNTM N
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPAN-DKVERPILNFTMMGGDDFVPMDLFIG
        +PSYNVT T+IIVGGK+NN++F+AIFDSGTSF+Y+ +P YS+I+EQM+AGMKL+R   DPDFPFEYCY+LP N +    P LNFTM GGD++  +D F+ 
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPAN-DKVERPILNFTMMGGDDFVPMDLFIG

Query:  FPIDDTTH-AVCLTLIKSTD-INLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAE-----DSPP
         P D++   A CL ++KSTD I+LIGQNFMTGYRIIF+REKM LGW+ SDCYD+ A TPS ++PPA +SPP+ DSPP + SPP + SPP++     DSPP
Subjt:  FPIDDTTH-AVCLTLIKSTD-INLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAE-----DSPP

Query:  TDDSPSPPSSPGGSTG---LPKIG-GDATRLNPLTSVFVAVLAILAVV
        + DSP  PS+ GGS G   LP+IG GDATRLNPL  VFVA+LAIL VV
Subjt:  TDDSPSPPSSPGGSTG---LPKIG-GDATRLNPLTSVFVAVLAILAVV

A0A6J1EEK3 aspartyl protease family protein 1-like1.0e-309100Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
        MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENL

Query:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
        GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG
Subjt:  GYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTG

Query:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
        YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN
Subjt:  YLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF
        YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGF

Query:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP
        PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP
Subjt:  PIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP

Query:  SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
        SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV
Subjt:  SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV

SwissProt top hitse value%identityAlignment
Q4V3D2 Aspartic proteinase 361.2e-2825.76Show/hide
Query:  LVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYANISVGS
        +V  V++L   + SG   +F FN+ H+F+   K +  SE   + H    +A M+    L  G       GD++            +++G LY+  I +GS
Subjt:  LVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYANISVGS

Query:  PSLDFLVALDTGSDLLWLPC-ECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCE--LSNQCTSNTNTCPYEINYLSANTSSTGYLVQDV-LH
        P  ++ V +DTGSD+LW+ C  C  C      TD G   L+ Y    S+TS  V C +  C   + ++       C Y + Y   +TS   ++  ++ L 
Subjt:  PSLDFLVALDTGSDLLWLPC-ECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCE--LSNQCTSNTNTCPYEINYLSANTSSTGYLVQDV-LH

Query:  LATDDLKLDPVESKITFGCGTVQTG-VFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCF-GIDGIGRIDFGDSGTPGQRETPFNTMANYPSYNV
          T +L+  P+  ++ FGCG  Q+G + Q  +A +G++G G    S+ S LA  G T   FS C   ++G G    G+  +P  + TP   + N   YNV
Subjt:  LATDDLKLDPVESKITFGCGTVQTG-VFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCF-GIDGIGRIDFGDSGTPGQRETPFNTMANYPSYNV

Query:  TVTEIIVGG---------KANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLF
         +  + V G          + N +   I DSGT+  YL +  Y+ + E++ A  ++K       F    C+   +N     P++N      +D + + ++
Subjt:  TVTEIIVGG---------KANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLF

Query:  ---IGFPIDDTTHAV-----CLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDS
             F + +  +        +T     D+ L+G   ++   +++D E   +GW+  +C  S
Subjt:  ---IGFPIDDTTHAV-----CLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDS

Q6XBF8 Aspartic proteinase CDR18.1e-2527.79Show/hide
Query:  YYANISVGSPSLDFLVALDTGSDLLWLPC-ECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLC-ELSNQ--CTSNTNTCPYEINYLSANTSST
        Y  N+S+G+P    +   DTGSDLLW  C  C  C T ++           + P  S+T   V CS+S C  L NQ  C++N NTC Y ++Y   N+ + 
Subjt:  YYANISVGSPSLDFLVALDTGSDLLWLPC-ECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLC-ELSNQ--CTSNTNTCPYEINYLSANTSST

Query:  GYLVQDVLHLATDDLKLDPVESK-ITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCF-----GIDGIGRIDFGDSGT---PGQ
        G +  D L L + D +  P++ K I  GCG    G F +    +G++GLG   +S+   L +       FS C        D   +I+FG +      G 
Subjt:  GYLVQDVLHLATDDLKLDPVESK-ITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCF-----GIDGIGRIDFGDSGT---PGQ

Query:  RETPFNTMANYPS-YNVTVTEIIVGGK--------ANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPIL
          TP    A+  + Y +T+  I VG K        + + E   I DSGT+ T L    YS + + + + +  ++   DP      CY    + KV  P++
Subjt:  RETPFNTMANYPS-YNVTVTEIIVGGK--------ANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPIL

Query:  NFTMMGGDDFVPMDLFIGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDC
             G D  V +D    F +  +   VC     S   ++ G      + + +D     + + P+DC
Subjt:  NFTMMGGDDFVPMDLFIGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDC

Q8VYV9 Aspartyl protease family protein 14.3e-12748.59Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEA-ASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIEN
        M W  S  +  L +L +   +  L   E    F F  HHRFS+ + G+L  +GLP + +  YY  M HRD L+RGRRLA+ +  + +TF+ GNET  ++ 
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEA-ASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIEN

Query:  LGYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSST
        LG+L+YAN++VG+PS  F+VALDTGSDL WLPC+C +C+  L    G    LN YSP+ S+TS  VPC+++LC   ++C S  + CPY+I YLS  TSST
Subjt:  LGYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSST

Query:  GYLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMA
        G LV+DVLHL ++D     + +++TFGCG VQTGVF  GAAPNGL GLG++ ISVPS+LA +G+  +SFSMCFG DG GRI FGD G+  QRETP N   
Subjt:  GYLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMA

Query:  NYPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRF-TTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLF
         +P+YN+TVT+I VGG   ++EF A+FDSGTSFTYL + AY++ISE  N+    KR+ TTD + PFEYCY L P  D  + P +N TM GG  +      
Subjt:  NYPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRF-TTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLF

Query:  IGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPT
        +  P+ D T   CL ++K  DI++IGQNFMTGYR++FDREK+ LGW  SDCY    G  S  T P+  S  +   P +   P A + P    +  T
Subjt:  IGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPT

Q9LX20 Aspartic proteinase-like protein 11.1e-6936.59Show/hide
Query:  SVYLLACGL----RSGEAASFKFNIHHRFSE----SIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIEN-LGYLYYA
        S +LL C L        A+ F   + HRFS+    SIK   +S+ LP K +  YY  +   D   R +R+        L  + G++T    N  G+L+Y 
Subjt:  SVYLLACGL----RSGEAASFKFNIHHRFSE----SIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIEN-LGYLYYA

Query:  NISVGSPSLDFLVALDTGSDLLWLPCECRSC--LTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQ
         I +G+PS+ FLVALDTGS+LLW+PC C  C  LT    +      LN Y+P  S+TS    CS+ LC+ ++ C S    CPY +NYLS NTSS+G LV+
Subjt:  NISVGSPSLDFLVALDTGSDLLWLPCECRSC--LTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQ

Query:  DVLHLA--TDDLKLD---PVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMA
        D+LHL   T++  ++    V++++  GCG  Q+G +  G AP+GL+GLG   ISVPS L+  GL  +SFS+CF  +  GRI FGD G   Q+ TPF  + 
Subjt:  DVLHLA--TDDLKLD---PVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMA

Query:  N--YPSYNVTVTEIIVGGKA-NNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDF---PFEYCYELPANDKVERPILNFTMMGGDDFVP
        N  Y  Y V V    +G        FT   DSG SFTYL E  Y  ++ +++  +      T  +F    +EYCYE  A  KV  P +       + FV 
Subjt:  N--YPSYNVTVTEIIVGGKA-NNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDF---PFEYCYELPANDKVERPILNFTMMGGDDFVP

Query:  MDLFIGFPIDDTTHAVCLTLIKS--TDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSP
              F         CL +  S    I  IGQN+M GYR++FDRE M LGWSPS C +                   D   P + SP +  SP   +  
Subjt:  MDLFIGFPIDDTTHAVCLTLIKS--TDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSP

Query:  PTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTS
        PTD+      S GG    P I G      P +S
Subjt:  PTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTS

Q9S9K4 Aspartic proteinase 391.6e-2827.93Show/hide
Query:  IENLGYLYYANISVGSPSLDFLVALDTGSDLLWLPCE-CRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNT--CPYEINYLS
        ++++G LY+  I +GSP  ++ V +DTGSD+LW+ C+ C  C T  N      F L+ +  + S+TS  V C +  C   +Q  S      C Y I Y  
Subjt:  IENLGYLYYANISVGSPSLDFLVALDTGSDLLWLPCE-CRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNT--CPYEINYLS

Query:  ANTSSTGYLVQDVLHL--ATDDLKLDPVESKITFGCGTVQTGVFQRG-AAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCF-GIDGIGRIDFGDSGTPG
         +TS  G  ++D+L L   T DLK  P+  ++ FGCG+ Q+G    G +A +G++G G    SV S LA  G     FS C   + G G    G   +P 
Subjt:  ANTSSTGYLVQDVLHL--ATDDLKLDPVESKITFGCGTVQTGVFQRG-AAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCF-GIDGIGRIDFGDSGTPG

Query:  QRETPFNTMANYPSYNVTVTEIIVGGKANNVEFT------AIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNF
         + TP   + N   YNV +  + V G + ++  +       I DSGT+  Y  +  Y  + E + A   +K    +  F    C+    N     P ++F
Subjt:  QRETPFNTMANYPSYNVTVTEIIVGGKANNVEFT------AIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNF

Query:  TMMGGDDFVPMDLF---IGFPIDDTTH-----AVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDS
             +D V + ++     F +++  +     A  LT  + +++ L+G   ++   +++D +   +GW+  +C  S
Subjt:  TMMGGDDFVPMDLF---IGFPIDDTTH-----AVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDS

Arabidopsis top hitse value%identityAlignment
AT2G17760.1 Eukaryotic aspartyl protease family protein3.1e-12848.59Show/hide
Query:  MAWTFSSGVQMLLVLSVYLLACGLRSGEA-ASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIEN
        M W  S  +  L +L +   +  L   E    F F  HHRFS+ + G+L  +GLP + +  YY  M HRD L+RGRRLA+ +  + +TF+ GNET  ++ 
Subjt:  MAWTFSSGVQMLLVLSVYLLACGLRSGEA-ASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIEN

Query:  LGYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSST
        LG+L+YAN++VG+PS  F+VALDTGSDL WLPC+C +C+  L    G    LN YSP+ S+TS  VPC+++LC   ++C S  + CPY+I YLS  TSST
Subjt:  LGYLYYANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSST

Query:  GYLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMA
        G LV+DVLHL ++D     + +++TFGCG VQTGVF  GAAPNGL GLG++ ISVPS+LA +G+  +SFSMCFG DG GRI FGD G+  QRETP N   
Subjt:  GYLVQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMA

Query:  NYPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRF-TTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLF
         +P+YN+TVT+I VGG   ++EF A+FDSGTSFTYL + AY++ISE  N+    KR+ TTD + PFEYCY L P  D  + P +N TM GG  +      
Subjt:  NYPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRF-TTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDDFVPMDLF

Query:  IGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPT
        +  P+ D T   CL ++K  DI++IGQNFMTGYR++FDREK+ LGW  SDCY    G  S  T P+  S  +   P +   P A + P    +  T
Subjt:  IGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPT

AT3G51330.1 Eukaryotic aspartyl protease family protein2.9e-11044.86Show/hide
Query:  QMLLVLSVYLLACGLRSGEAA-SFKFNIHHRFSESIKGILTSEGL-PEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYAN
        Q+ ++LS+ ++  GL   EA+  F F +HH FS+ +K  L  + L PEK +  Y+  +  RD L+RGR LAS+N +T +TF  GN T  I+ LG+L+YAN
Subjt:  QMLLVLSVYLLACGLRSGEAA-SFKFNIHHRFSESIKGILTSEGL-PEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYAN

Query:  ISVGSPSLDFLVALDTGSDLLWLPCECRS-CLTYLNTTD-GGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQD
        +SVG+P+  FLVALDTGSDL WLPC C S C+  L          LN YSP+ S+TS+ + CS+  C  S++C+S  ++CPY+I YLS +T +TG L +D
Subjt:  ISVGSPSLDFLVALDTGSDLLWLPCECRS-CLTYLNTTD-GGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQD

Query:  VLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFG--IDGIGRIDFGDSGTPGQRETPFNTMANYPS
        VLHL T+D  L+PV++ IT GCG  QTG  Q  AA NGL+GLG+   SVPS+LA   +T +SFSMCFG  ID +GRI FGD G   Q ETP       P+
Subjt:  VLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFG--IDGIGRIDFGDSGTPGQRETPFNTMANYPS

Query:  YNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDD-FVPMDLFIGFP
        Y V+VTE+ VGG A  V+  A+FD+GTSFT+L EP Y +I++  +  +  KR   DP+ PFE+CY+L P    +  P +  T  GG   F+   LFI + 
Subjt:  YNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL-PANDKVERPILNFTMMGGDD-FVPMDLFIGFP

Query:  IDDTTHAVCLTLIKSTD--INLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSP
         +D +   CL ++KS D  IN+IGQNFM+GYRI+FDRE+M LGW  SDC++ ++   +   PP  ++P    SP A    P+   PPA  +PP  D  + 
Subjt:  IDDTTHAVCLTLIKSTD--INLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSP

Query:  PSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILA
          + G         G A  L PL S  + +L +LA
Subjt:  PSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILA

AT3G51340.1 Eukaryotic aspartyl protease family protein5.6e-9840.61Show/hide
Query:  QMLLVLS-VYLLACGLRSGEAA-SFKFNIHHRFSESIKGILTSEGL-PEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYA
        Q+ ++LS + L+  GL   EA+  F F +HH FS+ +K  L  + L PE  +  Y+  + HRD  +RGR LAS+N +T LT    N T  +  LG+L+YA
Subjt:  QMLLVLS-VYLLACGLRSGEAA-SFKFNIHHRFSESIKGILTSEGL-PEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYA

Query:  NISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFA----LNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYL
        N+S+G+P+  FLVALDTGSDL WLPC C +  T ++     +F+    LN Y+P+ STTS+ + CS+  C  S +C+S  + CPY+I  LS+NT +TG L
Subjt:  NISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFA----LNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYL

Query:  VQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFG--IDGIGRIDFGDSGTPGQRETPFNTMAN
        +QDVLHL T+D  L PV + +T GCG  QTG FQ   A NG++GL M   SVPSLLA   +T +SFSMCFG  I  +GRI FGD G   Q ETP  ++  
Subjt:  VQDVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFG--IDGIGRIDFGDSGTPGQRETPFNTMAN

Query:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL--------------------PANDKVERPI
          +Y V VT + VGG   +V   A+FD+G+SFT L E AY + ++  +  M+ KR   DPDFPFE+CY+L                    P  D     I
Subjt:  YPSYNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYEL--------------------PANDKVERPI

Query:  LNFTMMGGDDFVPMDLFIGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPP
         N +             + +  ++ T   CL ++KS ++N+IGQN M+G+RI+FDRE+M LGW  S+C++ ++       PP  ++P     PP+  +PP
Subjt:  LNFTMMGGDDFVPMDLFIGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPP

Query:  AEDSPPAEDSPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILA
            P A  +PPT D       P  ST     GG A  L+PL +  + +L +LA
Subjt:  AEDSPPAEDSPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILA

AT3G51350.1 Eukaryotic aspartyl protease family protein7.8e-10842.88Show/hide
Query:  QMLLVLSVYLLACGLRSGEA-ASFKFNIHHRFSESIKGIL-TSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYAN
        Q+ ++LSV ++  G    EA   F F +HH FS+S+K  L   + +PE+ +  Y+  + HRD L+RGR LAS+N +T +TF  GN T  ++ LG LYYAN
Subjt:  QMLLVLSVYLLACGLRSGEA-ASFKFNIHHRFSESIKGIL-TSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYAN

Query:  ISVGSPSLDFLVALDTGSDLLWLPCEC-RSCLTYLNTTD-GGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQD
        +SVG+P   FLVALDTGSDL WLPC C  +C+  L          LN Y+P+ STTS+ + CS+  C  S +C+S ++ CPY+I+Y S +T + G L+QD
Subjt:  ISVGSPSLDFLVALDTGSDLLWLPCEC-RSCLTYLNTTD-GGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQD

Query:  VLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFG--IDGIGRIDFGDSGTPGQRETPFNTMANYPS
        VLHLAT+D  L PV++ +T GCG  QTG+FQR  + NG++GLG+   SVPSLLA   +T +SFSMCFG  I  +GRI FGD G   Q ETPF ++A   +
Subjt:  VLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFG--IDGIGRIDFGDSGTPGQRETPFNTMANYPS

Query:  YNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPAN-DKVERPILNFTMMGGDDFVPMDLFIGFPI
        Y V ++ + V G   ++   A FD+G+SFT+L EPAY ++++  +  ++ +R   DP+ PFE+CY+L  N   ++ P++  T +GG   +  + F     
Subjt:  YNVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPAN-DKVERPILNFTMMGGDDFVPMDLFIGFPI

Query:  DDTTHAVCLTLIKST--DINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP
         +     CL ++KS    IN+IGQNF+ GYRI+FDRE+M LGW  S C++ +  +    TPP    PP  ++P      P+  +PP    PPT  +  PP
Subjt:  DDTTHAVCLTLIKST--DINLIGQNFMTGYRIIFDREKMALGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPP

Query:  SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILA
         +P  STG P  GG A  L PL S  + +L +LA
Subjt:  SSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILA

AT4G35880.1 Eukaryotic aspartyl protease family protein1.1e-11746.98Show/hide
Query:  MLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEG----LPEKHTPAYYATMVHRDMLVRGRRLASSNGDTK--LTFAYGNETFYIENLGYLY
        + L+  + LL+ G  +G    F F +HHRFS+ +K    S G     P K +  Y+  +V RD L+RGRRL+ S  +++  LTF+ GN T  I +LG+L+
Subjt:  MLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEG----LPEKHTPAYYATMVHRDMLVRGRRLASSNGDTK--LTFAYGNETFYIENLGYLY

Query:  YANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQ
        Y  + +G+P + F+VALDTGSDL W+PC+C  C      T   +F L+ Y+P  STT+  V C+NSLC   NQC    +TCPY ++Y+SA TS++G L++
Subjt:  YANISVGSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQ

Query:  DVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMANYPSY
        DV+HL T+D   + VE+ +TFGCG VQ+G F   AAPNGL GLGM++ISVPS+LA +GL  DSFSMCFG DG+GRI FGD G+  Q ETPFN   ++P+Y
Subjt:  DVLHLATDDLKLDPVESKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMANYPSY

Query:  NVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVER-PILNFTMMGGDDFVPMDLFIGFPID
        N+TVT + VG    + EFTA+FD+GTSFTYL +P Y+ +SE  ++  + KR + D   PFEYCY++  +      P L+ TM G   F   D  I    +
Subjt:  NVTVTEIIVGGKANNVEFTAIFDSGTSFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVER-PILNFTMMGGDDFVPMDLFIGFPID

Query:  DTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYD
              CL ++KS+++N+IGQN+MTGYR++FDREK+ L W   DCYD
Subjt:  DTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMALGWSPSDCYD


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGTGGACTTTCAGTTCCGGCGTCCAAATGTTACTGGTTCTTTCTGTTTACCTACTTGCCTGCGGGCTCAGAAGCGGCGAGGCGGCTTCGTTTAAGTTCAATATTCA
CCATCGATTTTCGGAATCGATAAAGGGAATTCTCACGTCTGAAGGCTTACCGGAGAAACACACCCCTGCCTATTATGCCACTATGGTCCATCGCGATATGTTAGTTCGCG
GCCGGCGACTGGCCTCCAGCAACGGCGATACGAAGCTGACGTTCGCTTATGGCAACGAGACGTTCTACATCGAAAATTTGGGATATTTGTACTACGCCAATATATCGGTG
GGATCGCCGTCGTTAGATTTCTTAGTGGCATTGGACACTGGAAGCGATTTGCTCTGGTTACCTTGTGAATGCCGTAGTTGTTTAACTTATTTGAACACAACAGATGGTGG
GAAGTTTGCGTTGAATCATTATAGTCCAGATGATTCAACAACGAGCGCACCTGTTCCCTGCAGCAACTCTTTGTGCGAGCTCTCAAACCAGTGCACTTCGAACACAAATA
CTTGCCCTTACGAAATTAATTACCTGTCTGCCAATACCTCATCCACTGGCTACTTGGTACAGGACGTCTTGCACTTGGCCACTGATGATTTAAAACTCGACCCTGTCGAA
TCCAAGATTACTTTTGGGTGCGGTACGGTTCAGACTGGTGTATTTCAAAGAGGTGCAGCTCCCAATGGTCTTATTGGGCTTGGCATGGACAGGATATCAGTTCCAAGCTT
ATTAGCAAACCAAGGGCTTACCACAGATTCATTCTCCATGTGTTTCGGGATTGATGGTATTGGGAGAATCGATTTTGGAGACTCAGGCACCCCAGGCCAAAGAGAAACAC
CCTTCAATACCATGGCCAACTATCCATCCTACAATGTCACCGTCACTGAGATAATTGTGGGAGGAAAAGCCAACAATGTCGAATTCACCGCAATTTTCGACTCCGGTACC
TCGTTTACCTACTTGAATGAACCAGCTTACTCCATTATTTCTGAGCAAATGAATGCAGGAATGAAACTAAAGCGCTTTACAACAGATCCCGATTTCCCATTTGAGTACTG
CTATGAACTTCCTGCTAACGACAAAGTTGAACGTCCGATACTGAATTTTACGATGATGGGTGGGGACGATTTTGTCCCCATGGATCTGTTCATTGGTTTTCCTATTGACG
ATACTACACATGCAGTTTGTCTAACCCTTATCAAAAGCACCGATATTAATCTAATTGGACAGAACTTCATGACTGGTTACCGTATTATCTTCGATCGTGAAAAGATGGCG
TTGGGATGGAGTCCTTCAGACTGTTACGACAGTGACGCCGGCACTCCCTCCGGTGACACCCCTCCGGCCAAAGACTCCCCCCCGGCCGACGACTCTCCCCCAGCCGAGGA
CTCTCCCCCGGCCGAAGACTCTCCGCCGGCAGAAGACTCTCCCCCCACCGACGATTCTCCATCGCCACCTTCTTCCCCCGGAGGAAGCACCGGTTTGCCGAAAATTGGGG
GTGATGCAACGCGGTTGAATCCATTGACCTCTGTGTTTGTCGCCGTTCTTGCAATTTTGGCTGTTGTTTGA
mRNA sequenceShow/hide mRNA sequence
AGAGAGACCAGAATTTCATCATCTTCTGAAGTTCAACGCCTCTCTCTCTCTCTCTCTCATCCTGCTCATGTTCTTCATCCTTGAATCCGTCAAAGCTTCCTATCCCATTC
GATTCTATTTAAACTCTTTTCAAATCCTTCCATGTCTTCATCACTTTCCCGGGAAATTTCTGGTTACTCTAATCGGCGTCCATGGCGTGGACTTTCAGTTCCGGCGTCCA
AATGTTACTGGTTCTTTCTGTTTACCTACTTGCCTGCGGGCTCAGAAGCGGCGAGGCGGCTTCGTTTAAGTTCAATATTCACCATCGATTTTCGGAATCGATAAAGGGAA
TTCTCACGTCTGAAGGCTTACCGGAGAAACACACCCCTGCCTATTATGCCACTATGGTCCATCGCGATATGTTAGTTCGCGGCCGGCGACTGGCCTCCAGCAACGGCGAT
ACGAAGCTGACGTTCGCTTATGGCAACGAGACGTTCTACATCGAAAATTTGGGATATTTGTACTACGCCAATATATCGGTGGGATCGCCGTCGTTAGATTTCTTAGTGGC
ATTGGACACTGGAAGCGATTTGCTCTGGTTACCTTGTGAATGCCGTAGTTGTTTAACTTATTTGAACACAACAGATGGTGGGAAGTTTGCGTTGAATCATTATAGTCCAG
ATGATTCAACAACGAGCGCACCTGTTCCCTGCAGCAACTCTTTGTGCGAGCTCTCAAACCAGTGCACTTCGAACACAAATACTTGCCCTTACGAAATTAATTACCTGTCT
GCCAATACCTCATCCACTGGCTACTTGGTACAGGACGTCTTGCACTTGGCCACTGATGATTTAAAACTCGACCCTGTCGAATCCAAGATTACTTTTGGGTGCGGTACGGT
TCAGACTGGTGTATTTCAAAGAGGTGCAGCTCCCAATGGTCTTATTGGGCTTGGCATGGACAGGATATCAGTTCCAAGCTTATTAGCAAACCAAGGGCTTACCACAGATT
CATTCTCCATGTGTTTCGGGATTGATGGTATTGGGAGAATCGATTTTGGAGACTCAGGCACCCCAGGCCAAAGAGAAACACCCTTCAATACCATGGCCAACTATCCATCC
TACAATGTCACCGTCACTGAGATAATTGTGGGAGGAAAAGCCAACAATGTCGAATTCACCGCAATTTTCGACTCCGGTACCTCGTTTACCTACTTGAATGAACCAGCTTA
CTCCATTATTTCTGAGCAAATGAATGCAGGAATGAAACTAAAGCGCTTTACAACAGATCCCGATTTCCCATTTGAGTACTGCTATGAACTTCCTGCTAACGACAAAGTTG
AACGTCCGATACTGAATTTTACGATGATGGGTGGGGACGATTTTGTCCCCATGGATCTGTTCATTGGTTTTCCTATTGACGATACTACACATGCAGTTTGTCTAACCCTT
ATCAAAAGCACCGATATTAATCTAATTGGACAGAACTTCATGACTGGTTACCGTATTATCTTCGATCGTGAAAAGATGGCGTTGGGATGGAGTCCTTCAGACTGTTACGA
CAGTGACGCCGGCACTCCCTCCGGTGACACCCCTCCGGCCAAAGACTCCCCCCCGGCCGACGACTCTCCCCCAGCCGAGGACTCTCCCCCGGCCGAAGACTCTCCGCCGG
CAGAAGACTCTCCCCCCACCGACGATTCTCCATCGCCACCTTCTTCCCCCGGAGGAAGCACCGGTTTGCCGAAAATTGGGGGTGATGCAACGCGGTTGAATCCATTGACC
TCTGTGTTTGTCGCCGTTCTTGCAATTTTGGCTGTTGTTTGACTTTGATTATTATTCTCTGGGTATCGTTCTGATTTGTTTGGTGTATTTTTAATTTTTTTTTTGAAGCA
ATAATTTAAGAAGGAAACAGTTTTGCTGCTTCCACTTGTTTGTATTTTGTAAATCAGTGTTACTCAAAATTTATTACAAATTTGCAGGTCGGTAAAATTCTGAAC
Protein sequenceShow/hide protein sequence
MAWTFSSGVQMLLVLSVYLLACGLRSGEAASFKFNIHHRFSESIKGILTSEGLPEKHTPAYYATMVHRDMLVRGRRLASSNGDTKLTFAYGNETFYIENLGYLYYANISV
GSPSLDFLVALDTGSDLLWLPCECRSCLTYLNTTDGGKFALNHYSPDDSTTSAPVPCSNSLCELSNQCTSNTNTCPYEINYLSANTSSTGYLVQDVLHLATDDLKLDPVE
SKITFGCGTVQTGVFQRGAAPNGLIGLGMDRISVPSLLANQGLTTDSFSMCFGIDGIGRIDFGDSGTPGQRETPFNTMANYPSYNVTVTEIIVGGKANNVEFTAIFDSGT
SFTYLNEPAYSIISEQMNAGMKLKRFTTDPDFPFEYCYELPANDKVERPILNFTMMGGDDFVPMDLFIGFPIDDTTHAVCLTLIKSTDINLIGQNFMTGYRIIFDREKMA
LGWSPSDCYDSDAGTPSGDTPPAKDSPPADDSPPAEDSPPAEDSPPAEDSPPTDDSPSPPSSPGGSTGLPKIGGDATRLNPLTSVFVAVLAILAVV