CuGenDBv2

Gene ID	HG10022601
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	Eukaryotic aspartyl protease family protein
Genome location	Chr05:26029269..26039949
RNA-Seq Expression	HG10022601
Synteny	HG10022601
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0004190 - aspartic-type endopeptidase activity (molecular function)
InterPro domains	IPR001461 - Aspartic peptidase A1 family IPR001969 - Aspartic peptidase, active site IPR021109 - Aspartic peptidase domain superfamily IPR032799 - Xylanase inhibitor, C-terminal IPR032861 - Xylanase inhibitor, N-terminal IPR033121 - Peptidase family A1 domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8646221.1 hypothetical protein Csa_016557 [Cucumis sativus]

1.3e-225

73.33

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL
        +SS +KR+KVGDLDRDRPLTCRRDSS +S KE+ V+Y  NAKTSEFAFFKKFKEDA+HRFSSSLPRQKEL+SKK NS+D  RER SPVEN CKD+ S+HL
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL

Query:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS
        VE  TPVNFNSLHLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEKGYGVIS LLSRL PE NQYK     
Subjt:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS

Query:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF
          FNNNLEK+QRL G CCP LDYEHHLNNS SPC LNKS G  FSHSDFSTNS+DN+FQ++YRTKEFDC+V+RKMTLL+V     TA V+NYRS ISSLF
Subjt:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF

Query:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS
        KPQY LYDQ EH H+RKQ+L+PLLLGWDTD IKDESSSQ TELNT A+SPISF DD QP +H+SFGA  LCSSPF SSNR +L SLPYSSLAS QIHGLS
Subjt:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS

Query:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL
        W NV  E+ I  TFNN+HLNFSSVPK L Q ++ VD GG  D CAQ+ DW+MNNVLDD  ++PS+ESLCASG+VFDFG KYLS S EQ QTAYHILKYPL
Subjt:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL

Query:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINV-DITKMNYI
        DE++ TA  NEE +NDSSDDVL DYRPPFFIQPESFF + KV SILTDKLSWD ARSEINV DIT+MNYI
Subjt:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINV-DITKMNYI

KAG6576069.1 hypothetical protein SDJN03_26708, partial [Cucurbita argyrosperma subsp. sororia]

1.7e-230

74.21

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL
        DS+CRKR KVGDLD  RPLTCRRD+S +S KE HVT PNNAKTSEFAFFKKFKEDAN RFSSSL RQKEL+SKK NS+D  RER   VENR +DF S+  
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL

Query:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS
        VEN TP+NFNS+HLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEK YGVISTLLSRL PESNQYKNEPDS
Subjt:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS

Query:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF
         QFNNNLEKLQ LPG C PRLDYEH LNNSSSPC LNKS G V  HSDFSTN+DD++F V+YRTKEFD DVE KMTLLD N SP TA V+NYR LIS+LF
Subjt:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF

Query:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS
          QY  YDQ E LHIRKQE+EPLLLGWDTDDIKD+ SS+ TE +TFAE PISF DD QPNLH+SFGAVALCSSPF SSN R LYSLPYSSLASYQIHGLS
Subjt:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS

Query:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYP
          NVEKEE IDATFNNVHLNFSSVPKCL QCDNYVD  G    FCAQSA+W MN  LDDEHR PS++S+CASG VFDFG KYLSGS E CQTAYH+L+YP
Subjt:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYP

Query:  LDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI
        LDEM+ T+ VNEECN DSS     +Y  PFFIQPESFF+E KV S+LTDKLSWD  RSEINV IT+M+Y+
Subjt:  LDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI

XP_008461985.1 PREDICTED: uncharacterized protein LOC103500465 [Cucumis melo]

1.3e-241

75.96

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL
        DSS RKR+KVGDLDRDRPLTCRRDSS +S KE+HVTY  NAKTSEFAFFKKFKEDA+HRFSSSLPRQKEL+SKK NSSD  RE  SPVENRCKDF S+HL
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL

Query:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS
        VE  TPVNFNSLHLPLGN SKIS                        DIFSRKRQKLRQFIQNMSF GTG+SYEKGYGVIS LLSRL PE N YK     
Subjt:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS

Query:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF
          FNNNLEK+Q+L G C PRLDYEHHLNNS SPC LN S G    HSDFSTNS+DN+FQV+YRTKEFDCDV+RKMTLLDVNGSPLTA V+NYRS ISSLF
Subjt:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF

Query:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS
         PQY LYDQ EHLH+RKQ+LEPLLLGWDTD IKDESSSQ TELNTFA+SPISF DD QP LH+SFGAVALCSSPF SSNR +  SLPYS+LASYQI GLS
Subjt:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS

Query:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL
        W NV KEE+IDATFNN+HLNFSSVPKCL QC++YVD GG  D CAQ+ADW+MNNV++DE ++PSVESLCASG+VFDFG KYLSGS EQCQT+YHILKYPL
Subjt:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL

Query:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLS-WDAARSEINV-DITKMNY
        DE++ TA +NEE +NDSSDDVL DY PPF+IQPESFF+E KV S+LTDKLS WD  RSEINV DIT+MNY
Subjt:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLS-WDAARSEINV-DITKMNY

XP_011659159.1 uncharacterized protein LOC101207408 [Cucumis sativus]

3.4e-226

73.51

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL
        DSS +KR+KVGDLDRDRPLTCRRDSS +S KE+ V+Y  NAKTSEFAFFKKFKEDA+HRFSSSLPRQKEL+SKK NS+D  RER SPVEN CKD+ S+HL
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL

Query:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS
        VE  TPVNFNSLHLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEKGYGVIS LLSRL PE NQYK     
Subjt:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS

Query:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF
          FNNNLEK+QRL G CCP LDYEHHLNNS SPC LNKS G  FSHSDFSTNS+DN+FQ++YRTKEFDC+V+RKMTLL+V     TA V+NYRS ISSLF
Subjt:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF

Query:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS
        KPQY LYDQ EH H+RKQ+L+PLLLGWDTD IKDESSSQ TELNT A+SPISF DD QP +H+SFGA  LCSSPF SSNR +L SLPYSSLAS QIHGLS
Subjt:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS

Query:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL
        W NV  E+ I  TFNN+HLNFSSVPK L Q ++ VD GG  D CAQ+ DW+MNNVLDD  ++PS+ESLCASG+VFDFG KYLS S EQ QTAYHILKYPL
Subjt:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL

Query:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINV-DITKMNYI
        DE++ TA  NEE +NDSSDDVL DYRPPFFIQPESFF + KV SILTDKLSWD ARSEINV DIT+MNYI
Subjt:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINV-DITKMNYI

XP_022954290.1 uncharacterized protein LOC111456585 isoform X3 [Cucurbita moschata]

5.8e-226

73.56

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFASYH
        DS+CRKR KVGDLD  RPLTCRRD+S +S K  HVT PNNAKTSEFAFFKKFKEDAN RFSSSL RQKEL+ KK NS+D  R ER   VENR +DF S+ 
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFASYH

Query:  LVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPD
         VEN TP+NFNS+HLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEK YGVISTLLSRL PESNQYKNEPD
Subjt:  LVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPD

Query:  SPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSL
        S QFNNNLEKLQ LPG C PRLDYEH LNNSSSPC LNKS G V  HSDFSTN+DD++F V+YRTKEFD DVE KMTLLD N SP TA V+NYR LIS+L
Subjt:  SPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSL

Query:  FKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGL
        F  QY  YDQ E LHIRKQE+EPLLLGWDTDDIKD+ SS+ TE +TFAE PISF DD QPNLH+SFGAVALCSSPF SSN R LYSLPYSSLASYQIHGL
Subjt:  FKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGL

Query:  SWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKY
        S  NVEKEE IDAT NNVHLNFSSVPKCL QCDNYVD  G    FCAQSA+W MN  LDDEHR PS++S+CASG VFDFG KYLSGS E CQTAYH+L+Y
Subjt:  SWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKY

Query:  PLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI
        PLDEM+ T+ VNEECN DSS     +Y  PFFIQPESFF+E KV S+LTDKLSWD  RSEINV IT+M+Y+
Subjt:  PLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI

TrEMBL top hits

e value

%identity

Alignment

A0A1S3CFT3 uncharacterized protein LOC103500465

6.2e-242

75.96

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL
        DSS RKR+KVGDLDRDRPLTCRRDSS +S KE+HVTY  NAKTSEFAFFKKFKEDA+HRFSSSLPRQKEL+SKK NSSD  RE  SPVENRCKDF S+HL
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL

Query:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS
        VE  TPVNFNSLHLPLGN SKIS                        DIFSRKRQKLRQFIQNMSF GTG+SYEKGYGVIS LLSRL PE N YK     
Subjt:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDS

Query:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF
          FNNNLEK+Q+L G C PRLDYEHHLNNS SPC LN S G    HSDFSTNS+DN+FQV+YRTKEFDCDV+RKMTLLDVNGSPLTA V+NYRS ISSLF
Subjt:  PQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLF

Query:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS
         PQY LYDQ EHLH+RKQ+LEPLLLGWDTD IKDESSSQ TELNTFA+SPISF DD QP LH+SFGAVALCSSPF SSNR +  SLPYS+LASYQI GLS
Subjt:  KPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLS

Query:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL
        W NV KEE+IDATFNN+HLNFSSVPKCL QC++YVD GG  D CAQ+ADW+MNNV++DE ++PSVESLCASG+VFDFG KYLSGS EQCQT+YHILKYPL
Subjt:  WHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPL

Query:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLS-WDAARSEINV-DITKMNY
        DE++ TA +NEE +NDSSDDVL DY PPF+IQPESFF+E KV S+LTDKLS WD  RSEINV DIT+MNY
Subjt:  DEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLS-WDAARSEINV-DITKMNY

A0A6J1GQP2 uncharacterized protein LOC111456585 isoform X1

5.4e-222

70.35

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFASYH
        DS+CRKR KVGDLD  RPLTCRRD+S +S K  HVT PNNAKTSEFAFFKKFKEDAN RFSSSL RQKEL+ KK NS+D  R ER   VENR +DF S+ 
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFASYH

Query:  LVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEK------------------------
         VEN TP+NFNS+HLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEK                        
Subjt:  LVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEK------------------------

Query:  --GYGVISTLLSRLKPESNQYKNEPDSPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVER
           YGVISTLLSRL PESNQYKNEPDS QFNNNLEKLQ LPG C PRLDYEH LNNSSSPC LNKS G V  HSDFSTN+DD++F V+YRTKEFD DVE 
Subjt:  --GYGVISTLLSRLKPESNQYKNEPDSPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVER

Query:  KMTLLDVNGSPLTAGVDNYRSLISSLFKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSS
        KMTLLD N SP TA V+NYR LIS+LF  QY  YDQ E LHIRKQE+EPLLLGWDTDDIKD+ SS+ TE +TFAE PISF DD QPNLH+SFGAVALCSS
Subjt:  KMTLLDVNGSPLTAGVDNYRSLISSLFKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSS

Query:  PFLSSNRRSLYSLPYSSLASYQIHGLSWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASG
        PF SSN R LYSLPYSSLASYQIHGLS  NVEKEE IDAT NNVHLNFSSVPKCL QCDNYVD  G    FCAQSA+W MN  LDDEHR PS++S+CASG
Subjt:  PFLSSNRRSLYSLPYSSLASYQIHGLSWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASG

Query:  IVFDFGQKYLSGSNEQCQTAYHILKYPLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI
         VFDFG KYLSGS E CQTAYH+L+YPLDEM+ T+ VNEECN DSS     +Y  PFFIQPESFF+E KV S+LTDKLSWD  RSEINV IT+M+Y+
Subjt:  IVFDFGQKYLSGSNEQCQTAYHILKYPLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI

A0A6J1GS11 uncharacterized protein LOC111456585 isoform X3

2.8e-226

73.56

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFASYH
        DS+CRKR KVGDLD  RPLTCRRD+S +S K  HVT PNNAKTSEFAFFKKFKEDAN RFSSSL RQKEL+ KK NS+D  R ER   VENR +DF S+ 
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFASYH

Query:  LVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPD
         VEN TP+NFNS+HLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEK YGVISTLLSRL PESNQYKNEPD
Subjt:  LVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPD

Query:  SPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSL
        S QFNNNLEKLQ LPG C PRLDYEH LNNSSSPC LNKS G V  HSDFSTN+DD++F V+YRTKEFD DVE KMTLLD N SP TA V+NYR LIS+L
Subjt:  SPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSL

Query:  FKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGL
        F  QY  YDQ E LHIRKQE+EPLLLGWDTDDIKD+ SS+ TE +TFAE PISF DD QPNLH+SFGAVALCSSPF SSN R LYSLPYSSLASYQIHGL
Subjt:  FKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGL

Query:  SWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKY
        S  NVEKEE IDAT NNVHLNFSSVPKCL QCDNYVD  G    FCAQSA+W MN  LDDEHR PS++S+CASG VFDFG KYLSGS E CQTAYH+L+Y
Subjt:  SWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKY

Query:  PLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI
        PLDEM+ T+ VNEECN DSS     +Y  PFFIQPESFF+E KV S+LTDKLSWD  RSEINV IT+M+Y+
Subjt:  PLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI

A0A6J1GSJ6 uncharacterized protein LOC111456585 isoform X2

2.2e-223

70.47

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL
        DS+CRKR KVGDLD  RPLTCRRD+S +S K  HVT PNNAKTSEFAFFKKFKEDAN RFSSSL RQKEL+ KK NS+D  RER   VENR +DF S+  
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRERESPVENRCKDFASYHL

Query:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEK-------------------------
        VEN TP+NFNS+HLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEK                         
Subjt:  VENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEK-------------------------

Query:  -GYGVISTLLSRLKPESNQYKNEPDSPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERK
          YGVISTLLSRL PESNQYKNEPDS QFNNNLEKLQ LPG C PRLDYEH LNNSSSPC LNKS G V  HSDFSTN+DD++F V+YRTKEFD DVE K
Subjt:  -GYGVISTLLSRLKPESNQYKNEPDSPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERK

Query:  MTLLDVNGSPLTAGVDNYRSLISSLFKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSP
        MTLLD N SP TA V+NYR LIS+LF  QY  YDQ E LHIRKQE+EPLLLGWDTDDIKD+ SS+ TE +TFAE PISF DD QPNLH+SFGAVALCSSP
Subjt:  MTLLDVNGSPLTAGVDNYRSLISSLFKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSP

Query:  FLSSNRRSLYSLPYSSLASYQIHGLSWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGI
        F SSN R LYSLPYSSLASYQIHGLS  NVEKEE IDAT NNVHLNFSSVPKCL QCDNYVD  G    FCAQSA+W MN  LDDEHR PS++S+CASG 
Subjt:  FLSSNRRSLYSLPYSSLASYQIHGLSWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGG-SRDFCAQSADWLMNNVLDDEHRNPSVESLCASGI

Query:  VFDFGQKYLSGSNEQCQTAYHILKYPLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI
        VFDFG KYLSGS E CQTAYH+L+YPLDEM+ T+ VNEECN DSS     +Y  PFFIQPESFF+E KV S+LTDKLSWD  RSEINV IT+M+Y+
Subjt:  VFDFGQKYLSGSNEQCQTAYHILKYPLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTDKLSWDAARSEINVDITKMNYI

A0A6J1JQC1 uncharacterized protein LOC111487990 isoform X4

3.4e-224

73.17

Show/hide

Query:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYP---NNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFA
        DS CRKR KVGDLD DRPLTCRRD+S +S KE HVT P   NNAKTSEFAFFKKFK DAN RFSSSL RQKEL+SK+ NS+D  R ER   VENR +DFA
Subjt:  DSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYP---NNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVR-ERESPVENRCKDFA

Query:  SYHLVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKN
        S+  VEN TP+NFNS+HLPLGNSSKIS                        DIFSRKRQKLRQFIQNMSFHGTG+SYEK YGVISTLLSRL PESNQYKN
Subjt:  SYHLVENATPVNFNSLHLPLGNSSKIS------------------------DIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKN

Query:  EPDSPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLI
        EPDS QFNNNLEKLQ LPG C PRLDYEH LNNSSSPC LNKS G V  HSDFSTN+DD++F V+YRTK+FD DVE KMTLLD N SP TA V+NYRSLI
Subjt:  EPDSPQFNNNLEKLQRLPGSCCPRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLI

Query:  SSLFKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQI
         +LF PQY  YDQ E LHIRKQE+EPLLLGWDTDDIKD+ SS+ TE +TFAE PISF DD QPNL +SFGAVALCSSPF SS  R+LY LPYSSL SYQI
Subjt:  SSLFKPQYDLYDQVEHLHIRKQELEPLLLGWDTDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQI

Query:  HGLSWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHIL
        HGLS HNVEKEE IDATFNNVHLNFSSVPKCL QCDNYV+  G   FCAQSA+WLMN   +DEHR+PS+ES+CASG VFDFG KYLSGS E CQTAYH+L
Subjt:  HGLSWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAGGSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHIL

Query:  KYPLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEE-RKVCSILTDKLSWDAARSEINVDITKMNYI
        +YPLDEM+ T+ VNEECN DSS     +YR PFFIQPESFF+E +KV S+LTDKLSWD  RSEINV IT+M+Y+
Subjt:  KYPLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEE-RKVCSILTDKLSWDAARSEINVDITKMNYI

SwissProt top hits

e value

%identity

Alignment

Q766C3 Aspartic proteinase nepenthesin-1

5.9e-40

42.74

Show/hide

Query:  CLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVG-AAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRLA
        C Y   YGDGS T G   TETLTF    I  +  GCG +N+G   G  AGL+G+GRG LS PSQ  +    KFSYC+     SS PS+++ G  A S  A
Subjt:  CLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVG-AAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRLA

Query:  RF--TPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDS-AGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDL-SGQS
            T LI++ ++ TFYY+ L G+SVG  R+  I P+ F L+S  G GG+IIDSGT++T     AY ++R  F +  +        S FD C+   S  S
Subjt:  RF--TPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDS-AGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDL-SGQS

Query:  AVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFADSS
         +++PT V+HF G D+ LP+ NY I    NG  C A   SS
Subjt:  AVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFADSS

Q8S9J6 Aspartyl protease family protein At5g10770

2.2e-39

40.34

Show/hide

Query:  SCLYQVSYGDGSFTTGDFATETLTFRGNKI-ARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRL
        +C+Y + YGD SF+ G  A E  T   + +   V  GCG +N+GLF G AGLLGLGR +LSFPSQT   +N  FSYCL   S++S    + FG A ISR 
Subjt:  SCLYQVSYGDGSFTTGDFATETLTFRGNKI-ARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRL

Query:  ARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQSAVK
         +FTP+       +FY + ++ I+VGG ++  I   +F        G +IDSGT +TRL   AY ALR +F+A  S        S+ DTC+DLSG   V 
Subjt:  ARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQSAVK

Query:  VPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFADSS
        +P V   F G  +    +  +  V      C AFA +S
Subjt:  VPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFADSS

Q9LHE3 Protein ASPARTIC PROTEASE IN GUARD CELL 2

5.5e-62

50.85

Show/hide

Query:  CLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRLAR
        C Y+V YGDGS+T G  A ETLTF    +  VA+GCGH N G+F+GAAGLLG+G G +SF  Q   +    F YCLV R   S   S+VFG  A+   A 
Subjt:  CLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRLAR

Query:  FTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQSAVKVP
        + PL+RNP+  +FYYV L G+ VGGVR+  +   +F L   G+GGV++D+GT+VTRL   AY A RD F++  ++L R    S+FDTCYDLSG  +V+VP
Subjt:  FTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQSAVKVP

Query:  TVVLHF-RGADMSLPATNYLIPVDDNGSFCFAFADS
        TV  +F  G  ++LPA N+L+PVDD+G++CFAFA S
Subjt:  TVVLHF-RGADMSLPATNYLIPVDDNGSFCFAFADS

Q9LNJ3 Aspartyl protease family protein 2

2.7e-109

79.5

Show/hide

Query:  STRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAA
        +TRR +CLYQVSYGDGSFT GDF+TETLTFR N++  VALGCGH NEGLFVGAAGLLGLG+G+LSFP QTG RFN KFSYCLVDRSASSKPSS+VFG+AA
Subjt:  STRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAA

Query:  ISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQ
        +SR+ARFTPL+ NPKL+TFYYV L+GISVGG RV G++ +LFKLD  GNGGVIIDSGTSVTRL RPAY A+RDAFR GA  LKR P+FSLFDTC+DLS  
Subjt:  ISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQ

Query:  SAVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFA
        + VKVPTVVLHFRGAD+SLPATNYLIPVD NG FCFAFA
Subjt:  SAVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFA

Q9LS40 Protein ASPARTIC PROTEASE IN GUARD CELL 1

2.5e-67

56.8

Show/hide

Query:  LREVLSTRRHSCLYQVSYGDGSFTTGDFATETLTF-RGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSM
        L E  + R + CLYQVSYGDGSFT G+ AT+T+TF    KI  VALGCGH NEGLF GAAGLLGLG G LS  +Q        FSYCLVDR  S K SS+
Subjt:  LREVLSTRRHSCLYQVSYGDGSFTTGDFATETLTF-RGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSM

Query:  VFGDAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRG-PEFSLFDT
         F    +       PL+RN K++TFYYV L G SVGG +V  +  A+F +D++G+GGVI+D GT+VTRL   AY +LRDAF     +LK+G    SLFDT
Subjt:  VFGDAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRG-PEFSLFDT

Query:  CYDLSGQSAVKVPTVVLHFRGA-DMSLPATNYLIPVDDNGSFCFAFADSS
        CYD S  S VKVPTV  HF G   + LPA NYLIPVDD+G+FCFAFA +S
Subjt:  CYDLSGQSAVKVPTVVLHFRGA-DMSLPATNYLIPVDDNGSFCFAFADSS

Arabidopsis top hits

e value

%identity

Alignment

AT1G01300.1 Eukaryotic aspartyl protease family protein

1.9e-110

79.5

Show/hide

Query:  STRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAA
        +TRR +CLYQVSYGDGSFT GDF+TETLTFR N++  VALGCGH NEGLFVGAAGLLGLG+G+LSFP QTG RFN KFSYCLVDRSASSKPSS+VFG+AA
Subjt:  STRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAA

Query:  ISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQ
        +SR+ARFTPL+ NPKL+TFYYV L+GISVGG RV G++ +LFKLD  GNGGVIIDSGTSVTRL RPAY A+RDAFR GA  LKR P+FSLFDTC+DLS  
Subjt:  ISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQ

Query:  SAVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFA
        + VKVPTVVLHFRGAD+SLPATNYLIPVD NG FCFAFA
Subjt:  SAVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFA

AT1G25510.1 Eukaryotic aspartyl protease family protein

1.3e-66

54.07

Show/hide

Query:  EVLSTRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFG
        EV   R  +CLY+VSYGDGS+T GDFATETLT     +  VA+GCGH NEGLFVGAAGLLGLG G L+ PSQ        FSYCLVDR + S  S++ FG
Subjt:  EVLSTRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFG

Query:  DAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDL
          ++S  A   PL+RN +L+TFYY+ L GISVGG  ++ I  + F++D +G+GG+IIDSGT+VTRL    Y +LRD+F  G   L++    ++FDTCY+L
Subjt:  DAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDL

Query:  SGQSAVKVPTVVLHFRGADM-SLPATNYLIPVDDNGSFCFAFADSS
        S ++ V+VPTV  HF G  M +LPA NY+IPVD  G+FC AFA ++
Subjt:  SGQSAVKVPTVVLHFRGADM-SLPATNYLIPVDDNGSFCFAFADSS

AT3G18490.1 Eukaryotic aspartyl protease family protein

1.8e-68

56.8

Show/hide

Query:  LREVLSTRRHSCLYQVSYGDGSFTTGDFATETLTF-RGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSM
        L E  + R + CLYQVSYGDGSFT G+ AT+T+TF    KI  VALGCGH NEGLF GAAGLLGLG G LS  +Q        FSYCLVDR  S K SS+
Subjt:  LREVLSTRRHSCLYQVSYGDGSFTTGDFATETLTF-RGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSM

Query:  VFGDAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRG-PEFSLFDT
         F    +       PL+RN K++TFYYV L G SVGG +V  +  A+F +D++G+GGVI+D GT+VTRL   AY +LRDAF     +LK+G    SLFDT
Subjt:  VFGDAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRG-PEFSLFDT

Query:  CYDLSGQSAVKVPTVVLHFRGA-DMSLPATNYLIPVDDNGSFCFAFADSS
        CYD S  S VKVPTV  HF G   + LPA NYLIPVDD+G+FCFAFA +S
Subjt:  CYDLSGQSAVKVPTVVLHFRGA-DMSLPATNYLIPVDDNGSFCFAFADSS

AT3G20015.1 Eukaryotic aspartyl protease family protein

3.9e-63

50.85

Show/hide

Query:  CLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRLAR
        C Y+V YGDGS+T G  A ETLTF    +  VA+GCGH N G+F+GAAGLLG+G G +SF  Q   +    F YCLV R   S   S+VFG  A+   A 
Subjt:  CLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISRLAR

Query:  FTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQSAVKVP
        + PL+RNP+  +FYYV L G+ VGGVR+  +   +F L   G+GGV++D+GT+VTRL   AY A RD F++  ++L R    S+FDTCYDLSG  +V+VP
Subjt:  FTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQSAVKVP

Query:  TVVLHF-RGADMSLPATNYLIPVDDNGSFCFAFADS
        TV  +F  G  ++LPA N+L+PVDD+G++CFAFA S
Subjt:  TVVLHF-RGADMSLPATNYLIPVDDNGSFCFAFADS

AT3G61820.1 Eukaryotic aspartyl protease family protein

6.4e-98

69.92

Show/hide

Query:  EVLSTRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDR----SASSKPSS
        E ++ R  +CLYQVSYGDGSFT GDF+TETLTF G ++  V LGCGH NEGLFVGAAGLLGLGRG LSFPSQT  R+N KFSYCLVDR    S+S  PS+
Subjt:  EVLSTRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDR----SASSKPSS

Query:  MVFGDAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDT
        +VFG+AA+ + + FTPL+ NPKL+TFYY++L+GISVGG RV G+S + FKLD+ GNGGVIIDSGTSVTRLT+PAY ALRDAFR GA+ LKR P +SLFDT
Subjt:  MVFGDAAISRLARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDT

Query:  CYDLSGQSAVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFA
        C+DLSG + VKVPTVV HF G ++SLPA+NYLIPV+  G FCFAFA
Subjt:  CYDLSGQSAVKVPTVVLHFRGADMSLPATNYLIPVDDNGSFCFAFA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAGCTTAGAGAAGTGTTGAGCACCCGCCGCCACTCCTGCCTCTACCAAGTCTCCTACGGCGACGGCTCCTTCACCACCGGCGATTTCGCCACAGAAACCCTCACGTT
TCGTGGCAATAAAATTGCTAGAGTCGCCCTCGGATGCGGCCACCACAATGAGGGATTGTTCGTCGGAGCCGCCGGTTTGTTGGGCCTTGGTCGAGGCCGGTTGTCTTTCC
CTTCCCAAACTGGAATCCGGTTCAATCACAAATTCTCTTATTGTTTAGTCGACCGGTCCGCTTCCTCTAAACCGTCCTCCATGGTTTTCGGCGATGCGGCGATTTCCCGA
CTCGCCCGATTCACTCCTCTGATTCGGAACCCGAAATTAGAGACGTTCTATTACGTTGAACTTATCGGAATCAGCGTCGGCGGAGTCCGAGTCCGTGGCATTTCCCCCGC
ACTCTTCAAGCTCGATTCGGCCGGCAACGGCGGCGTCATCATCGATTCCGGTACATCCGTGACCCGTCTGACTCGACCGGCTTACACCGCTCTCCGCGACGCGTTCCGAG
CCGGAGCGTCACATTTGAAAAGAGGGCCGGAGTTTTCGTTGTTCGATACGTGTTACGACTTGTCGGGTCAGTCGGCGGTGAAGGTGCCGACGGTGGTGTTGCATTTTCGG
GGAGCCGACATGTCGTTGCCGGCGACGAATTATTTGATTCCGGTAGACGACAATGGGAGCTTTTGCTTTGCGTTTGCGGATAGTAGCTGTCGGAAGAGATCAAAAGTTGG
AGATCTTGATCGTGATAGACCTTTGACATGCAGAAGAGATTCTTCTTCCCTATCCTGGAAAGAGAAACATGTTACATACCCAAATAATGCAAAAACTTCTGAGTTTGCAT
TTTTTAAGAAGTTCAAGGAAGATGCAAACCATAGATTCAGTTCATCTCTTCCACGTCAAAAGGAACTTCGATCGAAGAAGTTAAACTCGAGTGATCGTGTCAGAGAGAGA
GAAAGCCCAGTTGAAAACCGCTGTAAAGACTTCGCATCATATCATCTTGTCGAGAATGCCACTCCTGTTAACTTTAACTCGTTGCATTTACCTCTGGGTAATTCATCCAA
AATTTCAGATATTTTTAGTAGGAAGAGGCAGAAATTACGTCAGTTCATTCAGAATATGTCTTTCCATGGAACTGGTGACTCATATGAGAAGGGGTATGGTGTTATTTCCA
CGCTACTTAGCCGGCTTAAACCTGAGAGCAATCAGTATAAGAATGAACCTGATTCTCCACAGTTTAATAATAACTTGGAGAAACTACAAAGGTTGCCTGGAAGTTGCTGT
CCAAGGCTTGATTATGAGCATCATTTGAATAATAGTTCATCACCTTGTAGTTTGAATAAATCAAGTGGAAGTGTTTTTTCCCATTCTGATTTCTCAACCAATAGCGATGA
TAACAGTTTCCAAGTACAGTACAGAACCAAGGAGTTTGACTGTGATGTAGAAAGAAAAATGACTTTGCTGGATGTCAATGGTTCACCTCTTACTGCTGGAGTTGATAACT
ATAGATCACTTATTTCCAGCCTTTTCAAACCGCAGTATGATTTGTATGATCAAGTTGAACATTTGCACATAAGAAAGCAAGAGCTAGAACCTCTTCTGCTAGGTTGGGAT
ACCGACGACATAAAAGATGAAAGTTCTTCTCAAGCTACAGAGTTGAACACATTTGCCGAGTCACCAATTTCATTCGGTGATGATCTTCAGCCAAACTTGCACAAGAGTTT
TGGTGCTGTTGCGCTGTGTTCATCCCCTTTCCTTTCCAGTAATCGTAGAAGCTTATACTCATTGCCATACTCCAGTTTAGCCAGCTATCAAATCCATGGATTAAGTTGGC
ATAATGTAGAAAAGGAGGAAAATATAGATGCCACTTTCAACAACGTGCATTTGAATTTCTCATCTGTACCCAAATGTCTTTGTCAGTGCGATAACTATGTCGATGCCGGA
GGCAGCCGTGACTTCTGTGCACAAAGTGCTGATTGGCTTATGAATAATGTGTTGGATGACGAACACCGAAATCCTTCTGTAGAAAGTCTGTGTGCTTCTGGTATCGTCTT
TGATTTTGGACAGAAATATCTCTCAGGCTCAAATGAGCAATGCCAAACAGCTTATCATATACTTAAGTACCCACTGGATGAAATGAAACTTACAGCCTTCGTCAATGAAG
AATGTAATAATGACAGTTCAGATGATGTCCTTGCAGATTATCGGCCACCCTTCTTTATCCAACCTGAGTCATTCTTTGAAGAAAGGAAGGTATGCTCCATACTGACTGAT
AAACTTAGCTGGGATGCAGCCAGAAGCGAAATAAATGTTGATATAACTAAAATGAATTACATATTATAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKLREVLSTRRHSCLYQVSYGDGSFTTGDFATETLTFRGNKIARVALGCGHHNEGLFVGAAGLLGLGRGRLSFPSQTGIRFNHKFSYCLVDRSASSKPSSMVFGDAAISR
LARFTPLIRNPKLETFYYVELIGISVGGVRVRGISPALFKLDSAGNGGVIIDSGTSVTRLTRPAYTALRDAFRAGASHLKRGPEFSLFDTCYDLSGQSAVKVPTVVLHFR
GADMSLPATNYLIPVDDNGSFCFAFADSSCRKRSKVGDLDRDRPLTCRRDSSSLSWKEKHVTYPNNAKTSEFAFFKKFKEDANHRFSSSLPRQKELRSKKLNSSDRVRER
ESPVENRCKDFASYHLVENATPVNFNSLHLPLGNSSKISDIFSRKRQKLRQFIQNMSFHGTGDSYEKGYGVISTLLSRLKPESNQYKNEPDSPQFNNNLEKLQRLPGSCC
PRLDYEHHLNNSSSPCSLNKSSGSVFSHSDFSTNSDDNSFQVQYRTKEFDCDVERKMTLLDVNGSPLTAGVDNYRSLISSLFKPQYDLYDQVEHLHIRKQELEPLLLGWD
TDDIKDESSSQATELNTFAESPISFGDDLQPNLHKSFGAVALCSSPFLSSNRRSLYSLPYSSLASYQIHGLSWHNVEKEENIDATFNNVHLNFSSVPKCLCQCDNYVDAG
GSRDFCAQSADWLMNNVLDDEHRNPSVESLCASGIVFDFGQKYLSGSNEQCQTAYHILKYPLDEMKLTAFVNEECNNDSSDDVLADYRPPFFIQPESFFEERKVCSILTD
KLSWDAARSEINVDITKMNYIL

HG10022601 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome