CuGenDBv2

Gene ID	MC01g0252
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	Zinc finger family protein, putative isoform 1
Genome location	MC01:9230858..9235294
RNA-Seq Expression	MC01g0252
Synteny	MC01g0252
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0016021 - integral component of membrane (cellular component) GO:0004175 - endopeptidase activity (molecular function) GO:0008236 - serine-type peptidase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0025811.1 Zinc finger family protein, putative isoform 1 [Cucumis melo var. makuwa]

1.68e-224

80.88

Show/hide

Query:  SPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRIT
        S  +LK  HDIVA F+VERSVSLLEDN  QL  DIF EF IPS KV ILSLE +  SNRTKVVF +DPD DDSEI S  +SLIRSI+ +LVTNQ  L IT
Subjt:  SPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRIT

Query:  KSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNT
        KS FGEA+SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTA TIVQTSVLLEVGNT
Subjt:  KSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNT

Query:  PSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYG
        PSMRRLKQLAQTISGSNSSNLGLNN EFGKVKQVRLSSILKHSLNGS+GNGPVRSPSPAPTPQPHN+ H P HHH HHH PL  AISPAPATEKGAP YG
Subjt:  PSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYG

Query:  SLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKP
        S APERSAA P+RSY A+PPGC+YRYKRKSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P   PLPNVIY+HVQPPSKS+SN    
Subjt:  SLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKP

Query:  TTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI
          DP+  PS +PSPS ADR   ITQW FTLFL++
Subjt:  TTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI

XP_004144318.1 uncharacterized protein LOC101216010 isoform X1 [Cucumis sativus]

9.32e-227

80.45

Show/hide

Query:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT
        + LN SYRG          HDIVA F+VERSVSLLEDN  QL  DIF EF IPS KV ILSLE +  SNRTKVVF LDPD DDSEI S  +SLIRSI+ +
Subjt:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT

Query:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV
        LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVT  TIV
Subjt:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV

Query:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA
        QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHN  H P HHH HHH PLTPAISPA
Subjt:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA

Query:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP
        PATEKGAP YGS APER+AA PKRSY AKPPGC+YRYKRKSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P   PLPNVIY+HVQP
Subjt:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP

Query:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI
        PSKS+SN           PS +PSPS ADR   ITQW FTLFL++
Subjt:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI

XP_008455751.1 PREDICTED: uncharacterized protein LOC103495852 [Cucumis melo]

7.16e-224

79.55

Show/hide

Query:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT
        + LN SYRG          HDIVA F+VERSVSLLEDN  QL  DIF EF IPS KV ILSLE +  SNRTKVVF +DPD DDSEI S  +SLIRSI+ +
Subjt:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT

Query:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV
        LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTA TIV
Subjt:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV

Query:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA
        QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNN EFGKVKQVRLSSILKHSLNGS+GNGPVRSPSPAPTPQPHN+ H P HHH HHH PL  AISPA
Subjt:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA

Query:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP
        PATEKGAP YGS APERSAA P+RSY A+PPGC+YRYKRKSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P   PLPNVIY+HVQP
Subjt:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP

Query:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI
        PSKS+SN      DP+  PS +PSPS ADR   ITQW FTLFL++
Subjt:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI

XP_022154524.1 uncharacterized protein LOC111021781 [Momordica charantia]

8.14e-297

100

Show/hide

Query:  CHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEA
        CHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEA
Subjt:  CHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEA

Query:  FSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLK
        FSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLK
Subjt:  FSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLK

Query:  QLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERS
        QLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERS
Subjt:  QLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERS

Query:  AAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT
        AAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT
Subjt:  AAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT

Query:  PSPSPSPSAADRRAITQWEFTLFLLILALQM
        PSPSPSPSAADRRAITQWEFTLFLLILALQM
Subjt:  PSPSPSPSAADRRAITQWEFTLFLLILALQM

XP_038882638.1 uncharacterized protein LOC120073837 [Benincasa hispida]

6.35e-221

79.69

Show/hide

Query:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT
        + LN SYRG          HDIVA F+VER VSLLEDNI QL  DIF EF IPS KV ILSLES+P SNRTKVVF LDPD D+SEI S  +SLIRS + +
Subjt:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT

Query:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV
        LVTNQ  LRITKS+FGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILY+KLWNAEGSTVTA TIV
Subjt:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV

Query:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA
        Q+SVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGS+GNGP RSPSPAP PQPHN P   P HH HHH  LTPAISPA
Subjt:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA

Query:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSP--QHQVKPPAPPVSPTPTSAPLPNVIYSHV
        PATEKGAP YGS APERS A PKRSY AKPPGC+Y  KRKSGRKEGKQSHL+PLA+PN+SP HSAASPSP  QH+V PPA P+ P P   PLPNVIY+HV
Subjt:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSP--QHQVKPPAPPVSPTPTSAPLPNVIYSHV

Query:  QPPSKSNSN-PEKPTTDPSLTPSPSPSPSAADRRA-ITQWEFTLFLLI
        QPPSKSNSN PEK TT+PS    PSPSPS ADR   ITQW FTLFL++
Subjt:  QPPSKSNSN-PEKPTTDPSLTPSPSPSPSAADRRA-ITQWEFTLFLLI

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KYS3 Uncharacterized protein

4.51e-227

80.45

Show/hide

Query:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT
        + LN SYRG          HDIVA F+VERSVSLLEDN  QL  DIF EF IPS KV ILSLE +  SNRTKVVF LDPD DDSEI S  +SLIRSI+ +
Subjt:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT

Query:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV
        LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVT  TIV
Subjt:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV

Query:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA
        QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHN  H P HHH HHH PLTPAISPA
Subjt:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA

Query:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP
        PATEKGAP YGS APER+AA PKRSY AKPPGC+YRYKRKSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P   PLPNVIY+HVQP
Subjt:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP

Query:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI
        PSKS+SN           PS +PSPS ADR   ITQW FTLFL++
Subjt:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI

A0A1S3C173 uncharacterized protein LOC103495852

3.47e-224

79.55

Show/hide

Query:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT
        + LN SYRG          HDIVA F+VERSVSLLEDN  QL  DIF EF IPS KV ILSLE +  SNRTKVVF +DPD DDSEI S  +SLIRSI+ +
Subjt:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT

Query:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV
        LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTA TIV
Subjt:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV

Query:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA
        QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNN EFGKVKQVRLSSILKHSLNGS+GNGPVRSPSPAPTPQPHN+ H P HHH HHH PL  AISPA
Subjt:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA

Query:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP
        PATEKGAP YGS APERSAA P+RSY A+PPGC+YRYKRKSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P   PLPNVIY+HVQP
Subjt:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP

Query:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI
        PSKS+SN      DP+  PS +PSPS ADR   ITQW FTLFL++
Subjt:  PSKSNSNPEKPTTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI

A0A5A7SNH7 Zinc finger family protein, putative isoform 1

8.12e-225

80.88

Show/hide

Query:  SPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRIT
        S  +LK  HDIVA F+VERSVSLLEDN  QL  DIF EF IPS KV ILSLE +  SNRTKVVF +DPD DDSEI S  +SLIRSI+ +LVTNQ  L IT
Subjt:  SPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRIT

Query:  KSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNT
        KS FGEA+SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTA TIVQTSVLLEVGNT
Subjt:  KSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNT

Query:  PSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYG
        PSMRRLKQLAQTISGSNSSNLGLNN EFGKVKQVRLSSILKHSLNGS+GNGPVRSPSPAPTPQPHN+ H P HHH HHH PL  AISPAPATEKGAP YG
Subjt:  PSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYG

Query:  SLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKP
        S APERSAA P+RSY A+PPGC+YRYKRKSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P   PLPNVIY+HVQPPSKS+SN    
Subjt:  SLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKP

Query:  TTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI
          DP+  PS +PSPS ADR   ITQW FTLFL++
Subjt:  TTDPSLTPSPSPSPSAADR-RAITQWEFTLFLLI

A0A6J1DMD3 uncharacterized protein LOC111021781

3.94e-297

100

Show/hide

Query:  CHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEA
        CHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEA
Subjt:  CHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEA

Query:  FSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLK
        FSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLK
Subjt:  FSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLK

Query:  QLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERS
        QLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERS
Subjt:  QLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERS

Query:  AAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT
        AAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT
Subjt:  AAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT

Query:  PSPSPSPSAADRRAITQWEFTLFLLILALQM
        PSPSPSPSAADRRAITQWEFTLFLLILALQM
Subjt:  PSPSPSPSAADRRAITQWEFTLFLLILALQM

A0A6J1EB56 uncharacterized protein LOC111432513 isoform X3

5.31e-215

77.35

Show/hide

Query:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT
        + LN SYRG          HDIVA F VER VSLL+DNI +L  DIF EF IPS KV ILSL S+  SNRTKVVFG+DPD DD EIPS  +SLIRS  A+
Subjt:  ISLNSSYRGGISPSILKSCHDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILAT

Query:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV
        +VTNQS LRITKS+FGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTA TIV
Subjt:  LVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIV

Query:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA
        Q+SVLLEVGNTPSM+RLKQLAQTIS SNSSNLGLNNTEFGKVKQVRLSSILKHSLNG DG GP+RSPSPAPTPQPHN+ H P HHH HHHAPLTP ISPA
Subjt:  QTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPA

Query:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP
        PA E GAP YG  AP +SAA PKRSY+AKPPGC+Y  KRKSGRKEGKQ HLSPLA+P+ISPVHSAASPS QH V       SPT  S PLP+VIY+HVQP
Subjt:  PATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQP

Query:  PSKSNSN-PEKPTTDPSLTPSPSPSPSAADRRA-ITQWEFTLFLLI
        PSKS+SN PEK TT PS+ PSPSPSPS+A     IT+W FTL L++
Subjt:  PSKSNSN-PEKPTTDPSLTPSPSPSPSAADRRA-ITQWEFTLFLLI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G10790.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT3G56590.2)

3.9e-27

35.18

Show/hide

Query:  IVAMFDVERSVSLLEDNILQLENDIFGEF-LIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFS
        + A F +++ VS +  +  ++E+DI     L  ++KV +LSL     SN T V F + P   D EI   S+SL+RS    L   +S L++T S FG+  S
Subjt:  IVAMFDVERSVSLLEDNILQLENDIFGEF-LIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFS

Query:  FEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQL
        F+VLKFPGGIT+ P + A +     +LF+ T+  SI  +Q     L    E  L L PYE ++ +L N +GST++     Q  V   +      +RL   
Subjt:  FEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQL

Query:  AQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTP
         Q I  S + NLGL+   FG+VK +  S+ L   +  SD        +PAPTP
Subjt:  AQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTP

AT3G10810.1 zinc finger (C3HC4-type RING finger) family protein

8.1e-81

46.5

Show/hide

Query:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF
        H IVA F + RS S L +N LQL+NDIF E    S KV IL++E     N TKVVFG+DPD    EI  +S+S I+ +  +++ NQS+L++TKSLFGE F
Subjt:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF

Query:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQ
         FEVLKFPGGIT+IPPQSAF LQK +I+FNFTLN+SIHQIQ++F+ L SQL+ GL LAPYE LY+ L N+EGSTV+  T V +SVLL VG + S  RLKQ
Subjt:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQ

Query:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQP----------HNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPG
        L  TI+GS S NLGLNNT FGKVKQVRLSS L +S + S      +SPSP+P+P            H++ H   +HH HHH  L+P ++P  +       
Subjt:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQP----------HNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPG

Query:  YGSLAPERSAAPPKRSYKAKP---PGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSP----TPTSAPLPNVIYSH-VQPP
          S AP RS    KR+  A P   PG    +K K       Q   +P  AP        ++ +P HQ+  PAP  +      P SAPLP+V+++H  QPP
Subjt:  YGSLAPERSAAPPKRSYKAKP---PGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSP----TPTSAPLPNVIYSH-VQPP

Query:  SKSNSNPEKPTTDPSLTPSPSPSPSAADRRAITQWEFTLFLLI
            + P +P  +    P P  S SA +      W   L L++
Subjt:  SKSNSNPEKPTTDPSLTPSPSPSPSAADRRAITQWEFTLFLLI

AT3G56590.1 hydroxyproline-rich glycoprotein family protein

1.6e-89

50.24

Show/hide

Query:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF
        H IVA FDV + +S +EDN++QLENDI  E   P  KVV+L+LE +   NRT V+F +DP+ ++S+IP+   SLI++   TLV  Q S R+T+SLFGE F
Subjt:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF

Query:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQ
         FEVLKFPGGIT+IPPQ  F LQK Q+LFNFTLNFSI+QIQ +F EL SQL+ G+ LA YE LYI L N+ GSTV   TIV +SVLL  G   S  RLKQ
Subjt:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQ

Query:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERSA
        LAQTI+ S+S NLGLN+T FGKVKQVRLSSIL HS   S       +PSP+P P+ H YPH  PHHH HHH  L P  S +P T+  AP   S   + S 
Subjt:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERSA

Query:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT
         PP+       P C Y  +R  G          P  AP+ S  H    P+P      PAPP     P S+PLP+V+++H+ PPSKS+     P ++P+  
Subjt:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT

Query:  PSPSPSPSAADRRAITQW
         SPSP+P+     ++TQ+
Subjt:  PSPSPSPSAADRRAITQW

AT3G56590.2 hydroxyproline-rich glycoprotein family protein

6.2e-89

51.71

Show/hide

Query:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF
        H IVA FDV + +S +EDN++QLENDI  E   P  KVV+L+LE +   NRT V+F +DP+ ++S+IP+   SLI++   TLV  Q S R+T+SLFGE F
Subjt:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF

Query:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQ
         FEVLKFPGGIT+IPPQ  F LQK Q+LFNFTLNFSI+QIQ +F EL SQL+ G+ LA YE LYI L N+ GSTV   TIV +SVLL  G   S  RLKQ
Subjt:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQ

Query:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERSA
        LAQTI+ S+S NLGLN+T FGKVKQVRLSSIL HS   S       +PSP+P P+ H YPH  PHHH HHH  L P  S +P T+  AP   S   + S 
Subjt:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERSA

Query:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT
         PP+       P C Y  +R  G          P  AP+ S  H    P+P      PAPP     P S+PLP+V+++H+ PPSKS+   E PT + S  
Subjt:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLT

Query:  PSPSPSPSAA
        PSP+P+PS+A
Subjt:  PSPSPSPSAA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCCTTGACCCACTTCGCTGGCATTGCTCCCGATGGGGAAAAACGACGGAGAACAGCCACCGCAGTCCGCCGTCGGCTCGCGGCCGTCCGGCCAGGCTGCCGAGGGC
CGATGCTGTTCTGGGTGTGTTCGGATTCGGAGGCTCATTGGCTTCAGATGCATCTTCATTATGCTATTGTCCGTTGCCTTGTTCGTTTCCGCTCTCTTTTGGTTGCTCCC
TTTTCTCCATTACGCAGATCAGAAGGATCAGTCTTAATTCTTCTTATCGAGGTGGGATTTCTCCATCGATTCTGAAATCTTGTCATGATATAGTAGCAATGTTTGATGTC
GAGAGATCGGTTTCTTTGCTGGAAGACAATATCTTGCAGCTCGAGAATGACATTTTTGGAGAGTTCCTTATACCTTCTGCCAAAGTGGTAATACTATCTCTGGAATCCGT
ACCCAGATCGAACCGAACAAAAGTTGTGTTTGGCCTCGATCCAGATGCAGATGATTCAGAAATTCCATCAATGTCCGTAAGTTTGATCAGATCGATCCTTGCAACTCTAG
TTACGAATCAGTCGTCCCTCCGAATAACTAAATCCTTGTTCGGGGAGGCCTTTTCGTTCGAAGTACTGAAATTCCCCGGAGGAATAACTATAATCCCGCCGCAGAGTGCA
TTTCTTTTGCAGAAAGTGCAAATTCTTTTCAACTTTACCTTGAACTTCTCTATTCATCAGATTCAAGTACATTTCAGTGAACTCACCAGCCAACTGGAGGCAGGATTACG
ACTAGCTCCATATGAGATTTTGTACATTAAACTGTGGAATGCGGAAGGTTCAACCGTGACTGCCCTGACGATTGTTCAGACATCTGTTCTTCTAGAAGTTGGAAATACTC
CATCAATGCGGAGGCTGAAGCAGCTAGCTCAGACGATCTCGGGTTCTAATTCTAGCAACCTCGGCCTGAATAATACTGAGTTTGGAAAAGTGAAGCAAGTTCGCCTTTCG
TCAATTCTTAAACACTCCCTCAATGGCAGTGATGGGAATGGCCCCGTGAGATCACCTTCTCCTGCTCCTACACCCCAGCCCCATAACTATCCTCACCTCCCGCCTCACCA
CCATCCCCATCATCACGCCCCTCTAACGCCTGCAATCTCACCTGCCCCTGCAACCGAGAAGGGTGCGCCGGGGTATGGTTCGCTTGCCCCCGAAAGAAGTGCAGCACCGC
CTAAGAGAAGTTACAAAGCAAAGCCGCCTGGTTGCGAATATAGATACAAGAGGAAGTCTGGTAGGAAAGAAGGAAAGCAATCTCATTTGTCCCCGCTCGCTGCACCCAAT
ATATCTCCCGTTCATTCTGCTGCATCGCCATCGCCACAACATCAAGTAAAACCACCAGCACCACCAGTCTCTCCAACTCCGACATCAGCTCCATTGCCAAACGTCATCTA
TTCTCACGTTCAACCACCATCAAAAAGCAACTCAAACCCTGAAAAACCCACGACGGATCCATCCCTCACGCCATCTCCATCTCCATCTCCATCTGCTGCTGATCGCCGTG
CGATCACTCAATGGGAATTCACACTGTTTCTTCTAATTCTCGCCCTCCAAATGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MALDPLRWHCSRWGKTTENSHRSPPSARGRPARLPRADAVLGVFGFGGSLASDASSLCYCPLPCSFPLSFGCSLFSITQIRRISLNSSYRGGISPSILKSCHDIVAMFDV
ERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSA
FLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTALTIVQTSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLS
SILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHPHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPN
ISPVHSAASPSPQHQVKPPAPPVSPTPTSAPLPNVIYSHVQPPSKSNSNPEKPTTDPSLTPSPSPSPSAADRRAITQWEFTLFLLILALQM

MC01g0252 (gene) of Bitter gourd (Dali-11) v1 genome