CuGenDBv2

Gene ID	MS017013
Organism	Momordica charantia cv. TR (Bitter gourd (TR) v1)
Description	Zinc finger family protein, putative isoform 1
Genome location	scaffold197:638389..642428
RNA-Seq Expression	MS017013
Synteny	MS017013
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0016021 - integral component of membrane (cellular component) GO:0004175 - endopeptidase activity (molecular function) GO:0008236 - serine-type peptidase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KGN54878.2 hypothetical protein Csa_012907 [Cucumis sativus]

1.6e-221

83.04

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGEQP  SA+ SRPSG  A+GRCC GCV IRRLIGFRCIFI+LLSVALFVSA+FWL PFLHYADQKDL LN SYRGHDIVA F+VERSVSLLEDN 
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         QL  DIF EF IPS KV ILSLE +  SNRTKVVF LDPD DDSEI S  +SLIRSI+ +LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVT PTIVQ+SVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHN  H P HHHHHHH PLTPAISPAPATEKGAP YGS APER+AA PKRSY AKPPGC+YRYKR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW
        KSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P  TPLPNVIYAHVQPPSKS+SN            +PS +PSPS ADR   ITQW
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW

Query:  EFTLFLLILALHM
         FTLF LILA HM
Subjt:  EFTLFLLILALHM

XP_004144318.1 uncharacterized protein LOC101216010 isoform X1 [Cucumis sativus]

1.6e-221

83.04

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGEQP  SA+ SRPSG  A+GRCC GCV IRRLIGFRCIFI+LLSVALFVSA+FWL PFLHYADQKDL LN SYRGHDIVA F+VERSVSLLEDN 
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         QL  DIF EF IPS KV ILSLE +  SNRTKVVF LDPD DDSEI S  +SLIRSI+ +LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVT PTIVQ+SVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHN  H P HHHHHHH PLTPAISPAPATEKGAP YGS APER+AA PKRSY AKPPGC+YRYKR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW
        KSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P  TPLPNVIYAHVQPPSKS+SN            +PS +PSPS ADR   ITQW
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW

Query:  EFTLFLLILALHM
         FTLF LILA HM
Subjt:  EFTLFLLILALHM

XP_008455751.1 PREDICTED: uncharacterized protein LOC103495852 [Cucumis melo]

3.7e-218

81.87

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGEQP  SA+ SRPSG  A+GRCC GCV IRRLIGFRCIFI+LLSVALFVSA+ WL PF+HYADQKDL LN SYRGHDIVA F+VERSVSLLEDN 
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         QL  DIF EF IPS KV ILSLE +  SNRTKVVF +DPD DDSEI S  +SLIRSI+ +LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTAPTIVQ+SVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNN EF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNGS+GNGPVRSPSPAPTPQPHN+ H P HHHHHHH PL  AISPAPATEKGAP YGS APERSAA P+RSY A+PPGC+YRYKR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW
        KSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P  TPLPNVIYAHVQPPSKS+SN      DP+   +PS +PSPS ADR   ITQW
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW

Query:  EFTLFLLILALHM
         FTLF LILA HM
Subjt:  EFTLFLLILALHM

XP_022154524.1 uncharacterized protein LOC111021781 [Momordica charantia]

1.7e-226

97.92

Show/hide

Query:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF
        HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF
Subjt:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF

Query:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQ
        SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTA TIVQ+SVLLEVGNTPSMRRLKQ
Subjt:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQ

Query:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSA
        LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHH HHHAPLTPAISPAPATEKGAPGYGSLAPERSA
Subjt:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSA

Query:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTP
        APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTS PLPNVIY+HVQPPSKSNSNPEKPTTDPS T 
Subjt:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTP

Query:  SPSPSPSPSAADRRAITQWEFTLFLLILALHM
         PSPSPSPSAADRRAITQWEFTLFLLILAL M
Subjt:  SPSPSPSPSAADRRAITQWEFTLFLLILALHM

XP_038882638.1 uncharacterized protein LOC120073837 [Benincasa hispida]

2.2e-218

82.95

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGEQP  SA+ SRPSGQ A+GRCC GCV IRRLIGFRCIFI+LLSVALFVSA+FWL PFLHYADQKDL LN SYRGHDIVA F+VER VSLLEDNI
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         QL  DIF EF IPS KV ILSLES+P SNRTKVVF LDPD D+SEI S  +SLIRS + +LVTNQ  LRITKS+FGEAFSFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILY+KLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNGS+GNGP RSPSPAP PQPHN    PP HHHHHH  LTPAISPAPATEKGAP YGS APERS A PKRSY AKPPGC+Y  KR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPS--PQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSN-PEKPTTDPSRTPSPSPSPSPSAADRRA-I
        KSGRKEGKQSHL+PLA+PN+SP HSAASPS  PQH+V PPA P+ P P  TPLPNVIYAHVQPPSKSNSN PEK TT+    PS +PSPSPS ADR   I
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPS--PQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSN-PEKPTTDPSRTPSPSPSPSPSAADRRA-I

Query:  TQWEFTLFLLILALHM
        TQW FTLF LILA HM
Subjt:  TQWEFTLFLLILALHM

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KYS3 Uncharacterized protein

7.8e-222

83.04

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGEQP  SA+ SRPSG  A+GRCC GCV IRRLIGFRCIFI+LLSVALFVSA+FWL PFLHYADQKDL LN SYRGHDIVA F+VERSVSLLEDN 
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         QL  DIF EF IPS KV ILSLE +  SNRTKVVF LDPD DDSEI S  +SLIRSI+ +LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVT PTIVQ+SVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHN  H P HHHHHHH PLTPAISPAPATEKGAP YGS APER+AA PKRSY AKPPGC+YRYKR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW
        KSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P  TPLPNVIYAHVQPPSKS+SN            +PS +PSPS ADR   ITQW
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW

Query:  EFTLFLLILALHM
         FTLF LILA HM
Subjt:  EFTLFLLILALHM

A0A1S3C173 uncharacterized protein LOC103495852

1.8e-218

81.87

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGEQP  SA+ SRPSG  A+GRCC GCV IRRLIGFRCIFI+LLSVALFVSA+ WL PF+HYADQKDL LN SYRGHDIVA F+VERSVSLLEDN 
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         QL  DIF EF IPS KV ILSLE +  SNRTKVVF +DPD DDSEI S  +SLIRSI+ +LVTNQ  L ITKS FGEA+SFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTAPTIVQ+SVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNN EF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNGS+GNGPVRSPSPAPTPQPHN+ H P HHHHHHH PL  AISPAPATEKGAP YGS APERSAA P+RSY A+PPGC+YRYKR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW
        KSGRKEGKQSHL+PLA+PNISP HSAASPSPQHQ+ PPA PVSP P  TPLPNVIYAHVQPPSKS+SN      DP+   +PS +PSPS ADR   ITQW
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADR-RAITQW

Query:  EFTLFLLILALHM
         FTLF LILA HM
Subjt:  EFTLFLLILALHM

A0A6J1DMD3 uncharacterized protein LOC111021781

8.1e-227

97.92

Show/hide

Query:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF
        HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF
Subjt:  HDIVAMFDVERSVSLLEDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAF

Query:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQ
        SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTA TIVQ+SVLLEVGNTPSMRRLKQ
Subjt:  SFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQ

Query:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSA
        LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHH HHHAPLTPAISPAPATEKGAPGYGSLAPERSA
Subjt:  LAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSA

Query:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTP
        APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTS PLPNVIY+HVQPPSKSNSNPEKPTTDPS T 
Subjt:  APPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTP

Query:  SPSPSPSPSAADRRAITQWEFTLFLLILALHM
         PSPSPSPSAADRRAITQWEFTLFLLILAL M
Subjt:  SPSPSPSPSAADRRAITQWEFTLFLLILALHM

A0A6J1EB56 uncharacterized protein LOC111432513 isoform X3

9.0e-210

80.71

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGE PP SAVGS PS    +GRCCSGCV IRRLIGFRCIFI+LLSVALFVSA+FWL PFLHY+DQKDL LN SYRGHDIVA F VER VSLL+DNI
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         +L  DIF EF IPS KV ILSL S+  SNRTKVVFG+DPD DD EIPS  +SLIRS  A++VTNQS LRITKS+FGEAFSFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSM+RLKQLAQTIS SNSSNLGLNNTEF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNG DG GP+RSPSPAPTPQPHN+ H P HHHHHHHAPLTP ISPAPA E GAP YG  AP +SAA PKRSY+AKPPGC+  YKR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSN-PEKPTTDPSRTPSPSPSPSPSAADRRAITQW
        KSGRKEGKQ HLSPLA+P+ISPVHSAASPS QH        VSPT  STPLP+VIYAHVQPPSKS+SN PEK TT PS  PSPSPSPS SA     IT+W
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSN-PEKPTTDPSRTPSPSPSPSPSAADRRAITQW

Query:  EFTLFLLI
         FTL L++
Subjt:  EFTLFLLI

A0A6J1EH92 uncharacterized protein LOC111432513 isoform X1

1.1e-210

80.23

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGKNDGE PP SAVGS PS    +GRCCSGCV IRRLIGFRCIFI+LLSVALFVSA+FWL PFLHY+DQKDL LN SYRGHDIVA F VER VSLL+DNI
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
         +L  DIF EF IPS KV ILSL S+  SNRTKVVFG+DPD DD EIPS  +SLIRS  A++VTNQS LRITKS+FGEAFSFEVLKFPGGITIIPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
        LLQKVQILFNFTLNFSIHQIQVHFSELTSQL+AGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSM+RLKQLAQTIS SNSSNLGLNNTEF
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR
        GKVKQVRLSSILKHSLNG DG GP+RSPSPAPTPQPHN+ H P HHHHHHHAPLTP ISPAPA E GAP YG  AP +SAA PKRSY+AKPPGC+  YKR
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKR

Query:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSN-PEKPTTDPSRTPSPSPSPSPSAADRR---AI
        KSGRKEGKQ HLSPLA+P+ISPVHSAASPS QH        VSPT  STPLP+VIYAHVQPPSKS+SN PEK TT PS  PSPSPSPSPS +       I
Subjt:  KSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSPTPTSTPLPNVIYAHVQPPSKSNSN-PEKPTTDPSRTPSPSPSPSPSAADRR---AI

Query:  TQWEFTLFLLI
        T+W FTL L++
Subjt:  TQWEFTLFLLI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G10790.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT3G56590.2)

6.9e-37

35.31

Show/hide

Query:  SGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQK---DLSLNSSYRGHDIVAMFDVERSVSLLEDNILQLENDIFGEF-LIP
        S   + GR CS      RL+G RC+ +++LS A+ +SA+FWL P    ++ K    + LN+S     + A F +++ VS +  +  ++E+DI     L  
Subjt:  SGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQK---DLSLNSSYRGHDIVAMFDVERSVSLLEDNILQLENDIFGEF-LIP

Query:  SAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLN
        ++KV +LSL     SN T V F + P   D EI   S+SL+RS    L   +S L++T S FG+  SF+VLKFPGGIT+ P + A +     +LF+ T+ 
Subjt:  SAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLN

Query:  FSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKH
         SI  +Q     L    E  L L PYE ++ +L N +GST++ P   Q  V   +      +RL    Q I  S + NLGL+   FG+VK +  S+ L  
Subjt:  FSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKH

Query:  SLNGSDGNGPVRSPSPAPTP
         +  SD        +PAPTP
Subjt:  SLNGSDGNGPVRSPSPAPTP

AT3G10810.1 zinc finger (C3HC4-type RING finger) family protein

2.0e-97

45.94

Show/hide

Query:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI
        MGK + +   + A G            C  C  I   +GF+C+F++LLSVALF+SALF LLPF    D++D +L+  +RGH IVA F + RS S L +N 
Subjt:  MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNI

Query:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF
        LQL+NDIF E    S KV IL++E     N TKVVFG+DPD    EI  +S+S I+ +  +++ NQS+L++TKSLFGE F FEVLKFPGGIT+IPPQSAF
Subjt:  LQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAF

Query:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF
         LQK +I+FNFTLN+SIHQIQ++F+ L SQL+ GL LAPYE LY+ L N+EGSTV+ PT V SSVLL VG + S  RLKQL  TI+GS S NLGLNNT F
Subjt:  LLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEF

Query:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQP----------HNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAK
        GKVKQVRLSS L +S + S      +SPSP+P+P            H++ H   +HHHHHH  L+P ++P  +         S AP RS    KR+  A 
Subjt:  GKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQP----------HNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAK

Query:  P---PGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSP----TPTSTPLPNVIYAH-VQPPSKSNSNPEKPTTDPSRTPSP
        P   PG    +K K       Q   +P  AP        ++ +P HQ+  PAP  +      P S PLP+V++AH  QPP    + P +P    +    P
Subjt:  P---PGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPPVSP----TPTSTPLPNVIYAH-VQPPSKSNSNPEKPTTDPSRTPSP

Query:  SPSPSPSAADRRAITQWEFTLFLLILALH
         P  S SA +      W   L L++  LH
Subjt:  SPSPSPSAADRRAITQWEFTLFLLILALH

AT3G56590.1 hydroxyproline-rich glycoprotein family protein

2.0e-105

49.7

Show/hide

Query:  MGKNDGEQP----PQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLL
        MGKN  E+        A  +R +G      CC  C  I      RC+ I+  S A+F+SALFWL PFL +AD  DL L+  ++ H IVA FDV + +S +
Subjt:  MGKNDGEQP----PQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLL

Query:  EDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPP
        EDN++QLENDI  E   P  KVV+L+LE +   NRT V+F +DP+ ++S+IP+   SLI++   TLV  Q S R+T+SLFGE F FEVLKFPGGIT+IPP
Subjt:  EDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPP

Query:  QSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLN
        Q  F LQK Q+LFNFTLNFSI+QIQ +F EL SQL+ G+ LA YE LYI L N+ GSTV  PTIV SSVLL  G   S  RLKQLAQTI+ S+S NLGLN
Subjt:  QSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLN

Query:  NTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEY
        +T FGKVKQVRLSSIL HS   S       +PSP+P P+ H YPH  PHHHHHHH  L P  S +P T+  AP   S   + S  PP+       P C Y
Subjt:  NTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEY

Query:  RYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSP
          +R  G          P  AP+ S  H    P+P      PAPP     P S+PLP+V++AH+ PPSKS+     P ++P+   SPSP+P+P
Subjt:  RYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSP

AT3G56590.2 hydroxyproline-rich glycoprotein family protein

2.4e-106

49.8

Show/hide

Query:  MGKNDGEQP----PQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLL
        MGKN  E+        A  +R +G      CC  C  I      RC+ I+  S A+F+SALFWL PFL +AD  DL L+  ++ H IVA FDV + +S +
Subjt:  MGKNDGEQP----PQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLL

Query:  EDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPP
        EDN++QLENDI  E   P  KVV+L+LE +   NRT V+F +DP+ ++S+IP+   SLI++   TLV  Q S R+T+SLFGE F FEVLKFPGGIT+IPP
Subjt:  EDNILQLENDIFGEFLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPP

Query:  QSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLN
        Q  F LQK Q+LFNFTLNFSI+QIQ +F EL SQL+ G+ LA YE LYI L N+ GSTV  PTIV SSVLL  G   S  RLKQLAQTI+ S+S NLGLN
Subjt:  QSAFLLQKVQILFNFTLNFSIHQIQVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLN

Query:  NTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEY
        +T FGKVKQVRLSSIL HS   S       +PSP+P P+ H YPH  PHHHHHHH  L P  S +P T+  AP   S   + S  PP+       P C Y
Subjt:  NTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSPAPTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEY

Query:  RYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAA
          +R  G          P  AP+ S  H    P+P      PAPP     P S+PLP+V++AH+ PPSKS+     P ++P+   SPSP+P+PS+A
Subjt:  RYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAPP-VSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGAAAAACGACGGAGAACAGCCACCGCAGTCCGCCGTCGGCTCGCGGCCGTCCGGCCAGGCTGCCGAGGGCCGATGCTGTTCTGGGTGTGTTCGGATTCGGAGGCT
CATTGGCTTCAGATGCATCTTCATTATGCTATTGTCCGTTGCCTTGTTCGTTTCCGCTCTCTTTTGGCTGCTCCCTTTTCTCCATTACGCAGATCAGAAGGATCTGAGTC
TTAATTCTTCGTATCGAGGTCATGATATAGTAGCAATGTTTGATGTCGAGAGATCGGTTTCTTTGCTGGAAGACAATATCTTGCAGCTCGAGAATGACATTTTTGGAGAG
TTCCTTATACCTTCTGCCAAAGTGGTAATACTATCTCTGGAATCCGTACCCAGATCGAACCGAACAAAAGTTGTGTTTGGCCTCGATCCAGATGCAGATGATTCAGAAAT
TCCATCAATGTCCGTAAGTTTGATCAGATCGATCCTTGCAACTCTAGTTACGAATCAGTCGTCCCTCCGAATAACTAAATCCTTGTTCGGGGAGGCCTTTTCGTTCGAAG
TACTGAAATTCCCCGGAGGAATAACTATAATCCCGCCGCAGAGTGCATTTCTTTTGCAGAAAGTGCAAATTCTTTTCAACTTTACCTTGAACTTCTCTATTCATCAGATT
CAAGTACATTTCAGTGAACTCACCAGCCAACTGGAGGCAGGATTACGACTAGCTCCATATGAGATTTTATACATTAAACTGTGGAATGCGGAAGGTTCGACCGTGACTGC
CCCGACGATTGTTCAGTCATCTGTTCTTCTAGAAGTTGGAAATACTCCATCAATGCGGAGGCTGAAGCAGCTAGCTCAGACGATCTCGGGTTCTAATTCTAGCAACCTCG
GCCTGAATAATACTGAGTTTGGAAAAGTGAAGCAAGTTCGCCTTTCGTCAATTCTTAAACACTCCCTCAATGGCAGTGATGGGAATGGCCCCGTGAGATCACCTTCTCCT
GCTCCTACACCCCAGCCCCATAACTATCCTCACCTCCCGCCTCACCACCATCACCATCATCACGCCCCTCTAACGCCTGCAATCTCACCTGCCCCTGCAACCGAGAAGGG
TGCGCCGGGGTATGGTTCGCTTGCCCCCGAAAGAAGTGCAGCACCGCCTAAGAGAAGTTACAAAGCAAAGCCACCTGGTTGCGAATATAGATACAAGAGGAAGTCTGGTA
GGAAAGAAGGAAAGCAATCTCATTTGTCCCCACTCGCTGCACCCAATATATCTCCCGTTCATTCTGCTGCATCGCCATCGCCACAACATCAAGTAAAACCACCAGCACCA
CCAGTCTCTCCAACTCCGACATCAACTCCATTGCCAAACGTCATCTACGCTCATGTTCAACCACCATCAAAAAGCAACTCAAACCCTGAAAAACCCACGACGGATCCATC
ACGCACGCCATCTCCATCTCCATCTCCATCTCCATCTGCTGCTGATCGCCGTGCGATCACTCAATGGGAATTCACACTGTTTCTTCTAATTCTCGCACTCCACATG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGKNDGEQPPQSAVGSRPSGQAAEGRCCSGCVRIRRLIGFRCIFIMLLSVALFVSALFWLLPFLHYADQKDLSLNSSYRGHDIVAMFDVERSVSLLEDNILQLENDIFGE
FLIPSAKVVILSLESVPRSNRTKVVFGLDPDADDSEIPSMSVSLIRSILATLVTNQSSLRITKSLFGEAFSFEVLKFPGGITIIPPQSAFLLQKVQILFNFTLNFSIHQI
QVHFSELTSQLEAGLRLAPYEILYIKLWNAEGSTVTAPTIVQSSVLLEVGNTPSMRRLKQLAQTISGSNSSNLGLNNTEFGKVKQVRLSSILKHSLNGSDGNGPVRSPSP
APTPQPHNYPHLPPHHHHHHHAPLTPAISPAPATEKGAPGYGSLAPERSAAPPKRSYKAKPPGCEYRYKRKSGRKEGKQSHLSPLAAPNISPVHSAASPSPQHQVKPPAP
PVSPTPTSTPLPNVIYAHVQPPSKSNSNPEKPTTDPSRTPSPSPSPSPSAADRRAITQWEFTLFLLILALHM

MS017013 (gene) of Bitter gourd (TR) v1 genome