CuGenDBv2

Gene ID	MC10g0688
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	Hydroxyproline-rich glycoprotein family protein
Genome location	MC10:5743053..5744324
RNA-Seq Expression	MC10g0688
Synteny	MC10g0688
Gene Ontology terms	NA
InterPro domains	IPR040420 - Uncharacterized protein At1g76660-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0044829.1 mucin-2 [Cucumis melo var. makuwa]

2.89e-231

79.06

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+EP ENTLQSPDIVLPFAAPPSSPVS LQSEPPSA QSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHE QLVSPPLNFST+TT+PST PFTPPESIHLTTPSSPEVPFAQ++ PSHQKVESD+QY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF
        LPD DF   GS F NFP++VPPTL N+D+HSI +WR +QS+DSCTQ+S+ +KSSNDFVLNP TSES+ D+HA+NE  NIQIL D GS+R+E   A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA
        SFELSD D L +SV +KPLESNEL V SSPIHEP ET KE S  G HTSN  EE+ KADG+E H HQE  HHSV LG+VKEFNFDN NG DT  P INS 
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA

Query:  WWANGKDAETEGTTTGAWSFFPITQ
        WW N KD  TEGTTTGAWSFFP TQ
Subjt:  WWANGKDAETEGTTTGAWSFFPITQ

XP_004146564.1 uncharacterized protein LOC101220378 isoform X1 [Cucumis sativus]

1.43e-231

79.53

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSC SIYWCFGS+KQRKRIGHAVLVPEPSPS+EP ENTLQSPDIVLPFAAPPSSPVS LQSEPPSA QSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHE QLVSPPLNFST+TT+PST PFTPPESIHLTTPSSPEVPFAQ++QP+  KVESD+QY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF
        LPD DF   GS F NFP+EVPPTLLNLD+HSI +WR +QS+DSCTQ+S+ +KSSNDFVLNPQTSES+SD+HA+NE  NIQIL D GS+++E   A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA
        SFELSD D LL+SV +KPLESNELAV SSPIHEP ET KE S  G HTSN  EE+ KADG+E H  Q  EHHSVTLG+VKEFNFDNGNG DT  PNINS 
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA

Query:  WWANGKDAETEGTTTGAWSFFPITQ
        WW N KD  TE T TG WSFFP+TQ
Subjt:  WWANGKDAETEGTTTGAWSFFPITQ

XP_022136623.1 uncharacterized protein At1g76660-like [Momordica charantia]

1.51e-308

100

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAAAANHRFSF
        LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAAAANHRFSF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAAAANHRFSF

Query:  ELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSAWW
        ELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSAWW
Subjt:  ELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSAWW

Query:  ANGKDAETEGTTTGAWSFFPITQ
        ANGKDAETEGTTTGAWSFFPITQ
Subjt:  ANGKDAETEGTTTGAWSFFPITQ

XP_038884072.1 uncharacterized protein LOC120075005 isoform X1 [Benincasa hispida]

4.03e-237

80.52

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE SPS+E  EN+LQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHETQLVSPPLNFST+TT+PSTAPFTPPESIHLTTPSSPEVPFAQ+LQP+ QK ESDHQY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAA--AANHRF
        LPD DF   GS F NFP+EVPPTLLNLD+ SI +WR +QS+DSCTQ+S+  KSSNDFVLNPQTSES+SD+HA+NE  NIQIL DG+Q++E    A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAA--AANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGG-HTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINS
        SFELSD DALL+SV +KPL+SNE+AVASSPIHEP ETAKE S V   HTSN TE + KA+ EE H HQE  HHS+TLG+VKEFNFDNGNG DT K N+NS
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGG-HTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINS

Query:  AWWANGKDAETEGTTTGAWSFFPITQ
         WW N KD +TEGTT GAWSFFP+TQ
Subjt:  AWWANGKDAETEGTTTGAWSFFPITQ

XP_038884079.1 uncharacterized protein LOC120075005 isoform X2 [Benincasa hispida]

3.49e-237

80.52

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE SPS+E  EN+LQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHETQLVSPPLNFST+TT+PSTAPFTPPESIHLTTPSSPEVPFAQ+LQP+ QK ESDHQY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAA--AANHRF
        LPD DF   GS F NFP+EVPPTLLNLD+ SI +WR +QS+DSCTQ+S+  KSSNDFVLNPQTSES+SD+HA+NE  NIQIL DG+Q++E    A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAA--AANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGG-HTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINS
        SFELSD DALL+SV +KPL+SNE+AVASSPIHEP ETAKE S V   HTSN TE + KA+ EE H HQE  HHS+TLG+VKEFNFDNGNG DT K N+NS
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGG-HTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINS

Query:  AWWANGKDAETEGTTTGAWSFFPITQ
         WW N KD +TEGTT GAWSFFP+TQ
Subjt:  AWWANGKDAETEGTTTGAWSFFPITQ

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BSB0 uncharacterized protein LOC103493162 isoform X1

8.36e-231

79.29

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+EP ENTLQSPDIVLPFAAPPSSPVS LQSEPPSA QSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHE QLVSPPLNFST+TT+PST PFTPPESIHLTTPSSPEVPFAQ++ PS QKVESD+QY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF
        LPD DF   GS F NFP+EVPPTL NLD+HSI +WR +QS+DSCTQ+S+ +KSSNDFVLNP TSES+ D+HA+NE  NIQIL D GS+R+E   A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA
        SFELSD D L +SV +KPLESNEL V SSPIHEP ET KE S  G HTSN  EE+ KADG+E H HQE  HHSV LG+VKEFNFDN NG DT  P INS 
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA

Query:  WWANGKDAETEGTTTGAWSFFPITQ
        WW N KD  TEGTTTGAWSFFP TQ
Subjt:  WWANGKDAETEGTTTGAWSFFPITQ

A0A1S3BSY8 uncharacterized protein LOC103493162 isoform X2

8.06e-231

79.29

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+EP ENTLQSPDIVLPFAAPPSSPVS LQSEPPSA QSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHE QLVSPPLNFST+TT+PST PFTPPESIHLTTPSSPEVPFAQ++ PS QKVESD+QY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF
        LPD DF   GS F NFP+EVPPTL NLD+HSI +WR +QS+DSCTQ+S+ +KSSNDFVLNP TSES+ D+HA+NE  NIQIL D GS+R+E   A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA
        SFELSD D L +SV +KPLESNEL V SSPIHEP ET KE S  G HTSN  EE+ KADG+E H HQE  HHSV LG+VKEFNFDN NG DT  P INS 
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA

Query:  WWANGKDAETEGTTTGAWSFFPITQ
        WW N KD  TEGTTTGAWSFFP TQ
Subjt:  WWANGKDAETEGTTTGAWSFFPITQ

A0A5A7TUB1 Mucin-2

1.40e-231

79.06

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+EP ENTLQSPDIVLPFAAPPSSPVS LQSEPPSA QSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHE QLVSPPLNFST+TT+PST PFTPPESIHLTTPSSPEVPFAQ++ PSHQKVESD+QY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF
        LPD DF   GS F NFP++VPPTL N+D+HSI +WR +QS+DSCTQ+S+ +KSSNDFVLNP TSES+ D+HA+NE  NIQIL D GS+R+E   A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA
        SFELSD D L +SV +KPLESNEL V SSPIHEP ET KE S  G HTSN  EE+ KADG+E H HQE  HHSV LG+VKEFNFDN NG DT  P INS 
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA

Query:  WWANGKDAETEGTTTGAWSFFPITQ
        WW N KD  TEGTTTGAWSFFP TQ
Subjt:  WWANGKDAETEGTTTGAWSFFPITQ

A0A5D3CYQ2 Mucin-2

8.06e-231

79.29

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+EP ENTLQSPDIVLPFAAPPSSPVS LQSEPPSA QSPTA++SFTSLTANMYSPDGPSSIFA+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHE QLVSPPLNFST+TT+PST PFTPPESIHLTTPSSPEVPFAQ++ PS QKVESD+QY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF
        LPD DF   GS F NFP+EVPPTL NLD+HSI +WR +QS+DSCTQ+S+ +KSSNDFVLNP TSES+ D+HA+NE  NIQIL D GS+R+E   A NHRF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTD-GSQRDEA-AAANHRF

Query:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA
        SFELSD D L +SV +KPLESNEL V SSPIHEP ET KE S  G HTSN  EE+ KADG+E H HQE  HHSV LG+VKEFNFDN NG DT  P INS 
Subjt:  SFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSA

Query:  WWANGKDAETEGTTTGAWSFFPITQ
        WW N KD  TEGTTTGAWSFFP TQ
Subjt:  WWANGKDAETEGTTTGAWSFFPITQ

A0A6J1C828 uncharacterized protein At1g76660-like

7.33e-309

100

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
        QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAV

Query:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
        GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP
Subjt:  GPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSP

Query:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAAAANHRFSF
        LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAAAANHRFSF
Subjt:  LPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAAAANHRFSF

Query:  ELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSAWW
        ELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSAWW
Subjt:  ELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSAWW

Query:  ANGKDAETEGTTTGAWSFFPITQ
        ANGKDAETEGTTTGAWSFFPITQ
Subjt:  ANGKDAETEGTTTGAWSFFPITQ

SwissProt top hits

e value

%identity

Alignment

Q9SRE5 Uncharacterized protein At1g76660

9.2e-32

39.08

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE-PSPSTEPPE--------NTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSP
        Q++RWG C  ++ CF S K  KRI  A  +PE  + S   P         N   +  I L   APPSSP SF  S  PS TQSP   L   SL AN  SP
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE-PSPSTEPPE--------NTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSP

Query:  DGP-SSIFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFT-PPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPR
         GP SS++A GP+AHETQLVSPP+ FST TT+PSTAPFT PPE   LT PSSP+VP+A++L  S     S   +    ND   +Y  YPGSP S L SP 
Subjt:  DGP-SSIFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFT-PPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPR

Query:  SVISRSGASSPL-PDCDFTPSGSSF-------------SNF--PIEVPPTLLNLDQHSIQD-WRLQQSSDSCTQNSVGYKSSNDFVLN---PQTSESVSD
        S  S  G  SP    C  + SG++F             SNF  P       L+ D    Q+  RL  S DS    + GY + N    N    Q  E +  
Subjt:  SVISRSGASSPL-PDCDFTPSGSSF-------------SNF--PIEVPPTLLNLDQHSIQD-WRLQQSSDSCTQNSVGYKSSNDFVLN---PQTSESVSD

Query:  YHASNEYHNIQILTDGSQRDEAAAANHRF---SFELSDEDALLKSVEN
        Y AS  +   +I+T     +     +  F   ++  SD   LL+   N
Subjt:  YHASNEYHNIQILTDGSQRDEAAAANHRF---SFELSDEDALLKSVEN

Arabidopsis top hits

e value

%identity

Alignment

AT1G63720.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT5G52430.1)

4.2e-48

51.49

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEP----SPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSS
        +KR+W + WS+  CFGS +QRKRIG++VLVPEP    S ++    +  +S    LPF APPSSP SF QSEPPSATQSP  ILSF+ L  N        S
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEP----SPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSS

Query:  IFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFTPP---ESIHL--TTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSV
        IFA+GP+AHETQLVSPP+ FST TT+PS+AP TPP    SI+L  TTPSSPEVPFAQ    +HQ     +++    + +FQ YQ  PGSP+  LISP   
Subjt:  IFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFTPP---ESIHL--TTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSV

Query:  ISRSGASSPLPDCDFTPSGSSFSNFPIEVPPTLLN
           SG +SP PD +     S F +F +  PP LL+
Subjt:  ISRSGASSPLPDCDFTPSGSSFSNFPIEVPPTLLN

AT1G76660.1 FUNCTIONS IN: molecular_function unknown

6.5e-33

39.08

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE-PSPSTEPPE--------NTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSP
        Q++RWG C  ++ CF S K  KRI  A  +PE  + S   P         N   +  I L   APPSSP SF  S  PS TQSP   L   SL AN  SP
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE-PSPSTEPPE--------NTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSP

Query:  DGP-SSIFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFT-PPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPR
         GP SS++A GP+AHETQLVSPP+ FST TT+PSTAPFT PPE   LT PSSP+VP+A++L  S     S   +    ND   +Y  YPGSP S L SP 
Subjt:  DGP-SSIFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFT-PPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPR

Query:  SVISRSGASSPL-PDCDFTPSGSSF-------------SNF--PIEVPPTLLNLDQHSIQD-WRLQQSSDSCTQNSVGYKSSNDFVLN---PQTSESVSD
        S  S  G  SP    C  + SG++F             SNF  P       L+ D    Q+  RL  S DS    + GY + N    N    Q  E +  
Subjt:  SVISRSGASSPL-PDCDFTPSGSSF-------------SNF--PIEVPPTLLNLDQHSIQD-WRLQQSSDSCTQNSVGYKSSNDFVLN---PQTSESVSD

Query:  YHASNEYHNIQILTDGSQRDEAAAANHRF---SFELSDEDALLKSVEN
        Y AS  +   +I+T     +     +  F   ++  SD   LL+   N
Subjt:  YHASNEYHNIQILTDGSQRDEAAAANHRF---SFELSDEDALLKSVEN

AT4G25620.1 hydroxyproline-rich glycoprotein family protein

3.6e-47

36.65

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS---TEPPEN-TLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSS
        QK+R GS WS+YWCFGS K  KRIGHAVLVPEP+ S     P +N +  S  I +PF APPSSP SFL S PPSA+ +P   L   SLT N      P S
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS---TEPPEN-TLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSS

Query:  IFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESD-----HQYDQFPNDDFQSYQFYPGSPVSHLISPRSV
         F +GP+AHETQ V+PP+ FS  TT+PSTAPFTPP      +PSSPEVPFAQ L  S ++   +     +Q     + +F+S Q YPGSP  +LISP   
Subjt:  IFAVGPFAHETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESD-----HQYDQFPNDDFQSYQFYPGSPVSHLISPRSV

Query:  ISRSGASSPLPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEA
           SG SSP       P   S   F I  PP  L  +  + + W  +  S S T    G +  +   L P  S+  S     N    +  ++ G+     
Subjt:  ISRSGASSPLPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEA

Query:  AAANHRFSFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGE-----------EVHGHQEVEHHSVTLGTVKEF
                 ++S+  +L  S       ++E  V    +   L T ++ +       N +   EKA GE           E    Q  +  S + G+ KEF
Subjt:  AAANHRFSFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGE-----------EVHGHQEVEHHSVTLGTVKEF

Query:  NFDNGNGCDTLKPNINSAWWANGKDA-ETEGTTTGAWSFFPI
         FD+ N  + +   I S WWAN K A + + +   +W+FFP+
Subjt:  NFDNGNGCDTLKPNINSAWWANGKDA-ETEGTTTGAWSFFPI

AT5G52430.1 hydroxyproline-rich glycoprotein family protein

2.7e-55

38.86

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEP---PENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSI
        QK RWG CWS+Y CFG+ K  KRIG+AVLVPEP  S  P    +N+  S  +VLPF APPSSP SFLQS+P S + SP   L   SLT+N +SP  P S+
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEP---PENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSI

Query:  FAVGPFAHETQLVSPPLNFSTVTTQPSTAPFTPP--ESIHLTTPSSPEVPFAQYLQPSHQKVESD-----HQYDQFPNDDFQSYQFYPGSP-VSHLISPR
        F VGP+A+ETQ V+PP+ FS   T+PSTAP+TPP   S+H+TTPSSPEVPFAQ L  S +    D     +Q     + +F+S Q  PGSP   +LISP 
Subjt:  FAVGPFAHETQLVSPPLNFSTVTTQPSTAPFTPP--ESIHLTTPSSPEVPFAQYLQPSHQKVESD-----HQYDQFPNDDFQSYQFYPGSP-VSHLISPR

Query:  SVISRSGASSPLPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSS-NDFVLNPQTSESVS--------DYHASNEYHNIQ
        SVIS SG SSP       P  S    F I  PP  L  +  + + W  +  S S T   VG+ S      L P   E VS         +   N+   + 
Subjt:  SVISRSGASSPLPDCDFTPSGSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSS-NDFVLNPQTSESVS--------DYHASNEYHNIQ

Query:  ILTDGSQRDEAAAANHRFSFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEF
         L +     E   A+HR SFEL+ ED + + + +K   S++        ++ +ET + +S     T      ++++   E   H+  +  S ++G+ KEF
Subjt:  ILTDGSQRDEAAAANHRFSFELSDEDALLKSVENKPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEF

Query:  NFDNGNGCDTLKPNINSAWWANGKDAETEGTTTGAWSFFP
         FD                  N KD   E     +WSFFP
Subjt:  NFDNGNGCDTLKPNINSAWWANGKDAETEGTTTGAWSFFP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

CCCCAGAAAAGGAGATGGGGCAGCTGCTGGAGTATTTATTGGTGCTTTGGATCTCTCAAACAGAGGAAGAGAATTGGACACGCTGTACTGGTCCCAGAACCAAGT
CCTTCAACTGAACCTCCTGAAAATACATTACAATCACCAGACATTGTGCTTCCCTTTGCTGCACCTCCCTCTTCCCCTGTATCCTTCCTTCAATCAGAGCCGCCT
TCTGCTACACAATCACCAACAGCCATACTCTCTTTCACTTCTCTCACTGCTAACATGTATTCCCCTGATGGGCCTTCCTCTATTTTTGCCGTTGGCCCATTTGCT
CATGAAACACAGTTAGTGTCTCCACCTCTGAATTTCTCCACTGTCACTACTCAGCCATCAACTGCTCCCTTCACTCCTCCTGAGTCTATCCACTTGACTACACCT
TCTTCCCCTGAAGTTCCATTTGCTCAGTATCTGCAACCTAGCCATCAGAAAGTTGAGTCTGATCACCAATATGATCAGTTTCCTAATGATGACTTTCAATCTTAT
CAATTCTATCCCGGAAGCCCAGTTAGTCACCTCATATCACCACGCTCGGTCATTTCCCGTTCCGGGGCATCGTCGCCTTTGCCTGATTGTGATTTTACTCCCTCT
GGTTCTTCATTTTCTAACTTCCCAATAGAAGTTCCTCCTACGCTGTTGAACCTTGACCAACATTCTATTCAGGACTGGCGACTACAGCAAAGTTCTGATTCTTGC
ACTCAGAATTCTGTAGGGTACAAATCTAGTAACGATTTTGTTTTGAATCCTCAAACTTCAGAATCTGTGTCAGACTACCACGCGTCAAATGAATATCATAATATT
CAGATCCTCACTGATGGAAGCCAAAGGGATGAAGCTGCTGCTGCTAATCATAGATTCTCATTTGAGTTGTCTGATGAAGATGCTTTATTAAAAAGCGTAGAAAAT
AAACCACTGGAATCAAATGAACTTGCAGTTGCATCATCTCCAATACACGAACCACTTGAAACGGCAAAAGAAACTTCTCATGTTGGCGGTCATACCTCAAATGAT
ACAGAAGAACAGGAAAAAGCAGATGGTGAAGAAGTACATGGGCATCAAGAAGTAGAACATCATTCCGTTACTCTTGGGACTGTGAAAGAATTCAATTTTGATAAT
GGCAATGGATGTGATACACTTAAGCCTAATATCAACTCAGCGTGGTGGGCTAATGGGAAGGATGCAGAGACAGAAGGTACGACCACCGGGGCCTGGTCGTTCTTT
CCAATTACGCAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

PQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSTEPPENTLQSPDIVLPFAAPPSSPVSFLQSEPPSATQSPTAILSFTSLTANMYSPDGPSSIFAVGPFA
HETQLVSPPLNFSTVTTQPSTAPFTPPESIHLTTPSSPEVPFAQYLQPSHQKVESDHQYDQFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDCDFTPS
GSSFSNFPIEVPPTLLNLDQHSIQDWRLQQSSDSCTQNSVGYKSSNDFVLNPQTSESVSDYHASNEYHNIQILTDGSQRDEAAAANHRFSFELSDEDALLKSVEN
KPLESNELAVASSPIHEPLETAKETSHVGGHTSNDTEEQEKADGEEVHGHQEVEHHSVTLGTVKEFNFDNGNGCDTLKPNINSAWWANGKDAETEGTTTGAWSFF
PITQ

MC10g0688 (gene) of Bitter gourd (Dali-11) v1 genome