CuGenDBv2

Gene ID	Lag0019241
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Mucin-2
Genome location	chr5:40149759..40151862
RNA-Seq Expression	Lag0019241
Synteny	Lag0019241
Gene Ontology terms	NA
InterPro domains	IPR040420 - Uncharacterized protein At1g76660-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004146564.1 uncharacterized protein LOC101220378 isoform X1 [Cucumis sativus]

7.8e-191

82.25

Show/hide

Query:  MRRRANADDAADLRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAA
        MRRR + D   D RPV NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGS+KQRKRIGHAVLVPEPSPS+ + H+NTL+SPDIVLPFAA
Subjt:  MRRRANADDAADLRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAA

Query:  PPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTPFTPPESILLTTPSSPEVPFAQF-QPSLQK
        PPSSPVS LQSEPPSA QSPTA +SFTSLTANMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPSTPFTPPESI LTTPSSPEVPFAQF QP+L K
Subjt:  PPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTPFTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF
         +SD+QY FP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DFAS GSQF NF LEVPPTLLNLDK  IH+WRQ QS+DSC Q+S  F SSNDF
Subjt:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF

Query:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK
         LNPQTSESMSDHHATNESQNIQIL +DG  +EEEP A NHRFSFELSD D LL+S  SKPLESNELAV SSPIHEPF T KE SP G  TSN  EEK K
Subjt:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK

Query:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        A+G+EA++ QEHHS+TLGSVKEFNFDNGNGSD   PNINS+WW N
Subjt:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

XP_022136623.1 uncharacterized protein At1g76660-like [Momordica charantia]

1.3e-193

82.51

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP
        MRRR +AD  ADL PVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS +   +NTL+SPDIVLPFAAP
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP

Query:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK
        PSSPVSFLQSEPPSATQSPTA LSFTSLTANMYSPDGPSSIFA+GPFAHETQLVSPPLNFST+TT+PST PFTPPESI LTTPSSPEVPFAQ+ QPS QK
Subjt:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQY-PFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSND
         +SD QY  FP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DF  SGS FSNF +EVPPTLLNLD+  I  WR  QSSDSC QNS G+ SSND
Subjt:  AQSDDQY-PFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSND

Query:  FDLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKA
        F LNPQTSES+SD+HA+NE  NIQIL DG Q +E AAANHRFSFELSDEDALL+S E+KPLESNELAV SSPIHEP  TAKETS VGG TSN TEE+ KA
Subjt:  FDLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKA

Query:  EGEEANEHQ--EHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        +GEE + HQ  EHHS+TLG+VKEFNFDNGNG D LKPNINS WWAN
Subjt:  EGEEANEHQ--EHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

XP_023522163.1 uncharacterized protein At1g76660-like [Cucurbita pepo subsp. pepo]

5.6e-189

82.48

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP
        MRRRA+A DAADLRP+NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS  +AHQN+L+SPDIVLPFAAP
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP

Query:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTP-FTPPESILLTTPSSPEVPFAQF-QPSLQK
        PSSPVSFLQSEPPSATQSP+  LSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTP FTPPESI LTTPSSPEVPFAQF QP+LQK
Subjt:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTP-FTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDKQIHSWRQGQSSDSCNQNSTGFTSS-NDF
        A+SDDQY  P DDFQSYQFYPGSP+S+LISPRS IS SGASSPLPDLDFASS SQFSNFSL+VPP LLNLD      RQGQSSDSC QNS GF S+ +DF
Subjt:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDKQIHSWRQGQSSDSCNQNSTGFTSS-NDF

Query:  DLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKAE
        DLNP+TS+SM      NESQNIQIL DG Q EEP   NHRFSFELSDED+LLR+ ESKPLESN +AV SSP+HE F TAKETS  GG +SNG EEKA A+
Subjt:  DLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKAE

Query:  GEEANEHQE-HHSITLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVKVR
        GEEAN+HQE HHS TLGSV EFNFDNGNGS+ALKPNINSDWWAN   V+ +
Subjt:  GEEANEHQE-HHSITLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVKVR

XP_023529207.1 uncharacterized protein At1g76660-like isoform X1 [Cucurbita pepo subsp. pepo]

1.5e-189

82.52

Show/hide

Query:  MRRRANAD-DAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAA
        MRRRA+AD DAADLRP+NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS  +AHQN+L+SPDIVLPFAA
Subjt:  MRRRANAD-DAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAA

Query:  PPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTP-FTPPESILLTTPSSPEVPFAQF-QPSLQ
        PPSSPVSFLQSEPPSATQSP+  LSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTP FTPPESI LTTPSSPEVPFAQF QP+LQ
Subjt:  PPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTP-FTPPESILLTTPSSPEVPFAQF-QPSLQ

Query:  KAQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDKQIHSWRQGQSSDSCNQNSTGFTSS-ND
        KA+SDDQY  P DDFQSYQFYPGSP+S+LISPRS IS SGASSPLPDLDFASS SQFSNFSL+VPP LLNLD      RQGQSSDSC QNS GF S+ +D
Subjt:  KAQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDKQIHSWRQGQSSDSCNQNSTGFTSS-ND

Query:  FDLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKA
        FDLNP+TS+SM      NESQNIQIL DG Q EEP   NHRFSFELSDED+LLR+ ESKPLESN +AV SSP+HE F TAKETS  GG +SNG EEKA A
Subjt:  FDLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKA

Query:  EGEEANEHQE-HHSITLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVKVR
        +GEEAN+HQE HHS TLGSV EFNFDNGNGS+ALKPNINSDWWAN   V+ +
Subjt:  EGEEANEHQE-HHSITLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVKVR

XP_038884079.1 uncharacterized protein LOC120075005 isoform X2 [Benincasa hispida]

1.2e-194

83.63

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP
        MRRR + DD+   RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE SPS+ ++H+N+L+SPDIVLPFAAP
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP

Query:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK
        PSSPVSFLQSEPPSATQSPTA +SFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST PFTPPESI LTTPSSPEVPFAQF QP+LQK
Subjt:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDKQ-IHSWRQGQSSDSCNQNSTGFTSSNDF
        ++SD QYPFP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DFAS GSQF NF LEVPPTLLNLDKQ IH+WRQ QS+DSC Q+S    SSNDF
Subjt:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDKQ-IHSWRQGQSSDSCNQNSTGFTSSNDF

Query:  DLNPQTSESMSDHHATNESQNIQILNDGCQEEE--PAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPV-GGQTSNGTEEKA
         LNPQTSESMSDHHATNESQNIQIL DG Q+EE  P A NHRFSFELSD DALL+S  SKPL+SNE+AV SSPIHEPF TAKE SPV    TSN TE K 
Subjt:  DLNPQTSESMSDHHATNESQNIQILNDGCQEEE--PAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPV-GGQTSNGTEEKA

Query:  KAEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        KAE EEA++HQEHHSITLGSVKEFNFDNGNGSD  K N+NS+WW N
Subjt:  KAEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BSB0 uncharacterized protein LOC103493162 isoform X1

1.6e-186

81.17

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAA
        MRRR + D   D RPVNNTFQTITAAADAIATVDHRFPRATAV QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+ + H+NTL+SPDIVLPFAA
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAA

Query:  PPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQ
        PPSSPVS LQSEPPSA QSPTA +SFTSLTANMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESI LTTPSSPEVPFAQF  PSLQ
Subjt:  PPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQ

Query:  KAQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSND
        K +SD+QY FP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DFAS GSQF NF LEVPPTL NLDK  IH+WRQ QS+DSC Q+S  F SSND
Subjt:  KAQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSND

Query:  FDLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKA
        F LNP TSESM DHHATNESQNIQIL +DG  +EEEP A NHRFSFELSD D L +S  SKPLESNEL V SSPIHEPF T KE SP G  TSN  EEK 
Subjt:  FDLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKA

Query:  KAEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        KA+G+EA++HQEHHS+ LGSVKEFNFDN NGSD   P INSDWW N
Subjt:  KAEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

A0A1S3BSY8 uncharacterized protein LOC103493162 isoform X2

6.6e-188

81.35

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP
        MRRR + D   D RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+ + H+NTL+SPDIVLPFAAP
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP

Query:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK
        PSSPVS LQSEPPSA QSPTA +SFTSLTANMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESI LTTPSSPEVPFAQF  PSLQK
Subjt:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF
         +SD+QY FP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DFAS GSQF NF LEVPPTL NLDK  IH+WRQ QS+DSC Q+S  F SSNDF
Subjt:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF

Query:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK
         LNP TSESM DHHATNESQNIQIL +DG  +EEEP A NHRFSFELSD D L +S  SKPLESNEL V SSPIHEPF T KE SP G  TSN  EEK K
Subjt:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK

Query:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        A+G+EA++HQEHHS+ LGSVKEFNFDN NGSD   P INSDWW N
Subjt:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

A0A5A7TUB1 Mucin-2

2.1e-186

80.67

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP
        MRRR + D   D RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+ + H+NTL+SPDIVLPFAAP
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP

Query:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK
        PSSPVS LQSEPPSA QSPTA +SFTSLTANMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESI LTTPSSPEVPFAQF  PS QK
Subjt:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF
         +SD+QY FP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DFAS GSQF NF L+VPPTL N+DK  IH+WRQ QS+DSC Q+S  F SSNDF
Subjt:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF

Query:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK
         LNP TSESM DHHATNESQNIQIL +DG  +EEEP A NHRFSFELSD D L +S  SKPLESNEL V SSPIHEPF T KE SP G  TSN  EEK K
Subjt:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK

Query:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        A+G+EA++HQEHHS+ LGSVKEFNFDN NGSD   P INSDWW N
Subjt:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

A0A5D3CYQ2 Mucin-2

6.6e-188

81.35

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP
        MRRR + D   D RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+ + H+NTL+SPDIVLPFAAP
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP

Query:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK
        PSSPVS LQSEPPSA QSPTA +SFTSLTANMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESI LTTPSSPEVPFAQF  PSLQK
Subjt:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF
         +SD+QY FP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DFAS GSQF NF LEVPPTL NLDK  IH+WRQ QS+DSC Q+S  F SSNDF
Subjt:  AQSDDQYPFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDF

Query:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK
         LNP TSESM DHHATNESQNIQIL +DG  +EEEP A NHRFSFELSD D L +S  SKPLESNEL V SSPIHEPF T KE SP G  TSN  EEK K
Subjt:  DLNPQTSESMSDHHATNESQNIQIL-NDGC-QEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAK

Query:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        A+G+EA++HQEHHS+ LGSVKEFNFDN NGSD   P INSDWW N
Subjt:  AEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

A0A6J1C828 uncharacterized protein At1g76660-like

6.2e-194

82.51

Show/hide

Query:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP
        MRRR +AD  ADL PVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS +   +NTL+SPDIVLPFAAP
Subjt:  MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAP

Query:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK
        PSSPVSFLQSEPPSATQSPTA LSFTSLTANMYSPDGPSSIFA+GPFAHETQLVSPPLNFST+TT+PST PFTPPESI LTTPSSPEVPFAQ+ QPS QK
Subjt:  PSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQF-QPSLQK

Query:  AQSDDQY-PFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSND
         +SD QY  FP DDFQSYQFYPGSP+SHLISPRSVISRSGASSPLPD DF  SGS FSNF +EVPPTLLNLD+  I  WR  QSSDSC QNS G+ SSND
Subjt:  AQSDDQY-PFP-DDFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSND

Query:  FDLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKA
        F LNPQTSES+SD+HA+NE  NIQIL DG Q +E AAANHRFSFELSDEDALL+S E+KPLESNELAV SSPIHEP  TAKETS VGG TSN TEE+ KA
Subjt:  FDLNPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKA

Query:  EGEEANEHQ--EHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN
        +GEE + HQ  EHHS+TLG+VKEFNFDNGNG D LKPNINS WWAN
Subjt:  EGEEANEHQ--EHHSITLGSVKEFNFDNGNGSDALKPNINSDWWAN

SwissProt top hits

e value

%identity

Alignment

Q9SRE5 Uncharacterized protein At1g76660

1.0e-31

48.56

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE----PSPSADDAHQ----NTLESPDIVLPFAAPPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSP
        Q++RWG C  ++ CF S K  KRI  A  +PE     +   + AHQ    N   +  I L   APPSSP SF  S  PS TQSP     + SL AN  SP
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE----PSPSADDAHQ----NTLESPDIVLPFAAPPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSP

Query:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFT-PPESILLTTPSSPEVPFAQFQPSLQKAQSDDQYPFPDDFQSYQFYPGSPISHLISPRSVI
         GP SS++A GP+AHETQLVSPP+ FST TTEPST PFT PPE   LT PSSP+VP+A+F  S    ++  +  + D   +Y  YPGSP S L SP S  
Subjt:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFT-PPESILLTTPSSPEVPFAQFQPSLQKAQSDDQYPFPDDFQSYQFYPGSPISHLISPRSVI

Query:  SRSGASSP
        S  G  SP
Subjt:  SRSGASSP

Arabidopsis top hits

e value

%identity

Alignment

AT1G63720.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT5G52430.1)

6.4e-50

51.71

Show/hide

Query:  NNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEP---SPSADDAHQNTLESPDIVLPFAAPPSSPVSFLQSEP
        NN F TI AAA AIA+ D R  +++ + +KR+W + WS+  CFGS +QRKRIG++VLVPEP   S S      +   S    LPF APPSSP SF QSEP
Subjt:  NNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEP---SPSADDAHQNTLESPDIVLPFAAPPSSPVSFLQSEP

Query:  PSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPP---ESILL--TTPSSPEVPFAQ-FQPSLQKAQSDDQY
        PSATQSP   LSF+ L  N        SIFAIGP+AHETQLVSPP+ FST TTEPS+ P TPP    SI L  TTPSSPEVPFAQ F  + Q      ++
Subjt:  PSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPP---ESILL--TTPSSPEVPFAQ-FQPSLQKAQSDDQY

Query:  PFPD--DFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLN
        P     +FQ YQ  PGSP+  LISP      SG +SP PD       S F +F +  PP LL+
Subjt:  PFPD--DFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLN

AT1G76660.1 FUNCTIONS IN: molecular_function unknown

7.1e-33

48.56

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE----PSPSADDAHQ----NTLESPDIVLPFAAPPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSP
        Q++RWG C  ++ CF S K  KRI  A  +PE     +   + AHQ    N   +  I L   APPSSP SF  S  PS TQSP     + SL AN  SP
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE----PSPSADDAHQ----NTLESPDIVLPFAAPPSSPVSFLQSEPPSATQSPTATLSFTSLTANMYSP

Query:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFT-PPESILLTTPSSPEVPFAQFQPSLQKAQSDDQYPFPDDFQSYQFYPGSPISHLISPRSVI
         GP SS++A GP+AHETQLVSPP+ FST TTEPST PFT PPE   LT PSSP+VP+A+F  S    ++  +  + D   +Y  YPGSP S L SP S  
Subjt:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFT-PPESILLTTPSSPEVPFAQFQPSLQKAQSDDQYPFPDDFQSYQFYPGSPISHLISPRSVI

Query:  SRSGASSP
        S  G  SP
Subjt:  SRSGASSP

AT4G25620.1 hydroxyproline-rich glycoprotein family protein

4.4e-43

37.04

Show/hide

Query:  LRPVNN-TFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS---ADDAHQNTLESPDIVLPFAAPPSSPVSFL
        +R VNN +  T+ AAA AI + + R  + ++VQK+R GS WS+YWCFGS K  KRIGHAVLVPEP+ S         ++  S  I +PF APPSSP SFL
Subjt:  LRPVNN-TFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPS---ADDAHQNTLESPDIVLPFAAPPSSPVSFL

Query:  QSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQ-FQPSLQKAQSDDQYP
         S PPSA+ +P   L   SLT N      P S F IGP+AHETQ V+PP+ FS  TTEPST PFTPP      +PSSPEVPFAQ    SL++A+ +    
Subjt:  QSEPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPPESILLTTPSSPEVPFAQ-FQPSLQKAQSDDQYP

Query:  FPD-------DFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDFDL
                  +F+S Q YPGSP  +LISP      SG SSP P             F +  PP  L  +      W     S S      G +      L
Subjt:  FPD-------DFQSYQFYPGSPISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSWRQGQSSDSCNQNSTGFTSSNDFDL

Query:  NPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPI-HEPFGTAKETSPVGGQTSNGTEEKA----
         P  S+  S     N ++ +  ++ G               ++S+  +L  S       ++E  VV   +  E  G             +G+ EKA    
Subjt:  NPQTSESMSDHHATNESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPI-HEPFGTAKETSPVGGQTSNGTEEKA----

Query:  ------KAEGE-EANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVKVRPPGPDHS
              K  GE E+ + Q+  S + GS KEF FD+ N  + +   I S+WWAN    KV   G DHS
Subjt:  ------KAEGE-EANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVKVRPPGPDHS

AT5G52430.1 hydroxyproline-rich glycoprotein family protein

3.1e-52

37.42

Show/hide

Query:  VNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADD--AHQNTLESPDIVLPFAAPPSSPVSFLQSEPP
        VNN+ +T+ AAA AI T + R  + ++ QK RWG CWS+Y CFG+ K  KRIG+AVLVPEP  S       QN+  S  +VLPF APPSSP SFLQS+P 
Subjt:  VNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADD--AHQNTLESPDIVLPFAAPPSSPVSFLQSEPP

Query:  SATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPP--ESILLTTPSSPEVPFAQ-FQPSLQKAQSDDQYPFPD
        S + SP   L   SLT+N +SP  P S+F +GP+A+ETQ V+PP+ FS   TEPST P+TPP   S+ +TTPSSPEVPFAQ    SL+  + D       
Subjt:  SATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPST-PFTPP--ESILLTTPSSPEVPFAQ-FQPSLQKAQSDDQYPFPD

Query:  -------DFQSYQFYPGSP-ISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSW--RQGQSSDSCNQNSTGFTSSNDFDL
               +F+S Q  PGSP   +LISP SVIS SG SSP P        S    F +  PP  L  +      W  R G  S +   + +G  S      
Subjt:  -------DFQSYQFYPGSP-ISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDK-QIHSW--RQGQSSDSCNQNSTGFTSSNDFDL

Query:  NPQ-TSESMSDHHAT----NESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKA
         P+  S +++ ++ T    N+   +  L +     E   A+HR SFEL+ ED                  ++S ++           +  + S+ T+ + 
Subjt:  NPQ-TSESMSDHHAT----NESQNIQILNDGCQEEEPAAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKA

Query:  KAEGEEANEHQEHHSI------TLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVK
          E    +   E H I      ++GS KEF FDN    +  K   NS  W+ F  ++
Subjt:  KAEGEEANEHQEHHSI------TLGSVKEFNFDNGNGSDALKPNINSDWWANFGSVK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGACGACGTGCGAATGCTGATGATGCTGCTGATCTGAGGCCTGTAAATAACACTTTTCAAACCATTACTGCAGCCGCCGATGCGATCGCCACCGTCGATCATCGTTT
TCCTCGGGCTACTGCCGTTCAGAAAAGAAGATGGGGCAGCTGTTGGAGTATTTATTGGTGCTTTGGATCTCTCAAACAGAGAAAACGAATTGGGCACGCTGTCCTGGTCC
CAGAACCAAGTCCTTCAGCTGATGATGCTCATCAAAATACATTGGAATCACCAGACATTGTGCTTCCTTTTGCTGCGCCTCCCTCTTCCCCTGTATCCTTCCTTCAATCA
GAGCCACCTTCTGCTACACAATCACCTACAGCTACACTCTCTTTCACTTCTCTCACTGCTAACATGTATTCTCCTGATGGGCCTTCCTCAATTTTTGCCATTGGCCCATT
TGCTCATGAAACACAACTAGTGTCTCCACCTCTGAATTTCTCTACTCTCACCACTGAACCATCAACTCCCTTCACTCCTCCTGAGTCTATACTCTTGACTACACCTTCTT
CCCCTGAAGTTCCTTTTGCTCAGTTTCAACCTAGCCTTCAGAAAGCTCAGTCTGATGACCAATATCCATTTCCTGATGACTTTCAATCTTATCAATTCTATCCCGGCAGC
CCAATCAGTCACCTCATATCACCACGCTCAGTCATTTCTCGTTCTGGGGCGTCGTCACCTTTGCCAGACTTGGATTTTGCTTCTTCTGGTTCTCAGTTTTCTAATTTTTC
ATTAGAAGTTCCACCTACGCTGTTGAACCTTGACAAGCAAATTCATAGCTGGCGACAAGGGCAAAGTTCTGATTCTTGCAATCAAAATTCTACAGGATTCACATCGAGTA
ATGATTTTGATTTGAATCCTCAAACTTCAGAATCTATGTCAGATCACCACGCAACAAATGAATCCCAAAATATTCAAATTCTCAATGATGGATGCCAAGAGGAGGAGCCT
GCTGCTGCTAATCATAGATTCTCATTTGAGTTATCTGATGAAGATGCTTTATTAAGAAGCGCAGAAAGTAAGCCACTGGAATCAAATGAACTTGCAGTTGTATCATCTCC
AATACACGAACCATTTGGAACGGCTAAAGAAACTTCTCCTGTTGGTGGTCAAACCTCAAATGGTACAGAAGAAAAGGCAAAAGCAGAGGGTGAAGAAGCAAATGAGCATC
AAGAACATCATTCCATTACTCTTGGGTCTGTGAAGGAATTCAATTTTGATAATGGCAATGGAAGTGATGCACTCAAGCCTAATATCAACTCAGACTGGTGGGCCAATTTT
GGGTCTGTGAAGGTACGGCCGCCGGGGCCTGATCATTCTTTCCAGACACAGGGAAGATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MRRRANADDAADLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPEPSPSADDAHQNTLESPDIVLPFAAPPSSPVSFLQS
EPPSATQSPTATLSFTSLTANMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTPFTPPESILLTTPSSPEVPFAQFQPSLQKAQSDDQYPFPDDFQSYQFYPGS
PISHLISPRSVISRSGASSPLPDLDFASSGSQFSNFSLEVPPTLLNLDKQIHSWRQGQSSDSCNQNSTGFTSSNDFDLNPQTSESMSDHHATNESQNIQILNDGCQEEEP
AAANHRFSFELSDEDALLRSAESKPLESNELAVVSSPIHEPFGTAKETSPVGGQTSNGTEEKAKAEGEEANEHQEHHSITLGSVKEFNFDNGNGSDALKPNINSDWWANF
GSVKVRPPGPDHSFQTQGR

Lag0019241 (gene) of Sponge gourd (AG-4) v1 genome