CuGenDBv2

Gene ID	PI0022261
Organism	Cucumis metuliferus PI 482460 (Melon (PI 482460) v1)
Description	Mucin-2
Genome location	chr07:4787607..4790416
RNA-Seq Expression	PI0022261
Synteny	PI0022261
Gene Ontology terms	NA
InterPro domains	IPR040420 - Uncharacterized protein At1g76660-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0044829.1 mucin-2 [Cucumis melo var. makuwa]

4.2e-253

95.91

Show/hide

Query:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTDT+DFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
        VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPS QKVESD
Subjt:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD

Query:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
        NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPL+VPPTL N+DKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD
         TSESM DHHATNESQN QILIDDGSK+ EEPGATN RFSFELSDGDVL QSVGSKPLESNEL VESSPIHEPFETTKENSPHGDHTSNVIEEKTK DGD
Subjt:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD

Query:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        EAHQHQEHHSV LGSVKEFNFDN NGSDTHNP INS+WWTNAKDGSTEGTTTGAWSFFP TQQR
Subjt:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

XP_004146564.1 uncharacterized protein LOC101220378 isoform X1 [Cucumis sativus]

6.1e-252

96.34

Show/hide

Query:  MRRRTDTEDFRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
        MRRRTDT+DFRPV NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGS+KQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
Subjt:  MRRRTDTEDFRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS

Query:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES
        PVSLLQSEPPSA+QSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQFV P+L KVES
Subjt:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES

Query:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
        DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
Subjt:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG
        PQTSESMSDHHATNESQN QILIDDGSKK EEPGATN RFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTK DG
Subjt:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG

Query:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        DEAHQ QEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWW NAKDGSTE T TG WSFFPMTQQR
Subjt:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

XP_008452032.1 PREDICTED: uncharacterized protein LOC103493162 isoform X1 [Cucumis melo]

3.2e-253

96.34

Show/hide

Query:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
        MRRRTDT+DFRPVNNTFQTITAAADAIATVDHRFPRATAV QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
Subjt:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS

Query:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES
        PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES
Subjt:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES

Query:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
        DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
Subjt:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG
        P TSESM DHHATNESQN QILIDDGSK+ EEPGATN RFSFELSDGDVL QSVGSKPLESNEL VESSPIHEPFETTKENSPHGDHTSNVIEEKTK DG
Subjt:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG

Query:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        DEAHQHQEHHSV LGSVKEFNFDN NGSDTHNP INS+WWTNAKDGSTEGTTTGAWSFFP TQQR
Subjt:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

XP_008452033.1 PREDICTED: uncharacterized protein LOC103493162 isoform X2 [Cucumis melo]

1.3e-254

96.55

Show/hide

Query:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTDT+DFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
        VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
Subjt:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD

Query:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
        NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD
         TSESM DHHATNESQN QILIDDGSK+ EEPGATN RFSFELSDGDVL QSVGSKPLESNEL VESSPIHEPFETTKENSPHGDHTSNVIEEKTK DGD
Subjt:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD

Query:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        EAHQHQEHHSV LGSVKEFNFDN NGSDTHNP INS+WWTNAKDGSTEGTTTGAWSFFP TQQR
Subjt:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

XP_031740284.1 uncharacterized protein LOC101220378 isoform X2 [Cucumis sativus]

2.3e-235

92.47

Show/hide

Query:  MRRRTDTEDFRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
        MRRRTDT+DFRPV NNTFQTITAAADAIATVDHRFPRATAV                   QRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
Subjt:  MRRRTDTEDFRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS

Query:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES
        PVSLLQSEPPSA+QSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQFV P+L KVES
Subjt:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES

Query:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
        DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
Subjt:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG
        PQTSESMSDHHATNESQN QILIDDGSKK EEPGATN RFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTK DG
Subjt:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG

Query:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        DEAHQ QEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWW NAKDGSTE T TG WSFFPMTQQR
Subjt:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BSB0 uncharacterized protein LOC103493162 isoform X1

1.6e-253

96.34

Show/hide

Query:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
        MRRRTDT+DFRPVNNTFQTITAAADAIATVDHRFPRATAV QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS
Subjt:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSS

Query:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES
        PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES
Subjt:  PVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVES

Query:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
        DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
Subjt:  DNQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG
        P TSESM DHHATNESQN QILIDDGSK+ EEPGATN RFSFELSDGDVL QSVGSKPLESNEL VESSPIHEPFETTKENSPHGDHTSNVIEEKTK DG
Subjt:  PQTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDG

Query:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        DEAHQHQEHHSV LGSVKEFNFDN NGSDTHNP INS+WWTNAKDGSTEGTTTGAWSFFP TQQR
Subjt:  DEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

A0A1S3BSY8 uncharacterized protein LOC103493162 isoform X2

6.3e-255

96.55

Show/hide

Query:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTDT+DFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
        VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
Subjt:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD

Query:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
        NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD
         TSESM DHHATNESQN QILIDDGSK+ EEPGATN RFSFELSDGDVL QSVGSKPLESNEL VESSPIHEPFETTKENSPHGDHTSNVIEEKTK DGD
Subjt:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD

Query:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        EAHQHQEHHSV LGSVKEFNFDN NGSDTHNP INS+WWTNAKDGSTEGTTTGAWSFFP TQQR
Subjt:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

A0A5A7TUB1 Mucin-2

2.0e-253

95.91

Show/hide

Query:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTDT+DFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
        VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPS QKVESD
Subjt:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD

Query:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
        NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPL+VPPTL N+DKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD
         TSESM DHHATNESQN QILIDDGSK+ EEPGATN RFSFELSDGDVL QSVGSKPLESNEL VESSPIHEPFETTKENSPHGDHTSNVIEEKTK DGD
Subjt:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD

Query:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        EAHQHQEHHSV LGSVKEFNFDN NGSDTHNP INS+WWTNAKDGSTEGTTTGAWSFFP TQQR
Subjt:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

A0A5D3CYQ2 Mucin-2

6.3e-255

96.55

Show/hide

Query:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTDT+DFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
        VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD
Subjt:  VSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESD

Query:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
        NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  NQYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD
         TSESM DHHATNESQN QILIDDGSK+ EEPGATN RFSFELSDGDVL QSVGSKPLESNEL VESSPIHEPFETTKENSPHGDHTSNVIEEKTK DGD
Subjt:  QTSESMSDHHATNESQNFQILIDDGSKK-EEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGD

Query:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR
        EAHQHQEHHSV LGSVKEFNFDN NGSDTHNP INS+WWTNAKDGSTEGTTTGAWSFFP TQQR
Subjt:  EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQR

A0A6J1C828 uncharacterized protein At1g76660-like

1.9e-206

80.56

Show/hide

Query:  MRRRTDTE---DFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPP
        MRRR D +   D  PVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPEPSPS+EP ENTLQSPDIVLPFAAPP
Subjt:  MRRRTDTE---DFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPP

Query:  SSPVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKV
        SSPVS LQSEPPSA QSPTA++SFTSLTANMYSPDGPSSIFA+GPFAHE QLVSPPLNFST+TT+PST PFTPPESIHLTTPSSPEVPFAQ++ PS QKV
Subjt:  SSPVSLLQSEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKV

Query:  ESDNQY-TFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDF
        ESD+QY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPD DF   GS F NFP+EVPPTLLNLD+HSI +WR +QS+DSCTQ+S+ +KSSNDF
Subjt:  ESDNQY-TFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDF

Query:  VLNPQTSESMSDHHATNESQNFQILIDDGSKKEEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKT
        VLNPQTSES+SD+HA+NE  N QIL  DGS+++E  A N RFSFELSD D LL+SV +KPLESNELAV SSPIHEP ET KE S  G HTSN  EE+ K 
Subjt:  VLNPQTSESMSDHHATNESQNFQILIDDGSKKEEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKT

Query:  DGDEAHQHQ--EHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQ
        DG+E H HQ  EHHSVTLG+VKEFNFDNGNG DT  PNINS WW N KD  TEGTTTGAWSFFP+TQQ
Subjt:  DGDEAHQHQ--EHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFPMTQQ

SwissProt top hits

e value

%identity

Alignment

Q9SRE5 Uncharacterized protein At1g76660

7.7e-32

48.1

Show/hide

Query:  QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPVSLLQSEPPSAIQSPTALISFTSLTANMYSP
        Q++RWG CL ++ CF S K  KRI  A  +PE     +S+P   H+    N   +  I L   APPSSP S   S  PS  QSP     + SL AN  SP
Subjt:  QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPVSLLQSEPPSAIQSPTALISFTSLTANMYSP

Query:  DGP-SSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFT-PPESIHLTTPSSPEVPFAQFVPPSLQKVESDNQYTFPNDDFQSYQFYPGSPVSHLISPRS
         GP SS++A GP+AHE QLVSPP+ FST TTEPST PFT PPE   LT PSSP+VP+A+F+  S+    S   +   ND   +Y  YPGSP S L SP S
Subjt:  DGP-SSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFT-PPESIHLTTPSSPEVPFAQFVPPSLQKVESDNQYTFPNDDFQSYQFYPGSPVSHLISPRS

Query:  VISRSGASSP
          S  G  SP
Subjt:  VISRSGASSP

Arabidopsis top hits

e value

%identity

Alignment

AT1G63720.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT5G52430.1)

2.1e-48

49.81

Show/hide

Query:  NNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENT----LQSPDIVLPFAAPPSSPVSLLQSEP
        NN F TI AAA AIA+ D R  +++ + +KR+W +  S+  CFGS +QRKRIG++VLVPEP   S  +  T     +S    LPF APPSSP S  QSEP
Subjt:  NNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENT----LQSPDIVLPFAAPPSSPVSLLQSEP

Query:  PSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPP---ESIHL--TTPSSPEVPFAQFVPPSLQKVESDNQY
        PSA QSP  ++SF+ L  N        SIFAIGP+AHE QLVSPP+ FST TTEPS+ P TPP    SI+L  TTPSSPEVPFAQ    + Q       Y
Subjt:  PSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPP---ESIHL--TTPSSPEVPFAQFVPPSLQKVESDNQY

Query:  TFP---NDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLN
         FP   + +FQ YQ  PGSP+  LISP      SG +SP PD +     S F +F +  PP LL+
Subjt:  TFP---NDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLN

AT1G76660.1 FUNCTIONS IN: molecular_function unknown

5.5e-33

48.1

Show/hide

Query:  QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPVSLLQSEPPSAIQSPTALISFTSLTANMYSP
        Q++RWG CL ++ CF S K  KRI  A  +PE     +S+P   H+    N   +  I L   APPSSP S   S  PS  QSP     + SL AN  SP
Subjt:  QKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPVSLLQSEPPSAIQSPTALISFTSLTANMYSP

Query:  DGP-SSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFT-PPESIHLTTPSSPEVPFAQFVPPSLQKVESDNQYTFPNDDFQSYQFYPGSPVSHLISPRS
         GP SS++A GP+AHE QLVSPP+ FST TTEPST PFT PPE   LT PSSP+VP+A+F+  S+    S   +   ND   +Y  YPGSP S L SP S
Subjt:  DGP-SSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFT-PPESIHLTTPSSPEVPFAQFVPPSLQKVESDNQYTFPNDDFQSYQFYPGSPVSHLISPRS

Query:  VISRSGASSP
          S  G  SP
Subjt:  VISRSGASSP

AT4G25620.1 hydroxyproline-rich glycoprotein family protein

3.0e-47

36.42

Show/hide

Query:  RPVNN-TFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSS---EPHEN-TLQSPDIVLPFAAPPSSPVSLLQ
        R VNN +  T+ AAA AI + + R  + ++VQK+R GS  S+YWCFGS K  KRIGHAVLVPEP+ S     P +N +  S  I +PF APPSSP S L 
Subjt:  RPVNN-TFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSS---EPHEN-TLQSPDIVLPFAAPPSSPVSLLQ

Query:  SEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESDN----
        S PPSA  +P   +   SLT N      P S F IGP+AHE Q V+PP+ FS  TTEPST PFTPP      +PSSPEVPFAQ +  SL++   ++    
Subjt:  SEPPSAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESDN----

Query:  --QYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN
          +++  + +F+S Q YPGSP  +LISP      SG SSP P           + F +  PP  L  +  +   W  R  + S T    +        L 
Subjt:  --QYTFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNESQNFQILIDDGSKKEEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKEN---------SPHGDHT----
        P  S+  S     N ++   I +  G+     G+       ++S+   L  S       ++E  V   P    FE T E+         +  G H     
Subjt:  PQTSESMSDHHATNESQNFQILIDDGSKKEEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKEN---------SPHGDHT----

Query:  SNVIEEKTKTDGD-EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAK-DGSTEGTTTGAWSFFPM
         ++     KT G+ E+ Q Q+  S + GS KEF FD+ N  +     I SEWW N K  G  + +   +W+FFP+
Subjt:  SNVIEEKTKTDGD-EAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAK-DGSTEGTTTGAWSFFPM

AT5G52430.1 hydroxyproline-rich glycoprotein family protein

4.2e-57

37.63

Show/hide

Query:  VNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEP---HENTLQSPDIVLPFAAPPSSPVSLLQSEPP
        VNN+ +T+ AAA AI T + R  + ++ QK RWG C S+Y CFG+ K  KRIG+AVLVPEP  S  P    +N+  S  +VLPF APPSSP S LQS+P 
Subjt:  VNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEP---HENTLQSPDIVLPFAAPPSSPVSLLQSEPP

Query:  SAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPP--ESIHLTTPSSPEVPFAQFVPPSLQKVESDN------
        S   SP   +   SLT+N +SP  P S+F +GP+A+E Q V+PP+ FS   TEPST P+TPP   S+H+TTPSSPEVPFAQ +  SL+    D+      
Subjt:  SAIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPP--ESIHLTTPSSPEVPFAQFVPPSLQKVESDN------

Query:  QYTFPNDDFQSYQFYPGSP-VSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP
        +++  + +F+S Q  PGSP   +LISP SVIS SG SSP P        S  + F +  PP  L  +  +   W  R  + S T             L P
Subjt:  QYTFPNDDFQSYQFYPGSP-VSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATN------ESQNFQIL-IDDGSKKEEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEK
           E +S +   N      ++Q  ++  + +     E    + R SFEL+  DV  + + SK   S++    +  I        E S   D   N IE++
Subjt:  QTSESMSDHHATN------ESQNFQIL-IDDGSKKEEPGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEK

Query:  TKTDGDEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFP
        +    +E H+ Q+  S ++GS KEF FD                  N KD + E     +WSFFP
Subjt:  TKTDGDEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTNAKDGSTEGTTTGAWSFFP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGACGACGTACGGATACTGAGGATTTCAGGCCTGTTAACAATACTTTTCAAACAATTACTGCCGCCGCTGATGCGATCGCAACCGTCGATCATCGTTTTCCTCGGGC
TACTGCCGTCCAGAAAAGAAGATGGGGCAGTTGTTTGAGTATTTATTGGTGCTTTGGATCTCTCAAACAGAGGAAAAGAATTGGGCATGCTGTATTGGTACCAGAACCAA
GTCCTTCATCTGAGCCTCATGAAAATACATTACAATCACCAGATATTGTGCTTCCTTTTGCTGCACCTCCTTCTTCCCCTGTTTCCTTACTTCAATCTGAACCACCCTCT
GCTATACAGTCGCCTACTGCTTTAATCTCTTTCACTTCTCTTACTGCTAACATGTATTCTCCTGATGGGCCTTCCTCCATTTTTGCCATTGGCCCATTTGCTCATGAACC
ACAATTAGTGTCTCCACCTCTGAATTTCTCTACTCTTACTACTGAACCATCAACTCCTCCCTTCACTCCTCCCGAATCTATCCACTTGACTACACCTTCTTCCCCTGAAG
TTCCTTTTGCTCAGTTTGTTCCGCCTAGTCTTCAGAAAGTTGAGTCTGATAATCAATATACATTTCCTAATGATGATTTTCAATCTTACCAATTCTATCCAGGTAGTCCG
GTTAGTCACCTCATATCACCACGGTCGGTTATTTCTCGTTCTGGGGCTTCATCGCCTTTGCCTGACTATGATTTTGCTTCCTTTGGTTCTCAATTTTTGAATTTCCCATT
AGAAGTTCCACCTACTTTGTTGAACCTTGACAAACATTCCATTCATAACTGGCGACAACGTCAAAGTACTGATTCTTGTACTCAAGATTCTATAGAATTCAAATCAAGTA
ATGACTTTGTTTTGAATCCCCAAACTTCAGAATCTATGTCTGATCACCACGCAACAAATGAATCTCAAAATTTTCAAATTCTCATCGATGATGGAAGCAAAAAGGAGGAG
CCAGGTGCTACTAATCCTAGATTCTCATTTGAGTTATCTGATGGAGATGTTTTATTACAAAGCGTAGGAAGTAAGCCATTGGAATCAAATGAACTTGCAGTTGAATCATC
GCCAATACATGAACCATTTGAAACGACTAAAGAAAATTCTCCTCATGGTGACCATACTTCAAATGTTATAGAAGAAAAGACAAAAACAGACGGTGATGAAGCACATCAGC
ATCAAGAACATCATTCCGTTACTCTTGGGTCTGTGAAGGAATTCAATTTTGATAATGGTAATGGAAGTGATACACATAACCCAAATATAAATTCAGAATGGTGGACTAAT
GCAAAGGATGGTAGCACAGAAGGCACAACCACCGGGGCCTGGTCATTCTTTCCAATGACGCAACAAAGATGA

mRNA sequence

Show/hide mRNA sequence

ATAGACTTTTTGAGAGTTCTATGTTTAAAAAATCTATTTAATTTAATTACATACTAATCTTTTTTTTAGTTATTATTTAATTTCATTTCATTTCCGTCTTCTTCCTTCTA
TCTCGCTAACGAACCTTCTCTTCACTTTCTTACTGCAAAGTCCCCTGTTTCGATTTTGCCTAAGAATTTCATGATCTCTTCTTTGTATGTGGAACTACGATTCTTCTTTC
TATGAAACCCATCGGCGATTCTCTGTTTCCAAGTAACGATAGCGATGAGACGACGTACGGATACTGAGGATTTCAGGCCTGTTAACAATACTTTTCAAACAATTACTGCC
GCCGCTGATGCGATCGCAACCGTCGATCATCGTTTTCCTCGGGCTACTGCCGTCCAGAAAAGAAGATGGGGCAGTTGTTTGAGTATTTATTGGTGCTTTGGATCTCTCAA
ACAGAGGAAAAGAATTGGGCATGCTGTATTGGTACCAGAACCAAGTCCTTCATCTGAGCCTCATGAAAATACATTACAATCACCAGATATTGTGCTTCCTTTTGCTGCAC
CTCCTTCTTCCCCTGTTTCCTTACTTCAATCTGAACCACCCTCTGCTATACAGTCGCCTACTGCTTTAATCTCTTTCACTTCTCTTACTGCTAACATGTATTCTCCTGAT
GGGCCTTCCTCCATTTTTGCCATTGGCCCATTTGCTCATGAACCACAATTAGTGTCTCCACCTCTGAATTTCTCTACTCTTACTACTGAACCATCAACTCCTCCCTTCAC
TCCTCCCGAATCTATCCACTTGACTACACCTTCTTCCCCTGAAGTTCCTTTTGCTCAGTTTGTTCCGCCTAGTCTTCAGAAAGTTGAGTCTGATAATCAATATACATTTC
CTAATGATGATTTTCAATCTTACCAATTCTATCCAGGTAGTCCGGTTAGTCACCTCATATCACCACGGTCGGTTATTTCTCGTTCTGGGGCTTCATCGCCTTTGCCTGAC
TATGATTTTGCTTCCTTTGGTTCTCAATTTTTGAATTTCCCATTAGAAGTTCCACCTACTTTGTTGAACCTTGACAAACATTCCATTCATAACTGGCGACAACGTCAAAG
TACTGATTCTTGTACTCAAGATTCTATAGAATTCAAATCAAGTAATGACTTTGTTTTGAATCCCCAAACTTCAGAATCTATGTCTGATCACCACGCAACAAATGAATCTC
AAAATTTTCAAATTCTCATCGATGATGGAAGCAAAAAGGAGGAGCCAGGTGCTACTAATCCTAGATTCTCATTTGAGTTATCTGATGGAGATGTTTTATTACAAAGCGTA
GGAAGTAAGCCATTGGAATCAAATGAACTTGCAGTTGAATCATCGCCAATACATGAACCATTTGAAACGACTAAAGAAAATTCTCCTCATGGTGACCATACTTCAAATGT
TATAGAAGAAAAGACAAAAACAGACGGTGATGAAGCACATCAGCATCAAGAACATCATTCCGTTACTCTTGGGTCTGTGAAGGAATTCAATTTTGATAATGGTAATGGAA
GTGATACACATAACCCAAATATAAATTCAGAATGGTGGACTAATGCAAAGGATGGTAGCACAGAAGGCACAACCACCGGGGCCTGGTCATTCTTTCCAATGACGCAACAA
AGATGAGCAAACTGGGGCAGTTGCAAATTGATAGGCAAGACAAACAGCAAGAGGAATGGTTAGTTTTGAGGTTTTAAAGATGTCAAATTATGAAAGAGCCTGACCAGAAG
CCTTTTTTTTTTCAACAATATGACCTAAAACAAACAAAGCCAGATATTAGTGGAGAGAACGATAGAGAAATTGTATATTCAGTAGGACCTTATTAACTAACAAACACTCG
TGGCTTGCGACTCGGTCACTTGAATTGTAATAGATATCAATAGTCTGATAGAGATTGAAAGCATGTAAATATGGTAATAAGAAGTTTTTTTTTTATCTTCACAATATTTT
GATTATTGATTTTGAATTAGTTTGTAGAATACACAAAGTTGAGAACGTATTGAGTTGGGTTATACCTAGAAATGTTTCATTCATAAGTTG

Protein sequence

Show/hide protein sequence

MRRRTDTEDFRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCLSIYWCFGSLKQRKRIGHAVLVPEPSPSSEPHENTLQSPDIVLPFAAPPSSPVSLLQSEPPS
AIQSPTALISFTSLTANMYSPDGPSSIFAIGPFAHEPQLVSPPLNFSTLTTEPSTPPFTPPESIHLTTPSSPEVPFAQFVPPSLQKVESDNQYTFPNDDFQSYQFYPGSP
VSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWRQRQSTDSCTQDSIEFKSSNDFVLNPQTSESMSDHHATNESQNFQILIDDGSKKEE
PGATNPRFSFELSDGDVLLQSVGSKPLESNELAVESSPIHEPFETTKENSPHGDHTSNVIEEKTKTDGDEAHQHQEHHSVTLGSVKEFNFDNGNGSDTHNPNINSEWWTN
AKDGSTEGTTTGAWSFFPMTQQR

PI0022261 (gene) of Melon (PI 482460) v1 genome