CuGenDBv2

Gene ID	Clc07G07590
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	Mucin-2
Genome location	ClcChr07:20044841..20047771
RNA-Seq Expression	Clc07G07590
Synteny	Clc07G07590
Gene Ontology terms	NA
InterPro domains	IPR040420 - Uncharacterized protein At1g76660-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0044829.1 mucin-2 [Cucumis melo var. makuwa]

9.1e-232

88.79

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD
         S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+ P+  K ESD
Subjt:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD

Query:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP
        +QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPL+VPPTL N+DKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE
         TSESM DHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVL QSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG+
Subjt:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE

Query:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        EAHQHQEHHS+ LGSVKEFNFDN NGSDTH P INS+WWTNAKD  TEGTTT AWSFFP  QQR
Subjt:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

XP_004146564.1 uncharacterized protein LOC101220378 isoform X1 [Cucumis sativus]

7.5e-234

90.32

Show/hide

Query:  MRRRTDADDLRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSS
        MRRRTD DD RPV NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGS+KQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSS
Subjt:  MRRRTDADDLRPV-NNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSS

Query:  PASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPES
        P S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+QPTL K ES
Subjt:  PASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPES

Query:  DHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN
        D+QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLN
Subjt:  DHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADG
        PQTSESMSDHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVLLQSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG
Subjt:  PQTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADG

Query:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        +EAHQ QEHHS+TLGSVKEFNFDNGNGSDTH PNINSEWW NAKD  TE T T  WSFFPM QQR
Subjt:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

XP_008452032.1 PREDICTED: uncharacterized protein LOC103493162 isoform X1 [Cucumis melo]

7.0e-232

89.25

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSS
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAV QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSS
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSS

Query:  PASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPES
        P S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+ P+L K ES
Subjt:  PASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPES

Query:  DHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN
        D+QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLN
Subjt:  DHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADG
        P TSESM DHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVL QSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG
Subjt:  PQTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADG

Query:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        +EAHQHQEHHS+ LGSVKEFNFDN NGSDTH P INS+WWTNAKD  TEGTTT AWSFFP  QQR
Subjt:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

XP_008452033.1 PREDICTED: uncharacterized protein LOC103493162 isoform X2 [Cucumis melo]

2.8e-233

89.44

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD
         S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+ P+L K ESD
Subjt:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD

Query:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP
        +QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE
         TSESM DHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVL QSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG+
Subjt:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE

Query:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        EAHQHQEHHS+ LGSVKEFNFDN NGSDTH P INS+WWTNAKD  TEGTTT AWSFFP  QQR
Subjt:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

XP_038884079.1 uncharacterized protein LOC120075005 isoform X2 [Benincasa hispida]

9.7e-242

92.26

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSE HEN+LQSPDIVLPFAAPPSSP
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD
         SFLQS+PPSATQSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTL K ESD
Subjt:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD

Query:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP
        HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDK SIHNW QRQSTDSCTQDSIE KSSNDFVLNP
Subjt:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNKSQNIQILIDGSQTEEE-PAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPI-GDHTSNVTGEKTKADG
        QTSESMSDHHATN+SQNIQILIDG+Q EEE P ATNHRFSFELSDGD LLQSVGSKPL+SNE+ VASSPIHEP ETAKENSP+  DHTSNVT  KTKA+ 
Subjt:  QTSESMSDHHATNKSQNIQILIDGSQTEEE-PAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPI-GDHTSNVTGEKTKADG

Query:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHK N+NSEWWTNAKDVDTEGTT  AWSFFPM QQR
Subjt:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BSB0 uncharacterized protein LOC103493162 isoform X1

3.4e-232

89.25

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSS
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAV QKRRWGSC SIYWCFGSLKQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSS
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSS

Query:  PASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPES
        P S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+ P+L K ES
Subjt:  PASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPES

Query:  DHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN
        D+QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLN
Subjt:  DHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADG
        P TSESM DHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVL QSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG
Subjt:  PQTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADG

Query:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        +EAHQHQEHHS+ LGSVKEFNFDN NGSDTH P INS+WWTNAKD  TEGTTT AWSFFP  QQR
Subjt:  EEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

A0A1S3BSY8 uncharacterized protein LOC103493162 isoform X2

1.4e-233

89.44

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD
         S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+ P+L K ESD
Subjt:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD

Query:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP
        +QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE
         TSESM DHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVL QSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG+
Subjt:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE

Query:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        EAHQHQEHHS+ LGSVKEFNFDN NGSDTH P INS+WWTNAKD  TEGTTT AWSFFP  QQR
Subjt:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

A0A5A7TUB1 Mucin-2

4.4e-232

88.79

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD
         S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+ P+  K ESD
Subjt:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD

Query:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP
        +QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPL+VPPTL N+DKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE
         TSESM DHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVL QSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG+
Subjt:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE

Query:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        EAHQHQEHHS+ LGSVKEFNFDN NGSDTH P INS+WWTNAKD  TEGTTT AWSFFP  QQR
Subjt:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

A0A5D3CYQ2 Mucin-2

1.4e-233

89.44

Show/hide

Query:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP
        MRRRTD DD RPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSC SIYWCFGSLKQRKRIGHAVLVPE SPSSEPHENTLQSPDIVLPFAAPPSSP
Subjt:  MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSP

Query:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD
         S LQS+PPSA QSPT LISF+SLT+NMYSPDGPSSIFAIGPFAHE QLVSPPLNFSTLTTEPST PFTPPESIHLTTPSSPEVPFAQF+ P+L K ESD
Subjt:  ASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESD

Query:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP
        +QY FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTL NLDKHSIHNW QRQSTDSCTQDSIEFKSSNDFVLNP
Subjt:  HQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNP

Query:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE
         TSESM DHHATN+SQNIQILI DGS+ EEEP ATNHRFSFELSDGDVL QSVGSKPLESNEL V SSPIHEP ET KENSP GDHTSNV  EKTKADG+
Subjt:  QTSESMSDHHATNKSQNIQILI-DGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGE

Query:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR
        EAHQHQEHHS+ LGSVKEFNFDN NGSDTH P INS+WWTNAKD  TEGTTT AWSFFP  QQR
Subjt:  EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQR

A0A6J1C828 uncharacterized protein At1g76660-like

1.1e-211

81.62

Show/hide

Query:  MRRRTDAD---DLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPP
        MRRR DAD   DL PVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE SPS+EP ENTLQSPDIVLPFAAPP
Subjt:  MRRRTDAD---DLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPP

Query:  SSPASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKP
        SSP SFLQS+PPSATQSPT ++SF+SLT+NMYSPDGPSSIFA+GPFAHETQLVSPPLNFST+TT+PSTAPFTPPESIHLTTPSSPEVPFAQ+LQP+  K 
Subjt:  SSPASFLQSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKP

Query:  ESDHQY-PFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDF
        ESDHQY  FPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPD DF   GS F NFP+EVPPTLLNLD+HSI +W  +QS+DSCTQ+S+ +KSSNDF
Subjt:  ESDHQY-PFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDF

Query:  VLNPQTSESMSDHHATNKSQNIQILIDGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKA
        VLNPQTSES+SD+HA+N+  NIQIL DGSQ  +E AA NHRFSFELSD D LL+SV +KPLESNEL VASSPIHEP ETAKE S +G HTSN T E+ KA
Subjt:  VLNPQTSESMSDHHATNKSQNIQILIDGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKA

Query:  DGEEAHQHQ--EHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQ
        DGEE H HQ  EHHS+TLG+VKEFNFDNGNG DT KPNINS WW N KD +TEGTTT AWSFFP+ QQ
Subjt:  DGEEAHQHQ--EHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFPMAQQ

SwissProt top hits

e value

%identity

Alignment

Q9SRE5 Uncharacterized protein At1g76660

4.1e-33

49.52

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPASFLQSDPPSATQSPTPLISFSSLTSNMYSP
        Q++RWG C  ++ CF S K  KRI  A  +PE     +S+P   H+    N   +  I L   APPSSPASF  S  PS TQSP     + SL +N  SP
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPASFLQSDPPSATQSPTPLISFSSLTSNMYSP

Query:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFT-PPESIHLTTPSSPEVPFAQFLQPTLHKPESDHQYPFPNDDFQSYQFYPGSPVSHLISPRS
         GP SS++A GP+AHETQLVSPP+ FST TTEPSTAPFT PPE   LT PSSP+VP+A+FL  ++    S   +   ND   +Y  YPGSP S L SP S
Subjt:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFT-PPESIHLTTPSSPEVPFAQFLQPTLHKPESDHQYPFPNDDFQSYQFYPGSPVSHLISPRS

Query:  VISRSGASSP
          S  G  SP
Subjt:  VISRSGASSP

Arabidopsis top hits

e value

%identity

Alignment

AT1G63720.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT5G52430.1)

1.1e-52

51.33

Show/hide

Query:  NNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE----SSPSSEPHENTLQSPDIVLPFAAPPSSPASFLQSDP
        NN F TI AAA AIA+ D R  +++ + +KR+W + WS+  CFGS +QRKRIG++VLVPE    SS +S    +  +S    LPF APPSSPASF QS+P
Subjt:  NNTFQTITAAADAIATVDHRFPRATAV-QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPE----SSPSSEPHENTLQSPDIVLPFAAPPSSPASFLQSDP

Query:  PSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPP---ESIHL--TTPSSPEVPFAQFLQPTLHKPESDHQY
        PSATQSP  ++SFS L  N        SIFAIGP+AHETQLVSPP+ FST TTEPS+AP TPP    SI+L  TTPSSPEVPFAQ            +++
Subjt:  PSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPP---ESIHL--TTPSSPEVPFAQFLQPTLHKPESDHQY

Query:  PFPND-DFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLN
        P  +  +FQ YQ  PGSP+  LISP      SG +SP PD +     S F +F +  PP LL+
Subjt:  PFPND-DFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLN

AT1G76660.1 FUNCTIONS IN: molecular_function unknown

2.9e-34

49.52

Show/hide

Query:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPASFLQSDPPSATQSPTPLISFSSLTSNMYSP
        Q++RWG C  ++ CF S K  KRI  A  +PE     +S+P   H+    N   +  I L   APPSSPASF  S  PS TQSP     + SL +N  SP
Subjt:  QKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESS--PSSEP---HE----NTLQSPDIVLPFAAPPSSPASFLQSDPPSATQSPTPLISFSSLTSNMYSP

Query:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFT-PPESIHLTTPSSPEVPFAQFLQPTLHKPESDHQYPFPNDDFQSYQFYPGSPVSHLISPRS
         GP SS++A GP+AHETQLVSPP+ FST TTEPSTAPFT PPE   LT PSSP+VP+A+FL  ++    S   +   ND   +Y  YPGSP S L SP S
Subjt:  DGP-SSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFT-PPESIHLTTPSSPEVPFAQFLQPTLHKPESDHQYPFPNDDFQSYQFYPGSPVSHLISPRS

Query:  VISRSGASSP
          S  G  SP
Subjt:  VISRSGASSP

AT4G25620.1 hydroxyproline-rich glycoprotein family protein

3.6e-53

37.4

Show/hide

Query:  LRPVNN-TFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSS---EPHEN-TLQSPDIVLPFAAPPSSPASFL
        +R VNN +  T+ AAA AI + + R  + ++VQK+R GS WS+YWCFGS K  KRIGHAVLVPE + S     P +N +  S  I +PF APPSSPASFL
Subjt:  LRPVNN-TFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSS---EPHEN-TLQSPDIVLPFAAPPSSPASFL

Query:  QSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPE------
         S PPSA+ +P P +   SLT N      P S F IGP+AHETQ V+PP+ FS  TTEPSTAPFTPP      +PSSPEVPFAQ L  +L +        
Subjt:  QSDPPSATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPE------

Query:  SDHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDS--------------CT
         + ++   + +F+S Q YPGSP  +LISP      SG SSP P           + F +  PP  L  +  +   W  R  + S               T
Subjt:  SDHQYPFPNDDFQSYQFYPGSPVSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDS--------------CT

Query:  QDSIEFKSSNDFVLNPQTSESMSDHHATNKSQNIQILID---------------GSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPI
         D  +  S    V+ P  +E++      N +     L+D                S+  +E     HR SFEL+  DV  + + SK        +  S  
Subjt:  QDSIEFKSSNDFVLNPQTSESMSDHHATNKSQNIQILID---------------GSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPI

Query:  HEPSETAKENSPIGDHTSNVTGEKTKADGE-EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTR-AWSFFPM
        HE +         G+H   +     K  GE E+ Q Q+  S + GS KEF FD+ N     K  I SEWW N K       + R +W+FFP+
Subjt:  HEPSETAKENSPIGDHTSNVTGEKTKADGE-EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTR-AWSFFPM

AT5G52430.1 hydroxyproline-rich glycoprotein family protein

5.6e-62

40.38

Show/hide

Query:  VNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEP---HENTLQSPDIVLPFAAPPSSPASFLQSDPP
        VNN+ +T+ AAA AI T + R  + ++ QK RWG CWS+Y CFG+ K  KRIG+AVLVPE   S  P    +N+  S  +VLPF APPSSPASFLQSDP 
Subjt:  VNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEP---HENTLQSPDIVLPFAAPPSSPASFLQSDPP

Query:  SATQSPT-PLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPP--ESIHLTTPSSPEVPFAQFLQPTLHKPESD------
        S + SP  PL    SLTSN +SP  P S+F +GP+A+ETQ V+PP+ FS   TEPSTAP+TPP   S+H+TTPSSPEVPFAQ L  +L     D      
Subjt:  SATQSPT-PLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPP--ESIHLTTPSSPEVPFAQFLQPTLHKPESD------

Query:  HQYPFPNDDFQSYQFYPGSP-VSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN
         ++   + +F+S Q  PGSP   +LISP SVIS SG SSP P        S  + F +  PP  L  +  +   W  R  + S T             L 
Subjt:  HQYPFPNDDFQSYQFYPGSP-VSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLN

Query:  PQTSESMSDHHATNKS----QNIQI----LIDGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTG
        P   E +S +   N +    QN QI     +  S    E    +HR SFEL+  DV  + + SK      L  +   ++       E S   D   N+  
Subjt:  PQTSESMSDHHATNKS----QNIQI----LIDGSQTEEEPAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTG

Query:  EKTKADGE-EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFP
        EK   D E E H+ Q+  S ++GS KEF FD                  N KD + E     +WSFFP
Subjt:  EKTKADGE-EAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTNAKDVDTEGTTTRAWSFFP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGACGACGTACGGATGCTGATGATTTGAGGCCTGTTAACAATACTTTCCAAACCATTACTGCCGCCGCTGATGCGATCGCCACTGTTGATCATCGTTTTCCTCGGGC
TACTGCCGTCCAGAAAAGAAGATGGGGCAGTTGTTGGAGTATTTATTGGTGCTTTGGATCCCTCAAACAGAGGAAAAGAATTGGGCACGCTGTTTTGGTACCAGAATCAA
GTCCTTCATCTGAGCCTCATGAAAATACATTGCAATCACCAGATATTGTGCTTCCTTTTGCTGCACCTCCCTCTTCCCCTGCATCCTTCCTTCAATCTGACCCACCTTCT
GCTACACAGTCACCTACACCTTTAATTTCTTTCTCTTCTCTCACTTCTAACATGTATTCTCCTGATGGGCCTTCCTCCATTTTTGCCATTGGCCCATTTGCTCATGAAAC
ACAACTAGTTTCTCCACCTCTCAATTTCTCTACTCTCACGACTGAACCATCAACTGCTCCCTTCACTCCTCCTGAGTCTATTCACTTGACTACCCCTTCTTCCCCTGAAG
TTCCTTTTGCTCAGTTTCTTCAACCTACCCTCCACAAACCTGAGTCTGATCATCAATATCCATTTCCTAATGATGACTTCCAATCTTACCAATTCTATCCAGGCAGTCCG
GTTAGTCACCTCATATCACCACGGTCCGTGATTTCTCGTTCTGGGGCTTCGTCGCCTTTGCCTGACTATGATTTTGCTTCCTTTGGTTCTCAATTTTTGAATTTCCCATT
AGAAGTTCCACCTACTTTGTTGAATCTTGACAAGCATTCCATTCATAACTGGCCACAACGCCAGAGTACTGATTCTTGCACTCAAGATTCTATAGAATTCAAATCAAGTA
ATGATTTTGTTTTGAATCCCCAAACTTCAGAATCTATGTCAGATCACCACGCAACAAATAAATCTCAAAATATTCAAATTCTCATTGATGGAAGCCAAACGGAGGAGGAG
CCAGCTGCTACTAATCATAGATTCTCATTTGAATTATCTGATGGAGATGTTCTATTACAAAGCGTAGGAAGTAAGCCACTGGAATCAAATGAACTTACTGTTGCATCGTC
TCCAATACATGAACCATCTGAAACGGCTAAAGAAAATTCTCCTATTGGTGACCATACTTCAAATGTTACAGGAGAAAAGACAAAAGCAGACGGTGAAGAAGCACATCAGC
ATCAAGAACATCATTCCATTACTCTTGGATCTGTGAAGGAATTCAATTTTGATAATGGCAATGGAAGTGATACACATAAGCCAAATATAAATTCAGAATGGTGGACTAAT
GCAAAGGATGTTGACACAGAAGGCACGACCACGAGGGCCTGGTCATTCTTTCCAATGGCGCAGCAAAGATGA

mRNA sequence

Show/hide mRNA sequence

CTACTCTCACTTTCACTTCTTAATTCCTTTTCTTAATTATAATTACATAATAATATTATTTATTATTTCATTTCATTTCCGTCTTCTTCTTCTTCCTTCTCTCTCGCTAA
CGAACCTTCTCTTCACTTTCTTACTGCAAAATCTCTTGTTTTGATTTTGCCTAAGAATTTCATCTCATGATCTCTTGTGTATGATAGGAACCACGATTCTTTCTATGAAA
CCGATCGGCAATTCTCTGGCTAGCGATGAGACGACGTACGGATGCTGATGATTTGAGGCCTGTTAACAATACTTTCCAAACCATTACTGCCGCCGCTGATGCGATCGCCA
CTGTTGATCATCGTTTTCCTCGGGCTACTGCCGTCCAGAAAAGAAGATGGGGCAGTTGTTGGAGTATTTATTGGTGCTTTGGATCCCTCAAACAGAGGAAAAGAATTGGG
CACGCTGTTTTGGTACCAGAATCAAGTCCTTCATCTGAGCCTCATGAAAATACATTGCAATCACCAGATATTGTGCTTCCTTTTGCTGCACCTCCCTCTTCCCCTGCATC
CTTCCTTCAATCTGACCCACCTTCTGCTACACAGTCACCTACACCTTTAATTTCTTTCTCTTCTCTCACTTCTAACATGTATTCTCCTGATGGGCCTTCCTCCATTTTTG
CCATTGGCCCATTTGCTCATGAAACACAACTAGTTTCTCCACCTCTCAATTTCTCTACTCTCACGACTGAACCATCAACTGCTCCCTTCACTCCTCCTGAGTCTATTCAC
TTGACTACCCCTTCTTCCCCTGAAGTTCCTTTTGCTCAGTTTCTTCAACCTACCCTCCACAAACCTGAGTCTGATCATCAATATCCATTTCCTAATGATGACTTCCAATC
TTACCAATTCTATCCAGGCAGTCCGGTTAGTCACCTCATATCACCACGGTCCGTGATTTCTCGTTCTGGGGCTTCGTCGCCTTTGCCTGACTATGATTTTGCTTCCTTTG
GTTCTCAATTTTTGAATTTCCCATTAGAAGTTCCACCTACTTTGTTGAATCTTGACAAGCATTCCATTCATAACTGGCCACAACGCCAGAGTACTGATTCTTGCACTCAA
GATTCTATAGAATTCAAATCAAGTAATGATTTTGTTTTGAATCCCCAAACTTCAGAATCTATGTCAGATCACCACGCAACAAATAAATCTCAAAATATTCAAATTCTCAT
TGATGGAAGCCAAACGGAGGAGGAGCCAGCTGCTACTAATCATAGATTCTCATTTGAATTATCTGATGGAGATGTTCTATTACAAAGCGTAGGAAGTAAGCCACTGGAAT
CAAATGAACTTACTGTTGCATCGTCTCCAATACATGAACCATCTGAAACGGCTAAAGAAAATTCTCCTATTGGTGACCATACTTCAAATGTTACAGGAGAAAAGACAAAA
GCAGACGGTGAAGAAGCACATCAGCATCAAGAACATCATTCCATTACTCTTGGATCTGTGAAGGAATTCAATTTTGATAATGGCAATGGAAGTGATACACATAAGCCAAA
TATAAATTCAGAATGGTGGACTAATGCAAAGGATGTTGACACAGAAGGCACGACCACGAGGGCCTGGTCATTCTTTCCAATGGCGCAGCAAAGATGAGCTGACTCGTGCT
AACTTATCCTCTGGAATCTCCTCATGTCCATCATCCTTTGCAGTTTCAAATTGATAGGTAAGACAAACTGCAAGAGGAATGGTGGGTTTTGTAGGTATTAAAGAGGCCGT
CAAATCATGAGAGAGCCAGACCAGAATGATAGAGAAATTTGTTGATTCGGTTGGGCCTTATTAACAAACAATTGTGGCTCGTCACCTGAATTGTCATAGATATTAGTAGT
CTGATAGATATTGGAAGTGTGTAAATATGGTAATAAAAAGTGTTATTTTTTCTTTTTATCTTCACAATATCTCGTTTATTGACTTTGAATTAGCAGAATACACAAAAAGT
TGAGAACATATTGAGTTTGGGATACCCAAAAATTGCAAAAACTTTTTGTAAATAGATTGCTTCATTCTATGAAATGAATGAGTTGTAAATAGAATAAGAATTGTGATCGC
TACAGTTTTGAAGTCTCTTTTTTCATACTTCAGGCTAAGTCTCAAATGCATGAGTTGGGAGAAGAATTGGGATTGCTATAACTATGTTCGTCGTTTGAATAATATTCTAA
TCCAATATTTGGC

Protein sequence

Show/hide protein sequence

MRRRTDADDLRPVNNTFQTITAAADAIATVDHRFPRATAVQKRRWGSCWSIYWCFGSLKQRKRIGHAVLVPESSPSSEPHENTLQSPDIVLPFAAPPSSPASFLQSDPPS
ATQSPTPLISFSSLTSNMYSPDGPSSIFAIGPFAHETQLVSPPLNFSTLTTEPSTAPFTPPESIHLTTPSSPEVPFAQFLQPTLHKPESDHQYPFPNDDFQSYQFYPGSP
VSHLISPRSVISRSGASSPLPDYDFASFGSQFLNFPLEVPPTLLNLDKHSIHNWPQRQSTDSCTQDSIEFKSSNDFVLNPQTSESMSDHHATNKSQNIQILIDGSQTEEE
PAATNHRFSFELSDGDVLLQSVGSKPLESNELTVASSPIHEPSETAKENSPIGDHTSNVTGEKTKADGEEAHQHQEHHSITLGSVKEFNFDNGNGSDTHKPNINSEWWTN
AKDVDTEGTTTRAWSFFPMAQQR

Clc07G07590 (gene) of Watermelon (cordophanus) v2 genome