CuGenDBv2

Gene ID	CcUC11G221990
Organism	Citrullus colocynthis (Watermelon (PI 537277) v1)
Description	HTH myb-type domain-containing protein
Genome location	CicolChr11:26421009..26434175
RNA-Seq Expression	CcUC11G221990
Synteny	CcUC11G221990
Gene Ontology terms	NA
InterPro domains	IPR001005 - SANT/Myb domain IPR009057 - Homeobox-like domain superfamily IPR017930 - Myb domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6591699.1 hypothetical protein SDJN03_14045, partial [Cucurbita argyrosperma subsp. sororia]

1.4e-217

82.07

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MIE KEKQ+ GTIS ED S +LERYSVRTIFTLLREVA VS VRIDWDKLVKNTSTGIS+VREYQLLWRHLAYRHTLLEN+DSVTDPLDYDSDLDFEIEP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA
        FPSVS+ES NEAAACVKVLIANGIPSESDVPSSS VEAPLTI I SNS++   +L+NPQ ACLMQGM VT+P+SIQRQP+P  +ATEVFDVNG AG NAA
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA

Query:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN
        S+KRRKPWSK EDLELMAAVEK GEGNWANILK DFKGDRTASQLSQRWSIIRKRHGNLNVGA+TTST   KAQIDAAHRALS ALDLPVNNSK+AANSN
Subjt:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN

Query:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC
        +NSS VSS SGAEA VQ+QNQSPQ+ +PSRPL V+PLPSA KSGINT+KN+L+MKSTHNSDSIV ATAVAAGARIVSPS AASL+KAAQTK AIHIKSKC
Subjt:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC

Query:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT
        +SS Q PV+GNA  HLD  PSVHYIS G+T TPGSN+VGGKSTM  NNSMK VSPK  +N STA+LTNPPS+++SPTTESPLKQEV  SEE KI KP+IT
Subjt:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT

Query:  AK
         K
Subjt:  AK

KAG7024581.1 hypothetical protein SDJN02_13399, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.1e-217

81.87

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MIE KEKQ+ GTIS ED S +LERYSVRTIFTLLREVA VS VRIDWDKLVKNTSTGIS+VREYQLLWRHLAYRHTLLEN+DSVTDPLDYDSDLDFEIEP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA
        FPSVS+ES NEAAACVKVLIANGIPSESDVPSSS VEAPLTI I SNS++   +L+NPQ ACLMQGM VT+P+SIQRQP+P  +ATEVFDVNG AG+NAA
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA

Query:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN
        S+KRRKPWSK EDLELMAAVEK GEGNWANILK DFKGDRTASQLSQRWSIIRKRHGNLNVGA+TTST   KAQIDAAHRALS ALD PVNNSK+AANSN
Subjt:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN

Query:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC
        +NSS VSS SGAEA VQ+QNQSPQ+ +PSRPL V+PLPSA KSGINT+KN+L+MKSTHNSDSIVRATAVAAGARIVSPS AASL+KAAQTK AIHIKSKC
Subjt:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC

Query:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT
        +SS Q P++GNA  HLD  PSVHYIS G+T TPGSN+VGGKSTM  NNSMK VSPK  +N STA+LTNPPS+++SPTTESPLKQEV  SEE KI KP+IT
Subjt:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT

Query:  AK
         K
Subjt:  AK

XP_022937359.1 uncharacterized protein LOC111443670 isoform X1 [Cucurbita moschata]

6.3e-218

81.87

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MIE KEKQ+ GTIS ED S +LERYSVRTIFTLLREVA VS VRIDWDKLVKNTSTGIS+VREYQLLWRHLAYRHTLLEN+DSVTDPLDYDSDLDFEIEP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA
        FPSVS+ES NEAAACVKVLIANGIPSESDVPSSS VEAPLTI I SNS++   +L+NPQ ACLMQGM VT+P+SIQRQP+P  +ATEVFDVNG AG+NAA
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA

Query:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN
        S+KRRKPWSK EDLELMAAVEK GEGNWANILK DFKGDRTASQLSQRWSIIRKRHGNLNVGA+TTST   KAQIDAAHRALS ALDLPVNNSK+AANSN
Subjt:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN

Query:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC
        +NSS VSS SGAEA VQ+QNQSPQ+ +PSRPL V+PLPSA KSGINT+KN+L+MKSTHNSDSIVRATAVAAGARIVSPS AASL+KAAQTK AIHIKSKC
Subjt:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC

Query:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT
        +SS Q P++GNA  HLD  PSVHYIS G+T TPG+N+VGGKSTM  NNSMK VSPK  +N STA+LTNPPS+++SPTTESPLKQEV  SEE KI KP+IT
Subjt:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT

Query:  AK
         K
Subjt:  AK

XP_038898738.1 uncharacterized protein LOC120086263 isoform X1 [Benincasa hispida]

2.2e-231

87.18

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MIERKE  RTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDW  LVKNTSTGIS+VREYQLLWRHLAYRHT LENMDSVTDPLDYDSDLDFEIEP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS
        FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTI ISNSQ+ST NL+N Q ACLMQGMSVTIPLS+QRQPIPM +ATEV DVNG A ANAAS
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS

Query:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN
        +KRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWS+IRKR GNLNVGAST+STTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN
Subjt:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN

Query:  SSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCIS
        SS+VSSASGAEA VQ+QNQSPQISMPSRPLLVEPLPS+VKSGI TSKNSL+MKSTHNSDSIVRATAVAAGARIVSPS AASLLKAAQ K AIHIKSKC  
Subjt:  SSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCIS

Query:  STQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITAK
                 +P+HLD  PSVHYIS GKTPTPGSN V GKSTM  NNS+KAVSPKV HNRSTAI TNPPSDRVSPTTESPLKQ+VN SEERKI + +ITAK
Subjt:  STQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITAK

Query:  RSSEKTA
            +TA
Subjt:  RSSEKTA

XP_038898739.1 uncharacterized protein LOC120086263 isoform X2 [Benincasa hispida]

1.2e-229

86.98

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MIERKE  RTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDW  LVKNTSTGIS+VREYQLLWRHLAYRHT LENMDSVTDPLDYDSDLDFEIEP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS
        FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTI ISNSQ+ST NL+N Q ACLMQGMSVTIPLS+QRQPIPM +ATEV DVNG A ANAAS
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS

Query:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN
        +KRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWS+IRKR GNLNVGAST+STTQKAQIDAAHRALSFALDLPVNNSKT ANSNIN
Subjt:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN

Query:  SSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCIS
        SS+VSSASGAEA VQ+QNQSPQISMPSRPLLVEPLPS+VKSGI TSKNSL+MKSTHNSDSIVRATAVAAGARIVSPS AASLLKAAQ K AIHIKSKC  
Subjt:  SSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCIS

Query:  STQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITAK
                 +P+HLD  PSVHYIS GKTPTPGSN V GKSTM  NNS+KAVSPKV HNRSTAI TNPPSDRVSPTTESPLKQ+VN SEERKI + +ITAK
Subjt:  STQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITAK

Query:  RSSEKTA
            +TA
Subjt:  RSSEKTA

TrEMBL top hits

e value

%identity

Alignment

A0A1S3CRZ4 uncharacterized protein LOC103503656 isoform X2

1.1e-215

82.63

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MI +KE +RTGTISMEDCSTLL RYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISD REYQLLWRHLAYRHTLLE+M SVTD LDYDSDLDFE+EP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS
        FPSV SESSNEAAACVKVLIANGIP+ESDVP+SSAVEAPLTI ISNSQ  TDN  N Q A L QG+SVTIPLSIQRQPIP+  A EVFDVNG AGA+AAS
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS

Query:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN
        +KRRKPWSKAEDLEL+AAVEKCGEGNWANILKGDFKGDRTASQLSQRWS+IRKR  NLN+GAST+STTQKAQIDAAHRAL+FALDLPVNN+KT ANSNIN
Subjt:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN

Query:  SSIV-SSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCI
        SSIV SSAS +E+ VQ+QNQSPQISMPSRPLLV+PLPSAVKSGINTSKNSL++ STHNSDSIVRATAVAAGARIVSPS AASL+KA QTK AIHIKSKC 
Subjt:  SSIV-SSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCI

Query:  SSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITA
                   P+HLD  P+VHYIS GKTPTP SN+V GKSTM  NNSMKAVSPK+LH+RS AI TN PS++VSPTTESPLKQEVN SEERK P+ +ITA
Subjt:  SSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITA

Query:  K
        K
Subjt:  K

A0A5A7T5C8 HTH myb-type domain-containing protein

1.1e-215

82.02

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPL-----DYDSDLD
        MI +KE +RTGTISMEDCSTLL RYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISD REYQLLWRHLAYRHTLLE+M SVTD L     DYDSDLD
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPL-----DYDSDLD

Query:  FEIEPFPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAG
        FE+EPFPSV SESSNEAAACVKVLIANGIP+ESDVP+SSAVEAPLTI ISNSQ  TDN  N Q A L QG+SVTIPLSIQRQPIP+  A EVFDVNG AG
Subjt:  FEIEPFPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAG

Query:  ANAASQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAA
        A+AAS+KRRKPWSKAEDLEL+AAVEKCGEGNWANILKGDFKGDRTASQLSQRWS+IRKR  NLN+GAST+STTQKAQIDAAHRAL+FALDLPVNN+KTAA
Subjt:  ANAASQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAA

Query:  NSNINSSIV-SSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHI
        NSNINSSIV SSAS +E+ VQ+QNQSPQISMPSRPLLV+PLPSAVKSGINTSKNSL++ STHNSDSIVRATAVAAGARIVSPS AASL+KA QTK AIHI
Subjt:  NSNINSSIV-SSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHI

Query:  KSKCISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPK
        KSKC            P+HLD  P+VHYIS GKTPTP SN+V GKSTM  NNSMKAVSPK+LH+RS AI TN PS++VSPTTESPLKQEVN SEERK P+
Subjt:  KSKCISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPK

Query:  PVITAK
         +ITAK
Subjt:  PVITAK

A0A5D3E5P5 HTH myb-type domain-containing protein

1.5e-217

82.83

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MI +KE +RTGTISMEDCSTLL RYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISD REYQLLWRHLAYRHTLLE+M SVTD LDYDSDLDFE+EP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS
        FPSV SESSNEAAACVKVLIANGIP+ESDVP+SSAVEAPLTI ISNSQ  TDN  N Q A L QG+SVTIPLSIQRQPIP+  A EVFDVNG AGA+AAS
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAAS

Query:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN
        +KRRKPWSKAEDLEL+AAVEKCGEGNWANILKGDFKGDRTASQLSQRWS+IRKR  NLN+GAST+STTQKAQIDAAHRAL+FALDLPVNN+KTAANSNIN
Subjt:  QKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNIN

Query:  SSIV-SSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCI
        SSIV SSAS +E+ VQ+QNQSPQISMPSRPLLV+PLPSAVKSGINTSKNSL++ STHNSDSIVRATAVAAGARIVSPS AASL+KA QTK AIHIKSKC 
Subjt:  SSIV-SSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCI

Query:  SSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITA
                   P+HLD  P+VHYIS GKTPTP SN+V GKSTM  NNSMKAVSPK+LH+RS AI TN PS++VSPTTESPLKQEVN SEERK P+ +ITA
Subjt:  SSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITA

Query:  K
        K
Subjt:  K

A0A6J1FAZ9 uncharacterized protein LOC111443670 isoform X2

2.2e-216

81.67

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MIE KEKQ+ GTIS ED S +LERYSVRTIFTLLREVA VS VRIDWDKLVKNTSTGIS+VREYQLLWRHLAYRHTLLEN+DSVTDPLDYDSDLDFEIEP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA
        FPSVS+ES NEAAACVKVLIANGIPSESDVPSSS VEAPLTI I SNS++   +L+NPQ ACLMQGM VT+P+SIQRQP+P  +ATEVFDVNG AG+NAA
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA

Query:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN
        S+KRRKPWSK EDLELMAAVEK GEGNWANILK DFKGDRTASQLSQRWSIIRKRHGNLNVGA+TTST   KAQIDAAHRALS ALDLPVNNSK +ANSN
Subjt:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN

Query:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC
        +NSS VSS SGAEA VQ+QNQSPQ+ +PSRPL V+PLPSA KSGINT+KN+L+MKSTHNSDSIVRATAVAAGARIVSPS AASL+KAAQTK AIHIKSKC
Subjt:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC

Query:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT
        +SS Q P++GNA  HLD  PSVHYIS G+T TPG+N+VGGKSTM  NNSMK VSPK  +N STA+LTNPPS+++SPTTESPLKQEV  SEE KI KP+IT
Subjt:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT

Query:  AK
         K
Subjt:  AK

A0A6J1FGE2 uncharacterized protein LOC111443670 isoform X1

3.1e-218

81.87

Show/hide

Query:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP
        MIE KEKQ+ GTIS ED S +LERYSVRTIFTLLREVA VS VRIDWDKLVKNTSTGIS+VREYQLLWRHLAYRHTLLEN+DSVTDPLDYDSDLDFEIEP
Subjt:  MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEP

Query:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA
        FPSVS+ES NEAAACVKVLIANGIPSESDVPSSS VEAPLTI I SNS++   +L+NPQ ACLMQGM VT+P+SIQRQP+P  +ATEVFDVNG AG+NAA
Subjt:  FPSVSSESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICI-SNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAA

Query:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN
        S+KRRKPWSK EDLELMAAVEK GEGNWANILK DFKGDRTASQLSQRWSIIRKRHGNLNVGA+TTST   KAQIDAAHRALS ALDLPVNNSK+AANSN
Subjt:  SQKRRKPWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTST-TQKAQIDAAHRALSFALDLPVNNSKTAANSN

Query:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC
        +NSS VSS SGAEA VQ+QNQSPQ+ +PSRPL V+PLPSA KSGINT+KN+L+MKSTHNSDSIVRATAVAAGARIVSPS AASL+KAAQTK AIHIKSKC
Subjt:  INSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKC

Query:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT
        +SS Q P++GNA  HLD  PSVHYIS G+T TPG+N+VGGKSTM  NNSMK VSPK  +N STA+LTNPPS+++SPTTESPLKQEV  SEE KI KP+IT
Subjt:  ISSTQSPVVGNAPIHLDGSPSVHYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVIT

Query:  AK
         K
Subjt:  AK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G09710.1 Homeodomain-like superfamily protein

9.2e-58

40.39

Show/hide

Query:  QRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEPFPSVSSE
        +R   I+  D +TLL RY + TI  +L+E++  S  ++DW+ LVK T+TGI++ REYQLLWRHL+YRH LL   D    PLD DSD++ E+E  P+VS E
Subjt:  QRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEPFPSVSSE

Query:  SSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNS--QASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAASQKRRK
        +S EA A VKV+ A+ + SESD+   S VEAPLTI I  +  + S +  ++P  +   +GM++  P+ +Q+       +TE  + NG AG + A +++RK
Subjt:  SSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNS--QASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAASQKRRK

Query:  PWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKR-HGNLNVGASTTSTTQKAQIDAAHRALSFAL-DLPVNNSKTAANSNINSSI
         WS  ED EL AAV++CGEGNWA+I+KGDF+G+RTASQLSQRW++IRKR H + +V       T+ A++ A + ALS AL + P +N          SS 
Subjt:  PWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKR-HGNLNVGASTTSTTQKAQIDAAHRALSFAL-DLPVNNSKTAANSNINSSI

Query:  VSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMK----STHNSDSIVRATAVAAGA-----------RIVSPSGAASLLKAAQT
          + + A         S Q    S+P +V+ LP A  S +  +K+ ++ K    ST  SD +V A +VAA A           R V P G     +  +T
Subjt:  VSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMK----STHNSDSIVRATAVAAGA-----------RIVSPSGAASLLKAAQT

Query:  KKAIHIKSKCI
        K   H  + C+
Subjt:  KKAIHIKSKCI

AT1G09710.2 Homeodomain-like superfamily protein

4.3e-55

38.12

Show/hide

Query:  QRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEPFPSVSSE
        +R   I+  D +TLL RY + TI  +L+E++  S  ++DW+ LVK T+TGI++ REYQLLWRHL+YRH LL   D    PLD DSD++ E+E  P+VS E
Subjt:  QRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEPFPSVSSE

Query:  SSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNS--QASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAASQKRRK
        +S EA A VKV+ A+ + SESD+   S VEAPLTI I  +  + S +  ++P  +   +GM++  P+ +Q+       +TE  + NG AG + A +++RK
Subjt:  SSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNS--QASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAASQKRRK

Query:  PWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKR-HGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTA----------
         WS  ED EL AAV++CGEGNWA+I+KGDF+G+RTASQLSQRW++IRKR H + +V       T+ A++ A + ALS AL     ++K A          
Subjt:  PWSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKR-HGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTA----------

Query:  ANSNI------------------------NSSIVSSASGAEALVQVQN--QSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMK----STHNSDSIVRA
        ANS+I                        N  ++ + S         N   S Q    S+P +V+ LP A  S +  +K+ ++ K    ST  SD +V A
Subjt:  ANSNI------------------------NSSIVSSASGAEALVQVQN--QSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMK----STHNSDSIVRA

Query:  TAVAAGA-----------RIVSPSGAASLLKAAQTKKAIHIKSKCI
         +VAA A           R V P G     +  +TK   H  + C+
Subjt:  TAVAAGA-----------RIVSPSGAASLLKAAQTKKAIHIKSKCI

AT1G58220.1 Homeodomain-like superfamily protein

5.6e-55

40.2

Show/hide

Query:  KQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEPFPSVSS
        K+R   IS  D +TLL+RY   TI  LL+E+A  +  +++W++LVK TSTGI+  REYQLLWRHLAYR +L+  + +    LD DSD++ E+E  P VS 
Subjt:  KQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEPFPSVSS

Query:  ESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAASQKRRKP
        +   EA A VKV+ A+ +PSESD+P  S VEAPLTI I  S        +  Y    +GM++T P+ + +       A E  + NG+A ++ A +KRRK 
Subjt:  ESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAASQKRRKP

Query:  WSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFAL-------DLPVNNSKTAANSNI
        WS  ED EL+AAV++ GEG+WA I K +F+G+RTASQLSQRW  IR+R    N    T     +AQ+ AA+RALS A+        L V  +   ++  I
Subjt:  WSKAEDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFAL-------DLPVNNSKTAANSNI

Query:  NSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAI
          +  + AS    L   Q   PQI   SR     P+    KS +   K +    ST  +D +V A +VAA A +   + A ++ K    K A+
Subjt:  NSSIVSSASGAEALVQVQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAI

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATTGAGAGGAAAGAGAAGCAAAGGACAGGCACAATTAGTATGGAAGATTGTTCCACTCTATTGGAAAGATATTCAGTAAGGACGATATTTACTTTGCTTCGG
GAGGTGGCCCAGGTTTCGGGAGTGAGAATTGATTGGGACAAATTGGTGAAGAACACGTCCACTGGGATTTCTGATGTTCGAGAGTATCAGTTGTTATGGCGGCAT
TTGGCTTATCGTCACACGTTACTGGAGAACATGGATTCTGTTACTGATCCTCTGGATTATGATAGTGACTTAGATTTTGAAATAGAACCTTTTCCATCTGTTAGC
AGTGAGTCCTCGAATGAAGCTGCAGCATGTGTAAAGGTACTGATTGCTAATGGTATACCAAGTGAGTCAGATGTTCCAAGTAGTTCTGCAGTTGAGGCCCCATTG
ACTATATGTATATCCAATAGTCAAGCATCTACAGACAATCTCAAAAATCCTCAATATGCTTGTTTGATGCAAGGGATGTCTGTTACAATTCCACTTTCCATTCAG
AGGCAGCCGATTCCAATGGCAGCAGCAACTGAAGTATTTGATGTGAATGGAGTAGCTGGTGCTAATGCAGCTTCTCAGAAAAGAAGAAAGCCTTGGTCGAAGGCA
GAGGATTTGGAATTGATGGCTGCTGTGGAGAAATGTGGTGAAGGAAACTGGGCGAATATCTTGAAAGGAGACTTCAAAGGGGATAGAACTGCTTCACAGCTATCT
CAGAGGTGGTCCATTATTAGGAAGCGACATGGTAATTTGAATGTGGGAGCTAGCACCACAAGTACTACCCAGAAAGCTCAGATTGATGCTGCACACCGTGCATTG
TCCTTTGCCCTTGATTTGCCTGTGAATAACTCAAAAACAGCAGCAAATTCAAATATAAACAGTAGCATTGTTTCTTCTGCAAGTGGTGCTGAAGCTTTGGTTCAA
GTGCAGAATCAGTCTCCACAGATTTCCATGCCTTCAAGGCCGCTGCTGGTAGAGCCTTTGCCTTCAGCAGTGAAATCTGGAATCAACACTTCCAAGAATTCATTG
ATTATGAAGTCTACTCACAATTCTGATTCTATAGTTAGAGCAACTGCAGTAGCTGCAGGGGCCCGGATCGTTTCTCCGTCCGGTGCTGCATCTTTACTGAAAGCT
GCACAAACGAAAAAGGCCATCCATATAAAGTCCAAATGCATTTCATCAACCCAATCACCTGTGGTTGGTAATGCACCAATCCACTTGGATGGAAGCCCCAGTGTA
CATTATATTTCCCCAGGAAAAACACCAACTCCAGGGTCAAACCATGTCGGCGGTAAATCTACTATGGGATGCAATAACTCAATGAAGGCTGTCTCACCAAAAGTT
CTGCATAATCGTTCTACTGCTATTTTGACAAACCCGCCATCAGACCGAGTAAGCCCAACAACTGAGTCTCCACTGAAGCAAGAGGTTAACGGTTCAGAAGAACGC
AAAATTCCCAAGCCAGTCATTACTGCAAAGAGGAGTTCCGAGAAAACAGCTTGGTAA

mRNA sequence

Show/hide mRNA sequence

CTGCACCCTCGCCACCGTCGCCGATAAGTCCGAATTTCTTTTGCAACCGCAGCGCTTAACATTCGTTTTCGGTTTCGTCTTCGAACAATTTCCGATAGGCGACAG
TCACCGACGCTGCACCTTATTTGCAGGGTTTAGGGTTTTGGCTGATCTCCGATTAGAGGACTTTGGTTTCTTTTGTTTCTAAAAGCTTCTTATGCGATTTCATTA
CGAGCTCTACAATGATTGAGAGGAAAGAGAAGCAAAGGACAGGCACAATTAGTATGGAAGATTGTTCCACTCTATTGGAAAGATATTCAGTAAGGACGATATTTA
CTTTGCTTCGGGAGGTGGCCCAGGTTTCGGGAGTGAGAATTGATTGGGACAAATTGGTGAAGAACACGTCCACTGGGATTTCTGATGTTCGAGAGTATCAGTTGT
TATGGCGGCATTTGGCTTATCGTCACACGTTACTGGAGAACATGGATTCTGTTACTGATCCTCTGGATTATGATAGTGACTTAGATTTTGAAATAGAACCTTTTC
CATCTGTTAGCAGTGAGTCCTCGAATGAAGCTGCAGCATGTGTAAAGGTACTGATTGCTAATGGTATACCAAGTGAGTCAGATGTTCCAAGTAGTTCTGCAGTTG
AGGCCCCATTGACTATATGTATATCCAATAGTCAAGCATCTACAGACAATCTCAAAAATCCTCAATATGCTTGTTTGATGCAAGGGATGTCTGTTACAATTCCAC
TTTCCATTCAGAGGCAGCCGATTCCAATGGCAGCAGCAACTGAAGTATTTGATGTGAATGGAGTAGCTGGTGCTAATGCAGCTTCTCAGAAAAGAAGAAAGCCTT
GGTCGAAGGCAGAGGATTTGGAATTGATGGCTGCTGTGGAGAAATGTGGTGAAGGAAACTGGGCGAATATCTTGAAAGGAGACTTCAAAGGGGATAGAACTGCTT
CACAGCTATCTCAGAGGTGGTCCATTATTAGGAAGCGACATGGTAATTTGAATGTGGGAGCTAGCACCACAAGTACTACCCAGAAAGCTCAGATTGATGCTGCAC
ACCGTGCATTGTCCTTTGCCCTTGATTTGCCTGTGAATAACTCAAAAACAGCAGCAAATTCAAATATAAACAGTAGCATTGTTTCTTCTGCAAGTGGTGCTGAAG
CTTTGGTTCAAGTGCAGAATCAGTCTCCACAGATTTCCATGCCTTCAAGGCCGCTGCTGGTAGAGCCTTTGCCTTCAGCAGTGAAATCTGGAATCAACACTTCCA
AGAATTCATTGATTATGAAGTCTACTCACAATTCTGATTCTATAGTTAGAGCAACTGCAGTAGCTGCAGGGGCCCGGATCGTTTCTCCGTCCGGTGCTGCATCTT
TACTGAAAGCTGCACAAACGAAAAAGGCCATCCATATAAAGTCCAAATGCATTTCATCAACCCAATCACCTGTGGTTGGTAATGCACCAATCCACTTGGATGGAA
GCCCCAGTGTACATTATATTTCCCCAGGAAAAACACCAACTCCAGGGTCAAACCATGTCGGCGGTAAATCTACTATGGGATGCAATAACTCAATGAAGGCTGTCT
CACCAAAAGTTCTGCATAATCGTTCTACTGCTATTTTGACAAACCCGCCATCAGACCGAGTAAGCCCAACAACTGAGTCTCCACTGAAGCAAGAGGTTAACGGTT
CAGAAGAACGCAAAATTCCCAAGCCAGTCATTACTGCAAAGAGGAGTTCCGAGAAAACAGCTTGGTAAATGATGTCAAGATTAGGGGCTGACCAAACATAAAAGG
AAGCAAGAACAAATCTATACCATATAATCATGGGGACCATATCACAAATAATAAACAGCCCAGCTCTACAGCATGTTAATAGCAGGGTTGTGGGGTCAATAAAAA
AGGCCAATGACAAGACTAAAATTTGGAAGCTCATATTCTTCAGCAAGACAAGGAAAATGTATACTGTTTATCTGGGATTGAAGGTATAATTCATTCTTGAAATTA
ATGGATGTTCTTCCTTTCATTACATTGGCAAAATTACACCCTCAAAAAAAGCTCATCACTGAGGTAGGGGCCCTTTTGCTAGATCACTATATTGTTTCTGTAGTT
GTGGACTTGCACATGAGAACAGTGATGGCTTTTGCCTCTTTAACTTCACCCCAAACAAGAAAGACCGTAAAGGAATTCGTGTTCGGCCTAATGATTTCGATTGTT
GTATGCTCTTCCCTGCTGAAATGCCAAATTCTTGATCAAGTCTCTCCAAAGCCTTCTCAACTTGGACTTGTAGTACTCTTACCCGACCTTGACCAACTTGTAACT
CATCGGCTATCTTCCTATTTTCTTGCTTCATGTTGAGTACTTCACCTTGAAACTTTGCAGCTTGATAATCACTCAGTTCTGTCTTTTCTTCAGCTGAACCTTCAT
CTGTGATTCTTGATATATCACTTTGTATGTCACATAAGGATGAGAATCTATTGCATAGTTCATCTTTCAATACTGCACTATGTTCCAACCAAAGTGATAATTCGG
TTTGTATCTCTCTCAAGTGTGTATATATTGGTCGAGCATCGGATTCCATTGCTTGTTGATGTTTCACACTTCCTTCTTGCTTGTTTTCTCTCAACTTTTGCAACT
CTGATTGTAGATCCTGGATTGAAGTCTGGAATTTTTGAATCTGGTGGACTGTCGTGCTAAATCGCAGCCAAAACTCGAGATTCATCTCTAGTTGTCCATCAATGT
GGGAGCGGAATCTTTCTTCTGTAGGTGACATGATAATGACTTTATCACCCCCAATCGATTTCTTGTTTACATCCTCTTTCTTTGTCAAGCTTCTTGCATTTCTCA
TTGCTCTATAGCTTCCTTCTGCGGGATCAATACTTCGTTCGACATAAGAATCGGAAATCGAAACTTGATCTATATATGGAGTTGAGGATTCAGAGTACAAATAGC
TAGGAGCCTCATGAATGCTTTCTTGCAGTAGTTCCTGGTCCACATCTCTCGCGTTCGTGTCTTCATCTGTTTCGCCATTATTTACTAATGATTTTATAACGTCAT
CTTTAGAGGAAATGGCGTCTTTCAGTTCTTTAACCTGCATTGCCAATTCGAAAATGCTGTCACGGTTCTTTTGTTCAACTTCACTCAACTTGTTTCGTACATCTT
TATAGTCTCTTAAAACTGAAGTATACTCCTCCAGTAGAATCTTTTCTCTATCTTCTATTCCTTTCAAGAACAATTGCCTCAATGTAGGATGCTTTTCTTCCTCTT
GCAATTCATTTGCCTCCAAATCAAGAAGAGTGTTTTCTGTTTGAAGTTGTGGTCTCTCATCATTTTCCTCGTGCCCTGATTCCTTTTCCATAAGATTCTTATTAC
CTGGAACGGGTTGTTTCTCTTCCTCATCTATGAAAAAATCACCAAGTTTCAAACTTTCTACTTTCCTCCCCTCAAATCCTGAAATTGTTGAAATTGTTGTTGTTT
TCACATCGGGATCGACCATCATAACATCTTGTGAGAAGTCACAAGTTTCAGCATCGTCCATTTTCATGGTCTGCAATTTATCAGATAAGTGGTAGAGATTACTAC
TTGCTTCGGTGAATTGGGTTTGAAGGCTGATATTTTGACTTTCTGCGTTCTGATTTAGATTTTTCACTCTGGAGAGTTCGGCCTCCAATTCCTTTATCTTCTTCT
TCATGTTCTCTGAACTTTCCACAAGAATTTCCTTGTCTTCTTCCAACTGCTGGACGTTTGCTTGGAGCACATCTGTCTCTGATTTTAGCCGTCTTACAAGAGATG
TCTGAGAGGAAACTGCAGCTTCAAGTGTCACAATTTTATTTACAAGTTCATCAATTTTCTCAGCCAACTCAGAAATGGTGAATGAACTGTTTGAATCCATTTCCA
GATGTTCTCTGATCTTCTGATCAAGGAGTTCTATATTATGTTTGTCTTCTGCTGTGCAAGCGATGAGTTGGTCTGCAATTTTCAATCCAGATTCAATGCTTAGAT
CCTCATGTAAATCAATGGACTCGTGATGGTCTGTTTGCTTTGGAAGGAGCTTACACTTGAGGCTCTCAAATTTTGTATCCACTTTCTTGATTCTGTTGTTCTCTA
GTCTTGTTTCTTCAATTGTTCTTTCCTGTTCCTCTTGCAATTTGGTCAGAGTTTCTCGGCAAGATTTTAGAGCAGTTACTGCCATTAACGTTCGAGCTTCATTAT
CTTCAATAATAGTGCCAATGCCGAACTCATCTTGCAAGTTGCTGACTCTTTTTTGCATCTTTGTGATACTGTTTTCCATATCCCAATATTTCTCACATTCACGTT
CATACAAGCTCTTCACGAATTCCATTTCGGTCTGTCGAGCCAGAATTTCTTTCTGTAGCATATTGATCTCTTCTAGTGCTTCAGTTTTGTTAAGCCCTGATTTTG
GAGTTGAAGCTGGTCTAATTCTAGGAGTACTTGCATTTCTCTTTAGTTGTGCCTTTCTTCTTATCATTGAAGGACTTCTAAATCCCTTCTCAGGAAACTTTGGAA
CTTCTGGGATTCCTAGTTTTGGTGAGCCGTCCAATTCACTTGAAAACTCATGAGGAGTTTTGGTTGAAAAAGATTCTCGAGGAAAAAACTCAATTTCACAATCAT
CATCATCAATTGTGTAATGAACTCGTTCAGGAAAGATTGAAGCTATTGTCCGATTTGCACCTTGAAACTCTTTTGATAGGTGATCGTATCTCTCTGCTAAAGCTC
GATATGCCCGGAAAGACTCTTCTACATGTTCTACAAGTTCAGGTCTCTTCTTATAATACATTTCAGCCCTCTTTGCAAACGAATCCCCATCGCCTTCAATGATTC
TCATCATGTTATCAACCTTCTCCTCCATATCTACAATTCAAGAAGCATATGCATGTCAGTCCAAATATCATTTTAAAATACTATCTGCTCATGATTTTACAATAA
ACAAAATTTGCAGAATGAATAACAAAAAATCAAAACAATCTCAAATACGGGTCATTCCGTTCCATTCCAATTCTATTGAATTTGTACACCAAAAATACTACAATT
TAGGAACAGAGCATTGATTACAAAAGCAAAGTATTCAATACACACTCCAGATTGGAATTCCTAAAATTATAACCTTCAAATTCAAATCAATATTTATGGTGTAAA
CCTAGATGCGGAATTCTAATCTACAAGCTTTAATCAAGAAAACAGAGGCAAAAACCAAATGCAAATGTACCGTGGAGGTTTTGTTCGAGCCATTTGGATTGCTTT
GTCCTGATATGGCTCGCCCACCACCATGAATAAGCATTACTAGCAGCTCTTTGCAACATCTCTTTCTCCTCTCTTTATAGAATCGAAAGAGATTCAAAATCCATC
CGAGGAAGAAAAACGATCGCCGATAACTATAACAAAGAAGAAGCGAAACGAAAATAAGGATATAGGAAGAAGATCATAAGCAGCAGCCGGTTACAATAATGGAGA
ATTGTGGATTACAAATCTTCCAAAAAGACCCTAATCGATGAGGACGAAGATGATTAGGACGACGACAAGAAACGGCGCCAAACAAGCGATGGAGATGAGATTGAG
AATATTGAGAGAGAGATCACAGGCATCCTATAGTCATGGATGAGAGGATACAACGGCTTGTTTATAGCTGTTGGCAATGGAGGACCAAGCCCTTCTATTTAGTGC
CACGTGGCATTGCCAGGCTGGCCAACCTTTTCTGCATGATACATATACACACACTCTCTCTCTCC

Protein sequence

Show/hide protein sequence

MIERKEKQRTGTISMEDCSTLLERYSVRTIFTLLREVAQVSGVRIDWDKLVKNTSTGISDVREYQLLWRHLAYRHTLLENMDSVTDPLDYDSDLDFEIEPFPSVS
SESSNEAAACVKVLIANGIPSESDVPSSSAVEAPLTICISNSQASTDNLKNPQYACLMQGMSVTIPLSIQRQPIPMAAATEVFDVNGVAGANAASQKRRKPWSKA
EDLELMAAVEKCGEGNWANILKGDFKGDRTASQLSQRWSIIRKRHGNLNVGASTTSTTQKAQIDAAHRALSFALDLPVNNSKTAANSNINSSIVSSASGAEALVQ
VQNQSPQISMPSRPLLVEPLPSAVKSGINTSKNSLIMKSTHNSDSIVRATAVAAGARIVSPSGAASLLKAAQTKKAIHIKSKCISSTQSPVVGNAPIHLDGSPSV
HYISPGKTPTPGSNHVGGKSTMGCNNSMKAVSPKVLHNRSTAILTNPPSDRVSPTTESPLKQEVNGSEERKIPKPVITAKRSSEKTAW

CcUC11G221990 (gene) of Watermelon (PI 537277) v1 genome