CuGenDBv2

Gene ID	CmoCh16G004430
Organism	Cucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Description	protein SAWADEE HOMEODOMAIN HOMOLOG 2-like
Genome location	Cmo_Chr16:2121098..2125558
RNA-Seq Expression	CmoCh16G004430
Synteny	CmoCh16G004430
Gene Ontology terms	GO:0005634 - nucleus (cellular component) GO:0003677 - DNA binding (molecular function) GO:0003682 - chromatin binding (molecular function)
InterPro domains	IPR001356 - Homeobox domain IPR009057 - Homeobox-like domain superfamily IPR032001 - SAWADEE domain IPR039276 - Protein SAWADEE HOMEODOMAIN HOMOLOG 1/2

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8650545.1 hypothetical protein Csa_011086 [Cucumis sativus]

9.4e-171

84.9

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTA EVAEM+AILQ HNNTMPAREVLVALA+KFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKT+KAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQT VVPAPAPVGSAK A ENP  EFEAKSGRDGAWYDVATFLSHRSVESGD             EVLVRFSGFGSEEDEWVNIRRNIRPRS PCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAAS EPSKSG+DSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQ------------KQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFE +Q              N +IN H QT+TQE R+TETN+APTT NS N A SSAFSSGIVT N+VS  SADNVSDGKLLS
Subjt:  INFEATQ------------KQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

XP_022923145.1 protein SAWADEE HOMEODOMAIN HOMOLOG 2-like [Cucurbita moschata]

6.1e-194

96.77

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDL            EVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
Subjt:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

XP_022984988.1 protein SAWADEE HOMEODOMAIN HOMOLOG 2-like isoform X1 [Cucurbita maxima]

1.1e-192

96.24

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDL            EVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFEATQK NANINVH QTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
Subjt:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

XP_023553578.1 protein SAWADEE HOMEODOMAIN HOMOLOG 2-like [Cucurbita pepo subsp. pepo]

3.3e-192

95.7

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSP+VQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDL            EVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSG+DSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFEATQK NANINVH QTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
Subjt:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

XP_038878066.1 protein SAWADEE HOMEODOMAIN HOMOLOG 2-like isoform X1 [Benincasa hispida]

1.5e-171

84.05

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTA EVAEM+AILQ HNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSP+VQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQT VVPAP PVGSAK A ENP  EFEAKSGRDGAWYDVATFLSHRSVESGD             EVLVRFSGFGSEEDEWVNIRRNIRPRS PCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAAS EPSKS +DSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQK------------QNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFE TQK             NANINVH QTNTQE R+TETN           SAPTT NSGN A  SAFS GIVT N+VSG SADNVSDGKLLS
Subjt:  INFEATQK------------QNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

TrEMBL top hits

e value

%identity

Alignment

A0A1S3C274 protein SAWADEE HOMEODOMAIN HOMOLOG 2 isoform X1

3.6e-168

82.28

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTA EVAEM+ ILQ HNNTMPAREVLVALA+KFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKT+KAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQT VVPAP PVG+AKSA ENP  EFEAKSGRDGAWYDVATFLSHRSVESGD             EVLVRFSGFGSEEDEWVNIRRNIRPRS PCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAAS EPSKSG+DSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQ------------KQNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFE  Q              N +IN H QT+TQE R+TETN           +APTT NS N A SSAFSSGIVT N+VSG SADNVSDGKLLS
Subjt:  INFEATQ------------KQNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

A0A5A7UUV7 SAWADEE HOMEODOMAIN-like protein 2 isoform X1

3.6e-168

82.28

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTA EVAEM+ ILQ HNNTMPAREVLVALA+KFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKT+KAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQT VVPAP PVG+AKSA ENP  EFEAKSGRDGAWYDVATFLSHRSVESGD             EVLVRFSGFGSEEDEWVNIRRNIRPRS PCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAAS EPSKSG+DSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQ------------KQNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFE  Q              N +IN H QT+TQE R+TETN           +APTT NS N A SSAFSSGIVT N+VSG SADNVSDGKLLS
Subjt:  INFEATQ------------KQNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

A0A5D3CH38 Protein SAWADEE HOMEODOMAIN-like protein 2 isoform X1

5.2e-167

81.77

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTA EVAEM+ ILQ HNNTMPAREVLVALA+KFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKT+KAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQT VVPAP PVG+AKSA ENP  EFEAKSGRDGAWYDVATFLSHRSVESGD             EVLVRFSGFGSEEDEWVNIRRNIRPRS PCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDH+QSEEIVQLRKICRRPETDYRLQQLHAVNEAAS EPSKSG+DSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQ------------KQNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFE  Q              N + N H QT+TQE R+TETN           +APTT NS N A SSAFSSGIVT N+VSG SADNVSDGKLLS
Subjt:  INFEATQ------------KQNANINVHTQTNTQEGRSTETN-----------SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

A0A6J1EAV6 protein SAWADEE HOMEODOMAIN HOMOLOG 2-like

2.9e-194

96.77

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDL            EVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
Subjt:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

A0A6J1JC16 protein SAWADEE HOMEODOMAIN HOMOLOG 2-like isoform X1

5.6e-193

96.24

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
        MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRN

Query:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
        VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDL            EVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE
Subjt:  VPQTTVVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSE

Query:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
        CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR
Subjt:  CVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQR

Query:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
        INFEATQK NANINVH QTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS
Subjt:  INFEATQKQNANINVHTQTNTQEGRSTETNSAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

SwissProt top hits

e value

%identity

Alignment

Q8RWJ7 Protein SAWADEE HOMEODOMAIN HOMOLOG 2

5.7e-102

64.03

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR
        MGRPPSNGGPAFRF  PEV EM+AIL  HN  MP R +L ALA+KFSES ERKGK+ VQ KQ+WNWFQNRRYA+RA+  KAPGKL VS + +++    +R
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR

Query:  NVPQTTVVP------------APAPVGS-----AKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEW
        +V Q   VP             PAP GS      +S S+N  LEFEAKS RDGAWYDV  FL+HR++E GD             EV VRF+GF  EEDEW
Subjt:  NVPQTTVVP------------APAPVGS-----AKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEW

Query:  VNIRRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLH-AVNEA
        +N+++++R RS PCE+SECVAVL GDL+LCFQEGK+QALYFDA VLD QRRRHDVRGCRCRFLVRY HDQSEEIV LRKICRRPETDYRLQQLH AVN+ 
Subjt:  VNIRRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLH-AVNEA

Query:  AST
        A++
Subjt:  AST

Q9XI47 Protein SAWADEE HOMEODOMAIN HOMOLOG 1

4.6e-43

41.38

Show/hide

Query:  FTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNR-RYAIRAKTTKAPGKLAVSPVVQIE-----STPVRNVPQTTVV
        FT  E+ +M+ + +   +    ++    +A  FS SV R GK ++  KQV  WFQ + ++  + K+   P     SP +QI      S+   N    T V
Subjt:  FTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNR-RYAIRAKTTKAPGKLAVSPVVQIE-----STPVRNVPQTTVV

Query:  PAPAPVGSAK-SASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSECVAVLP
             V + K  AS+   L FEAKS RD AWYDV++FL++R + +G+L            EV VRFSGF +  DEWVN++ ++R RS P E SEC  V  
Subjt:  PAPAPVGSAK-SASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSECVAVLP

Query:  GDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPE
        GDL+LCFQE ++QALY D HVL+ +R  HD   C C FLVRY+ D +EE + L +ICRRPE
Subjt:  GDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPE

Arabidopsis top hits

e value

%identity

Alignment

AT1G15215.2 BEST Arabidopsis thaliana protein match is: sequence-specific DNA binding transcription factors

3.2e-44

41.38

Show/hide

Query:  FTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNR-RYAIRAKTTKAPGKLAVSPVVQIE-----STPVRNVPQTTVV
        FT  E+ +M+ + +   +    ++    +A  FS SV R GK ++  KQV  WFQ + ++  + K+   P     SP +QI      S+   N    T V
Subjt:  FTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNR-RYAIRAKTTKAPGKLAVSPVVQIE-----STPVRNVPQTTVV

Query:  PAPAPVGSAK-SASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSECVAVLP
             V + K  AS+   L FEAKS RD AWYDV++FL++R + +G+L            EV VRFSGF +  DEWVN++ ++R RS P E SEC  V  
Subjt:  PAPAPVGSAK-SASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSECVAVLP

Query:  GDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPE
        GDL+LCFQE ++QALY D HVL+ +R  HD   C C FLVRY+ D +EE + L +ICRRPE
Subjt:  GDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPE

AT1G15215.3 BEST Arabidopsis thaliana protein match is: sequence-specific DNA binding transcription factors

2.4e-39

40.32

Show/hide

Query:  FTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNR-RYAIRAKTTKAPGKLAVSPVVQIE-----STPVRNVPQTTVV
        FT  E+ +M+ + +   +    ++    +A  FS SV R GK ++  KQV  WFQ + ++  + K+   P     SP +QI      S+   N    T V
Subjt:  FTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNR-RYAIRAKTTKAPGKLAVSPVVQIE-----STPVRNVPQTTVV

Query:  PAPAPVGSAK-SASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSECVAVLP
             V + K  AS+   L FEAKS RD AWYDV++FL++R + +G+L            EV VRFSGF +  DEWVN++ ++R RS P E SEC  V  
Subjt:  PAPAPVGSAK-SASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSECVAVLP

Query:  GDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSE
        GDL+LCFQE ++QALY D HVL+ +R  HD   C C FLVRY+ D +E
Subjt:  GDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSE

AT3G18380.1 sequence-specific DNA binding transcription factors;sequence-specific DNA binding

4.0e-103

64.03

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR
        MGRPPSNGGPAFRF  PEV EM+AIL  HN  MP R +L ALA+KFSES ERKGK+ VQ KQ+WNWFQNRRYA+RA+  KAPGKL VS + +++    +R
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR

Query:  NVPQTTVVP------------APAPVGS-----AKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEW
        +V Q   VP             PAP GS      +S S+N  LEFEAKS RDGAWYDV  FL+HR++E GD             EV VRF+GF  EEDEW
Subjt:  NVPQTTVVP------------APAPVGS-----AKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEW

Query:  VNIRRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLH-AVNEA
        +N+++++R RS PCE+SECVAVL GDL+LCFQEGK+QALYFDA VLD QRRRHDVRGCRCRFLVRY HDQSEEIV LRKICRRPETDYRLQQLH AVN+ 
Subjt:  VNIRRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLH-AVNEA

Query:  AST
        A++
Subjt:  AST

AT3G18380.2 sequence-specific DNA binding transcription factors;sequence-specific DNA binding

9.9e-102

63.82

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR
        MGRPPSNGGPAFRF  PEV EM+AIL  HN  MP R +L ALA+KFSES ERKGK+ VQ KQ+WNWFQNRRYA+RA+  KAPGKL VS + +++    +R
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR

Query:  NVPQTTVVP------------APAPVGS-----AKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEW
        +V Q   VP             PAP GS      +S S+N  LEFEAKS RDGAWYDV  FL+HR++E GD             EV VRF+GF  EEDEW
Subjt:  NVPQTTVVP------------APAPVGS-----AKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEW

Query:  VNIRRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSE-EIVQLRKICRRPETDYRLQQLH-AVNE
        +N+++++R RS PCE+SECVAVL GDL+LCFQEGK+QALYFDA VLD QRRRHDVRGCRCRFLVRY HDQSE EIV LRKICRRPETDYRLQQLH AVN+
Subjt:  VNIRRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSE-EIVQLRKICRRPETDYRLQQLH-AVNE

Query:  AAST
         A++
Subjt:  AAST

AT3G18380.3 sequence-specific DNA binding transcription factors;sequence-specific DNA binding

2.0e-102

64.12

Show/hide

Query:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR
        MGRPPSNGGPAFRF  PEV EM+AIL  HN  MP R +L ALA+KFSES ERKGK+ VQ KQ+WNWFQNRRYA+RA+  KAPGKL VS + +++    +R
Subjt:  MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIE-STPVR

Query:  ------NVPQTT--------VVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNI
              +VP+TT        + PAP+  G  +S S+N  LEFEAKS RDGAWYDV  FL+HR++E GD             EV VRF+GF  EEDEW+N+
Subjt:  ------NVPQTT--------VVPAPAPVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNI

Query:  RRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSE-EIVQLRKICRRPETDYRLQQLH-AVNEAAS
        ++++R RS PCE+SECVAVL GDL+LCFQEGK+QALYFDA VLD QRRRHDVRGCRCRFLVRY HDQSE EIV LRKICRRPETDYRLQQLH AVN+ A+
Subjt:  RRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQALYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSE-EIVQLRKICRRPETDYRLQQLH-AVNEAAS

Query:  T
        +
Subjt:  T

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGTCGGCCTCCCAGCAATGGAGGCCCTGCCTTCCGTTTCACGGCTCCCGAGGTTGCGGAGATGGACGCTATATTGCAAGCACACAATAATACCATGCCAGCTCGGGA
AGTTCTTGTTGCCCTTGCTGAGAAGTTCAGTGAATCGGTAGAACGGAAAGGGAAGATTGCTGTGCAAATGAAACAAGTTTGGAATTGGTTCCAGAATAGACGATATGCTA
TAAGAGCGAAGACAACCAAGGCTCCTGGAAAGTTAGCTGTCTCTCCAGTTGTCCAAATCGAGTCAACTCCCGTGAGAAATGTGCCTCAAACCACAGTTGTTCCTGCTCCT
GCACCAGTAGGATCTGCAAAGAGTGCTTCAGAAAATCCATCGTTGGAGTTCGAAGCTAAGTCTGGGAGAGATGGTGCATGGTATGATGTTGCTACCTTTCTATCCCATAG
ATCTGTGGAAAGCGGTGACCTGTCTACTTTCTGTGCGTTTTTCATTAAAAACAAACATGAAGTACTAGTCAGATTTTCTGGTTTTGGATCGGAGGAGGACGAGTGGGTTA
ATATCCGAAGGAACATTAGACCTCGTTCTTTTCCTTGTGAATCATCAGAATGCGTGGCAGTTCTTCCGGGTGATCTCATCTTATGCTTTCAGGAGGGTAAAGAGCAGGCA
CTTTACTTTGATGCCCATGTGCTTGATACACAAAGAAGAAGACATGACGTTCGAGGTTGTCGCTGCAGGTTTTTGGTCCGTTATGATCACGATCAGTCTGAGGAAATCGT
CCAGTTGAGAAAGATTTGTCGTCGGCCCGAGACTGATTACAGGTTGCAACAGCTTCATGCTGTAAATGAAGCAGCATCCACTGAGCCCTCAAAGTCTGGCGTGGATTCTG
TACTGCTCAGCGGCCAGAGGATAAATTTTGAGGCAACACAAAAGCAAAATGCCAATATAAACGTCCATACCCAAACTAATACTCAGGAGGGAAGGAGTACTGAAACTAAC
AGTGCTCCAACCACACTCAACTCTGGTAATTCTGCAGCTAGCTCTGCATTCTCGAGTGGTATCGTGACGTCGAACTCTGTTTCTGGATTGTCGGCTGACAATGTGTCTGA
TGGGAAGTTACTTAGCTGA

mRNA sequence

Show/hide mRNA sequence

GAATTTTGGGCTTGAATGTTCAATCTTTATTGCATAATATATATATGTGTATATATATATATACATATACATTCATTTATATCCGCTCAAAGATTTCCGAAAATAACGAA
TTTCATTTCTGTAGACGGGATCTTCAATTCTGCTCTCTTTTTCCCGGCACTTTTTTTTTTCTTCTTCTCAGTTTCTCTCTCTGCTTCTGCGATAGCGACGCCGAAATCAG
AGAAACCACAGCGGAAGGTTTAGCTTATGGGTCGGCCTCCCAGCAATGGAGGCCCTGCCTTCCGTTTCACGGCTCCCGAGGTTGCGGAGATGGACGCTATATTGCAAGCA
CACAATAATACCATGCCAGCTCGGGAAGTTCTTGTTGCCCTTGCTGAGAAGTTCAGTGAATCGGTAGAACGGAAAGGGAAGATTGCTGTGCAAATGAAACAAGTTTGGAA
TTGGTTCCAGAATAGACGATATGCTATAAGAGCGAAGACAACCAAGGCTCCTGGAAAGTTAGCTGTCTCTCCAGTTGTCCAAATCGAGTCAACTCCCGTGAGAAATGTGC
CTCAAACCACAGTTGTTCCTGCTCCTGCACCAGTAGGATCTGCAAAGAGTGCTTCAGAAAATCCATCGTTGGAGTTCGAAGCTAAGTCTGGGAGAGATGGTGCATGGTAT
GATGTTGCTACCTTTCTATCCCATAGATCTGTGGAAAGCGGTGACCTGTCTACTTTCTGTGCGTTTTTCATTAAAAACAAACATGAAGTACTAGTCAGATTTTCTGGTTT
TGGATCGGAGGAGGACGAGTGGGTTAATATCCGAAGGAACATTAGACCTCGTTCTTTTCCTTGTGAATCATCAGAATGCGTGGCAGTTCTTCCGGGTGATCTCATCTTAT
GCTTTCAGGAGGGTAAAGAGCAGGCACTTTACTTTGATGCCCATGTGCTTGATACACAAAGAAGAAGACATGACGTTCGAGGTTGTCGCTGCAGGTTTTTGGTCCGTTAT
GATCACGATCAGTCTGAGGAAATCGTCCAGTTGAGAAAGATTTGTCGTCGGCCCGAGACTGATTACAGGTTGCAACAGCTTCATGCTGTAAATGAAGCAGCATCCACTGA
GCCCTCAAAGTCTGGCGTGGATTCTGTACTGCTCAGCGGCCAGAGGATAAATTTTGAGGCAACACAAAAGCAAAATGCCAATATAAACGTCCATACCCAAACTAATACTC
AGGAGGGAAGGAGTACTGAAACTAACAGTGCTCCAACCACACTCAACTCTGGTAATTCTGCAGCTAGCTCTGCATTCTCGAGTGGTATCGTGACGTCGAACTCTGTTTCT
GGATTGTCGGCTGACAATGTGTCTGATGGGAAGTTACTTAGCTGACTATGAAAACGAATTTCTCAATCAGTCTAATTTTAACTGAACGTATCAATTTAAAATTTTGCCTG
ACTCGTTTATTTAGGATGAGTAAATACGTAGCGAAGTCTGTTTTTTGCCACATGTTTCGAAGTTTTAGGTTCGAATCCACTCGTTGTGAATGCTGAATGTTCTTGACGGA
TAAAAAATGCAGGAGTCACGCCTCGAGTCTAACAGGTCAGAGGCATCATCTCTCTTGTTTTACTTCTTCTCTGCTTATCTAGACAGGGTTCTACACTTAGC

Protein sequence

Show/hide protein sequence

MGRPPSNGGPAFRFTAPEVAEMDAILQAHNNTMPAREVLVALAEKFSESVERKGKIAVQMKQVWNWFQNRRYAIRAKTTKAPGKLAVSPVVQIESTPVRNVPQTTVVPAP
APVGSAKSASENPSLEFEAKSGRDGAWYDVATFLSHRSVESGDLSTFCAFFIKNKHEVLVRFSGFGSEEDEWVNIRRNIRPRSFPCESSECVAVLPGDLILCFQEGKEQA
LYFDAHVLDTQRRRHDVRGCRCRFLVRYDHDQSEEIVQLRKICRRPETDYRLQQLHAVNEAASTEPSKSGVDSVLLSGQRINFEATQKQNANINVHTQTNTQEGRSTETN
SAPTTLNSGNSAASSAFSSGIVTSNSVSGLSADNVSDGKLLS

CmoCh16G004430 (gene) of Cucurbita moschata (Rifu) v1 genome