CuGenDBv2

Gene ID	Sgr023006
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	HTH myb-type domain-containing protein
Genome location	tig00000729:1864641..1878814
RNA-Seq Expression	Sgr023006
Synteny	Sgr023006
Gene Ontology terms	NA
InterPro domains	IPR001005 - SANT/Myb domain IPR009057 - Homeobox-like domain superfamily IPR017930 - Myb domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7029668.1 hypothetical protein SDJN02_08008 [Cucurbita argyrosperma subsp. argyrosperma]

7.6e-256

81.68

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        RRYSPTTVLALLQEVAQVPEAKI+W ELVKNTSTGISN REYQMLWRHLAY HALLDNLEDE APLEDDSDLECDLEPF SVSCETL+EAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         S SDL+VPSSSTIEAPLTI+LPRSY  GV+ ENVDP CSIKGA ITVPVSVQRQPVL P S EGLN NGS+YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ
        GEGNWANI+RGDFLSDRTASQLSQRWAIIKK+HGNL VGANT GT LSEVQLAARHAMSLALDRH VGSLKAARISGSASTN IGNGSS AAV TSEQ+Q
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP
        DKLH+SPTHTKPSPIGSSSLTAKAQVTTSKK+I +SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHI AK+PAS  TPTPGRG NHLE+HP
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP

Query:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD
        S+KT T SN P VMP +SRG P+KT S  TA L SVPTDQN+AVAS T AADPLS KEIKTVE++RGRGLG VQ T QK++ CLSR+S+SER  +E+PAD
Subjt:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD

Query:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN
        +GP LKRQ TET++C SSS NM TADG I+ E  NQVEERQNSN    VP SSD+Q  MNQS VE SKPQ M  D +GKD PIMK DG SENSGHKE  N
Subjt:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN

Query:  EILEGN
        EILEGN
Subjt:  EILEGN

XP_022131905.1 uncharacterized protein LOC111004931 [Momordica charantia]

6.8e-273

86.24

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        +RYSPTTVLALLQEV QV EAKIDWNELVKNTSTGI NAREYQMLWRHLAY HALLDNL+DE APLEDDSDLECDLEPF SVSCE LSEAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         SPSDL+VPSSSTIEAPLTINLPRSYTSGV+LE+VDP   IKGA ITVPVSVQRQPVL PSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGSSFAAVATSEQVQD
        GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVG NT GTQLSEVQLAARHAMSLALD+HVGSLKAARISGSA TNT+GNGSS AAVATSEQ+Q+
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGSSFAAVATSEQVQD

Query:  KLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHPS
        KLHQS T TKPS IG SSLTAKAQVT +KK+IT+SS DSD IVRAAAVAAGARIASPADAASLLKAAQSKN IHIMAKVPAS+ TPTPGRGPNHLE HPS
Subjt:  KLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHPS

Query:  VKTATFSNNPTVMPCVSRGGPIKTMSPTAALL-SVPTDQNVAVASATAADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPADIG
        +KT   SNNPTVMP VSRGGPIKT+SPT A++ SVPTDQN+AVASATAA PLS KEIKTVEEIRGRGLGDVQATSQKDEDCLSR+SISERV+EE+PAD+G
Subjt:  VKTATFSNNPTVMPCVSRGGPIKTMSPTAALL-SVPTDQNVAVASATAADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPADIG

Query:  PVLKRQATETSNCSSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADNEIL
        P LK+QATETSN SSSLN+  ADGDI+ E G+QVEERQNSN N  VP SSDEQ SMNQS VE SKPQ M  DGNGKD P MKTDGCS+N GHKEA NEIL
Subjt:  PVLKRQATETSNCSSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADNEIL

Query:  EGN
        EGN
Subjt:  EGN

XP_022961793.1 uncharacterized protein LOC111462453 isoform X1 [Cucurbita moschata]

1.3e-255

81.85

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        RRYSPTTVLALLQEVAQVPEAKI+W ELVKNTSTGISN REYQMLWRHLAY HALLDNLEDE APLEDDSDLECDLEPF SVSCETL+EAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         S SDL+VPSSSTIEAPLTI+LPRSY  GV+ ENVDP CSIKGA ITVPVSVQRQPVL P S EGLN NGS+YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ
        GEGNWANI+RGDFLSDRTASQLSQRWAIIKK+HGNL VGANT GT LSEVQLAARHAMSLALDRH VGSLKAARISGSASTN IGNGSS AAV TSEQVQ
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP
        DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKK+I +SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHI AK+PAS  TPTPGRG NHLE+HP
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP

Query:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD
        S+KT T SN P VMP +SRG P+KT S  TA L SVPTDQN+AVAS T AADPLS KEIKTVE++RGRGLG VQ T QK++ CLSR+S+SERV +E+PAD
Subjt:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD

Query:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN
        +GP LKRQ TET++C SSS NM TADG I+ E  NQVEERQNSN    VP SSD+Q  MNQS VE SKPQ M  D +GKD PI K DG SENS HKE  N
Subjt:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN

Query:  EILEGN
        EILEGN
Subjt:  EILEGN

XP_023545927.1 uncharacterized protein LOC111805215 isoform X1 [Cucurbita pepo subsp. pepo]

7.6e-256

82.01

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        RRYSPTTVLALLQEVAQVPEAKI+W ELVKNTSTGISN REYQMLWRHLAY HALLDNLEDE APLEDDSDLECDLEPF SVSCETL+EAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         S SDL+VPSSSTIEAPLTI+LPRSY  GV+ ENVDP CSIKGA ITVPVSVQRQPVL P S EGLN NGS+YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ
        GEGNWANI+RGDFLSDRTASQLSQRWAIIKK+HGNL VGANT GT LSEVQLAARHAMSLALDRH VGSLKAARISGSASTN IGNGSS A  ATSEQVQ
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP
        DKL QSPTHTKPSPIGSSSLTAKAQVTTSKK+I +SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHI AK+PAS  TPTPGRG NHLE+HP
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP

Query:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASATAA-DPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD
        S+KT T SN   VMP +SRG P+KT S  TA L SVPTDQN+AVAS TAA DPLS KEIKTVE++RGRGLG VQ T QK++ CLSR+SISERV +E+PAD
Subjt:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASATAA-DPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD

Query:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN
        +GP LKRQ TETSNC SSS N  TADG I+ E  NQVEERQNSN    VP SSD+Q  MNQS VE SKPQ M  D +GKD PI K DGCSENSGHKEA N
Subjt:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN

Query:  EILEGN
        +ILEGN
Subjt:  EILEGN

XP_038885320.1 uncharacterized protein LOC120075747 [Benincasa hispida]

5.1e-260

82.37

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS
        RRYSPTTVLALLQEVAQVPE KIDWNELVKNTSTGISN REYQMLWRHLAY HALLD+LEDE APL+DDSDLECDLEPF SVSCETL+EAAAC KVFISS
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS

Query:  --PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
          PSDL+VPSSSTIEAPLTI+LPRSYT GV+ ENVDP CSIKGA ITVPVSVQRQPVL P SAEG+N NGS+YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  --PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGSSFAAVATSEQVQD
        GEGNWANILRGDFLSDRTASQLSQRWAIIKK+HGNLNVGA+T GTQLSEVQLAARHAMSLALDRHVGSLKA RISGSASTNTIGNGSS  AVATSEQVQD
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGSSFAAVATSEQVQD

Query:  KLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHPS
        KLHQSPTH KPS I SSSLTAKAQVTTSKK+I +SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHIMAKVPAS   PTPGRGPNHLE+HPS
Subjt:  KLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHPS

Query:  VKTATFSNNPTVMPCVSRGGPIKTMSPTAALL-SVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPADI
        +K  T SN P  +P +SRGGP+K  SPT A L SVPT+QN AVAS T AADPLS KEIKTVEEIRGRGLG VQATSQK+E CLS+QS+S RVQEE+PAD+
Subjt:  VKTATFSNNPTVMPCVSRGGPIKTMSPTAALL-SVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPADI

Query:  GPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADNE
        G  LKRQATET+NC SSS NM TADG+I+ E  NQ EERQNSN    V   SD+QG MNQS VE SKPQ M  DG+G D PI K DGC+ENSGHKEA +E
Subjt:  GPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADNE

Query:  ILEGNIK
        I+EGN K
Subjt:  ILEGNIK

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BCC8 uncharacterized protein LOC103488120

1.4e-247

78.54

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISN REYQMLWRHLAY HALLD+LEDE APLEDDSDLECDLEPF SVSCETL+EAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         SPSDL+VP+SSTIEAPLTI+LPRSYT GV+ ENVDP CSIKG  ITVPVSVQRQPVLAP SAEGLN NG +YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLK-AARISGSASTNTIGNGSSFAAVATSEQVQ
        GEGNWANI+RGDFLSDRTASQLSQRWAIIKK+HGNLNVG NT GTQLSEVQLAARHAMSLAL  HVGSLK AARI+GSASTNTIGNGSS    AT EQ+Q
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLK-AARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP
        DKLHQSPTH KPS IGSSSLT KAQVTTSKK+I +SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHIMAKVPAS  TPTPGRGPNHLE+HP
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP

Query:  SVKTATFSNNPTVMPCVSRGGPIKTMSPTAA-LLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQS------------
        S+K  + SN PTV+P +SRGGP+K  SPT A L SVPTDQN AVAS T AAD LS KEIK  EEIRGRGL  VQATSQK E CLS+QS            
Subjt:  SVKTATFSNNPTVMPCVSRGGPIKTMSPTAA-LLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQS------------

Query:  ---------ISERVQEERPADIGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGK
                 +S RVQEE+PAD+GP LKRQATETSNC SSS NM TADGD + E  NQVEERQ SN N  VP SSD+QG +NQS VE ++PQ M  D NGK
Subjt:  ---------ISERVQEERPADIGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGK

Query:  DMPIMKTDGCSENSGHKEADNEILEGNIK
        D   MKTD CSENS  KEA +E+ EGN K
Subjt:  DMPIMKTDGCSENSGHKEADNEILEGNIK

A0A5A7VDH5 Cell wall protein DAN4 isoform X2

4.8e-248

78.54

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISN REYQMLWRHLAY HALLD+LEDE APLEDDSDLECDLEPF SVSCETL+EAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         SPSDL+VP+SSTIEAPLTI+LPRSYT GV+ ENVDP CSIKG  ITVPVSVQRQPVLAP SAEGLN NG +YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLK-AARISGSASTNTIGNGSSFAAVATSEQVQ
        GEGNWANI+RGDFLSDRTASQLSQRWAIIKK+HGNLNVG NT GTQLSEVQLAARHAMSLAL  HVGSLK AARI+GSASTNTIGNGSS    AT EQ+Q
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLK-AARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP
        DKLHQSPTH KPS IGSSSLT KAQVTTSKK+I++SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHIMAKVPAS  TPTPGRGPNHLE+HP
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP

Query:  SVKTATFSNNPTVMPCVSRGGPIKTMSPTAA-LLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQS------------
        S+K  + SN PTV+P +SRGGP+K  SPT A L SVPTDQN AVAS T AAD LS KEIK  EEIRGRGL  VQATSQK E CLS+QS            
Subjt:  SVKTATFSNNPTVMPCVSRGGPIKTMSPTAA-LLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQS------------

Query:  ---------ISERVQEERPADIGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGK
                 +S RVQEE+PAD+GP LKRQATETSNC SSS NMSTADGD + E  NQVEERQ SN N  VP SSD+QG +NQS VE ++PQ M  D NGK
Subjt:  ---------ISERVQEERPADIGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGK

Query:  DMPIMKTDGCSENSGHKEADNEILEGNIK
        D    KTD CSENS  KEA +E+ EGN K
Subjt:  DMPIMKTDGCSENSGHKEADNEILEGNIK

A0A6J1BQZ5 uncharacterized protein LOC111004931

3.3e-273

86.24

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        +RYSPTTVLALLQEV QV EAKIDWNELVKNTSTGI NAREYQMLWRHLAY HALLDNL+DE APLEDDSDLECDLEPF SVSCE LSEAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         SPSDL+VPSSSTIEAPLTINLPRSYTSGV+LE+VDP   IKGA ITVPVSVQRQPVL PSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGSSFAAVATSEQVQD
        GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVG NT GTQLSEVQLAARHAMSLALD+HVGSLKAARISGSA TNT+GNGSS AAVATSEQ+Q+
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGSSFAAVATSEQVQD

Query:  KLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHPS
        KLHQS T TKPS IG SSLTAKAQVT +KK+IT+SS DSD IVRAAAVAAGARIASPADAASLLKAAQSKN IHIMAKVPAS+ TPTPGRGPNHLE HPS
Subjt:  KLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHPS

Query:  VKTATFSNNPTVMPCVSRGGPIKTMSPTAALL-SVPTDQNVAVASATAADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPADIG
        +KT   SNNPTVMP VSRGGPIKT+SPT A++ SVPTDQN+AVASATAA PLS KEIKTVEEIRGRGLGDVQATSQKDEDCLSR+SISERV+EE+PAD+G
Subjt:  VKTATFSNNPTVMPCVSRGGPIKTMSPTAALL-SVPTDQNVAVASATAADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPADIG

Query:  PVLKRQATETSNCSSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADNEIL
        P LK+QATETSN SSSLN+  ADGDI+ E G+QVEERQNSN N  VP SSDEQ SMNQS VE SKPQ M  DGNGKD P MKTDGCS+N GHKEA NEIL
Subjt:  PVLKRQATETSNCSSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADNEIL

Query:  EGN
        EGN
Subjt:  EGN

A0A6J1HCU7 uncharacterized protein LOC111462453 isoform X1

6.2e-256

81.85

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        RRYSPTTVLALLQEVAQVPEAKI+W ELVKNTSTGISN REYQMLWRHLAY HALLDNLEDE APLEDDSDLECDLEPF SVSCETL+EAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         S SDL+VPSSSTIEAPLTI+LPRSY  GV+ ENVDP CSIKGA ITVPVSVQRQPVL P S EGLN NGS+YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ
        GEGNWANI+RGDFLSDRTASQLSQRWAIIKK+HGNL VGANT GT LSEVQLAARHAMSLALDRH VGSLKAARISGSASTN IGNGSS AAV TSEQVQ
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP
        DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKK+I +SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHI AK+PAS  TPTPGRG NHLE+HP
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP

Query:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD
        S+KT T SN P VMP +SRG P+KT S  TA L SVPTDQN+AVAS T AADPLS KEIKTVE++RGRGLG VQ T QK++ CLSR+S+SERV +E+PAD
Subjt:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD

Query:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN
        +GP LKRQ TET++C SSS NM TADG I+ E  NQVEERQNSN    VP SSD+Q  MNQS VE SKPQ M  D +GKD PI K DG SENS HKE  N
Subjt:  IGPVLKRQATETSNC-SSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN

Query:  EILEGN
        EILEGN
Subjt:  EILEGN

A0A6J1KCU7 uncharacterized protein LOC111492110 isoform X1

2.4e-255

81.52

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-
        RRYSPTTVLALLQEVAQVPEAKI+W ELVKNTSTGISN REYQMLWRHLAY HALLDNLEDE APLEDDSDLECDLEPF SVSCETL+EAAACAKVFIS 
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFIS-

Query:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
         S SDL+VPSSSTIEAPLTI+LPRSY  GV+ ENVDP CSIKGA ITVPVSVQRQPVL P S EGLN NGS+YGNNASRRKRKPWSEAEDLEL+AAVKKC
Subjt:  -SPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ
        GEGNWANI+RGDFLSDRTASQLSQRWAIIKK+HGNL VGANT GT LSEVQLAARHAMSLALDRH VGSLKAARISGSASTN IGNGSS AAVATS+QVQ
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRH-VGSLKAARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP
        +KLHQSPTHTKPSPIGSSSLTAKAQVTTSKK+I +SS DSDCIVRAAAVAAGARIASPADAASLLKAAQSKN IHI AK+PAS  TPTPGRG NHLE+HP
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGPNHLESHP

Query:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD
        S+K+ T SN P VMP +SRG P+KT S  TA L SVP+DQN+AVAS T AADPLS KEIKTVE++RGRGLG VQ T QK++ CLSR+ +SERV +E+PAD
Subjt:  SVKTATFSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASAT-AADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPAD

Query:  IGPVLKRQATETSNCS-SSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN
        +GP LKRQ TETSNCS SS NM TADG I  E  NQVEERQNSN    VP SSD++  MNQS VE  KPQ M  D +GKD PI K DG SENSGHKEA N
Subjt:  IGPVLKRQATETSNCS-SSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGM--DGNGKDMPIMKTDGCSENSGHKEADN

Query:  EILEGN
        EILEGN
Subjt:  EILEGN

SwissProt top hits

e value

%identity

Alignment

P70371 Telomeric repeat-binding factor 1

6.7e-05

43.86

Show/hide

Query:  NNASRRKRKPWSEAEDLELIAAVKKCGEGNWANILRGDFLSDRTASQLSQRWAIIKK
        + + RRKR+ W   ED  L   VKK GEGNWA IL     ++RT+  L  RW  +K+
Subjt:  NNASRRKRKPWSEAEDLELIAAVKKCGEGNWANILRGDFLSDRTASQLSQRWAIIKK

Arabidopsis top hits

e value

%identity

Alignment

AT1G09710.1 Homeodomain-like superfamily protein

1.8e-61

39.5

Show/hide

Query:  RYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS-
        RY   T+L +LQE++   E K+DWN LVK T+TGI+NAREYQ+LWRHL+Y H LL  +ED+  PL+DDSD+EC+LE   +VS E   EA A  KV  +S 
Subjt:  RYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS-

Query:  -PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKCG
          S+  +   ST+EAPLTIN+P +   G +  +  P  S +G  I  PV +Q+      +S EG+NGNGS+  + A RRKRK WS  ED EL AAVK+CG
Subjt:  -PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKCG

Query:  EGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAA-----RISGSASTNTIGNGSSFAAVATSE
        EGNWA+I++GDF  +RTASQLSQRWA+I+KR  + +   +  G Q +E +LA  HA+SLAL     S K A       S    T T  NG S      S 
Subjt:  EGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAA-----RISGSASTNTIGNGSSFAAVATSE

Query:  QVQDKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKV-PASNNTPTPGRGPNHL
        Q Q    QS    +  P   +SL A A+    KK    S+  SD +V A +VAA A +     AAS  K    K     + K  P  + +      P+  
Subjt:  QVQDKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKV-PASNNTPTPGRGPNHL

Query:  ESHPSVKTAT---------------------FSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASATAADPLSGK
         S P V+  T                      SN P ++   S G  + + S P A+L  + ++Q V   S  A + ++ K
Subjt:  ESHPSVKTAT---------------------FSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNVAVASATAADPLSGK

AT1G09710.2 Homeodomain-like superfamily protein

9.1e-58

36.58

Show/hide

Query:  RYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS-
        RY   T+L +LQE++   E K+DWN LVK T+TGI+NAREYQ+LWRHL+Y H LL  +ED+  PL+DDSD+EC+LE   +VS E   EA A  KV  +S 
Subjt:  RYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS-

Query:  -PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKCG
          S+  +   ST+EAPLTIN+P +   G +  +  P  S +G  I  PV +Q+      +S EG+NGNGS+  + A RRKRK WS  ED EL AAVK+CG
Subjt:  -PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKCG

Query:  EGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGS--------------
        EGNWA+I++GDF  +RTASQLSQRWA+I+KR  + +   +  G Q +E +LA  HA+SLAL     S K A I  S+  +   N S              
Subjt:  EGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNTIGNGS--------------

Query:  -------------------SFAAVATSEQVQDKLHQSPTHTKP-----SPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASL
                           S   +  +E       Q    +KP        G+S   AK++V   KK    S+  SD +V A +VAA A +     AAS 
Subjt:  -------------------SFAAVATSEQVQDKLHQSPTHTKP-----SPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASL

Query:  LKAAQSKNTIHIMAKV-PASNNTPTPGRGPNHLESHPSVKTAT---------------------FSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNV
         K    K     + K  P  + +      P+   S P V+  T                      SN P ++   S G  + + S P A+L  + ++Q V
Subjt:  LKAAQSKNTIHIMAKV-PASNNTPTPGRGPNHLESHPSVKTAT---------------------FSNNPTVMPCVSRGGPIKTMS-PTAALLSVPTDQNV

Query:  AVASATAADPLSGK
           S  A + ++ K
Subjt:  AVASATAADPLSGK

AT1G58220.1 Homeodomain-like superfamily protein

1.3e-59

38.71

Show/hide

Query:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS
        +RY   T+L LLQE+A   EAK++WNELVK TSTGI++AREYQ+LWRHLAY  +L+  + +    L+DDSD+EC+LE    VS + ++EA A  KV  +S
Subjt:  RRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLEDENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISS

Query:  --PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC
          PS+  +P  ST+EAPLTIN+P S   G + E  D   S +G  IT        PV  P +AEG NGNG +  + A R++RK WS  ED ELIAAVK+ 
Subjt:  --PSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSSYGNNASRRKRKPWSEAEDLELIAAVKKC

Query:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLK-AARISGSASTNTIGNGSSFAAVATSEQVQ
        GEG+WA I + +F  +RTASQLSQRW  I++R    N  +  TG Q +E Q+AA  A+SLA+   + S K A  ++   S+ TI  G+     ++   +Q
Subjt:  GEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLK-AARISGSASTNTIGNGSSFAAVATSEQVQ

Query:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIM------AKVPASNNTPTPGRGPN
         +    P     S   +S   AK++V   KK    S+  +D +V A +VAA A ++  A A ++ K    KN +  +       K  ++ + P P    +
Subjt:  DKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIM------AKVPASNNTPTPGRGPN

Query:  HLESHPSVKTATFSNNPTVMPCVS--RGGPIKTMSPTAAL------LSVPTDQNVAVASATAADP
         L + P VKTA  ++ P     +S  +  P+KT +  A+L      +S P  + V   ++ A+ P
Subjt:  HLESHPSVKTATFSNNPTVMPCVS--RGGPIKTMSPTAAL------LSVPTDQNVAVASATAADP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAATGAACTTGGCTATGGGGGCAAAGGAAGAACGCCTGTAACTCAGAAACGCAGGAAATACATAGACCTTATTCAAATACTTAAGCCAATTCAGCATCTCAATCGTAA
GATAGATAAGGGTGGCCAATCATTGTTAGCAGGAATCCACGAGGGTGGAGCGTACCTCCCACAGACCACGGAAGACGTCGGGTTGCTTACGAGGAAAGGCGTTTCAATGC
CTCCTGAGCGTTGGATAATCGTGGCTCGATGTTCAACGCTTCTTCGTATGCGTTCTTGGCCTCTCCTACATCTTCAACTCAGCTCGCTTAAACAACGCGTCTCCTCGCTC
CTCGTCGCTGAGCGACTTAGCAGCGAGGGGCGACAGAGCCGTATCGAGCGATTCCAGAGCAGAGGTCTTGAATCCTTGGATGTCGAGAGCCAGAGCCTTGAGGATGTGAG
CAGCGGCATCCTTAGGATCGAGAGCGATGGCCTTGTCAGCTTCCGCTACCACTTCTTCGGCCAACGACGTCGCCGAGGAGCGAGACGGGGCAGATCTTGCTCGAGCGAGA
AGCTGAGCGCCTCTTACGAAATGGCGTTTCGATTCGACATCAGCTCGAAAGCGCAACCGAAGCTTGGTGAAGAATCTCTGGGGAATGTTATGCATGGCGAGGAACATGAA
GACCATTACGAGGATGATACCAATTTGAAGAAGTATGTCGATCACCATCTTTCTCAATCTCTGGACTGCCTGCAATTTCTTTCCCTCTGCTTCTTATCGATTCCGGGAAG
TGGAGAAACTCCGAATACGATCGGAATCAGATCTGAAAGGAGGAGGTACTCTCCGACAACGGTGCTGGCATTGCTACAAGAAGTTGCACAAGTTCCAGAAGCGAAGATTG
ATTGGAACGAGTTGGTGAAAAATACTTCGACTGGGATTTCTAATGCTCGGGAATATCAGATGCTCTGGCGGCATTTAGCTTATCATCATGCATTGCTTGATAATTTGGAA
GATGAGAACGCACCTTTGGAAGATGACAGTGACTTAGAGTGTGATTTGGAGCCATTTTCATCAGTCAGCTGCGAAACCTTATCGGAGGCTGCTGCGTGTGCGAAGGTATT
TATCTCTTCTCCAAGTGACTTGAGTGTTCCAAGTAGTAGCACAATCGAGGCTCCACTAACTATAAACCTACCAAGAAGTTACACGTCCGGGGTTCGGTTAGAAAATGTAG
ACCCTACTTGCTCTATAAAAGGGGCATGCATCACAGTTCCTGTTTCTGTTCAGCGACAGCCAGTCCTTGCCCCATCATCAGCTGAAGGATTGAATGGAAATGGATCATCA
TATGGCAACAATGCTTCTCGGAGGAAAAGAAAACCGTGGTCAGAGGCGGAGGACCTTGAGTTGATTGCTGCAGTGAAGAAATGTGGTGAAGGGAATTGGGCAAACATCTT
ACGTGGAGACTTCTTGAGCGATAGAACTGCTTCTCAGCTATCTCAGAGATGGGCAATTATTAAAAAGAGACATGGAAATTTGAATGTGGGAGCCAACACGACCGGCACAC
AGCTATCTGAGGTGCAGCTGGCAGCTCGTCATGCAATGTCCTTAGCTCTTGATAGGCATGTTGGTAGCTTGAAAGCAGCTCGAATAAGTGGCTCAGCCAGTACAAATACG
ATTGGTAATGGTAGCTCCTTTGCTGCTGTTGCCACTTCGGAACAAGTGCAAGATAAATTACATCAAAGCCCTACTCATACAAAACCATCTCCAATTGGATCATCAAGTCT
AACAGCCAAAGCTCAAGTTACTACATCCAAGAAGATTATTACAAGGTCTTCTTTGGATTCCGACTGTATTGTTAGAGCTGCTGCCGTTGCTGCTGGGGCTCGCATTGCTT
CTCCAGCAGATGCTGCATCTCTACTCAAGGCTGCTCAGTCAAAGAATACCATCCATATCATGGCCAAAGTCCCCGCTTCAAACAATACACCCACTCCTGGCAGGGGGCCA
AACCATTTAGAATCTCATCCTAGTGTTAAGACAGCCACCTTCTCTAACAATCCTACAGTCATGCCATGTGTGTCTCGTGGTGGTCCCATAAAGACCATGTCTCCAACTGC
CGCATTATTGAGTGTGCCAACAGACCAGAATGTTGCTGTTGCCTCTGCAACAGCTGCTGATCCATTGTCAGGAAAGGAGATCAAGACAGTTGAAGAAATTAGAGGTCGTG
GTTTAGGTGATGTACAAGCTACATCCCAAAAGGATGAAGATTGTCTTTCCAGACAATCAATATCTGAGAGAGTTCAAGAAGAAAGGCCAGCAGACATAGGACCAGTTTTG
AAAAGACAAGCTACTGAGACTAGTAATTGTAGTAGTTCACTAAACATGTCGACAGCTGATGGTGATATTGAAAGTGAAATTGGAAACCAGGTAGAAGAGAGACAAAACAG
TAATCTCAATGACCAGGTTCCCAGTTCCTCAGATGAGCAAGGAAGCATGAATCAATCACCGGTGGAGAGCTCTAAACCTCAGGGTATGGATGGTAATGGAAAGGATATGC
CTATCATGAAAACAGATGGATGTAGCGAAAATTCGGGGCACAAGGAAGCTGATAATGAGATTCTGGAGGGAAACATTAAGAGCATTAGCGTCGTAGTTAGATCCGCGTGC
AACCATTACAAATCCGGTGCATCAGCAGTTCTGAAGAGAGGACAGCCATTGTTCCATATAATTCTTGCTCTCTGCACCATGCAAAACACCGCAAAACTGTTGTCAGGGTC
ATCATCGCTCTGGAATCCAGGTCCATGGGGTTCCGACCATCCAATTGACCAATCCGAGTCATCAGATTCAGACCCTGAAACACATCCTCCATCAGATGGAACTAGAACAA
TGTCATATTCCCTGTCAATTTTCCTCTCTTCACGACTATGCCATTTCCGCTTCACCCTTCTAGACGAGGATGATATGTTGGCCCCATTAACTAAAGGAAATTTTAAAGTA
TCTGGTTCCCGAATGGCTGTATCTAGCGAAGCATTTAAAGGAGACCCACCATTTGAGCTTCGAGGTTCTTTATGCTTCCCACTCCACAACCACCACGAGAGTTGGGGAAA
TGCCACAGCCATGCAAAGGCTGTCGAATTCAAATTTGAACACCCCAAAATTTCAGCAATTCATCGCCAAAAAGAGACGAGTCGCAAAAATGGAGAAGAAAGATGGAAGGC
CTTTGGATACAGTCGGATCGCGATGCTCGTCCAGTAATCATTTGACACCGATCAAGTTTCCTAAATTAAATATAAATTACGTTTACGTGGTGAGAAAGGCTGCAACAAGG
ACTTTATCCTGTGCAAGCAACGACCTCCAAAGTAAATGTACGAACGTCCACGTGGACGGTGGAGATTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNELGYGGKGRTPVTQKRRKYIDLIQILKPIQHLNRKIDKGGQSLLAGIHEGGAYLPQTTEDVGLLTRKGVSMPPERWIIVARCSTLLRMRSWPLLHLQLSSLKQRVSSL
LVAERLSSEGRQSRIERFQSRGLESLDVESQSLEDVSSGILRIESDGLVSFRYHFFGQRRRRGARRGRSCSSEKLSASYEMAFRFDISSKAQPKLGEESLGNVMHGEEHE
DHYEDDTNLKKYVDHHLSQSLDCLQFLSLCFLSIPGSGETPNTIGIRSERRRYSPTTVLALLQEVAQVPEAKIDWNELVKNTSTGISNAREYQMLWRHLAYHHALLDNLE
DENAPLEDDSDLECDLEPFSSVSCETLSEAAACAKVFISSPSDLSVPSSSTIEAPLTINLPRSYTSGVRLENVDPTCSIKGACITVPVSVQRQPVLAPSSAEGLNGNGSS
YGNNASRRKRKPWSEAEDLELIAAVKKCGEGNWANILRGDFLSDRTASQLSQRWAIIKKRHGNLNVGANTTGTQLSEVQLAARHAMSLALDRHVGSLKAARISGSASTNT
IGNGSSFAAVATSEQVQDKLHQSPTHTKPSPIGSSSLTAKAQVTTSKKIITRSSLDSDCIVRAAAVAAGARIASPADAASLLKAAQSKNTIHIMAKVPASNNTPTPGRGP
NHLESHPSVKTATFSNNPTVMPCVSRGGPIKTMSPTAALLSVPTDQNVAVASATAADPLSGKEIKTVEEIRGRGLGDVQATSQKDEDCLSRQSISERVQEERPADIGPVL
KRQATETSNCSSSLNMSTADGDIESEIGNQVEERQNSNLNDQVPSSSDEQGSMNQSPVESSKPQGMDGNGKDMPIMKTDGCSENSGHKEADNEILEGNIKSISVVVRSAC
NHYKSGASAVLKRGQPLFHIILALCTMQNTAKLLSGSSSLWNPGPWGSDHPIDQSESSDSDPETHPPSDGTRTMSYSLSIFLSSRLCHFRFTLLDEDDMLAPLTKGNFKV
SGSRMAVSSEAFKGDPPFELRGSLCFPLHNHHESWGNATAMQRLSNSNLNTPKFQQFIAKKRRVAKMEKKDGRPLDTVGSRCSSSNHLTPIKFPKLNINYVYVVRKAATR
TLSCASNDLQSKCTNVHVDGGD

Sgr023006 (gene) of Monk fruit (Qingpiguo) v1 genome