; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sed0015717 (gene) of Chayote v1 genome

Gene IDSed0015717
OrganismSechium edule (Chayote v1)
DescriptionHomeobox-leucine zipper protein
Genome locationLG14:18805674..18807787
RNA-Seq ExpressionSed0015717
SyntenySed0015717
Gene Ontology termsGO:0006357 - regulation of transcription by RNA polymerase II (biological process)
GO:0005634 - nucleus (cellular component)
GO:0000981 - DNA-binding transcription factor activity, RNA polymerase II-specific (molecular function)
GO:0043565 - sequence-specific DNA binding (molecular function)
InterPro domainsIPR001356 - Homeobox domain
IPR003106 - Leucine zipper, homeobox-associated
IPR009057 - Homeobox-like domain superfamily
IPR017970 - Homeobox, conserved site


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7034261.1 Homeobox-leucine zipper protein HAT22 [Cucurbita argyrosperma subsp. argyrosperma]2.0e-9373.68Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE
        MGFD+ SNTGLLLGLGL LP+ PA LSHKPKKP  LF F A ESEPSLTLGLST ET                     ++ SGGRVKRER+VSGED++EE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE

Query:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL
        K CSRVSDE+EDGS +RKKLRLTK+QSALLE+SFKLHSTLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENR+LQKEL
Subjt:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL

Query:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC
        QELKALKLA PL MQMPAATL++CPSC+R GGGATA N D  SK        P F K FT PSAAC
Subjt:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC

XP_022950875.1 homeobox-leucine zipper protein HAT22 [Cucurbita moschata]2.0e-9373.68Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE
        MGFD+ SNTGLLLGLGL LP+ PA LSHKPKKP  LF F A ESEPSLTLGLST ET                     ++ SGGRVKRER+VSGED++EE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE

Query:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL
        K CSRVSDE+EDGS +RKKLRLTK+QSALLE+SFKLHSTLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENR+LQKEL
Subjt:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL

Query:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC
        QELKALKLA PL MQMPAATL++CPSC+R GGGATA N D  SK        P F K FT PSAAC
Subjt:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC

XP_023517048.1 homeobox-leucine zipper protein HAT22-like [Cucurbita pepo subsp. pepo]2.7e-9375.39Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLST-----------AETAACSGGRVKREREVSGEDVDEEKGCSRVSDEE
        MGFD+  NTGLLLGLGLTL +KPA LS KP  P  LF F A ESEPSLTLGLST           +  ++ SGGRVKRER+VSGED++EEK  SRVSDEE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLST-----------AETAACSGGRVKREREVSGEDVDEEKGCSRVSDEE

Query:  EDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP
        EDGSN+RKKLRLTK+QSALLEESFKLH TLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKL  
Subjt:  EDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP

Query:  PLFMQMPAATLSICPSCDRMGGGATA--GNGDLKS------KPLFYKPFTNPSAAC
        PLFMQMPAATL++CPSC+R+GG      GNG+ K+      KP FYKPFTNPSAAC
Subjt:  PLFMQMPAATLSICPSCDRMGGGATA--GNGDLKS------KPLFYKPFTNPSAAC

XP_023543052.1 homeobox-leucine zipper protein HAT22 [Cucurbita pepo subsp. pepo]2.0e-9373.68Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE
        MGFD+ SNTGLLLGLGL LP+ PA LSHKPKKP  LF F A ESEPSLTLGLST ET                     ++ SGGRVKRER+VSGED++EE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE

Query:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL
        K CSRVSDE+EDGS +RKKLRLTK+QSALLE+SFKLHSTLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENR+LQKEL
Subjt:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL

Query:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC
        QELKALKLA PL MQMPAATL++CPSC+R GGGATA N D  SK        P F K FT PSAAC
Subjt:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC

XP_038883701.1 homeobox-leucine zipper protein HAT22-like [Benincasa hispida]1.1e-9474.14Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET------------------AACSGGRVKREREVSGEDVDEEKGC
        MGFD+ SNTGLLLGLGLTLP+ P  LS KPKKP    CF A ESEPSLTLGLST +T                  ++ SGGRVKRER+VSGED++EEK  
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET------------------AACSGGRVKREREVSGEDVDEEKGC

Query:  SRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQEL
        SRVSDE+EDGSN+RKKLRLTK QSALLEESFKLHSTLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQEL
Subjt:  SRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQEL

Query:  KALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC
        KALKLA PLFMQMPAATL++CPSC+R+GGG  A NGD  SK        P F+K FT PSAAC
Subjt:  KALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC

TrEMBL top hitse value%identityAlignment
A0A0A0KJS8 Homeobox-leucine zipper protein2.7e-9171.97Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADL-SHKPKKPARLFCF-AAESEPSLTLGLSTAET------------------AACSGGRVKREREVSGEDVDEEKG
        MGFD+ SNT LLLGLGLTLP+ P  L S KPKKP    CF   ESEPSLTLGLST +T                  ++ SG RVKRER+VSGE+++EEK 
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADL-SHKPKKPARLFCF-AAESEPSLTLGLSTAET------------------AACSGGRVKREREVSGEDVDEEKG

Query:  CSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQE
         SRVSDE+EDGSN+RKKLRLTK+QSALLEESFKLHSTLNPK+KQALA ELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQE
Subjt:  CSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQE

Query:  LKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGD--------LKSKPLFYKPFTNPSAAC
        LKALKLA PLFMQMPAATL++CPSC+R+GGGA   NGD        + +KP FYK FT PSAAC
Subjt:  LKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGD--------LKSKPLFYKPFTNPSAAC

A0A6J1GGZ5 homeobox-leucine zipper protein HAT229.9e-9473.68Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE
        MGFD+ SNTGLLLGLGL LP+ PA LSHKPKKP  LF F A ESEPSLTLGLST ET                     ++ SGGRVKRER+VSGED++EE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE

Query:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL
        K CSRVSDE+EDGS +RKKLRLTK+QSALLE+SFKLHSTLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENR+LQKEL
Subjt:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL

Query:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC
        QELKALKLA PL MQMPAATL++CPSC+R GGGATA N D  SK        P F K FT PSAAC
Subjt:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC

A0A6J1HJS8 homeobox-leucine zipper protein HAT22-like2.9e-9375Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLST-----------AETAACSGGRVKREREVSGEDVDEEKGCSRVSDEE
        MGFD+  NTGLLLGLGLTL +KPA LS KP  P  LF F A ESEPSLTLGLST           +  ++ SGGRVKRER+VSGED++EEK  SRVSDEE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLST-----------AETAACSGGRVKREREVSGEDVDEEKGCSRVSDEE

Query:  EDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP
        EDGSN+RKKLRLTK+QSALLEESFKLH TLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRL KELQELKALKL  
Subjt:  EDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP

Query:  PLFMQMPAATLSICPSCDRMGGGATA--GNGDLKS------KPLFYKPFTNPSAAC
        PLFMQMPAATL++CPSC+R+GG      GNG+ K+      KP FYKPFTNPSAAC
Subjt:  PLFMQMPAATLSICPSCDRMGGGATA--GNGDLKS------KPLFYKPFTNPSAAC

A0A6J1IM38 homeobox-leucine zipper protein HAT22-like2.4e-9272.93Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE
        MGFD+ SNTGLLLGLGL LP+ PA LSHKPKKP  LF F A ESEPSLTLGLST ET                     ++ SGGRVKRER+V GED++EE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLSTAET---------------------AACSGGRVKREREVSGEDVDEE

Query:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL
        K CSRVSDE+EDGS +RKKLRLTK+QSALLE+SFKLHSTLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCC TLTDENR+LQKEL
Subjt:  KGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKEL

Query:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC
        QELKALKLA PL MQMPAATL++CPSC+R GGGATA N D  SK        P F K FT PSAAC
Subjt:  QELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSK--------PLFYKPFTNPSAAC

A0A6J1KU00 homeobox-leucine zipper protein HAT22-like1.3e-9374.61Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLST-----------AETAACSGGRVKREREVSGEDVDEEKGCSRVSDEE
        MGFD+  NTGLLLGLGLTL +KPA LS KP KP  LF F A ESEPSLTLGLST           +  ++ SGG+VKRER+VSGED++EEK  SRVSDEE
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCF-AAESEPSLTLGLST-----------AETAACSGGRVKREREVSGEDVDEEKGCSRVSDEE

Query:  EDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP
        EDGSN+RKKLRLTK+QSALLEESFKLH TLNPK+KQALARELNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKL  
Subjt:  EDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP

Query:  PLFMQMPAATLSICPSCDRMGGGATAGNGD--------LKSKPLFYKPFTNPSAAC
        PLFMQMPAATL++CPSC+R+GG     NG+        +  KP FYKPFTNPSAAC
Subjt:  PLFMQMPAATLSICPSCDRMGGGATAGNGD--------LKSKPLFYKPFTNPSAAC

SwissProt top hitse value%identityAlignment
A2XE76 Homeobox-leucine zipper protein HOX197.6e-5153.85Show/hide
Query:  EPSLTL--------GLSTAETAACSGG------------------RVKREREVSGEDVDEEKGCSRVS--DEEEDGSNSRKKLRLTKQQSALLEESFKLH
        EPSLTL        G +   TA  SGG                   VKRER    E+ D E+  S  +  D+++DGS +RKKLRLTK+QSALLE+ F+ H
Subjt:  EPSLTL--------GLSTAETAACSGG------------------RVKREREVSGEDVDEEKGCSRVS--DEEEDGSNSRKKLRLTKQQSALLEESFKLH

Query:  STLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP----------------PLFMQMPAATL
        STLNPK+K ALA++LNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLT+ENRRLQ+ELQEL+ALK AP                P +MQ+PAATL
Subjt:  STLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP----------------PLFMQMPAATL

Query:  SICPSCDRMGGGATAGN----GDLKSKP------LFYKPFTNPSAAC
        +ICPSC+R+GG A+A         K+ P       F+ PFT+ SAAC
Subjt:  SICPSCDRMGGGATAGN----GDLKSKP------LFYKPFTNPSAAC

A2Z1U1 Homeobox-leucine zipper protein HOX111.2e-4864.33Show/hide
Query:  EKGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKE
        ++ CSR SD E+DG ++RKKLRL+K+QSA LEESFK HSTLNPK+K ALA++LNLR RQVEVWFQNRRARTKLKQTEVDCE+LKRCCETLT+ENRRLQKE
Subjt:  EKGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKE

Query:  LQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSKPLFYKPFTNPSA
        L EL+ALK   P +M +PA TLS+CPSC+R+   +        +      P   PS+
Subjt:  LQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSKPLFYKPFTNPSA

P46603 Homeobox-leucine zipper protein HAT92.5e-6254.96Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFAAESEPSLTLGLS-----TAETAA----------------CSGGRVKREREVSGEDVDEEK
        MGFD+  NTGL+LGLG      P+ + +      R      + EPSLTL LS     T  T A                 SG  VKRER+   E  +EE+
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFAAESEPSLTLGLS-----TAETAA----------------CSGGRVKREREVSGEDVDEEK

Query:  GCSRV-SD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQK
           RV SD  E+E+G ++RKKLRLTKQQSALLEESFK HSTLNPK+KQ LAR+LNLR RQVEVWFQNRRARTKLKQTEVDCEFLK+CCETL DEN RLQK
Subjt:  GCSRV-SD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQK

Query:  ELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG----------------------DLKSKPLFYKPFTNPSAAC
        E+QELK LKL  P +M MPA+TL+ CPSC+R+GGG   GNG                       + SKP F+ PFTNPSAAC
Subjt:  ELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG----------------------DLKSKPLFYKPFTNPSAAC

P46604 Homeobox-leucine zipper protein HAT224.6e-7258.57Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFA-AESEPSLTLGLS----------------TAETAACSG------GRVKREREVSGEDVDE
        MG D+  NTGL+LGLGL+ PT P + +H  KK +          +PSLTL LS                  +T++ SG      GRVKRERE+SG D +E
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFA-AESEPSLTLGLS----------------TAETAACSG------GRVKREREVSGEDVDE

Query:  EKG-------CSRVSD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLT
        E         CSRVSD  ++E+G ++RKKLRLTKQQSALLE++FKLHSTLNPK+KQALAR+LNLR RQVEVWFQNRRARTKLKQTEVDCEFLK+CCETLT
Subjt:  EKG-------CSRVSD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLT

Query:  DENRRLQKELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG------------DLKSKPLFYKPFTNPSAAC
        DENRRLQKELQ+LKALKL+ P +M MPAATL++CPSC+R+GGG   G+              + +KP FY PFTNPSAAC
Subjt:  DENRRLQKELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG------------DLKSKPLFYKPFTNPSAAC

Q8GRL4 Homeobox-leucine zipper protein HOX197.6e-5153.85Show/hide
Query:  EPSLTL--------GLSTAETAACSGG------------------RVKREREVSGEDVDEEKGCSRVS--DEEEDGSNSRKKLRLTKQQSALLEESFKLH
        EPSLTL        G +   TA  SGG                   VKRER    E+ D E+  S  +  D+++DGS +RKKLRLTK+QSALLE+ F+ H
Subjt:  EPSLTL--------GLSTAETAACSGG------------------RVKREREVSGEDVDEEKGCSRVS--DEEEDGSNSRKKLRLTKQQSALLEESFKLH

Query:  STLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP----------------PLFMQMPAATL
        STLNPK+K ALA++LNLR RQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLT+ENRRLQ+ELQEL+ALK AP                P +MQ+PAATL
Subjt:  STLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAP----------------PLFMQMPAATL

Query:  SICPSCDRMGGGATAGN----GDLKSKP------LFYKPFTNPSAAC
        +ICPSC+R+GG A+A         K+ P       F+ PFT+ SAAC
Subjt:  SICPSCDRMGGGATAGN----GDLKSKP------LFYKPFTNPSAAC

Arabidopsis top hitse value%identityAlignment
AT2G22800.1 Homeobox-leucine zipper protein family1.8e-6354.96Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFAAESEPSLTLGLS-----TAETAA----------------CSGGRVKREREVSGEDVDEEK
        MGFD+  NTGL+LGLG      P+ + +      R      + EPSLTL LS     T  T A                 SG  VKRER+   E  +EE+
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFAAESEPSLTLGLS-----TAETAA----------------CSGGRVKREREVSGEDVDEEK

Query:  GCSRV-SD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQK
           RV SD  E+E+G ++RKKLRLTKQQSALLEESFK HSTLNPK+KQ LAR+LNLR RQVEVWFQNRRARTKLKQTEVDCEFLK+CCETL DEN RLQK
Subjt:  GCSRV-SD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQK

Query:  ELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG----------------------DLKSKPLFYKPFTNPSAAC
        E+QELK LKL  P +M MPA+TL+ CPSC+R+GGG   GNG                       + SKP F+ PFTNPSAAC
Subjt:  ELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG----------------------DLKSKPLFYKPFTNPSAAC

AT4G16780.1 homeobox protein 29.0e-4764.38Show/hide
Query:  GLSTAETAACSGGRVKREREVSGEDVDEEKGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTK
        G+S+  +   S    + ERE   ED D +   SR   ++EDG NSRKKLRL+K QSA+LEE+FK HSTLNPK+KQALA++L LRARQVEVWFQNRRARTK
Subjt:  GLSTAETAACSGGRVKREREVSGEDVDEEKGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTK

Query:  LKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAPPLFMQM-PAATLSICPSCDRM
        LKQTEVDCEFL+RCCE LT+ENRRLQKE+ EL+ALKL+P  +M M P  TL++CPSC+ +
Subjt:  LKQTEVDCEFLKRCCETLTDENRRLQKELQELKALKLAPPLFMQM-PAATLSICPSCDRM

AT4G37790.1 Homeobox-leucine zipper protein family3.3e-7358.57Show/hide
Query:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFA-AESEPSLTLGLS----------------TAETAACSG------GRVKREREVSGEDVDE
        MG D+  NTGL+LGLGL+ PT P + +H  KK +          +PSLTL LS                  +T++ SG      GRVKRERE+SG D +E
Subjt:  MGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFA-AESEPSLTLGLS----------------TAETAACSG------GRVKREREVSGEDVDE

Query:  EKG-------CSRVSD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLT
        E         CSRVSD  ++E+G ++RKKLRLTKQQSALLE++FKLHSTLNPK+KQALAR+LNLR RQVEVWFQNRRARTKLKQTEVDCEFLK+CCETLT
Subjt:  EKG-------CSRVSD--EEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLT

Query:  DENRRLQKELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG------------DLKSKPLFYKPFTNPSAAC
        DENRRLQKELQ+LKALKL+ P +M MPAATL++CPSC+R+GGG   G+              + +KP FY PFTNPSAAC
Subjt:  DENRRLQKELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNG------------DLKSKPLFYKPFTNPSAAC

AT5G06710.1 homeobox from Arabidopsis thaliana4.0e-4765.33Show/hide
Query:  EREVSGEDVDE--EKGCSRVSDEEEDGSN--SRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKR
        ER  +  D+D+  E+  SR S+E+ D  N  +RKKLRL+K QSA LE+SFK HSTLNPK+K ALA++LNLR RQVEVWFQNRRARTKLKQTEVDCE+LKR
Subjt:  EREVSGEDVDE--EKGCSRVSDEEEDGSN--SRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKR

Query:  CCETLTDENRRLQKELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGA
        CCE+LT+ENRRLQKE++EL+ LK + P +MQ+PA TL++CPSC+R+   A
Subjt:  CCETLTDENRRLQKELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGA

AT5G47370.1 Homeobox-leucine zipper protein 4 (HB-4) / HD-ZIP protein2.2e-4563.64Show/hide
Query:  SGEDVDE---EKGCSR-VSDEEED-GSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCE
        SG+D DE   ++G SR  SDEEED G  SRKKLRL+K QSA LEE+FK H+TLNPK+K ALA++LNL ARQVEVWFQNRRARTKLKQTEVDCE+LKRC E
Subjt:  SGEDVDE---EKGCSR-VSDEEED-GSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCE

Query:  TLTDENRRLQKELQELKALKLAPPLFMQM-PAATLSICPSCDRMGGGATAGNGDLKSKPLFYKPF
         LT+ENRRLQKE  EL+ LKL+P  + QM P  TL +CPSC+R+ GG ++ N     +P+   P+
Subjt:  TLTDENRRLQKELQELKALKLAPPLFMQM-PAATLSICPSCDRMGGGATAGNGDLKSKPLFYKPF


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAAATCCTCCATTCGATTATTAATCCCCCACCAGCCACCACCCATTTCCCCCATTCCCAAATCCCCCTTCTTAAAAACCCCCCTAAATTGCTCTCCAAATCCCCAAAA
CTTTCACTCACAAAATACCCAGATGGGATTTGATGAATTTTCCAACACAGGTCTTCTCCTAGGCTTGGGATTGACCCTCCCCACCAAACCGGCCGATCTTTCCCACAAAC
CCAAAAAACCCGCCCGTCTGTTCTGCTTCGCCGCCGAATCCGAACCCTCCTTAACGTTGGGCCTGTCCACGGCGGAAACGGCGGCTTGTTCAGGCGGCCGAGTGAAGCGC
GAAAGGGAGGTTTCAGGCGAGGATGTGGACGAAGAGAAAGGCTGTTCTCGTGTGAGCGATGAAGAGGAAGATGGGTCTAATTCCAGGAAAAAACTTAGGCTTACCAAACA
ACAATCTGCCCTTTTGGAAGAGAGCTTCAAACTTCACAGCACTCTTAACCCTAAGGAAAAACAAGCTTTAGCCAGAGAGTTGAATCTTCGGGCTCGCCAAGTTGAAGTTT
GGTTCCAGAACAGAAGAGCCAGGACAAAGCTAAAGCAAACGGAAGTGGATTGTGAGTTTTTAAAGAGATGCTGCGAAACATTAACGGATGAAAACAGGAGATTGCAAAAA
GAGCTGCAGGAACTAAAAGCCCTGAAATTAGCGCCGCCCCTTTTCATGCAAATGCCGGCGGCGACGCTCTCCATTTGCCCCTCCTGCGACCGGATGGGCGGCGGCGCCAC
CGCCGGCAACGGCGATCTGAAATCCAAGCCTCTGTTTTACAAGCCCTTCACCAATCCCTCTGCTGCTTGCTGA
mRNA sequenceShow/hide mRNA sequence
AATCTCTTCCCACCTTTTTTTAGGTATAATAAAGTGGGGATATCAAATAAGTGGGGGCACCTATGGTCAACCTATGTAAGTAGCAAAGAAATAGAAGAAAAAGCGTTCCT
AATTATTTTTCACCCAACGCCAAAGATTCCATGAAATCCTCCATTCGATTATTAATCCCCCACCAGCCACCACCCATTTCCCCCATTCCCAAATCCCCCTTCTTAAAAAC
CCCCCTAAATTGCTCTCCAAATCCCCAAAACTTTCACTCACAAAATACCCAGATGGGATTTGATGAATTTTCCAACACAGGTCTTCTCCTAGGCTTGGGATTGACCCTCC
CCACCAAACCGGCCGATCTTTCCCACAAACCCAAAAAACCCGCCCGTCTGTTCTGCTTCGCCGCCGAATCCGAACCCTCCTTAACGTTGGGCCTGTCCACGGCGGAAACG
GCGGCTTGTTCAGGCGGCCGAGTGAAGCGCGAAAGGGAGGTTTCAGGCGAGGATGTGGACGAAGAGAAAGGCTGTTCTCGTGTGAGCGATGAAGAGGAAGATGGGTCTAA
TTCCAGGAAAAAACTTAGGCTTACCAAACAACAATCTGCCCTTTTGGAAGAGAGCTTCAAACTTCACAGCACTCTTAACCCTAAGGAAAAACAAGCTTTAGCCAGAGAGT
TGAATCTTCGGGCTCGCCAAGTTGAAGTTTGGTTCCAGAACAGAAGAGCCAGGACAAAGCTAAAGCAAACGGAAGTGGATTGTGAGTTTTTAAAGAGATGCTGCGAAACA
TTAACGGATGAAAACAGGAGATTGCAAAAAGAGCTGCAGGAACTAAAAGCCCTGAAATTAGCGCCGCCCCTTTTCATGCAAATGCCGGCGGCGACGCTCTCCATTTGCCC
CTCCTGCGACCGGATGGGCGGCGGCGCCACCGCCGGCAACGGCGATCTGAAATCCAAGCCTCTGTTTTACAAGCCCTTCACCAATCCCTCTGCTGCTTGCTGATCCTATT
CTAGGATATGTGTTAGAATTTGCCCAATAAAAAAAAAAAAAATCAAATTAGGCAATTAATTAATCAAATAGGAAAATCCCCAGAAACCCAGGATTTTTTGGTTGGGGTCT
ATGATTAAAAAAAAGAAAACCCAAAAAAGGAAAATAGCTGAAATTAAATTAGTTTAATTTGTAGAAAATTATAGTAGTTACTAATCCGATTATTATGTGTTCTTATTTGA
TTTCATATGTTTGTACATAAAGTAAATGAATGAATGTTACTATTG
Protein sequenceShow/hide protein sequence
MKSSIRLLIPHQPPPISPIPKSPFLKTPLNCSPNPQNFHSQNTQMGFDEFSNTGLLLGLGLTLPTKPADLSHKPKKPARLFCFAAESEPSLTLGLSTAETAACSGGRVKR
EREVSGEDVDEEKGCSRVSDEEEDGSNSRKKLRLTKQQSALLEESFKLHSTLNPKEKQALARELNLRARQVEVWFQNRRARTKLKQTEVDCEFLKRCCETLTDENRRLQK
ELQELKALKLAPPLFMQMPAATLSICPSCDRMGGGATAGNGDLKSKPLFYKPFTNPSAAC