; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr020159 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr020159
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Descriptionhomeobox-leucine zipper protein HAT4
Genome locationtig00153449:450282..451848
RNA-Seq ExpressionSgr020159
SyntenySgr020159
Gene Ontology termsGO:0006357 - regulation of transcription by RNA polymerase II (biological process)
GO:0005634 - nucleus (cellular component)
GO:0000981 - DNA-binding transcription factor activity, RNA polymerase II-specific (molecular function)
GO:0043565 - sequence-specific DNA binding (molecular function)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6577673.1 Homeobox-leucine zipper protein HAT2, partial [Cucurbita argyrosperma subsp. sororia]4.7e-13088.89Show/hide
Query:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA
        MMAG DD LGLSLGLSFDS   H HR  HLQLNL+PSW NDA     SSDRTSETGRSLLRGIDVNR+ PSTADCEEEAAMSSPNSTVSSVSGKRSERE 
Subjt:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA

Query:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE
        NGEDLD DR C RGISDEEDGETSRKKLRLTKDQSAVLE+SFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLT+E
Subjt:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE

Query:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMG--QAQAHHSRSIHINPWASSIPARPFNALHPRS
        NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP T+ R+G  QAQAHH+R IHINPWAS+IPARPFNALHPRS
Subjt:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMG--QAQAHHSRSIHINPWASSIPARPFNALHPRS

XP_022923548.1 homeobox-leucine zipper protein HAT4 [Cucurbita moschata]1.5e-13189.51Show/hide
Query:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA
        MMAG DD LGLSLGLSFDS   H HR  HLQLNL+PSW NDA     SSDRTSETGRSLLRGIDVNR+ PSTADCEEEAAMSSPNSTVSSVSGKRSERE 
Subjt:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA

Query:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE
        NGEDLD DR C RGISDEEDGETSRKKLRLTKDQSAVLE+SFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLT+E
Subjt:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE

Query:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARPFNALHPRS
        NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP T+ R+GQAQAHH+R IHINPWAS+IPARPFNALHPRS
Subjt:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARPFNALHPRS

XP_022965141.1 homeobox-leucine zipper protein HAT4-like [Cucurbita maxima]1.1e-12687.15Show/hide
Query:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA
        MMAGKDD LGLSLGLS +S     HR  HLQLNL+PSW NDA     SSDRTSETGRSLLRGIDVNR+ PS ADCEEEAAMSSPNSTVSSVSGKRSERE 
Subjt:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA

Query:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE
        NGEDLD DR C RGISDEEDGETSRKKLRLTKDQSAVLE+SFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLT+E
Subjt:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE

Query:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQA--HHSRSIHINPWASSIPARPFNALHPRS
        NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVP STSAP T+ R+GQAQA  HH+R IH+NPWAS+IPARPFNALHPRS
Subjt:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQA--HHSRSIHINPWASSIPARPFNALHPRS

XP_023552456.1 homeobox-leucine zipper protein HAT4 [Cucurbita pepo subsp. pepo]5.2e-12987.93Show/hide
Query:  MMAGK-DDLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA
        MMAG  D LGLSLGLSFDS   H HR  HLQLNL+PSW NDA     SSDRTSETGRSLLRGIDVNR+ PSTADCEEEAAMSSPNSTVSSVSGKRSERE 
Subjt:  MMAGK-DDLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA

Query:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE
        NGEDLD DR C RGISDEEDGETSRKKLRLTKDQSAVLE+SFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLT+E
Subjt:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE

Query:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMG----QAQAHHSRSIHINPWASSIPARPFNALHPRS
        NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP T+ R+G    QAQAHH+R IHINPWAS+IPARPFNALHPRS
Subjt:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMG----QAQAHHSRSIHINPWASSIPARPFNALHPRS

XP_038906160.1 homeobox-leucine zipper protein HAT4 [Benincasa hispida]2.6e-12888.01Show/hide
Query:  MMAGKDD--LGLSLGLSFDSLSNHRHRSDHLQLNLLP-SWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLP---STADCEEEAAMSSPNSTVSSVSGKRS
        MMA KDD  LGLSLGLSFD        S HLQLNL+P SWNNDA     SSDRTSETGRSLLRGIDVNR+P   S ADCEEEAAMSSPNSTVSSVSGKRS
Subjt:  MMAGKDD--LGLSLGLSFDSLSNHRHRSDHLQLNLLP-SWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLP---STADCEEEAAMSSPNSTVSSVSGKRS

Query:  EREANGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCEN
        ERE NGEDLD DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCEN
Subjt:  EREANGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCEN

Query:  LTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQA--QAHHSRSIHINPWASSIPARPFNALHPRS
        LTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSA  T+ RMGQA  QAHH+R IHINPWAS+IPARPFNALHPRS
Subjt:  LTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQA--QAHHSRSIHINPWASSIPARPFNALHPRS

TrEMBL top hitse value%identityAlignment
A0A0A0L6T6 Homeobox domain-containing protein7.6e-11885.21Show/hide
Query:  DLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREANGEDLDA
        +LGL+LGL+ DS   H           L SW NDA     SSDRTSETGRSLLRGIDVNR+ PSTADCEEEAAMSSPNSTVSSVSGKRSERE NGEDLD 
Subjt:  DLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREANGEDLDA

Query:  DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE
        DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE
Subjt:  DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE

Query:  VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPP-STSAP-ATIPRMGQAQA--HHSRSI-HINPWASSIPARPFNALHPRS
        VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPP STSAP  T+ RMGQAQ+  HH+R I HINPWAS IP RPFNALHPRS
Subjt:  VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPP-STSAP-ATIPRMGQAQA--HHSRSI-HINPWASSIPARPFNALHPRS

A0A1S3BJZ9 homeobox-leucine zipper protein HAT41.5e-11885.87Show/hide
Query:  DLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREANGEDLDA
        +LGL+LGLS DS   H           L SW NDA     SSDRTSETGRSLLRGIDVNR+ PSTADCEEEAAMSSPNSTVSSVSGKRSERE NGEDLD 
Subjt:  DLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREANGEDLDA

Query:  DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE
        DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE
Subjt:  DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE

Query:  VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP-ATIPRMGQA--QAHHSRSI-HINPWASSIPARPFNALHPRS
        VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP  T+ RM QA  QAHH R I HINPWAS IP RPFNALHPRS
Subjt:  VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP-ATIPRMGQA--QAHHSRSI-HINPWASSIPARPFNALHPRS

A0A5D3CLM5 Homeobox-leucine zipper protein HAT41.5e-11885.87Show/hide
Query:  DLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREANGEDLDA
        +LGL+LGLS DS   H           L SW NDA     SSDRTSETGRSLLRGIDVNR+ PSTADCEEEAAMSSPNSTVSSVSGKRSERE NGEDLD 
Subjt:  DLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREANGEDLDA

Query:  DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE
        DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE
Subjt:  DRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKE

Query:  VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP-ATIPRMGQA--QAHHSRSI-HINPWASSIPARPFNALHPRS
        VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP  T+ RM QA  QAHH R I HINPWAS IP RPFNALHPRS
Subjt:  VQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP-ATIPRMGQA--QAHHSRSI-HINPWASSIPARPFNALHPRS

A0A6J1E9Y0 homeobox-leucine zipper protein HAT47.1e-13289.51Show/hide
Query:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA
        MMAG DD LGLSLGLSFDS   H HR  HLQLNL+PSW NDA     SSDRTSETGRSLLRGIDVNR+ PSTADCEEEAAMSSPNSTVSSVSGKRSERE 
Subjt:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA

Query:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE
        NGEDLD DR C RGISDEEDGETSRKKLRLTKDQSAVLE+SFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLT+E
Subjt:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE

Query:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARPFNALHPRS
        NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAP T+ R+GQAQAHH+R IHINPWAS+IPARPFNALHPRS
Subjt:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARPFNALHPRS

A0A6J1HKW5 homeobox-leucine zipper protein HAT4-like5.3e-12787.15Show/hide
Query:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA
        MMAGKDD LGLSLGLS +S     HR  HLQLNL+PSW NDA     SSDRTSETGRSLLRGIDVNR+ PS ADCEEEAAMSSPNSTVSSVSGKRSERE 
Subjt:  MMAGKDD-LGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRL-PSTADCEEEAAMSSPNSTVSSVSGKRSEREA

Query:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE
        NGEDLD DR C RGISDEEDGETSRKKLRLTKDQSAVLE+SFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLT+E
Subjt:  NGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEE

Query:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQA--HHSRSIHINPWASSIPARPFNALHPRS
        NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVP STSAP T+ R+GQAQA  HH+R IH+NPWAS+IPARPFNALHPRS
Subjt:  NRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQA--HHSRSIHINPWASSIPARPFNALHPRS

SwissProt top hitse value%identityAlignment
P46600 Homeobox-leucine zipper protein HAT19.1e-7658.77Show/hide
Query:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPS-----------WNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-
        MM GK+DLGLSL L F    NH      LQLNL P+           WN   V   SSSD+  +     LR IDVN LP+T D EEE  +SSPNST+SS 
Subjt:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPS-----------WNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-

Query:  VSGKR--SEREAN-----GEDLD--ADRACSRGISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRART
        VSGKR  +ERE       G+DLD   DR+ SRG SDEE+   GET RKKLRL+KDQSAVLE++FKEHNTLNPKQKLALAK+LGL  RQVEVWFQNRRART
Subjt:  VSGKR--SEREAN-----GEDLD--ADRACSRGISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRART

Query:  KLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARP
        KLKQTEVDCE+LKRC E LTEENRRL+KE  ELRALKLSP+ Y  M+PPTTL MCPSCERVA P S++             H+ RS+ ++PW        
Subjt:  KLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARP

Query:  FNALHPRS
        F+ + PRS
Subjt:  FNALHPRS

P46601 Homeobox-leucine zipper protein HAT21.6e-7559.67Show/hide
Query:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLP--SWNNDAVSFP--SSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-VSGKRSE
        MM GK+DLGLSL L F    NH    + LQ+NL P  S +N+    P   + D TS+     LR IDVN  PST +CEE+  +SSPNST+SS +SGKRSE
Subjt:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLP--SWNNDAVSFP--SSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-VSGKRSE

Query:  RE-------ANGEDLD---ADRACSRGISDEED--GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEV
        RE        +G+D D    DR  SRG SDEE+  GETSRKKLRL+KDQSA LEE+FKEHNTLNPKQKLALAK+L L  RQVEVWFQNRRARTKLKQTEV
Subjt:  RE-------ANGEDLD---ADRACSRGISDEED--GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEV

Query:  DCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASS----IPARPFNA
        DCE+LKRC E LTEENRRLQKE  ELR LKLSPQFY  MTPPTTL MCPSCERV  P S++             H+ R + INPW +          F A
Subjt:  DCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASS----IPARPFNA

Query:  LHPRS
        L PRS
Subjt:  LHPRS

P46602 Homeobox-leucine zipper protein HAT39.1e-6856.96Show/hide
Query:  MAGKDD-LGLSLGLSFD------------------SLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPST--ADCEEE-AAM
        M+ +DD LGLSL LS                    + S+H         N      N  ++   SS+R S+  RS LRGIDVNR PST   D E+E A +
Subjt:  MAGKDD-LGLSLGLSFD------------------SLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPST--ADCEEE-AAM

Query:  SSPNSTVSSV-SGKRSERE----------ANGEDLDADRA-CS-RGISDEEDG-----ETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLR
        SSPNSTVSSV SGK+SERE             ED + +RA CS  G SD+EDG     ++SRKKLRL+K+Q+ VLEE+FKEH+TLNPKQK+ALAKQL LR
Subjt:  SSPNSTVSSV-SGKRSERE----------ANGEDLDADRA-CS-RGISDEEDG-----ETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLR

Query:  PRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSR
         RQVEVWFQNRRARTKLKQTEVDCE+LKRCCENLT+ENRRLQKEV ELRALKLSP  YMHM PPTTLTMCPSCERVAV  S+S+ A  P M  +    S 
Subjt:  PRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSR

Query:  SIHINPWAS
           ++PWA+
Subjt:  SIHINPWAS

P92953 Homeobox-leucine zipper protein ATHB-41.5e-6555.48Show/hide
Query:  GKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVS-------------------------FPSS------SDRTSETGRSLLRGIDVNRLPST--
        G+ D GL L L   SL N + +   L+LNL+P   + + S                         F SS      ++R S+ G S LRG +VNR  S+  
Subjt:  GKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVS-------------------------FPSS------SDRTSETGRSLLRGIDVNRLPST--

Query:  -ADCEEEAA-MSSPNSTVSSVSGKRSEREA--NGEDLDADRA-CSR----GISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQL
          D EEEAA +SSPNS VSS+SG + +      G++ +A+RA CSR    G SD+ED   G+ SRKKLRL+KDQ+ VLEE+FKEH+TLNPKQKLALAKQL
Subjt:  -ADCEEEAA-MSSPNSTVSSVSGKRSEREA--NGEDLDADRA-CSR----GISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQL

Query:  GLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERV--------AVPPSTSAPATIP
         LR RQVEVWFQNRRARTKLKQTEVDCE+LKRCC+NLTEENRRLQKEV ELRALKLSP  YMHMTPPTTLTMCPSCERV        A P +T+ P  + 
Subjt:  GLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERV--------AVPPSTSAPATIP

Query:  R
        R
Subjt:  R

Q05466 Homeobox-leucine zipper protein HAT43.1e-8462.63Show/hide
Query:  MMAGKDDLGLSLGLSFDSLS---------NHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADC-EEEAAMSSPNSTVSSVS
        MM  KDDLGLSLGL+F             +    S    L    SWN    S   +SD + +  R+ +RGIDVNR PSTA+  +E+A +SSPNSTVSS +
Subjt:  MMAGKDDLGLSLGLSFDSLS---------NHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADC-EEEAAMSSPNSTVSSVS

Query:  GKRSEREANGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKR
        GKRSERE      D D   SRGISD+EDG+ SRKKLRL+KDQSA+LEE+FK+H+TLNPKQK ALAKQLGLR RQVEVWFQNRRARTKLKQTEVDCEFL+R
Subjt:  GKRSEREANGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKR

Query:  CCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSI---PARPFNALHPRS
        CCENLTEENRRLQKEV ELRALKLSPQFYMHM+PPTTLTMCPSCE V+VPP     AT        AHH RS+ +N WA +        F+AL PRS
Subjt:  CCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSI---PARPFNALHPRS

Arabidopsis top hitse value%identityAlignment
AT2G44910.1 homeobox-leucine zipper protein 41.0e-6655.48Show/hide
Query:  GKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVS-------------------------FPSS------SDRTSETGRSLLRGIDVNRLPST--
        G+ D GL L L   SL N + +   L+LNL+P   + + S                         F SS      ++R S+ G S LRG +VNR  S+  
Subjt:  GKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVS-------------------------FPSS------SDRTSETGRSLLRGIDVNRLPST--

Query:  -ADCEEEAA-MSSPNSTVSSVSGKRSEREA--NGEDLDADRA-CSR----GISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQL
          D EEEAA +SSPNS VSS+SG + +      G++ +A+RA CSR    G SD+ED   G+ SRKKLRL+KDQ+ VLEE+FKEH+TLNPKQKLALAKQL
Subjt:  -ADCEEEAA-MSSPNSTVSSVSGKRSEREA--NGEDLDADRA-CSR----GISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQL

Query:  GLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERV--------AVPPSTSAPATIP
         LR RQVEVWFQNRRARTKLKQTEVDCE+LKRCC+NLTEENRRLQKEV ELRALKLSP  YMHMTPPTTLTMCPSCERV        A P +T+ P  + 
Subjt:  GLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERV--------AVPPSTSAPATIP

Query:  R
        R
Subjt:  R

AT3G60390.1 homeobox-leucine zipper protein 36.5e-6956.96Show/hide
Query:  MAGKDD-LGLSLGLSFD------------------SLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPST--ADCEEE-AAM
        M+ +DD LGLSL LS                    + S+H         N      N  ++   SS+R S+  RS LRGIDVNR PST   D E+E A +
Subjt:  MAGKDD-LGLSLGLSFD------------------SLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPST--ADCEEE-AAM

Query:  SSPNSTVSSV-SGKRSERE----------ANGEDLDADRA-CS-RGISDEEDG-----ETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLR
        SSPNSTVSSV SGK+SERE             ED + +RA CS  G SD+EDG     ++SRKKLRL+K+Q+ VLEE+FKEH+TLNPKQK+ALAKQL LR
Subjt:  SSPNSTVSSV-SGKRSERE----------ANGEDLDADRA-CS-RGISDEEDG-----ETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLR

Query:  PRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSR
         RQVEVWFQNRRARTKLKQTEVDCE+LKRCCENLT+ENRRLQKEV ELRALKLSP  YMHM PPTTLTMCPSCERVAV  S+S+ A  P M  +    S 
Subjt:  PRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSR

Query:  SIHINPWAS
           ++PWA+
Subjt:  SIHINPWAS

AT4G16780.1 homeobox protein 22.2e-8562.63Show/hide
Query:  MMAGKDDLGLSLGLSFDSLS---------NHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADC-EEEAAMSSPNSTVSSVS
        MM  KDDLGLSLGL+F             +    S    L    SWN    S   +SD + +  R+ +RGIDVNR PSTA+  +E+A +SSPNSTVSS +
Subjt:  MMAGKDDLGLSLGLSFDSLS---------NHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADC-EEEAAMSSPNSTVSSVS

Query:  GKRSEREANGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKR
        GKRSERE      D D   SRGISD+EDG+ SRKKLRL+KDQSA+LEE+FK+H+TLNPKQK ALAKQLGLR RQVEVWFQNRRARTKLKQTEVDCEFL+R
Subjt:  GKRSEREANGEDLDADRACSRGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKR

Query:  CCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSI---PARPFNALHPRS
        CCENLTEENRRLQKEV ELRALKLSPQFYMHM+PPTTLTMCPSCE V+VPP     AT        AHH RS+ +N WA +        F+AL PRS
Subjt:  CCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSI---PARPFNALHPRS

AT4G17460.1 Homeobox-leucine zipper protein 4 (HB-4) / HD-ZIP protein6.5e-7758.77Show/hide
Query:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPS-----------WNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-
        MM GK+DLGLSL L F    NH      LQLNL P+           WN   V   SSSD+  +     LR IDVN LP+T D EEE  +SSPNST+SS 
Subjt:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPS-----------WNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-

Query:  VSGKR--SEREAN-----GEDLD--ADRACSRGISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRART
        VSGKR  +ERE       G+DLD   DR+ SRG SDEE+   GET RKKLRL+KDQSAVLE++FKEHNTLNPKQKLALAK+LGL  RQVEVWFQNRRART
Subjt:  VSGKR--SEREAN-----GEDLD--ADRACSRGISDEED---GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRART

Query:  KLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARP
        KLKQTEVDCE+LKRC E LTEENRRL+KE  ELRALKLSP+ Y  M+PPTTL MCPSCERVA P S++             H+ RS+ ++PW        
Subjt:  KLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARP

Query:  FNALHPRS
        F+ + PRS
Subjt:  FNALHPRS

AT5G47370.1 Homeobox-leucine zipper protein 4 (HB-4) / HD-ZIP protein1.1e-7659.67Show/hide
Query:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLP--SWNNDAVSFP--SSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-VSGKRSE
        MM GK+DLGLSL L F    NH    + LQ+NL P  S +N+    P   + D TS+     LR IDVN  PST +CEE+  +SSPNST+SS +SGKRSE
Subjt:  MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLP--SWNNDAVSFP--SSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSS-VSGKRSE

Query:  RE-------ANGEDLD---ADRACSRGISDEED--GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEV
        RE        +G+D D    DR  SRG SDEE+  GETSRKKLRL+KDQSA LEE+FKEHNTLNPKQKLALAK+L L  RQVEVWFQNRRARTKLKQTEV
Subjt:  RE-------ANGEDLD---ADRACSRGISDEED--GETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEV

Query:  DCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASS----IPARPFNA
        DCE+LKRC E LTEENRRLQKE  ELR LKLSPQFY  MTPPTTL MCPSCERV  P S++             H+ R + INPW +          F A
Subjt:  DCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYMHMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASS----IPARPFNA

Query:  LHPRS
        L PRS
Subjt:  LHPRS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGATGGCTGGGAAAGATGATCTAGGGTTGAGCCTTGGTTTGAGCTTCGATTCTCTTAGTAATCATCGCCATCGTTCTGATCATTTGCAGCTCAATCTCTTGCCTTCTTG
GAATAATGACGCCGTCTCCTTCCCTTCTTCCTCAGATCGGACCTCCGAAACCGGCCGATCACTGCTCCGGGGGATCGACGTGAACCGGCTGCCGTCGACGGCGGATTGCG
AGGAGGAAGCGGCGATGTCGAGCCCTAACAGTACGGTGTCGAGCGTGAGCGGGAAGCGGAGCGAACGAGAAGCCAACGGCGAGGATCTGGACGCCGATAGAGCTTGCTCC
CGGGGAATCAGCGACGAAGAAGACGGCGAAACTTCCAGAAAGAAGCTCCGCCTCACCAAAGACCAGTCCGCCGTCTTGGAGGAGAGCTTCAAAGAACACAACACTCTCAA
TCCTAAGCAAAAGTTAGCGTTGGCCAAGCAGTTGGGTCTCCGGCCAAGACAAGTCGAAGTCTGGTTCCAAAACAGAAGGGCAAGGACGAAATTGAAGCAAACGGAGGTAG
ATTGCGAGTTTCTAAAGAGATGCTGCGAGAATCTGACGGAGGAGAACAGGCGGTTGCAGAAAGAAGTTCAGGAACTGAGAGCACTGAAACTTTCCCCACAGTTCTACATG
CACATGACCCCACCCACCACCCTGACCATGTGCCCCTCATGTGAGCGCGTGGCCGTCCCACCCTCCACGTCAGCTCCCGCCACTATCCCCCGCATGGGCCAGGCCCAGGC
CCACCACTCTCGGTCCATCCACATCAACCCATGGGCCTCCTCCATCCCGGCCCGGCCCTTCAATGCCCTCCACCCTCGGTCGTAA
mRNA sequenceShow/hide mRNA sequence
ATGATGGCTGGGAAAGATGATCTAGGGTTGAGCCTTGGTTTGAGCTTCGATTCTCTTAGTAATCATCGCCATCGTTCTGATCATTTGCAGCTCAATCTCTTGCCTTCTTG
GAATAATGACGCCGTCTCCTTCCCTTCTTCCTCAGATCGGACCTCCGAAACCGGCCGATCACTGCTCCGGGGGATCGACGTGAACCGGCTGCCGTCGACGGCGGATTGCG
AGGAGGAAGCGGCGATGTCGAGCCCTAACAGTACGGTGTCGAGCGTGAGCGGGAAGCGGAGCGAACGAGAAGCCAACGGCGAGGATCTGGACGCCGATAGAGCTTGCTCC
CGGGGAATCAGCGACGAAGAAGACGGCGAAACTTCCAGAAAGAAGCTCCGCCTCACCAAAGACCAGTCCGCCGTCTTGGAGGAGAGCTTCAAAGAACACAACACTCTCAA
TCCTAAGCAAAAGTTAGCGTTGGCCAAGCAGTTGGGTCTCCGGCCAAGACAAGTCGAAGTCTGGTTCCAAAACAGAAGGGCAAGGACGAAATTGAAGCAAACGGAGGTAG
ATTGCGAGTTTCTAAAGAGATGCTGCGAGAATCTGACGGAGGAGAACAGGCGGTTGCAGAAAGAAGTTCAGGAACTGAGAGCACTGAAACTTTCCCCACAGTTCTACATG
CACATGACCCCACCCACCACCCTGACCATGTGCCCCTCATGTGAGCGCGTGGCCGTCCCACCCTCCACGTCAGCTCCCGCCACTATCCCCCGCATGGGCCAGGCCCAGGC
CCACCACTCTCGGTCCATCCACATCAACCCATGGGCCTCCTCCATCCCGGCCCGGCCCTTCAATGCCCTCCACCCTCGGTCGTAA
Protein sequenceShow/hide protein sequence
MMAGKDDLGLSLGLSFDSLSNHRHRSDHLQLNLLPSWNNDAVSFPSSSDRTSETGRSLLRGIDVNRLPSTADCEEEAAMSSPNSTVSSVSGKRSEREANGEDLDADRACS
RGISDEEDGETSRKKLRLTKDQSAVLEESFKEHNTLNPKQKLALAKQLGLRPRQVEVWFQNRRARTKLKQTEVDCEFLKRCCENLTEENRRLQKEVQELRALKLSPQFYM
HMTPPTTLTMCPSCERVAVPPSTSAPATIPRMGQAQAHHSRSIHINPWASSIPARPFNALHPRS