; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CsaV3_3G018100 (gene) of Cucumber (Chinese Long) v3 genome

Gene IDCsaV3_3G018100
OrganismCucumis sativus L. var. sativus cv. Chinese Long (Cucumber (Chinese Long) v3)
Descriptionhomeobox protein HAT3.1-like
Genome locationchr3:13859402..13871939
RNA-Seq ExpressionCsaV3_3G018100
SyntenyCsaV3_3G018100
Gene Ontology termsGO:0006357 - regulation of transcription by RNA polymerase II (biological process)
GO:0005634 - nucleus (cellular component)
GO:0000981 - DNA-binding transcription factor activity, RNA polymerase II-specific (molecular function)
GO:0003677 - DNA binding (molecular function)
GO:0046872 - metal ion binding (molecular function)
InterPro domainsIPR001356 - Homeobox domain
IPR001965 - Zinc finger, PHD-type
IPR009057 - Homeobox-like domain superfamily
IPR011011 - Zinc finger, FYVE/PHD-type
IPR013083 - Zinc finger, RING/FYVE/PHD-type
IPR017970 - Homeobox, conserved site
IPR019786 - Zinc finger, PHD-type, conserved site
IPR019787 - Zinc finger, PHD-finger


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0037202.1 pathogenesis-related homeodomain protein [Cucumis melo var. makuwa]0.0e+0085.97Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR
        MEERDE+TDTESRPNNNAEAVQEAKAS DMEERDENTG E R  NNAESVQKAKASDN                             MEERDENT TES 
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR

Query:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
        PNNN EAVQEA ASDNMEERDE+TGTESRPNNNAEAVQEAKASDNMKERD NT TESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
Subjt:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA

Query:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL
        SVEVEV TCLSNE  YSGYQELGTTPEFS K DGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADND+VEAGN LS DKDTKNLKLSIEDE TTL
Subjt:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL

Query:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK
        LNECSELPLEDVTKNYIEKMNPPI DLTQITSIQSLETIPSNSQQ   KD+ F KSKKKNYKLRS VSSDRVLRSRTQEKAKAPE               
Subjt:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK

Query:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE
                       +DEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRID LCAEGRLSESLFDSE
Subjt:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE

Query:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN
        GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPE AAAAAGRN
Subjt:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN

Query:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS
        SD TLGLPSDDSEDGDYDPD+PDTIDQDNELSSDESSSDQ     SNSDTSGYASASEGLEV  NDDQYLGLPSDDSEDNDYDPSVPELDEG RQESSSS
Subjt:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS

Query:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHD
        DFTSDSEDLAAL+NNCSSKD DLVSSLNNTLPVKN+NG+SSGP+KS LHNELSSLLDSG DKDGLEP+SGRRQVERLDYKKLHD
Subjt:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHD

XP_008456177.1 PREDICTED: pathogenesis-related homeodomain protein [Cucumis melo]0.0e+0090.82Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR
        MEERDE+TDTESRPNNNAEAVQEAKAS DMEERDENTG E R  NNAESVQKAKASDN                             MEERDENT TES 
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR

Query:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
        PNNN EAVQEA ASDNMEERDE+TGTESRPNNNAEAVQEAKASDNMKERD NT TESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
Subjt:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA

Query:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL
        SVEVEV TCLSNE  YSGYQELGTTPEFS K DGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADND+VEAGN LS DKDTKNLKLSIEDE TTL
Subjt:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL

Query:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK
        LNECSELPLEDVTKNYIEKMNPPI DLTQITSIQSLETIPSNSQQ   KD+ F KSKKKNYKLRS VSSDRVLRSRTQEKAKAPE SNDLNNFTAEE+GK
Subjt:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK

Query:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE
        RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRID LCAEGRLSESLFDSE
Subjt:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE

Query:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN
        GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPE AAAAAGRN
Subjt:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN

Query:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS
        SD TLGLPSDDSEDGDYDPD+PDTIDQDNELSSDESSSDQ     SNSDTSGYASASEGLEV  NDDQYLGLPSDDSEDNDYDPSVPELDEG RQESSSS
Subjt:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS

Query:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYG
        DFTSDSEDLAAL+NNCSSKD DLVSSLNNTLPVKN+NG+SSGP+KS LHNELSSLLDSG DKDGLEP+SGRRQVERLDYKKLHDETYGNVPT+SSDDTYG
Subjt:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYG

Query:  STLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQ
        STLDSSDDRG DSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSV++ TSSSNRRLSQPALERL ASFQ
Subjt:  STLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQ

Query:  ENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGD
        ENEYPKRATK+SLAQELGL LKQVSKWFENTRWSTRHPSS GKKAKSSSRMSI+LSQASGELSKNE ESATCFRDTDSNGARHQDLPMANSVVASCQSGD
Subjt:  ENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGD

Query:  TGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI
        TGDKKL++RKTKR +SSATKSRKRKGRSDNTAS+SKDREGSPRPPAKSPKVNE QTADRFKTRRRRSI
Subjt:  TGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI

XP_011651230.2 homeobox protein HOX1A [Cucumis sativus]0.0e+00100Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR
        MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR

Query:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS
        PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS
Subjt:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS

Query:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ
        SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ
Subjt:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ

Query:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL
        ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL
Subjt:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL

Query:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
        LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
Subjt:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG

Query:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
        ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
Subjt:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN

Query:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN
        ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN
Subjt:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN

Query:  TLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSN
        TLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSN
Subjt:  TLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSN

Query:  NGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFE
        NGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFE
Subjt:  NGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFE

Query:  NTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKGRSD
        NTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKGRSD
Subjt:  NTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKGRSD

Query:  NTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI
        NTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI
Subjt:  NTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI

XP_038876083.1 homeobox protein HAT3.1 isoform X1 [Benincasa hispida]0.0e+0085.6Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR
        MEERDE+TDTE RPN+NAEAVQEAKAS +ME RDEN+ TE RP ++AE+VQ+AKASDNME RDENTDTESRPNN+ EAVQEA ASDNME RDE+T TESR
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR

Query:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS
        PNN+AEAVQEAKASDNM+  DENT TESR N +A A QE KASDNMEERDENTDTESRPN  AE VQEAKASVEVEVLTCLSNE  +SGYQELGTTPE+S
Subjt:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS

Query:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ
        SK DGPDEEK GVQQNMELGSGYLLSEL EKDNQT+SNHADND+VEAGNLLS+DKDT+NLKL IE E TTLLNECSELP+EDV KN+IE+MNPPI DLTQ
Subjt:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ

Query:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL
          SIQ+LE IPSNSQQ  RKDK  LKSKK NY+LRS VSSDRVLRSRTQEKAKAPE SN LNNFTAEE  ++KKKKKRNIQGK ARVDEYSSIR  LRYL
Subjt:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL

Query:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
        LNRI YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIM+RKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
Subjt:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG

Query:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
        ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITD WEKVYPEAAAAAAG+NSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
Subjt:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN

Query:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN
        E SSDESS   S+SD SNSDTSGYASASEGLEV  NDDQYLGLPSDDSED+DYDPSVPELDEGVR+ESSSSDFTSDSEDLAALDNN  SKD D VSSLNN
Subjt:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN

Query:  TLPVKNSNGQSS--GPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGST-LDSSDDRGWDSGTRKRGPKTLVLA
        TL VKNSNGQSS  GP+KSALHNELSSL      KDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGST +DSS DRGWDS TRKRGP+ LVLA
Subjt:  TLPVKNSNGQSS--GPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGST-LDSSDDRGWDSGTRKRGPKTLVLA

Query:  LSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSK
        LSNNG+NDDLTNVKTKRS+K RTRQK  AINVNNSVTETPVDTAKSSSS +++TSSSNRRLSQPALERL ASFQENEYPKRATK+SLAQELGL LKQVS+
Subjt:  LSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSK

Query:  WFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKG
        WFENTRWSTRHPSS G +AKSSSRMS   S+ASGEL KNE ES  CFRDTDSNGA+HQDLP ANS    CQSGDTGDKKL +RKTKRA+SSATKSRKRK 
Subjt:  WFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKG

Query:  RSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI
         SD+ ASH+KD+E S RPPAKSPKVNE+QTADRFKTRRRRSI
Subjt:  RSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI

XP_038876114.1 homeobox protein HAT3.1 isoform X2 [Benincasa hispida]0.0e+0086.53Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR
        MEERDE+TDTE RPN+NAEAVQEAKAS +ME RDEN+ TE RP ++AE+VQ+AKASDNME RDENTDTESRPNN+ EAVQEA ASDNME RDE+T TESR
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR

Query:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS
        PNN+AEAVQEAKASDNM+  DENT TESR N +A A QE KASDNMEERDENTDTESRPN  AE VQEAKASVEVEVLTCLSNE  +SGYQELGTTPE+S
Subjt:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS

Query:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ
        SK DGPDEEK GVQQNMELGSGYLLSEL EKDNQT+SNHADND+VEAGNLLS+DKDT+NLKL IE E TTLLNECSELP+EDV KN+IE+MNPPI DLTQ
Subjt:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ

Query:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL
          SIQ+LE IPSNSQQ  RKDK  LKSKK NY+LRS VSSDRVLRSRTQEKAKAPE SN LNNFTAEE  ++KKKKKRNIQGK ARVDEYSSIR  LRYL
Subjt:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL

Query:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
        LNRI YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIM+RKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
Subjt:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG

Query:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
        ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITD WEKVYPEAAAAAAG+NSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
Subjt:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN

Query:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN
        E SSDESS   S+SD SNSDTSGYASASEGLEV  NDDQYLGLPSDDSED+DYDPSVPELDEGVR+ESSSSDFTSDSEDLAALDNN  SKD D VSSLNN
Subjt:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN

Query:  TLPVKNSNGQSS--GPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGST-LDSSDDRGWDSGTRKRGPKTLVLA
        TL VKNSNGQSS  GP+KSALHNELSSL      KDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGST +DSS DRGWDS TRKRGP+ LVLA
Subjt:  TLPVKNSNGQSS--GPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGST-LDSSDDRGWDSGTRKRGPKTLVLA

Query:  LSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQV
        LSNNG+NDDLTNVKTKRS+K RTRQK  AINVNNSVTETPVDTAKSSSS +++TSSSNRRLSQPALERL ASFQENEYPKRATK+SLAQELGL LKQ+
Subjt:  LSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQV

TrEMBL top hitse value%identityAlignment
A0A0A0LA53 PHD-type domain-containing protein0.0e+0098.68Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR
        MEERDEST TESRPNNNAEAVQEAKASVDMEERDE+TGTE RP NNAE+VQ+AKAS +MEERDE+T TESRPNNNPEAVQEAMASDNMEERDESTGTESR
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESR

Query:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS
        PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS
Subjt:  PNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFS

Query:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ
        SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ
Subjt:  SKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQ

Query:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL
        ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL
Subjt:  ITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYL

Query:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
        LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG
Subjt:  LNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDG

Query:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
        ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN
Subjt:  ICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDN

Query:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN
        ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN
Subjt:  ELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNN

Query:  TLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHD
        TLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHD
Subjt:  TLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHD

A0A1S3C283 pathogenesis-related homeodomain protein0.0e+0090.82Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR
        MEERDE+TDTESRPNNNAEAVQEAKAS DMEERDENTG E R  NNAESVQKAKASDN                             MEERDENT TES 
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR

Query:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
        PNNN EAVQEA ASDNMEERDE+TGTESRPNNNAEAVQEAKASDNMKERD NT TESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
Subjt:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA

Query:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL
        SVEVEV TCLSNE  YSGYQELGTTPEFS K DGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADND+VEAGN LS DKDTKNLKLSIEDE TTL
Subjt:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL

Query:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK
        LNECSELPLEDVTKNYIEKMNPPI DLTQITSIQSLETIPSNSQQ   KD+ F KSKKKNYKLRS VSSDRVLRSRTQEKAKAPE SNDLNNFTAEE+GK
Subjt:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK

Query:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE
        RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRID LCAEGRLSESLFDSE
Subjt:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE

Query:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN
        GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPE AAAAAGRN
Subjt:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN

Query:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS
        SD TLGLPSDDSEDGDYDPD+PDTIDQDNELSSDESSSDQ     SNSDTSGYASASEGLEV  NDDQYLGLPSDDSEDNDYDPSVPELDEG RQESSSS
Subjt:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS

Query:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYG
        DFTSDSEDLAAL+NNCSSKD DLVSSLNNTLPVKN+NG+SSGP+KS LHNELSSLLDSG DKDGLEP+SGRRQVERLDYKKLHDETYGNVPT+SSDDTYG
Subjt:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYG

Query:  STLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQ
        STLDSSDDRG DSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSV++ TSSSNRRLSQPALERL ASFQ
Subjt:  STLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQ

Query:  ENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGD
        ENEYPKRATK+SLAQELGL LKQVSKWFENTRWSTRHPSS GKKAKSSSRMSI+LSQASGELSKNE ESATCFRDTDSNGARHQDLPMANSVVASCQSGD
Subjt:  ENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGD

Query:  TGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI
        TGDKKL++RKTKR +SSATKSRKRKGRSDNTAS+SKDREGSPRPPAKSPKVNE QTADRFKTRRRRSI
Subjt:  TGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI

A0A5D3CQ03 Pathogenesis-related homeodomain protein0.0e+0085.97Show/hide
Query:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR
        MEERDE+TDTESRPNNNAEAVQEAKAS DMEERDENTG E R  NNAESVQKAKASDN                             MEERDENT TES 
Subjt:  MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDN-----------------------------MEERDENTDTESR

Query:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
        PNNN EAVQEA ASDNMEERDE+TGTESRPNNNAEAVQEAKASDNMKERD NT TESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA
Subjt:  PNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQEAKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKA

Query:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL
        SVEVEV TCLSNE  YSGYQELGTTPEFS K DGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADND+VEAGN LS DKDTKNLKLSIEDE TTL
Subjt:  SVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELGSGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTL

Query:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK
        LNECSELPLEDVTKNYIEKMNPPI DLTQITSIQSLETIPSNSQQ   KD+ F KSKKKNYKLRS VSSDRVLRSRTQEKAKAPE               
Subjt:  LNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGK

Query:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE
                       +DEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRID LCAEGRLSESLFDSE
Subjt:  RKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSE

Query:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN
        GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPE AAAAAGRN
Subjt:  GQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRN

Query:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS
        SD TLGLPSDDSEDGDYDPD+PDTIDQDNELSSDESSSDQ     SNSDTSGYASASEGLEV  NDDQYLGLPSDDSEDNDYDPSVPELDEG RQESSSS
Subjt:  SDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSS

Query:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHD
        DFTSDSEDLAAL+NNCSSKD DLVSSLNNTLPVKN+NG+SSGP+KS LHNELSSLLDSG DKDGLEP+SGRRQVERLDYKKLHD
Subjt:  DFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHD

A0A6J1D6Q5 homeobox protein HAT3.1 isoform X10.0e+0075.47Show/hide
Query:  MEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYS--GYQELGTTPEFSSKIDGPDEEKAGVQQNM-----ELGSGYLLSELSEKDNQTISN
        MEER E   TE RPN   EAVQEAKAS  VEVLTC SNE  +S    QELGTTPE +SK  GPD+EK+GVQQNM     ELGSG +LSEL EK+NQTIS 
Subjt:  MEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYS--GYQELGTTPEFSSKIDGPDEEKAGVQQNM-----ELGSGYLLSELSEKDNQTISN

Query:  HADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIP----SNSQQSARKDKIFLKSKKKNYKL
         A+ D+VEAGNLLS+D +T+NL L IE E TT LNECSELP ED  KN I+++NPPI DLTQ TSIQ LET+P    S SQQ   KDK  LKSKKKNY L
Subjt:  HADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIP----SNSQQSARKDKIFLKSKKKNYKL

Query:  RSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQ
        RS VSSDRVLRSRTQEKAKAPE SN+LN  TA E GKR KKKKRNI+GKGA  DE+SSIRN LRYL+NRI+YEQSLI+AYSSEGWKGFSSDKLKPEKELQ
Subjt:  RSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQ

Query:  RASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDC
        RAS+EIMR KLKIRDLFQ +D+LCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDC
Subjt:  RASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDC

Query:  KDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVS
        KDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAG+NSDH LGLPSDDSEDGDYDPD PDTI+Q++E SSD+SSSD+          SGYASASE LE +
Subjt:  KDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVS

Query:  SNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSS--GPNKSALHNELSSLLDSGPD
         NDDQYLGLPSDDSED+DY+P  PELDEGV+QESS SDFTSDSEDLAALD              + T PV+NSNGQ S  GP  S LHNEL SLL+SGPD
Subjt:  SNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSS--GPNKSALHNELSSLLDSGPD

Query:  KDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGS-TLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNN
        KDGLEPVSGRRQVERLDYKKLHDETYGNVP+DSSDDT+GS ++DSSDDRG  S TRKR PK LV AL  NG+NDDL N KTKRSYKRRT QKPGA N+ N
Subjt:  KDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGS-TLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNN

Query:  SVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSS-SGKKAKSSSRMSIYLSQAS
        SVT TP D+ KSSSSV+++ SSSNRRLSQPALERLLASFQEN+YPKRATK+SLAQELGL LKQVSKWFENTRWSTRHPSS    KAKS+ RM I  S+ S
Subjt:  SVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSS-SGKKAKSSSRMSIYLSQAS

Query:  GELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADR
        G+L K E ES  CFRDTD+NGA+HQ  P  +  VA CQSGDT D KL+++KT R +S+ATKSRKRKGRSD+ ASHSKDR+ S +PPAKSPKVN++QTAD+
Subjt:  GELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADR

Query:  FKTRRRRSI
         +TRRRRSI
Subjt:  FKTRRRRSI

A0A6J1J9X9 homeobox protein HAT3.1-like0.0e+0074.89Show/hide
Query:  MEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNM-----ELGSGYLLSELSEKDNQTISNHA
        MEERDE   TESR N  AEAVQEAK  VE E+ TCLSNE K+    EL  TP +++K  GPDEEK  VQQNM     ELGSG +LSELSEK NQT SN A
Subjt:  MEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNM-----ELGSGYLLSELSEKDNQTISNHA

Query:  DNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSS
        DND+VEAGNLL  DKDT+NL + IE E TTLL +CSELP E V KNYIE+MNPPI +LTQ T  Q LET+PSNS+QS  KDK  LKS K N  LRS VSS
Subjt:  DNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSS

Query:  DRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEI
        DR +RS+TQEK K PE SNDLNNFTAEE   + KKK+RNIQGKGARVDE+SSIRNHLRYLLNRI YEQ+LIEAYSSEGWKGFSSDKLKPEKELQRASNEI
Subjt:  DRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEI

Query:  MRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLD
        MRRKLKIRD+FQRIDALC EG LS+SLFDS+GQI SEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIP DDEGWLCPGCDCKDDCL+
Subjt:  MRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLD

Query:  LLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQY
        LLNEFQGS LSITDGWEKVYPEAAA+AAGRN DH LGLPSDDSED DYDPDVPDTI QD               D S+S+TSGYASASE LE S N DQY
Subjt:  LLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQY

Query:  LGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLV-SSLNNTLPVKNSNGQSS--GPNKSALHNELSSLLDSGPDKDGLE
        LGLPSDDSED+DYDPS PE DE VRQESSSSDFTSDSEDLAALD+N SSK  +LV SSLNNT  +KN +G+SS  GP KS+L+NELSSLL+SGPDKDG E
Subjt:  LGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLV-SSLNNTLPVKNSNGQSS--GPNKSALHNELSSLLDSGPDKDGLE

Query:  PVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGS-TLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTET
        PV GRRQVERLDYKKLHDETYGNVPTDSSDDTY S ++DSSDD+GWDS TRKR PKTLVLAL N   NDDLTNVKTK S KR TRQK  A+N+N SVT+T
Subjt:  PVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGS-TLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTET

Query:  PVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSS-SGKKAKSSSRMSIYLSQASGELSK
        P DT K+SSSV+++TSSS RRLSQ ALERLLASFQEN+YP+RATK+SLAQELGL +KQV+KWF NTRWSTRHPSS  G KAKSSSRM I+ SQASGEL +
Subjt:  PVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSS-SGKKAKSSSRMSIYLSQASGELSK

Query:  NEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRR
         E E           GA+HQ+LP A+SVVA CQSGDTGD KL+++ TKR++ SA KSRKRKGRSD+ AS SKD + S RPPAKSPKVNE+QTA   KTRR
Subjt:  NEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSATKSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRR

Query:  RRSI
        R S+
Subjt:  RRSI

SwissProt top hitse value%identityAlignment
P46605 Homeobox protein HOX1A1.3e-10340.09Show/hide
Query:  YKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEK
        Y L S  S  RVLRS +  K  + E      +  A      K++K      K +  DE+S IR  +RY+LNR+ YEQSLIEAY+SEGWK  S DK++PEK
Subjt:  YKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEK

Query:  ELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPG
        EL+RA +EI+R KL+IR++F+ ID+L ++G++ E+LFDSEG+I  EDIFC+ CGS + +L NDIILCDG CDRGFHQ CL PPL   DIP  DEGWLCP 
Subjt:  ELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPG

Query:  CDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGL
        CDCK DC+DL+NE  GSN+SI D WEKV+P+AAA A     D    LPSDDS+D D+DP++P    +++ +  DE SS++     S+SD S + + S+  
Subjt:  CDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGL

Query:  E--VSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSS--SDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLL
        E  +    D  L LPS+DSED+DYDP+ P+ D+ V ++SSS  SDFTSDS+D        S    D VSS    LP            ++   +     +
Subjt:  E--VSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSS--SDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLL

Query:  DSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGS----TLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQK
        ++  D+  + P S RRQ ERLDYKKL+DE YG   +DSSDD   S     +  S++ G  +    +G + +         ND+LT   TK+S        
Subjt:  DSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGS----TLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQK

Query:  PGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPAL-ERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSSSGKKAKSSSRM
            +++ SV E P D   + S+     S++ +    P + ++L   F+   YP R+ K+SLA+ELGL  +QV+KWFE  R S R  SS    +      
Subjt:  PGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPAL-ERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRHPSSSGKKAKSSSRM

Query:  SIYLSQASGELSKNEPESATCFR-DTDSNGARHQDLPMANSVVASCQSG-DTGDKKLSSRKTKRADSSATKSRKRK
            SQ +  +   EPE       +   NG         +S V S   G D G  K+ S + +       +  ++K
Subjt:  SIYLSQASGELSKNEPESATCFR-DTDSNGARHQDLPMANSVVASCQSG-DTGDKKLSSRKTKRADSSATKSRKRK

P48785 Pathogenesis-related homeodomain protein4.1e-4929.07Show/hide
Query:  SLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIR
        S+E I S    S  K    + +K+ + + +     +   +SRT++ ++   R  ++     ++   RK+K KR  +     VD+   ++   RYLL +++
Subjt:  SLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIR

Query:  YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRG
         +Q+LI+AY++EGWKG S +K++P+KEL+RA  EI+  KL +RD  +++D L + G + E +  S+G I  + IFCA+C S+E   +NDIILCDG C+R 
Subjt:  YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRG

Query:  FHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNS--DHTLGLPSDDSEDGDYDPDVPDTIDQDNELS
        FHQ CL+PPL    IPP D+GW C  CDCK + +D +N   G++  +   W+ ++ E A+   G  +  ++    PSDDS+D DYDP++           
Subjt:  FHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNS--DHTLGLPSDDSEDGDYDPDVPDTIDQDNELS

Query:  SDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLP
               + N   ++S+ SG                      D   DND             +ES S+  +  S+ +A    +  S +G  +S++     
Subjt:  SDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLP

Query:  VKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGS
          N                              E V G RQ   +DY +L+ E +G    D+     G     S+D  W    R++  +      S+ GS
Subjt:  VKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGS

Query:  NDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVK-KSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENT
            T V    S K+           +  V ET   + + S SV+ K       RL + A+E+L   F E E P +A +  LA+EL L  ++V+KWF+NT
Subjt:  NDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVK-KSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENT

Query:  RW
        R+
Subjt:  RW

P48786 Pathogenesis-related homeodomain protein9.3e-11846.45Show/hide
Query:  VSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKK-KKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRA
        V+S R LRSR+QEK+  P    D+NN  A+E   R+K +KKR  + +  RVDE+  IR HLRYLL+RI+YE++ ++AYS EGWKG S DK+KPEKEL+RA
Subjt:  VSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKK-KKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRA

Query:  SNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKD
          EI  RKLKIRDLFQR+D   +EGRL E LFDS G+IDSEDIFCAKCGSK+++L NDIILCDG CDRGFHQFCL+PPLL   IPPDDEGWLCPGC+CK 
Subjt:  SNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKD

Query:  DCLDLLNEFQGSNLSITDGWEKVY-PEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSS
        DC+ LLN+ Q +N+ + D WEKV+  EAAAAA+G+N D   GLPSDDSED DYDP  PD    D ++  D+SS+D+S+          Y S S+ ++V  
Subjt:  DCLDLLNEFQGSNLSITDGWEKVY-PEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSS

Query:  NDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSG-PDKD
          +   GLPSDDSED++YDPS    D+ + ++SS SDFTSDSED   + ++                      G++ GP  S   +  ++    G P++ 
Subjt:  NDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSG-PDKD

Query:  GLEPVSGRRQVERLDYKKLHD--------------------------ETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLT
           P+  RRQVE LDYKKL+D                          E YGN  +DSSD+ Y  T  SS D       +    K          S D   
Subjt:  GLEPVSGRRQVERLDYKKLHD--------------------------ETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLT

Query:  NVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRH
        + K + S   R   K  A+   +S      +   S++ V  S S+S     + A +RLL SF+EN+YP+RA K+SLA EL L ++QVS WF N RWS RH
Subjt:  NVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWSTRH

Query:  PSSSG
         S  G
Subjt:  PSSSG

Q04996 Homeobox protein HAT3.15.8e-12049.36Show/hide
Query:  GKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFD
        G+ KKK K   +G+    DEY+ I+  LRY LNRI YEQSLI+AYS EGWKG S +K++PEKEL+RA+ EI+RRKLKIRDLFQ +D LCAEG L ESLFD
Subjt:  GKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFD

Query:  SEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAG
        ++G+I SEDIFCAKCGSK+LS++NDIILCDG CDRGFHQ+CLEPPL   DIPPDDEGWLCPGCDCKDD LDLLN+  G+  S++D WEK++PEAAAA  G
Subjt:  SEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAG

Query:  RNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQ-----YLGLPSDDSEDNDYDPSVPELDEGV
           +    LPSDDS+D +YDPD  +  + D + S D   +++S ++  +SD + + SAS+ +  S  + +      + LPSDDSED+DYDP  P  D+  
Subjt:  RNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQ-----YLGLPSDDSEDNDYDPSVPELDEGV

Query:  RQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTD
         +ESS+SD TSD+EDL       +S  GD  +      P+++   Q+S     A+   L S  D G D DG   VS RR VERLDYKKL+DE Y NVPT 
Subjt:  RQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTD

Query:  SSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNV--KTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPA
        SSDD      D +   G +    +    T+ L  S+N  +     +  K+KR+ K+ T + P          E P +    S  ++KS+SS+ ++ + P 
Subjt:  SSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNV--KTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPA

Query:  LERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWS
         +RL  SFQEN+YP +ATK+SLA+EL + +KQV+ WF++ RWS
Subjt:  LERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWS

Q8H991 Homeobox protein HAZ15.3e-10539.94Show/hide
Query:  IPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQS
        +P+N   + ++     K +K++  LR   +  RVLRS +++K KA    N+L N  A      KK+K       G   D+Y  IR  +RY+LNR+ YEQS
Subjt:  IPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQS

Query:  LIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQF
        LI+AY+SEGWKG S +K++PEKEL+RA  EI+R K +IR+ F+ +D+L +EG+L ES+FDS G+I SEDIFCA CGSK+++L+NDIILCDGICDRGFHQ+
Subjt:  LIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQF

Query:  CLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSS
        CL PPLL  DIP  DEGWLCP CDCK DC+D+LNE QG  LSI D WEKV+PEAA+   G        LPSDDS D DYDP +      D E SS E   
Subjt:  CLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSS

Query:  DQSNSDPSNSDTSGYASASEGLEVSSN----DDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSS-----SDFTSDSEDLAA-LDNNCSSKD-GDLVSSL
        +  +SD S+S+ S  +S  E  + S N    DD  LGLPS+DSED D+DP+ P+ D+    ES+S     SDFTSDS+D  A +  +C   +     SS 
Subjt:  DQSNSDPSNSDTSGYASASEGLEVSSN----DDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSS-----SDFTSDSEDLAA-LDNNCSSKD-GDLVSSL

Query:  NNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDT--YGSTLDSSDDRGWDSGTRKRGPKTLVL
          T+   + +G    PN     N   + +++  ++D + P+S +RQVERLDYKKL++E YG   +DSSDD   YG   +S+ ++G          +T  L
Subjt:  NNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDT--YGSTLDSSDDRGWDSGTRKRGPKTLVL

Query:  ALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVS
        A S  G          +      T   P  +    SV++   +   S+S+    +++ NR       ++L A F+E+ YP RATK++LAQELGL   QV+
Subjt:  ALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVS

Query:  KWFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVA-----SCQSGDTGDKKLSSRKTKRADSSATK
        KWF +TR                     + ++ +    +N  E+ T   + ++N      L  +N +V+           TG   L+     R+D+S  +
Subjt:  KWFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVA-----SCQSGDTGDKKLSSRKTKRADSSATK

Query:  S
        S
Subjt:  S

Arabidopsis top hitse value%identityAlignment
AT3G19510.1 Homeodomain-like protein with RING/FYVE/PHD-type zinc finger domain4.1e-12149.36Show/hide
Query:  GKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFD
        G+ KKK K   +G+    DEY+ I+  LRY LNRI YEQSLI+AYS EGWKG S +K++PEKEL+RA+ EI+RRKLKIRDLFQ +D LCAEG L ESLFD
Subjt:  GKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFD

Query:  SEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAG
        ++G+I SEDIFCAKCGSK+LS++NDIILCDG CDRGFHQ+CLEPPL   DIPPDDEGWLCPGCDCKDD LDLLN+  G+  S++D WEK++PEAAAA  G
Subjt:  SEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAG

Query:  RNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQ-----YLGLPSDDSEDNDYDPSVPELDEGV
           +    LPSDDS+D +YDPD  +  + D + S D   +++S ++  +SD + + SAS+ +  S  + +      + LPSDDSED+DYDP  P  D+  
Subjt:  RNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQ-----YLGLPSDDSEDNDYDPSVPELDEGV

Query:  RQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTD
         +ESS+SD TSD+EDL       +S  GD  +      P+++   Q+S     A+   L S  D G D DG   VS RR VERLDYKKL+DE Y NVPT 
Subjt:  RQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTD

Query:  SSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNV--KTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPA
        SSDD      D +   G +    +    T+ L  S+N  +     +  K+KR+ K+ T + P          E P +    S  ++KS+SS+ ++ + P 
Subjt:  SSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNV--KTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPA

Query:  LERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWS
         +RL  SFQEN+YP +ATK+SLA+EL + +KQV+ WF++ RWS
Subjt:  LERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENTRWS

AT4G29940.1 pathogenesis related homeodomain protein A2.9e-5029.07Show/hide
Query:  SLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIR
        S+E I S    S  K    + +K+ + + +     +   +SRT++ ++   R  ++     ++   RK+K KR  +     VD+   ++   RYLL +++
Subjt:  SLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIR

Query:  YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRG
         +Q+LI+AY++EGWKG S +K++P+KEL+RA  EI+  KL +RD  +++D L + G + E +  S+G I  + IFCA+C S+E   +NDIILCDG C+R 
Subjt:  YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRG

Query:  FHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNS--DHTLGLPSDDSEDGDYDPDVPDTIDQDNELS
        FHQ CL+PPL    IPP D+GW C  CDCK + +D +N   G++  +   W+ ++ E A+   G  +  ++    PSDDS+D DYDP++           
Subjt:  FHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNS--DHTLGLPSDDSEDGDYDPDVPDTIDQDNELS

Query:  SDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLP
               + N   ++S+ SG                      D   DND             +ES S+  +  S+ +A    +  S +G  +S++     
Subjt:  SDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLP

Query:  VKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGS
          N                              E V G RQ   +DY +L+ E +G    D+     G     S+D  W    R++  +      S+ GS
Subjt:  VKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGS

Query:  NDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVK-KSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENT
            T V    S K+           +  V ET   + + S SV+ K       RL + A+E+L   F E E P +A +  LA+EL L  ++V+KWF+NT
Subjt:  NDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVK-KSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENT

Query:  RW
        R+
Subjt:  RW

AT4G29940.2 pathogenesis related homeodomain protein A2.9e-5029.07Show/hide
Query:  SLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIR
        S+E I S    S  K    + +K+ + + +     +   +SRT++ ++   R  ++     ++   RK+K KR  +     VD+   ++   RYLL +++
Subjt:  SLETIPSNSQQSARKDKIFLKSKKKNYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIR

Query:  YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRG
         +Q+LI+AY++EGWKG S +K++P+KEL+RA  EI+  KL +RD  +++D L + G + E +  S+G I  + IFCA+C S+E   +NDIILCDG C+R 
Subjt:  YEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEIMRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRG

Query:  FHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNS--DHTLGLPSDDSEDGDYDPDVPDTIDQDNELS
        FHQ CL+PPL    IPP D+GW C  CDCK + +D +N   G++  +   W+ ++ E A+   G  +  ++    PSDDS+D DYDP++           
Subjt:  FHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNLSITDGWEKVYPEAAAAAAGRNS--DHTLGLPSDDSEDGDYDPDVPDTIDQDNELS

Query:  SDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLP
               + N   ++S+ SG                      D   DND             +ES S+  +  S+ +A    +  S +G  +S++     
Subjt:  SDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPELDEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLP

Query:  VKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGS
          N                              E V G RQ   +DY +L+ E +G    D+     G     S+D  W    R++  +      S+ GS
Subjt:  VKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTYGSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGS

Query:  NDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVK-KSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENT
            T V    S K+           +  V ET   + + S SV+ K       RL + A+E+L   F E E P +A +  LA+EL L  ++V+KWF+NT
Subjt:  NDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVK-KSTSSSNRRLSQPALERLLASFQENEYPKRATKQSLAQELGLGLKQVSKWFENT

Query:  RW
        R+
Subjt:  RW


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAAGAAAGAGATGAAAGTACCGATACAGAATCAAGACCTAATAATAATGCTGAAGCAGTACAGGAAGCCAAGGCCAGTGTCGATATGGAAGAAAGAGATGAAAATAC
TGGTACAGAATTAAGACCTTTCAATAATGCTGAATCTGTACAAAAAGCCAAGGCCAGCGACAATATGGAAGAAAGAGATGAAAATACTGATACAGAATCAAGACCTAATA
ATAATCCTGAAGCCGTACAAGAGGCCATGGCCAGCGACAATATGGAAGAAAGAGATGAAAGTACTGGTACAGAATCAAGACCTAATAATAATGCTGAAGCTGTACAAGAA
GCCAAGGCCAGTGACAATATGAAAGAAAGAGATGAAAATACTGTTACAGAATCAAGACCAAATAATAATGCTGAAGCCGCACAAGAAGGCAAGGCCAGTGACAATATGGA
AGAAAGAGATGAAAATACAGATACAGAATCAAGACCTAATAAAATTGCTGAAGCCGTACAAGAAGCCAAGGCCAGTGTTGAAGTTGAAGTGCTAACTTGTCTTTCAAATG
AGGCAAAGTATTCAGGTTATCAGGAGTTGGGAACAACTCCAGAGTTTTCCAGCAAAATTGATGGTCCAGATGAAGAAAAAGCAGGAGTCCAACAGAATATGGAACTTGGT
TCTGGATATTTGCTTAGTGAGTTGTCAGAAAAAGATAATCAGACCATCTCTAATCATGCTGATAATGATCGAGTTGAAGCTGGCAATTTATTATCTAATGATAAAGATAC
TAAAAATTTAAAATTATCTATTGAAGATGAGGCAACGACTCTTCTTAATGAGTGCTCGGAACTTCCTCTTGAAGATGTCACCAAAAATTATATCGAAAAGATGAACCCTC
CCATTGGAGATTTAACTCAAATTACTTCTATCCAAAGTTTAGAAACAATCCCCAGTAATTCCCAGCAATCGGCTCGCAAGGATAAGATATTTTTGAAATCAAAAAAGAAA
AATTATAAGTTAAGGTCCCATGTAAGTAGCGACAGAGTTTTGCGTTCAAGGACCCAAGAGAAAGCTAAAGCTCCTGAACGAAGTAATGACTTGAATAATTTTACTGCTGA
AGAGGATGGAAAAAGGAAGAAGAAGAAGAAGAGAAATATACAAGGAAAGGGAGCAAGAGTGGATGAGTATTCATCAATCAGGAATCATTTGAGATATTTACTGAATCGCA
TCAGATATGAACAGAGTTTGATTGAAGCTTATTCTAGTGAAGGCTGGAAAGGGTTCAGCTCAGATAAATTGAAGCCCGAAAAGGAACTTCAGCGAGCATCAAATGAAATA
ATGCGACGCAAATTGAAAATAAGAGATCTATTTCAACGTATTGATGCCCTTTGTGCTGAAGGGAGGCTTTCTGAATCTTTATTCGATTCTGAAGGACAGATAGACAGCGA
GGATATATTCTGTGCAAAATGTGGATCCAAAGAACTGTCCCTTGAGAATGACATCATATTATGCGATGGCATTTGTGATCGTGGGTTCCATCAGTTCTGTTTAGAACCAC
CTTTGCTAAACACAGACATTCCGCCGGATGATGAGGGATGGCTGTGCCCTGGATGTGATTGCAAAGATGACTGCTTAGATCTTCTCAATGAATTTCAAGGATCAAATCTT
TCAATCACTGATGGTTGGGAGAAAGTCTATCCTGAGGCGGCAGCAGCAGCAGCTGGACGAAATTCTGATCACACCTTAGGTCTTCCTTCAGATGATTCTGAAGATGGTGA
TTATGATCCTGATGTTCCAGATACCATTGACCAGGACAATGAATTGAGTTCTGATGAATCAAGTTCTGATCAATCTAACTCTGATCCGTCAAACTCTGATACATCTGGTT
ATGCTTCTGCTTCTGAGGGATTAGAGGTTTCATCTAATGATGACCAGTACTTAGGTCTCCCTTCTGATGACTCGGAGGATAATGACTATGATCCCAGTGTTCCAGAACTT
GATGAGGGTGTTAGACAGGAAAGCTCAAGTTCTGACTTTACATCTGATTCTGAGGATCTAGCTGCCCTTGACAATAACTGTTCTTCGAAAGATGGTGACCTTGTGTCTTC
ATTAAATAATACTTTGCCTGTCAAAAACTCTAATGGGCAAAGTTCCGGTCCCAACAAGAGTGCACTACATAATGAGTTATCAAGTCTACTAGACTCTGGTCCTGATAAGG
ATGGTCTTGAGCCTGTTTCGGGAAGAAGGCAGGTTGAACGGTTGGATTATAAGAAGCTCCATGATGAGACATACGGGAACGTTCCTACTGACTCAAGCGATGACACCTAC
GGGAGTACTTTGGACTCGAGTGATGACAGAGGCTGGGATAGTGGTACAAGGAAGAGAGGTCCTAAAACTCTGGTTCTTGCATTGTCAAACAATGGATCTAATGATGATTT
GACCAATGTAAAAACTAAACGCAGTTATAAGAGGAGAACTCGTCAAAAGCCAGGTGCTATAAATGTGAATAATTCTGTGACTGAAACTCCTGTAGACACTGCAAAATCTA
GTTCCTCTGTTAAGAAAAGCACATCATCATCAAATAGAAGACTCAGTCAACCTGCATTGGAGAGACTTCTTGCATCATTCCAAGAAAATGAGTATCCTAAACGAGCTACA
AAGCAGAGTTTAGCACAAGAACTAGGCCTTGGTCTGAAGCAGGTTAGCAAATGGTTTGAGAACACGCGATGGAGCACACGCCATCCCTCAAGCAGTGGTAAGAAAGCAAA
AAGTTCCTCAAGAATGAGCATTTATTTATCACAGGCAAGTGGAGAACTATCCAAGAACGAGCCAGAATCTGCAACATGTTTCAGAGATACTGATAGCAATGGTGCTCGAC
ATCAAGACTTACCAATGGCAAATAGTGTTGTGGCTTCATGTCAGAGTGGGGATACAGGGGATAAGAAATTGTCGTCTCGGAAAACTAAAAGAGCAGACTCTTCAGCCACA
AAATCCAGAAAACGGAAGGGCAGGTCAGATAACACGGCATCACATTCAAAAGACAGGGAGGGATCACCAAGGCCTCCTGCCAAGTCACCTAAAGTTAATGAAATGCAAAC
AGCAGATAGGTTTAAGACAAGGAGGAGGAGATCCATTTAG
mRNA sequenceShow/hide mRNA sequence
ATGGAAGAAAGAGATGAAAGTACCGATACAGAATCAAGACCTAATAATAATGCTGAAGCAGTACAGGAAGCCAAGGCCAGTGTCGATATGGAAGAAAGAGATGAAAATAC
TGGTACAGAATTAAGACCTTTCAATAATGCTGAATCTGTACAAAAAGCCAAGGCCAGCGACAATATGGAAGAAAGAGATGAAAATACTGATACAGAATCAAGACCTAATA
ATAATCCTGAAGCCGTACAAGAGGCCATGGCCAGCGACAATATGGAAGAAAGAGATGAAAGTACTGGTACAGAATCAAGACCTAATAATAATGCTGAAGCTGTACAAGAA
GCCAAGGCCAGTGACAATATGAAAGAAAGAGATGAAAATACTGTTACAGAATCAAGACCAAATAATAATGCTGAAGCCGCACAAGAAGGCAAGGCCAGTGACAATATGGA
AGAAAGAGATGAAAATACAGATACAGAATCAAGACCTAATAAAATTGCTGAAGCCGTACAAGAAGCCAAGGCCAGTGTTGAAGTTGAAGTGCTAACTTGTCTTTCAAATG
AGGCAAAGTATTCAGGTTATCAGGAGTTGGGAACAACTCCAGAGTTTTCCAGCAAAATTGATGGTCCAGATGAAGAAAAAGCAGGAGTCCAACAGAATATGGAACTTGGT
TCTGGATATTTGCTTAGTGAGTTGTCAGAAAAAGATAATCAGACCATCTCTAATCATGCTGATAATGATCGAGTTGAAGCTGGCAATTTATTATCTAATGATAAAGATAC
TAAAAATTTAAAATTATCTATTGAAGATGAGGCAACGACTCTTCTTAATGAGTGCTCGGAACTTCCTCTTGAAGATGTCACCAAAAATTATATCGAAAAGATGAACCCTC
CCATTGGAGATTTAACTCAAATTACTTCTATCCAAAGTTTAGAAACAATCCCCAGTAATTCCCAGCAATCGGCTCGCAAGGATAAGATATTTTTGAAATCAAAAAAGAAA
AATTATAAGTTAAGGTCCCATGTAAGTAGCGACAGAGTTTTGCGTTCAAGGACCCAAGAGAAAGCTAAAGCTCCTGAACGAAGTAATGACTTGAATAATTTTACTGCTGA
AGAGGATGGAAAAAGGAAGAAGAAGAAGAAGAGAAATATACAAGGAAAGGGAGCAAGAGTGGATGAGTATTCATCAATCAGGAATCATTTGAGATATTTACTGAATCGCA
TCAGATATGAACAGAGTTTGATTGAAGCTTATTCTAGTGAAGGCTGGAAAGGGTTCAGCTCAGATAAATTGAAGCCCGAAAAGGAACTTCAGCGAGCATCAAATGAAATA
ATGCGACGCAAATTGAAAATAAGAGATCTATTTCAACGTATTGATGCCCTTTGTGCTGAAGGGAGGCTTTCTGAATCTTTATTCGATTCTGAAGGACAGATAGACAGCGA
GGATATATTCTGTGCAAAATGTGGATCCAAAGAACTGTCCCTTGAGAATGACATCATATTATGCGATGGCATTTGTGATCGTGGGTTCCATCAGTTCTGTTTAGAACCAC
CTTTGCTAAACACAGACATTCCGCCGGATGATGAGGGATGGCTGTGCCCTGGATGTGATTGCAAAGATGACTGCTTAGATCTTCTCAATGAATTTCAAGGATCAAATCTT
TCAATCACTGATGGTTGGGAGAAAGTCTATCCTGAGGCGGCAGCAGCAGCAGCTGGACGAAATTCTGATCACACCTTAGGTCTTCCTTCAGATGATTCTGAAGATGGTGA
TTATGATCCTGATGTTCCAGATACCATTGACCAGGACAATGAATTGAGTTCTGATGAATCAAGTTCTGATCAATCTAACTCTGATCCGTCAAACTCTGATACATCTGGTT
ATGCTTCTGCTTCTGAGGGATTAGAGGTTTCATCTAATGATGACCAGTACTTAGGTCTCCCTTCTGATGACTCGGAGGATAATGACTATGATCCCAGTGTTCCAGAACTT
GATGAGGGTGTTAGACAGGAAAGCTCAAGTTCTGACTTTACATCTGATTCTGAGGATCTAGCTGCCCTTGACAATAACTGTTCTTCGAAAGATGGTGACCTTGTGTCTTC
ATTAAATAATACTTTGCCTGTCAAAAACTCTAATGGGCAAAGTTCCGGTCCCAACAAGAGTGCACTACATAATGAGTTATCAAGTCTACTAGACTCTGGTCCTGATAAGG
ATGGTCTTGAGCCTGTTTCGGGAAGAAGGCAGGTTGAACGGTTGGATTATAAGAAGCTCCATGATGAGACATACGGGAACGTTCCTACTGACTCAAGCGATGACACCTAC
GGGAGTACTTTGGACTCGAGTGATGACAGAGGCTGGGATAGTGGTACAAGGAAGAGAGGTCCTAAAACTCTGGTTCTTGCATTGTCAAACAATGGATCTAATGATGATTT
GACCAATGTAAAAACTAAACGCAGTTATAAGAGGAGAACTCGTCAAAAGCCAGGTGCTATAAATGTGAATAATTCTGTGACTGAAACTCCTGTAGACACTGCAAAATCTA
GTTCCTCTGTTAAGAAAAGCACATCATCATCAAATAGAAGACTCAGTCAACCTGCATTGGAGAGACTTCTTGCATCATTCCAAGAAAATGAGTATCCTAAACGAGCTACA
AAGCAGAGTTTAGCACAAGAACTAGGCCTTGGTCTGAAGCAGGTTAGCAAATGGTTTGAGAACACGCGATGGAGCACACGCCATCCCTCAAGCAGTGGTAAGAAAGCAAA
AAGTTCCTCAAGAATGAGCATTTATTTATCACAGGCAAGTGGAGAACTATCCAAGAACGAGCCAGAATCTGCAACATGTTTCAGAGATACTGATAGCAATGGTGCTCGAC
ATCAAGACTTACCAATGGCAAATAGTGTTGTGGCTTCATGTCAGAGTGGGGATACAGGGGATAAGAAATTGTCGTCTCGGAAAACTAAAAGAGCAGACTCTTCAGCCACA
AAATCCAGAAAACGGAAGGGCAGGTCAGATAACACGGCATCACATTCAAAAGACAGGGAGGGATCACCAAGGCCTCCTGCCAAGTCACCTAAAGTTAATGAAATGCAAAC
AGCAGATAGGTTTAAGACAAGGAGGAGGAGATCCATTTAG
Protein sequenceShow/hide protein sequence
MEERDESTDTESRPNNNAEAVQEAKASVDMEERDENTGTELRPFNNAESVQKAKASDNMEERDENTDTESRPNNNPEAVQEAMASDNMEERDESTGTESRPNNNAEAVQE
AKASDNMKERDENTVTESRPNNNAEAAQEGKASDNMEERDENTDTESRPNKIAEAVQEAKASVEVEVLTCLSNEAKYSGYQELGTTPEFSSKIDGPDEEKAGVQQNMELG
SGYLLSELSEKDNQTISNHADNDRVEAGNLLSNDKDTKNLKLSIEDEATTLLNECSELPLEDVTKNYIEKMNPPIGDLTQITSIQSLETIPSNSQQSARKDKIFLKSKKK
NYKLRSHVSSDRVLRSRTQEKAKAPERSNDLNNFTAEEDGKRKKKKKRNIQGKGARVDEYSSIRNHLRYLLNRIRYEQSLIEAYSSEGWKGFSSDKLKPEKELQRASNEI
MRRKLKIRDLFQRIDALCAEGRLSESLFDSEGQIDSEDIFCAKCGSKELSLENDIILCDGICDRGFHQFCLEPPLLNTDIPPDDEGWLCPGCDCKDDCLDLLNEFQGSNL
SITDGWEKVYPEAAAAAAGRNSDHTLGLPSDDSEDGDYDPDVPDTIDQDNELSSDESSSDQSNSDPSNSDTSGYASASEGLEVSSNDDQYLGLPSDDSEDNDYDPSVPEL
DEGVRQESSSSDFTSDSEDLAALDNNCSSKDGDLVSSLNNTLPVKNSNGQSSGPNKSALHNELSSLLDSGPDKDGLEPVSGRRQVERLDYKKLHDETYGNVPTDSSDDTY
GSTLDSSDDRGWDSGTRKRGPKTLVLALSNNGSNDDLTNVKTKRSYKRRTRQKPGAINVNNSVTETPVDTAKSSSSVKKSTSSSNRRLSQPALERLLASFQENEYPKRAT
KQSLAQELGLGLKQVSKWFENTRWSTRHPSSSGKKAKSSSRMSIYLSQASGELSKNEPESATCFRDTDSNGARHQDLPMANSVVASCQSGDTGDKKLSSRKTKRADSSAT
KSRKRKGRSDNTASHSKDREGSPRPPAKSPKVNEMQTADRFKTRRRRSI