; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cucsat.G4041 (gene) of Cucumber (B10) v3 genome

Gene IDCucsat.G4041
OrganismCucumis sativus L. var. sativus cv. B10 (Cucumber (B10) v3)
Descriptionglutamic acid-rich protein isoform X2
Genome locationctg105:2943167..2952504
RNA-Seq ExpressionCucsat.G4041
SyntenyCucsat.G4041
Gene Ontology termsGO:0005634 - nucleus (cellular component)
GO:0016874 - ligase activity (molecular function)
InterPro domainsIPR019098 - Histone chaperone domain CHZ
IPR037647 - HIRA-interacting protein 3


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004145363.1 DNA ligase 1 isoform X1 [Cucumis sativus]1.52e-31294.02Show/hide
Query:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
Subjt:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTS
        TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPD+NETKKRKRSTKKTVSAQKQSKHVQDTS
Subjt:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTS

Query:  DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKR
        DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGM                              SVPPSIYKKVKQAPESKR
Subjt:  DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKR

Query:  ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD
        ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD
Subjt:  ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD

Query:  VDESQGEEFNEDDNEDSD
        VDESQGEEFNEDDNEDSD
Subjt:  VDESQGEEFNEDDNEDSD

XP_008466701.1 PREDICTED: DNA ligase 1 isoform X1 [Cucumis melo]3.62e-25088.06Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEE PESPEGHQSKKGAKEPCLEDEEK+EDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKN LDSCKK ISQQVEEILTSCEAAE+VSNLK+PKK+SKESS+STEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEV

Query:  NPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYL
        NPGKTNATKGRI D+NETKKRKRSTKK VSA+KQ KHVQDTSDEDSDEGG NVSED +SGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGM      
Subjt:  NPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYL

Query:  SPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS
                                SVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSAN TEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS
Subjt:  SPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS

Query:  YVAPPPKPKIPVKTDGDDAD-----EEEDDEEE---DEEEEDGEEE-DNGDVDESQGEEFNEDDNEDSD
        YVAPPPKPKIPVKTDGDDAD     EEEDDEEE   DEEEEDGEEE DNGDVDESQGEEFNEDDNEDSD
Subjt:  YVAPPPKPKIPVKTDGDDAD-----EEEDDEEE---DEEEEDGEEE-DNGDVDESQGEEFNEDDNEDSD

XP_011649194.1 DNA ligase 1 isoform X2 [Cucumis sativus]2.12e-30692.86Show/hide
Query:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
Subjt:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTS
        TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPD+NETKKRKRSTKKTVSAQKQSKHVQDTS
Subjt:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTS

Query:  DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKR
        DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGM                              SVPPSIYKKVKQAPESKR
Subjt:  DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKR

Query:  ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD
        ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD
Subjt:  ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD

Query:  VDESQGEEFNEDDNEDSD
        VDESQ      DDNEDSD
Subjt:  VDESQGEEFNEDDNEDSD

XP_038884709.1 glutamic acid-rich protein isoform X1 [Benincasa hispida]3.48e-25279.44Show/hide
Query:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQ  D   ++ MDVAV IETKI+NAMRSR+S+FKE+ADSLTFEGVRRLLEKDLCME YTLDVHKR VKQCLVKC EAD EDNVSK SE TGRKSVN
Subjt:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEEA E  EGHQSKKG KEPC EDEEKMEDSPVMGLL  R+TKNVESDGIKGIK KDDKD+PSES I KAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN---LKSPKKISKESSYSTEGSSSEE----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS
        TKN LDSCKKFISQQVEEILTSCEAAEQVSN   LK+PKK+SKESS+STEGSSSEE    ENDEV PGK NATKGRIP++NETKKRKRSTK+T+SA+KQS
Subjt:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN---LKSPKKISKESSYSTEGSSSEE----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS

Query:  KHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVK
        KHVQ TS+ED+DEGG NVSEDG+S SS+E+PVKKEVS  TPVYGK VEHLKSVIKSCGM                              SVPPSIYKKVK
Subjt:  KHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVK

Query:  QAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDAD-------EEEDDEEE
        QAPESKRESQLIKELEGILSREGLSAN TEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRS TSY  PPPKPKIPVKTDGD  D       EEED++EE
Subjt:  QAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDAD-------EEEDDEEE

Query:  D---EEEEDGEEEDNGDVDESQGEEFNEDDNEDSD
        D   EEEEDGEEEDNG+VD SQGEEFNEDDNEDSD
Subjt:  D---EEEEDGEEEDNGDVDESQGEEFNEDDNEDSD

XP_038884710.1 glutamic acid-rich protein isoform X2 [Benincasa hispida]4.79e-24678.32Show/hide
Query:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQ  D   ++ MDVAV IETKI+NAMRSR+S+FKE+ADSLTFEGVRRLLEKDLCME YTLDVHKR VKQCLVKC EAD EDNVSK SE TGRKSVN
Subjt:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEEA E  EGHQSKKG KEPC EDEEKMEDSPVMGLL  R+TKNVESDGIKGIK KDDKD+PSES I KAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN---LKSPKKISKESSYSTEGSSSEE----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS
        TKN LDSCKKFISQQVEEILTSCEAAEQVSN   LK+PKK+SKESS+STEGSSSEE    ENDEV PGK NATKGRIP++NETKKRKRSTK+T+SA+KQS
Subjt:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN---LKSPKKISKESSYSTEGSSSEE----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS

Query:  KHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVK
        KHVQ TS+ED+DEGG NVSEDG+S SS+E+PVKKEVS  TPVYGK VEHLKSVIKSCGM                              SVPPSIYKKVK
Subjt:  KHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVK

Query:  QAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDAD-------EEEDDEEE
        QAPESKRESQLIKELEGILSREGLSAN TEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRS TSY  PPPKPKIPVKTDGD  D       EEED++EE
Subjt:  QAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDAD-------EEEDDEEE

Query:  D---EEEEDGEEEDNGDVDESQGEEFNEDDNEDSD
        D   EEEEDGEEEDNG+VD SQ      DDNEDSD
Subjt:  D---EEEEDGEEEDNGDVDESQGEEFNEDDNEDSD

TrEMBL top hitse value%identityAlignment
A0A0A0LIS6 CHZ domain-containing protein7.35e-31394.02Show/hide
Query:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
Subjt:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTS
        TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPD+NETKKRKRSTKKTVSAQKQSKHVQDTS
Subjt:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTS

Query:  DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKR
        DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGM                              SVPPSIYKKVKQAPESKR
Subjt:  DEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKR

Query:  ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD
        ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD
Subjt:  ESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGD

Query:  VDESQGEEFNEDDNEDSD
        VDESQGEEFNEDDNEDSD
Subjt:  VDESQGEEFNEDDNEDSD

A0A1S3CRU1 glutamic acid-rich protein isoform X22.43e-24486.78Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEE PESPEGHQSKKGAKEPCLEDEEK+EDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKN LDSCKK ISQQVEEILTSCEAAE+VSNLK+PKK+SKESS+STEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEV

Query:  NPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYL
        NPGKTNATKGRI D+NETKKRKRSTKK VSA+KQ KHVQDTSDEDSDEGG NVSED +SGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGM      
Subjt:  NPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYL

Query:  SPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS
                                SVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSAN TEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS
Subjt:  SPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS

Query:  YVAPPPKPKIPVKTDGDDAD-----EEEDDEEE---DEEEEDGEEE-DNGDVDESQGEEFNEDDNEDSD
        YVAPPPKPKIPVKTDGDDAD     EEEDDEEE   DEEEEDGEEE DNGDVDESQ      DDNEDSD
Subjt:  YVAPPPKPKIPVKTDGDDAD-----EEEDDEEE---DEEEEDGEEE-DNGDVDESQGEEFNEDDNEDSD

A0A1S3CRW5 DNA ligase 1 isoform X11.75e-25088.06Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEE PESPEGHQSKKGAKEPCLEDEEK+EDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKN LDSCKK ISQQVEEILTSCEAAE+VSNLK+PKK+SKESS+STEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEILTSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEV

Query:  NPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYL
        NPGKTNATKGRI D+NETKKRKRSTKK VSA+KQ KHVQDTSDEDSDEGG NVSED +SGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGM      
Subjt:  NPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYL

Query:  SPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS
                                SVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSAN TEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS
Subjt:  SPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTS

Query:  YVAPPPKPKIPVKTDGDDAD-----EEEDDEEE---DEEEEDGEEE-DNGDVDESQGEEFNEDDNEDSD
        YVAPPPKPKIPVKTDGDDAD     EEEDDEEE   DEEEEDGEEE DNGDVDESQGEEFNEDDNEDSD
Subjt:  YVAPPPKPKIPVKTDGDDAD-----EEEDDEEE---DEEEEDGEEE-DNGDVDESQGEEFNEDDNEDSD

A0A6J1FFY5 DNA ligase 1-like isoform X19.21e-24577.9Show/hide
Query:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQ ND P EE MDV VGIETKI NAM SR+SHFKEQADSLTFEGVRRLLEKDLCMETY LDVHKRY+KQCLVKCLE   EDN SK SE TG KSV+
Subjt:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        + EA ES EGHQSKKGAKEPCLEDEEKMEDSPVMGLL G  TKNVESD IKGIK KDDKD+P+ESTI KAIRKRT YLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN------LKSPKKISKESSYSTEG-SSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS
        TK  LD CKKFISQQVEEIL SCEAAE+VSN      LK+PKK+SKESS+STEG SSSEEE+DEV P K N TKGRI ++NETKKRKRSTK+ VSA+KQ 
Subjt:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN------LKSPKKISKESSYSTEG-SSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS

Query:  KHVQDTSDEDSDEGGG-NVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKV
        KHVQ TS+EDSDE GG NVSEDG S SSNEKPVKKEVS  TPVYGKRVEHLKSVIKSCGM                              SVPPSIYKKV
Subjt:  KHVQDTSDEDSDEGGG-NVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKV

Query:  KQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEED
        KQAPESKRESQLIKELEGILSREGLSAN TEKEIK+VKKKKERAKELEGIDLSNIVSSSRRRST+SYVAPPPKPKIPVKT+GDD D+ +D+EEED++++D
Subjt:  KQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEED

Query:  GE-------EEDNGDVDESQGEE-FNEDDNEDSD
         E       EEDNGDVDESQGEE FNEDDNEDSD
Subjt:  GE-------EEDNGDVDESQGEE-FNEDDNEDSD

A0A6J1FGV2 glutamic acid-rich protein-like isoform X21.83e-24076.92Show/hide
Query:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQ ND P EE MDV VGIETKI NAM SR+SHFKEQADSLTFEGVRRLLEKDLCMETY LDVHKRY+KQCLVKCLE   EDN SK SE TG KSV+
Subjt:  MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        + EA ES EGHQSKKGAKEPCLEDEEKMEDSPVMGLL G  TKNVESD IKGIK KDDKD+P+ESTI KAIRKRT YLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEAPESPEGHQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN------LKSPKKISKESSYSTEG-SSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS
        TK  LD CKKFISQQVEEIL SCEAAE+VSN      LK+PKK+SKESS+STEG SSSEEE+DEV P K N TKGRI ++NETKKRKRSTK+ VSA+KQ 
Subjt:  TKNVLDSCKKFISQQVEEILTSCEAAEQVSN------LKSPKKISKESSYSTEG-SSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQS

Query:  KHVQDTSDEDSDEGGG-NVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKV
        KHVQ TS+EDSDE GG NVSEDG S SSNEKPVKKEVS  TPVYGKRVEHLKSVIKSCGM                              SVPPSIYKKV
Subjt:  KHVQDTSDEDSDEGGG-NVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKV

Query:  KQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEED
        KQAPESKRESQLIKELEGILSREGLSAN TEKEIK+VKKKKERAKELEGIDLSNIVSSSRRRST+SYVAPPPKPKIPVKT+GDD D+ +D+EEED++++D
Subjt:  KQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEED

Query:  GE-------EEDNGDVDESQGEEFNEDDNEDSD
         E       EEDNGDVDESQ      DDNEDSD
Subjt:  GE-------EEDNGDVDESQGEEFNEDDNEDSD

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G44780.1 CONTAINS InterPro DOMAIN/s: Histone chaperone domain CHZ (InterPro:IPR019098)4.6e-6540Show/hide
Query:  AVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAK
        A  IE KI  A+RSR+++ + +AD  T   VRR+LE+D+ +E   LDV+K +VK+ LVKCLE    ++ S++S+ T R+    +E P      QS     
Subjt:  AVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAK

Query:  EPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEE
            E+ E M D+           +N      K +KGK +K+   +  I +A+RKR SY+KANSE +TMA +RRLLE+DLKL K  LD  KKFI+++++E
Subjt:  EPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEE

Query:  IL-----TSCEAAEQVSNLKSPKKISKESSYSTEGSSSEE-----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGG
        +L       C     V N+K   K +     S+E +S  +     +N+EV   KT A K ++       KRK    K VS +K++KH +  S+ DSD G 
Subjt:  IL-----TSCEAAEQVSNLKSPKKISKESSYSTEGSSSEE-----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGG

Query:  GNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKEL
                    +EK +K+   ++T VYGKRVEHLKSVIKSCGM                              SVPP+IYKK KQAP+ KRE+ LI+EL
Subjt:  GNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKEL

Query:  EGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGDVDESQGEE
        E IL++EGLS++ +  EIKEVKK+K  ++ELEGID +NIV +SRRRS+TS+ APPPKPK+  +++  ++DE ED E E+E  E  E     +  E +   
Subjt:  EGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGDVDESQGEE

Query:  FNEDDNEDSD
          +D  E+SD
Subjt:  FNEDDNEDSD

AT1G44780.2 INVOLVED IN: biological_process unknown6.7e-6440Show/hide
Query:  AVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAK
        A  IE KI  A+RSR+++ + +AD  T   VRR+LE+D+ +E   LDV+K +VK+ LVKCLE    ++ S++S+ T R+    +E P      QS     
Subjt:  AVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEGHQSKKGAK

Query:  EPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEE
            E+ E M D+           +N      K +KGK +K+   +  I +A+RKR SY+KANSE +TMA +RRLLE+DLKL K  LD  KKFI+++++E
Subjt:  EPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEE

Query:  IL-----TSCEAAEQVSNLKSPKKISKESSYSTEGSSSEE-----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGG
        +L       C     V N+K   K +     S+E +S  +     +N+EV   KT A K ++       KRK    K VS +K++KH +  S+ DSD G 
Subjt:  IL-----TSCEAAEQVSNLKSPKKISKESSYSTEGSSSEE-----ENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGG

Query:  GNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKEL
                    +EK +K +  ++T VYGKRVEHLKSVIKSCGM                              SVPP+IYKK KQAP+ KRE+ LI+EL
Subjt:  GNVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKEL

Query:  EGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGDVDESQGEE
        E IL++EGLS++ +  EIKEVKK+K  ++ELEGID +NIV +SRRRS+TS+ APPPKPK+  +++  ++DE ED E E+E  E  E     +  E +   
Subjt:  EGILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGDVDESQGEE

Query:  FNEDDNEDSD
          +D  E+SD
Subjt:  FNEDDNEDSD

AT4G08310.1 FUNCTIONS IN: molecular_function unknown4.3e-7944.57Show/hide
Query:  IETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKS--VNKEEAPESPEGHQSKKGAKE
        IE++I  AM+SR+++ +++AD+ TFEGVRRLLE+DL +E + LDVHK +VKQ LV+CL     D  S++S  T +K      +EA E  + H +KK  KE
Subjt:  IETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKS--VNKEEAPESPEGHQSKKGAKE

Query:  PCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEI
            D+EK +DSPVMGLLT  +T    ++  K     +DK+V  +S I KA+RKR+SY+KANSEK+TM  +RRLLE DLKL K  LD  KKFI+ +++EI
Subjt:  PCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEI

Query:  LTSCEAAEQVSNLK----------SPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGG
        L + EA +  +  +          +P K S            EEE+ EV   K  A K ++  +  T KRKR  +K  SA K++K     SD D+     
Subjt:  LTSCEAAEQVSNLK----------SPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGG

Query:  NVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELE
             G    S+EK VKK  + +T  YGKRVEHLKS+IKSCGM                              S+ PS+Y+K KQAPE KRE  LIKEL+
Subjt:  NVSEDGRSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELE

Query:  GILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEED---------EEEEDGEEEDNGD
         +L++EGLSAN +EKEIKEVKK+KER KELEGID SNIVSSSRRRS+ S+V PPPKP    +++ DD+++ E++E+ED         EEE++G  ED G+
Subjt:  GILSREGLSANSTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEED---------EEEEDGEEEDNGD

Query:  VDESQGEEFNEDDNED
          +++GE   ED  E+
Subjt:  VDESQGEEFNEDDNED


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCAGAGGAATTACAAGGCAACGATACTCCGAAAGAAGAACCCATGGATGTAGCTGTTGGTATAGAGACGAAGATTCATAACGCTATGCGCTCTCGCATCTCTCACTT
CAAGGAACAAGCCGACTCTTTGACATTTGAGGGGGTTAGAAGGTTGTTGGAAAAGGACTTGTGCATGGAGACGTATACTTTAGATGTACACAAAAGATACGTCAAGCAGT
GTTTGGTGAAGTGCTTAGAAGCTGATTTGGAAGACAATGTATCCAAGGATTCTGAGTTGACAGGGAGGAAAAGTGTAAATAAAGAAGAAGCGCCTGAATCACCTGAAGGG
CATCAGTCCAAGAAAGGTGCAAAGGAACCTTGCTTGGAAGATGAGGAAAAAATGGAGGACTCTCCAGTTATGGGCCTTCTCACAGGACGTAGCACAAAAAATGTTGAATC
TGATGGAATCAAAGGAATCAAAGGCAAAGATGACAAAGATGTTCCTAGTGAGAGTACAATTATGAAAGCGATTAGAAAAAGAACTTCTTATCTTAAAGCTAATTCAGAGA
AAGTTACTATGGCTGGAGTTCGCCGCCTTCTGGAGGATGACCTTAAACTTACTAAAAATGTTCTTGACAGTTGTAAGAAGTTTATAAGCCAACAAGTAGAGGAGATATTG
ACTTCTTGTGAAGCTGCTGAACAAGTTTCTAATTTGAAATCTCCGAAAAAGATCAGCAAAGAAAGCTCTTATTCTACTGAAGGGAGCAGCAGTGAGGAGGAAAACGATGA
GGTAAACCCTGGAAAGACAAATGCAACTAAAGGAAGAATACCGGACGCTAATGAAACAAAAAAGCGGAAAAGGTCTACAAAGAAGACTGTCTCTGCCCAGAAGCAAAGCA
AGCATGTCCAGGATACATCAGATGAGGATAGTGATGAAGGTGGTGGAAATGTCTCTGAAGATGGTCGATCTGGTTCATCTAATGAAAAACCTGTGAAGAAGGAAGTTTCA
AGTTCAACTCCTGTCTATGGCAAGCGTGTGGAGCACTTGAAATCTGTTATCAAATCATGTGGGATGAGGTTTTGTTTCTATCTCTCACCAATTACATGCTTAATTTCTGA
GTTGATGTGTAAAGAATTAAGATTTAAGATCAGTAATTTCGCATACAGTGTTCCTCCATCGATTTATAAGAAAGTCAAGCAGGCACCTGAAAGCAAACGTGAATCACAAC
TTATAAAGGAGTTGGAGGGGATACTATCCAGAGAAGGACTATCTGCTAATTCCACGGAAAAAGAAATTAAGGAAGTCAAAAAGAAGAAGGAAAGGGCCAAAGAACTTGAA
GGCATCGACTTAAGTAATATTGTCTCAAGTTCACGTAGAAGATCAACAACCAGTTATGTTGCACCACCTCCAAAACCGAAAATACCAGTTAAAACCGATGGCGATGATGC
AGATGAGGAGGAGGATGATGAAGAAGAAGACGAGGAAGAAGAGGACGGTGAGGAAGAGGATAATGGCGATGTTGATGAAAGCCAAGGTGAAGAATTTAACGAGGATGACA
ATGAAGACAGCGATTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCAGAGGAATTACAAGGCAACGATACTCCGAAAGAAGAACCCATGGATGTAGCTGTTGGTATAGAGACGAAGATTCATAACGCTATGCGCTCTCGCATCTCTCACTT
CAAGGAACAAGCCGACTCTTTGACATTTGAGGGGGTTAGAAGGTTGTTGGAAAAGGACTTGTGCATGGAGACGTATACTTTAGATGTACACAAAAGATACGTCAAGCAGT
GTTTGGTGAAGTGCTTAGAAGCTGATTTGGAAGACAATGTATCCAAGGATTCTGAGTTGACAGGGAGGAAAAGTGTAAATAAAGAAGAAGCGCCTGAATCACCTGAAGGG
CATCAGTCCAAGAAAGGTGCAAAGGAACCTTGCTTGGAAGATGAGGAAAAAATGGAGGACTCTCCAGTTATGGGCCTTCTCACAGGACGTAGCACAAAAAATGTTGAATC
TGATGGAATCAAAGGAATCAAAGGCAAAGATGACAAAGATGTTCCTAGTGAGAGTACAATTATGAAAGCGATTAGAAAAAGAACTTCTTATCTTAAAGCTAATTCAGAGA
AAGTTACTATGGCTGGAGTTCGCCGCCTTCTGGAGGATGACCTTAAACTTACTAAAAATGTTCTTGACAGTTGTAAGAAGTTTATAAGCCAACAAGTAGAGGAGATATTG
ACTTCTTGTGAAGCTGCTGAACAAGTTTCTAATTTGAAATCTCCGAAAAAGATCAGCAAAGAAAGCTCTTATTCTACTGAAGGGAGCAGCAGTGAGGAGGAAAACGATGA
GGTAAACCCTGGAAAGACAAATGCAACTAAAGGAAGAATACCGGACGCTAATGAAACAAAAAAGCGGAAAAGGTCTACAAAGAAGACTGTCTCTGCCCAGAAGCAAAGCA
AGCATGTCCAGGATACATCAGATGAGGATAGTGATGAAGGTGGTGGAAATGTCTCTGAAGATGGTCGATCTGGTTCATCTAATGAAAAACCTGTGAAGAAGGAAGTTTCA
AGTTCAACTCCTGTCTATGGCAAGCGTGTGGAGCACTTGAAATCTGTTATCAAATCATGTGGGATGAGGTTTTGTTTCTATCTCTCACCAATTACATGCTTAATTTCTGA
GTTGATGTGTAAAGAATTAAGATTTAAGATCAGTAATTTCGCATACAGTGTTCCTCCATCGATTTATAAGAAAGTCAAGCAGGCACCTGAAAGCAAACGTGAATCACAAC
TTATAAAGGAGTTGGAGGGGATACTATCCAGAGAAGGACTATCTGCTAATTCCACGGAAAAAGAAATTAAGGAAGTCAAAAAGAAGAAGGAAAGGGCCAAAGAACTTGAA
GGCATCGACTTAAGTAATATTGTCTCAAGTTCACGTAGAAGATCAACAACCAGTTATGTTGCACCACCTCCAAAACCGAAAATACCAGTTAAAACCGATGGCGATGATGC
AGATGAGGAGGAGGATGATGAAGAAGAAGACGAGGAAGAAGAGGACGGTGAGGAAGAGGATAATGGCGATGTTGATGAAAGCCAAGGTGAAGAATTTAACGAGGATGACA
ATGAAGACAGCGATTGA
Protein sequenceShow/hide protein sequence
MAEELQGNDTPKEEPMDVAVGIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEAPESPEG
HQSKKGAKEPCLEDEEKMEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNVLDSCKKFISQQVEEIL
TSCEAAEQVSNLKSPKKISKESSYSTEGSSSEEENDEVNPGKTNATKGRIPDANETKKRKRSTKKTVSAQKQSKHVQDTSDEDSDEGGGNVSEDGRSGSSNEKPVKKEVS
SSTPVYGKRVEHLKSVIKSCGMRFCFYLSPITCLISELMCKELRFKISNFAYSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANSTEKEIKEVKKKKERAKELE
GIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADEEEDDEEEDEEEEDGEEEDNGDVDESQGEEFNEDDNEDSD