; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cmc03g0066901 (gene) of Melon (Charmono) v1.1 genome

Gene IDCmc03g0066901
OrganismCucumis melo var. cantalupensis cv. Charmono (Melon (Charmono) v1.1)
Descriptionglutamic acid-rich protein isoform X2
Genome locationCMiso1.1chr03:9273626..9285038
RNA-Seq ExpressionCmc03g0066901
SyntenyCmc03g0066901
Gene Ontology termsGO:0005634 - nucleus (cellular component)
GO:0016874 - ligase activity (molecular function)
InterPro domainsIPR019098 - Histone chaperone domain CHZ
IPR037647 - HIRA-interacting protein 3


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004145363.1 DNA ligase 1 isoform X1 [Cucumis sativus]5.8e-23294.37Show/hide
Query:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQGND  KEEPMDVAV IETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
Subjt:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEE PESPEGHQSKKGAKEPCLEDEEK+EDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTS
        TKN LDSCKK ISQQVEEILTSCEAAE+VSNLK+PKK+SKESS+STEGSSSEEENDEVNPGKTNATKGRI DSNETKKRKRSTKK VSA+KQ KHVQDTS
Subjt:  TKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTS

Query:  DEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVK
        DEDSDEGG NVSED +SGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSAN TEKEIKEVK
Subjt:  DEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVK

Query:  KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDA     DEEEDDEEE   DEEEEDG EEEDNGDVDESQGEEFNEDDNEDSD
Subjt:  KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

XP_008466701.1 PREDICTED: DNA ligase 1 isoform X1 [Cucumis melo]1.4e-217100Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV

Query:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
        NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
Subjt:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI

Query:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
        YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
Subjt:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD

Query:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
Subjt:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

XP_008466703.1 PREDICTED: glutamic acid-rich protein isoform X2 [Cucumis melo]1.0e-21298.63Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV

Query:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
        NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
Subjt:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI

Query:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
        YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
Subjt:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD

Query:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        EEEEDDDEEEEDGEEEEDNGDVDESQ      DDNEDSD
Subjt:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

XP_011649194.1 DNA ligase 1 isoform X2 [Cucumis sativus]3.3e-22793.16Show/hide
Query:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQGND  KEEPMDVAV IETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
Subjt:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEE PESPEGHQSKKGAKEPCLEDEEK+EDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTS
        TKN LDSCKK ISQQVEEILTSCEAAE+VSNLK+PKK+SKESS+STEGSSSEEENDEVNPGKTNATKGRI DSNETKKRKRSTKK VSA+KQ KHVQDTS
Subjt:  TKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTS

Query:  DEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVK
        DEDSDEGG NVSED +SGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSAN TEKEIKEVK
Subjt:  DEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVK

Query:  KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDA     DEEEDDEEE   DEEEEDG EEEDNGDVDESQ      DDNEDSD
Subjt:  KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

XP_038884709.1 glutamic acid-rich protein isoform X1 [Benincasa hispida]7.1e-20685.57Show/hide
Query:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQ  DA  ++ MDVAVDIETKI+NAMRSR+S+FKE+ADSLTFEGVRRLLEKDLCME YTLDVHKR VKQCLVKC EAD EDNVSK SE TGRKSVN
Subjt:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEE  E  EGHQSKKG KEPC EDEEK+EDSPVMGLL  R+TKNVESDGIKGIK KDDKD+PSES I KAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNALDSCKKLISQQVEEILTSCEAAEKVSN---LKTPKKVSKESSHSTEGSS----SEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQR
        TKNALDSCKK ISQQVEEILTSCEAAE+VSN   LKTPKKVSKESSHSTEGSS    SEEENDEV PGK NATKGRI +SNETKKRKRSTK+ +SAKKQ 
Subjt:  TKNALDSCKKLISQQVEEILTSCEAAEKVSN---LKTPKKVSKESSHSTEGSS----SEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQR

Query:  KHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTE
        KHVQ TS+ED+DEGGENVSED QS SS+E+PVKKEV  STPVYGK VEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTE
Subjt:  KHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTE

Query:  KEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKT--DGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNED
        KEIKEVKKKKERAKELEGIDLSNIVSSSRRRS TSY  PPPKPKIPVKT  DGDD DDT+++EEED++EE+DDDEEEEDG EEEDNG+VD SQGEEFNED
Subjt:  KEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKT--DGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNED

Query:  DNEDSD
        DNEDSD
Subjt:  DNEDSD

TrEMBL top hitse value%identityAlignment
A0A0A0LIS6 CHZ domain-containing protein2.8e-23294.37Show/hide
Query:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQGND  KEEPMDVAV IETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
Subjt:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        KEE PESPEGHQSKKGAKEPCLEDEEK+EDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTS
        TKN LDSCKK ISQQVEEILTSCEAAE+VSNLK+PKK+SKESS+STEGSSSEEENDEVNPGKTNATKGRI DSNETKKRKRSTKK VSA+KQ KHVQDTS
Subjt:  TKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTS

Query:  DEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVK
        DEDSDEGG NVSED +SGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSAN TEKEIKEVK
Subjt:  DEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVK

Query:  KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDA     DEEEDDEEE   DEEEEDG EEEDNGDVDESQGEEFNEDDNEDSD
Subjt:  KKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

A0A1S3CRU1 glutamic acid-rich protein isoform X24.9e-21398.63Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV

Query:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
        NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
Subjt:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI

Query:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
        YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
Subjt:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD

Query:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        EEEEDDDEEEEDGEEEEDNGDVDESQ      DDNEDSD
Subjt:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

A0A1S3CRW1 DNA ligase 1 isoform X33.2e-20495.67Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEE                   VSKESSHSTEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV

Query:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
        NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
Subjt:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI

Query:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
        YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
Subjt:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD

Query:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
Subjt:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

A0A1S3CRW5 DNA ligase 1 isoform X16.7e-218100Show/hide
Query:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
        METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD
Subjt:  METYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDD

Query:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
        KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV
Subjt:  KDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEV

Query:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
        NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI
Subjt:  NPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSI

Query:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
        YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD
Subjt:  YKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDD

Query:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
Subjt:  EEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

A0A6J1FFY5 DNA ligase 1-like isoform X11.6e-20084.58Show/hide
Query:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN
        MAEELQ NDA  EE MDV V IETKI NAM SR+SHFKEQADSLTFEGVRRLLEKDLCMETY LDVHKRY+KQCLVKCLE   EDN SK SE TG KSV+
Subjt:  MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVN

Query:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL
        + E  ES EGHQSKKGAKEPCLEDEEK+EDSPVMGLL G  TKNVESD IKGIK KDDKD+P+ESTI KAIRKRT YLKANSEKVTMAGVRRLLEDDLKL
Subjt:  KEEMPESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKL

Query:  TKNALDSCKKLISQQVEEILTSCEAAEKVSN------LKTPKKVSKESSHSTE-GSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQR
        TK ALD CKK ISQQVEEIL SCEAAE+VSN      LKTPKKVSKESSHSTE GSSSEEE+DEV P K N TKGRI +SNETKKRKRSTK+ VSAKKQR
Subjt:  TKNALDSCKKLISQQVEEILTSCEAAEKVSN------LKTPKKVSKESSHSTE-GSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQR

Query:  KHVQDTSDEDSD-EGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPT
        KHVQ TS+EDSD EGGENVSED  S SSNEKPVKKEV  STPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPT
Subjt:  KHVQDTSDEDSD-EGGENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPT

Query:  EKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQG-EEFNED
        EKEIK+VKKKKERAKELEGIDLSNIVSSSRRRST+SYVAPPPKPKIPVKT+GDD DDTDD+EEEDD++++D+D EEED  +EEDNGDVDESQG EEFNED
Subjt:  EKEIKEVKKKKERAKELEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQG-EEFNED

Query:  DNEDSD
        DNEDSD
Subjt:  DNEDSD

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G44780.1 CONTAINS InterPro DOMAIN/s: Histone chaperone domain CHZ (InterPro:IPR019098)7.3e-6842.33Show/hide
Query:  AVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAK
        A +IE KI  A+RSR+++ + +AD  T   VRR+LE+D+ +E   LDV+K +VK+ LVKCLE    ++ S++S+ T R+    +E+P      QS     
Subjt:  AVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAK

Query:  EPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEE
            E+ E + D+           +N      K +KGK +K+   +  I +A+RKR SY+KANSE +TMA +RRLLE+DLKL K +LD  KK I+++++E
Subjt:  EPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEE

Query:  IL-----TSCEAAEKVSNLK-----TPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGG
        +L       C     V N+K     TP K+     +S   +    +N+EV   KT A K ++       KRK    K VS +K+ KH +  S+ DSD G 
Subjt:  IL-----TSCEAAEKVSNLK-----TPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGG

Query:  ENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKE
                    +EK +K+   ++T VYGKRVEHLKSVIKSCGMSVPP+IYKK KQAP+ KRE+ LI+ELE IL++EGLS++P+  EIKEVKK+K  ++E
Subjt:  ENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKE

Query:  LEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        LEGID +NIV +SRRRS+TS+ APPPKPK+  ++      +++ DE ED E EE+ +E+ E G + E   +V+E    E  +D  E+SD
Subjt:  LEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

AT1G44780.2 INVOLVED IN: biological_process unknown1.1e-6642.33Show/hide
Query:  AVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAK
        A +IE KI  A+RSR+++ + +AD  T   VRR+LE+D+ +E   LDV+K +VK+ LVKCLE    ++ S++S+ T R+    +E+P      QS     
Subjt:  AVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMPESPEGHQSKKGAK

Query:  EPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEE
            E+ E + D+           +N      K +KGK +K+   +  I +A+RKR SY+KANSE +TMA +RRLLE+DLKL K +LD  KK I+++++E
Subjt:  EPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEE

Query:  IL-----TSCEAAEKVSNLK-----TPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGG
        +L       C     V N+K     TP K+     +S   +    +N+EV   KT A K ++       KRK    K VS +K+ KH +  S+ DSD G 
Subjt:  IL-----TSCEAAEKVSNLK-----TPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGG

Query:  ENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKE
                    +EK +K +  ++T VYGKRVEHLKSVIKSCGMSVPP+IYKK KQAP+ KRE+ LI+ELE IL++EGLS++P+  EIKEVKK+K  ++E
Subjt:  ENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKE

Query:  LEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD
        LEGID +NIV +SRRRS+TS+ APPPKPK+  ++      +++ DE ED E EE+ +E+ E G + E   +V+E    E  +D  E+SD
Subjt:  LEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD

AT4G08310.1 FUNCTIONS IN: molecular_function unknown1.2e-8348.46Show/hide
Query:  DIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKS--VNKEEMPESPEGHQSKKGAK
        DIE++I  AM+SR+++ +++AD+ TFEGVRRLLE+DL +E + LDVHK +VKQ LV+CL     D  S++S  T +K      +E  E  + H +KK  K
Subjt:  DIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKS--VNKEEMPESPEGHQSKKGAK

Query:  EPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEE
        E    D+EK +DSPVMGLLT  +T    ++  K     +DK+V  +S I KA+RKR+SY+KANSEK+TM  +RRLLE DLKL K +LD  KK I+ +++E
Subjt:  EPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKKLISQQVEE

Query:  ILTSCEAAEKVSNLK----------TPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGG
        IL + EA +  +  +          TP K S            EEE+ EV   K  A K ++  S  T KRKR  +K  SAKK +   Q  S  DSD G 
Subjt:  ILTSCEAAEKVSNLK----------TPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGG

Query:  ENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKE
               +   S+EK VKK  + +T  YGKRVEHLKS+IKSCGMS+ PS+Y+K KQAPE KRE  LIKEL+ +L++EGLSANP+EKEIKEVKK+KER KE
Subjt:  ENVSEDDQSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKE

Query:  LEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNED
        LEGID SNIVSSSRRRS+ S+V PPPKP    +++ DD++D++++E+ED+E   +++EEEED    ED G+  +++GE   ED  E+
Subjt:  LEGIDLSNIVSSSRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNED


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGGAGGAATTACAAGGCAACGATGCTCTCAAAGAAGAACCCATGGATGTAGCTGTTGATATAGAGACGAAGATTCATAACGCTATGCGCTCTCGCATCTCT
CACTTCAAGGAACAAGCCGACTCTTTGACATTTGAGGGGGTTAGAAGATTGTTGGAAAAGGACTTGTGTATGGAGACGTATACTTTAGATGTACACAAAAGATAT
GTCAAGCAGTGTTTGGTGAAGTGCTTAGAAGCTGATTTGGAAGACAATGTATCCAAGGATTCTGAGTTGACAGGGAGAAAAAGTGTAAATAAAGAAGAAATGCCT
GAGTCACCTGAAGGGCATCAGTCCAAGAAAGGTGCAAAGGAACCTTGCTTGGAAGATGAGGAAAAACTGGAAGACTCTCCAGTTATGGGCCTTCTCACAGGACGT
AGCACAAAAAATGTTGAATCTGATGGAATCAAAGGAATCAAAGGCAAAGATGACAAAGATGTTCCTAGTGAGAGTACAATTATGAAAGCGATTAGAAAAAGAACT
TCTTATCTTAAAGCTAATTCAGAGAAAGTTACTATGGCTGGAGTTCGCCGCCTTCTGGAGGATGACCTTAAACTTACTAAAAATGCTCTCGACAGTTGTAAGAAG
TTGATAAGCCAACAAGTAGAGGAGATATTAACTTCTTGTGAAGCTGCTGAAAAAGTTTCTAATTTGAAAACTCCGAAAAAGGTTAGCAAAGAAAGCTCTCATTCT
ACTGAAGGGAGCAGCAGTGAGGAGGAAAACGATGAGGTAAACCCTGGAAAGACAAATGCAACTAAAGGAAGAATACTGGACTCTAATGAAACAAAAAAGCGGAAA
AGGTCTACAAAGAAGAACGTCTCTGCCAAGAAGCAAAGGAAGCATGTCCAGGATACATCAGATGAGGATAGTGATGAAGGTGGTGAAAATGTCTCTGAAGATGAT
CAGTCTGGTTCATCCAATGAAAAACCTGTGAAGAAGGAAGTTTCAAGTTCAACTCCTGTCTATGGCAAGCGCGTGGAGCACTTGAAATCTGTTATCAAATCATGT
GGGATGAGTGTTCCTCCATCGATTTATAAGAAAGTCAAGCAGGCACCTGAAAGCAAACGTGAATCACAACTTATAAAGGAGTTGGAGGGGATACTATCCAGAGAA
GGACTGTCTGCTAATCCCACGGAAAAAGAAATTAAGGAAGTCAAAAAGAAGAAGGAAAGGGCCAAAGAACTTGAAGGCATCGACTTAAGTAATATTGTCTCAAGT
TCACGTAGAAGATCAACAACCAGTTATGTTGCACCACCTCCAAAACCGAAAATACCAGTTAAAACTGATGGCGATGATGCAGATGATACTGATGACGATGAAGAG
GAGGATGATGAAGAAGAAGAAGACGACGATGAAGAAGAAGAGGACGGTGAGGAAGAGGAGGATAATGGCGATGTTGATGAAAGCCAAGGTGAAGAATTTAACGAG
GATGACAATGAAGACAGTGATTGA
mRNA sequenceShow/hide mRNA sequence
CCCACACAGTATCAAAAATCTCCCCCTCTTTTTTACCTGTCAAGCATAGTCATTCTTCGAAAGTCCTAACACAACCTACACTCCAGAGCCCATAATTTCCTTTTC
TTCGCACAACAATCGGTGCGAGTCGTAGAACAGCAAAATGGCGGAGGAATTACAAGGCAACGATGCTCTCAAAGAAGAACCCATGGATGTAGCTGTTGATATAGA
GACGAAGATTCATAACGCTATGCGCTCTCGCATCTCTCACTTCAAGGAACAAGCCGACTCTTTGACATTTGAGGGGGTTAGAAGATTGTTGGAAAAGGACTTGTG
TATGGAGACGTATACTTTAGATGTACACAAAAGATATGTCAAGCAGTGTTTGGTGAAGTGCTTAGAAGCTGATTTGGAAGACAATGTATCCAAGGATTCTGAGTT
GACAGGGAGAAAAAGTGTAAATAAAGAAGAAATGCCTGAGTCACCTGAAGGGCATCAGTCCAAGAAAGGTGCAAAGGAACCTTGCTTGGAAGATGAGGAAAAACT
GGAAGACTCTCCAGTTATGGGCCTTCTCACAGGACGTAGCACAAAAAATGTTGAATCTGATGGAATCAAAGGAATCAAAGGCAAAGATGACAAAGATGTTCCTAG
TGAGAGTACAATTATGAAAGCGATTAGAAAAAGAACTTCTTATCTTAAAGCTAATTCAGAGAAAGTTACTATGGCTGGAGTTCGCCGCCTTCTGGAGGATGACCT
TAAACTTACTAAAAATGCTCTCGACAGTTGTAAGAAGTTGATAAGCCAACAAGTAGAGGAGATATTAACTTCTTGTGAAGCTGCTGAAAAAGTTTCTAATTTGAA
AACTCCGAAAAAGGTTAGCAAAGAAAGCTCTCATTCTACTGAAGGGAGCAGCAGTGAGGAGGAAAACGATGAGGTAAACCCTGGAAAGACAAATGCAACTAAAGG
AAGAATACTGGACTCTAATGAAACAAAAAAGCGGAAAAGGTCTACAAAGAAGAACGTCTCTGCCAAGAAGCAAAGGAAGCATGTCCAGGATACATCAGATGAGGA
TAGTGATGAAGGTGGTGAAAATGTCTCTGAAGATGATCAGTCTGGTTCATCCAATGAAAAACCTGTGAAGAAGGAAGTTTCAAGTTCAACTCCTGTCTATGGCAA
GCGCGTGGAGCACTTGAAATCTGTTATCAAATCATGTGGGATGAGTGTTCCTCCATCGATTTATAAGAAAGTCAAGCAGGCACCTGAAAGCAAACGTGAATCACA
ACTTATAAAGGAGTTGGAGGGGATACTATCCAGAGAAGGACTGTCTGCTAATCCCACGGAAAAAGAAATTAAGGAAGTCAAAAAGAAGAAGGAAAGGGCCAAAGA
ACTTGAAGGCATCGACTTAAGTAATATTGTCTCAAGTTCACGTAGAAGATCAACAACCAGTTATGTTGCACCACCTCCAAAACCGAAAATACCAGTTAAAACTGA
TGGCGATGATGCAGATGATACTGATGACGATGAAGAGGAGGATGATGAAGAAGAAGAAGACGACGATGAAGAAGAAGAGGACGGTGAGGAAGAGGAGGATAATGG
CGATGTTGATGAAAGCCAAGGTGAAGAATTTAACGAGGATGACAATGAAGACAGTGATTGAAACCGGAAAAGCATCCAAGATTCTAGCATCTGATCCTTGATCAA
CGTTGAAACGATCGAGTGTAAACTAATTCTCTATGTAGTTCCCTTATTTCTTAGTTTTATTGAAGAGCTTGTAGTGAGCGATGATAGAGCTATATATCTAGGAGA
TTGGACGTAGTATTATTGTACAATATTTTTTACTCTTCATGATAAAGACGAACGAAAGAACACCTATATAATTTTGATTTATCCTTCGTTTCAAATTAGTAATTT
GATTTTATACATCAGTGGTAGGACTTCAGATTAGTTGAAGATGCAATGTCCTCATAACCCTTTGACATTATAAACG
Protein sequenceShow/hide protein sequence
MAEELQGNDALKEEPMDVAVDIETKIHNAMRSRISHFKEQADSLTFEGVRRLLEKDLCMETYTLDVHKRYVKQCLVKCLEADLEDNVSKDSELTGRKSVNKEEMP
ESPEGHQSKKGAKEPCLEDEEKLEDSPVMGLLTGRSTKNVESDGIKGIKGKDDKDVPSESTIMKAIRKRTSYLKANSEKVTMAGVRRLLEDDLKLTKNALDSCKK
LISQQVEEILTSCEAAEKVSNLKTPKKVSKESSHSTEGSSSEEENDEVNPGKTNATKGRILDSNETKKRKRSTKKNVSAKKQRKHVQDTSDEDSDEGGENVSEDD
QSGSSNEKPVKKEVSSSTPVYGKRVEHLKSVIKSCGMSVPPSIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKEVKKKKERAKELEGIDLSNIVSS
SRRRSTTSYVAPPPKPKIPVKTDGDDADDTDDDEEEDDEEEEDDDEEEEDGEEEEDNGDVDESQGEEFNEDDNEDSD