; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS015677 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS015677
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
Descriptionglutamic acid-rich protein-like isoform X2
Genome locationscaffold983:210488..214921
RNA-Seq ExpressionMS015677
SyntenyMS015677
Gene Ontology termsGO:0005634 - nucleus (cellular component)
GO:0016874 - ligase activity (molecular function)
InterPro domainsIPR019098 - Histone chaperone domain CHZ
IPR037647 - HIRA-interacting protein 3


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7016498.1 hypothetical protein SDJN02_21607 [Cucurbita argyrosperma subsp. argyrosperma]4.1e-18485.62Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLC+ETYALDVHKRYIKQCLVKCLEGVEEDNASK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         NV   K +GIKD+DDKDIP+ES IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAEQV NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKGRI NSNETKKRKRS KE VSAKKQ K+VQ TSE DSDEEGGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SY A   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEEDD------DDEEDNGGDDESQG-EEFNE
        PKPKIPV+T+G DVDDTD+E++DD++DD+++DD      DDEEDNG  DESQG EEFNE
Subjt:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEEDD------DDEEDNGGDDESQG-EEFNE

XP_022141421.1 DNA ligase 1 [Momordica charantia]7.9e-22098.67Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPKKVS
        TNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPKKVS
Subjt:  TNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPKKVS

Query:  KESSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK---KEVSTAVYG
        KESS STEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK   KEVSTAVYG
Subjt:  KESSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK---KEVSTAVYG

Query:  KRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPPP
        KRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPPP
Subjt:  KRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPPP

Query:  KPKIPVETDGDVDDTDEEEEDDEEDDEEEDDDDEEDNGGDDESQGEEFNE
        KPKIPVETDGDVDDTD EEEDDEEDDEEEDD DEEDNGGDDESQGEEFNE
Subjt:  KPKIPVETDGDVDDTDEEEEDDEEDDEEEDDDDEEDNGGDDESQGEEFNE

XP_022939456.1 DNA ligase 1-like isoform X1 [Cucurbita moschata]3.1e-18486.18Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLC+ETYALDVHKRYIKQCLVKCLEGVEEDNASK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         NV   K +GIKD+DDKDIP+ES IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAE+V NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKGRI NSNETKKRKRS KE VSAKKQ K+VQ TSE DSDEEGGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SY A   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQG-EEFNE
        PKPKIPV+T+G DVDDTD+EEE+D++DD++ED   +DDEEDNG  DESQG EEFNE
Subjt:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQG-EEFNE

XP_022939457.1 glutamic acid-rich protein-like isoform X2 [Cucurbita moschata]2.9e-18285.81Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLC+ETYALDVHKRYIKQCLVKCLEGVEEDNASK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         NV   K +GIKD+DDKDIP+ES IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAE+V NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKGRI NSNETKKRKRS KE VSAKKQ K+VQ TSE DSDEEGGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SY A   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQGE
        PKPKIPV+T+G DVDDTD+EEE+D++DD++ED   +DDEEDNG  DESQ +
Subjt:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQGE

XP_023551365.1 glutamic acid-rich protein-like isoform X1 [Cucurbita pepo subsp. pepo]4.1e-18486.37Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLC+ETYALDVHKRYIKQCLVKCLEGVEEDN SK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         NV   K +GIKD+DDKDIP+E+ IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAEQV NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKGRI NSNETKKRKRS KE VSAKKQ K+VQ TSE DSDEEGGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SY A   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEE--EDDDDEEDNGGDDESQG-EEFNE
        PKPKIPV+T+G DVDDTDEEEE++E+DD+E  E++DDEEDNG  DESQG EEFNE
Subjt:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEE--EDDDDEEDNGGDDESQG-EEFNE

TrEMBL top hitse value%identityAlignment
A0A6J1CJ49 DNA ligase 13.8e-22098.67Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPKKVS
        TNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPKKVS
Subjt:  TNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPKKVS

Query:  KESSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK---KEVSTAVYG
        KESS STEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK   KEVSTAVYG
Subjt:  KESSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK---KEVSTAVYG

Query:  KRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPPP
        KRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPPP
Subjt:  KRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPPP

Query:  KPKIPVETDGDVDDTDEEEEDDEEDDEEEDDDDEEDNGGDDESQGEEFNE
        KPKIPVETDGDVDDTD EEEDDEEDDEEEDD DEEDNGGDDESQGEEFNE
Subjt:  KPKIPVETDGDVDDTDEEEEDDEEDDEEEDDDDEEDNGGDDESQGEEFNE

A0A6J1FFY5 DNA ligase 1-like isoform X11.5e-18486.18Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLC+ETYALDVHKRYIKQCLVKCLEGVEEDNASK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         NV   K +GIKD+DDKDIP+ES IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAE+V NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKGRI NSNETKKRKRS KE VSAKKQ K+VQ TSE DSDEEGGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SY A   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQG-EEFNE
        PKPKIPV+T+G DVDDTD+EEE+D++DD++ED   +DDEEDNG  DESQG EEFNE
Subjt:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQG-EEFNE

A0A6J1FGV2 glutamic acid-rich protein-like isoform X21.4e-18285.81Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLEKDLC+ETYALDVHKRYIKQCLVKCLEGVEEDNASK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         NV   K +GIKD+DDKDIP+ES IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAE+V NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKGRI NSNETKKRKRS KE VSAKKQ K+VQ TSE DSDEEGGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SY A   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQGE
        PKPKIPV+T+G DVDDTD+EEE+D++DD++ED   +DDEEDNG  DESQ +
Subjt:  PKPKIPVETDG-DVDDTDEEEEDDEEDDEEED---DDDEEDNGGDDESQGE

A0A6J1JTY1 glutamic acid-rich protein-like isoform X11.7e-18085.27Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLE DLC+ETYALDVHKRYIKQCLVKCLEGVEEDNASK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         N    K +GIKD+DDKDIP+ES IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAEQV NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKG I NSNE KKRKRS KE VSAKKQ K+V  T E DSDE+GGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLS NPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SYAA   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTD--EEEEDDEEDDEEEDDDDEEDNGGDDESQG-EEFNE
        PKPKIPV+T+G DVDDTD  EEEEDD++DD+ E++DDEEDNG  DESQG EEFNE
Subjt:  PKPKIPVETDG-DVDDTD--EEEEDDEEDDEEEDDDDEEDNGGDDESQG-EEFNE

A0A6J1K3E3 glutamic acid-rich protein-like isoform X21.6e-17884.89Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT
        SLTFEGVRRLLE DLC+ETYALDVHKRYIKQCLVKCLEGVEEDNASK SEETGGKSVSR EAA+SLEG QSKKG KEPCLEDEEKMEDSPVMGLL G KT
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKT

Query:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK
         N    K +GIKD+DDKDIP+ES IKKAIRKRT YLKANSEKVTMAGVRRLLE+DLKLTKYALD CKK ISQQVEEILNSCEAAEQV NEKK S+LKTPK
Subjt:  TNV---KPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPK

Query:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY
        KVSKESS STE GSSSEEE+DEVKP KKN TKG I NSNE KKRKRS KE VSAKKQ K+V  T E DSDE+GGENVSEDG SESS+EKPVKKEVST VY
Subjt:  KVSKESSLSTE-GSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVY

Query:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP
        GKRVEHLKSVIKSCGMSVPP+IYKKVKQAPESKRESQLIKELEGILSREGLS NPTEKEIKDV+KKKERAKELEGIDLSNIVSSSRRRST+SYAA   PP
Subjt:  GKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPP

Query:  PKPKIPVETDG-DVDDTD--EEEEDDEEDDEEEDDDDEEDNGGDDESQGE
        PKPKIPV+T+G DVDDTD  EEEEDD++DD+ E++DDEEDNG  DESQ +
Subjt:  PKPKIPVETDG-DVDDTD--EEEEDDEEDDEEEDDDDEEDNGGDDESQGE

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G44780.1 CONTAINS InterPro DOMAIN/s: Histone chaperone domain CHZ (InterPro:IPR019098)2.1e-6141.5Show/hide
Query:  TFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKTTN
        T   VRR+LE+D+ LE   LDV+K ++K+ LVKCLE    ++ S++S+ET                   ++  + P  E  E+ E+   M     + T+ 
Subjt:  TFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKTTN

Query:  VKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILN-----SCEAAEQVPNEKKSSQLKTPK
         + + +K + +K+      IK+A+RKR SY+KANSE +TMA +RRLLE DLKL K +LD  KK I+++++E+L       C     V N KK  +    K
Subjt:  VKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILN-----SCEAAEQVPNEKKSSQLKTPK

Query:  KVSKE--SSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAV
         VS E  S   TEG+    +N+EV  +K  A K ++       KRK    + VS +K++K+ +  SENDSD          G SE S ++   KE +T V
Subjt:  KVSKE--SSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAV

Query:  YGKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPP
        YGKRVEHLKSVIKSCGMSVPP IYKK KQAP+ KRE+ LI+ELE IL++EGLS++P+  EIK+V+K+K  ++ELEGID +NIV +SRRRS+ S+A    P
Subjt:  YGKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPP

Query:  PPKPKIPVETDGDVDDTDEEEEDDEEDDE----------EEDDDDEEDNGGDD
        PPKPK+  E++ + D+ ++ E ++E +++          EE+ + EED+GG++
Subjt:  PPKPKIPVETDGDVDDTDEEEEDDEEDDE----------EEDDDDEEDNGGDD

AT1G44780.2 INVOLVED IN: biological_process unknown9.4e-6241.41Show/hide
Query:  TFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKTTN
        T   VRR+LE+D+ LE   LDV+K ++K+ LVKCLE    ++ S++S+ET                   ++  + P  E  E+ E+   M     + T+ 
Subjt:  TFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKTTN

Query:  VKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILN-----SCEAAEQVPNEKKSSQLKTPK
         + + +K + +K+      IK+A+RKR SY+KANSE +TMA +RRLLE DLKL K +LD  KK I+++++E+L       C     V N KK  +    K
Subjt:  VKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILN-----SCEAAEQVPNEKKSSQLKTPK

Query:  KVSKE--SSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK-KEVSTA
         VS E  S   TEG+    +N+EV  +K  A K ++       KRK    + VS +K++K+ +  SENDSD                SEK +K KE +T 
Subjt:  KVSKE--SSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVK-KEVSTA

Query:  VYGKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPP
        VYGKRVEHLKSVIKSCGMSVPP IYKK KQAP+ KRE+ LI+ELE IL++EGLS++P+  EIK+V+K+K  ++ELEGID +NIV +SRRRS+ S+A    
Subjt:  VYGKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPP

Query:  PPPKPKIPVETDGDVDDTDEEEEDDEEDDE----------EEDDDDEEDNGGDD
        PPPKPK+  E++ + D+ ++ E ++E +++          EE+ + EED+GG++
Subjt:  PPPKPKIPVETDGDVDDTDEEEEDDEEDDE----------EEDDDDEEDNGGDD

AT4G08310.1 FUNCTIONS IN: molecular_function unknown6.0e-8550.77Show/hide
Query:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKS--VSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQ
        + TFEGVRRLLE+DL LE +ALDVHK ++KQ LV+CL G E D  S++S ET  K      +EAA+  +   +KK  KE    D+EK +DSPVMGLLT +
Subjt:  SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKS--VSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQ

Query:  KTTNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEA------AEQVPNEKKSSQ
         T+    E  KDED + + S+  IKKA+RKR+SY+KANSEK+TM  +RRLLE DLKL KY+LD  KK I+ +++EIL + EA      A++ P  KK   
Subjt:  KTTNVKPEGIKDEDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEA------AEQVPNEKKSSQ

Query:  LKTPKKVSKESSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKK-EV
          TP K S    +       EEE+ EV  +KK A K ++  S  T KRKR  ++  SAKK     Q  S++DSD          G    SSEK VKK E 
Subjt:  LKTPKKVSKESSLSTEGSSSEEENDEVKPRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKK-EV

Query:  STAVYGKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAA
         T  YGKRVEHLKS+IKSCGMS+ P++Y+K KQAPE KRE  LIKEL+ +L++EGLSANP+EKEIK+V+K+KER KELEGID SNIVSSSRRRS+AS+  
Subjt:  STAVYGKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKRESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAA

Query:  PPPPPPKPKIPVETDGDVDDTDEEEEDDEEDDEEEDDDDEEDNGGDDESQGEEFNEG
           PPPKP    E++ D  +  E EED++E+   E++++EED GG ++      NEG
Subjt:  PPPPPPKPKIPVETDGDVDDTDEEEEDDEEDDEEEDDDDEEDNGGDDESQGEEFNEG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
TCTTTAACTTTTGAGGGGGTTAGAAGATTGTTAGAAAAGGACTTGTGCTTGGAGACGTATGCTTTAGATGTGCATAAAAGATATATCAAGCAGTGTTTGGTGAAGTGCTT
AGAAGGTGTTGAGGAAGACAATGCCTCAAAGGATTCTGAGGAAACTGGGGGGAAAAGTGTAAGTAGAGAAGAAGCGGCCAAGTCACTTGAAGGGCGTCAGTCCAAGAAAG
GTGTAAAGGAACCTTGCTTGGAAGATGAGGAGAAAATGGAAGACTCTCCAGTTATGGGCCTTCTCACAGGACAGAAAACAACAAATGTAAAACCTGAGGGAATCAAAGAC
GAAGATGACAAAGATATTCCTAGCGAGAGTATAATTAAGAAAGCTATCAGGAAAAGAACTTCTTATCTTAAAGCTAATTCAGAGAAAGTTACTATGGCTGGAGTTCGCCG
CCTTCTGGAGAATGACCTTAAACTTACTAAATATGCTCTCGATTGTTGTAAGAAGATTATAAGCCAGCAAGTGGAGGAGATATTAAATTCTTGTGAAGCTGCTGAACAAG
TTCCTAACGAAAAGAAAAGTTCTCAGTTGAAAACTCCAAAAAAGGTAAGCAAAGAAAGTTCTCTTTCTACAGAAGGCAGCAGCAGTGAGGAGGAAAACGATGAAGTAAAA
CCTAGAAAGAAAAATGCTACTAAAGGAAGAATACCGAACTCTAATGAAACGAAAAAGCGAAAAAGATCTGCAAAGGAGACTGTCTCTGCCAAGAAGCAAAGCAAGAATGT
TCAGCCTACATCAGAGAATGATAGTGATGAAGAAGGTGGTGAAAATGTCTCTGAAGATGGCCGGTCTGAATCATCCAGTGAAAAACCTGTCAAGAAGGAAGTTTCAACTG
CTGTCTATGGCAAGCGTGTGGAGCATCTGAAATCGGTTATCAAATCGTGTGGGATGAGTGTTCCTCCAGCAATTTATAAGAAAGTCAAGCAGGCACCTGAAAGCAAACGT
GAATCCCAACTTATAAAGGAGTTGGAGGGGATACTATCTAGAGAAGGATTATCTGCTAATCCCACTGAAAAAGAAATTAAAGACGTCAGAAAGAAGAAGGAAAGAGCCAA
GGAACTTGAAGGCATTGACTTGAGTAATATTGTTTCAAGTTCACGTAGAAGATCCACAGCTAGTTATGCGGCGCCACCACCACCACCTCCAAAACCAAAAATTCCAGTTG
AAACTGATGGTGATGTTGATGATACTGATGAGGAGGAGGAAGATGATGAAGAAGATGATGAGGAGGAGGATGACGACGACGAAGAGGATAATGGTGGTGATGATGAAAGC
CAGGGTGAAGAATTTAACGAGGGTAACAGACCACTACCAACA
mRNA sequenceShow/hide mRNA sequence
TCTTTAACTTTTGAGGGGGTTAGAAGATTGTTAGAAAAGGACTTGTGCTTGGAGACGTATGCTTTAGATGTGCATAAAAGATATATCAAGCAGTGTTTGGTGAAGTGCTT
AGAAGGTGTTGAGGAAGACAATGCCTCAAAGGATTCTGAGGAAACTGGGGGGAAAAGTGTAAGTAGAGAAGAAGCGGCCAAGTCACTTGAAGGGCGTCAGTCCAAGAAAG
GTGTAAAGGAACCTTGCTTGGAAGATGAGGAGAAAATGGAAGACTCTCCAGTTATGGGCCTTCTCACAGGACAGAAAACAACAAATGTAAAACCTGAGGGAATCAAAGAC
GAAGATGACAAAGATATTCCTAGCGAGAGTATAATTAAGAAAGCTATCAGGAAAAGAACTTCTTATCTTAAAGCTAATTCAGAGAAAGTTACTATGGCTGGAGTTCGCCG
CCTTCTGGAGAATGACCTTAAACTTACTAAATATGCTCTCGATTGTTGTAAGAAGATTATAAGCCAGCAAGTGGAGGAGATATTAAATTCTTGTGAAGCTGCTGAACAAG
TTCCTAACGAAAAGAAAAGTTCTCAGTTGAAAACTCCAAAAAAGGTAAGCAAAGAAAGTTCTCTTTCTACAGAAGGCAGCAGCAGTGAGGAGGAAAACGATGAAGTAAAA
CCTAGAAAGAAAAATGCTACTAAAGGAAGAATACCGAACTCTAATGAAACGAAAAAGCGAAAAAGATCTGCAAAGGAGACTGTCTCTGCCAAGAAGCAAAGCAAGAATGT
TCAGCCTACATCAGAGAATGATAGTGATGAAGAAGGTGGTGAAAATGTCTCTGAAGATGGCCGGTCTGAATCATCCAGTGAAAAACCTGTCAAGAAGGAAGTTTCAACTG
CTGTCTATGGCAAGCGTGTGGAGCATCTGAAATCGGTTATCAAATCGTGTGGGATGAGTGTTCCTCCAGCAATTTATAAGAAAGTCAAGCAGGCACCTGAAAGCAAACGT
GAATCCCAACTTATAAAGGAGTTGGAGGGGATACTATCTAGAGAAGGATTATCTGCTAATCCCACTGAAAAAGAAATTAAAGACGTCAGAAAGAAGAAGGAAAGAGCCAA
GGAACTTGAAGGCATTGACTTGAGTAATATTGTTTCAAGTTCACGTAGAAGATCCACAGCTAGTTATGCGGCGCCACCACCACCACCTCCAAAACCAAAAATTCCAGTTG
AAACTGATGGTGATGTTGATGATACTGATGAGGAGGAGGAAGATGATGAAGAAGATGATGAGGAGGAGGATGACGACGACGAAGAGGATAATGGTGGTGATGATGAAAGC
CAGGGTGAAGAATTTAACGAGGGTAACAGACCACTACCAACA
Protein sequenceShow/hide protein sequence
SLTFEGVRRLLEKDLCLETYALDVHKRYIKQCLVKCLEGVEEDNASKDSEETGGKSVSREEAAKSLEGRQSKKGVKEPCLEDEEKMEDSPVMGLLTGQKTTNVKPEGIKD
EDDKDIPSESIIKKAIRKRTSYLKANSEKVTMAGVRRLLENDLKLTKYALDCCKKIISQQVEEILNSCEAAEQVPNEKKSSQLKTPKKVSKESSLSTEGSSSEEENDEVK
PRKKNATKGRIPNSNETKKRKRSAKETVSAKKQSKNVQPTSENDSDEEGGENVSEDGRSESSSEKPVKKEVSTAVYGKRVEHLKSVIKSCGMSVPPAIYKKVKQAPESKR
ESQLIKELEGILSREGLSANPTEKEIKDVRKKKERAKELEGIDLSNIVSSSRRRSTASYAAPPPPPPKPKIPVETDGDVDDTDEEEEDDEEDDEEEDDDDEEDNGGDDES
QGEEFNEGNRPLPT