; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Csor.00g033320 (gene) of Silver-seed gourd (wild; sororia) v1 genome

Gene IDCsor.00g033320
OrganismCucurbita argyrosperma subsp. sororia (Silver-seed gourd (wild; sororia) v1)
DescriptionDUF4378 domain-containing protein
Genome locationCsor_Chr07:4204748..4207529
RNA-Seq ExpressionCsor.00g033320
SyntenyCsor.00g033320
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6595203.1 hypothetical protein SDJN03_11756, partial [Cucurbita argyrosperma subsp. sororia]0.0100Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
        RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE

Query:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
        GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
Subjt:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD

Query:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVMDL
        DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVMDL
Subjt:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVMDL

Query:  IAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
        IAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
Subjt:  IAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC

KAG7027223.1 hypothetical protein SDJN02_11234, partial [Cucurbita argyrosperma subsp. argyrosperma]0.098.97Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKS HPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
        RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE

Query:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
        GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
Subjt:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD

Query:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVMDL
        DRDRDG  DEDYNLECSYATVQRTKQQLLNKLRRFERL DLDPIELEKIIQEEEEEEEKLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVMDL
Subjt:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVMDL

Query:  IAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
        IAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEE WRGGAAMDLELAIFSVLVEELAVELAC
Subjt:  IAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC

XP_022962721.1 uncharacterized protein LOC111463127 [Cucurbita moschata]0.097.13Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKS HPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
        RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE

Query:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
        GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGC+TPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
Subjt:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD

Query:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEE--KLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVM
        +RDRDGD DEDYNLECSYATVQRTKQQLLNKL+RF+RLA+LDPIELEKIIQEEEEEEE  KLENYKESVQWDNAYDIERFVKEV NNASSEPRDMRKLVM
Subjt:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEE--KLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVM

Query:  DLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
        DLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVEL TIEMMVEEDLRKEV EWKKEEEEE  RGGAAMDLELAIFSVLVEELAVELAC
Subjt:  DLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC

XP_022972688.1 uncharacterized protein LOC111471213 [Cucurbita maxima]0.094.89Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKS  PSPELRKSPLFEFRSPARNR+SPNAIFLHVPA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
        RTAALLLEAALKIHKQKSTAKSKK QIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE

Query:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
        GRSMDLGTSCSS SVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKE+ETVNSEES KKFQ EEDEEDKEQCSPVSVLDGPFDDTYDE+RD
Subjt:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD

Query:  DRDRDGDGDED--YNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEK-LENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLV
        +RD DGDGD D  YNLECSYATVQRTKQQLLNKLRRFERLADLDP ELEKIIQEEEEEEE+ LENYKESVQWDN Y+IE FVKEVANNASS+PRDMRKLV
Subjt:  DRDRDGDGDED--YNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEK-LENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLV

Query:  MDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
        MDLIAEE+AKRSGLDAREEVI+RVCRRLEEWEVVELNTIEMMVEEDLRKEV EWKKEEEEEE RGGAAMDLELAIFSVLVEELAVELAC
Subjt:  MDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC

XP_023518249.1 uncharacterized protein LOC111781783 [Cucurbita pepo subsp. pepo]0.095.91Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        MMPHKPLHELLQQDQEPFHLN YIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKS  PSPELRKSPLFEFRSPARNR+SPNAIFLHVPA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
        RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE

Query:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
         RSMDLGTSCSSQSVDSGEDFCESPFRFVLQRS SYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
Subjt:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD

Query:  DRDRDGDGDED--YNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEK-LENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLV
        +RD DGDGD D  YNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEE+ LENYKESVQWDNAYDIERFVKEVANNASS+PRDMRKLV
Subjt:  DRDRDGDGDED--YNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEK-LENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLV

Query:  MDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
        MDLIAEEEAKRS LDAREEVI+RVC+RLEEWEVVELNTIEMMVEEDLRKEV EWKKEEEEE  RGGAAMDLELAIFSVLVEELAVELAC
Subjt:  MDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC

TrEMBL top hitse value%identityAlignment
A0A0A0KFA1 Uncharacterized protein4.95e-24474.95Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNR--SSPNAIFLHV
        MM  K LHELL+QDQEPFHLNTYIA+KRV+LKRVSPKT LQ+KKRKPIS+NS+F G+FCRN CF S HPSP+ RKSPLFEFRSPARN    SPNAIFLH+
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNR--SSPNAIFLHV

Query:  PARTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN
        PARTA LLLEAALKIHKQKS++K+KK+QIKNQG ARFGSVLKRLTLRNRNN +RETE C +G DLASFG RKS+IRR+  QGETSS NGRSSYGFWSETN
Subjt:  PARTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN

Query:  EEGRSMDLGTSCSSQSVDS--------GEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGP
        EEG SMDLGTSCSSQS DS        GED+CESPFRFVLQRS S+GCRTPDFLSPAASPC RNKED  V   ESL KFQVEEDEEDKEQCSPVSVLD P
Subjt:  EEGRSMDLGTSCSSQSVDS--------GEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGP

Query:  FDDTYDERRDDRDRDGDGD-EDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEE--------KLENYKESVQWDNAYDIERFVKE
        FDD+YDE   DR+RDGDGD EDY++ECSYATVQRTKQQLLNKLRRFERLADLDPIELEKI+ EEE++E         + E Y ESVQWDN  DIE FV+E
Subjt:  FDDTYDERRDDRDRDGDGD-EDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEE--------KLENYKESVQWDNAYDIERFVKE

Query:  VANNASS------EPRDMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSV
        VA++A+        P+DMRKLV DL+AEEEA RS  + REEVI+RVC RLE W+ VE NTI+MMVEEDLRKEV EWK+ +E+   R  AA DLELAIFS+
Subjt:  VANNASS------EPRDMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSV

Query:  LVEELAVELAC
        LVEELAVELAC
Subjt:  LVEELAVELAC

A0A1S3CHP7 uncharacterized protein LOC1035008758.15e-24374.76Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNR--SSPNAIFLHV
        MM  K LHELL+QDQEPFHLNTYIA+KRV+LKRVSPKT LQ+KKRKPIS+NS+F G+FCRN CF S HPSP+ RKSPLFEFRSPARN    SPNAIFLH+
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNR--SSPNAIFLHV

Query:  PARTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN
        PARTA LLLEAALKIHKQKS++K+KK+QIKNQG ARFGSVLKRLTLRNRNN +R TE C +G DLASF  RKS+IRR+  QGETSS NGRSSYGFWSETN
Subjt:  PARTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN

Query:  EEGRSMDLGTSCSSQSVDS--------GEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGP
        EEG SMDLGTSCSSQS DS        GED+CESPFRFVLQRS S+GCRTPDFLSPAASPCRRNKED  +   ESL KFQVEEDEEDKEQCSPVSVLD P
Subjt:  EEGRSMDLGTSCSSQSVDS--------GEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGP

Query:  FDDTYDERRDDRDRDGDGD-EDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEE--------EKLENYKESVQWDNAYDIERFVKE
        FDD+YDE   +R+RDGDGD E+Y++ECSYATVQRTKQQLLNKLRRFERLADLDPIELEKI+ EEE +E        E+ E Y ESVQWDN  DIE FVKE
Subjt:  FDDTYDERRDDRDRDGDGD-EDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEE--------EKLENYKESVQWDNAYDIERFVKE

Query:  VANNASS------EPRDMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSV
        VA+N +        P+D+RKLV DLIAEEEA RS  + REEVI RVC RLE W+ VE NTI+MMVEEDLRKEV EWK+ +E+   RG AA DLELAIFS+
Subjt:  VANNASS------EPRDMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSV

Query:  LVEELAVELAC
        LVEELAVELAC
Subjt:  LVEELAVELAC

A0A5A7SKT4 Histone-lysine N-methyltransferase SETD1B-like8.15e-24374.76Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNR--SSPNAIFLHV
        MM  K LHELL+QDQEPFHLNTYIA+KRV+LKRVSPKT LQ+KKRKPIS+NS+F G+FCRN CF S HPSP+ RKSPLFEFRSPARN    SPNAIFLH+
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNR--SSPNAIFLHV

Query:  PARTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN
        PARTA LLLEAALKIHKQKS++K+KK+QIKNQG ARFGSVLKRLTLRNRNN +R TE C +G DLASF  RKS+IRR+  QGETSS NGRSSYGFWSETN
Subjt:  PARTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN

Query:  EEGRSMDLGTSCSSQSVDS--------GEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGP
        EEG SMDLGTSCSSQS DS        GED+CESPFRFVLQRS S+GCRTPDFLSPAASPCRRNKED  +   ESL KFQVEEDEEDKEQCSPVSVLD P
Subjt:  EEGRSMDLGTSCSSQSVDS--------GEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGP

Query:  FDDTYDERRDDRDRDGDGD-EDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEE--------EKLENYKESVQWDNAYDIERFVKE
        FDD+YDE   +R+RDGDGD E+Y++ECSYATVQRTKQQLLNKLRRFERLADLDPIELEKI+ EEE +E        E+ E Y ESVQWDN  DIE FVKE
Subjt:  FDDTYDERRDDRDRDGDGD-EDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEE--------EKLENYKESVQWDNAYDIERFVKE

Query:  VANNASS------EPRDMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSV
        VA+N +        P+D+RKLV DLIAEEEA RS  + REEVI RVC RLE W+ VE NTI+MMVEEDLRKEV EWK+ +E+   RG AA DLELAIFS+
Subjt:  VANNASS------EPRDMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSV

Query:  LVEELAVELAC
        LVEELAVELAC
Subjt:  LVEELAVELAC

A0A6J1HE04 uncharacterized protein LOC1114631270.097.13Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKS HPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
        RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE

Query:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
        GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGC+TPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
Subjt:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD

Query:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEE--KLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVM
        +RDRDGD DEDYNLECSYATVQRTKQQLLNKL+RF+RLA+LDPIELEKIIQEEEEEEE  KLENYKESVQWDNAYDIERFVKEV NNASSEPRDMRKLVM
Subjt:  DRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEE--KLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVM

Query:  DLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
        DLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVEL TIEMMVEEDLRKEV EWKKEEEEE  RGGAAMDLELAIFSVLVEELAVELAC
Subjt:  DLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC

A0A6J1IAR4 uncharacterized protein LOC1114712130.094.89Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKS  PSPELRKSPLFEFRSPARNR+SPNAIFLHVPA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
        RTAALLLEAALKIHKQKSTAKSKK QIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEE

Query:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD
        GRSMDLGTSCSS SVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKE+ETVNSEES KKFQ EEDEEDKEQCSPVSVLDGPFDDTYDE+RD
Subjt:  GRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRD

Query:  DRDRDGDGDED--YNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEK-LENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLV
        +RD DGDGD D  YNLECSYATVQRTKQQLLNKLRRFERLADLDP ELEKIIQEEEEEEE+ LENYKESVQWDN Y+IE FVKEVANNASS+PRDMRKLV
Subjt:  DRDRDGDGDED--YNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEK-LENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLV

Query:  MDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC
        MDLIAEE+AKRSGLDAREEVI+RVCRRLEEWEVVELNTIEMMVEEDLRKEV EWKKEEEEEE RGGAAMDLELAIFSVLVEELAVELAC
Subjt:  MDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT2G36420.1 unknown protein7.0e-6339.6Show/hide
Query:  KPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDF-CRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPARTA
        K LHE L+ DQEPFHLN YI + R  +      +D+++KKRK  +  +   G F C N CF + H SP+ RKSPLFE RSP + +     +FL +PARTA
Subjt:  KPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDF-CRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPARTA

Query:  ALLLEAALKIHKQKS-TAKSKKTQIKNQGLARFGSVLKRLTLR----NRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN
        A+LL+AA +I KQ+S  AK+ K + +  G   FGSVLK LT R      +N D      + G +  S   R+                            
Subjt:  ALLLEAALKIHKQKS-TAKSKKTQIKNQGLARFGSVLKRLTLR----NRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETN

Query:  EEGRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRS-SSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKF--QVEED--EEDKEQCSPVSVLDGPFDD
           R +++   C          FCESPF FVLQ + SS G +TP F S A SP RR+ EDE  +  ESL+K   Q EED  EEDKEQCSPVSVLD P + 
Subjt:  EEGRSMDLGTSCSSQSVDSGEDFCESPFRFVLQRS-SSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKF--QVEED--EEDKEQCSPVSVLDGPFDD

Query:  TYDERRDDRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDN--AYDIERFVKEVANNASSEPR
          +E  D+     + D   NL CS+  VQR K++LL KLRRFE+LA LDP+ELE  + EEE+EEE  E Y+ES + DN   YD +   ++V    + E R
Subjt:  TYDERRDDRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDN--AYDIERFVKEVANNASSEPR

Query:  DMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEV--VELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVEL
                    E+ KR   D R    ++  R +  W V       ++ +V +DLR+E  EW +   E E    A  DLE +IF VL++E + EL
Subjt:  DMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEV--VELNTIEMMVEEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVEL

AT5G03670.1 unknown protein4.1e-7140.45Show/hide
Query:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA
        M   + L +LL++DQEPF L +YI+D+R  +   +  T LQ+KKR+PIS N+     FCRN CF S   SP+ +KSPLFE +SP R   S NAIF+++PA
Subjt:  MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPA

Query:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHR-----KSAIRRKIT-----------------
        RTA++LLEAA++I KQ S     +T+        FGSVLK+LT    N   RE  G    G ++S   +     +S + RKI                  
Subjt:  RTAALLLEAALKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHR-----KSAIRRKIT-----------------

Query:  --QGETSSYNGRSSYGFWSET---NEEGRSMDLGTSCSSQSVDSGED----------------FCESPFRFVLQ-RSSSYGCRTPDFLSPAASPCRRNKE
            ET      SS G WSE+    E    +D  TS S+ S  +G D                FCESPF FVLQ   S+ G RTP+F SPAASP     E
Subjt:  --QGETSSYNGRSSYGFWSET---NEEGRSMDLGTSCSSQSVDSGED----------------FCESPFRFVLQ-RSSSYGCRTPDFLSPAASPCRRNKE

Query:  DETVNSE-ESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRDDRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEE
         E  + E E LKK ++EE+EE+KEQ SPVSVLD PF D      DD D   D   D N+  S+ +VQ+ K  LL KL RFE+LA LDP+ELEK + ++E 
Subjt:  DETVNSE-ESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRDDRDRDGDGDEDYNLECSYATVQRTKQQLLNKLRRFERLADLDPIELEKIIQEEEE

Query:  EEEKLENYKESVQWDNAYDI-ERFVKEVANNASSEPRDMRKLVMDLIAEEEAKRSGLDAREE---VIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVE-
        EEE+ E  +E     +   I +R +K         P  +  L+ DL AEE    S +D   E   V +RVC RL  W  VE NTI+MMVE D R E +  
Subjt:  EEEKLENYKESVQWDNAYDI-ERFVKEVANNASSEPRDMRKLVMDLIAEEEAKRSGLDAREE---VIERVCRRLEEWEVVELNTIEMMVEEDLRKEVVE-

Query:  WKKEEEEEEWRGGAAMDLELAIFSVLVEELAVEL
        W+ + + +       +D+E  IF  LVEEL+ ++
Subjt:  WKKEEEEEEWRGGAAMDLELAIFSVLVEELAVEL


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGATGCCTCACAAGCCCTTGCACGAGTTACTGCAACAGGATCAAGAGCCCTTCCATTTGAACACATACATCGCCGACAAACGCGTTGATCTCAAAAGGGTTTCGCCTAA
AACCGATTTACAACTCAAGAAACGAAAACCCATTTCCTCAAATTCTGTTTTCCGGGGAGATTTCTGCAGAAATGGTTGTTTTAAATCATGCCACCCCTCGCCGGAGCTGC
GGAAATCTCCCCTGTTTGAGTTTCGTTCGCCGGCCAGAAATAGAAGTAGTCCTAATGCGATTTTCCTCCATGTTCCGGCTAGAACGGCGGCGTTGCTTCTTGAAGCTGCT
TTAAAGATTCATAAACAGAAATCGACAGCGAAATCTAAGAAAACCCAGATTAAGAATCAAGGGCTTGCGAGATTTGGGTCGGTTTTGAAGAGATTAACTCTTCGAAATCG
GAACAACACTGACCGTGAAACGGAAGGTTGTGATAATGGCGGCGATTTAGCGTCGTTTGGGCATAGAAAAAGCGCCATTAGAAGGAAAATAACGCAGGGGGAGACGAGTT
CTTATAATGGAAGGTCTAGCTATGGATTCTGGTCGGAAACCAACGAAGAAGGAAGATCAATGGATTTGGGGACTTCTTGTAGTAGCCAATCTGTGGATTCAGGGGAAGAT
TTCTGTGAAAGCCCTTTCCGATTTGTTCTTCAGCGAAGCTCCTCGTACGGTTGTCGGACGCCAGATTTTCTGTCGCCGGCGGCCTCTCCTTGTCGCCGTAACAAAGAGGA
TGAAACAGTAAACAGTGAAGAAAGCTTGAAGAAATTTCAGGTGGAAGAAGATGAAGAAGATAAGGAGCAATGTAGTCCCGTGTCTGTATTGGATGGTCCCTTCGACGACA
CATACGATGAACGGCGTGACGACCGGGACAGGGACGGGGACGGGGACGAAGATTACAATTTGGAATGCAGCTATGCAACAGTCCAAAGAACAAAGCAGCAACTATTAAAC
AAGCTTCGAAGATTCGAGAGACTTGCCGACTTGGACCCGATCGAGCTCGAGAAAATAATTCAAGAGGAAGAGGAAGAAGAAGAAAAGCTAGAAAACTACAAAGAGTCAGT
TCAATGGGATAACGCATACGACATCGAACGTTTCGTGAAAGAGGTTGCAAACAATGCAAGCTCCGAACCTCGAGACATGAGGAAACTCGTCATGGATCTGATTGCGGAAG
AAGAGGCGAAACGAAGCGGTCTCGACGCGAGAGAGGAGGTTATAGAGAGGGTTTGTAGGAGGTTGGAGGAGTGGGAAGTGGTGGAATTGAACACCATTGAGATGATGGTG
GAGGAAGATCTAAGGAAGGAGGTTGTGGAGTGGAAGAAGGAGGAGGAGGAGGAGGAGTGGAGAGGAGGGGCCGCCATGGATTTGGAGCTTGCAATTTTCAGTGTGTTGGT
GGAGGAATTGGCTGTGGAACTTGCTTGTTGA
mRNA sequenceShow/hide mRNA sequence
ATGATGCCTCACAAGCCCTTGCACGAGTTACTGCAACAGGATCAAGAGCCCTTCCATTTGAACACATACATCGCCGACAAACGCGTTGATCTCAAAAGGGTTTCGCCTAA
AACCGATTTACAACTCAAGAAACGAAAACCCATTTCCTCAAATTCTGTTTTCCGGGGAGATTTCTGCAGAAATGGTTGTTTTAAATCATGCCACCCCTCGCCGGAGCTGC
GGAAATCTCCCCTGTTTGAGTTTCGTTCGCCGGCCAGAAATAGAAGTAGTCCTAATGCGATTTTCCTCCATGTTCCGGCTAGAACGGCGGCGTTGCTTCTTGAAGCTGCT
TTAAAGATTCATAAACAGAAATCGACAGCGAAATCTAAGAAAACCCAGATTAAGAATCAAGGGCTTGCGAGATTTGGGTCGGTTTTGAAGAGATTAACTCTTCGAAATCG
GAACAACACTGACCGTGAAACGGAAGGTTGTGATAATGGCGGCGATTTAGCGTCGTTTGGGCATAGAAAAAGCGCCATTAGAAGGAAAATAACGCAGGGGGAGACGAGTT
CTTATAATGGAAGGTCTAGCTATGGATTCTGGTCGGAAACCAACGAAGAAGGAAGATCAATGGATTTGGGGACTTCTTGTAGTAGCCAATCTGTGGATTCAGGGGAAGAT
TTCTGTGAAAGCCCTTTCCGATTTGTTCTTCAGCGAAGCTCCTCGTACGGTTGTCGGACGCCAGATTTTCTGTCGCCGGCGGCCTCTCCTTGTCGCCGTAACAAAGAGGA
TGAAACAGTAAACAGTGAAGAAAGCTTGAAGAAATTTCAGGTGGAAGAAGATGAAGAAGATAAGGAGCAATGTAGTCCCGTGTCTGTATTGGATGGTCCCTTCGACGACA
CATACGATGAACGGCGTGACGACCGGGACAGGGACGGGGACGGGGACGAAGATTACAATTTGGAATGCAGCTATGCAACAGTCCAAAGAACAAAGCAGCAACTATTAAAC
AAGCTTCGAAGATTCGAGAGACTTGCCGACTTGGACCCGATCGAGCTCGAGAAAATAATTCAAGAGGAAGAGGAAGAAGAAGAAAAGCTAGAAAACTACAAAGAGTCAGT
TCAATGGGATAACGCATACGACATCGAACGTTTCGTGAAAGAGGTTGCAAACAATGCAAGCTCCGAACCTCGAGACATGAGGAAACTCGTCATGGATCTGATTGCGGAAG
AAGAGGCGAAACGAAGCGGTCTCGACGCGAGAGAGGAGGTTATAGAGAGGGTTTGTAGGAGGTTGGAGGAGTGGGAAGTGGTGGAATTGAACACCATTGAGATGATGGTG
GAGGAAGATCTAAGGAAGGAGGTTGTGGAGTGGAAGAAGGAGGAGGAGGAGGAGGAGTGGAGAGGAGGGGCCGCCATGGATTTGGAGCTTGCAATTTTCAGTGTGTTGGT
GGAGGAATTGGCTGTGGAACTTGCTTGTTGA
Protein sequenceShow/hide protein sequence
MMPHKPLHELLQQDQEPFHLNTYIADKRVDLKRVSPKTDLQLKKRKPISSNSVFRGDFCRNGCFKSCHPSPELRKSPLFEFRSPARNRSSPNAIFLHVPARTAALLLEAA
LKIHKQKSTAKSKKTQIKNQGLARFGSVLKRLTLRNRNNTDRETEGCDNGGDLASFGHRKSAIRRKITQGETSSYNGRSSYGFWSETNEEGRSMDLGTSCSSQSVDSGED
FCESPFRFVLQRSSSYGCRTPDFLSPAASPCRRNKEDETVNSEESLKKFQVEEDEEDKEQCSPVSVLDGPFDDTYDERRDDRDRDGDGDEDYNLECSYATVQRTKQQLLN
KLRRFERLADLDPIELEKIIQEEEEEEEKLENYKESVQWDNAYDIERFVKEVANNASSEPRDMRKLVMDLIAEEEAKRSGLDAREEVIERVCRRLEEWEVVELNTIEMMV
EEDLRKEVVEWKKEEEEEEWRGGAAMDLELAIFSVLVEELAVELAC