; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0015772 (gene) of Snake gourd v1 genome

Gene IDTan0015772
OrganismTrichosanthes anguina (Snake gourd v1)
Descriptionataxin-10
Genome locationLG04:20053894..20059746
RNA-Seq ExpressionTan0015772
SyntenyTan0015772
Gene Ontology termsGO:0009793 - embryo development ending in seed dormancy (biological process)
GO:0005829 - cytosol (cellular component)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_008465880.1 PREDICTED: ataxin-10 [Cucumis melo]1.0e-17880.1Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        M+M DPDRV IRLGLQV+ANVSLAGE+HQQAIW GLFP+KF+LLAR+ + EISDPLSMI+YN+CS HSELV SLCGD+GLPIIEEI RT SSVGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFP+LFS LRPID  +D +KA+ + VSFS EQA+LLT++SEILNE+IGDI VPK+FA+CVYR FQ SISII+STP+ +C+LPTGTIA 
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVN-KDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRK
        DVLGYSLTILRDICA D  + G+KD+ EDA+DV LSLGL+DLLLSIL D+EPPAILKKALQQV N +DRTSLP  LK CPYKGFRRDIVAV+ANCLYRRK
Subjt:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVN-KDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRK

Query:  HVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        HVQDDIR+KNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENK+LV+ELEVQG A+VPEIAELGL+VEVDPKTR+AKLVN+SRPF+D+
Subjt:  HVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

XP_022947319.1 ataxin-10 [Cucurbita moschata]5.7e-18281.98Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        ML++DPDRVIIRLGLQV+ANVSLAGEEHQQAIW GLFP+KF+ LARIRY EISDPLSMI+YNLCS +SELV SLC D+GLPI+EEITRT + VGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFP LFS LRPID S+DG     K +SFS EQAFLLTIISEILNERIGDIS+PK+FA C++RIFQ SI II+STPICE +LPTGT AV
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICA-HDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR
        DVLGYSL ILRDICA  DGKEGG+KDVS+DA+DV LSLGL+DLLL ILRD+EPPAI+KKA+QQ  N++RT LP+T K  PCPYKGFRRDIVAV+ANCLYR
Subjt:  DVLGYSLTILRDICA-HDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR

Query:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        +KHVQDDIRKKNGVFVLLQQCV DENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGP N+PEIAELGLQVEVDPKT+ AKLVNASRPFKDN
Subjt:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

XP_023006847.1 ataxin-10 [Cucurbita maxima]1.7e-17881.22Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        ML++DPDRVIIRLGLQV+ANVSLAGEEHQQAIW GLFP+KF+ LARIRY EISDPLSMI+YNLCS +SELV SLC D+GLPIIEEITRT S VGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE  F  LFS L PID+S+DG     K +SFS EQAFLLTIISEILNERIGDIS+PK+FA C++RIFQ SI II+STPICE +LPTG  AV
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAH-DGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR
        DVLGYSL ILRDICA  DGKEGG KDVSEDA+DV L LGL+DLLL ILRD+EPPAI+KKA+QQ  N++RT LP+T K  PCPYKGFRRDIVAV+ANCLYR
Subjt:  DVLGYSLTILRDICAH-DGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR

Query:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        +KHVQDDIRKKNGVFVLLQQCV DENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGP N+PEIAELGLQVEVDPKT+ AKLVNA+RPFKDN
Subjt:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

XP_023534595.1 ataxin-10 [Cucurbita pepo subsp. pepo]7.0e-18081.47Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        ML++DPDRVIIRLGLQV+ANVSLAGEEHQQAIW+GLFP+KF+ LARIRY EISDPLSMI+YNL S ++ELV SLC D+GLPIIEEITRT S VGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFP LFS LRPID+S+DG     + +SFS EQAFLLTIISEILNERIGDIS+PK+FA C++RIFQ SI II+STPICE +LPTGT AV
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAH-DGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR
        DVLGYSL ILRDICA  DGKEG  KDVSEDA+DV LSLGL+DLLL ILRD+EPPAI+KKA+QQ  N++RT LP+T K  PCPYKGFRRDIVAV+ANCLYR
Subjt:  DVLGYSLTILRDICAH-DGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR

Query:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        +KHVQDDIRKKNGVFVLLQQCV DENNPFLREWGIWAVRNLLEGN+ENKKLVAELEVQGP N+PEIAELGLQVEVDPKT+ AKLVNASRPFKDN
Subjt:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

XP_038888252.1 ataxin-10 [Benincasa hispida]1.7e-18182.61Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        MLM DPD VIIRLGLQV+ANVSLAGEEHQQAIW  LFP+KF+LL+RI Y EISDPLSMIIYN+CSRHSELV SLCGD GLPIIEEI RT SSVGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFP LFS LRPID  +D +KA+ + VSFS EQA+LLTIISEILNE+IGDI VPK+FA CVYRIFQ SISII+STPIC+  LPTGTIA 
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKH
        DVLGYSLTILRDICA D K+ G+KDVSEDA+DV LSLGL+DLLL IL D+EPPA+LKKALQQ  N+DRTSLP++LK CPYKGFRRDIVAV+ANCLYRRKH
Subjt:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKH

Query:  VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLEN+KLV+ELEVQG A+VPEIAELGL+VEVDPKTR+AKLVNA RPF+D+
Subjt:  VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

TrEMBL top hitse value%identityAlignment
A0A1S3CPV9 ataxin-104.9e-17980.1Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        M+M DPDRV IRLGLQV+ANVSLAGE+HQQAIW GLFP+KF+LLAR+ + EISDPLSMI+YN+CS HSELV SLCGD+GLPIIEEI RT SSVGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFP+LFS LRPID  +D +KA+ + VSFS EQA+LLT++SEILNE+IGDI VPK+FA+CVYR FQ SISII+STP+ +C+LPTGTIA 
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVN-KDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRK
        DVLGYSLTILRDICA D  + G+KD+ EDA+DV LSLGL+DLLLSIL D+EPPAILKKALQQV N +DRTSLP  LK CPYKGFRRDIVAV+ANCLYRRK
Subjt:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVN-KDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRK

Query:  HVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        HVQDDIR+KNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENK+LV+ELEVQG A+VPEIAELGL+VEVDPKTR+AKLVN+SRPF+D+
Subjt:  HVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

A0A5A7T6L8 Ataxin-104.9e-17980.1Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        M+M DPDRV IRLGLQV+ANVSLAGE+HQQAIW GLFP+KF+LLAR+ + EISDPLSMI+YN+CS HSELV SLCGD+GLPIIEEI RT SSVGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFP+LFS LRPID  +D +KA+ + VSFS EQA+LLT++SEILNE+IGDI VPK+FA+CVYR FQ SISII+STP+ +C+LPTGTIA 
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVN-KDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRK
        DVLGYSLTILRDICA D  + G+KD+ EDA+DV LSLGL+DLLLSIL D+EPPAILKKALQQV N +DRTSLP  LK CPYKGFRRDIVAV+ANCLYRRK
Subjt:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVN-KDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRK

Query:  HVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        HVQDDIR+KNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENK+LV+ELEVQG A+VPEIAELGL+VEVDPKTR+AKLVN+SRPF+D+
Subjt:  HVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

A0A6J1BXT4 ataxin-10 isoform X18.7e-17680.78Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        MLM DPD VIIRLGLQV+ANVSLAGEEHQQAIW+ LFP+ F+LLARIRY EISDPLSMIIYNLCSRH ELV  LCGD GLPII EITRTASSVGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFPLLFS L P+D S+DG+K + + VSFS EQAFLLTIISEILNERIGDI+VP +FA CV+RIFQ S+SII+ TPIC+C+LPTGT AV
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKH
        DVLGYSL ILRDICA DG+   +KD+SEDA+DV LSLGL+DLLL +LR++EPPA++KKALQQ  N+DR+S P++LK CPYKGFRRDIVAV+ANC YRRKH
Subjt:  DVLGYSLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKH

Query:  VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNAS
        VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWA+RNLLEGNLEN+KLVAELEVQG  +VPEIAELGLQ+EVDPKTR+AKLVNAS
Subjt:  VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNAS

A0A6J1G6J4 ataxin-102.8e-18281.98Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        ML++DPDRVIIRLGLQV+ANVSLAGEEHQQAIW GLFP+KF+ LARIRY EISDPLSMI+YNLCS +SELV SLC D+GLPI+EEITRT + VGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE YFP LFS LRPID S+DG     K +SFS EQAFLLTIISEILNERIGDIS+PK+FA C++RIFQ SI II+STPICE +LPTGT AV
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICA-HDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR
        DVLGYSL ILRDICA  DGKEGG+KDVS+DA+DV LSLGL+DLLL ILRD+EPPAI+KKA+QQ  N++RT LP+T K  PCPYKGFRRDIVAV+ANCLYR
Subjt:  DVLGYSLTILRDICA-HDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR

Query:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        +KHVQDDIRKKNGVFVLLQQCV DENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGP N+PEIAELGLQVEVDPKT+ AKLVNASRPFKDN
Subjt:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

A0A6J1KWY2 ataxin-108.4e-17981.22Show/hide
Query:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV
        ML++DPDRVIIRLGLQV+ANVSLAGEEHQQAIW GLFP+KF+ LARIRY EISDPLSMI+YNLCS +SELV SLC D+GLPIIEEITRT S VGF EDWV
Subjt:  MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWV

Query:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV
        KLLLSRICLEE  F  LFS L PID+S+DG     K +SFS EQAFLLTIISEILNERIGDIS+PK+FA C++RIFQ SI II+STPICE +LPTG  AV
Subjt:  KLLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAV

Query:  DVLGYSLTILRDICAH-DGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR
        DVLGYSL ILRDICA  DGKEGG KDVSEDA+DV L LGL+DLLL ILRD+EPPAI+KKA+QQ  N++RT LP+T K  PCPYKGFRRDIVAV+ANCLYR
Subjt:  DVLGYSLTILRDICAH-DGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLK--PCPYKGFRRDIVAVVANCLYR

Query:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN
        +KHVQDDIRKKNGVFVLLQQCV DENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGP N+PEIAELGLQVEVDPKT+ AKLVNA+RPFKDN
Subjt:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDN

SwissProt top hitse value%identityAlignment
Q2TBW0 Ataxin-104.2e-1822.99Show/hide
Query:  RLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCS--RHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVKLLLSRICL
        R GLQ + N++   E+ Q  +W   FP  F+       R+I    SMI++   +  R  EL  +L  ++ + ++E   +   S     +W  L+++   L
Subjt:  RLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCS--RHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVKLLLSRICL

Query:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICEC----NLPTGTIAVDVLGY
        +    P L                  K +   +     +T++  ++ + +GD  + K+ A     +F     +I ST + +C     L +     D    
Subjt:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICEC----NLPTGTIAVDVLGY

Query:  SLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCP--------YKGFRRDIVAVVANCLYR
        +   L D+     ++  N D+    + VF   GL++ ++ +LR           L  V   D T++                 +GF+  ++ ++ N  Y+
Subjt:  SLTILRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCP--------YKGFRRDIVAVVANCLYR

Query:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE
         K  QD + + +G+ ++L  C  D++NPFL +W ++A+RNL E N +N+ L+A++E QG A+   + ++G +VE
Subjt:  RKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE

Q55EI6 Ataxin-10 homolog2.5e-1837.84Show/hide
Query:  KGFRRDIVAVVANCLYRRKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAK
        KGF+ +++ ++ N  Y+ +  QD+IR+  G+ ++L  C  D NNP+++EW ++A+RNL E N+EN+ L+  L+V+G AN  E+ +LGL+V V  +    K
Subjt:  KGFRRDIVAVVANCLYRRKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAK

Query:  LVNASRPFKDN
          N  +  K+N
Subjt:  LVNASRPFKDN

Q5FVB0 Ataxin-103.2e-1823.45Show/hide
Query:  LMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVK
        ++ +P  V  R GLQ + N +    + Q A+W   FP+ F+        ++    SM+++   +R  E V++L     L +   +  TA S     +W+ 
Subjt:  LMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVK

Query:  LLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVD
        L++        +F L   +++ +  S+            S E+  LL +I   ++++   +S  +  AL     F           I +   P+     +
Subjt:  LLLSRICLEELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVD

Query:  VLGYSLTILRDI-CAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKH
         +   +T L DI C    K       +E    +    GL++  + ILR        K+++         S+   L      GF+  ++ ++ N  Y+ K 
Subjt:  VLGYSLTILRDI-CAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKH

Query:  VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE
         Q+ + + +G+ ++L  C  D+NNPFL +W ++A+RNL E N +N++L+A +E QG A+   +  +GLQ E
Subjt:  VQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE

Q5RE06 Ataxin-106.1e-1721.69Show/hide
Query:  RLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCS--RHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVKLLLSRICL
        R GLQ + N++   E+ Q  +W   FP  F+       ++I    SMI++   +  R  EL  +L  ++ + +I+   +   S     +W  L+++ + L
Subjt:  RLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCS--RHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVKLLLSRICL

Query:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVDVLGYSLTI
        +    P L   + P                  L     +T++  ++ +   D  + K+       +F R   +I ST + +C                T+
Subjt:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVDVLGYSLTI

Query:  LRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQ-----QVVNKDRTSLPHTLKPC-----------PYKGFRRDIVAVVAN
        L+ + + +  +      +   +DV   + +   LL  L+    P +L++ +       V  K+ T++      C             +GF+  ++ ++ N
Subjt:  LRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQ-----QVVNKDRTSLPHTLKPC-----------PYKGFRRDIVAVVAN

Query:  CLYRRKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE
          Y+ K  QD + + +G+ ++L  C   ++NPFL +W I+A+RNL E N +N+ L+A++E QG A+   + ++G +VE
Subjt:  CLYRRKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE

Q9UBB4 Ataxin-107.9e-1721.69Show/hide
Query:  RLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCS--RHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVKLLLSRICL
        R GLQ + N++   E+ Q  +W   FP  F+       ++I    SMI++   +  R  EL  +L  ++ + +I+   +   S     +W  L+++ + L
Subjt:  RLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCS--RHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVKLLLSRICL

Query:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVDVLGYSLTI
        +    P L   + P                  L     +T++  ++ +   D  + K+       +F R   +I ST + +C                T+
Subjt:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVDVLGYSLTI

Query:  LRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQ-----QVVNKDRTSLPHTLKPC-----------PYKGFRRDIVAVVAN
        L+ + + +  +      +   +DV   + +   LL  L+    P +L++ +       V  K+ T++      C              GF+  ++ ++ N
Subjt:  LRDICAHDGKEGGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQ-----QVVNKDRTSLPHTLKPC-----------PYKGFRRDIVAVVAN

Query:  CLYRRKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE
          Y+ K  QD + + +G+ ++L  C   ++NPFL +W I+A+RNL E N +N+ L+A++E QG A+   + ++G +VE
Subjt:  CLYRRKHVQDDIRKKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVE

Arabidopsis top hitse value%identityAlignment
AT4G00231.1 ARM repeat superfamily protein1.5e-10350.4Show/hide
Query:  IRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSED-WVKLLLSRICL
        +R GLQV+ANV L GE+ Q+ +W   +P +F+ +A+IR RE  DPL MI+Y      SE+ + LC   GL II E  RT+SSVG  ED W+KLL+SRIC+
Subjt:  IRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSED-WVKLLLSRICL

Query:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVDVLGYSLTI
        E+ YF  LFS L            D +   FS EQAFL+ ++S+I NERIG +S+PK+ A  +  +F++S+ + +        LPTG+  VDV+GYSL I
Subjt:  EELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVDVLGYSLTI

Query:  LRDICAHDGKE---GGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKHVQDDIR
        +RD CA    E     NKD S D +++ LS GL++LLL +L  L+PP  +KKAL    N+  +S   +LKPCPY+GFRRDIV+V+ NC YRRK VQD+IR
Subjt:  LRDICAHDGKE---GGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKHVQDDIR

Query:  KKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVN
        +++G+F++LQQCV D+ NPFLREWG+W +RNLLEGN EN+++VAELE++G  +VP++ E+GL+VE+DPKT + KLVN
Subjt:  KKNGVFVLLQQCVADENNPFLREWGIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVN


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCTTATGTATGATCCTGATCGCGTGATTATCAGACTAGGACTACAGGTCATAGCCAATGTTTCATTGGCTGGAGAAGAGCATCAACAAGCAATTTGGCAGGGATTGTT
CCCTAACAAGTTCATTTTACTTGCTCGTATTCGTTACCGTGAGATTTCTGATCCTTTGAGTATGATTATCTACAATCTATGTAGTAGACACTCTGAACTAGTCACATCAC
TTTGCGGTGACTTAGGGTTGCCTATAATTGAAGAGATTACGAGGACGGCATCTTCAGTTGGTTTTAGCGAAGATTGGGTGAAGTTGCTTCTTTCACGAATTTGCTTGGAA
GAGCTGTATTTTCCTCTGCTTTTCTCTGTATTACGCCCTATTGATGCTTCTGAAGACGGCGACAAAGCTGATGATAAAGGAGTTTCCTTTTCATTAGAACAAGCATTTCT
TCTGACAATCATATCAGAGATATTGAATGAGCGAATTGGAGATATTTCTGTTCCCAAGGAGTTTGCATTGTGTGTATATAGAATATTTCAGAGGTCCATTTCTATTATCA
ATTCCACCCCAATATGTGAGTGTAATCTCCCAACAGGCACAATTGCAGTAGATGTTCTCGGCTACTCGCTCACTATTTTAAGAGATATTTGTGCGCATGATGGTAAGGAA
GGAGGAAATAAAGATGTCTCTGAGGATGCAATTGATGTGTTTCTCTCTCTTGGACTTGTAGATTTGCTTTTGAGCATACTTCGTGATCTCGAACCTCCAGCCATACTCAA
GAAAGCACTTCAACAAGTAGTAAACAAGGATAGAACAAGTCTTCCACACACATTAAAGCCGTGTCCATATAAAGGATTTCGAAGAGATATTGTTGCTGTGGTTGCAAATT
GCTTATATAGAAGGAAGCATGTACAAGATGACATTAGAAAGAAGAATGGAGTGTTTGTGCTATTGCAGCAGTGTGTTGCTGATGAAAACAATCCCTTTTTGAGGGAATGG
GGCATCTGGGCTGTGAGGAACTTACTGGAAGGGAACTTAGAAAATAAAAAATTAGTAGCTGAATTGGAGGTTCAAGGTCCTGCAAATGTGCCTGAGATTGCGGAACTTGG
CCTTCAAGTTGAGGTGGATCCAAAAACTCGACAGGCTAAGCTTGTTAATGCGTCACGACCATTTAAAGACAATCAAGGTAATTGTATTGCAAGAACTTGCTAG
mRNA sequenceShow/hide mRNA sequence
CTAAACTCTACATCACAATCACAAACTTCTGAACTCAAATGAGTGTTCTTTTTTTTTTTTTGAATTTTGCTTATCTTCTCCAATTAGGATGTGGTTTTCAAATGGCAAGA
GAGAGAGAGGGAATAGTTAGTCTGGCAACGTGGGTCTCGGCCTTTAGAGGAAGGTAAACGCCGGTGGTTGCTCGATTTACATTGCAATCGGTTGTGGGTCTGACTGGCGT
CTCCGTTTAAACGCTGTGAGTCTCGGTTCCAGGGGTAGGAGGCGTGGGCAACAGCGTAGCAGTCTCGCAGTGGGTTCTGTGTTGTCTCGATGGTGTGGGCCACGGTGGTT
CCAATAAGTCACAAGTGGTTTAGCTTGTGAGGTGATCTCACGGTGGGTATTTGATTGAAGCTCAAGTCGGTGAAGATGGAGTGTATCGGAACTTCCTTTTGCACGGGCCA
GCTTCCATAGTCTTTGGCAACTGTCTAGGACTTCTCCAGCTTGATTTTTTCATAAATTTCTCAACCTTTGCCATTCAGAAGCAGCCTTGTTTGTGGCCTATTGTCAACAA
ATGAAGAACTCGTCATCATTTGAGCAGTCTATACCTGAAAGAATTATTCAACGAATGTTCAGTACATCAAACTTCTTTCACCCTAGAAGCGTCCATAGAAACCCTTATTG
AAGTTTCCAAAAGTATTGAGGGTCGATCAAATTTGGCTTCTCAGAATATCCTTCCTTGTGTGCTTGAGCTGATTCAGTGTCTCATTTACACTTCTAGTGATGTGCTTCTA
TTGTTATCCTTGAAGTTCCTTAGAAACCTATGTGCTGGAGAAATTAGAAATCAGAATGTTTTCATTGAACAAAATGGGGTTGGAGTTGTTTCGAGCATTTTGCAGTATGC
TATGCTTATGTATGATCCTGATCGCGTGATTATCAGACTAGGACTACAGGTCATAGCCAATGTTTCATTGGCTGGAGAAGAGCATCAACAAGCAATTTGGCAGGGATTGT
TCCCTAACAAGTTCATTTTACTTGCTCGTATTCGTTACCGTGAGATTTCTGATCCTTTGAGTATGATTATCTACAATCTATGTAGTAGACACTCTGAACTAGTCACATCA
CTTTGCGGTGACTTAGGGTTGCCTATAATTGAAGAGATTACGAGGACGGCATCTTCAGTTGGTTTTAGCGAAGATTGGGTGAAGTTGCTTCTTTCACGAATTTGCTTGGA
AGAGCTGTATTTTCCTCTGCTTTTCTCTGTATTACGCCCTATTGATGCTTCTGAAGACGGCGACAAAGCTGATGATAAAGGAGTTTCCTTTTCATTAGAACAAGCATTTC
TTCTGACAATCATATCAGAGATATTGAATGAGCGAATTGGAGATATTTCTGTTCCCAAGGAGTTTGCATTGTGTGTATATAGAATATTTCAGAGGTCCATTTCTATTATC
AATTCCACCCCAATATGTGAGTGTAATCTCCCAACAGGCACAATTGCAGTAGATGTTCTCGGCTACTCGCTCACTATTTTAAGAGATATTTGTGCGCATGATGGTAAGGA
AGGAGGAAATAAAGATGTCTCTGAGGATGCAATTGATGTGTTTCTCTCTCTTGGACTTGTAGATTTGCTTTTGAGCATACTTCGTGATCTCGAACCTCCAGCCATACTCA
AGAAAGCACTTCAACAAGTAGTAAACAAGGATAGAACAAGTCTTCCACACACATTAAAGCCGTGTCCATATAAAGGATTTCGAAGAGATATTGTTGCTGTGGTTGCAAAT
TGCTTATATAGAAGGAAGCATGTACAAGATGACATTAGAAAGAAGAATGGAGTGTTTGTGCTATTGCAGCAGTGTGTTGCTGATGAAAACAATCCCTTTTTGAGGGAATG
GGGCATCTGGGCTGTGAGGAACTTACTGGAAGGGAACTTAGAAAATAAAAAATTAGTAGCTGAATTGGAGGTTCAAGGTCCTGCAAATGTGCCTGAGATTGCGGAACTTG
GCCTTCAAGTTGAGGTGGATCCAAAAACTCGACAGGCTAAGCTTGTTAATGCGTCACGACCATTTAAAGACAATCAAGGTAATTGTATTGCAAGAACTTGCTAGTGAATT
GATTTTGGTTAGTGTAATGCTTCTGAATACTGTATGTGGAGGAATCTCATTGGCTTTGAGATGATACAAGCCATTAGTTTATTTAAGAGATTTTTCCCATCAAACTAATT
TGATGTACAGTAGAGGAGTTGAATGTAGAGAAAGAATAGGATGTCTGTCATTATTAGTAAAAAATAAATCAATATAGAGGTTGTCTTTCAGCTCGTGTCATTTTGTAATT
TGGGGTGGAATTTTTTGAAAGGAGGGATTTGCGTATTCATATTCTAATTATAAGTTTATAACTCAAC
Protein sequenceShow/hide protein sequence
MLMYDPDRVIIRLGLQVIANVSLAGEEHQQAIWQGLFPNKFILLARIRYREISDPLSMIIYNLCSRHSELVTSLCGDLGLPIIEEITRTASSVGFSEDWVKLLLSRICLE
ELYFPLLFSVLRPIDASEDGDKADDKGVSFSLEQAFLLTIISEILNERIGDISVPKEFALCVYRIFQRSISIINSTPICECNLPTGTIAVDVLGYSLTILRDICAHDGKE
GGNKDVSEDAIDVFLSLGLVDLLLSILRDLEPPAILKKALQQVVNKDRTSLPHTLKPCPYKGFRRDIVAVVANCLYRRKHVQDDIRKKNGVFVLLQQCVADENNPFLREW
GIWAVRNLLEGNLENKKLVAELEVQGPANVPEIAELGLQVEVDPKTRQAKLVNASRPFKDNQGNCIARTC