; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

ClCG08G016200 (gene) of Watermelon (Charleston Gray) v2.5 genome

Gene IDClCG08G016200
OrganismCitrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
DescriptionSASA domain-containing protein
Genome locationCG_Chr08:28602676..28619804
RNA-Seq ExpressionClCG08G016200
SyntenyClCG08G016200
Gene Ontology termsGO:0006468 - protein phosphorylation (biological process)
GO:0016021 - integral component of membrane (cellular component)
GO:0004672 - protein kinase activity (molecular function)
GO:0005524 - ATP binding (molecular function)
InterPro domainsIPR005181 - Sialate O-acetylesterase domain
IPR036514 - SGNH hydrolase superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAE8646868.1 hypothetical protein Csa_020851 [Cucumis sativus]5.7e-13284.33Show/hide
Query:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVP
        GA SPKNIFI AGQSNMAGRGGVE N KG+L WDGL+P ECQS+ SILRLNP+RQWEIAREPLH GIDIN+T GIGPGM FAH+LLAKVGPNAG VGLVP
Subjt:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVP

Query:  CARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTH
        CARGGTLI QW+KNPSNP+ATFYQNFIERIKASD++GGVVRALFWFQGESDAAMNDTA+RYKDNLK FFT+IRNDIKPRFLPIIVVKIALYDF M+HDTH
Subjt:  CARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTH

Query:  NLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL
        NLPAVR A+DAVSKELP VV ID+L+LP+N  T+EGFN DHGHFNTT EI +GKWLA+TYLSHYGHLL
Subjt:  NLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL

KAE8652071.1 hypothetical protein Csa_018776 [Cucumis sativus]0.0e+0072.56Show/hide
Query:  MALLKLSILLCIMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPLECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMS
        M LL+LSI+LC+ML+GPSLSGA SPKNIFILAGQSNMAGRGGVE N +G L+WDGL+P ECQ   SILRLNP  QWEIAREPLH GIDI +T GIGPG++
Subjt:  MALLKLSILLCIMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPLECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMS

Query:  FAHQLLAKAGPNIGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRF
        FAH+LL KAGPN G VGLVPCARGGTLIEQWIKNPSNP+ATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTA+RYKDNLK FFTDIR+DIKPRF
Subjt:  FAHQLLAKAGPNIGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRF

Query:  LPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIV------------GATSPKNIFILAGQSN
        LPIIVVKIALYDFF +HDTHNLPAVR A++AVSKELP+VV ID+LKLP+N+ T+EG N DHGHFNTT EI +            GA SPKNIFILAGQSN
Subjt:  LPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIV------------GATSPKNIFILAGQSN

Query:  MAGRGGVEKNLKGELEWDGLIPPECQSDSSILQLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGILIEQWIKNQG
        MAGRGGVE N +G L+WDGL+PPECQ   SIL+LN   QWEIAREPLH GIDI +T GIGPG++FAH+LL KVGPNAG VGLVPCAR            G
Subjt:  MAGRGGVEKNLKGELEWDGLIPPECQSDSSILQLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGILIEQWIKNQG

Query:  GVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRFLPIIVVKITLCDFLMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGF
        GVVRALFWFQGESDAAMNDTA+RYKDNLK FFTDIR+DIKPRFLPIIVVKI L DF  +HDTHNLPAVR A++AVSKELP VV ID+LKLP+N+ T+EG 
Subjt:  GVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRFLPIIVVKITLCDFLMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGF

Query:  NKDHGHFNTTIEIIVGKWLGDTYLSHHVKYYFLKTYLGAGLLSKVVGVEMPLLKLSILLCTMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGEL
        N DHGHFNTT EI +                                                      GA SPKNIFILAGQSNMAGRGGVE N +G L
Subjt:  NKDHGHFNTTIEIIVGKWLGDTYLSHHVKYYFLKTYLGAGLLSKVVGVEMPLLKLSILLCTMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGEL

Query:  EWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIK
        +WDGL+PPECQ   SILRLN   QWEIAREPLH GIDIN+T GIGPG++FAH+LL K GPNAG VGLVPCARGGTLIEQWIKNPSNP+ATFYQNFIERIK
Subjt:  EWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIK

Query:  ASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNF
        ASD++GGVVRALFWFQGESDAAMNDTA+RYKDNLK FFT+IR+DIKPRFLPIIVVKIALYDFF +HDTHNLPAVR A++AVSKELP VV ID+LKLP+N+
Subjt:  ASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNF

Query:  ETHEGFNKDHGHFNTTMEIIVGATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIARE
         T+EG N DHGHFNTT EI +G    +      GQSNMAGRGGVE N +G+L+WDGL+P ECQ   SILRLNP  QWEIARE
Subjt:  ETHEGFNKDHGHFNTTMEIIVGATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIARE

KAG6585684.1 putative carbohydrate esterase, partial [Cucurbita argyrosperma subsp. sororia]6.3e-22469.58Show/hide
Query:  MAGRGGVEKNLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPS
        MAGRGGVE N +G L WDG +P +CQSD SILRLN ERQWEIA EPLH GIDI KT GIGPG++FAH+ +AK G  AGVVGLVPCARGGTLIEQW KNPS
Subjt:  MAGRGGVEKNLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPS

Query:  NPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKEL
        N +ATFYQNFIERIK S++EGGVVRALFW+QGESDAAM+DTA RYKDNLK F T+IRNDIKPRFLP+I+VKI++YDFFMKHDTH+LPAVRAAEDAV KEL
Subjt:  NPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKEL

Query:  PHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIV---------------------------------------------GATSPKNIFILAGQSNMAG
        P ++TID+ +LP+NF T+EGF+ DHGHFN+  EI +                                             GATSPKNIFILAGQSNMAG
Subjt:  PHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIV---------------------------------------------GATSPKNIFILAGQSNMAG

Query:  RGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPSNPN
        RGG+EK+  G   WDG IP E QSD +ILR +PE QWEIA EP+H+GIDINKTVG+G  + FA QL AK    AGVVGLVPCARGGTLIE+WIKNPSNP 
Subjt:  RGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPSNPN

Query:  ATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHV
        ATFYQNFIERIKAS+++GGVVRAL W QGESDAA  DTA RYKDNLK FF +IRNDIKPRFLPII+VKIA+YD +MKHDTH+LPAVRAAEDAV KELP +
Subjt:  ATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHV

Query:  VTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL
        VTID++ L +N  THEGFN+DH HFNT  +I +GKWLADTYLSHYGH L
Subjt:  VTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL

XP_038886442.1 probable carbohydrate esterase At4g34215 [Benincasa hispida]1.6e-13486.52Show/hide
Query:  ATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPC
        A SP NIFILAGQSNMAGRGGVE N   +LEWDGLIP ECQSD SILRLNP  QWEIAREPLHEGIDINKTVGIGPGM FAHQLL KVGP AG VGLVPC
Subjt:  ATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPC

Query:  ARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHN
        ARGGT+IEQWIKNPSNP+ATFY+NFIERIKASD+EGGVVRALFWFQGESDAAM+DTA RYKDNLKNFFT+IRNDIKPRFLPII+VKIALYDF MKHDTH+
Subjt:  ARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHN

Query:  LPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL
        LPAVRAA+DAVSKELP +VTIDALKLP+N +THEGFN+DHGHFNTT +I +GKWLADTYLSHYGHLL
Subjt:  LPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL

XP_038886575.1 probable carbohydrate esterase At4g34215 [Benincasa hispida]1.2e-13486.52Show/hide
Query:  ATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPC
        A SPKNIFILAGQSNMAGRGGVE N  G LEW+ LIP ECQSD+SILRLNP  QWE+AREPLHEGIDINKTVGIGPGM FAHQLLAKVGP AG+VGLVPC
Subjt:  ATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPC

Query:  ARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHN
        A+GGT+IEQWIKNPSNP+ATFY++FIERIKASD+EGGVVRALFWFQGESDAAMNDTA RYKDNLKNFFT+IRNDIKPRFLPII+VKIALYDF MKHDTH+
Subjt:  ARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHN

Query:  LPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL
        LP VRAA+DAVSKELP VVTIDALKLP+N +THEGFN+DHGHFNTT EI +GKWLADTYLSHYGHLL
Subjt:  LPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL

TrEMBL top hitse value%identityAlignment
A0A0A0LNC5 SASA domain-containing protein3.7e-12982.05Show/hide
Query:  MALLKLSILLCIMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPLECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMS
        M LL+LSI+LC+ML+GPSLSGA SPKNIFILAGQSNMAGRGGVE N +G L+WDGL+P ECQ   SILRLNP  QWEIAREPLH GIDI +T GIGPG++
Subjt:  MALLKLSILLCIMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPLECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMS

Query:  FAHQLLAKAGPNIGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRF
        FAH+LL KAGPN G VGLVPCARGGTLIEQWIKNPSNP+ATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTA+RYKDNLK FFTDIR+DIKPRF
Subjt:  FAHQLLAKAGPNIGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRF

Query:  LPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG
        LPIIVVKIALYDFF +HDTHNLPAVR A++AVSKELP VV ID+LKLP+N+ T+EG N DHGHFNTT EI +G
Subjt:  LPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG

A0A5A7V0T7 Putative receptor-like protein kinase3.3e-12580.6Show/hide
Query:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVP
        GA  PKNIFILAGQSNMAGRGGVE   K  L WDGL+P EC  + SILRLNP+RQWE+AREPLH GIDIN+T GIGPG+ FA +LLAK GPNAG VGLVP
Subjt:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVP

Query:  CARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTH
        CARGGTLI QW+KNPSNP+ATFYQNFIERI+ SD++GGVVRALFWFQGESDAAMNDTAMRYKDNL  FFT+IRNDIKPRFLPI+VVKIALYDFFMKHDTH
Subjt:  CARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTH

Query:  NLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL
        NLPAVRAA+DAV+KELP VV IDAL+LP+NF T+EG N DHGHFNT+ EI +GKWLA+TYLSH+GHLL
Subjt:  NLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL

A0A5A7VGP3 Putative carbohydrate esterase5.9e-12780.97Show/hide
Query:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVP
        GA SPKNIFILAGQSNMAGRGGVEK+  G+L WD L+P EC+   SILRLNPER+WE AREPLH GIDIN+T GIGPGM FAH LLAK GPNAGVVGLVP
Subjt:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVP

Query:  CARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTH
        CARGGTLIEQWIKNPSNPNATFY+NFIERIKASD++GGVVRALFWFQGESDAAM+DTA RYKDNLK FFT+IRNDIKPRFLPII+ KIA+YD FMKHDTH
Subjt:  CARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTH

Query:  NLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL
        +L AVRAA++ VSKELP ++TIDAL+LP+NF T+ GFN DH HFNT  EI+VGKW ADTYLSHYGHLL
Subjt:  NLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL

A0A6J1GJF6 probable carbohydrate esterase At4g342153.3e-12579.85Show/hide
Query:  MALLKLSILLCIMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPLECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMS
        M LLKLSILLC++LF PSLSGATSP NIFILAGQSNMAGRGGVEK   G+L WDG +PLECQ D SILRLNPERQWEIA EPLH GIDI+ T GIGPG+ 
Subjt:  MALLKLSILLCIMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPLECQSDSSILRLNPERQWEIAREPLHEGIDINKTVGIGPGMS

Query:  FAHQLLAKAGPNIGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRF
        FAHQ   KAG   G+VGLVPCARGGTLIEQWIKNPSNP+ATFYQNFIERIK S+K+GGVVRALFW+QGESDAAMNDTA RYKDNLK F TDIRNDIKPRF
Subjt:  FAHQLLAKAGPNIGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRNDIKPRF

Query:  LPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG
        LP+I+VKI+LYDFFMKHDTHNLPAVRAAEDAV KELP ++TID+ +LP+NF T EGF+ DHGHFNT  EI++G
Subjt:  LPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG

A0A6J1I774 probable carbohydrate esterase At4g342151.5e-12580Show/hide
Query:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDI--NKTVGIGPGMSFAHQLLAKVGPNAGVVGL
        GATSP NIFILAGQSNMAGRGGVEK   G+L WDG +PSECQSD SILR NPERQWEIA EPLH GID+   KT GIGPG+ FAHQL  K G  AG+VGL
Subjt:  GATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDSSILRLNPERQWEIAREPLHEGIDI--NKTVGIGPGMSFAHQLLAKVGPNAGVVGL

Query:  VPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHD
        VPCARGGTLIEQWIKNPSNP+ATFYQNFIERIK S++EGGVVRALFW+QGESDAAMNDTA RYKDNLK F T+IRNDIKPRFLP+I+VKIALYDFFMKHD
Subjt:  VPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHD

Query:  THNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL
        THNLPAVRAAEDAV KELP ++TID+ +LP+N  T EGF+ DHGHFNT  EI +GKWLADTYL+HYGHLL
Subjt:  THNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYGHLL

SwissProt top hitse value%identityAlignment
Q8L9J9 Probable carbohydrate esterase At4g342153.9e-4337.6Show/hide
Query:  PSLSGATSPKNIFILAGQSNMAGRGGVEK-NLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGV
        P +     P  IFIL+GQSNMAGRGGV K +      WD ++PPEC  +SSILRL+++ +WE A EPLH  ID  K  G+GPGM+FA+ +  ++  ++ V
Subjt:  PSLSGATSPKNIFILAGQSNMAGRGGVEK-NLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGV

Query:  VGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFM
        +GLVPCA GGT I++W +      +  Y+  ++R + S + GG ++A+ W+QGESD      A  Y +N+     N+R+D+    LPII V IA    ++
Subjt:  VGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFM

Query:  KHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG
                  +  E  +  +L +VV +DA  LPL          D+ H  T  ++ +G
Subjt:  KHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG

Arabidopsis top hitse value%identityAlignment
AT3G53010.1 Domain of unknown function (DUF303)1.3e-4442.75Show/hide
Query:  PSLSGATSPKN--IFILAGQSNMAGRGGV-EKNLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNA
        P L   T  +N  IFILAGQSNMAGRGGV          WDG+IPPEC+S+ SILRL S+ +W+ A+EPLH  IDINKT G+GPGM FA++++ + G   
Subjt:  PSLSGATSPKN--IFILAGQSNMAGRGGV-EKNLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNA

Query:  GVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKA--SDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALY
          VGLVPC+ GGT + QW K         Y+  ++R KA  +   GG  RA+ W+QGESD      A  YK  L  FF+++RND++   LPII V +A  
Subjt:  GVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKA--SDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALY

Query:  DFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG
                  L AVR A+  +  +L +V  +DA  LPL          D  H  T+ ++ +G
Subjt:  DFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG

AT4G34215.1 Domain of unknown function (DUF303)2.8e-4437.6Show/hide
Query:  PSLSGATSPKNIFILAGQSNMAGRGGVEK-NLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGV
        P +     P  IFIL+GQSNMAGRGGV K +      WD ++PPEC  +SSILRL+++ +WE A EPLH  ID  K  G+GPGM+FA+ +  ++  ++ V
Subjt:  PSLSGATSPKNIFILAGQSNMAGRGGVEK-NLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGV

Query:  VGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFM
        +GLVPCA GGT I++W +      +  Y+  ++R + S + GG ++A+ W+QGESD      A  Y +N+     N+R+D+    LPII V IA    ++
Subjt:  VGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFM

Query:  KHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG
                  +  E  +  +L +VV +DA  LPL          D+ H  T  ++ +G
Subjt:  KHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG

AT4G34215.2 Domain of unknown function (DUF303)2.8e-4437.6Show/hide
Query:  PSLSGATSPKNIFILAGQSNMAGRGGVEK-NLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGV
        P +     P  IFIL+GQSNMAGRGGV K +      WD ++PPEC  +SSILRL+++ +WE A EPLH  ID  K  G+GPGM+FA+ +  ++  ++ V
Subjt:  PSLSGATSPKNIFILAGQSNMAGRGGVEK-NLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGV

Query:  VGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFM
        +GLVPCA GGT I++W +      +  Y+  ++R + S + GG ++A+ W+QGESD      A  Y +N+     N+R+D+    LPII V IA    ++
Subjt:  VGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFM

Query:  KHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG
                  +  E  +  +L +VV +DA  LPL          D+ H  T  ++ +G
Subjt:  KHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCCAACCCCAGCTACTTAAGTACACTTTGTAAGGTTGCATTAGGATTGGTAGGATTCTTTCTCCATTGTCCAATTAAAGAGCCACCTCTAGCACAAAGAACTAAACC
CACAACATCTGCCTTTAACCCAACTTTGGCTCTTAGCAAAGGCTCTCGTGCTACCTCCTATTGGCGCATAGAGTTCAATCGTAGAATGGATGGATTAGTAGAAGGAACCC
CTAAAAGGGAAGGGCCAAATAGCATCATACATTGCAAGATTAATAGTCCTAACAAAACCATTTTGACCCTCTGTGTTTGTGCAATATTATTTAGTTTTCATATCGTTTTT
TTTTTCCAAGAATGTGTTAATGTCTATATTTTTACAGCTGATCGGTTTAATATAACTTATAATACACAAAGGGTCGAAATGGCTTTATTAAAACTATCAATCTTGCTATG
TATAATGTTATTTGGCCCTTCCCTTTCAGGGGCTACTTCTCCTAAGAACATATTCATCCTCGCTGGCCAAAGCAATATGGCTGGTCGAGGTGGGGTTGAGAAAAATCTAA
AGGGAGAGCTTGAGTGGGATGGATTGATCCCACTAGAATGTCAATCTGACTCATCCATCCTACGATTAAACCCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTCCAT
GAGGGGATCGACATTAACAAGACAGTTGGGATTGGCCCGGGAATGTCATTTGCTCACCAGCTACTAGCTAAAGCAGGGCCAAATATAGGTGTTGTCGGTTTAGTTCCTTG
TGCTAGAGGTGGCACTTTAATTGAACAATGGATTAAAAATCCTAGCAATCCTAATGCAACTTTTTACCAAAACTTCATTGAACGAATCAAAGCATCGGATAAAGATGGTG
GAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCGATGCAGCTATGAATGACACTGCTATGAGATACAAAGACAACCTAAAGAATTTCTTCACCGACATCCGCAAT
GATATAAAACCTAGATTTTTACCCATCATTGTTGTTAAAATAGCCCTTTATGACTTTTTTATGAAGCACGATACTCATAATCTGCCAGCAGTGAGGGCGGCAGAAGATGC
AGTCAGCAAGGAGCTACCACATGTGGTGACCATTGACGCTTTGAAATTACCTTTAAACTTTGAGACACATGAAGGCTTCAACAAAGATCATGGCCATTTTAATACCACAA
TGGAAATTATTGTGGGGGCTACTTCTCCTAAGAACATATTCATCCTTGCTGGTCAGAGCAATATGGCTGGGCGAGGTGGGGTTGAGAAAAATCTTAAGGGAGAGCTTGAG
TGGGATGGATTGATCCCACCAGAATGTCAATCTGACTCATCCATCCTACAATTAAATTCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTCCATGAGGGGATCGACAT
CAACAAGACAGTTGGGATTGGTCCGGGAATGTCATTTGCTCACCAGCTACTAGCTAAAGTCGGGCCAAATGCAGGTGTTGTTGGTTTAGTTCCTTGTGCTAGAGGTGGCA
TTTTAATTGAACAATGGATTAAAAATCAAGGTGGAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCGATGCAGCTATGAATGACACTGCTATGAGATACAAAGAC
AACCTAAAGAATTTCTTCACCGACATCCGCAATGATATAAAACCTAGATTCTTACCCATCATTGTTGTTAAAATAACCCTCTGTGACTTTTTGATGAAGCACGATACTCA
TAATCTGCCAGCAGTGAGGGCGGCAGAAGATGCAGTTAGCAAGGAGCTACCACACGTGGTGACTATTGACGCTTTGAAATTACCTTTAAACTTTGAAACACATGAAGGCT
TCAACAAAGATCATGGTCATTTTAATACCACGATAGAAATTATTGTGGGTAAATGGTTGGGTGATACCTACCTCTCCCACCATGTAAAATATTATTTTTTAAAAACATAT
TTAGGTGCTGGTTTGCTGTCCAAAGTTGTAGGGGTTGAAATGCCTTTATTAAAACTATCAATCTTGCTATGTACAATGTTGTTTGGCCCTTCCCTTTCAGGGGCTACTTC
TCCTAAGAACATATTTATCCTCGCTGGCCAAAGCAATATGGCTGGTCGAGGTGGGGTTGAGAAAAATCTAAAGGGAGAGCTTGAGTGGGATGGATTGATCCCACCAGAAT
GTCAATCTGACTCATCCATCCTACGATTAAATTCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTTCATGAGGGGATCGACATCAACAAGACAGTTGGAATTGGTCCA
GGAATGTCATTTGCTCACCAGCTACTAGCTAAAGTTGGGCCAAATGCAGGTGTTGTCGGTTTAGTTCCTTGTGCTAGAGGTGGCACTTTAATTGAACAATGGATTAAAAA
TCCTAGCAATCCTAATGCAACTTTTTACCAAAACTTCATTGAACGAATCAAAGCATCAGATAGAGAAGGTGGAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCG
ATGCAGCTATGAATGACACTGCTATGAGATACAAAGACAACCTAAAGAATTTCTTCACCAACATCCGCAATGATATAAAACCTAGATTTTTACCCATCATTGTTGTTAAA
ATAGCCCTCTATGACTTTTTTATGAAACACGATACTCATAATCTGCCAGCAGTTAGGGCGGCAGAAGATGCAGTCAGCAAGGAGCTACCACATGTGGTGACCATTGACGC
TTTGAAATTACCTTTAAACTTTGAGACACATGAAGGCTTCAACAAAGATCATGGCCATTTTAATACCACAATGGAAATTATTGTGGGGGCTACTTCTCCTAAGAACATAT
TCATCCTTGCTGGTCAGAGCAATATGGCTGGTCGAGGTGGGGTTGAGAAAAATCTAAAGGGAGACCTTGAGTGGGATGGATTGATCCCATCAGAATGTCAATCTGACTCA
TCCATCCTACGATTAAATCCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTCCATGAGGGGATCGACATCAACAAGACAGTTGGGATTGGTCCGGGAATGTCATTTGC
TCACCAGCTACTAGCTAAAGTTGGGCCAAATGCAGGTGTTGTCGGTTTAGTTCCTTGTGCTAGAGGTGGCACTTTAATTGAACAATGGATTAAAAATCCTAGCAATCCTA
ATGCAACTTTTTACCAAAACTTCATTGAACGAATCAAAGCATCAGATAGAGAAGGTGGAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCGATGCAGCTATGAAT
GACACTGCTATGAGATACAAAGACAACCTAAAGAATTTCTTCACCAACATCCGCAATGATATAAAACCTAGATTTTTACCCATCATTGTTGTTAAAATAGCCCTCTATGA
CTTTTTTATGAAACACGATACTCATAATCTGCCAGCAGTTAGGGCGGCAGAAGATGCAGTCAGCAAGGAGCTACCACATGTGGTGACCATTGACGCTTTGAAATTACCTT
TAAACTTTGAGACACATGAAGGCTTCAACAAAGATCATGGCCATTTTAATACCACAATGGAAATTATTGTGGGTAAATGGTTGGCTGATACCTACCTCTCCCACTATGGT
CATTTACTCTAA
mRNA sequenceShow/hide mRNA sequence
ATGTCCAACCCCAGCTACTTAAGTACACTTTGTAAGGTTGCATTAGGATTGGTAGGATTCTTTCTCCATTGTCCAATTAAAGAGCCACCTCTAGCACAAAGAACTAAACC
CACAACATCTGCCTTTAACCCAACTTTGGCTCTTAGCAAAGGCTCTCGTGCTACCTCCTATTGGCGCATAGAGTTCAATCGTAGAATGGATGGATTAGTAGAAGGAACCC
CTAAAAGGGAAGGGCCAAATAGCATCATACATTGCAAGATTAATAGTCCTAACAAAACCATTTTGACCCTCTGTGTTTGTGCAATATTATTTAGTTTTCATATCGTTTTT
TTTTTCCAAGAATGTGTTAATGTCTATATTTTTACAGCTGATCGGTTTAATATAACTTATAATACACAAAGGGTCGAAATGGCTTTATTAAAACTATCAATCTTGCTATG
TATAATGTTATTTGGCCCTTCCCTTTCAGGGGCTACTTCTCCTAAGAACATATTCATCCTCGCTGGCCAAAGCAATATGGCTGGTCGAGGTGGGGTTGAGAAAAATCTAA
AGGGAGAGCTTGAGTGGGATGGATTGATCCCACTAGAATGTCAATCTGACTCATCCATCCTACGATTAAACCCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTCCAT
GAGGGGATCGACATTAACAAGACAGTTGGGATTGGCCCGGGAATGTCATTTGCTCACCAGCTACTAGCTAAAGCAGGGCCAAATATAGGTGTTGTCGGTTTAGTTCCTTG
TGCTAGAGGTGGCACTTTAATTGAACAATGGATTAAAAATCCTAGCAATCCTAATGCAACTTTTTACCAAAACTTCATTGAACGAATCAAAGCATCGGATAAAGATGGTG
GAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCGATGCAGCTATGAATGACACTGCTATGAGATACAAAGACAACCTAAAGAATTTCTTCACCGACATCCGCAAT
GATATAAAACCTAGATTTTTACCCATCATTGTTGTTAAAATAGCCCTTTATGACTTTTTTATGAAGCACGATACTCATAATCTGCCAGCAGTGAGGGCGGCAGAAGATGC
AGTCAGCAAGGAGCTACCACATGTGGTGACCATTGACGCTTTGAAATTACCTTTAAACTTTGAGACACATGAAGGCTTCAACAAAGATCATGGCCATTTTAATACCACAA
TGGAAATTATTGTGGGGGCTACTTCTCCTAAGAACATATTCATCCTTGCTGGTCAGAGCAATATGGCTGGGCGAGGTGGGGTTGAGAAAAATCTTAAGGGAGAGCTTGAG
TGGGATGGATTGATCCCACCAGAATGTCAATCTGACTCATCCATCCTACAATTAAATTCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTCCATGAGGGGATCGACAT
CAACAAGACAGTTGGGATTGGTCCGGGAATGTCATTTGCTCACCAGCTACTAGCTAAAGTCGGGCCAAATGCAGGTGTTGTTGGTTTAGTTCCTTGTGCTAGAGGTGGCA
TTTTAATTGAACAATGGATTAAAAATCAAGGTGGAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCGATGCAGCTATGAATGACACTGCTATGAGATACAAAGAC
AACCTAAAGAATTTCTTCACCGACATCCGCAATGATATAAAACCTAGATTCTTACCCATCATTGTTGTTAAAATAACCCTCTGTGACTTTTTGATGAAGCACGATACTCA
TAATCTGCCAGCAGTGAGGGCGGCAGAAGATGCAGTTAGCAAGGAGCTACCACACGTGGTGACTATTGACGCTTTGAAATTACCTTTAAACTTTGAAACACATGAAGGCT
TCAACAAAGATCATGGTCATTTTAATACCACGATAGAAATTATTGTGGGTAAATGGTTGGGTGATACCTACCTCTCCCACCATGTAAAATATTATTTTTTAAAAACATAT
TTAGGTGCTGGTTTGCTGTCCAAAGTTGTAGGGGTTGAAATGCCTTTATTAAAACTATCAATCTTGCTATGTACAATGTTGTTTGGCCCTTCCCTTTCAGGGGCTACTTC
TCCTAAGAACATATTTATCCTCGCTGGCCAAAGCAATATGGCTGGTCGAGGTGGGGTTGAGAAAAATCTAAAGGGAGAGCTTGAGTGGGATGGATTGATCCCACCAGAAT
GTCAATCTGACTCATCCATCCTACGATTAAATTCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTTCATGAGGGGATCGACATCAACAAGACAGTTGGAATTGGTCCA
GGAATGTCATTTGCTCACCAGCTACTAGCTAAAGTTGGGCCAAATGCAGGTGTTGTCGGTTTAGTTCCTTGTGCTAGAGGTGGCACTTTAATTGAACAATGGATTAAAAA
TCCTAGCAATCCTAATGCAACTTTTTACCAAAACTTCATTGAACGAATCAAAGCATCAGATAGAGAAGGTGGAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCG
ATGCAGCTATGAATGACACTGCTATGAGATACAAAGACAACCTAAAGAATTTCTTCACCAACATCCGCAATGATATAAAACCTAGATTTTTACCCATCATTGTTGTTAAA
ATAGCCCTCTATGACTTTTTTATGAAACACGATACTCATAATCTGCCAGCAGTTAGGGCGGCAGAAGATGCAGTCAGCAAGGAGCTACCACATGTGGTGACCATTGACGC
TTTGAAATTACCTTTAAACTTTGAGACACATGAAGGCTTCAACAAAGATCATGGCCATTTTAATACCACAATGGAAATTATTGTGGGGGCTACTTCTCCTAAGAACATAT
TCATCCTTGCTGGTCAGAGCAATATGGCTGGTCGAGGTGGGGTTGAGAAAAATCTAAAGGGAGACCTTGAGTGGGATGGATTGATCCCATCAGAATGTCAATCTGACTCA
TCCATCCTACGATTAAATCCTGAGCGCCAATGGGAGATAGCACGAGAGCCTCTCCATGAGGGGATCGACATCAACAAGACAGTTGGGATTGGTCCGGGAATGTCATTTGC
TCACCAGCTACTAGCTAAAGTTGGGCCAAATGCAGGTGTTGTCGGTTTAGTTCCTTGTGCTAGAGGTGGCACTTTAATTGAACAATGGATTAAAAATCCTAGCAATCCTA
ATGCAACTTTTTACCAAAACTTCATTGAACGAATCAAAGCATCAGATAGAGAAGGTGGAGTTGTGCGTGCTCTTTTTTGGTTCCAAGGCGAAAGCGATGCAGCTATGAAT
GACACTGCTATGAGATACAAAGACAACCTAAAGAATTTCTTCACCAACATCCGCAATGATATAAAACCTAGATTTTTACCCATCATTGTTGTTAAAATAGCCCTCTATGA
CTTTTTTATGAAACACGATACTCATAATCTGCCAGCAGTTAGGGCGGCAGAAGATGCAGTCAGCAAGGAGCTACCACATGTGGTGACCATTGACGCTTTGAAATTACCTT
TAAACTTTGAGACACATGAAGGCTTCAACAAAGATCATGGCCATTTTAATACCACAATGGAAATTATTGTGGGTAAATGGTTGGCTGATACCTACCTCTCCCACTATGGT
CATTTACTCTAA
Protein sequenceShow/hide protein sequence
MSNPSYLSTLCKVALGLVGFFLHCPIKEPPLAQRTKPTTSAFNPTLALSKGSRATSYWRIEFNRRMDGLVEGTPKREGPNSIIHCKINSPNKTILTLCVCAILFSFHIVF
FFQECVNVYIFTADRFNITYNTQRVEMALLKLSILLCIMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPLECQSDSSILRLNPERQWEIAREPLH
EGIDINKTVGIGPGMSFAHQLLAKAGPNIGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDKDGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTDIRN
DIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGATSPKNIFILAGQSNMAGRGGVEKNLKGELE
WDGLIPPECQSDSSILQLNSERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGILIEQWIKNQGGVVRALFWFQGESDAAMNDTAMRYKD
NLKNFFTDIRNDIKPRFLPIIVVKITLCDFLMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTIEIIVGKWLGDTYLSHHVKYYFLKTY
LGAGLLSKVVGVEMPLLKLSILLCTMLFGPSLSGATSPKNIFILAGQSNMAGRGGVEKNLKGELEWDGLIPPECQSDSSILRLNSERQWEIAREPLHEGIDINKTVGIGP
GMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMNDTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVK
IALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGATSPKNIFILAGQSNMAGRGGVEKNLKGDLEWDGLIPSECQSDS
SILRLNPERQWEIAREPLHEGIDINKTVGIGPGMSFAHQLLAKVGPNAGVVGLVPCARGGTLIEQWIKNPSNPNATFYQNFIERIKASDREGGVVRALFWFQGESDAAMN
DTAMRYKDNLKNFFTNIRNDIKPRFLPIIVVKIALYDFFMKHDTHNLPAVRAAEDAVSKELPHVVTIDALKLPLNFETHEGFNKDHGHFNTTMEIIVGKWLADTYLSHYG
HLL