; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CsGy3G009090 (gene) of Cucumber (Gy14) v2.1 genome

Gene IDCsGy3G009090
OrganismCucumis sativus L. var. sativus cv. Gy14 (Cucumber (Gy14) v2.1)
Descriptionacyl-coenzyme A thioesterase 13
Genome locationGy14Chr3:7405883..7408991
RNA-Seq ExpressionCsGy3G009090
SyntenyCsGy3G009090
Gene Ontology termsGO:0047617 - acyl-CoA hydrolase activity (molecular function)
InterPro domainsIPR006683 - Thioesterase domain
IPR029069 - HotDog domain superfamily
IPR039298 - Acyl-coenzyme A thioesterase 13


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7018981.1 hypothetical protein SDJN02_20858, partial [Cucurbita argyrosperma subsp. argyrosperma]6.90e-8674.43Show/hide
Query:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI
        SSS  PSLIF SPTIQIKDMSE++L GTI++ N L GSG IPDDC+TK FYS I  GH+RQ   ERGRLTYLL VKPAV+N YGFLHGGFVA  AE  SI
Subjt:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI

Query:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        ACARTV+ EDK+LF+GELSISYLSGAP NAEVI++AS+LRSG+ L+VV ++F+LQKTGKL+YTAR TLYNMPMAKL
Subjt:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

XP_004133876.1 acyl-coenzyme A thioesterase 13 [Cucumis sativus]1.80e-122100Show/hide
Query:  MANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVA
        MANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVA
Subjt:  MANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVA

Query:  ELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        ELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
Subjt:  ELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

XP_008438081.1 PREDICTED: acyl-coenzyme A thioesterase 13 [Cucumis melo]2.27e-10386.11Show/hide
Query:  ANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAE
        ++SSSSS IPSLIF SPTIQIK +SE++L  TIQMFN LTGSG IPDDCDTKAFYSHIT GH+RQL RERGRLTYLLCVKPAV+N+YG+LHGGFVA  AE
Subjt:  ANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAE

Query:  LVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
         +SIACARTVVGEDKKLFIGELSISYLSGAPENAEV+V+ASVLRSGRSLSVVEVEFKLQKTGKLVYTAR TLYNMPMAKL
Subjt:  LVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

XP_038892661.1 uncharacterized protein LOC120081650 isoform X1 [Benincasa hispida]2.15e-9180.11Show/hide
Query:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI
        SSS IP LI  SPTIQIKDMSE++L GTI M N LTGSG IPDDC+TK+FYS IT GH+RQL  ERG LTYLL VKPAV+N+YGFLHGGFVA  AE +SI
Subjt:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI

Query:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        ACARTVVG DK+LFIGELSIS+LSGAP NAEV+V+ASVLRSGRSLSVV VEF+LQKTGKLVYTAR TLYNMPMAKL
Subjt:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

XP_038892740.1 uncharacterized protein LOC120081650 isoform X2 [Benincasa hispida]1.11e-8879.55Show/hide
Query:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI
        SSS IP LI  SPTIQIKDMSE++L GTI M N LTGSG IPDDC+TK+FYS IT GH+RQL  ERG LTYLL VKPA  N+YGFLHGGFVA  AE +SI
Subjt:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI

Query:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        ACARTVVG DK+LFIGELSIS+LSGAP NAEV+V+ASVLRSGRSLSVV VEF+LQKTGKLVYTAR TLYNMPMAKL
Subjt:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

TrEMBL top hitse value%identityAlignment
A0A0A0L3N5 4HBT domain-containing protein8.72e-123100Show/hide
Query:  MANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVA
        MANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVA
Subjt:  MANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVA

Query:  ELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        ELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
Subjt:  ELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

A0A1S3AVH8 acyl-coenzyme A thioesterase 131.10e-10386.11Show/hide
Query:  ANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAE
        ++SSSSS IPSLIF SPTIQIK +SE++L  TIQMFN LTGSG IPDDCDTKAFYSHIT GH+RQL RERGRLTYLLCVKPAV+N+YG+LHGGFVA  AE
Subjt:  ANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAE

Query:  LVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
         +SIACARTVVGEDKKLFIGELSISYLSGAPENAEV+V+ASVLRSGRSLSVVEVEFKLQKTGKLVYTAR TLYNMPMAKL
Subjt:  LVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

A0A5A7U3Z9 Acyl-coenzyme A thioesterase 131.10e-10386.11Show/hide
Query:  ANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAE
        ++SSSSS IPSLIF SPTIQIK +SE++L  TIQMFN LTGSG IPDDCDTKAFYSHIT GH+RQL RERGRLTYLLCVKPAV+N+YG+LHGGFVA  AE
Subjt:  ANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAE

Query:  LVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
         +SIACARTVVGEDKKLFIGELSISYLSGAPENAEV+V+ASVLRSGRSLSVVEVEFKLQKTGKLVYTAR TLYNMPMAKL
Subjt:  LVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

A0A6J1EC92 acyl-coenzyme A thioesterase 13-like6.37e-8674.43Show/hide
Query:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI
        SSS  PSLIF SPTIQIKD+SE++L GTI++ N L GSG IPDDC+TK FYS I  GH+RQ   ERGRLTYLL VKPAV+N YGFLHGGFVA  AE  SI
Subjt:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI

Query:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        ACARTV+ EDK+LF+GELSISYLSGAP NAEVI++AS+LRSG+ L+VV ++F+LQKTGKLVYTAR TLYNMPMAKL
Subjt:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

A0A6J1IR82 uncharacterized protein LOC1114792735.55e-8573.86Show/hide
Query:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI
        SSS  PSLIF SPTIQIKDMSE++L GTI++ N L+GSG IPDDC+TK FYS I  GH+ Q   ERGRLTYLL VKPAV+N YGFLHGGFVA  AE  SI
Subjt:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI

Query:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        ACARTV+ EDK+LF+GELSISYLSGAP NAEVI++AS+LRSG+ L+VV ++F+LQKTGKL+YTAR TLYNMPMAKL
Subjt:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL

SwissProt top hitse value%identityAlignment
P34419 Putative esterase F42H10.66.4e-0626.28Show/hide
Query:  IKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIG
        I+  SE+ L   +++FN++ GS            ++ +    V  +   + +L   + V+    N  G LHGG  AT+ ++++ A A  V  +DK +   
Subjt:  IKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIG

Query:  ELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMP
        EL++SYL        + + A VL+ GR+++  + EF+ +  GK+    + TL  +P
Subjt:  ELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMP

Q5R833 Acyl-coenzyme A thioesterase 131.6e-0425.62Show/hide
Query:  TKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLS
        TKA       G +  +    G++   + V+    N  G LHGG  AT+ + +S             + + +++I+Y+S A    ++++ A VL+ G++L+
Subjt:  TKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLS

Query:  VVEVEFKLQKTGKLVYTARFT
           V+   + TGKL+   R T
Subjt:  VVEVEFKLQKTGKLVYTARFT

Q9CQR4 Acyl-coenzyme A thioesterase 133.5e-0428.28Show/hide
Query:  LLC---VKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFT
        L+C   V+    N  G LHGG  AT+ + +S             + + +++I+Y+S A    E+++ A +L+ G++L+   V+   + TGKL+   R T
Subjt:  LLC---VKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFT

Q9NPJ3 Acyl-coenzyme A thioesterase 131.6e-0425.62Show/hide
Query:  TKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLS
        TKA       G +  +    G++   + V+    N  G LHGG  AT+ + +S             + + +++I+Y+S A    ++++ A VL+ G++L+
Subjt:  TKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLS

Query:  VVEVEFKLQKTGKLVYTARFT
           V+   + TGKL+   R T
Subjt:  VVEVEFKLQKTGKLVYTARFT

Arabidopsis top hitse value%identityAlignment
AT1G04290.1 Thioesterase superfamily protein1.0e-1133.33Show/hide
Query:  ITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFK
        +TNG    L  E GR+   + + P + N   FLHGG  AT+ +L+  A   T       + + E+++SYL  A  + E+ +E+  LR G++++VV VE +
Subjt:  ITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFK

Query:  LQKTGKLVYTARFTLYNMPMAKL
         + TGK++   R T Y  P + L
Subjt:  LQKTGKLVYTARFTLYNMPMAKL

AT3G61200.1 Thioesterase superfamily protein3.8e-3040.91Show/hide
Query:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI
        SS+PI      S T  +  + + N +  +  F +        +D  +   +S +   + R L   RGR++  + V P ++N +  LHGG VA++AE V++
Subjt:  SSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSI

Query:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL
        AC +TVV EDK LFIGELS+SYLS AP ++E++VE +V+R+GR+LSVV VEFK+++T K+ Y +R T Y+ P++KL
Subjt:  ACARTVVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGAATTCTTCTTCTTCTTCGCCAATCCCTTCCTTAATCTTTGTGTCGCCGACGATTCAGATAAAGGATATGTCTGAACAAAATTTAATCGGAACTATTCAAATGTT
CAATGAATTGACCGGCTCCGGCGCAATTCCGGACGATTGCGACACCAAGGCCTTTTATTCCCACATCACTAACGGTCATGTCCGCCAGCTCCACCGTGAACGAGGCCGTC
TCACCTACCTCCTTTGCGTCAAACCTGCTGTAGCGAATGTTTATGGGTTTTTACATGGAGGATTTGTTGCTACGGTTGCGGAGCTCGTATCAATAGCTTGTGCCAGAACT
GTCGTGGGTGAGGATAAGAAATTATTTATTGGGGAACTGAGCATTTCTTATCTCTCTGGTGCTCCGGAAAATGCAGAGGTTATAGTAGAAGCTTCTGTTTTGAGGAGTGG
AAGAAGTTTGAGTGTGGTGGAAGTAGAGTTTAAACTTCAAAAGACAGGTAAGTTGGTGTACACAGCTCGTTTTACCCTTTATAACATGCCAATGGCAAAGCTATAG
mRNA sequenceShow/hide mRNA sequence
ACGAAAACTAATTTTGGTAGCATTTGACCTAAAGGAAGAAGCCATTATCCGCTATTAACTTTTCGTACGAAAATCGAGTGGCAACATAGAAGGCAGTTGAGAGGATCACC
AATGGCGAATTCTTCTTCTTCTTCGCCAATCCCTTCCTTAATCTTTGTGTCGCCGACGATTCAGATAAAGGATATGTCTGAACAAAATTTAATCGGAACTATTCAAATGT
TCAATGAATTGACCGGCTCCGGCGCAATTCCGGACGATTGCGACACCAAGGCCTTTTATTCCCACATCACTAACGGTCATGTCCGCCAGCTCCACCGTGAACGAGGCCGT
CTCACCTACCTCCTTTGCGTCAAACCTGCTGTAGCGAATGTTTATGGGTTTTTACATGGAGGATTTGTTGCTACGGTTGCGGAGCTCGTATCAATAGCTTGTGCCAGAAC
TGTCGTGGGTGAGGATAAGAAATTATTTATTGGGGAACTGAGCATTTCTTATCTCTCTGGTGCTCCGGAAAATGCAGAGGTTATAGTAGAAGCTTCTGTTTTGAGGAGTG
GAAGAAGTTTGAGTGTGGTGGAAGTAGAGTTTAAACTTCAAAAGACAGGTAAGTTGGTGTACACAGCTCGTTTTACCCTTTATAACATGCCAATGGCAAAGCTATAGAAA
TCCTTGGTTCGTTCTACCTAAGATCAAAATTTGTCAGCAACCTAAATAAAAACCCCAATGCTTCGAGTCGAAGAATCGTGTTGCTCAGTGTAATGTTCAAAAGAGTAGGG
AATGTGTATGGATTACACACTTGATTATCCTTGTATACTATATATATATATATTTGCAAATTATAGAAAATAGTTCAGTTTCTTGCTTCAATATTTTGTATAGTCACGTT
CATGTATGGATTAGATTAGAATCTTTACTGTCATTTTGTTTTAGTTTTTTAATAGTTAGTAAAGTTTTCGAACATTTTATTTTGCTAGATAAAAACATACATTGATGTTT
ACATAATTGAATTAAATATACCGTTCCTTCTTTTTCTTTTTTTTCTTTTTAGTTTCCTCCTCTCTTCGTCTTCTCATTTCTGTAATTGCCTTTTCGTGTGTTTAGAGAGA
AACACAAAGAGGCGAAGATGGCTGGCTGGGTTATAGGTATTGAGTATCGAGATTTGACAAAATTGCTAATTTCGTACATGTTAATTTTAAAAATATGCTTAAAAAAAAGA
CAAACAAGTAACGAGAAGCAAGAATGAGTAGCAAGATTTTGATAGAAAAATGTGTTTTTAGATAGAAACATTTTTTTAAAAAAAAGTTACAAATTTATTGATC
Protein sequenceShow/hide protein sequence
MANSSSSSPIPSLIFVSPTIQIKDMSEQNLIGTIQMFNELTGSGAIPDDCDTKAFYSHITNGHVRQLHRERGRLTYLLCVKPAVANVYGFLHGGFVATVAELVSIACART
VVGEDKKLFIGELSISYLSGAPENAEVIVEASVLRSGRSLSVVEVEFKLQKTGKLVYTARFTLYNMPMAKL