; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmaCh09G009010 (gene) of Cucurbita maxima (Rimu) v1.1 genome

Gene IDCmaCh09G009010
OrganismCucurbita maxima Rimu (Cucurbita maxima (Rimu) v1.1)
DescriptionUnknown protein
Genome locationCma_Chr09:4465669..4466970
RNA-Seq ExpressionCmaCh09G009010
SyntenyCmaCh09G009010
Gene Ontology termsGO:0016021 - integral component of membrane (cellular component)
InterPro domainsIPR040411 - Uncharacterized protein At5g23160-like


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6591997.1 hypothetical protein SDJN03_14343, partial [Cucurbita argyrosperma subsp. sororia]9.1e-12592.49Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
        MESIVVTKSKKRNKLFPCFRAAASGSPVGH AP+EQVFPF TVRDNVL VD GDEDSSRWKKKGGRGAWSRAVRAVIFG SLAKKI KRKAK YQNSKES
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES

Query:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
        QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSV 
Subjt:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS

Query:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        +LC++RWRFGF SPDDKAS  AM SGEYNDI++MEEFLK+DRLAARNSTLRID
Subjt:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

KAG7024872.1 hypothetical protein SDJN02_13691 [Cucurbita argyrosperma subsp. argyrosperma]2.6e-12492.09Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
        MESIVVTKSKKRNKLFPCFRAAASGSPVGH AP++QVFPF TVRDNVL VD GDEDSSRWKKKGGRGAWSRAVRAVIFG SLAKKI KRKAK YQNSKES
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES

Query:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
        QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSV 
Subjt:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS

Query:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        +LC++RWRFGF SPDDKAS  AM SGEYNDI++MEEFLK+DRLAARNSTLRID
Subjt:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

XP_022936449.1 uncharacterized protein LOC111443063 [Cucurbita moschata]5.0e-12391.3Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
        MESIVVTKSKKRNKLFPCFRAAASGSPVGH AP+EQVFPF TVRDNVL VD GDEDSSRWKKKGGRGAWSRA+RAVIFG SLAKKI KRKAK YQNSKES
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES

Query:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
        QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSS SFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSV 
Subjt:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS

Query:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        +LC +RWRF F SPDDKAS  AM SGEYNDI++MEEFLK+DRLAARNSTLRID
Subjt:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

XP_022976567.1 uncharacterized protein LOC111476924 [Cucurbita maxima]3.0e-136100Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
        MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES

Query:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
        QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
Subjt:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS

Query:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
Subjt:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

XP_023535127.1 uncharacterized protein LOC111796643 [Cucurbita pepo subsp. pepo]2.5e-12290.91Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
        MESIVVTKSKKRNKLFPCFRAAASGSPVGH AP+EQVFPF T RDNVL VD GDEDSSRWKKKGGRGAWSRAVRAVIFG SLAKKIGKRKAKQYQNSKES
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES

Query:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
        QRHLAP WFSSRSRSGSDLNYRNYSTRS EPFSSSSFYSSSPSSTEKSD+SFRLYPTASNRLYTQI+ RKIFSGWFVLLVCLLSLVLWGKTGAIICTSV 
Subjt:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS

Query:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        +LC +RWRFGF SPDDKAS AAM S EYNDI++MEEFLK+DRLAARNSTLRID
Subjt:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

TrEMBL top hitse value%identityAlignment
A0A5A7SZR0 Uncharacterized protein2.9e-6059.62Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGS---PVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNS
        M+SI   KSKK+NKLFPCFRAAASGS    V      E VFPF TV +NV  + G D DS   KKKG  GA SRA +AV+FG SLAKKI KRKAK+ +NS
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGS---PVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNS

Query:  KE--SQRHLAPSWFSSRSRSGSD-LN-YRNYSTRSSE---PFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGK
        K   +Q H A S   +RS + SD LN Y N STRSS    PFSSSSF SSSP+S+E S+ SFR YP  SNRL  QIN RKI SGWFVLLVCLL+L+LWGK
Subjt:  KE--SQRHLAPSWFSSRSRSGSD-LN-YRNYSTRSSE---PFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGK

Query:  TGAIICTSVSILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDV-MEEFLKQDR-LAARNSTLRID
         GAI+CTSV ILC +R R G      K S  AM SGEY    + ME FLK++R  +A+NS LRID
Subjt:  TGAIICTSVSILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDV-MEEFLKQDR-LAARNSTLRID

A0A6J1CDH5 uncharacterized protein LOC1110105434.6e-5854.34Show/hide
Query:  KSKKRNKLFPCFRAAASGSPVG----HSAPKEQVFP-----------FTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAK
        KS+K+ KLFPCFR+ AS   V        P E+VFP           F +VR      D  DEDS   K+KG  GA SRA++AV+FG +LAKK+ K+KAK
Subjt:  KSKKRNKLFPCFRAAASGSPVG----HSAPKEQVFP-----------FTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAK

Query:  QYQNSKESQ--RHLAPSWFSSRSRSGSD--LNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLW
        Q QNSK+    RH + S  S RSR  SD   NY N+S+R+S PFSSSSF SSSPSS++ S+ SF +YPTA  RL++QIN R+I SGW + LVC+LSL+LW
Subjt:  QYQNSKESQ--RHLAPSWFSSRSRSGSD--LNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLW

Query:  GKTGAIICTSVSILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        GK  AI+CTSV ILCF   RFGF SP+ KAS AA+ SGE+N   V+E  L +DR AA+NS+LRID
Subjt:  GKTGAIICTSVSILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

A0A6J1F8B9 uncharacterized protein LOC1114430632.4e-12391.3Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
        MESIVVTKSKKRNKLFPCFRAAASGSPVGH AP+EQVFPF TVRDNVL VD GDEDSSRWKKKGGRGAWSRA+RAVIFG SLAKKI KRKAK YQNSKES
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES

Query:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
        QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSS SFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSV 
Subjt:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS

Query:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        +LC +RWRF F SPDDKAS  AM SGEYNDI++MEEFLK+DRLAARNSTLRID
Subjt:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

A0A6J1IG36 uncharacterized protein LOC1114769241.5e-136100Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
        MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKES

Query:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
        QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS
Subjt:  QRHLAPSWFSSRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVS

Query:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
Subjt:  ILCFHRWRFGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

A0A6J1IWY5 uncharacterized protein LOC111480657 isoform X15.5e-5957.04Show/hide
Query:  MESIVVTKSKKRNKLFPCFRAAASGSPV----GHSAPKEQVFPFTTVRD-------NVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKR
        M+S   TKSKK  K FPCFR+ AS SPV    G  A  EQVFPF  V +       NV   DG  + S R KK GG GA SRA++AV+FG SLAKKI KR
Subjt:  MESIVVTKSKKRNKLFPCFRAAASGSPV----GHSAPKEQVFPFTTVRD-------NVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKR

Query:  KAKQYQNS-KESQRHLAPSWFSSRSRSGSDLNYRNYST---RSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSL
        K KQ +NS +E+QR    S  SSRS   SD N+RN ST   R S PFSS+SF SSSP+S+E ++ SFR +PTASNRL+ QIN R     WFVLLVCLLSL
Subjt:  KAKQYQNS-KESQRHLAPSWFSSRSRSGSDLNYRNYST---RSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSL

Query:  VLWGKTGAIICTSVSILCFHRWR--FGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID
        VLW K GA +CTS+ ILCFH +R   GF SPDDKAS AAM S EY    ++E FL +DR A RNS   ID
Subjt:  VLWGKTGAIICTSVSILCFHRWR--FGFGSPDDKASMAAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAGTCCATCGTTGTAACCAAATCCAAGAAGAGGAACAAATTGTTTCCGTGTTTCCGAGCGGCGGCCTCCGGTAGCCCTGTCGGCCATAGCGCTCCAAAGGAGCAGGT
TTTTCCATTCACGACGGTGAGAGACAATGTGCTGCTGGTGGATGGAGGCGATGAAGATTCCAGTCGCTGGAAAAAGAAAGGCGGTCGCGGTGCTTGGTCGCGGGCGGTTA
GGGCTGTCATATTCGGAAATTCATTGGCAAAGAAGATTGGAAAAAGGAAAGCGAAACAATATCAAAATTCGAAGGAGTCTCAAAGGCATCTAGCTCCGTCCTGGTTTAGC
AGCAGATCAAGAAGTGGTTCAGATCTAAATTACCGCAACTATTCTACCCGTAGTTCTGAGCCATTTTCATCCTCCTCGTTCTACAGTTCGTCTCCTTCCTCCACGGAAAA
AAGCGACTCATCATTTCGACTCTATCCAACTGCATCGAATCGACTGTACACACAGATTAATTTCAGAAAAATCTTCAGCGGTTGGTTTGTGCTACTGGTATGTCTTCTAA
GCTTGGTTTTGTGGGGGAAAACCGGAGCTATTATCTGCACTTCGGTTTCGATTCTCTGTTTCCACCGCTGGAGGTTCGGATTCGGGTCACCGGACGACAAGGCCAGTATG
GCGGCGATGGGTTCCGGCGAATACAATGACATAGACGTCATGGAAGAATTTCTGAAGCAAGACCGTTTAGCTGCTCGGAATTCAACCTTACGCATTGATTGA
mRNA sequenceShow/hide mRNA sequence
GCTCCAAATCTCGAACGCCATCCACTCGTCTCCTCCATGAACACAACACCAACTGTTCTTCAAGTTCAGATTCTCATTCTCAAATCCATTACACTTTCTAGCCTCCAAAA
TGCCTTGCTAAATCCTCGCAAACTGCACAGAGATTCGAGTTTTGAGTTTTATGTCAAATGGAGTCCATCGTTGTAACCAAATCCAAGAAGAGGAACAAATTGTTTCCGTG
TTTCCGAGCGGCGGCCTCCGGTAGCCCTGTCGGCCATAGCGCTCCAAAGGAGCAGGTTTTTCCATTCACGACGGTGAGAGACAATGTGCTGCTGGTGGATGGAGGCGATG
AAGATTCCAGTCGCTGGAAAAAGAAAGGCGGTCGCGGTGCTTGGTCGCGGGCGGTTAGGGCTGTCATATTCGGAAATTCATTGGCAAAGAAGATTGGAAAAAGGAAAGCG
AAACAATATCAAAATTCGAAGGAGTCTCAAAGGCATCTAGCTCCGTCCTGGTTTAGCAGCAGATCAAGAAGTGGTTCAGATCTAAATTACCGCAACTATTCTACCCGTAG
TTCTGAGCCATTTTCATCCTCCTCGTTCTACAGTTCGTCTCCTTCCTCCACGGAAAAAAGCGACTCATCATTTCGACTCTATCCAACTGCATCGAATCGACTGTACACAC
AGATTAATTTCAGAAAAATCTTCAGCGGTTGGTTTGTGCTACTGGTATGTCTTCTAAGCTTGGTTTTGTGGGGGAAAACCGGAGCTATTATCTGCACTTCGGTTTCGATT
CTCTGTTTCCACCGCTGGAGGTTCGGATTCGGGTCACCGGACGACAAGGCCAGTATGGCGGCGATGGGTTCCGGCGAATACAATGACATAGACGTCATGGAAGAATTTCT
GAAGCAAGACCGTTTAGCTGCTCGGAATTCAACCTTACGCATTGATTGATCTATTACAGCGAAAGGGCGCCAATAAGGTTCGAAATGGCGTTTCAAAGCCGATTTTTGCA
TTTTTCATTACAAATTTGAAAAACGTCATTGTCGATTTTGTTCATCACAGACGTTAACAAAAAATTAATTAAATAAAAACTACAAAACTTAATTTGTACAATTATTACAT
TAATTTTTTTCTTTCTCACAGAAAATCGCAATGTAATTATGTTTAGTAGGGGG
Protein sequenceShow/hide protein sequence
MESIVVTKSKKRNKLFPCFRAAASGSPVGHSAPKEQVFPFTTVRDNVLLVDGGDEDSSRWKKKGGRGAWSRAVRAVIFGNSLAKKIGKRKAKQYQNSKESQRHLAPSWFS
SRSRSGSDLNYRNYSTRSSEPFSSSSFYSSSPSSTEKSDSSFRLYPTASNRLYTQINFRKIFSGWFVLLVCLLSLVLWGKTGAIICTSVSILCFHRWRFGFGSPDDKASM
AAMGSGEYNDIDVMEEFLKQDRLAARNSTLRID