; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh08G001380 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh08G001380
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
DescriptionDUF688 family protein
Genome locationCmo_Chr08:775145..776170
RNA-Seq ExpressionCmoCh08G001380
SyntenyCmoCh08G001380
Gene Ontology termsNA
InterPro domainsIPR007789 - Protein of unknown function DUF688


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6592927.1 hypothetical protein SDJN03_12403, partial [Cucurbita argyrosperma subsp. sororia]4.5e-10695.07Show/hide
Query:  MLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATT---TNTDTDTVTSPCLEL
        MLFIDPP EKAKKFLKAMECKGEETKPNSSL +LPLFSIPH AMDSPERSG LTPPIY+AVSVPF WEEEPGKPRFSNVATT   TNTDTDTVTSPCLEL
Subjt:  MLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATT---TNTDTDTVTSPCLEL

Query:  PPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLK
        PPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLK
Subjt:  PPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLK

Query:  KDV
        KDV
Subjt:  KDV

KAG7025335.1 hypothetical protein SDJN02_11830, partial [Cucurbita argyrosperma subsp. argyrosperma]2.6e-10695.54Show/hide
Query:  MLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATT--TNTDTDTVTSPCLELP
        MLFIDPP EKAKKFLKAMECKGEETKPNSSL +LPLFSIPH+AMDSPERSG LTPPIY+AVSVPF WEEEPGKPRFSNVATT  TNTDTDTVTSPCLELP
Subjt:  MLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATT--TNTDTDTVTSPCLELP

Query:  PRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKK
        PRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKK
Subjt:  PRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKK

Query:  DV
        DV
Subjt:  DV

XP_022960155.1 uncharacterized protein At4g00950-like isoform X1 [Cucurbita moschata]8.7e-102100Show/hide
Query:  MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM
        MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM
Subjt:  MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM

Query:  MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKKDV
        MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKKDV
Subjt:  MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKKDV

XP_023005080.1 uncharacterized protein LOC111498174 [Cucurbita maxima]2.6e-10695.59Show/hide
Query:  MSLEMLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLE
        MSLEMLFIDPP EKAKKFLKAMECKGEETKPNSSL RLPLFSIPH+AMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTN    TVTSPCLE
Subjt:  MSLEMLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLE

Query:  LPPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRL
        LPPRLLLMEKV RSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRP+FWVSVCEGLKHVVPSWRGKRL
Subjt:  LPPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRL

Query:  KKDV
        KKDV
Subjt:  KKDV

XP_023513857.1 uncharacterized protein LOC111778333 isoform X2 [Cucurbita pepo subsp. pepo]5.1e-11096.57Show/hide
Query:  MSLEMLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLE
        MS EMLFIDPP EKAK FLKAMECKGEETKPNSS+T+LPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNV TTTNTDTDTVTSPCLE
Subjt:  MSLEMLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLE

Query:  LPPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRL
        LPPRLLLMEKV RSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRL
Subjt:  LPPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRL

Query:  KKDV
        KKDV
Subjt:  KKDV

TrEMBL top hitse value%identityAlignment
A0A0A0KDR5 Uncharacterized protein1.8e-5261.08Show/hide
Query:  MECKGEETKPNSSLTRLPLFSIPHRA-MDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSE-GSSF
        MECK ++   NSS   LPLFSIPH + MDSP+ SG LTPPIY AVSVPF WEEEPGKPRFS   + +        SP LELPPRLL    V RSE  SSF
Subjt:  MECKGEETKPNSSLTRLPLFSIPHRA-MDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSE-GSSF

Query:  RMMGSDEMSSLFMKRRGWFGSWR------RSKRDE------VFPSLEWE------VEASRLRRNGSFSSLI-RTQIRPHFWVSVCEGLKHVVPSWRGKRL
        R    DE SSLFMK+RGWFGSWR      R KR++      VFPSLE E      VEASR RRNGSFSSL+  TQI+PHFW SVCEGLKH+VPSWR +R+
Subjt:  RMMGSDEMSSLFMKRRGWFGSWR------RSKRDE------VFPSLEWE------VEASRLRRNGSFSSLI-RTQIRPHFWVSVCEGLKHVVPSWRGKRL

Query:  KKD
        K++
Subjt:  KKD

A0A1S3CBE3 uncharacterized protein At4g009502.1e-5362.07Show/hide
Query:  MECKGEETKPNSSLTRLPLFSIPHRA-MDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSE-GSSF
        MECK ++   +SS   LPLFSIPH + MDSP+ SG LTPPIY+AVSVPFRWEEEPGKPRFS     T       TSP LELPPRLL    V RSE  SSF
Subjt:  MECKGEETKPNSSLTRLPLFSIPHRA-MDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSE-GSSF

Query:  RMMGSDEMSSLFMKRRGWFGSWR------RSKRDE------VFPSLEWE------VEASRLRRNGSFSSLI-RTQIRPHFWVSVCEGLKHVVPSWRGKRL
        R    DE SSLFMK+RGWFGSWR      R KR++      VFPSLE E      VEASR RRNGSFSSL+  TQI+PHFW SVCEGLKH+VPSWR ++L
Subjt:  RMMGSDEMSSLFMKRRGWFGSWR------RSKRDE------VFPSLEWE------VEASRLRRNGSFSSLI-RTQIRPHFWVSVCEGLKHVVPSWRGKRL

Query:  KKD
        K++
Subjt:  KKD

A0A6J1H6U8 uncharacterized protein At4g00950-like isoform X21.0e-8798.77Show/hide
Query:  MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM
        MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM
Subjt:  MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM

Query:  MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSV
        MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFW+ V
Subjt:  MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSV

A0A6J1H8B1 uncharacterized protein At4g00950-like isoform X14.2e-102100Show/hide
Query:  MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM
        MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM
Subjt:  MECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRM

Query:  MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKKDV
        MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKKDV
Subjt:  MGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKKDV

A0A6J1KTY4 uncharacterized protein LOC1114981741.3e-10695.59Show/hide
Query:  MSLEMLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLE
        MSLEMLFIDPP EKAKKFLKAMECKGEETKPNSSL RLPLFSIPH+AMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTN    TVTSPCLE
Subjt:  MSLEMLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLE

Query:  LPPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRL
        LPPRLLLMEKV RSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRP+FWVSVCEGLKHVVPSWRGKRL
Subjt:  LPPRLLLMEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRL

Query:  KKDV
        KKDV
Subjt:  KKDV

SwissProt top hitse value%identityAlignment
Q9M160 Uncharacterized protein At4g009504.9e-0735.35Show/hide
Query:  EETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAV--SVPFRWEEEPGKPRFSNVATTTNTDTDTVTS---------PCLELPPRLLLMEKVGRS
        +ET+   +LT + L  +P +       S +++ PI++++  SVPF WEEEPGKP+  + ++++++ +  +TS           LELPPRL L+EK G S
Subjt:  EETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAV--SVPFRWEEEPGKPRFSNVATTTNTDTDTVTS---------PCLELPPRLLLMEKVGRS

Arabidopsis top hitse value%identityAlignment
AT2G46535.1 unknown protein4.6e-0828.93Show/hide
Query:  SPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSP-CLELPPRLLL------MEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWR
        SP        PI+   SVPF WE++PGKP+              ++ P CL+LPPRLLL      M    R  G   R +       + ++    F S  
Subjt:  SPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSP-CLELPPRLLL------MEKVGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWR

Query:  RSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLK
        +   D +    E  ++  +  R+GS+      +   HFW S+C+GLK  +P W+ K+++
Subjt:  RSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLK

AT4G00950.1 Protein of unknown function (DUF688)3.5e-0835.35Show/hide
Query:  EETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAV--SVPFRWEEEPGKPRFSNVATTTNTDTDTVTS---------PCLELPPRLLLMEKVGRS
        +ET+   +LT + L  +P +       S +++ PI++++  SVPF WEEEPGKP+  + ++++++ +  +TS           LELPPRL L+EK G S
Subjt:  EETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAV--SVPFRWEEEPGKPRFSNVATTTNTDTDTVTS---------PCLELPPRLLLMEKVGRS

AT4G27810.1 unknown protein2.0e-1135.8Show/hide
Query:  RLPLFSIP-HRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSN----VATTTN--TDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRMMGSDEMSS
        +LPLFSIP +RA D+P   G  TPP+  A SVPF WEE PGKPR S+    +A+  N           CLELPPRL        S  +           S
Subjt:  RLPLFSIP-HRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSN----VATTTN--TDTDTVTSPCLELPPRLLLMEKVGRSEGSSFRMMGSDEMSS

Query:  LFMKRRGWFGSWRRSKRDEVFPSLEWE------VEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKR
        L + RR    S  R +      S   +      V+ SR+RR GS  +L  +  +  F   V +G K V+P WR ++
Subjt:  LFMKRRGWFGSWRRSKRDEVFPSLEWE------VEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKR

AT5G53030.1 unknown protein3.5e-0846.05Show/hide
Query:  NSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLL
        +S+  +LPLFS P   +      G  TPP+  A SVPF WEE PGKPR        N     V S  LELPPRL+L
Subjt:  NSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLL

AT5G53030.2 unknown protein3.5e-0846.05Show/hide
Query:  NSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLL
        +S+  +LPLFS P   +      G  TPP+  A SVPF WEE PGKPR        N     V S  LELPPRL+L
Subjt:  NSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLL


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGCCTAGAGATGCTCTTCATTGACCCTCCCACTGAAAAAGCCAAGAAATTCCTCAAGGCTATGGAGTGTAAAGGAGAGGAAACAAAGCCAAATTCTTCACTTACAAG
GCTACCTCTCTTTTCAATCCCACACCGAGCAATGGACTCGCCCGAACGCTCGGGGACGTTAACTCCGCCAATCTACGCCGCCGTCTCGGTCCCGTTTCGGTGGGAAGAAG
AGCCTGGCAAGCCTAGGTTTAGTAACGTTGCTACCACCACCAACACCGACACCGACACCGTCACGTCTCCGTGCCTAGAGCTACCTCCAAGGCTTTTGTTAATGGAGAAA
GTGGGAAGATCTGAGGGCTCTTCCTTTAGAATGATGGGGTCTGATGAGATGAGTTCTTTGTTCATGAAGAGAAGAGGTTGGTTTGGTTCATGGAGAAGAAGCAAAAGAGA
TGAAGTGTTTCCTTCCTTGGAATGGGAAGTGGAAGCTTCAAGGCTTAGAAGAAATGGGAGCTTTTCAAGCCTTATAAGAACTCAAATAAGGCCTCATTTTTGGGTAAGTG
TTTGTGAAGGTTTGAAGCATGTGGTTCCATCATGGAGAGGCAAAAGGCTAAAGAAAGACGTTTAG
mRNA sequenceShow/hide mRNA sequence
ATGATAATAATAGCGATGGATGAGCCTAGAGATGCTCTTCATTGACCCTCCCACTGAAAAAGCCAAGAAATTCCTCAAGGCTATGGAGTGTAAAGGAGAGGAAACAAAGC
CAAATTCTTCACTTACAAGGCTACCTCTCTTTTCAATCCCACACCGAGCAATGGACTCGCCCGAACGCTCGGGGACGTTAACTCCGCCAATCTACGCCGCCGTCTCGGTC
CCGTTTCGGTGGGAAGAAGAGCCTGGCAAGCCTAGGTTTAGTAACGTTGCTACCACCACCAACACCGACACCGACACCGTCACGTCTCCGTGCCTAGAGCTACCTCCAAG
GCTTTTGTTAATGGAGAAAGTGGGAAGATCTGAGGGCTCTTCCTTTAGAATGATGGGGTCTGATGAGATGAGTTCTTTGTTCATGAAGAGAAGAGGTTGGTTTGGTTCAT
GGAGAAGAAGCAAAAGAGATGAAGTGTTTCCTTCCTTGGAATGGGAAGTGGAAGCTTCAAGGCTTAGAAGAAATGGGAGCTTTTCAAGCCTTATAAGAACTCAAATAAGG
CCTCATTTTTGGGTAAGTGTTTGTGAAGGTTTGAAGCATGTGGTTCCATCATGGAGAGGCAAAAGGCTAAAGAAAGACGTTTAGCTCGATTTTCAAATGGTTTCAGTGGA
AGAACCGAAGCAAACTTGTAAATATATCTCGTTGATTTCACTGTGTTTTTCATTTTCTCGAGATGGGTCGGGAAGATTGAATCTTACGTTGTTTCAGAGGTACCAAATGT
GTTTTCAAACTAGTGTATCTTGTATCATTAACGGGTAAAAGTATATCGGTTAAGAATAAGGTAGTGTCTTGGTTACTATAGTTGATATTGTCTTCTTTTGAGCCATTCAC
GTGGTGCACGTGAGTCGAGATTGCATAACAGTGTTTGGATCGTAATGGGATTTAGTTTCTCGTAAGGTTATAATAG
Protein sequenceShow/hide protein sequence
MSLEMLFIDPPTEKAKKFLKAMECKGEETKPNSSLTRLPLFSIPHRAMDSPERSGTLTPPIYAAVSVPFRWEEEPGKPRFSNVATTTNTDTDTVTSPCLELPPRLLLMEK
VGRSEGSSFRMMGSDEMSSLFMKRRGWFGSWRRSKRDEVFPSLEWEVEASRLRRNGSFSSLIRTQIRPHFWVSVCEGLKHVVPSWRGKRLKKDV