; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

ClCG09G019910 (gene) of Watermelon (Charleston Gray) v2.5 genome

Gene IDClCG09G019910
OrganismCitrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
DescriptionCASP-like protein
Genome locationCG_Chr09:36978481..36979210
RNA-Seq ExpressionClCG09G019910
SyntenyClCG09G019910
Gene Ontology termsGO:0005886 - plasma membrane (cellular component)
GO:0016021 - integral component of membrane (cellular component)
GO:0051539 - 4 iron, 4 sulfur cluster binding (molecular function)
InterPro domainsIPR006702 - Casparian strip membrane protein domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004142832.1 CASP-like protein 4D1 [Cucumis sativus]1.5e-5774.16Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSGSR+T LILRILTFVFLFISFFILITTSQTV+ +KL+FNDYH F                       RYMLATIIIG+VFNL+QIAF+LFNIVKN
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
        G+ TILFDFFGDKFLSYLLATG AAGFG+ VDLKK+D  DLF  FFDKAYAASTL+LFAFFC+AAVSILSSFALS RS
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

XP_008458890.1 PREDICTED: CASP-like protein 4D1 [Cucumis melo]4.8e-5673.6Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSGSRVT LILRILTFVFLFISFFILITTSQTV+ +KL+FN YH F                       RYMLATIIIG+VFNL+QIAF+LFNIVKN
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
        G+ TILFDFFGDKFLSYLLATG AAGFG+ VDLKK D  DLF +FFDKAYAAS L+LFAFFC+AAVSILSSFALS RS
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

XP_022992767.1 CASP-like protein 4D1 [Cucurbita maxima]1.2e-5470.62Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSG+RVTCLILRILTFVFLFISFF+L+TTSQTV+S K +FN++H +                       RY+LATIIIGIVFNL+QIAF+LFNIVK 
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
           TILFDFFGDKFLSYLLATGTAAGFGLSVDL+ +D  D FG+FFDKAYAAS L+LFAFFC+AAVSILSSFALS R
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR

XP_023549516.1 CASP-like protein 4D1 [Cucurbita pepo subsp. pepo]2.0e-5470.06Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSG+RVTCLILRILTFVFLFISFF+L+TTSQTV+S K +FN++H +                       RY+LATIIIGIVFNL+QIAF+LFNIVK 
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
           TILFDFFGDKFLSYLLATGTAAGFGLSVDL+ +D  D FG+FFDKAYAAS L+LFAFFC+AAVSI+SSFALS R
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR

XP_038877616.1 CASP-like protein 4D1 [Benincasa hispida]3.8e-6179.78Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSGSRVT LILRILTFVFLFISFFILITTSQTVQS KL+FN YHAF                       RYMLATIIIGIVFNL+QIAF+LFNIVKN
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
        GNSTILFDFFGDKFLSYLL TGTAAGFGLSVDLKKID  D FGSFFDKAYAASTL+LFAFFC+AAVSILSSFALS RS
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

TrEMBL top hitse value%identityAlignment
A0A0A0KU83 CASP-like protein7.3e-5874.16Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSGSR+T LILRILTFVFLFISFFILITTSQTV+ +KL+FNDYH F                       RYMLATIIIG+VFNL+QIAF+LFNIVKN
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
        G+ TILFDFFGDKFLSYLLATG AAGFG+ VDLKK+D  DLF  FFDKAYAASTL+LFAFFC+AAVSILSSFALS RS
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

A0A1S3C9H1 CASP-like protein2.3e-5673.6Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSGSRVT LILRILTFVFLFISFFILITTSQTV+ +KL+FN YH F                       RYMLATIIIG+VFNL+QIAF+LFNIVKN
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
        G+ TILFDFFGDKFLSYLLATG AAGFG+ VDLKK D  DLF +FFDKAYAAS L+LFAFFC+AAVSILSSFALS RS
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

A0A6J1C1S4 CASP-like protein1.1e-5369.1Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSGSRVTCLILRI+TFVFLFISFFIL+TTS+TV   +L+FN +HA+                       RY+LATIIIGI+ NL+QIAF+LFN VKN
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
        G+ TILFDFFGDKFLSYLLATG AAGFGL+VDL+  D  D +G FFDKAYAAS L+LFAFFCAAAVSILSSFALSNR+
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

A0A6J1FG26 CASP-like protein2.4e-5370.79Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        ME SS SRVTCL+LRILTFVFLFISFFILITTSQTVQS K +FND+H +                       RY+LATII+ IVFNL+QIAF+LFNIVKN
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKI-DESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
         N TILFDFFGDKFLSYLLAT TAAGFG+SVDL++  D  DLFG+FFDKAYAAS L+LFAFFC+AAVSILSSFALS R
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKI-DESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR

A0A6J1JQU5 CASP-like protein5.8e-5570.62Show/hide
Query:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN
        MENSSG+RVTCLILRILTFVFLFISFF+L+TTSQTV+S K +FN++H +                       RY+LATIIIGIVFNL+QIAF+LFNIVK 
Subjt:  MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
           TILFDFFGDKFLSYLLATGTAAGFGLSVDL+ +D  D FG+FFDKAYAAS L+LFAFFC+AAVSILSSFALS R
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR

SwissProt top hitse value%identityAlignment
A1XGB4 CASP-like protein PIMP11.8e-2139.08Show/hide
Query:  LILRILTFVFLFISFFILITTSQTVQS----FKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVK----NGNS
        LI+RILT + L ISF ++ T +QTV +     K+ F D++A+                       RY++AT+IIG+ + L+QIAF++  +       G  
Subjt:  LILRILTFVFLFISFFILITTSQTVQS----FKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVK----NGNS

Query:  TILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
         +LFDF+GDKF+SY L TG AA FG++ DLK+++ SD +  F + + AA++L L  FF A A SI SS+ L  R
Subjt:  TILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR

B9SXY8 CASP-like protein 4D14.3e-2340.33Show/hide
Query:  SSGSRVTCLILRILTFVFLFISFFILITTSQTVQ----SFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLF----
        S  SR+  LILRILTF+FL  S  IL T + T++      K++F D +A+                       RYMLATI+IG+ + ++QIAFTL+    
Subjt:  SSGSRVTCLILRILTFVFLFISFFILITTSQTVQ----SFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLF----

Query:  -NIVKNGNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKI-DESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFAL
         N + +G+  + FDFFGDK +SY+L TG AAGF  + D+K +   S  F +F +K YA+++L+L  F C A +S+ SS+AL
Subjt:  -NIVKNGNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKI-DESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFAL

C6T1Z6 CASP-like protein 4D13.6e-2239.56Show/hide
Query:  NSSGSRVTCLILRILTFVFLFISFFILITTSQT--VQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVK-
        +S+GSR   L+LR+LTFVFL I+  ++    QT      ++ FND +A+                       RYM++TIIIG  +NL+Q+A ++F +V  
Subjt:  NSSGSRVTCLILRILTFVFLFISFFILITTSQT--VQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVK-

Query:  ----NGNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
            +G+   LFDFFGDK +SYLL +G+AAGFG++V+L +   S+   SF DKA A+++L+L AF   A  S  +SFAL  +
Subjt:  ----NGNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR

Q56X75 CASP-like protein 4D21.5e-2039.46Show/hide
Query:  RVTCLILRILTFVFLFISFFILITTSQTVQS----FKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNI---VKN
        +V  L+LR+LT VFL I+  IL T S T+ S     K +F D +A+                       RYML+  +IG+V+ ++Q+ FT+      VKN
Subjt:  RVTCLILRILTFVFLFISFFILITTSQTVQS----FKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNI---VKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
          +  L DF+GDK +SYL+ATG+AAGFG++ DLK        +D +D    FF K YA+++L+LFAF C A +S+ SSFA++ R+
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

Q8GWD5 CASP-like protein 4D13.4e-2039.89Show/hide
Query:  RVTCLILRILTFVFLFISFFILITTSQTVQ----SFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTL--FNIVKNG
        R   L+LR+LT  FL I+  ++ T + T++    S KL FND +A+                       RYML+  +IG+V+ +VQ+  T+  F   K  
Subjt:  RVTCLILRILTFVFLFISFFILITTSQTVQ----SFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTL--FNIVKNG

Query:  NSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
          T  FDF+GDK +SYLLATG+AAGFG+S DLK       + D +D    FF K YA+++L+LFAF   A +S+ SS ALS R
Subjt:  NSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR

Arabidopsis top hitse value%identityAlignment
AT2G39518.1 Uncharacterised protein family (UPF0497)1.1e-2139.46Show/hide
Query:  RVTCLILRILTFVFLFISFFILITTSQTVQS----FKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNI---VKN
        +V  L+LR+LT VFL I+  IL T S T+ S     K +F D +A+                       RYML+  +IG+V+ ++Q+ FT+      VKN
Subjt:  RVTCLILRILTFVFLFISFFILITTSQTVQS----FKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNI---VKN

Query:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS
          +  L DF+GDK +SYL+ATG+AAGFG++ DLK        +D +D    FF K YA+++L+LFAF C A +S+ SSFA++ R+
Subjt:  GNSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS

AT2G39530.1 Uncharacterised protein family (UPF0497)2.4e-2139.89Show/hide
Query:  RVTCLILRILTFVFLFISFFILITTSQTVQ----SFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTL--FNIVKNG
        R   L+LR+LT  FL I+  ++ T + T++    S KL FND +A+                       RYML+  +IG+V+ +VQ+  T+  F   K  
Subjt:  RVTCLILRILTFVFLFISFFILITTSQTVQ----SFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTL--FNIVKNG

Query:  NSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR
          T  FDF+GDK +SYLLATG+AAGFG+S DLK       + D +D    FF K YA+++L+LFAF   A +S+ SS ALS R
Subjt:  NSTILFDFFGDKFLSYLLATGTAAGFGLSVDLK-------KIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAAAATTCAAGTGGTTCAAGGGTGACTTGTCTTATATTAAGAATACTAACTTTTGTGTTTCTTTTCATCTCCTTCTTCATTCTCATCACCACTTCCCAAACTGTTCA
ATCATTTAAGCTCAATTTCAATGATTATCATGCTTTTAGGTCCGGAAATTTGAACTATGGCATCTTAGGGTCGAGAGAACATGTCTTAACCAAACGAGTTATGATTAGGT
ATATGCTTGCTACTATTATTATCGGAATCGTATTCAACCTTGTGCAAATCGCATTTACCCTCTTTAACATCGTTAAAAATGGCAACAGTACTATATTATTCGATTTCTTT
GGCGACAAGTTTTTGTCATACCTTCTAGCAACAGGAACAGCAGCTGGATTTGGACTCTCAGTGGATTTGAAGAAGATAGACGAAAGTGATTTATTTGGATCATTCTTTGA
TAAGGCATATGCAGCATCAACTCTTGTTTTGTTTGCATTCTTTTGTGCTGCAGCTGTGTCTATTCTCTCTTCCTTTGCACTCTCCAACAGATCTTAA
mRNA sequenceShow/hide mRNA sequence
ATGGAAAATTCAAGTGGTTCAAGGGTGACTTGTCTTATATTAAGAATACTAACTTTTGTGTTTCTTTTCATCTCCTTCTTCATTCTCATCACCACTTCCCAAACTGTTCA
ATCATTTAAGCTCAATTTCAATGATTATCATGCTTTTAGGTCCGGAAATTTGAACTATGGCATCTTAGGGTCGAGAGAACATGTCTTAACCAAACGAGTTATGATTAGGT
ATATGCTTGCTACTATTATTATCGGAATCGTATTCAACCTTGTGCAAATCGCATTTACCCTCTTTAACATCGTTAAAAATGGCAACAGTACTATATTATTCGATTTCTTT
GGCGACAAGTTTTTGTCATACCTTCTAGCAACAGGAACAGCAGCTGGATTTGGACTCTCAGTGGATTTGAAGAAGATAGACGAAAGTGATTTATTTGGATCATTCTTTGA
TAAGGCATATGCAGCATCAACTCTTGTTTTGTTTGCATTCTTTTGTGCTGCAGCTGTGTCTATTCTCTCTTCCTTTGCACTCTCCAACAGATCTTAA
Protein sequenceShow/hide protein sequence
MENSSGSRVTCLILRILTFVFLFISFFILITTSQTVQSFKLNFNDYHAFRSGNLNYGILGSREHVLTKRVMIRYMLATIIIGIVFNLVQIAFTLFNIVKNGNSTILFDFF
GDKFLSYLLATGTAAGFGLSVDLKKIDESDLFGSFFDKAYAASTLVLFAFFCAAAVSILSSFALSNRS