; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CSPI03G08200 (gene) of Cucumber (PI 183967) v1 genome

Gene IDCSPI03G08200
OrganismCucumis sativus L. var. sativus cv. PI 183967 (Cucumber (PI 183967) v1)
Descriptionprotein CURVATURE THYLAKOID 1A, chloroplastic
Genome locationChr3:6969506..6972280
RNA-Seq ExpressionCSPI03G08200
SyntenyCSPI03G08200
Gene Ontology termsGO:0090391 - granum assembly (biological process)
GO:0097753 - membrane bending (biological process)
GO:0009515 - granal stacked thylakoid (cellular component)
GO:0009535 - chloroplast thylakoid membrane (cellular component)
GO:0016021 - integral component of membrane (cellular component)
GO:0004812 - aminoacyl-tRNA ligase activity (molecular function)
InterPro domainsIPR025564 - Cyanobacterial aminoacyl-tRNA synthetase, CAAD domain
IPR033344 - Protein CURVATURE THYLAKOID 1


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004133828.1 protein CURVATURE THYLAKOID 1A, chloroplastic [Cucumis sativus]2.7e-77100Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

XP_008437946.1 PREDICTED: protein CURVATURE THYLAKOID 1A, chloroplastic [Cucumis melo]2.4e-7396.34Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAASQPTR SVLPLLPPR GSPSSFSTSLK SL+SRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAG E
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

XP_022974634.1 protein CURVATURE THYLAKOID 1A, chloroplastic-like [Cucurbita maxima]8.4e-7193.9Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAA QPTR S +PLLPPRFGSP +F TSLK SLESRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGA+NSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

XP_023539167.1 protein CURVATURE THYLAKOID 1A, chloroplastic-like [Cucurbita pepo subsp. pepo]1.9e-7093.9Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAA QPTR S +PLLPPR GSP SF TSLK SLESRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGA+NSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

XP_038876984.1 protein CURVATURE THYLAKOID 1A, chloroplastic [Benincasa hispida]1.2e-7296.95Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAASQPTR SVLPLLPPRFGSP SFSTSLKFS ESRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAG E
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

TrEMBL top hitse value%identityAlignment
A0A0A0L603 CAAD domain-containing protein1.3e-77100Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

A0A1S3AVS8 protein CURVATURE THYLAKOID 1A, chloroplastic1.1e-7396.34Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAASQPTR SVLPLLPPR GSPSSFSTSLK SL+SRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAG E
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

A0A5D3D097 Protein CURVATURE THYLAKOID 1A1.1e-7396.34Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAASQPTR SVLPLLPPR GSPSSFSTSLK SL+SRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAG E
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

A0A6J1II67 protein CURVATURE THYLAKOID 1A, chloroplastic-like4.1e-7193.9Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAA QPTR S +PLLPPRFGSP +F TSLK SLESRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGA+NSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

E5GCH0 CAAD domain-containing protein1.1e-7396.34Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
        MAATASPTAATAVLRPSLAASQPTR SVLPLLPPR GSPSSFSTSLK SL+SRRS LLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGA

Query:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAG E
Subjt:  IVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

SwissProt top hitse value%identityAlignment
O04616 Protein CURVATURE THYLAKOID 1A, chloroplastic1.0e-4766.87Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLES--RRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGG
        MA + + +++ AV+ P + A   TR S +P LPPR    SSF+  LK    +  ++  LL+TRA SSEE+S+ D +EL TDLKEKWD LENKSTVL+YGG
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLES--RRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGG

Query:  GAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        GAIVAVWLSSI+VGAINSVPLLPK++ELVGLGYTGWFVYRYLLFKSSRKELA+DIE+LKKKIAG+E
Subjt:  GAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

Q119Z5 Glutamate--tRNA ligase3.6e-0842.86Show/hide
Query:  LYGGGAIVAVWLS--SILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAG
        L+G  A+V +  +  ++++ A++ +P+L  I EL+G+ Y  WFVYRYLL +S+R+EL D IE +K++I G
Subjt:  LYGGGAIVAVWLS--SILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAG

Q8LCA1 Protein CURVATURE THYLAKOID 1B, chloroplastic4.9e-1329.8Show/hide
Query:  SLAASQPTRLSVLPLLP----PRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVG
        S +AS P+ +S LP LP     R    +++   +  ++ +R +  +    +++ E+   +  E+    +E W+ +++K  +       +VA+W S+ ++ 
Subjt:  SLAASQPTRLSVLPLLP----PRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVG

Query:  AINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGA
        AI+ +PL+P +LELVG+GYTGWF Y+ L+FK  R+ L + +++  K I G+
Subjt:  AINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGA

Q8LDD3 Protein CURVATURE THYLAKOID 1D, chloroplastic2.1e-1640.32Show/hide
Query:  KFSLESRRSFLL--QTRASSSEESSAAD----ASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYL
        +F +E R   ++  + + S+SE   A D    A E   D+K   D      ++LLYG GAIVA++L+S +V ++ ++PL PK++E+VGLGYT WF  RYL
Subjt:  KFSLESRRSFLL--QTRASSSEESSAAD----ASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYL

Query:  LFKSSRKELADDIEALKKKIAGAE
        LFK +R+EL   +  +KK++ G++
Subjt:  LFKSSRKELADDIEALKKKIAGAE

Q9M812 Protein CURVATURE THYLAKOID 1C, chloroplastic2.1e-0830.14Show/hide
Query:  PSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVGAIN
        P L   + + L+ +  LP  F      +     SL    S +     +S E S ++   ++ + ++  WD  E++  ++  G   IVA+W S  L+ AI+
Subjt:  PSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVGAIN

Query:  SVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIA
         +P++    ELVG+ ++ WF YRYLLFK  R+EL+   + +KK +A
Subjt:  SVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIA

Arabidopsis top hitse value%identityAlignment
AT2G46820.1 photosystem I P subunit3.5e-1429.8Show/hide
Query:  SLAASQPTRLSVLPLLP----PRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVG
        S +AS P+ +S LP LP     R    +++   +  ++ +R +  +    +++ E+   +  E+    +E W+ +++K  +       +VA+W S+ ++ 
Subjt:  SLAASQPTRLSVLPLLP----PRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVG

Query:  AINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGA
        AI+ +PL+P +LELVG+GYTGWF Y+ L+FK  R+ L + +++  K I G+
Subjt:  AINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGA

AT2G46820.2 photosystem I P subunit3.5e-1429.8Show/hide
Query:  SLAASQPTRLSVLPLLP----PRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVG
        S +AS P+ +S LP LP     R    +++   +  ++ +R +  +    +++ E+   +  E+    +E W+ +++K  +       +VA+W S+ ++ 
Subjt:  SLAASQPTRLSVLPLLP----PRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVG

Query:  AINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGA
        AI+ +PL+P +LELVG+GYTGWF Y+ L+FK  R+ L + +++  K I G+
Subjt:  AINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGA

AT4G01150.1 unknown protein7.4e-4966.87Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLES--RRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGG
        MA + + +++ AV+ P + A   TR S +P LPPR    SSF+  LK    +  ++  LL+TRA SSEE+S+ D +EL TDLKEKWD LENKSTVL+YGG
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLES--RRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGG

Query:  GAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE
        GAIVAVWLSSI+VGAINSVPLLPK++ELVGLGYTGWFVYRYLLFKSSRKELA+DIE+LKKKIAG+E
Subjt:  GAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE

AT4G01150.2 unknown protein6.3e-2458.2Show/hide
Query:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLES--RRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGG
        MA + + +++ AV+ P + A   TR S +P LPPR    SSF+  LK    +  ++  LL+TRA SSEE+S+ D +EL TDLKEKWD LENKSTVL+YGG
Subjt:  MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLES--RRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGG

Query:  GAIVAVWLSSILVGAINSVPLL
        GAIVAVWLSSI+VGAINSVPL+
Subjt:  GAIVAVWLSSILVGAINSVPLL

AT4G38100.1 unknown protein1.5e-1740.32Show/hide
Query:  KFSLESRRSFLL--QTRASSSEESSAAD----ASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYL
        +F +E R   ++  + + S+SE   A D    A E   D+K   D      ++LLYG GAIVA++L+S +V ++ ++PL PK++E+VGLGYT WF  RYL
Subjt:  KFSLESRRSFLL--QTRASSSEESSAAD----ASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSILVGAINSVPLLPKILELVGLGYTGWFVYRYL

Query:  LFKSSRKELADDIEALKKKIAGAE
        LFK +R+EL   +  +KK++ G++
Subjt:  LFKSSRKELADDIEALKKKIAGAE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCAGCCACGGCCTCCCCTACAGCGGCCACCGCCGTTCTGAGACCTTCTCTGGCTGCTTCTCAACCCACTCGCCTCTCCGTTTTACCGCTCCTTCCCCCTCGATTCGG
CTCTCCGTCTTCCTTCTCCACTTCCCTCAAATTCTCGTTAGAGTCACGTAGATCGTTTCTGCTTCAAACCCGAGCCTCATCTTCAGAAGAATCATCTGCTGCTGATGCAT
CTGAGCTCTTCACAGACTTGAAAGAAAAGTGGGATGCCCTTGAGAACAAATCCACAGTACTTCTCTACGGAGGCGGGGCAATTGTTGCAGTTTGGCTTTCTTCAATTCTT
GTTGGTGCAATCAACTCTGTTCCATTGCTTCCGAAGATACTGGAGTTGGTAGGGCTTGGATATACAGGGTGGTTCGTGTACCGATATCTACTCTTCAAGTCAAGCAGAAA
GGAACTAGCTGATGACATTGAAGCATTGAAGAAGAAGATTGCTGGAGCGGAATGA
mRNA sequenceShow/hide mRNA sequence
AAAAAAGTATTGGCTAAAATTTCATAAGAAAAGAAAAGAAAAGAAAATAAAAAGGTGTATTGGCTAACAAAAACCCAATTCCATTGGGGGGAAGAAAATTTGAGTCCTCA
AAAAAGGATTTCAGATAGGGAACTAACCAATCAAAACGAAGGATGTCTCCACGTGTCGCCACAAGAGGCCATCTTCCCAAAATGTGATCGCGGATAAACAAGCCATTTCT
GAGCATAGAAAATGGTGAAATTTAACAAAAAAAATCTCTGCAAAGTCATCACCTACAGCTGCTCTTTGACGGCCACTTGATTCACTATTTCCCTCTCTTTCCGGCGCCGA
TTCCAGTGTGGTTGAACTTTCTTCGAAGAAATGGCAGCCACGGCCTCCCCTACAGCGGCCACCGCCGTTCTGAGACCTTCTCTGGCTGCTTCTCAACCCACTCGCCTCTC
CGTTTTACCGCTCCTTCCCCCTCGATTCGGCTCTCCGTCTTCCTTCTCCACTTCCCTCAAATTCTCGTTAGAGTCACGTAGATCGTTTCTGCTTCAAACCCGAGCCTCAT
CTTCAGAAGAATCATCTGCTGCTGATGCATCTGAGCTCTTCACAGACTTGAAAGAAAAGTGGGATGCCCTTGAGAACAAATCCACAGTACTTCTCTACGGAGGCGGGGCA
ATTGTTGCAGTTTGGCTTTCTTCAATTCTTGTTGGTGCAATCAACTCTGTTCCATTGCTTCCGAAGATACTGGAGTTGGTAGGGCTTGGATATACAGGGTGGTTCGTGTA
CCGATATCTACTCTTCAAGTCAAGCAGAAAGGAACTAGCTGATGACATTGAAGCATTGAAGAAGAAGATTGCTGGAGCGGAATGAATAAGATGGGTGTAATAGGTCACTA
TGTTCGACATGCTTAGTTCCTCTTATTATCATTTTGTACTCTATTCTCTTTCGTTTATAAGAGGTAATCTAAATCATGTAATGTGGAATAGGTTTTGCTTTAATCCCTGT
AACTCATGTTCCCTTTCATTGTATCATTGTAATAAGATTTGTTAAGTTCATTTATGGGAAACCCCCCCTTTCTCAAAATCTACTTCTTCCTTCATCACAAAATGGTGAAA
TTTATTTTGAAGTTTTAATTATCCAATCCCCAAAATTTAAGAGCAACGA
Protein sequenceShow/hide protein sequence
MAATASPTAATAVLRPSLAASQPTRLSVLPLLPPRFGSPSSFSTSLKFSLESRRSFLLQTRASSSEESSAADASELFTDLKEKWDALENKSTVLLYGGGAIVAVWLSSIL
VGAINSVPLLPKILELVGLGYTGWFVYRYLLFKSSRKELADDIEALKKKIAGAE