; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CSPI06G10440 (gene) of Cucumber (PI 183967) v1 genome

Gene IDCSPI06G10440
OrganismCucumis sativus L. var. sativus cv. PI 183967 (Cucumber (PI 183967) v1)
Descriptionmitochondrial acidic protein mam33
Genome locationChr6:9106807..9111327
RNA-Seq ExpressionCSPI06G10440
SyntenyCSPI06G10440
Gene Ontology termsGO:0005759 - mitochondrial matrix (cellular component)
InterPro domainsIPR003428 - Mitochondrial glycoprotein
IPR036561 - Mitochondrial glycoprotein superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004139944.1 mitochondrial acidic protein mam33 [Cucumis sativus]4.3e-11299.52Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
        SKPGVSSLLQFDCGVSENGHG SPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI

Query:  AKGQSNEL
        AKGQSNEL
Subjt:  AKGQSNEL

XP_008448290.1 PREDICTED: uncharacterized protein LOC103490527 isoform X1 [Cucumis melo]1.9e-9188.14Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M R TQ+FRKARK F DL LL+ILQSEI HELSSTPCQNYENN++SS FTVEHDSLKSQDVVLRRK+DSGEEVVISALLGPLR GY+GAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ
        SKPGVSSLLQFDCGVSE+GHG SPF+LYNAYYL SSDCLGP VYRGPSFSSLDPRLQDALKE+LISRGVEE LTNFLLIHLHKKEQGQYLNWL+
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ

XP_022928687.1 uncharacterized protein LOC111435528 [Cucurbita moschata]7.3e-8881.25Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSSTP QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
        SKPGVSSLLQFDCGVSE+GHG SPF++YNAYYL SS CL PSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQ+VES I
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

XP_022967898.1 uncharacterized protein LOC111467274 [Cucurbita maxima]4.8e-8780.77Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSST  QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
        SKPGV+SLLQFDCGVSE+GHG SPF++YNAYYL SS CLGPSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQ+VES I
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

XP_023544221.1 uncharacterized protein LOC111803860 [Cucurbita pepo subsp. pepo]2.1e-8780.77Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSSTP QN+E   +SSDF VEHDS KS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
        SKPGVSSLLQFDCGVSE+GHG SPF++YNAYYL SS CL PSVYRGP FSSLDP LQ ALKEFLISRGVEE LT+FL+IHLHKKEQGQYLNWLQ+VES I
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

TrEMBL top hitse value%identityAlignment
A0A1S3BK83 uncharacterized protein LOC103490527 isoform X19.0e-9288.14Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M R TQ+FRKARK F DL LL+ILQSEI HELSSTPCQNYENN++SS FTVEHDSLKSQDVVLRRK+DSGEEVVISALLGPLR GY+GAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ
        SKPGVSSLLQFDCGVSE+GHG SPF+LYNAYYL SSDCLGP VYRGPSFSSLDPRLQDALKE+LISRGVEE LTNFLLIHLHKKEQGQYLNWL+
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ

A0A5A7V534 Mitochondrial acidic protein mam333.7e-6985.71Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M R TQ+FRKARK F DL LL+ILQSEI HELSSTPCQNYENN +SS FTVEHDSLKSQDVVLRRK+DSGEEVVISALLGPLR GY+GAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDP
        SKPGVSSLLQFDCGVSE+GHG SPF+LYNAYYL SSDCLGPSVYRGPSF +L P
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDP

A0A6J1DM07 mitochondrial acidic protein mam332.4e-8478.37Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEITHELSST  Q+ + +  S DF VEHDS KSQDVVLRRKL+SGEEV +SAL GPLR G EGAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
        SKPGV S+LQFDCGVSE+ HG SPF++YNAYYL SS  LG SVYRGP FSSLDPRLQDALK++LISRGVEE LTNFLL+H+HKKEQGQYLNWLQ++ES +
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI

Query:  AKGQSNEL
        AKGQ NEL
Subjt:  AKGQSNEL

A0A6J1EKM2 uncharacterized protein LOC1114355283.6e-8881.25Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSSTP QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
        SKPGVSSLLQFDCGVSE+GHG SPF++YNAYYL SS CL PSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQ+VES I
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

A0A6J1HWH3 uncharacterized protein LOC1114672742.3e-8780.77Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSST  QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI
        SKPGV+SLLQFDCGVSE+GHG SPF++YNAYYL SS CLGPSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQ+VES I
Subjt:  SKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

SwissProt top hitse value%identityAlignment
O94675 Mitochondrial acidic protein mam333.5e-0832Show/hide
Query:  EGAFPRDILMK-----ICVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGP----------SVYRGPSFSSLDPRLQDALKEFLISRGVEE
        E  FP + L +     I +SKPG  +L+ F+    ++G     F++ N Y+    D L              Y GPSF  LDP LQD    +L  R ++E
Subjt:  EGAFPRDILMK-----ICVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGP----------SVYRGPSFSSLDPRLQDALKEFLISRGVEE

Query:  RLTNFLLIHLHKKEQGQYLNWLQDV
         L++F++     KE  +Y+NWL+ V
Subjt:  RLTNFLLIHLHKKEQGQYLNWLQDV

P40513 Mitochondrial acidic protein MAM333.9e-0743.64Show/hide
Query:  VYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVE
        VY GP FS+LD  LQ++L+ +L SRGV E L +F+  +   KE  +Y++WL+ ++
Subjt:  VYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVE

Arabidopsis top hitse value%identityAlignment
AT2G41600.1 Mitochondrial glycoprotein family protein1.0e-2644.52Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVY
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y
Subjt:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVY

AT2G41600.2 Mitochondrial glycoprotein family protein5.9e-2743.79Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSS
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y    F S
Subjt:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSS

AT2G41600.3 Mitochondrial glycoprotein family protein1.1e-4647.78Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVES
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y    FS +DP+L  AL+++LIS+GV E LTNFLL HL+KKEQ QY+NWL+ +ES
Subjt:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVES

Query:  SIA
        +++
Subjt:  SIA

AT2G41600.4 Mitochondrial glycoprotein family protein1.0e-2644.52Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVY
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y
Subjt:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVY

AT2G41600.5 Mitochondrial glycoprotein family protein1.1e-4647.78Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVES
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y    FS +DP+L  AL+++LIS+GV E LTNFLL HL+KKEQ QY+NWL+ +ES
Subjt:  CVSKPGVSSLLQFDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVES

Query:  SIA
        +++
Subjt:  SIA


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGAGGGCTACTCAAATTTTTCGCAAAGCTCGGAAAGCCTTCCATGATCTCAACCTTCTCAAGATCTTGCAATCCGAGATAACCCACGAGCTTTCTTCAACCCCATG
TCAGAACTATGAGAACAATAGTACTTCCAGTGATTTCACTGTGGAACATGACTCGCTCAAGTCACAAGACGTGGTGTTGCGGCGAAAATTGGATTCCGGTGAGGAGGTTG
TGATTTCTGCTCTATTGGGTCCTCTCAGATTGGGATATGAAGGGGCTTTTCCGAGGGACATTTTGATGAAGATTTGTGTGAGTAAGCCTGGAGTTAGCTCTCTTTTGCAG
TTTGATTGTGGGGTTTCAGAGAACGGTCATGGCGAGTCTCCTTTCGAACTCTACAATGCCTATTATCTTCCATCTTCTGATTGTTTGGGACCTTCTGTTTATAGAGGCCC
TTCGTTCAGCTCGTTAGATCCTCGGTTACAAGACGCGCTCAAGGAATTCCTAATCAGTAGAGGTGTTGAAGAAAGGCTGACCAACTTCCTTCTCATTCACCTGCATAAAA
AAGAGCAAGGTCAGTATCTGAATTGGTTACAAGATGTCGAATCTTCAATCGCAAAAGGACAATCTAATGAACTTTAA
mRNA sequenceShow/hide mRNA sequence
ATTAGTTAGAACTAAAAAAGATGGCGGTCATGATAGTTTTAAACCAAGTAAAAGGATGTTAGAAACTGAGAGAGGGCAGCGCTGGGAGAAGAAGACGAAGGGACAGTAGA
ATAATGGCGAGGGCTACTCAAATTTTTCGCAAAGCTCGGAAAGCCTTCCATGATCTCAACCTTCTCAAGATCTTGCAATCCGAGATAACCCACGAGCTTTCTTCAACCCC
ATGTCAGAACTATGAGAACAATAGTACTTCCAGTGATTTCACTGTGGAACATGACTCGCTCAAGTCACAAGACGTGGTGTTGCGGCGAAAATTGGATTCCGGTGAGGAGG
TTGTGATTTCTGCTCTATTGGGTCCTCTCAGATTGGGATATGAAGGGGCTTTTCCGAGGGACATTTTGATGAAGATTTGTGTGAGTAAGCCTGGAGTTAGCTCTCTTTTG
CAGTTTGATTGTGGGGTTTCAGAGAACGGTCATGGCGAGTCTCCTTTCGAACTCTACAATGCCTATTATCTTCCATCTTCTGATTGTTTGGGACCTTCTGTTTATAGAGG
CCCTTCGTTCAGCTCGTTAGATCCTCGGTTACAAGACGCGCTCAAGGAATTCCTAATCAGTAGAGGTGTTGAAGAAAGGCTGACCAACTTCCTTCTCATTCACCTGCATA
AAAAAGAGCAAGGTCAGTATCTGAATTGGTTACAAGATGTCGAATCTTCAATCGCAAAAGGACAATCTAATGAACTTTAACAACTTCACATCGTATCTTGAATGCCTGAT
TTTCATATGGGAAGAGGAGGCACGACTTTAAGTGCAGGTTTGGAACATTTAAATTGATTGCTAAATAAGAGTTTTCATTCATTCTGCTTGCATTTTGTGTTTGTGCAAGT
GTATACTTTTTCTTGCGCATGAAAATGTTTCAGCCAGATTTATTTGTCAACAAAACAAAAACGTGGTACTCTAATCATTTAGTTTGAGCCTTGGTTCTACATTGACGTTG
ACAAAAATGTTGAGCCCTCAGCTGAAGAGAAATTCAATGAAAATATTGAAATAACACTTTATGAA
Protein sequenceShow/hide protein sequence
MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICVSKPGVSSLLQ
FDCGVSENGHGESPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQDVESSIAKGQSNEL