; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CsGy6G010570 (gene) of Cucumber (Gy14) v2.1 genome

Gene IDCsGy6G010570
OrganismCucumis sativus L. var. sativus cv. Gy14 (Cucumber (Gy14) v2.1)
Descriptionmitochondrial acidic protein mam33
Genome locationGy14Chr6:9062788..9067742
RNA-Seq ExpressionCsGy6G010570
SyntenyCsGy6G010570
Gene Ontology termsGO:0005759 - mitochondrial matrix (cellular component)
InterPro domainsIPR003428 - Mitochondrial glycoprotein
IPR036561 - Mitochondrial glycoprotein superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004139944.1 mitochondrial acidic protein mam33 [Cucumis sativus]5.67e-14699.52Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI
        SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ+VESSI
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI

Query:  AKGQSNEL
        AKGQSNEL
Subjt:  AKGQSNEL

XP_008448290.1 PREDICTED: uncharacterized protein LOC103490527 isoform X1 [Cucumis melo]1.20e-11988.66Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M R TQ+FRKARK F DL LL+ILQSEI HELSSTPCQNYENN++SS FTVEHDSLKSQDVVLRRK+DSGEEVVISALLGPLR GY+GAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ
        SKPGVSSLLQFDCGVSE+GHGGSPF+LYNAYYL SSDCLGP VYRGPSFSSLDPRLQDALKE+LISRGVEE LTNFLLIHLHKKEQGQYLNWL+
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ

XP_022928687.1 uncharacterized protein LOC111435528 [Cucurbita moschata]1.22e-11582.21Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSSTP QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI
        SKPGVSSLLQFDCGVSE+GHGGSPF++YNAYYL SS CL PSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQNVES I
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

XP_022967898.1 uncharacterized protein LOC111467274 [Cucurbita maxima]2.48e-11481.73Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSST  QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI
        SKPGV+SLLQFDCGVSE+GHGGSPF++YNAYYL SS CLGPSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQNVES I
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

XP_023544221.1 uncharacterized protein LOC111803860 [Cucurbita pepo subsp. pepo]4.95e-11581.73Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSSTP QN+E   +SSDF VEHDS KS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI
        SKPGVSSLLQFDCGVSE+GHGGSPF++YNAYYL SS CL PSVYRGP FSSLDP LQ ALKEFLISRGVEE LT+FL+IHLHKKEQGQYLNWLQNVES I
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

TrEMBL top hitse value%identityAlignment
A0A1S3BK83 uncharacterized protein LOC103490527 isoform X15.80e-12088.66Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M R TQ+FRKARK F DL LL+ILQSEI HELSSTPCQNYENN++SS FTVEHDSLKSQDVVLRRK+DSGEEVVISALLGPLR GY+GAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ
        SKPGVSSLLQFDCGVSE+GHGGSPF+LYNAYYL SSDCLGP VYRGPSFSSLDPRLQDALKE+LISRGVEE LTNFLLIHLHKKEQGQYLNWL+
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQ

A0A5A7V534 Mitochondrial acidic protein mam331.33e-9086.36Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M R TQ+FRKARK F DL LL+ILQSEI HELSSTPCQNYENN +SS FTVEHDSLKSQDVVLRRK+DSGEEVVISALLGPLR GY+GAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDP
        SKPGVSSLLQFDCGVSE+GHGGSPF+LYNAYYL SSDCLGPSVYRGPSF +L P
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDP

A0A6J1DM07 mitochondrial acidic protein mam334.27e-11179.81Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEITHELSST  Q+ E+   S DF VEHDS KSQDVVLRRKL+SGEEV +SAL GPLR G EGAFPR+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI
        SKPGV S+LQFDCGVSE+ HGGSPF++YNAYYL SS  LG SVYRGP FSSLDPRLQDALK++LISRGVEE LTNFLL+H+HKKEQGQYLNWLQN+ES +
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI

Query:  AKGQSNEL
        AKGQ NEL
Subjt:  AKGQSNEL

A0A6J1EKM2 uncharacterized protein LOC1114355285.90e-11682.21Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSSTP QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI
        SKPGVSSLLQFDCGVSE+GHGGSPF++YNAYYL SS CL PSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQNVES I
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

A0A6J1HWH3 uncharacterized protein LOC1114672741.20e-11481.73Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV
        M RA QIFRKARKA HDL+LLKILQSEI HELSST  QN+E   +SSDF VEHDSLKS+DVVLRRKL+SGEE+ ISAL GPL  G EGAF R+ILMKICV
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICV

Query:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI
        SKPGV+SLLQFDCGVSE+GHGGSPF++YNAYYL SS CLGPSVYRGP FSSLDP LQ ALK FLISRGVEE LT+FLLIHLHKKEQGQYLNWLQNVES I
Subjt:  SKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSI

Query:  AKGQSNEL
        AK Q NEL
Subjt:  AKGQSNEL

SwissProt top hitse value%identityAlignment
P40513 Mitochondrial acidic protein MAM333.9e-0743.64Show/hide
Query:  VYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVE
        VY GP FS+LD  LQ++L+ +L SRGV E L +F+  +   KE  +Y++WL+ ++
Subjt:  VYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVE

Arabidopsis top hitse value%identityAlignment
AT2G41600.1 Mitochondrial glycoprotein family protein1.3e-2644.52Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVY
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y
Subjt:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVY

AT2G41600.2 Mitochondrial glycoprotein family protein5.9e-2743.79Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSS
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y    F S
Subjt:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSS

AT2G41600.3 Mitochondrial glycoprotein family protein1.1e-4647.78Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVES
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y    FS +DP+L  AL+++LIS+GV E LTNFLL HL+KKEQ QY+NWL+ +ES
Subjt:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVES

Query:  SIA
        +++
Subjt:  SIA

AT2G41600.4 Mitochondrial glycoprotein family protein1.3e-2644.52Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVY
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y
Subjt:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVY

AT2G41600.5 Mitochondrial glycoprotein family protein1.1e-4647.78Show/hide
Query:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI
        M +   + ++  KA  + +LLKILQSEI HE+S    Q  E  S   DF ++ DS +SQD+VL+R+ DSGE+VV+SALL   P+ L  +  FPR+   K+
Subjt:  MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALL--GPLRLGYEGAFPRDILMKI

Query:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVES
        C+ KPG+SS+LQF C V E+G G S F++ +AY++ S      S Y    FS +DP+L  AL+++LIS+GV E LTNFLL HL+KKEQ QY+NWL+ +ES
Subjt:  CVSKPGVSSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVES

Query:  SIA
        +++
Subjt:  SIA


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGAGGGCTACTCAAATTTTTCGCAAAGCTCGGAAAGCCTTCCATGATCTCAACCTTCTCAAGATCTTGCAATCCGAGATAACCCACGAGCTTTCTTCAACC
CCATGTCAGAACTATGAGAACAATAGTACTTCCAGTGATTTCACTGTGGAACATGACTCGCTCAAGTCACAAGACGTGGTGTTGCGGCGAAAATTGGATTCCGGT
GAGGAGGTTGTGATTTCTGCTCTATTGGGTCCTCTCAGATTGGGATATGAAGGGGCTTTTCCGAGGGACATTTTGATGAAGATTTGTGTGAGTAAGCCTGGAGTT
AGCTCTCTTTTGCAGTTTGATTGTGGGGTTTCAGAGAACGGTCATGGCGGGTCTCCTTTCGAACTCTACAATGCCTATTATCTTCCATCTTCTGATTGTTTGGGA
CCTTCTGTTTATAGAGGCCCTTCGTTCAGCTCTTTAGATCCTCGGTTACAAGACGCGCTCAAGGAATTCCTAATCAGTAGAGGTGTTGAAGAAAGGCTGACCAAC
TTCCTTCTCATACACCTGCATAAAAAAGAGCAAGGTCAGTATCTGAATTGGTTACAAAATGTCGAATCTTCAATCGCAAAAGGACAATCTAATGAACTTTAA
mRNA sequenceShow/hide mRNA sequence
AGTTAGAACTAAAAAAGATGGCGGTCATGATAGTTTTAAACCAAGTAAAAGGATGTTAGAAACTGAGAGAGGGCAGCGCTGGGAGAAGAAGACGAAGGGACAGTA
GAATAATGGCGAGGGCTACTCAAATTTTTCGCAAAGCTCGGAAAGCCTTCCATGATCTCAACCTTCTCAAGATCTTGCAATCCGAGATAACCCACGAGCTTTCTT
CAACCCCATGTCAGAACTATGAGAACAATAGTACTTCCAGTGATTTCACTGTGGAACATGACTCGCTCAAGTCACAAGACGTGGTGTTGCGGCGAAAATTGGATT
CCGGTGAGGAGGTTGTGATTTCTGCTCTATTGGGTCCTCTCAGATTGGGATATGAAGGGGCTTTTCCGAGGGACATTTTGATGAAGATTTGTGTGAGTAAGCCTG
GAGTTAGCTCTCTTTTGCAGTTTGATTGTGGGGTTTCAGAGAACGGTCATGGCGGGTCTCCTTTCGAACTCTACAATGCCTATTATCTTCCATCTTCTGATTGTT
TGGGACCTTCTGTTTATAGAGGCCCTTCGTTCAGCTCTTTAGATCCTCGGTTACAAGACGCGCTCAAGGAATTCCTAATCAGTAGAGGTGTTGAAGAAAGGCTGA
CCAACTTCCTTCTCATACACCTGCATAAAAAAGAGCAAGGTCAGTATCTGAATTGGTTACAAAATGTCGAATCTTCAATCGCAAAAGGACAATCTAATGAACTTT
AACAACTTCACATCGTATCTTGAATGCCTGATTTTCATATGGGAAGAGGAGGCACGACTTTAAGTGCAGGTTTGGAACATTTAAATTGATTGCTAAATAAGAGTT
TTCATTCATTCTGCTTGCATTTTGTGTTTGTGCAAGTGTATACTTTTTCTTGCGCATGAAAATGTTTCAGCCAGATTTATTTGTCAACAAAACAAAAACGTGGTA
CTCTAATCATTTAGTTTGAGCCTTGGTTCTACATTGACGTTGACAAAAATGTTGAGCCCTCAGCTGAAGAGAAATTCAATGAAAATATTGAAATAACACTTTATG
AATTTCTTGAATCGTTTTCTTGGTTTTATTCATATTGATCATTTTTATTGACATTTTTTTTTATTACTCAATCGATGTTCATATGTTATATTAAAGTATCCGCCA
TCTTTTAAAATGGATATTATTCGAAAAGGGAGGAAAAGTTGGAATCAAGATGCCATTTGACTTCATCTATTCTATTGCACTCTTTTACATAATTAGAAATTTTGA
ATAGGAAATTAGATCATGGAGAAGTGGATGAGCTATGTTTTTTTTGAGGAGCTGAAGTGTAACAAGGATCAACGAAAATTTGAAAGTTGTTGGTATGCATGAGAA
ATCGTGAGCAGAATAGAAATAAGATAATGAAATGTGAAAAATGTAGAAAAGAGGGTTGGGTTGAAAATGTACTAATAGAATCAGG
Protein sequenceShow/hide protein sequence
MARATQIFRKARKAFHDLNLLKILQSEITHELSSTPCQNYENNSTSSDFTVEHDSLKSQDVVLRRKLDSGEEVVISALLGPLRLGYEGAFPRDILMKICVSKPGV
SSLLQFDCGVSENGHGGSPFELYNAYYLPSSDCLGPSVYRGPSFSSLDPRLQDALKEFLISRGVEERLTNFLLIHLHKKEQGQYLNWLQNVESSIAKGQSNEL