; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh09G008390 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh09G008390
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Description30S ribosomal protein S20
Genome locationCmo_Chr09:4297970..4300769
RNA-Seq ExpressionCmoCh09G008390
SyntenyCmoCh09G008390
Gene Ontology termsGO:0006412 - translation (biological process)
GO:0015935 - small ribosomal subunit (cellular component)
GO:0003735 - structural constituent of ribosome (molecular function)
GO:0070181 - small ribosomal subunit rRNA binding (molecular function)
InterPro domainsIPR002583 - Ribosomal protein S20
IPR036510 - Ribosomal protein S20 superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6607892.1 30S ribosomal protein S20, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia]8.7e-7080.5Show/hide
Query:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE
        A A  SCFALPSKF NLSLNASSS + +S SS  L+SLSFSSN+SVSAFSNGCLS+S AQRP RYSVVCEAAP KKADSAAKRARQAEKRR YNKARKSE
Subjt:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE

Query:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA
        I+TRMKK                  MEALDDLKKKPEAQSEEVLPIEKLIAEA+SVIDKAVKVGTLHRNTAA RKSRLARRKKAVEIHHGWYTPASPAAA
Subjt:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA

XP_022935732.1 30S ribosomal protein S20, chloroplastic-like [Cucurbita moschata]1.8e-8391.54Show/hide
Query:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
        MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
Subjt:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS

Query:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
        EIKTRMKK                 VMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
Subjt:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA

Query:  A
        A
Subjt:  A

XP_022976587.1 30S ribosomal protein S20, chloroplastic-like [Cucurbita maxima]1.2e-8291.04Show/hide
Query:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
        MAATAIISCFALPSKFRNLSLNASSSSM LSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
Subjt:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS

Query:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
        EIKTRMKK                 VMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
Subjt:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA

Query:  A
        A
Subjt:  A

XP_023534903.1 30S ribosomal protein S20, chloroplastic-like [Cucurbita pepo subsp. pepo]1.3e-8189.55Show/hide
Query:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
        MAATA+ISCF+LPSKFRNLSLNASSSSM LSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
Subjt:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS

Query:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
        EIKTRMKK                 VMEALDDLKKKPE QSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
Subjt:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA

Query:  A
        A
Subjt:  A

XP_038899721.1 30S ribosomal protein S20, chloroplastic [Benincasa hispida]4.6e-7181.19Show/hide
Query:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPK-KADSAAKRARQAEKRRVYNKARK
        MAATA +SCF+LPSKFRNLSLNASSS +  SPSS TLRSLSFSSN SVSAFSNGCL++SKAQRP RYSVVCEAAPK KADSAAKR RQAEKRR+YNKARK
Subjt:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPK-KADSAAKRARQAEKRRVYNKARK

Query:  SEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPA
        SEIKTR+KK                 V+EALD LKKKPEAQSEEVLPIEKLIAEA+SVIDKAV+VGTLHRNTAARRKSRLARRKKAVEIHHGWYTP SPA
Subjt:  SEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPA

Query:  AA
        AA
Subjt:  AA

TrEMBL top hitse value%identityAlignment
A0A6J1CG14 30S ribosomal protein S20, chloroplastic4.6e-6979Show/hide
Query:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE
        A A I+CF++ SKFRNLSLNASSSS   S SSSTL+SL+FSSN+S  AFSNGCLS+S+AQRP RYSVVCEAAP KK DSAAKRARQAEKRR+YNKARKSE
Subjt:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE

Query:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA
        IKTRMKK                 V+EALDDLKKKPEAQSEEVL IEKLIAEA+SVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWY PASPAAA
Subjt:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA

A0A6J1F6F1 30S ribosomal protein S20, chloroplastic-like8.7e-8491.54Show/hide
Query:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
        MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
Subjt:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS

Query:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
        EIKTRMKK                 VMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
Subjt:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA

Query:  A
        A
Subjt:  A

A0A6J1FKZ1 30S ribosomal protein S20, chloroplastic1.6e-6980Show/hide
Query:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE
        A A  SCFALPSKF NLSLNAS S + +S SS  L+SLSFSSN+SVSAFSNGCLS+S AQRP RYSVVCEAAP KKADSAAKRARQAEKRR YNKARKSE
Subjt:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE

Query:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA
        I+TRMKK                  MEALDDLKKKPEAQSEEVLPIEKLIAEA+SVIDKAVKVGTLHRNTAA RKSRLARRKKAVEIHHGWYTPASPAAA
Subjt:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA

A0A6J1IG57 30S ribosomal protein S20, chloroplastic-like5.6e-8391.04Show/hide
Query:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
        MAATAIISCFALPSKFRNLSLNASSSSM LSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS
Subjt:  MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKS

Query:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
        EIKTRMKK                 VMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA
Subjt:  EIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAA

Query:  A
        A
Subjt:  A

A0A6J1IVC5 30S ribosomal protein S20, chloroplastic-like7.2e-7080.5Show/hide
Query:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE
        A A  SCFALPSKF NLSLNASSS + +S SS  LRSLSFSSNVSVSAFS+GCLS+S AQRP RYSVVCEAAP KKADSAAKRARQAEKRR YNKARKSE
Subjt:  ATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSE

Query:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA
        I+TRMKK                  MEALDDLKKKPEAQSEEVLP+EKLIAEA+SVIDKAVKVGTLHRNTAA RKSRLARRKKAVEIHHGWYTPASPAAA
Subjt:  IKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA

SwissProt top hitse value%identityAlignment
P62661 30S ribosomal protein S207.5e-0840.71Show/hide
Query:  VCEAAPKKADSAAKRARQAEKRRVYNKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHR
        + +  PK+  SA KR RQ+ KRR+ NKA+KS IKT  KK                        ++   E ++EE L   K++ +A S+IDKA K  TLH+
Subjt:  VCEAAPKKADSAAKRARQAEKRRVYNKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHR

Query:  NTAARRKSRLARR
        N AARRKSRL R+
Subjt:  NTAARRKSRLARR

P80380 30S ribosomal protein S205.7e-0840.71Show/hide
Query:  VCEAAPKKADSAAKRARQAEKRRVYNKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHR
        + +  PK+  SA KR RQ+ KRR+ NKA+KS IKT  KK                        ++   E ++EE L   K++ +A S+IDKA K  TLH+
Subjt:  VCEAAPKKADSAAKRARQAEKRRVYNKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHR

Query:  NTAARRKSRLARR
        N AARRKSRL R+
Subjt:  NTAARRKSRLARR

P82130 30S ribosomal protein S20, chloroplastic8.8e-4156.61Show/hide
Query:  CFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSEIKTRMK
        C ++ SK  NLS +++         +S+L+ L+FS+N+S   FS GC S+   QR   +SVVCE A  KKADSAAKR RQAE RR+ NKARKSE+KTRM+
Subjt:  CFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAP-KKADSAAKRARQAEKRRVYNKARKSEIKTRMK

Query:  KVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPA
        K                 V EALD LKKK  A +EE++PI+ LIAEA+S IDKAV  GTLHRNTAARRKSRLAR KK VEIHHGWYTP+
Subjt:  KVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPA

Q2JI48 30S ribosomal protein S201.7e-0741.18Show/hide
Query:  SAAKRARQAEKRRVYNKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRL
        SA KR + AE+ R+ NKA K+ ++  MKKV              NP  E L +              I+  ++ AFS IDKA K G LH+NTAARRK+RL
Subjt:  SAAKRARQAEKRRVYNKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRL

Query:  AR
        AR
Subjt:  AR

Q9ASV6 30S ribosomal protein S20, chloroplastic2.3e-4157.97Show/hide
Query:  SCFALPSKFRNLSLNASSSSMLLSPSSS---------TL-RSLSFSSNVS-VSAFSNGCLSISKAQRPFRYSVVCEAA--PKKADSAAKRARQAEKRRVY
        SC  L S+F+ LSL   S S   SPSSS         TL  SLSFS +VS   AFS G L +   Q+P R  +VCEAA   KKADSAAKRARQAEKRRVY
Subjt:  SCFALPSKFRNLSLNASSSSMLLSPSSS---------TL-RSLSFSSNVS-VSAFSNGCLSISKAQRPFRYSVVCEAA--PKKADSAAKRARQAEKRRVY

Query:  NKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYT
        NK++KSE +TRMKK                 V+EAL+ LKKK +AQ++E++ +EKLI EA+S IDKAVKV  LH+NT ARRKSRLARRKKAVEIHHGWY 
Subjt:  NKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYT

Query:  PASPAAA
        P + AAA
Subjt:  PASPAAA

Arabidopsis top hitse value%identityAlignment
AT3G15190.1 chloroplast 30S ribosomal protein S20, putative1.6e-4257.97Show/hide
Query:  SCFALPSKFRNLSLNASSSSMLLSPSSS---------TL-RSLSFSSNVS-VSAFSNGCLSISKAQRPFRYSVVCEAA--PKKADSAAKRARQAEKRRVY
        SC  L S+F+ LSL   S S   SPSSS         TL  SLSFS +VS   AFS G L +   Q+P R  +VCEAA   KKADSAAKRARQAEKRRVY
Subjt:  SCFALPSKFRNLSLNASSSSMLLSPSSS---------TL-RSLSFSSNVS-VSAFSNGCLSISKAQRPFRYSVVCEAA--PKKADSAAKRARQAEKRRVY

Query:  NKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYT
        NK++KSE +TRMKK                 V+EAL+ LKKK +AQ++E++ +EKLI EA+S IDKAVKV  LH+NT ARRKSRLARRKKAVEIHHGWY 
Subjt:  NKARKSEIKTRMKKVPKFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYT

Query:  PASPAAA
        P + AAA
Subjt:  PASPAAA


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGGCAACTGCAATTATTAGTTGCTTCGCTCTTCCTTCTAAGTTCAGAAATCTCTCCCTTAATGCTTCTTCCTCTTCTATGCTCCTTTCCCCGTCTTCTTCGACCCT
CAGATCTCTCAGTTTCTCCTCCAACGTTTCAGTTTCCGCCTTCTCCAATGGGTGCCTGTCGATTAGTAAAGCTCAGAGGCCATTTCGCTACTCCGTGGTCTGCGAGGCGG
CTCCTAAGAAGGCTGATTCTGCTGCAAAAAGGGCTCGGCAGGCTGAGAAAAGACGCGTTTATAATAAAGCTCGGAAGTCTGAAATCAAAACCAGAATGAAGAAGGTACCT
AAATTTGGCTGGTTTATATGCATTGGATTTTCGTTATTGAATCCTGTTATGGAAGCTTTAGATGATCTGAAGAAGAAACCTGAAGCACAATCAGAGGAAGTCCTTCCAAT
TGAGAAGCTCATTGCAGAAGCATTCTCAGTGATCGACAAAGCCGTGAAAGTGGGAACATTGCACCGAAACACCGCAGCACGTCGAAAATCTCGGCTTGCCAGAAGAAAGA
AAGCTGTAGAAATCCACCATGGCTGGTACACCCCAGCTTCACCAGCAGCTGCCTAA
mRNA sequenceShow/hide mRNA sequence
CTACAGCAGCGGATAAGCCGATACTGAACCCTGAGGTGTAAAAGAAAAGAACCACCACCGTTCTTCTTCAACCTCTGGAGCTTTTCCTTCTCAGAGTTCCCCGCTCAGAA
ATGGCGGCAACTGCAATTATTAGTTGCTTCGCTCTTCCTTCTAAGTTCAGAAATCTCTCCCTTAATGCTTCTTCCTCTTCTATGCTCCTTTCCCCGTCTTCTTCGACCCT
CAGATCTCTCAGTTTCTCCTCCAACGTTTCAGTTTCCGCCTTCTCCAATGGGTGCCTGTCGATTAGTAAAGCTCAGAGGCCATTTCGCTACTCCGTGGTCTGCGAGGCGG
CTCCTAAGAAGGCTGATTCTGCTGCAAAAAGGGCTCGGCAGGCTGAGAAAAGACGCGTTTATAATAAAGCTCGGAAGTCTGAAATCAAAACCAGAATGAAGAAGGTACCT
AAATTTGGCTGGTTTATATGCATTGGATTTTCGTTATTGAATCCTGTTATGGAAGCTTTAGATGATCTGAAGAAGAAACCTGAAGCACAATCAGAGGAAGTCCTTCCAAT
TGAGAAGCTCATTGCAGAAGCATTCTCAGTGATCGACAAAGCCGTGAAAGTGGGAACATTGCACCGAAACACCGCAGCACGTCGAAAATCTCGGCTTGCCAGAAGAAAGA
AAGCTGTAGAAATCCACCATGGCTGGTACACCCCAGCTTCACCAGCAGCTGCCTAATGCTCTACCCTACCCTTTTGTCTTAATGTTAATGGGCTGAGGAACTCTTCTTCT
ATTTTTGTATTTAGTTCGAACCTTCCTTCTATGTCTACAGTTGAGGTTTCACTCCTTTTTTCATCTGCCAAAAATGTCTAAAAAAAAAATACTTTCAGCTTAGTTTTAGA
TATGAAAATTTATCAACAGTATTTCAAAATACCCTTAAATTTTTTTTTTTAAATTTAATCCTTCAC
Protein sequenceShow/hide protein sequence
MAATAIISCFALPSKFRNLSLNASSSSMLLSPSSSTLRSLSFSSNVSVSAFSNGCLSISKAQRPFRYSVVCEAAPKKADSAAKRARQAEKRRVYNKARKSEIKTRMKKVP
KFGWFICIGFSLLNPVMEALDDLKKKPEAQSEEVLPIEKLIAEAFSVIDKAVKVGTLHRNTAARRKSRLARRKKAVEIHHGWYTPASPAAA