; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CSPI04G20180 (gene) of Cucumber (PI 183967) v1 genome

Gene IDCSPI04G20180
OrganismCucumis sativus L. var. sativus cv. PI 183967 (Cucumber (PI 183967) v1)
DescriptionUnknown protein
Genome locationChr4:18252920..18255063
RNA-Seq ExpressionCSPI04G20180
SyntenyCSPI04G20180
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6603168.1 hypothetical protein SDJN03_03777, partial [Cucurbita argyrosperma subsp. sororia]4.7e-11274.32Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAK+PL+ILGLPFQSAIAAGT+K+L+L LST FESGPSF L+YRPNDSSNPFSVIVKTGI SFGSP SSPMLMSAEF+LI  GNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        +FMLHFKPK GDF++KKSQSSS+MFQKVLKSEEESVDV++AVSKAV GLEV+ASTAVPI+   AVR RWGL+VPAAEGMK+ GGISFRE P ++LDKIG 
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLPPDDTAAGVEE
        EHV+ GD+ +++GS GN DL+L    FSVKRQF+VL++ENGLLKK I+DLRK+MKLFSNSG        R+KDRK PE  G DG PP   A   EE
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLPPDDTAAGVEE

XP_004146383.1 uncharacterized protein LOC101215302 [Cucumis sativus]6.7e-15999.33Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGL+VSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA
        EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLL+KSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA

XP_008442091.1 PREDICTED: uncharacterized protein LOC103486052 [Cucumis melo]2.2e-14692.95Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLST FESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSP SSPMLMSAEFNLIASGNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        TFMLHFKPK GDF+VKKSQSSSVMFQKV KSEEE VDVKTAVSKAV GLEV+ STAVPIMKSGAVR RWGLRVPAAEGMKM GGISFREVPFMV+DKIGF
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA
        EHVDGGD STKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRK+MKLFSNSG R  DR  PELGGFDGLPPDD AAGVEELRKPAL SA
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA

XP_022933122.1 uncharacterized protein LOC111439886 [Cucurbita moschata]5.2e-11173.65Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAK+PL+ILGLPFQSAIAAGT+K+L+L LST FESGPSF L+YRPNDSSNPFSVIVKTGI SFGSP SSPMLMSAEF+LI  GNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        +FMLHFKPK GDF++KKSQSSS+MFQKVLKSEEESVDV++AVSKAV GLEV+ASTAVPI+   AVR RWGL+VPAAEGMK+ GGISFR  P ++LDKIG 
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLPPDDTAAGVEE
        EHV+ GD+ +++GS GN DL+L    FSVKRQF+VL++ENGLLK+ I+DLRK+MKLFSNSG        R+KDRK PE  G DG PP   A   EE
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLPPDDTAAGVEE

XP_038882551.1 uncharacterized protein LOC120073784 [Benincasa hispida]4.8e-13384.39Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAKIPL+ILGLPFQSAIAAGTS ELTLKLSTHFESGPSFNLAYRPNDSSNPFS+IVKTGI SFGSP SSPMLMSAEFNL+A+GNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKM--GGGISFREVPFMVLDKI
        +FMLHFKPK GDF++KKSQSSSVMFQKVLKSEEES+DVK+AVSK V GL+++ASTAVP+MK  AVR RWGLRVPAAEGMKM  GGG+SFREVPFM LDKI
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKM--GGGISFREVPFMVLDKI

Query:  GFEHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGV--EELRKPALS
        G EHVDGGD+S++EGSLGN DLNLD DCFSVKRQFEVLKLENGLLK SIDDLRK+MKL SNSG R+KDRK PEL GFDGLP +D AA    EELRKPALS
Subjt:  GFEHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGV--EELRKPALS

Query:  S
        +
Subjt:  S

TrEMBL top hitse value%identityAlignment
A0A0A0KZ92 Uncharacterized protein3.2e-15999.33Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGL+VSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA
        EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLL+KSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA

A0A1S3B5N3 uncharacterized protein LOC1034860521.1e-14692.95Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLST FESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSP SSPMLMSAEFNLIASGNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        TFMLHFKPK GDF+VKKSQSSSVMFQKV KSEEE VDVKTAVSKAV GLEV+ STAVPIMKSGAVR RWGLRVPAAEGMKM GGISFREVPFMV+DKIGF
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA
        EHVDGGD STKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRK+MKLFSNSG R  DR  PELGGFDGLPPDD AAGVEELRKPAL SA
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA

A0A5D3C2B3 Uncharacterized protein1.1e-14692.95Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLST FESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSP SSPMLMSAEFNLIASGNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        TFMLHFKPK GDF+VKKSQSSSVMFQKV KSEEE VDVKTAVSKAV GLEV+ STAVPIMKSGAVR RWGLRVPAAEGMKM GGISFREVPFMV+DKIGF
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA
        EHVDGGD STKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRK+MKLFSNSG R  DR  PELGGFDGLPPDD AAGVEELRKPAL SA
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA

A0A6J1EYV8 uncharacterized protein LOC1114398862.5e-11173.65Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAK+PL+ILGLPFQSAIAAGT+K+L+L LST FESGPSF L+YRPNDSSNPFSVIVKTGI SFGSP SSPMLMSAEF+LI  GNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        +FMLHFKPK GDF++KKSQSSS+MFQKVLKSEEESVDV++AVSKAV GLEV+ASTAVPI+   AVR RWGL+VPAAEGMK+ GGISFR  P ++LDKIG 
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLPPDDTAAGVEE
        EHV+ GD+ +++GS GN DL+L    FSVKRQF+VL++ENGLLK+ I+DLRK+MKLFSNSG        R+KDRK PE  G DG PP   A   EE
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLPPDDTAAGVEE

A0A6J1HT92 uncharacterized protein LOC1114672458.1e-11074.83Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKASLKFREDQKPLLRAK+PL+ILGLPFQSAIAAGT+K+L+L LST FESGPSF L+YRPNDSSNPFSVIVKTGI SFGSP SSPMLMSAEF+LI  GNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF
        +FMLH KPK GDF++KKSQSSS+MFQKVLKSEEESVDV++AVSKAV GLEV+ASTAVPI+   AVR RWGL+VPAAEGMK+ GGISFRE P ++LDKIG 
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGF

Query:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLP
        EHV+ GD+ +++GS  N DL+L    FSVKR+FEVL++ENGLLKK I+DLRK+MKLFSNSG        R+KDRK PE  G DG P
Subjt:  EHVDGGDTSTKEGSLGNGDLNLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGS-------RYKDRKGPELGGFDGLP

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT3G57990.1 unknown protein3.6e-6247.39Show/hide
Query:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP
        MKAS+KFRE+QKPL RAK+PL+ILGLPFQS I AG SKEL+L LST FESGPS  +AYRPNDS NPFS+IVKTG  SFGSP SS MLMSAEFNL+  GNP
Subjt:  MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNP

Query:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKS-------EEESVDVKTA-----------------------VSKAVLGLEVSASTAVPIMKSGAVRVRWG
        +FMLHFKP+FGDF++KKS SSS   + ++KS       ++ S++V                          ++  + G+EV+A T++P+     +  RWG
Subjt:  TFMLHFKPKFGDFTVKKSQSSSVMFQKVLKS-------EEESVDVKTA-----------------------VSKAVLGLEVSASTAVPIMKSGAVRVRWG

Query:  LRVPA--AEGMKMGGGISFREVPFMVLDKIGFEHVDGGDTSTKEGSLGNGDLNLDSDCFS---VKRQFEVLKLENGLLKKSIDDLRK
        +RVP            IS R  PF+V++KIG EHVDG D    + +   G ++  +   +   V    E L+ EN  LK++++DLR+
Subjt:  LRVPA--AEGMKMGGGISFREVPFMVLDKIGFEHVDGGDTSTKEGSLGNGDLNLDSDCFS---VKRQFEVLKLENGLLKKSIDDLRK


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAAAGCATCTCTGAAATTCCGTGAAGACCAGAAACCATTATTGAGAGCGAAAATCCCTCTCACCATTCTCGGCCTCCCTTTCCAATCCGCCATAGCCGCCGGAACCTC
CAAAGAACTCACTCTCAAGCTCTCAACTCATTTCGAATCCGGCCCCTCCTTCAATCTCGCATATCGCCCCAACGATTCTTCGAACCCCTTCTCTGTAATCGTCAAAACCG
GAATCGCCTCCTTCGGCTCCCCGACCTCTTCCCCTATGCTCATGAGCGCCGAATTCAACTTAATCGCCTCTGGAAACCCCACTTTCATGCTCCACTTCAAGCCTAAATTC
GGCGATTTCACGGTCAAGAAATCGCAATCCTCGTCCGTGATGTTCCAGAAGGTTTTGAAATCGGAGGAGGAATCTGTGGATGTTAAAACTGCTGTTTCGAAGGCAGTTTT
GGGTTTGGAGGTGTCGGCTAGTACGGCGGTTCCGATTATGAAATCCGGCGCCGTGAGGGTTCGTTGGGGTCTTAGGGTTCCTGCTGCGGAGGGGATGAAGATGGGTGGTG
GGATTTCGTTTAGGGAGGTTCCGTTTATGGTGCTGGATAAGATCGGGTTCGAACACGTGGACGGTGGGGATACGAGTACGAAGGAGGGTAGTTTGGGAAATGGGGATTTG
AATTTGGATTCGGATTGCTTTTCAGTGAAACGTCAGTTTGAGGTTCTGAAGTTAGAGAATGGGTTATTGAAAAAAAGCATAGACGATCTTAGGAAGAAAATGAAGTTGTT
CTCCAATTCCGGCAGCCGATATAAGGATAGAAAGGGGCCGGAGTTGGGTGGTTTTGATGGGTTGCCGCCAGATGACACGGCGGCGGGGGTTGAGGAGCTGAGGAAACCGG
CGCTGTCCAGTGCCTGA
mRNA sequenceShow/hide mRNA sequence
CTCAAATTCCCTGGAGGCCCCATGGCTTAGGTTCAACACAATAGAGTTAGAAAATAAATTCAGCTATAAACCGTTTTTCTTCCTTCACCAATAATTACAATTTCAAATTT
GAAATCCAATACCCCCAAACTCCCCATTACAAAAGTCCAATCCCTCTCTTAGTTTCTCCACAATTCCAATTCCAATTCCAATTTCGAAATCCATCTGGGAATTCTCAGAC
AAAGAAGATGAAAGCATCTCTGAAATTCCGTGAAGACCAGAAACCATTATTGAGAGCGAAAATCCCTCTCACCATTCTCGGCCTCCCTTTCCAATCCGCCATAGCCGCCG
GAACCTCCAAAGAACTCACTCTCAAGCTCTCAACTCATTTCGAATCCGGCCCCTCCTTCAATCTCGCATATCGCCCCAACGATTCTTCGAACCCCTTCTCTGTAATCGTC
AAAACCGGAATCGCCTCCTTCGGCTCCCCGACCTCTTCCCCTATGCTCATGAGCGCCGAATTCAACTTAATCGCCTCTGGAAACCCCACTTTCATGCTCCACTTCAAGCC
TAAATTCGGCGATTTCACGGTCAAGAAATCGCAATCCTCGTCCGTGATGTTCCAGAAGGTTTTGAAATCGGAGGAGGAATCTGTGGATGTTAAAACTGCTGTTTCGAAGG
CAGTTTTGGGTTTGGAGGTGTCGGCTAGTACGGCGGTTCCGATTATGAAATCCGGCGCCGTGAGGGTTCGTTGGGGTCTTAGGGTTCCTGCTGCGGAGGGGATGAAGATG
GGTGGTGGGATTTCGTTTAGGGAGGTTCCGTTTATGGTGCTGGATAAGATCGGGTTCGAACACGTGGACGGTGGGGATACGAGTACGAAGGAGGGTAGTTTGGGAAATGG
GGATTTGAATTTGGATTCGGATTGCTTTTCAGTGAAACGTCAGTTTGAGGTTCTGAAGTTAGAGAATGGGTTATTGAAAAAAAGCATAGACGATCTTAGGAAGAAAATGA
AGTTGTTCTCCAATTCCGGCAGCCGATATAAGGATAGAAAGGGGCCGGAGTTGGGTGGTTTTGATGGGTTGCCGCCAGATGACACGGCGGCGGGGGTTGAGGAGCTGAGG
AAACCGGCGCTGTCCAGTGCCTGAATTCGTCGATATGACAAACGTCAGTTTAAATTGAAGGTTGTGCTTGAGGTCTTATCCGAAGTAAGCATTATTACTGAGGTTGTCGT
ATGATCGAGACTGACACGAGAGAGAGAGCTGAGAAGTTTGAGGTCAGTTGGGGTTAATCGGAAAATATAGTAGTTTTGAAAAAAATTAGGTAAAAGGTGTTCTTTTGAGA
ATAATTCGTTAAATATGGTTTTTTTAGTTTTGTCGGAGTACCTTCCTAGAGATGCACTCCTTTCATTTTTCTTTAACTAGTTGATAGTCTTGGTTCATGGCCATATGCAC
AACCCCATAGGCACGCCCAGATGCCCACAAATGCAAGGTGTCACGACCATGCTTGTGTATGGCGTTGTTTGCCTATGACGGCATGCTCAAATTCCCCCAAACCACATTGT
CTTTATGTCTTATACAAACCACCTTATGCTG
Protein sequenceShow/hide protein sequence
MKASLKFREDQKPLLRAKIPLTILGLPFQSAIAAGTSKELTLKLSTHFESGPSFNLAYRPNDSSNPFSVIVKTGIASFGSPTSSPMLMSAEFNLIASGNPTFMLHFKPKF
GDFTVKKSQSSSVMFQKVLKSEEESVDVKTAVSKAVLGLEVSASTAVPIMKSGAVRVRWGLRVPAAEGMKMGGGISFREVPFMVLDKIGFEHVDGGDTSTKEGSLGNGDL
NLDSDCFSVKRQFEVLKLENGLLKKSIDDLRKKMKLFSNSGSRYKDRKGPELGGFDGLPPDDTAAGVEELRKPALSSA