; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Clc02G00680 (gene) of Watermelon (cordophanus) v2 genome

Gene IDClc02G00680
OrganismCitrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
DescriptionVQ domain-containing protein
Genome locationClcChr02:618201..619493
RNA-Seq ExpressionClc02G00680
SyntenyClc02G00680
Gene Ontology termsGO:0005634 - nucleus (cellular component)
InterPro domainsIPR008889 - VQ
IPR039607 - VQ motif-containing protein 8/17/18/20/21/25


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6605314.1 Protein MKS1, partial [Cucurbita argyrosperma subsp. sororia]2.9e-9587.56Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAA-
        MNPPG SA GSP TPRKKEIQLQGPRPPQLRV+QESRKIKKPPPHPQP+PP GRPPLPP  +QWPQPLIIYDISPKV+HVAENNFMSVVQRLTGLSSAA 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAA-

Query:  ATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP
        +TDGDLSPAAR ATIEKASPRS  EREREREI+VSDMMDL EVPVELGQ PGILSPAPA+LAPI +G+FSPAIE QS  YSLIHELSPHWPSPSALF AP
Subjt:  ATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP

Query:  LVSPISSPNIFNNLFDF
        LVSPISSPNIFN+LFDF
Subjt:  LVSPISSPNIFNNLFDF

XP_008460908.1 PREDICTED: protein MKS1-like [Cucumis melo]9.2e-10292.13Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA
        MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPP GRPPLPPGP+QWPQPLIIYDISPKVIHVAENNFMSVVQRLTG SS A 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA

Query:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL
        TDGDLSPAARLATIEKASPRS    EREREINVSDMMDLAEV VELGQIPGILSPAP TLAPIPTGYFSPAIE QS +YSL HELSPHWPSPSALFS PL
Subjt:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL

Query:  VSPISSPNIFNNLFDF
        +SPISSPNIFNNLFDF
Subjt:  VSPISSPNIFNNLFDF

XP_011649396.1 protein MKS1 [Cucumis sativus]2.5e-9991.16Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA
        MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVP  GRPPLPPGP+QWPQPLIIYDISPKVIHVAENNFMSVVQRLTG SS A 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA

Query:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL
        TDGDLSPAARLATIEKASPRS    EREREINVSDMMDLAEV VELGQIPGILSPAP TLAPIPTGYFSPAIE QS +YSL HELSPHW SPSALFS PL
Subjt:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL

Query:  VSPISSPNIFNNLFD
        +SPISSPNIFNNLFD
Subjt:  VSPISSPNIFNNLFD

XP_022947651.1 protein MKS1-like [Cucurbita moschata]5.4e-9486.64Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAA-
        MNPPG SA GSP TPRKKEIQLQGPRPPQLRV+QESRKIKKPPPHPQP+PP GRPPLPP  +QWPQPLIIYDISPKV+HVAENNFMSVVQRLTGLSSAA 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAA-

Query:  ATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP
        +TDGDLSPAAR ATIEKASPRS    EREREI+VSDMMDL EVPVELGQ PGILSPAPA+LAPI +G+FSPAIE QS  YSLIHELSPHWPSPSALF AP
Subjt:  ATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP

Query:  LVSPISSPNIFNNLFDF
        LVSPISSPNIFN+LFDF
Subjt:  LVSPISSPNIFNNLFDF

XP_038901805.1 protein MKS1-like [Benincasa hispida]3.6e-10695.89Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSS---
        MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRV+QESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSS   
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSS---

Query:  AAATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFS
        AAATDGDLSPAARLATIEKASPRS    EREREINVSDMMDLAEV VELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFS
Subjt:  AAATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFS

Query:  APLVSPISSPNIFNNLFDF
        APLVSPISSPNIFNNLFDF
Subjt:  APLVSPISSPNIFNNLFDF

TrEMBL top hitse value%identityAlignment
A0A0A0LK21 VQ domain-containing protein1.2e-9991.16Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA
        MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVP  GRPPLPPGP+QWPQPLIIYDISPKVIHVAENNFMSVVQRLTG SS A 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA

Query:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL
        TDGDLSPAARLATIEKASPRS    EREREINVSDMMDLAEV VELGQIPGILSPAP TLAPIPTGYFSPAIE QS +YSL HELSPHW SPSALFS PL
Subjt:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL

Query:  VSPISSPNIFNNLFD
        +SPISSPNIFNNLFD
Subjt:  VSPISSPNIFNNLFD

A0A1S3CD17 protein MKS1-like4.5e-10292.13Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA
        MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPP GRPPLPPGP+QWPQPLIIYDISPKVIHVAENNFMSVVQRLTG SS A 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA

Query:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL
        TDGDLSPAARLATIEKASPRS    EREREINVSDMMDLAEV VELGQIPGILSPAP TLAPIPTGYFSPAIE QS +YSL HELSPHWPSPSALFS PL
Subjt:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL

Query:  VSPISSPNIFNNLFDF
        +SPISSPNIFNNLFDF
Subjt:  VSPISSPNIFNNLFDF

A0A5A7TBE4 Protein MKS1-like4.5e-10292.13Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA
        MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPP GRPPLPPGP+QWPQPLIIYDISPKVIHVAENNFMSVVQRLTG SS A 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA

Query:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL
        TDGDLSPAARLATIEKASPRS    EREREINVSDMMDLAEV VELGQIPGILSPAP TLAPIPTGYFSPAIE QS +YSL HELSPHWPSPSALFS PL
Subjt:  TDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPL

Query:  VSPISSPNIFNNLFDF
        +SPISSPNIFNNLFDF
Subjt:  VSPISSPNIFNNLFDF

A0A6J1G715 protein MKS1-like2.6e-9486.64Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAA-
        MNPPG SA GSP TPRKKEIQLQGPRPPQLRV+QESRKIKKPPPHPQP+PP GRPPLPP  +QWPQPLIIYDISPKV+HVAENNFMSVVQRLTGLSSAA 
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAA-

Query:  ATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP
        +TDGDLSPAAR ATIEKASPRS    EREREI+VSDMMDL EVPVELGQ PGILSPAPA+LAPI +G+FSPAIE QS  YSLIHELSPHWPSPSALF AP
Subjt:  ATDGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP

Query:  LVSPISSPNIFNNLFDF
        LVSPISSPNIFN+LFDF
Subjt:  LVSPISSPNIFNNLFDF

A0A6J1L2G0 protein MKS1-like4.2e-9284.33Show/hide
Query:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA
        MNPPG SA GSP TPRKKEIQLQGPRPPQLRV+QESRKIKKPPPHPQP+PP GRPPLPP  +QWPQPLIIYDISPKV+HVAENNFMSVVQRLTGLSSA++
Subjt:  MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAA

Query:  T-DGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP
        + DGDLSPAAR ATIEKASPRS      EREI+VSDMMDL EVPVELGQ PGILSPAPA+LAPI +G+FSP IE QS  YSLIHELSPHWPSPSALF AP
Subjt:  T-DGDLSPAARLATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAP

Query:  LVSPISSPNIFNNLFDF
        LVSPISSPNIFN+LFDF
Subjt:  LVSPISSPNIFNNLFDF

SwissProt top hitse value%identityAlignment
F4HWF9 Nuclear speckle RNA-binding protein B1.9e-0940.32Show/hide
Query:  GPRPPQLRVSQESRK-IKKP---PPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAATD-----------------
        GP+P  L+V  +S K IKKP   PPHPQP PP      P      P P+ IY ++P++IH   NNFM++VQRLTG +S + T                  
Subjt:  GPRPPQLRVSQESRK-IKKP---PPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAATD-----------------

Query:  ----GDLSPAARLATIEKASPRSE
            G +SPAAR A  EKA+  +E
Subjt:  ----GDLSPAARLATIEKASPRSE

Q8LGD5 Protein MKS17.8e-2744.5Show/hide
Query:  MNPPGYSAAGSPTTP--RKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSA
        M+P  Y A G+P+    +K+++Q+ GPRP  L V ++S KIKKPP HP P P   +PP    P    +P++IY +SPKV+H   + FM+VVQRLTG+SS 
Subjt:  MNPPGYSAAGSPTTP--RKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSA

Query:  AATD----GDLSPAARLATIEKASPRSERE---REREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPS
           +    GD+SPAARLA+ E ASPR  +E   R+   EIN + M + AE     G  PGILSP+PA L    TG FSP + HQ   +S         P+
Subjt:  AATD----GDLSPAARLATIEKASPRSERE---REREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPS

Query:  -PSALFS-APLVSPISSP
         P  LFS A  +SP  SP
Subjt:  -PSALFS-APLVSPISSP

Arabidopsis top hitse value%identityAlignment
AT1G21320.1 nucleotide binding;nucleic acid binding1.4e-1040.32Show/hide
Query:  GPRPPQLRVSQESRK-IKKP---PPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAATD-----------------
        GP+P  L+V  +S K IKKP   PPHPQP PP      P      P P+ IY ++P++IH   NNFM++VQRLTG +S + T                  
Subjt:  GPRPPQLRVSQESRK-IKKP---PPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAATD-----------------

Query:  ----GDLSPAARLATIEKASPRSE
            G +SPAAR A  EKA+  +E
Subjt:  ----GDLSPAARLATIEKASPRSE

AT1G21326.1 VQ motif-containing protein3.6e-1132Show/hide
Query:  TPRKKEIQLQGPRPPQLRVSQESRK-IKKP---PPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAATD-------
        +PR + I   GPRP  L+V  +S K IKKP   PPHPQP PP      P      P P+IIY +SP++IH   NNFM++VQRLTG +S + T        
Subjt:  TPRKKEIQLQGPRPPQLRVSQESRK-IKKP---PPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAATD-------

Query:  --------------GDLSPAARLATIEKASPRSE---------------------REREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGY
                      G +SPAAR A  EKA+  +E                       +E++ +    +               GILSP P +L  +   +
Subjt:  --------------GDLSPAARLATIEKASPRSE---------------------REREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGY

Query:  FSPAIEHQSLAYSLIHELSPHWPSPSALFSAP--LVSPISSPNIFNNLFD
        FS         +S            S L S+P  + SP SS ++FNN FD
Subjt:  FSPAIEHQSLAYSLIHELSPHWPSPSALFSAP--LVSPISSPNIFNNLFD

AT3G18360.1 VQ motif-containing protein3.3e-0437.5Show/hide
Query:  PRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLS
        P PP L+V+++S  IKK PP P       +P           P+IIY  +P++IH    +FM++VQ+LTG++
Subjt:  PRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLS

AT3G18690.1 MAP kinase substrate 15.5e-2844.5Show/hide
Query:  MNPPGYSAAGSPTTP--RKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSA
        M+P  Y A G+P+    +K+++Q+ GPRP  L V ++S KIKKPP HP P P   +PP    P    +P++IY +SPKV+H   + FM+VVQRLTG+SS 
Subjt:  MNPPGYSAAGSPTTP--RKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSA

Query:  AATD----GDLSPAARLATIEKASPRSERE---REREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPS
           +    GD+SPAARLA+ E ASPR  +E   R+   EIN + M + AE     G  PGILSP+PA L    TG FSP + HQ   +S         P+
Subjt:  AATD----GDLSPAARLATIEKASPRSERE---REREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPS

Query:  -PSALFS-APLVSPISSP
         P  LFS A  +SP  SP
Subjt:  -PSALFS-APLVSPISSP


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAATCCGCCGGGATATTCCGCCGCCGGCAGCCCCACCACCCCAAGAAAGAAGGAGATCCAGCTACAAGGCCCCCGCCCGCCGCAACTCCGCGTCAGTCAAGAATCCCG
CAAAATCAAGAAGCCGCCGCCGCACCCTCAGCCGGTTCCCCCCGGCGGCCGGCCTCCTCTCCCGCCGGGCCCCGCCCAATGGCCTCAGCCCCTCATCATCTACGACATCT
CCCCCAAAGTCATCCACGTCGCCGAGAACAACTTCATGTCCGTCGTCCAGCGCCTCACTGGGCTGTCCTCCGCCGCCGCCACCGACGGCGACCTGTCCCCGGCAGCAAGG
CTGGCCACAATCGAGAAAGCCAGTCCCCGATCCGAAAGAGAAAGAGAAAGAGAAAGAGAAATCAACGTTAGCGACATGATGGATTTGGCGGAGGTTCCGGTGGAATTAGG
GCAAATTCCCGGAATCCTGTCACCAGCTCCGGCAACTCTGGCTCCGATTCCGACAGGGTATTTCTCGCCGGCGATTGAACATCAGAGCTTGGCGTATTCTTTGATTCACG
AGCTGAGTCCTCATTGGCCAAGCCCTTCTGCTCTGTTTTCAGCTCCTCTTGTTTCCCCAATTTCTTCACCAAATATCTTCAACAATCTCTTTGACTTTTAG
mRNA sequenceShow/hide mRNA sequence
TTTAATTCCCCCAACCAACTCTCCTCCAATTGTTACAAACAAAACAACCCCAAAATTAACCCAATTTCCCAATTCTCCACCTTTTCCCCGATCCGATTCCGATTCTCCTC
CGCCAGATCCGCCATGAATCCGCCGGGATATTCCGCCGCCGGCAGCCCCACCACCCCAAGAAAGAAGGAGATCCAGCTACAAGGCCCCCGCCCGCCGCAACTCCGCGTCA
GTCAAGAATCCCGCAAAATCAAGAAGCCGCCGCCGCACCCTCAGCCGGTTCCCCCCGGCGGCCGGCCTCCTCTCCCGCCGGGCCCCGCCCAATGGCCTCAGCCCCTCATC
ATCTACGACATCTCCCCCAAAGTCATCCACGTCGCCGAGAACAACTTCATGTCCGTCGTCCAGCGCCTCACTGGGCTGTCCTCCGCCGCCGCCACCGACGGCGACCTGTC
CCCGGCAGCAAGGCTGGCCACAATCGAGAAAGCCAGTCCCCGATCCGAAAGAGAAAGAGAAAGAGAAAGAGAAATCAACGTTAGCGACATGATGGATTTGGCGGAGGTTC
CGGTGGAATTAGGGCAAATTCCCGGAATCCTGTCACCAGCTCCGGCAACTCTGGCTCCGATTCCGACAGGGTATTTCTCGCCGGCGATTGAACATCAGAGCTTGGCGTAT
TCTTTGATTCACGAGCTGAGTCCTCATTGGCCAAGCCCTTCTGCTCTGTTTTCAGCTCCTCTTGTTTCCCCAATTTCTTCACCAAATATCTTCAACAATCTCTTTGACTT
TTAGCTAAGTTCTCTCTCTTCTTTCTCTCTAAAATATTAATCTTCATTGCCAATGCTCTTCACCAAAGAGGAATTTTGGGTTTTTTCTTTTCTTTTGTAAAGTAGGTTCT
TGTAATTTGTATAACATTTTTCCTTATTGTTCAATTCATTAACTACCCTAAAAACTCTAGTTTTAGTTTCCTTTTCCCATTAATTACCTCATTATATTTGTAAATGTGGC
ATTTTTCATCTCATATATCTAATTTATCTATCCTAAAAAAATAAAAATAATAAATCCATTTTTCATTTTTCTTCTTTTATACTAATTAGGCGATGGGATCCAAGGTTGAC
TGCTTGTTAATTGCAACCATATGAATTAGATTTTATTTATTTAATTTTTTTTTCTTGTCTAAAATTTTGGTCTTTTCTGTGTGTAGAATTGTTGACTTTTCCACATGTAT
TCGCTTTATCGTTATCATTTAATTTGTTTTATGATATCATTATTTCCATATTATGCCCAAATATAACGCTAACGTAATTTCCT
Protein sequenceShow/hide protein sequence
MNPPGYSAAGSPTTPRKKEIQLQGPRPPQLRVSQESRKIKKPPPHPQPVPPGGRPPLPPGPAQWPQPLIIYDISPKVIHVAENNFMSVVQRLTGLSSAAATDGDLSPAAR
LATIEKASPRSEREREREREINVSDMMDLAEVPVELGQIPGILSPAPATLAPIPTGYFSPAIEHQSLAYSLIHELSPHWPSPSALFSAPLVSPISSPNIFNNLFDF