; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr008962 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr008962
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
DescriptionF12P19.7, putative isoform 2
Genome locationtig00007332:22689..28186
RNA-Seq ExpressionSgr008962
SyntenySgr008962
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0044364.1 F12P19.7, putative isoform 2 [Cucumis melo var. makuwa]4.6e-14485.32Show/hide
Query:  LVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYT
        L+GSLKGITSE+V SECVLKQY+KG+I+IINKT+TQQLAQF+AHF+ADVDQPQSCNFATFLPSSEDTPLQ+AEWIKFLG FAN+E RA QIYTAIKENY 
Subjt:  LVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYT

Query:  CLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIE
        CLKNIA TRKTFKP+VAWMGYYDG+WSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDP AYNLSTFL L+NI+
Subjt:  CLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIE

Query:  DQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        DQSCLSF+STQSIWR+DKR HS++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERD ++ALEPTI+ CG
Subjt:  DQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

TYK29493.1 uncharacterized protein E5676_scaffold655G00920 [Cucumis melo var. makuwa]1.3e-14385.57Show/hide
Query:  GSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYTCL
        GSLKGITSE+V SECVLKQY+KG+I+IINKT+TQQLAQF+AHF+ADVDQPQSCNFATFLPSSEDTPLQ+AEWIKFLG FAN+E RA QIYTAIKENY CL
Subjt:  GSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYTCL

Query:  KNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIEDQ
        KNIA TRKTFKP+VAWMGYYDG+WSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDP AYNLSTFL L+NI+DQ
Subjt:  KNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIEDQ

Query:  SCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        SCLSF+STQSIWR+DKR HS++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERD ++ALEPTI+ CG
Subjt:  SCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

XP_004152259.1 uncharacterized protein LOC101208429 isoform X1 [Cucumis sativus]2.0e-14787.16Show/hide
Query:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE
        +LGL+GSLKGITSE+V SECVLKQY+KG+I+IINKT+TQQLAQF+AHFIADVDQPQSCNFATFLPSSEDTPLQ+AEWIKFLG FAN+E RA QIYTAIKE
Subjt:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE

Query:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM
        NY CLKNIA TRKTFKP+VAWMGYYDGIWSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDPTAYNLSTFL L+
Subjt:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM

Query:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        NI+DQSCLSF+STQSIWR+DKR H+++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERD SSALEPTIIACG
Subjt:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

XP_031739521.1 uncharacterized protein LOC101208429 isoform X2 [Cucumis sativus]2.0e-14787.16Show/hide
Query:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE
        +LGL+GSLKGITSE+V SECVLKQY+KG+I+IINKT+TQQLAQF+AHFIADVDQPQSCNFATFLPSSEDTPLQ+AEWIKFLG FAN+E RA QIYTAIKE
Subjt:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE

Query:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM
        NY CLKNIA TRKTFKP+VAWMGYYDGIWSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDPTAYNLSTFL L+
Subjt:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM

Query:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        NI+DQSCLSF+STQSIWR+DKR H+++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERD SSALEPTIIACG
Subjt:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

XP_038903360.1 uncharacterized protein LOC120089977 [Benincasa hispida]6.8e-14887.5Show/hide
Query:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE
        +LGL+GSLKGITSE V SECVLKQY+KG I+IINKT+TQQLAQF+AHF+ADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLG FANLEARATQIY+AIKE
Subjt:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE

Query:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM
        NY CLKNIA TRKTFKP+VAWMGYYDGIWSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDP  YNLSTFL L+
Subjt:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM

Query:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        NI+DQSCLSF+STQSIWR+DKR H+++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERDSSSALEPTIIACG
Subjt:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

TrEMBL top hitse value%identityAlignment
A0A0A0KV51 Uncharacterized protein9.6e-14887.16Show/hide
Query:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE
        +LGL+GSLKGITSE+V SECVLKQY+KG+I+IINKT+TQQLAQF+AHFIADVDQPQSCNFATFLPSSEDTPLQ+AEWIKFLG FAN+E RA QIYTAIKE
Subjt:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE

Query:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM
        NY CLKNIA TRKTFKP+VAWMGYYDGIWSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDPTAYNLSTFL L+
Subjt:  NYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLM

Query:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        NI+DQSCLSF+STQSIWR+DKR H+++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERD SSALEPTIIACG
Subjt:  NIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

A0A5A7TMJ6 F12P19.7, putative isoform 22.2e-14485.32Show/hide
Query:  LVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYT
        L+GSLKGITSE+V SECVLKQY+KG+I+IINKT+TQQLAQF+AHF+ADVDQPQSCNFATFLPSSEDTPLQ+AEWIKFLG FAN+E RA QIYTAIKENY 
Subjt:  LVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYT

Query:  CLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIE
        CLKNIA TRKTFKP+VAWMGYYDG+WSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDP AYNLSTFL L+NI+
Subjt:  CLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIE

Query:  DQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        DQSCLSF+STQSIWR+DKR HS++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERD ++ALEPTI+ CG
Subjt:  DQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

A0A5D3E0B2 Uncharacterized protein6.5e-14485.57Show/hide
Query:  GSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYTCL
        GSLKGITSE+V SECVLKQY+KG+I+IINKT+TQQLAQF+AHF+ADVDQPQSCNFATFLPSSEDTPLQ+AEWIKFLG FAN+E RA QIYTAIKENY CL
Subjt:  GSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYTCL

Query:  KNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIEDQ
        KNIA TRKTFKP+VAWMGYYDG+WSFTKDAYKLKYIED GGENVDDSINKITYNVSNPDDLDAFHGILCTVEVI+DETFTSDP AYNLSTFL L+NI+DQ
Subjt:  KNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIEDQ

Query:  SCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
        SCLSF+STQSIWR+DKR HS++   A DW DGAISQPQLVL DIIEVLFPTGN+TTTYFRNLAKE VTNI SEMCERD ++ALEPTI+ CG
Subjt:  SCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

A0A6J1CNU5 uncharacterized protein LOC111013325 isoform X22.1e-14284.85Show/hide
Query:  MLGLVGSLKGI-TSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIK
        +LG+VGSLKGI TS T+ASECVLKQY+KG+I+IIN T   QLAQFSAHF+ADVDQ Q CNFA FLPSSEDTPLQRAEWIKFLGVFANLEARA+QIYTA+K
Subjt:  MLGLVGSLKGI-TSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIK

Query:  ENYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGL
        ENY CLKNIA TRKTFKP+VAW+GYYDGIWSFTKD+YKLKYIED GGENVD+SINKITYNVSNPDDLDAFHGILCTVEV++DET+ SDPTAY +STFL L
Subjt:  ENYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGL

Query:  MNIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
         NIEDQSCLSFVS+QSIWR+DKR H NS ALALDW DGAISQPQLVL D+IEVLFPT NYTTTYFRNLAKE V+NISSEMCERD SSALEPTIIACG
Subjt:  MNIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

A0A6J1CPC0 uncharacterized protein LOC111013325 isoform X12.1e-14284.85Show/hide
Query:  MLGLVGSLKGI-TSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIK
        +LG+VGSLKGI TS T+ASECVLKQY+KG+I+IIN T   QLAQFSAHF+ADVDQ Q CNFA FLPSSEDTPLQRAEWIKFLGVFANLEARA+QIYTA+K
Subjt:  MLGLVGSLKGI-TSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIK

Query:  ENYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGL
        ENY CLKNIA TRKTFKP+VAW+GYYDGIWSFTKD+YKLKYIED GGENVD+SINKITYNVSNPDDLDAFHGILCTVEV++DET+ SDPTAY +STFL L
Subjt:  ENYTCLKNIAATRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGL

Query:  MNIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG
         NIEDQSCLSFVS+QSIWR+DKR H NS ALALDW DGAISQPQLVL D+IEVLFPT NYTTTYFRNLAKE V+NISSEMCERD SSALEPTIIACG
Subjt:  MNIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G65900.1 unknown protein1.4e-10660.67Show/hide
Query:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE
        +LGL+GSLKGITS+ V S C+LK  + G  E++   + +QL+QF+AHFI+D DQPQ+CNFA F P SE TPLQRAEWIKFLG F NLE +A Q+Y ++K 
Subjt:  MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKE

Query:  NYTCLKNIAATR-KTFKPVVAWMGY--YDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFL
        +YTCL  +AA + K+FKP+VAWMGY    G+WSFTK+++KLK++ED GGEN+D SINK++YNVS+PDDL+A H ILCTV+ ++DET +SDP  Y  +TFL
Subjt:  NYTCLKNIAATR-KTFKPVVAWMGY--YDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFL

Query:  GLMNIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAK-EEVTNISSEMCERDSSSALEPTIIACG
          +N++D SC +F++ QSIWRYDKR+ + +    LDW DGAISQP LVL DI+E LFPTGNYTT+YFRN+AK E V NIS +MC+RD+S  L P+I ACG
Subjt:  GLMNIEDQSCLSFVSTQSIWRYDKRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAK-EEVTNISSEMCERDSSSALEPTIIACG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCTAGGGTTAGTGGGAAGCTTGAAGGGCATAACGTCGGAGACGGTGGCGTCGGAATGCGTACTGAAGCAATACCAAAAAGGGAAAATTGAAATTATTAACAAGACCCA
GACGCAACAGCTGGCGCAATTTTCAGCGCACTTCATTGCTGACGTGGACCAACCACAGTCCTGCAATTTTGCCACCTTTCTTCCTTCCTCCGAGGATACGCCTTTGCAAA
GGGCAGAGTGGATAAAGTTCCTGGGAGTTTTTGCAAACCTTGAAGCAAGAGCCACTCAAATTTACACCGCGATAAAAGAAAATTACACGTGCCTGAAGAACATAGCAGCC
ACCAGAAAGACTTTCAAACCTGTAGTTGCTTGGATGGGTTACTATGATGGCATATGGTCTTTCACAAAGGACGCCTACAAGCTCAAGTACATAGAAGATGGAGGAGGAGA
GAACGTGGACGACTCCATCAACAAAATCACTTACAACGTCTCTAATCCCGACGACTTAGACGCCTTTCACGGCATCCTCTGCACGGTGGAGGTGATCGTTGATGAAACAT
TTACGTCGGATCCAACGGCGTACAACCTGTCCACGTTTCTGGGACTGATGAATATTGAAGACCAATCTTGCCTCTCTTTTGTTTCCACTCAGAGCATTTGGAGATACGAT
AAACGAATCCACAGCAACTCCCCCGCTCTCGCTCTCGATTGGTTGGACGGAGCAATCTCACAGCCGCAGTTGGTATTGGGAGACATCATTGAGGTTTTGTTCCCTACAGG
CAATTACACAACAACCTATTTTAGGAATTTGGCAAAGGAGGAAGTTACAAACATTAGTTCTGAAATGTGTGAGAGAGATAGTTCCTCTGCATTGGAGCCCACCATCATAG
CCTGTGGATGA
mRNA sequenceShow/hide mRNA sequence
ATGCTAGGGTTAGTGGGAAGCTTGAAGGGCATAACGTCGGAGACGGTGGCGTCGGAATGCGTACTGAAGCAATACCAAAAAGGGAAAATTGAAATTATTAACAAGACCCA
GACGCAACAGCTGGCGCAATTTTCAGCGCACTTCATTGCTGACGTGGACCAACCACAGTCCTGCAATTTTGCCACCTTTCTTCCTTCCTCCGAGGATACGCCTTTGCAAA
GGGCAGAGTGGATAAAGTTCCTGGGAGTTTTTGCAAACCTTGAAGCAAGAGCCACTCAAATTTACACCGCGATAAAAGAAAATTACACGTGCCTGAAGAACATAGCAGCC
ACCAGAAAGACTTTCAAACCTGTAGTTGCTTGGATGGGTTACTATGATGGCATATGGTCTTTCACAAAGGACGCCTACAAGCTCAAGTACATAGAAGATGGAGGAGGAGA
GAACGTGGACGACTCCATCAACAAAATCACTTACAACGTCTCTAATCCCGACGACTTAGACGCCTTTCACGGCATCCTCTGCACGGTGGAGGTGATCGTTGATGAAACAT
TTACGTCGGATCCAACGGCGTACAACCTGTCCACGTTTCTGGGACTGATGAATATTGAAGACCAATCTTGCCTCTCTTTTGTTTCCACTCAGAGCATTTGGAGATACGAT
AAACGAATCCACAGCAACTCCCCCGCTCTCGCTCTCGATTGGTTGGACGGAGCAATCTCACAGCCGCAGTTGGTATTGGGAGACATCATTGAGGTTTTGTTCCCTACAGG
CAATTACACAACAACCTATTTTAGGAATTTGGCAAAGGAGGAAGTTACAAACATTAGTTCTGAAATGTGTGAGAGAGATAGTTCCTCTGCATTGGAGCCCACCATCATAG
CCTGTGGATGA
Protein sequenceShow/hide protein sequence
MLGLVGSLKGITSETVASECVLKQYQKGKIEIINKTQTQQLAQFSAHFIADVDQPQSCNFATFLPSSEDTPLQRAEWIKFLGVFANLEARATQIYTAIKENYTCLKNIAA
TRKTFKPVVAWMGYYDGIWSFTKDAYKLKYIEDGGGENVDDSINKITYNVSNPDDLDAFHGILCTVEVIVDETFTSDPTAYNLSTFLGLMNIEDQSCLSFVSTQSIWRYD
KRIHSNSPALALDWLDGAISQPQLVLGDIIEVLFPTGNYTTTYFRNLAKEEVTNISSEMCERDSSSALEPTIIACG