; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr029245 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr029245
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
DescriptionFibrous sheath-interacting protein
Genome locationtig00153210:4424717..4436533
RNA-Seq ExpressionSgr029245
SyntenySgr029245
Gene Ontology termsNA
InterPro domainsIPR007454 - Uncharacterised protein family UPF0250
IPR027471 - YbeD-like domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022151740.1 uncharacterized protein LOC111019651 isoform X1 [Momordica charantia]4.3e-10192.42Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
        MAA RTVLRSASIFL EP RPVHFSRASSS +LGTSRSFTHRL+CNV   RARGFHF KRTVLNCSHD+TQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG

Query:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
        RVGHTTNMV+GGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQ IPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
Subjt:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN

Query:  AMKRDDRPLHF
        AMKRDDR  +F
Subjt:  AMKRDDRPLHF

XP_022945039.1 uncharacterized protein LOC111449401 [Cucurbita moschata]5.4e-9689.15Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE
        MAA R VLRSASIFLTEPSRP HFSRA SSSF+LGT RSFTHRL+CNV  +RARGFHFP+RT LNCS D+TQ TSSS+QDGQGPPQEAVLKAISEVSKTE
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGG DFVQSMVVAVESV+QQ IPEGKVRHKLS+KGKYVSVNIGPVQVISSEQVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY

Query:  NAMKRDDRPLHF
        NAMKRDDR  +F
Subjt:  NAMKRDDRPLHF

XP_022966813.1 uncharacterized protein LOC111466408 [Cucurbita maxima]5.4e-9689.15Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE
        MAA R VLRSASIFLTEPSRP HFSRA SSSF+LGT RSF HRL+CNV  +RARGFHFP+RTVLNCS D TQ TSSS+QDGQGPPQEAVLKAISEVSKTE
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWI LDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESV+QQ IPEGKVRHKLS+KGKYVSVNIGPVQVISSEQVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY

Query:  NAMKRDDRPLHF
        NAMKRDDR  +F
Subjt:  NAMKRDDRPLHF

XP_023542309.1 uncharacterized protein LOC111802242 [Cucurbita pepo subsp. pepo]6.8e-9990.52Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
        MAA R VLRSASIFLTEPSRP HFSRASSSFSLGT RSFTHRL+CNV  +R RGFHFP+RTVLNCS D+TQ TSSS+QDGQGPPQEAVLKAISEVSKTEG
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG

Query:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
        RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESV+QQ IPEGKVRHKLS+KGKYVSVNIGPVQVISSEQVQAVYN
Subjt:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN

Query:  AMKRDDRPLHF
        AMKRDDR  +F
Subjt:  AMKRDDRPLHF

XP_038891343.1 uncharacterized protein LOC120080787 [Benincasa hispida]1.2e-9587.2Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
        MAA R+++RSASIFLTEPSRP+HF+  SSSFSL T RSFTHRL CNVRR  ARGFHFPK  VLNCSHD+TQSTSSSNQDGQ PPQEAVLKAISEVSKTEG
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG

Query:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
        RVGHTTNMVLGGTVT DSTNEW+ALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQ IPEGKV+HK S+KGKY+SVNIGPVQVISSEQVQAVYN
Subjt:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN

Query:  AMKRDDRPLHF
        AMKRDDR  +F
Subjt:  AMKRDDRPLHF

TrEMBL top hitse value%identityAlignment
A0A6J1DC16 uncharacterized protein LOC111019651 isoform X12.1e-10192.42Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
        MAA RTVLRSASIFL EP RPVHFSRASSS +LGTSRSFTHRL+CNV   RARGFHF KRTVLNCSHD+TQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG

Query:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
        RVGHTTNMV+GGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQ IPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
Subjt:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN

Query:  AMKRDDRPLHF
        AMKRDDR  +F
Subjt:  AMKRDDRPLHF

A0A6J1FZV2 uncharacterized protein LOC1114494012.6e-9689.15Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE
        MAA R VLRSASIFLTEPSRP HFSRA SSSF+LGT RSFTHRL+CNV  +RARGFHFP+RT LNCS D+TQ TSSS+QDGQGPPQEAVLKAISEVSKTE
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGG DFVQSMVVAVESV+QQ IPEGKVRHKLS+KGKYVSVNIGPVQVISSEQVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY

Query:  NAMKRDDRPLHF
        NAMKRDDR  +F
Subjt:  NAMKRDDRPLHF

A0A6J1GWI1 uncharacterized protein LOC1114582181.9e-9488.15Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
        MAA RTVLRSA+IFLTEPSRPV   RASSSFSLGT R+FTHRL C    TR RGF FPKRTVL CS+D+TQSTSSSNQD QGPPQEAVLKAISEVSKTEG
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG

Query:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
        RVGHTTNMVLGGTVTDDS+NEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQ+ IPEGKVRHKLS+KGKYVSVNIGPVQVISSEQVQAVYN
Subjt:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN

Query:  AMKRDDRPLHF
        AMKRDDR  +F
Subjt:  AMKRDDRPLHF

A0A6J1HTC4 uncharacterized protein LOC1114664082.6e-9689.15Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE
        MAA R VLRSASIFLTEPSRP HFSRA SSSF+LGT RSF HRL+CNV  +RARGFHFP+RTVLNCS D TQ TSSS+QDGQGPPQEAVLKAISEVSKTE
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRA-SSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTE

Query:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY
        GRVGHTTNMVLGGTVTDDSTNEWI LDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESV+QQ IPEGKVRHKLS+KGKYVSVNIGPVQVISSEQVQAVY
Subjt:  GRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVY

Query:  NAMKRDDRPLHF
        NAMKRDDR  +F
Subjt:  NAMKRDDRPLHF

A0A6J1KAN5 uncharacterized protein LOC1114932146.4e-9588.63Show/hide
Query:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG
        MAA RTVLRSA+IFLTEPSRPV   RASSSFSLGT R+FTHRL C    TRARGF FPKRTVL CS+D+TQSTSSSNQD QGPPQEAVLKAISEVSKTEG
Subjt:  MAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKTEG

Query:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN
        RVGHTTNMVLGGTVTDDS+NEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQ+ IPEGKVRHKLS+KGKYVSVNIGPVQVISSEQVQAVYN
Subjt:  RVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYN

Query:  AMKRDDRPLHF
        AMKRDDR  +F
Subjt:  AMKRDDRPLHF

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G27385.1 unknown protein1.9e-5459.15Show/hide
Query:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT
        A +T+LR  S+F++E  R    S A   F L  S +    H L    +     GF   P+R T LNCSH+D        Q  QGPPQEAVLKAISEVSKT
Subjt:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT

Query:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV
        +GRVG TTNM++GGTV DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DFV +MVVAVESV+ + IPE  V+  LSSKGKYVSVNIGP+QV+SSEQVQAV
Subjt:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV

Query:  YNAMKRDDRPLHF
        YNAM+RD+R  +F
Subjt:  YNAMKRDDRPLHF

AT1G27385.2 unknown protein1.7e-5258.69Show/hide
Query:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT
        A +T+LR  S+F++E  R    S A   F L  S +    H L    +     GF   P+R T LNCSH+D        Q  QGPPQEAVLKAIS VSKT
Subjt:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT

Query:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV
        +GRVG TTNM++GGTV DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DFV +MVVAVESV+ + IPE  V+  LSSKGKYVSVNIGP+QV+SSEQVQAV
Subjt:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV

Query:  YNAMKRDDRPLHF
        YNAM+RD+R  +F
Subjt:  YNAMKRDDRPLHF

AT1G27385.3 unknown protein1.9e-5459.15Show/hide
Query:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT
        A +T+LR  S+F++E  R    S A   F L  S +    H L    +     GF   P+R T LNCSH+D        Q  QGPPQEAVLKAISEVSKT
Subjt:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT

Query:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV
        +GRVG TTNM++GGTV DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DFV +MVVAVESV+ + IPE  V+  LSSKGKYVSVNIGP+QV+SSEQVQAV
Subjt:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV

Query:  YNAMKRDDRPLHF
        YNAM+RD+R  +F
Subjt:  YNAMKRDDRPLHF

AT1G27385.4 unknown protein1.7e-5258.69Show/hide
Query:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT
        A +T+LR  S+F++E  R    S A   F L  S +    H L    +     GF   P+R T LNCSH+D        Q  QGPPQEAVLKAIS VSKT
Subjt:  AGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSF--THRLSCNVRRTRARGF-HFPKR-TVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVSKT

Query:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV
        +GRVG TTNM++GGTV DDS  +W+ LDQKVN+YP  RGFTAIGTGG+DFV +MVVAVESV+ + IPE  V+  LSSKGKYVSVNIGP+QV+SSEQVQAV
Subjt:  EGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAV

Query:  YNAMKRDDRPLHF
        YNAM+RD+R  +F
Subjt:  YNAMKRDDRPLHF


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCCGACGAAAAACATAGTTCAAATCACTGAATCAGGGCTTCATGGATCTTCTCTCTGCAATCGGATCGTCACCGATCTCTCTTCTCATCTGGCTATGTCCTTGCAGAG
CCACTTCAGCCTCCATCATTTCTTATGTATTCCAGAAAATGAAAATCGTCTTGATTTGAAAACTGCCTTTCAAAAAGAGAAATTTCATCATTTTCTTCATCTACAAAGAT
CCGAGGTACACCTACAAGACATCCACAGCATGTTTTGGGAAGTTAATGATCTTTCTACAAATGAATTACTCAGCATTGTCAGGAATCGGATATCCAAGGTAAACAGCACG
ACATCTCCACTTCGAAGAAACATGGCTACTGGTAGATCCTGTCTCGACTTGCCTCCCAAGAGGAAAATAGCTTTGCAACCCAAACTGGATGAAGAAAATTATGGAGGCCG
GCAGATATGGCAGCCGGCATTGCAGCTGCCGCCATTCTTTTGGCAAGTTGACACAGTGCAGAGGGTATCTTATTATGGGGCAGAGATATGTCATAGCTTCGCTACACCAT
TACAAGGGCGATTATCCAAGCAGAATACTAGTTCATCGAGATCGCACTGGGTCGCGTTCACGCCCAGCGGAACGGTGCGCTCTGAATCGTCGTTGCCTTTGTCTGATCCG
TACATTTTATTCACCGGTGTCAACAACCGCCGAGAACCAGAAATGGCAGCAGGCAGGACTGTGTTGCGTTCTGCATCAATATTCTTAACGGAGCCATCGCGACCCGTTCA
CTTCAGCCGTGCTTCTTCTTCCTTCTCACTAGGAACTAGCCGATCGTTCACCCACAGATTGAGTTGCAATGTAAGGAGAACTAGGGCTCGAGGATTTCACTTCCCTAAAC
GAACTGTCCTGAATTGCTCCCACGACGACACCCAATCTACGTCGTCGTCTAATCAGGACGGCCAGGGCCCTCCTCAGGAAGCTGTTTTAAAGGCAATTTCAGAGGTATCT
AAGACAGAAGGGAGGGTTGGGCATACCACAAATATGGTACTTGGAGGAACAGTGACAGATGATTCTACCAATGAGTGGATCGCCTTGGATCAAAAGGTTAACTCATACCC
GGGTGTTAGAGGCTTTACAGCAATTGGAACTGGGGGAGATGATTTTGTGCAATCTATGGTTGTCGCTGTGGAGTCTGTCCTCCAACAGTCAATTCCTGAGGGCAAGGTGA
GGCATAAATTATCATCAAAAGGGAAGTACGTGTCAGTAAACATAGGACCAGTTCAAGTAATTTCCAGTGAGCAGGTTCAAGCCGTATACAACGCAATGAAGAGAGATGAT
CGTCCTCTCCACTTTCCGGTCAATATCGTGCAAAAACACGTCGGTGACGCCGAATCCTTTTCTATTCCTCGCCATTACGGCGGCGGAGAATATGGCGGCCATCCTTCCGG
GAGCTTCCGCGAAATACCCCCGCGGCGCGTCGATCATTATCAGAAACGCCTTCGTCGGCGAGCAGTACGGCTCCGATCGATATGTGGAGAGCAGCCGATCTGCTTCCTGG
AGCTGCGTTCGGTATTGGACGTGGTAAGCTCGGAGCATCGGAGCATCCTTCAGCACCGTCTGAACCCATTTTGGATCCTCCTCGAGAAATACGGTGGTGCCGAGAGCGTT
GAGCGACGCCCACATGAGCGAATCGTGGCCGAGGCCGAAGACCAGAAAGTTGCAGGGACATCGGGCCTTCAAAACGTCGAACGAGATTCGGATCTCGTCCAGTGA
mRNA sequenceShow/hide mRNA sequence
ATGCCGACGAAAAACATAGTTCAAATCACTGAATCAGGGCTTCATGGATCTTCTCTCTGCAATCGGATCGTCACCGATCTCTCTTCTCATCTGGCTATGTCCTTGCAGAG
CCACTTCAGCCTCCATCATTTCTTATGTATTCCAGAAAATGAAAATCGTCTTGATTTGAAAACTGCCTTTCAAAAAGAGAAATTTCATCATTTTCTTCATCTACAAAGAT
CCGAGGTACACCTACAAGACATCCACAGCATGTTTTGGGAAGTTAATGATCTTTCTACAAATGAATTACTCAGCATTGTCAGGAATCGGATATCCAAGGTAAACAGCACG
ACATCTCCACTTCGAAGAAACATGGCTACTGGTAGATCCTGTCTCGACTTGCCTCCCAAGAGGAAAATAGCTTTGCAACCCAAACTGGATGAAGAAAATTATGGAGGCCG
GCAGATATGGCAGCCGGCATTGCAGCTGCCGCCATTCTTTTGGCAAGTTGACACAGTGCAGAGGGTATCTTATTATGGGGCAGAGATATGTCATAGCTTCGCTACACCAT
TACAAGGGCGATTATCCAAGCAGAATACTAGTTCATCGAGATCGCACTGGGTCGCGTTCACGCCCAGCGGAACGGTGCGCTCTGAATCGTCGTTGCCTTTGTCTGATCCG
TACATTTTATTCACCGGTGTCAACAACCGCCGAGAACCAGAAATGGCAGCAGGCAGGACTGTGTTGCGTTCTGCATCAATATTCTTAACGGAGCCATCGCGACCCGTTCA
CTTCAGCCGTGCTTCTTCTTCCTTCTCACTAGGAACTAGCCGATCGTTCACCCACAGATTGAGTTGCAATGTAAGGAGAACTAGGGCTCGAGGATTTCACTTCCCTAAAC
GAACTGTCCTGAATTGCTCCCACGACGACACCCAATCTACGTCGTCGTCTAATCAGGACGGCCAGGGCCCTCCTCAGGAAGCTGTTTTAAAGGCAATTTCAGAGGTATCT
AAGACAGAAGGGAGGGTTGGGCATACCACAAATATGGTACTTGGAGGAACAGTGACAGATGATTCTACCAATGAGTGGATCGCCTTGGATCAAAAGGTTAACTCATACCC
GGGTGTTAGAGGCTTTACAGCAATTGGAACTGGGGGAGATGATTTTGTGCAATCTATGGTTGTCGCTGTGGAGTCTGTCCTCCAACAGTCAATTCCTGAGGGCAAGGTGA
GGCATAAATTATCATCAAAAGGGAAGTACGTGTCAGTAAACATAGGACCAGTTCAAGTAATTTCCAGTGAGCAGGTTCAAGCCGTATACAACGCAATGAAGAGAGATGAT
CGTCCTCTCCACTTTCCGGTCAATATCGTGCAAAAACACGTCGGTGACGCCGAATCCTTTTCTATTCCTCGCCATTACGGCGGCGGAGAATATGGCGGCCATCCTTCCGG
GAGCTTCCGCGAAATACCCCCGCGGCGCGTCGATCATTATCAGAAACGCCTTCGTCGGCGAGCAGTACGGCTCCGATCGATATGTGGAGAGCAGCCGATCTGCTTCCTGG
AGCTGCGTTCGGTATTGGACGTGGTAAGCTCGGAGCATCGGAGCATCCTTCAGCACCGTCTGAACCCATTTTGGATCCTCCTCGAGAAATACGGTGGTGCCGAGAGCGTT
GAGCGACGCCCACATGAGCGAATCGTGGCCGAGGCCGAAGACCAGAAAGTTGCAGGGACATCGGGCCTTCAAAACGTCGAACGAGATTCGGATCTCGTCCAGTGA
Protein sequenceShow/hide protein sequence
MPTKNIVQITESGLHGSSLCNRIVTDLSSHLAMSLQSHFSLHHFLCIPENENRLDLKTAFQKEKFHHFLHLQRSEVHLQDIHSMFWEVNDLSTNELLSIVRNRISKVNST
TSPLRRNMATGRSCLDLPPKRKIALQPKLDEENYGGRQIWQPALQLPPFFWQVDTVQRVSYYGAEICHSFATPLQGRLSKQNTSSSRSHWVAFTPSGTVRSESSLPLSDP
YILFTGVNNRREPEMAAGRTVLRSASIFLTEPSRPVHFSRASSSFSLGTSRSFTHRLSCNVRRTRARGFHFPKRTVLNCSHDDTQSTSSSNQDGQGPPQEAVLKAISEVS
KTEGRVGHTTNMVLGGTVTDDSTNEWIALDQKVNSYPGVRGFTAIGTGGDDFVQSMVVAVESVLQQSIPEGKVRHKLSSKGKYVSVNIGPVQVISSEQVQAVYNAMKRDD
RPLHFPVNIVQKHVGDAESFSIPRHYGGGEYGGHPSGSFREIPPRRVDHYQKRLRRRAVRLRSICGEQPICFLELRSVLDVVSSEHRSILQHRLNPFWILLEKYGGAESV
ERRPHERIVAEAEDQKVAGTSGLQNVERDSDLVQ