CuGenDBv2

Gene ID	Sgr002816
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Nucleoid-associated protein
Genome location	tig00001784:12735..20167
RNA-Seq Expression	Sgr002816
Synteny	Sgr002816
Gene Ontology terms	GO:0003677 - DNA binding (molecular function)
InterPro domains	IPR004401 - Nucleoid-associated protein YbaB/EbfC family IPR036894 - Nucleoid-associated protein YbaB-like domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7023441.1 Nucleoid-associated protein, chloroplastic [Cucurbita argyrosperma subsp. argyrosperma]

5.2e-83

89.3

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTISL+AQ+PNLRGISD KKRSNLNSMSNIVG RI  +GPWKVEKN+RS  V GLFG KKEN EKSDDAPSKAGIFGNMQNLYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAMKLGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

XP_022135106.1 nucleoid-associated protein At4g30620, chloroplastic-like [Momordica charantia]

2.6e-90

94.65

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTISL+AQ+PN+RGISD K+RSNLNSMSNIVGVRI SHGPWKV KNNRSF VYGLFG+KKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRM+DLAQSLGMPQGLNEGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

XP_022932159.1 nucleoid-associated protein At4g30620, chloroplastic-like isoform X1 [Cucurbita moschata]

4.4e-82

87.7

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTIS++AQ+PNLRGISD KKRSNLNSMS I+G RI  +GPWKVEKNNRS  V GLFG KKENEEKSDDAPSKAGIFGNMQ LYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELA AEFDGYCEGELIKVTLSGNQQP+RTEITEAAMKLGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL+EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

XP_023516534.1 nucleoid-associated protein At4g30620, chloroplastic-like [Cucurbita pepo subsp. pepo]

2.6e-82

88.77

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTISL+AQ+PNLRGISD KKRSNLNS SNIVG RI  +GPWKVEKN+RS  V GLFG KKEN EKSDDAPSKAGIFGNMQNLYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAMKLGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

XP_038879413.1 nucleoid-associated protein At4g30620, chloroplastic isoform X2 [Benincasa hispida]

1.5e-82

87.7

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTISL+AQ+PNLRG+SD KKRSNLNS+SNI+GVRI  +GPWKVEK+NRS  VYGLFG KK+NEEKSDDAPSKAGIFGNMQ LYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAM+LGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL+EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

TrEMBL top hits

e value

%identity

Alignment

A0A5A7SUZ8 Nucleoid-associated protein

2.4e-81

87.7

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTISL+AQ+PNLRGISD KKRSNLN MSNIVG R+  +GPWKVEKNNRS  VYGLFG KK+ EEKSDDAPSKAGIFGNMQ LYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAM+LGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL+EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

A0A6J1BZP3 nucleoid-associated protein At4g30620, chloroplastic-like

1.3e-90

94.65

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTISL+AQ+PN+RGISD K+RSNLNSMSNIVGVRI SHGPWKV KNNRSF VYGLFG+KKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRM+DLAQSLGMPQGLNEGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

A0A6J1EW88 nucleoid-associated protein At4g30620, chloroplastic-like isoform X1

2.2e-82

87.7

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTIS++AQ+PNLRGISD KKRSNLNSMS I+G RI  +GPWKVEKNNRS  V GLFG KKENEEKSDDAPSKAGIFGNMQ LYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELA AEFDGYCEGELIKVTLSGNQQP+RTEITEAAMKLGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL+EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

A0A6J1HN29 nucleoid-associated protein At4g30620, chloroplastic-like isoform X1

2.2e-82

87.7

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTIS++AQ+PNLRGISD KKRSNLNSMS I+G RI  +GPWKVEKNNRS  V GLFG KKENEEKSDDAPSKAGIFGNMQ LYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELA AEFDGYCEGELIKVTLSGNQQP+RTEITEAAMKLGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL+EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

A0A6J1JDG0 nucleoid-associated protein At2g24020, chloroplastic-like

3.7e-82

88.24

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV
        MASTISL+AQ+PNLRGIS  KKR+NLNSMSNIVG RI  +GPWKVEKN+RS  V GLFG KKEN EKSDDAPSKAGIFGNMQNLYETV+ AQ VVQVEAV
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAV

Query:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        RVQKELAAAEFDGYCEGELIKVTLSGNQQP+RTEITEAAMKLGPEKLSLLVTEAY+DAHQKSVQAMK RMSDLAQSLGMPQGL EGL
Subjt:  RVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

SwissProt top hits

e value

%identity

Alignment

B7K422 Nucleoid-associated protein PCC8801_2554

2.0e-13

41.18

Show/hide

Query:  GNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLG
        G ++ L E   KAQ  VQ  A ++Q+EL   E +G+ EG+L+KV +SGNQ+P    I   A++ G ++LS LVT+A KDA+ +S + M+ +M +L   L 
Subjt:  GNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLG

Query:  MP
        +P
Subjt:  MP

O82230 Nucleoid-associated protein At2g24020, chloroplastic

5.9e-53

77.24

Show/hide

Query:  WKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKL
        +K +   RS RV GLFG   + +  S+D  SKAGIFGNMQN+YETVKKAQMVVQVEAVRVQKELAAAEFDGYC GEL+KVTLSGNQQP+RT+ITEAAM+L
Subjt:  WKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKL

Query:  GPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        G EKLS LVTEAYKDAH KSV AMK RMSDLAQSLGMP GL+EG+
Subjt:  GPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

Q5N376 Nucleoid-associated protein syc1054_d

1.8e-14

48.04

Show/hide

Query:  GNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLG
        G M+ L +  KKAQ  VQ  A +VQ++L   E +G  +G L+KV +SGNQ+P+R EI   A+  G E LS LV  A KDA+QKS  AMK +M  L   LG
Subjt:  GNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLG

Query:  MP
        +P
Subjt:  MP

Q8GMT0 Nucleoid-associated protein Synpcc7942_0464

1.8e-14

48.04

Show/hide

Query:  GNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLG
        G M+ L +  KKAQ  VQ  A +VQ++L   E +G  +G L+KV +SGNQ+P+R EI   A+  G E LS LV  A KDA+QKS  AMK +M  L   LG
Subjt:  GNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLG

Query:  MP
        +P
Subjt:  MP

Q9M098 Nucleoid-associated protein At4g30620, chloroplastic

2.6e-53

67.03

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLF-GRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEA
        MAST + T     L         +  +S  NIV +     G      NNRS RV GLF G KK+N+E   D  SKAGI GNMQNLYETVKKAQMVVQVEA
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLF-GRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEA

Query:  VRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLN
        VRVQKELA AEFDGYC+GEL+KVTLSGNQQP+RT+IT+AAM+LG EKLSLLVTEAYKDAH KSV AMK RMSDLAQSLGMP GL+
Subjt:  VRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLN

Arabidopsis top hits

e value

%identity

Alignment

AT2G24020.1 Uncharacterised BCR, YbaB family COG0718

4.2e-54

77.24

Show/hide

Query:  WKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKL
        +K +   RS RV GLFG   + +  S+D  SKAGIFGNMQN+YETVKKAQMVVQVEAVRVQKELAAAEFDGYC GEL+KVTLSGNQQP+RT+ITEAAM+L
Subjt:  WKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKL

Query:  GPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        G EKLS LVTEAYKDAH KSV AMK RMSDLAQSLGMP GL+EG+
Subjt:  GPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

AT2G24020.2 Uncharacterised BCR, YbaB family COG0718

4.2e-54

77.24

Show/hide

Query:  WKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKL
        +K +   RS RV GLFG   + +  S+D  SKAGIFGNMQN+YETVKKAQMVVQVEAVRVQKELAAAEFDGYC GEL+KVTLSGNQQP+RT+ITEAAM+L
Subjt:  WKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAVRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKL

Query:  GPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL
        G EKLS LVTEAYKDAH KSV AMK RMSDLAQSLGMP GL+EG+
Subjt:  GPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGL

AT4G30620.1 Uncharacterised BCR, YbaB family COG0718

1.9e-54

67.03

Show/hide

Query:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLF-GRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEA
        MAST + T     L         +  +S  NIV +     G      NNRS RV GLF G KK+N+E   D  SKAGI GNMQNLYETVKKAQMVVQVEA
Subjt:  MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLF-GRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEA

Query:  VRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLN
        VRVQKELA AEFDGYC+GEL+KVTLSGNQQP+RT+IT+AAM+LG EKLSLLVTEAYKDAH KSV AMK RMSDLAQSLGMP GL+
Subjt:  VRVQKELAAAEFDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGTCGACAATTTCTTTGACTGCTCAAATACCAAATTTGCGAGGAATTTCTGATCGGAAAAAACGCAGTAACCTAAATTCAATGTCAAATATAGTTGGTGTGCGGAT
CTTATCTCATGGTCCTTGGAAAGTTGAGAAAAACAATAGATCTTTTCGTGTTTATGGTCTATTTGGAAGAAAAAAGGAGAATGAGGAGAAGAGTGATGATGCGCCTTCAA
AGGCAGGAATCTTTGGAAACATGCAGAACTTATATGAGACTGTGAAGAAGGCGCAAATGGTTGTCCAAGTAGAGGCAGTGCGTGTACAAAAAGAACTTGCGGCGGCGGAG
TTTGATGGCTACTGCGAAGGAGAGCTAATTAAGGTGACATTATCCGGGAATCAGCAACCTGTTCGCACAGAGATCACTGAGGCTGCAATGAAATTAGGACCGGAAAAACT
GTCTCTGCTAGTCACTGAAGCATACAAGGACGCGCATCAGAAGAGCGTTCAGGCCATGAAGCTAAGAATGAGTGATCTTGCCCAGAGCTTAGGTATGCCCCAGGGCCTCA
ATGAGGGATTGAACATAATTCTCAGTGCATGGATCGTACCCAGACACCCTCCGCCGGAGAAGAGAACTTTTGAATCTGAAAGTGGGCGTCGCCGCCGTGTTGTTGGGAAA
CACGGCGCGGCACTTGGGAGTGTAGATACTGTACTGATCAACATTACCAAACTCGTGGTTCATGGCGTAGCTTACAACGTCGTCGCATTGGTTGGAAGTCTTGTCGGAGG
TGAAATTGCAGTGCTTGAGAATGGAGTTGTAGGTGGTGTCCGATATCATTGCATGGCTCCACCAATACGTCACTGTTCCAAGGGCGTCGTGGTTCGTATCCTTTGGGAAT
CTGGACATCCATCGGACGAGGAAAATAAGAGCATCTTGAGCTGTTCGGTTGTCGCCGGAATCTTCAAGGTCGGAGGAGGTGTTTGTCCTGAGTACTGCGAGAATGCCACC
GGTGGCTGTCCCGGGAGCGACGTGATTCTGTCGCGGAGCTGCTTTTCTGGCACGGCGGCGGCAATGGCGGAGGTGGTTGAATGGGCCAGGAGTGATATTAAGGCAATTGA
GAGAAGGGAGACCATTGCACTCCTCAAACTACTCATGCATGAAGGGTTTAGAGAGAGAGTTGTTGATGAGTCAATAATGGGATGGTGTTTTCTCTCTCTCTCTCTCTCTC
TCCCCCCAAATTCTGTGGAGAGAGAGAAGGAGATTGAAGGGGTAAATGAGATGAGATGTGGGTTGGTTAAGAAGAAGAAGGAGGGAGAAGAAAATCATAAATGCACCACC
ACTCTGATGATGAGAGTGTGGTCCTTATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASTISLTAQIPNLRGISDRKKRSNLNSMSNIVGVRILSHGPWKVEKNNRSFRVYGLFGRKKENEEKSDDAPSKAGIFGNMQNLYETVKKAQMVVQVEAVRVQKELAAAE
FDGYCEGELIKVTLSGNQQPVRTEITEAAMKLGPEKLSLLVTEAYKDAHQKSVQAMKLRMSDLAQSLGMPQGLNEGLNIILSAWIVPRHPPPEKRTFESESGRRRRVVGK
HGAALGSVDTVLINITKLVVHGVAYNVVALVGSLVGGEIAVLENGVVGGVRYHCMAPPIRHCSKGVVVRILWESGHPSDEENKSILSCSVVAGIFKVGGGVCPEYCENAT
GGCPGSDVILSRSCFSGTAAAMAEVVEWARSDIKAIERRETIALLKLLMHEGFRERVVDESIMGWCFLSLSLSLPPNSVEREKEIEGVNEMRCGLVKKKKEGEENHKCTT
TLMMRVWSL

Sgr002816 (gene) of Monk fruit (Qingpiguo) v1 genome