CuGenDBv2

Gene ID	Sgr027733
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	protein DCL homolog, chloroplastic-like
Genome location	tig00153055:2135828..2148344
RNA-Seq Expression	Sgr027733
Synteny	Sgr027733
Gene Ontology terms	GO:0009658 - chloroplast organization (biological process) GO:1901259 - chloroplast rRNA processing (biological process) GO:0009507 - chloroplast (cellular component) GO:0003729 - mRNA binding (molecular function)
InterPro domains	IPR035892 - C2 domain superfamily IPR044673 - Protein DCL-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6608449.1 Protein DCL-like, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia]

3.4e-57

82.96

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPL+RLGLR+RGLC  IVQV RRSCCTA  ASTPP G ++SA+NTT+VLSA+DPPKY RWDEP YRKWK+QEEEILSDI+P +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLT EDEKIVVDRLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

KAG7037785.1 Protein DCL-like, chloroplastic, partial [Cucurbita argyrosperma subsp. argyrosperma]

3.4e-57

82.96

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPL+RLGLR+RGLC  IVQV RRSCCTA  ASTPP G ++SA+NTT+VLSA+DPPKY RWDEP YRKWK+QEEEILSDI+P +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLT EDEKIVVDRLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

XP_022135338.1 protein DCL, chloroplastic isoform X1 [Momordica charantia]

4.3e-60

85.93

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPLLRLGLRHRGLC  IVQV RRSCCTATAA TPPDGN+TSA+N T+VLS+SDPPKY RWDEPDYRKWKDQEEE+L+DIEP +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLTS DE+IVV+RLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

XP_022135348.1 uncharacterized protein LOC111007322 isoform X2 [Momordica charantia]

3.3e-60

85.29

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPLLRLGLRHRGLC  IVQV RRSCCTATAA TPPDGN+TSA+N T+VLS+SDPPKY RWDEPDYRKWKDQEEE+L+DIEP +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIMH
        GERLTS DE+IVV+RLLAHHPHAEDKIGCGLESIM+
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIMH

XP_022940238.1 protein DCL homolog, chloroplastic-like [Cucurbita moschata]

1.3e-56

82.22

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPL+RLGLR+RGLC  IVQV RRSCCTA  ASTPP G ++SA+NTT+VLSA+DPPKY RW+EP YRKWK+QEEEILSDI+P +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLT EDEKIVVDRLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C4J4 protein DCL, chloroplastic isoform X1

2.1e-60

85.93

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPLLRLGLRHRGLC  IVQV RRSCCTATAA TPPDGN+TSA+N T+VLS+SDPPKY RWDEPDYRKWKDQEEE+L+DIEP +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLTS DE+IVV+RLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

A0A6J1C4K2 uncharacterized protein LOC111007322 isoform X2

1.6e-60

85.29

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPLLRLGLRHRGLC  IVQV RRSCCTATAA TPPDGN+TSA+N T+VLS+SDPPKY RWDEPDYRKWKDQEEE+L+DIEP +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIMH
        GERLTS DE+IVV+RLLAHHPHAEDKIGCGLESIM+
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIMH

A0A6J1FNQ4 protein DCL homolog, chloroplastic-like

6.3e-57

82.22

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPL+RLGLR+RGLC  IVQV RRSCCTA  ASTPP G ++SA+NTT+VLSA+DPPKY RW+EP YRKWK+QEEEILSDI+P +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLT EDEKIVVDRLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

A0A6J1J443 protein DCL, chloroplastic-like isoform X2

1.4e-56

81.48

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPL+RLGLR+RGLC  I+QV RRSCCTA  ASTPP G ++SA+NTT+VLS +DPPKY RWDEP YRKWK+QEEEILSDI+P +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLT EDEKIVVDRLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

A0A6J1J4G4 protein DCL homolog, chloroplastic-like isoform X1

1.4e-56

81.48

Show/hide

Query:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD
        ++GHPL+RLGLR+RGLC  I+QV RRSCCTA  ASTPP G ++SA+NTT+VLS +DPPKY RWDEP YRKWK+QEEEILSDI+P +SLTKEILHSNRYVD
Subjt:  VQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVD

Query:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        GERLT EDEKIVVDRLLAHHPHAEDKIGCGLESIM
Subjt:  GERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

SwissProt top hits

e value

%identity

Alignment

Q42463 Protein DCL, chloroplastic

5.2e-08

39.71

Show/hide

Query:  DYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESI
        D   W D E++IL D  P V   + ILHS +Y  G+RL+ + ++ ++ RLL +HP  + KIG G++ I
Subjt:  DYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESI

Q5D869 DNA-directed RNA polymerase V subunit 1

4.4e-07

35.14

Show/hide

Query:  QEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESI---MHTSSSCCPC
        +E+E+LSD+EP +   ++I+H + Y DG+ ++ +D+  V++++L  HP  E K+G G++ I    HT  S   C
Subjt:  QEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESI---MHTSSSCCPC

Q9C642 Protein DCL homolog, chloroplastic

3.0e-08

42.86

Show/hide

Query:  DQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        D E++IL    P V   + ILHS +Y + +RL+ E E+ +++ LL +HP  E KIGCG++ IM
Subjt:  DQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

Arabidopsis top hits

e value

%identity

Alignment

AT1G45230.1 Protein of unknown function (DUF3223)

2.2e-09

42.86

Show/hide

Query:  DQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        D E++IL    P V   + ILHS +Y + +RL+ E E+ +++ LL +HP  E KIGCG++ IM
Subjt:  DQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

AT1G45230.2 Protein of unknown function (DUF3223)

2.2e-09

42.86

Show/hide

Query:  DQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        D E++IL    P V   + ILHS +Y + +RL+ E E+ +++ LL +HP  E KIGCG++ IM
Subjt:  DQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

AT2G40030.1 nuclear RNA polymerase D1B

3.1e-08

35.14

Show/hide

Query:  QEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESI---MHTSSSCCPC
        +E+E+LSD+EP +   ++I+H + Y DG+ ++ +D+  V++++L  HP  E K+G G++ I    HT  S   C
Subjt:  QEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESI---MHTSSSCCPC

AT3G46630.1 Protein of unknown function (DUF3223)

5.9e-23

Show/hide

Query:  TPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM
        +P +G+  +A N T+ +  +      R+++PDYRKWK+ E EIL DIEP   L KEILHS+RY+DGERL  EDEKIV+++LL +HP+++DKIGCGL+ IM
Subjt:  TPPDGNVTSADNTTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIM

AT4G34150.1 Calcium-dependent lipid-binding (CaLB domain) family protein

1.1e-26

42.31

Show/hide

Query:  LVGCYNLEDRWPVATEYSCVLLEYGGSTKRTKPCQGGGKHLVFEEKVVFEFTEGVRELKVAVWTSQPPGNDGVIGFLSVQLQQVLSDGYVDSTWTLQRKD
        +VGC  L+D    + +   V+LEYGG + RT+ C  GGK+ VF+EK +F   EG+R+LKVAVW S     D  IG  ++QLQ+VLS  Y D TWTLQ K 
Subjt:  LVGCYNLEDRWPVATEYSCVLLEYGGSTKRTKPCQGGGKHLVFEEKVVFEFTEGVRELKVAVWTSQPPGNDGVIGFLSVQLQQVLSDGYVDSTWTLQRKD

Query:  GRPAGHIRLILQFPSSSSTFQRQNSSYTAPSLNSAAPLTPNTTQPPILSQLLPYDS
        GR AG ++L+L +  +     ++++  +APS    AP  P  + PP  S   PY +
Subjt:  GRPAGHIRLILQFPSSSSTFQRQNSSYTAPSLNSAAPLTPNTTQPPILSQLLPYDS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATCGAAGACCAACACAAGCTACCGAAGCGACATCATGGGATTCTGGGGAGGAATGCAAAGGCCAACACAGCTGCTTGAGGTCACAGGCACTTGTTGGATGCTACAA
CTTGGAGGACAGATGGCCGGTTGCGACCGAATACTCCTGCGTCCTTCTTGAATATGGTGGTTCCACAAAGAGGACCAAGCCATGCCAAGGTGGAGGCAAACACCTTGTGT
TCGAGGAGAAAGTTGTTTTCGAATTCACTGAAGGAGTTCGAGAACTGAAAGTTGCAGTCTGGACCAGTCAACCCCCAGGAAACGATGGAGTCATTGGCTTCCTGAGTGTA
CAGCTCCAACAAGTCCTTTCCGATGGTTATGTTGACTCTACCTGGACTTTGCAGAGGAAAGATGGCAGGCCTGCAGGCCATATACGACTCATATTGCAATTTCCCAGTTC
CAGTTCTACATTTCAACGACAAAACTCAAGTTACACTGCGCCATCGTTGAATTCTGCTGCTCCTCTGACACCCAATACAACCCAACCGCCAATATTGTCCCAACTCCTAC
CGTATGATTCCTTTCGCCGACGTCGCCGGCAGTTCCTCGGCCAAATGCTACATATCCTTGCACCACGTATCCTCCCAACTCAGCTCCGCCACCACAACCTCTGTACCCTC
CCACTCAGCCAACGCAACCGAATGCCACCGGACCGGCCGCTCTATGGTCCCAACTCCTACCGTATGGTTCGTCTACGGCGGCAGTTCCTCCACCAGCTGCCCCTGCCTAC
AATGTTCCATATCCTTCAGACCCATACCCTAAGACTCAACCAACGAGCAGCTACTGTGCAAGCACCAGCCCGCCTGCAGGATACCCTCGGAATCCTCATCCTCATCCTCA
TCACCGTCAGTACCCAACTTATCCTCCGACCCCACCAGGCTTACGTTTGTGGGATTCACTCCGATGAGAACCAATTCCTGAAGCTTCCTCAAGAGCTTGCACCGTTCTGC
TATCGCTACAATGCCCAGGTTGGTACACTCGGGGGTCTTAACGAGGGCAGAACAATTATCAAGAACTGCGTTCATTCCTTTGGCTCCAAATGTGCAAGATCCGCACGAGA
GTTTTTTCAAACCCTTGCAGTTCTTGGCAAAAGCAGCCATGCCGACATCGGTCAATTCACGGCACGCACGAAGTTTGAGACGAGTCAAATTACGGCACCGAAGGGAAATG
AGAATAAGCGCGTCGTCTCCGATGCTCGCAGATCTGCGGTCACACTTCAAAGCAAGTTTGGTGACGGCATCGAATCGAGTAAAGAGGGAAGGTATCATGGAGGAAAGATC
TGCTTCTGCTTTAAGGGAGAGACGGTGACGGCTTTGTCCCTCAACTTTGAGCCAGCGCCGGCATACGAGAGAGCAGCCCTTCCGGTCGACGGAGCTAAGGGATTGGAAAA
TGCAAGCCAAGCACTCATCTGGAAGATCGGAAATGAAGTCGGAGGCTCCATGAACGATTTCCTGGAAGTCATCGGTTTCGTCCAGGGGCATCCTCTCCTTCGGTTAGGAC
TCAGGCACCGCGGGCTATGTATTCGGATCGTACAGGTGCCTCGTCGGTCTTGTTGCACTGCGACGGCGGCGTCTACTCCACCAGACGGCAACGTAACATCTGCTGACAAT
ACCACCGCAGTCTTGAGTGCCAGTGACCCACCCAAGTACCCAAGGTGGGATGAGCCTGATTATCGAAAGTGGAAGGACCAGGAAGAGGAAATTCTCAGCGACATCGAGCC
TACCGTATCCCTCACAAAAGAGATCCTCCACTCCAATAGGTATGTGGATGGGGAGCGATTGACATCTGAGGACGAGAAAATTGTGGTTGACAGGCTTCTTGCTCATCATC
CACATGCTGAAGATAAAATTGGATGTGGGCTCGAATCCATTATGCACACCTCCTCAAGTTGCTGCCCGTGTGGTTCAAGTAATGGCCTCCAATTGACACCCAACTCCTTC
CCAATAAGGGGCACATTTGAAGTGTGCTTGAAGTCAGCAAGCAAGACCATATTAAGAGCAGCTCATACCATTCTAACACTGAAGCTTCTGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDRRPTQATEATSWDSGEECKGQHSCLRSQALVGCYNLEDRWPVATEYSCVLLEYGGSTKRTKPCQGGGKHLVFEEKVVFEFTEGVRELKVAVWTSQPPGNDGVIGFLSV
QLQQVLSDGYVDSTWTLQRKDGRPAGHIRLILQFPSSSSTFQRQNSSYTAPSLNSAAPLTPNTTQPPILSQLLPYDSFRRRRRQFLGQMLHILAPRILPTQLRHHNLCTL
PLSQRNRMPPDRPLYGPNSYRMVRLRRQFLHQLPLPTMFHILQTHTLRLNQRAATVQAPARLQDTLGILILILITVSTQLILRPHQAYVCGIHSDENQFLKLPQELAPFC
YRYNAQVGTLGGLNEGRTIIKNCVHSFGSKCARSAREFFQTLAVLGKSSHADIGQFTARTKFETSQITAPKGNENKRVVSDARRSAVTLQSKFGDGIESSKEGRYHGGKI
CFCFKGETVTALSLNFEPAPAYERAALPVDGAKGLENASQALIWKIGNEVGGSMNDFLEVIGFVQGHPLLRLGLRHRGLCIRIVQVPRRSCCTATAASTPPDGNVTSADN
TTAVLSASDPPKYPRWDEPDYRKWKDQEEEILSDIEPTVSLTKEILHSNRYVDGERLTSEDEKIVVDRLLAHHPHAEDKIGCGLESIMHTSSSCCPCGSSNGLQLTPNSF
PIRGTFEVCLKSASKTILRAAHTILTLKLL

Sgr027733 (gene) of Monk fruit (Qingpiguo) v1 genome