CuGenDBv2

Gene ID	Sgr021244
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	expressed protein localized to the inner membrane of the chloroplast.
Genome location	tig00153653:441194..449140
RNA-Seq Expression	Sgr021244
Synteny	Sgr021244
Gene Ontology terms	GO:0009706 - chloroplast inner membrane (cellular component) GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6571164.1 hypothetical protein SDJN03_30079, partial [Cucurbita argyrosperma subsp. sororia]

4.0e-71

84.71

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKSISFGQAPKLAIQ+KC RT+HKLSVRAEYNDG RNGGG+FVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RS+LNEDEYGFRRA+RPIYYD+GLEKTRQTLN KI QLNSAIDNVSSRLRGGN TP+VPVEADPEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

KAG7010970.1 hypothetical protein SDJN02_27768, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.1e-71

85.29

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKSISFGQAPKLAIQ+KC RTNHKLSVRAEYNDG RNGGG+FVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RS+LNEDEYGFRRA+RPIYYD+GLEKTRQTLN KI QLNSAIDNVSSRLRGGN TP+VPVEADPEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

XP_022148671.1 uncharacterized protein LOC111017273 [Momordica charantia]

1.1e-71

88.24

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKSI+FGQAPKLAIQKKCLRTN KLSVRAEYNDG R GGGDFVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKI QLNSAIDNVSSRLRGGNNTPAVPVEADPE EAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

XP_022944447.1 uncharacterized protein LOC111448897 [Cucurbita moschata]

1.8e-71

85.29

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKSISFGQAPKLAIQ+KC RT+HKLSVRAEYNDG RNGGG+FVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RS+LNEDEYGFRRA+RPIYYD+GLEKTRQTLN KI QLNSAIDNVSSRLRGGN TPAVPVEADPEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

XP_038902580.1 uncharacterized protein LOC120089235 [Benincasa hispida]

1.3e-72

88.24

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKSISFGQAPKLAIQ+K  RTN KLSVRAEYNDG+R+GGGDFVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

TrEMBL top hits

e value

%identity

Alignment

A0A1S3C9M4 uncharacterized protein LOC103498395

2.8e-70

83.63

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKS+SFGQ PKLAI++KC +TNHKLSVRAEYNDG R+GGGDFVAGFLLGGAVFGTLAY+FAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPV-EADPEIEATI
        RS+LNEDE+GFRRAKRP+YYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPV EA+PEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPV-EADPEIEATI

A0A5D3CQ66 Uncharacterized protein

2.8e-70

83.63

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKS+SFGQ PKLAI++KC +TNHKLSVRAEYNDG R+GGGDFVAGFLLGGAVFGTLAY+FAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPV-EADPEIEATI
        RS+LNEDE+GFRRAKRP+YYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPV EA+PEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPV-EADPEIEATI

A0A6J1D647 uncharacterized protein LOC111017273

5.2e-72

88.24

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKSI+FGQAPKLAIQKKCLRTN KLSVRAEYNDG R GGGDFVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKI QLNSAIDNVSSRLRGGNNTPAVPVEADPE EAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

A0A6J1FVP6 uncharacterized protein LOC111448897

8.8e-72

85.29

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAACFAPSLSVS             GGLIKASDLSSKSISFGQAPKLAIQ+KC RT+HKLSVRAEYNDG RNGGG+FVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RS+LNEDEYGFRRA+RPIYYD+GLEKTRQTLN KI QLNSAIDNVSSRLRGGN TPAVPVEADPEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

A0A6J1JGK4 uncharacterized protein LOC111484314

1.3e-70

84.12

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR
        MAAC APSLSVS             GGLIKASDLSSKSISFGQAPKLAIQ+KC R+NHKLSVRAEYNDG R+GGG+FVAGFLLGGAVFGTLAYIFAPQIR
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIR

Query:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI
        RS+LNEDEYGFRRA+RPIYYD+GLEKTRQTLN KI QLNSAIDNVSSRLRGGN TPAVPVEADPEIEAT+
Subjt:  RSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G42960.1 expressed protein localized to the inner membrane of the chloroplast.

2.7e-17

36.63

Show/hide

Query:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGG-GDFVAGFLLGGAVFGTLAYIFAPQI
        MA+  + SLS+   S  L+       G     +    S+SFG      +     RT   L++++ Y D + +G  G FV GF+LGG + G L  ++APQI
Subjt:  MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGG-GDFVAGFLLGGAVFGTLAYIFAPQI

Query:  RRSLLNEDEYGFRRAKRPIYYDE--GLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEAT
         +++   D     R      YDE   LEKTR+ L  KI+QLNSAID+VSS+L+   +TP     +  EIEAT
Subjt:  RRSLLNEDEYGFRRAKRPIYYDE--GLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEAT

AT3G02900.1 unknown protein

2.4e-37

62.6

Show/hide

Query:  LAIQKKCLRTNHKLSVRAEYNDGNRNGG-GDFVAGFLLGGAVFGTLAYIFAPQIRRSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNV
        L +Q K  R +HKLSV A Y  G++ GG  DFV GFLLG AVFGTLAYIFAPQIRRS+L+E+EYGF++ ++P+YYDEGLE+ R+ LN KI QLNSAID V
Subjt:  LAIQKKCLRTNHKLSVRAEYNDGNRNGG-GDFVAGFLLGGAVFGTLAYIFAPQIRRSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNV

Query:  SSRLRGG-------NNTPAVPVEADPEIEAT
        SSRL+GG        ++P+VPVE D E EAT
Subjt:  SSRLRGG-------NNTPAVPVEADPEIEAT

AT3G02900.2 unknown protein

2.4e-37

62.6

Show/hide

Query:  LAIQKKCLRTNHKLSVRAEYNDGNRNGG-GDFVAGFLLGGAVFGTLAYIFAPQIRRSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNV
        L +Q K  R +HKLSV A Y  G++ GG  DFV GFLLG AVFGTLAYIFAPQIRRS+L+E+EYGF++ ++P+YYDEGLE+ R+ LN KI QLNSAID V
Subjt:  LAIQKKCLRTNHKLSVRAEYNDGNRNGG-GDFVAGFLLGGAVFGTLAYIFAPQIRRSLLNEDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNV

Query:  SSRLRGG-------NNTPAVPVEADPEIEAT
        SSRL+GG        ++P+VPVE D E EAT
Subjt:  SSRLRGG-------NNTPAVPVEADPEIEAT

AT5G16660.1 unknown protein

8.5e-43

61.02

Show/hide

Query:  MAACFAPS-LSVSGKSFLLYLKIAVQGGLIKASDLS--SKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNG-GGDFVAGFLLGGAVFGTLAYIFA
        MA+C A + LS+SG S         Q   +KA+ LS  +K  S  +   L I KK  RT  K SV A Y DG+R+G  GDF+AGFLLGGAVFG +AYIFA
Subjt:  MAACFAPS-LSVSGKSFLLYLKIAVQGGLIKASDLS--SKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNG-GGDFVAGFLLGGAVFGTLAYIFA

Query:  PQIRRSLLN-EDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRG-GNNTPA--VPVEADPEIEAT
        PQIRRS+LN EDEYGF + K+P YYDEGLEKTR+TLN KI QLNSAIDNVSSRLRG   NT +  VPVE DPE+EAT
Subjt:  PQIRRSLLN-EDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRG-GNNTPA--VPVEADPEIEAT

AT5G16660.2 unknown protein

1.0e-40

60.45

Show/hide

Query:  MAACFAPS-LSVSGKSFLLYLKIAVQGGLIKASDLS--SKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNG-GGDFVAGFLLGGAVFGTLAYIFA
        MA+C A + LS+SG S         Q   +KA+ LS  +K  S  +   L I KK  RT  K SV A   DG+R+G  GDF+AGFLLGGAVFG +AYIFA
Subjt:  MAACFAPS-LSVSGKSFLLYLKIAVQGGLIKASDLS--SKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNG-GGDFVAGFLLGGAVFGTLAYIFA

Query:  PQIRRSLLN-EDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRG-GNNTPA--VPVEADPEIEAT
        PQIRRS+LN EDEYGF + K+P YYDEGLEKTR+TLN KI QLNSAIDNVSSRLRG   NT +  VPVE DPE+EAT
Subjt:  PQIRRSLLN-EDEYGFRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRG-GNNTPA--VPVEADPEIEAT

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGGCCTGCTTCGCTCCTTCGCTGTCCGTGTCTGGTAAATCTTTTCTTCTCTATCTTAAGATAGCAGTTCAAGGGGGATTGATCAAGGCCTCAGATCTCTCCTCAAA
GTCCATTTCCTTTGGGCAAGCACCCAAACTCGCCATTCAAAAGAAGTGCTTGAGAACCAACCACAAGTTATCAGTTCGTGCAGAGTACAATGATGGTAATAGAAATGGAG
GTGGGGACTTTGTTGCTGGTTTTCTTCTTGGGGGTGCAGTATTTGGAACTTTAGCTTATATTTTTGCTCCGCAGATCAGGAGATCTCTACTGAATGAAGATGAGTACGGT
TTTAGGAGGGCTAAGCGTCCAATCTACTACGATGAAGGTTTAGAGAAAACCAGACAGACGTTGAATGCAAAAATAAGCCAATTGAATTCTGCCATTGACAATGTATCTTC
ACGTCTGAGAGGTGGCAACAATACTCCAGCTGTGCCAGTTGAAGCCGATCCTGAGATAGAAGCTACCATAATTCTGAAACAAGGACTCAGTTCATTTCATGGCCACCGGA
ATGTCTTACCTTCATTGTATTCTGATGAAAAACCAACAGCGCCGCCACCAGCACCGCCAATCGCAGCTATTACCGGCCCCTCCGACCACCCATCGGAGAAATTGGGCATT
TTATGGGAAGGTGGGTTGGTCTTGGCTTCTATGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAACFAPSLSVSGKSFLLYLKIAVQGGLIKASDLSSKSISFGQAPKLAIQKKCLRTNHKLSVRAEYNDGNRNGGGDFVAGFLLGGAVFGTLAYIFAPQIRRSLLNEDEYG
FRRAKRPIYYDEGLEKTRQTLNAKISQLNSAIDNVSSRLRGGNNTPAVPVEADPEIEATIILKQGLSSFHGHRNVLPSLYSDEKPTAPPPAPPIAAITGPSDHPSEKLGI
LWEGGLVLASM

Sgr021244 (gene) of Monk fruit (Qingpiguo) v1 genome