CuGenDBv2

Gene ID	Sgr028645
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Protein SOB FIVE-LIKE 5
Genome location	tig00153204:3057228..3058507
RNA-Seq Expression	Sgr028645
Synteny	Sgr028645
Gene Ontology terms	GO:0009691 - cytokinin biosynthetic process (biological process) GO:0009736 - cytokinin-activated signaling pathway (biological process)
InterPro domains	IPR044670 - SOB-five-Like (SOFL) family

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004142900.1 uncharacterized protein LOC101210927 [Cucumis sativus]

4.7e-33

56.36

Show/hide

Query:  MSNLSGTHY-NSGCESGWTVYFEESLESEAERFGRSVVDYGGG---EEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAK-SAAKSKRKED
        MSN +G+H  NSGCESGWT+YFEES+E+E ERF  S VDYGGG   EEEE DLSM+SDASSGPRNG+ +       E+NCQS+ R+G K  A KSKR+E+
Subjt:  MSNLSGTHY-NSGCESGWTVYFEESLESEAERFGRSVVDYGGG---EEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAK-SAAKSKRKED

Query:  MGCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST
        MG RNQHSCLDDTASSPVFGLSK+   + Y +     G   N + F     RK+  K +    S+
Subjt:  MGCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST

XP_022132075.1 uncharacterized protein LOC111005036 isoform X1 [Momordica charantia]

2.5e-34

72.27

Show/hide

Query:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR
        MSN SGTH NSGC+SGWTVYF++S     ERF  SV DYGGG EEEGDLSMVSDASSGPRNGFGDG +GF  E N Q + RRNG KSAAK+KR++++G R
Subjt:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR

Query:  NQHSCLDDTASSPVFGLSK
        NQHS LDDTA+SPVF LSK
Subjt:  NQHSCLDDTASSPVFGLSK

XP_022132076.1 uncharacterized protein LOC111005036 isoform X2 [Momordica charantia]

1.1e-34

59.01

Show/hide

Query:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR
        MSN SGTH NSGC+SGWTVYF++S     ERF  SV DYGGG EEEGDLSMVSDASSGPRNGFGDG +GF  E N Q + RRNG KSAAK+KR++++G R
Subjt:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR

Query:  NQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST
        NQHS LDDTA+SPVF LSK       N        ++N + F +   RK Q K S  ++S+
Subjt:  NQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST

XP_022132077.1 uncharacterized protein LOC111005036 isoform X3 [Momordica charantia]

2.5e-34

72.27

Show/hide

Query:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR
        MSN SGTH NSGC+SGWTVYF++S     ERF  SV DYGGG EEEGDLSMVSDASSGPRNGFGDG +GF  E N Q + RRNG KSAAK+KR++++G R
Subjt:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR

Query:  NQHSCLDDTASSPVFGLSK
        NQHS LDDTA+SPVF LSK
Subjt:  NQHSCLDDTASSPVFGLSK

XP_038886134.1 uncharacterized protein LOC120076391 isoform X2 [Benincasa hispida]

2.1e-33

55.31

Show/hide

Query:  MSNLSGTH-YNSGCESGWTVYFEESLESEAERFGRSVVDYGGG--EEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAA-KSKRKEDM
        MSN SG+H  NSGCESGWT+YFEES+E+E   F RS VDYGGG  EEEEGDLSM+SDASSGP NG+ +       E N Q +RRNG KSAA KSKRKE+M
Subjt:  MSNLSGTH-YNSGCESGWTVYFEESLESEAERFGRSVVDYGGG--EEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAA-KSKRKEDM

Query:  GCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNSTVAVAAGSSVRLAGQN
        G RNQHSCLDDTASSPVFGLS V  +  Y +     G ++N + F      + Q    Q      +    SSV+  G+N
Subjt:  GCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNSTVAVAAGSSVRLAGQN

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LR31 Uncharacterized protein

2.3e-33

56.36

Show/hide

Query:  MSNLSGTHY-NSGCESGWTVYFEESLESEAERFGRSVVDYGGG---EEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAK-SAAKSKRKED
        MSN +G+H  NSGCESGWT+YFEES+E+E ERF  S VDYGGG   EEEE DLSM+SDASSGPRNG+ +       E+NCQS+ R+G K  A KSKR+E+
Subjt:  MSNLSGTHY-NSGCESGWTVYFEESLESEAERFGRSVVDYGGG---EEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAK-SAAKSKRKED

Query:  MGCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST
        MG RNQHSCLDDTASSPVFGLSK+   + Y +     G   N + F     RK+  K +    S+
Subjt:  MGCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST

A0A6J1BR82 uncharacterized protein LOC111005036 isoform X2

5.4e-35

59.01

Show/hide

Query:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR
        MSN SGTH NSGC+SGWTVYF++S     ERF  SV DYGGG EEEGDLSMVSDASSGPRNGFGDG +GF  E N Q + RRNG KSAAK+KR++++G R
Subjt:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR

Query:  NQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST
        NQHS LDDTA+SPVF LSK       N        ++N + F +   RK Q K S  ++S+
Subjt:  NQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNST

A0A6J1BRF5 uncharacterized protein LOC111005036 isoform X1

1.2e-34

72.27

Show/hide

Query:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR
        MSN SGTH NSGC+SGWTVYF++S     ERF  SV DYGGG EEEGDLSMVSDASSGPRNGFGDG +GF  E N Q + RRNG KSAAK+KR++++G R
Subjt:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR

Query:  NQHSCLDDTASSPVFGLSK
        NQHS LDDTA+SPVF LSK
Subjt:  NQHSCLDDTASSPVFGLSK

A0A6J1BSU7 uncharacterized protein LOC111005036 isoform X3

1.2e-34

72.27

Show/hide

Query:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR
        MSN SGTH NSGC+SGWTVYF++S     ERF  SV DYGGG EEEGDLSMVSDASSGPRNGFGDG +GF  E N Q + RRNG KSAAK+KR++++G R
Subjt:  MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSL-RRNGAKSAAKSKRKEDMGCR

Query:  NQHSCLDDTASSPVFGLSK
        NQHS LDDTA+SPVF LSK
Subjt:  NQHSCLDDTASSPVFGLSK

A0A6J1K5J3 uncharacterized protein LOC111492483

5.1e-33

57.5

Show/hide

Query:  MSNLSGTH-YNSGCESGWTVYFEESLESEAERFGRSVVDYGG------GEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAK-SAAKSKR
        MS+ SG+H  N+ CESGWT+Y EES E+E  RF  S VDYGG       EEEEGDLSM+SDASSGPR+G+         EENCQS+RRNG K +AAKSKR
Subjt:  MSNLSGTH-YNSGCESGWTVYFEESLESEAERFGRSVVDYGG------GEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAK-SAAKSKR

Query:  KEDMGCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPK
        KEDMG RN+HSCLDDTASSPVFGLSK    + Y +     G ++N + F     RK   K
Subjt:  KEDMGCRNQHSCLDDTASSPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPK

SwissProt top hits

e value

%identity

Alignment

Q8L9K4 Protein SOB FIVE-LIKE 5

3.8e-09

38.02

Show/hide

Query:  NSGCESGWTVYFEESLES------------EAERFGRSVVD----YGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAAKSKRK
        +SGCESGWT+Y ++S+ S            ++ R  +   D    +   EEEE DLSM+SDASSGPRN         S E++ + +   G K   K ++K
Subjt:  NSGCESGWTVYFEESLES------------EAERFGRSVVD----YGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAAKSKRK

Query:  EDMGCRNQHSCLDDTASSPVF
                +S LDDTASSP+F
Subjt:  EDMGCRNQHSCLDDTASSPVF

Arabidopsis top hits

e value

%identity

Alignment

AT1G58460.1 unknown protein

1.7e-04

34.78

Show/hide

Query:  NLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGE---EEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAAKSKRK--EDMG
        + S   Y+   +SGWT+Y   S       F     DY  GE   E + D SMVSDASSGP     +       ++N Q   ++ +K+  K+K+K  E+ G
Subjt:  NLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGE---EEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAAKSKRK--EDMG

Query:  CRNQ-HSCLDDTASS
           + +S  DDTASS
Subjt:  CRNQ-HSCLDDTASS

AT4G33800.1 unknown protein

2.7e-10

38.02

Show/hide

Query:  NSGCESGWTVYFEESLES------------EAERFGRSVVD----YGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAAKSKRK
        +SGCESGWT+Y ++S+ S            ++ R  +   D    +   EEEE DLSM+SDASSGPRN         S E++ + +   G K   K ++K
Subjt:  NSGCESGWTVYFEESLES------------EAERFGRSVVD----YGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAAKSKRK

Query:  EDMGCRNQHSCLDDTASSPVF
                +S LDDTASSP+F
Subjt:  EDMGCRNQHSCLDDTASSPVF

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGTAATTTATCGGGTACGCATTATAATAGCGGGTGTGAGTCGGGTTGGACGGTGTATTTCGAGGAATCGTTAGAGTCTGAGGCGGAGAGATTTGGGCGGAGTGTGGT
GGATTACGGCGGAGGGGAGGAGGAAGAAGGGGACTTGTCGATGGTTTCCGATGCGTCGTCGGGGCCGCGGAATGGGTTTGGAGATGGACAAATTGGGTTTTCGTTTGAGG
AGAACTGCCAATCTCTCCGGCGGAATGGTGCGAAATCGGCGGCGAAAAGTAAGAGGAAAGAGGACATGGGCTGCCGGAACCAACATTCCTGCCTTGATGACACTGCTAGC
TCCCCCGTTTTCGGGCTTTCAAAGGTGACTTTACTTGATCTGTACAATCATAGGCCTTGGCCACTTGGAAATTTGCAAAACAGACGAGCTTTTTTCAATCTTCCTCTGCG
AAAAAATCAACCAAAAATGTCTCAGGTAAAAAACTCAACCGTCGCAGTTGCCGCCGGCAGCTCTGTTCGTCTCGCGGGGCAAAATGGGAATGACGTTGCAGCACAACAGA
AGGAGAATGGCCAGAAGAAGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSNLSGTHYNSGCESGWTVYFEESLESEAERFGRSVVDYGGGEEEEGDLSMVSDASSGPRNGFGDGQIGFSFEENCQSLRRNGAKSAAKSKRKEDMGCRNQHSCLDDTAS
SPVFGLSKVTLLDLYNHRPWPLGNLQNRRAFFNLPLRKNQPKMSQVKNSTVAVAAGSSVRLAGQNGNDVAAQQKENGQKK

Sgr028645 (gene) of Monk fruit (Qingpiguo) v1 genome