CuGenDBv2

Gene ID	Sgr018821
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	DNA-directed RNA polymerase I subunit like
Genome location	tig00153210:1000883..1003610
RNA-Seq Expression	Sgr018821
Synteny	Sgr018821
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6601207.1 hypothetical protein SDJN03_06440, partial [Cucurbita argyrosperma subsp. sororia]

4.4e-41

73.88

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGFLT+P QW  +  P L S+S+P S STRS  + P +K  LHY    ++SQIPG R RFTA + NN NGLGGNIKEREGERNGAKGSNG DDLRKERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQ
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQ
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQ

KAG7032002.1 hypothetical protein SDJN02_06044, partial [Cucurbita argyrosperma subsp. argyrosperma]

9.8e-41

67.76

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGFLT+P QW  +  P L S+S+P S STRS  +   +K  LHY     +SQIPG R RFTA + NN NGLGGNIKEREGERNGAKGSNG DDLRKERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

XP_022139143.1 uncharacterized protein LOC111010120 [Momordica charantia]

8.8e-50

74.34

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGF TLPCQWSS S+  LSST TPSS+S  SLR  P +K +LHYA   T+SQIP NR RFTAFSGN  NGLGGNIKEREGER GAKGSNGGDDL+KERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

XP_022957096.1 uncharacterized protein LOC111458579 [Cucurbita moschata]

2.8e-40

67.11

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGFLT+P QW  +  P L S+S+P S STRS  +   +K  LHY    ++SQIPG R RFTA + NN NGLGGNIKEREGERNGAKGS G DDLRKERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

XP_023549272.1 uncharacterized protein LOC111807677 [Cucurbita pepo subsp. pepo]

2.7e-43

69.74

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGFLT+P QW  +  P LSS+S+P S STRS  + P +K  LHY    ++SQIPG R RFTA + NN NGLGGNIKEREGERNGAKGSNGGDDLRKERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BFX0 uncharacterized protein LOC103489407

3.1e-32

61.04

Show/hide

Query:  MLGFLTLPCQWS-STSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAK-GSNGGDDLRKE
        MLGFLT+P Q   S SL  L S S+PSS         P YK  LH+ F  ++  I  NR RFTA + N     GG+IKEREGERNGAK  SNGGDDL+KE
Subjt:  MLGFLTLPCQWS-STSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAK-GSNGGDDLRKE

Query:  RGPVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        RGPV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  RGPVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

A0A5D3CD16 Uncharacterized protein

3.1e-32

61.04

Show/hide

Query:  MLGFLTLPCQWS-STSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAK-GSNGGDDLRKE
        MLGFLT+P Q   S SL  L S S+PSS         P YK  LH+ F  ++  I  NR RFTA + N     GG+IKEREGERNGAK  SNGGDDL+KE
Subjt:  MLGFLTLPCQWS-STSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAK-GSNGGDDLRKE

Query:  RGPVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        RGPV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  RGPVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

A0A6J1CF05 uncharacterized protein LOC111010120

4.3e-50

74.34

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGF TLPCQWSS S+  LSST TPSS+S  SLR  P +K +LHYA   T+SQIP NR RFTAFSGN  NGLGGNIKEREGER GAKGSNGGDDL+KERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

A0A6J1GYA2 uncharacterized protein LOC111458579

1.4e-40

67.11

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGFLT+P QW  +  P L S+S+P S STRS  +   +K  LHY    ++SQIPG R RFTA + NN NGLGGNIKEREGERNGAKGS G DDLRKERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

A0A6J1JWP5 uncharacterized protein LOC111489528

3.1e-40

66.45

Show/hide

Query:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG
        MLGFLT+P QW  +  P LSS+S+P   STRS  + P +K  LHY    ++SQI G R RF A + NN NGLGGNIKEREGERNGAKGS G DDLRKERG
Subjt:  MLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAFPETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERG

Query:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK
        PV NIKWAELLIDPDPDNILAVALTGLLAWASVQV W +   S ++L   +K
Subjt:  PVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV-WCVIMPSPSVLWKVVK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G40045.1 unknown protein

4.6e-04

39.44

Show/hide

Query:  SGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERGPVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV
        +  NGN    + KE  G  N    ++ G+  +K++    + KW ELL +PD DN +AV L G+L WAS+QV
Subjt:  SGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERGPVLNIKWAELLIDPDPDNILAVALTGLLAWASVQV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAACGCATGTGAACCGAACCCGGACCCGGAGCCGAACCCGAACTATAATGGGTTCCAAACTTCCAACCGTCTTAGATTTTTCACAGCCTTGTCTCCCTCAGCCGAAAG
ACATGGATGCCGCGAACGGCTGCAGATTCCGGTATATTTTCCGCACGCCGCACGCGGGAGAAAATTGAAGAGAAAAAATATGTTAGGGTTTCTTACACTCCCATGCCAAT
GGAGTTCCACATCTCTCCCCTTTCTCTCCTCAACTTCCACACCTTCTTCTGCCTCAACAAGATCTCTCCGCGCCCCTCCAAGCTATAAACTCTCCCTCCATTACGCGTTT
CCCGAAACGCAGTCTCAAATTCCTGGAAACCGCACAAGATTTACGGCCTTTTCGGGCAATAATGGTAATGGTTTGGGCGGAAATATCAAGGAGAGAGAAGGAGAAAGAAA
TGGGGCGAAGGGCTCCAATGGCGGCGACGATTTGAGGAAAGAACGGGGGCCGGTTCTCAATATCAAATGGGCCGAACTTCTAATCGACCCGGATCCGGACAACATCTTGG
CGGTTGCATTGACTGGTTTGCTTGCTTGGGCAAGCGTTCAGGTCTGGTGTGTCATTATGCCTTCTCCCTCTGTTTTGTGGAAAGTTGTTAAACAAATTCTACGTTACTCA
GAAGGTACTCTTGATGGTGGTTTGTTATATCCAAACCAAGCAATATATCTTTGGAAGGTTCTGCTGATTCCATTTGGGTATCAGATCCTTAATGACAGCATATCAACTTT
TGATTTTCGTTTCTGCTATGGTCACCTAGTGCGTCAAGCCTCTACTATCTCATGTTCGAGGCTGCATATAGTTATTGTGATATTGCGAATGCTACTCCGAGATTGTTACG
TTAACATATCAGGAGAATTATGCTCAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNACEPNPDPEPNPNYNGFQTSNRLRFFTALSPSAERHGCRERLQIPVYFPHAARGRKLKRKNMLGFLTLPCQWSSTSLPFLSSTSTPSSASTRSLRAPPSYKLSLHYAF
PETQSQIPGNRTRFTAFSGNNGNGLGGNIKEREGERNGAKGSNGGDDLRKERGPVLNIKWAELLIDPDPDNILAVALTGLLAWASVQVWCVIMPSPSVLWKVVKQILRYS
EGTLDGGLLYPNQAIYLWKVLLIPFGYQILNDSISTFDFRFCYGHLVRQASTISCSRLHIVIVILRMLLRDCYVNISGELCSX

Sgr018821 (gene) of Monk fruit (Qingpiguo) v1 genome