CuGenDBv2

Gene ID	Sgr015758
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	GATA transcription factor-like protein
Genome location	tig00005725:58284..59105
RNA-Seq Expression	Sgr015758
Synteny	Sgr015758
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6575793.1 hypothetical protein SDJN03_26432, partial [Cucurbita argyrosperma subsp. sororia]

1.7e-91

74.39

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA
        M SRLTA  +K NW FS AQFQ LRR GL    T RTA+P VHA DDN PAV SGEPE+SQD  EPD A++NY+R+DS Q D      NGPFAPPK QYA
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA

Query:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI
        SSPRLE+T V Q SKPITQQKR H TV+DDVSCIG  GGP   ++ +R  DRKEQE+D+R+YYKHHKASPLAEIEF DTRKPITRATDGTAYDGGGKDVI
Subjt:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI

Query:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        GWLPEQ DT +DSL+RATEIWKQNAMRGDPDAPQSRVLRALRGE+F
Subjt:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

XP_022151127.1 uncharacterized protein LOC111019128 [Momordica charantia]

3.1e-101

79.18

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYAS
        M SRLTA    S WAFS AQ   LRRGL    TGRTA+P VHAVDDNDPAV SGEPEKSQ+V+EPD+A+ANYDREDS     GK  KNGPF P K QY S
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYAS

Query:  SPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG
        SPRLEST VGQPSKPITQQKR HGTVIDDVSC+G  GGP  E+KD RRT R+E+EED+R+YYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG
Subjt:  SPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG

Query:  WLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        WLPEQ+DTAEDSLRR TEIWK+NA+RGDPDAPQSRVLRALRGE+F
Subjt:  WLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

XP_022991237.1 uncharacterized protein LOC111487953 [Cucurbita maxima]

4.9e-91

75.61

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA
        M SRLTA  +K NWAFS AQFQ LRR GL    T RTA+P VHA DDN PAV SGEPE+SQD  EPD A+ANY  +DS Q D      NGPFAPPK QYA
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA

Query:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI
        SSPRLE+T V Q SKPITQQKR H TV+ DVSCIG  GGP  E++ +R  DRKEQEED+R+YYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI
Subjt:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI

Query:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
         WLPEQ DT +DSLRRATEIWKQNAMRGDPDAPQSRVLRALRGE+F
Subjt:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

XP_023548846.1 uncharacterized protein LOC111807374 [Cucurbita pepo subsp. pepo]

2.2e-91

74.8

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA
        M SRLTA  +K NW+FS AQFQ LRR GL    T RTA+P VHA DDN PAV SGEPE+SQD  EPD A+ANY+R+DS Q D      NGPFAPPK QYA
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA

Query:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI
        SSPRLE+T V Q SKPITQQKR H TV+ DVSCIG  GGP   ++ +R  DRKEQEED+R+YYKHHKASPLAEIEF DTRKPITRATDGTAYDGGGKDVI
Subjt:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI

Query:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        GWLPEQ DT +DSLRRA EIWKQNAMRGDPDAPQSRVLRALRGE+F
Subjt:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

XP_038899333.1 uncharacterized protein LOC120086662 isoform X1 [Benincasa hispida]

1.7e-91

74.29

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYAS
        M SRLTA   KSNWA S AQFQ LRR   +  T RTA+P VHA DDNDPAV SGEPE+SQD  EPD+ +ANY+R+D    D      NGPF  PK Q+AS
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYAS

Query:  SPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG
        SPRLE+  VGQ SKPITQQKR   TV D+VSCIGVYGGPL + K++R T+ KEQEED+RDYYKHHKASPLAEIEFADTRKPITRATDGTAYDG GKDVIG
Subjt:  SPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG

Query:  WLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        WLPEQLDT +DSLRRATEIWKQNAMRGDPDAPQSR+LRALRGE+F
Subjt:  WLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K9G7 Uncharacterized protein

7.9e-87

71.77

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHA---VDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQ
        M S L A   KSNWAF   QFQ LRRG  +  T RTA+P +HA    DDNDPAV SGEPE+SQD  EPD+A+ANYDR D    D  +    GPF  P  Q
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHA---VDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQ

Query:  YASSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKD
        +ASSPRLE+T VGQ SKPITQQKR H   IDDVSCIGVYGGPL + K++R T+ KE+EED+RDYYKHHKASPLAEIEFADTRKPITRATDGTAYDG    
Subjt:  YASSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKD

Query:  VIGWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        VIGWLPEQ+DT +DSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
Subjt:  VIGWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

A0A1S3BR22 uncharacterized protein LOC103492778

1.3e-84

69.26

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDD--NDPAVSSGEPEKSQDVAEPDDAEANYD-REDSAQADLGKEGKNGPFAPPKPQ
        M SRL A   +SNWA    QFQ LRRG     TGRTA+P VHA DD  NDP+V SGEPE+SQD  EPD+A+ANY+ R+D  Q D      NGPF P K Q
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDD--NDPAVSSGEPEKSQDVAEPDDAEANYD-REDSAQADLGKEGKNGPFAPPKPQ

Query:  YASSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQE---------EDDRDYYKHHKASPLAEIEFADTRKPITRATDG
        +ASSPRLE+T VGQ SKPITQQKR H   IDDVSCIGVYGGPL E K+ R T+ K++E         ED+RDYYKHHKASPLAEIEF DTRKPITRATDG
Subjt:  YASSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQE---------EDDRDYYKHHKASPLAEIEFADTRKPITRATDG

Query:  TAYDGGGKDVIGWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        TA  G GK VIGWLPEQ+DT +DSLRRATEIWKQNAMRGDPDAPQSRVLRALRGE+F
Subjt:  TAYDGGGKDVIGWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

A0A6J1DCP1 uncharacterized protein LOC111019128

1.5e-101

79.18

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYAS
        M SRLTA    S WAFS AQ   LRRGL    TGRTA+P VHAVDDNDPAV SGEPEKSQ+V+EPD+A+ANYDREDS     GK  KNGPF P K QY S
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYAS

Query:  SPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG
        SPRLEST VGQPSKPITQQKR HGTVIDDVSC+G  GGP  E+KD RRT R+E+EED+R+YYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG
Subjt:  SPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIG

Query:  WLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        WLPEQ+DTAEDSLRR TEIWK+NA+RGDPDAPQSRVLRALRGE+F
Subjt:  WLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

A0A6J1GPT4 uncharacterized protein LOC111456388

2.0e-90

73.17

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA
        M SRLTA  +K NW FS AQFQ LRR GL    T RTA+P VHA DDN PAV SGEPE+SQD  EPD A++NY+R+DS Q D      NGPFAPPK QYA
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA

Query:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI
        SSPRLE+T V Q SKPITQQKR H TV+ DVSCIG  GGP   ++ +R  DRKEQ++D+R+YYKHHKASPLAEIEF DTRKPITRATDGTAYDGGGKD+I
Subjt:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI

Query:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
        GWLPEQ DT +DSL+RATEIWKQNAMRGDPDAPQSRVLRALRGE+F
Subjt:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

A0A6J1JL82 uncharacterized protein LOC111487953

2.4e-91

75.61

Show/hide

Query:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA
        M SRLTA  +K NWAFS AQFQ LRR GL    T RTA+P VHA DDN PAV SGEPE+SQD  EPD A+ANY  +DS Q D      NGPFAPPK QYA
Subjt:  MLSRLTATVAKSNWAFSPAQFQCLRR-GLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYA

Query:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI
        SSPRLE+T V Q SKPITQQKR H TV+ DVSCIG  GGP  E++ +R  DRKEQEED+R+YYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI
Subjt:  SSPRLESTAVGQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVI

Query:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF
         WLPEQ DT +DSLRRATEIWKQNAMRGDPDAPQSRVLRALRGE+F
Subjt:  GWLPEQLDTAEDSLRRATEIWKQNAMRGDPDAPQSRVLRALRGEEF

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G02700.1 unknown protein

2.4e-51

49.61

Show/hide

Query:  MMLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDN-DPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQY
        MM SRL A  + +     P   + L  G  S+ +GRTA+P++HA +D  DPA+   +PE   DVA P  A A    +D+ +  L ++    P  PPK   
Subjt:  MMLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDN-DPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQY

Query:  ASSPRLESTAVGQPSKPITQQKRTHGTV----IDDVSCIGVYGGPLSEDKD--DRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYD
        A++ +LEST VG PS+P  QQKR + T     +D VSC G+ G P   D+   + +  R+++ E D+++YKHHKASPL+EIEFADTRKPIT+ATDGTAY 
Subjt:  ASSPRLESTAVGQPSKPITQQKRTHGTV----IDDVSCIGVYGGPLSEDKD--DRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYD

Query:  GGGKDVIGWLPEQLDTAEDSLRRATEIWKQNAMRGDPDA-PQSRVLRALRGEEF
          GKDVIGWLPEQLDTAE+SL +AT I+K+NA RGDP+  P SR+LR +RGE F
Subjt:  GGGKDVIGWLPEQLDTAEDSLRRATEIWKQNAMRGDPDA-PQSRVLRALRGEEF

AT4G02140.1 unknown protein

6.8e-06

41.94

Show/hide

Query:  SAPTGRTANPDVHAVDDND-PAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYASSPRLESTAVGQPSKPITQQKR
        S+ TGRTA+P++HA +D D P++   +PE   DVA P    A+ D  D       KE    P +PPK    +S +LEST VG P+    QQKR
Subjt:  SAPTGRTANPDVHAVDDND-PAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYASSPRLESTAVGQPSKPITQQKR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATGTTATCGAGATTGACGGCGACGGTAGCCAAGTCGAATTGGGCCTTCTCTCCGGCCCAATTCCAATGTCTCCGTCGAGGTCTGCCGTCGGCTCCGACTGGTCGCAC
GGCTAACCCTGACGTTCATGCCGTCGATGACAACGATCCTGCCGTTTCATCCGGTGAACCTGAAAAATCGCAGGATGTTGCAGAACCAGATGATGCTGAAGCCAACTACG
ACAGAGAAGATTCTGCACAGGCAGATCTCGGCAAAGAAGGAAAAAATGGGCCGTTTGCACCACCGAAGCCCCAGTACGCTTCCTCCCCTCGGTTAGAGAGCACGGCGGTA
GGCCAGCCCTCGAAGCCAATCACTCAGCAAAAGAGAACCCACGGGACGGTGATCGACGACGTGAGCTGCATTGGAGTATACGGCGGCCCGTTGTCGGAGGACAAAGACGA
CCGACGAACCGACAGAAAAGAACAAGAAGAAGACGACAGAGATTACTACAAGCACCACAAAGCGTCGCCGTTGGCCGAAATCGAGTTTGCGGATACACGGAAGCCGATAA
CCAGAGCGACGGACGGGACGGCTTACGACGGCGGTGGGAAAGACGTGATCGGATGGCTGCCGGAGCAGCTGGACACGGCGGAGGATTCACTCCGGAGAGCGACGGAGATA
TGGAAACAAAACGCCATGCGTGGGGACCCTGATGCTCCGCAATCGAGGGTTCTTAGGGCTTTACGTGGCGAAGAGTTTTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MMLSRLTATVAKSNWAFSPAQFQCLRRGLPSAPTGRTANPDVHAVDDNDPAVSSGEPEKSQDVAEPDDAEANYDREDSAQADLGKEGKNGPFAPPKPQYASSPRLESTAV
GQPSKPITQQKRTHGTVIDDVSCIGVYGGPLSEDKDDRRTDRKEQEEDDRDYYKHHKASPLAEIEFADTRKPITRATDGTAYDGGGKDVIGWLPEQLDTAEDSLRRATEI
WKQNAMRGDPDAPQSRVLRALRGEEF

Sgr015758 (gene) of Monk fruit (Qingpiguo) v1 genome