CuGenDBv2

Gene ID	Sgr023394
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Unknown protein
Genome location	tig00000892:2932686..2939857
RNA-Seq Expression	Sgr023394
Synteny	Sgr023394
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6605498.1 hypothetical protein SDJN03_02815, partial [Cucurbita argyrosperma subsp. sororia]

3.3e-56

82.24

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR---KKKD
        MASVCISNCINDAR PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE++NVPEKTNKCFGKVG MR  VSRRR   KKK 
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR---KKKD

Query:  DAAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
         A   E+      RK STLKKAKELSCAA TSVFRRLLSCTAKVDVADN RE
Subjt:  DAAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

XP_022146233.1 uncharacterized protein LOC111015497 [Momordica charantia]

4.8e-55

81.21

Show/hide

Query:  MASVCISNCINDAR--APVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK--
        MASVCISNCINDAR   PVRPTY NLY WPESDAEFIRSVSSKVNRA+RVVDSI CRQMYLRSYTFSR+D++VPEKTNKCF K+G+ +  +SRRRKKK  
Subjt:  MASVCISNCINDAR--APVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK--

Query:  DDAAGVEK-RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVREF
        +D    EK RK S LKKAKELSCAAFTSVFRRLLSCTAKVDVADNVREF
Subjt:  DDAAGVEK-RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVREF

XP_022946966.1 uncharacterized protein LOC111450987 [Cucurbita moschata]

7.5e-56

82.12

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR--KKKDD
        MASVCISNCINDAR PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE++N+PEKTNKCFGKVG MR  VSRRR  KKK  
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR--KKKDD

Query:  AAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
         A  E+      RK STLKKAKELSCAA TSVFRRLLSCTAKVDVADN RE
Subjt:  AAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

XP_023006939.1 uncharacterized protein LOC111499579 [Cucurbita maxima]

8.2e-55

79.22

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK----
        MASVCISNCINDAR PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE++NV EKTNKCFGKVG MR  VS RR KK    
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK----

Query:  -------DDAAGVEKRKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
               DD+  +  RK STLKKAKELSCAA TSVFRRLLSCTAKVDVADN RE
Subjt:  -------DDAAGVEKRKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

XP_023532318.1 uncharacterized protein LOC111794509 [Cucurbita pepo subsp. pepo]

2.2e-55

82.12

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR--KKKDD
        MASVCISNCINDAR PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE++NV EKTNKCFGKVG MR  VSRRR  KKK  
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR--KKKDD

Query:  AAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
        A   E+      RK STLKKAKELSCAA TSVFRRLLSCTAKVDVADN RE
Subjt:  AAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KET2 Uncharacterized protein

7.5e-54

81.21

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPE-KTNKCFGKVGIMRHTVSRRRKKKDDA
        MASVCISNCINDAR PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE+E+ PE KTNKCF KVG MR  +SRR+KKK  A
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPE-KTNKCFGKVGIMRHTVSRRRKKKDDA

Query:  A----GVEK-RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
        +    G EK RKSS LKKAKE+SCAA TSVFRRLLSCTAKVDVAD +RE
Subjt:  A----GVEK-RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

A0A5A7SXD3 Uncharacterized protein

4.9e-53

78.15

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPE-KTNKCFGKVGIMRHTVSRRRKKKDDA
        MASVCISNCINDA  PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE+E+ PE KTNKCF KVG MR  +SRR+KKK  A
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPE-KTNKCFGKVGIMRHTVSRRRKKKDDA

Query:  AGVEK-------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
        +  E        RKSS LKKAKE+SCAA TSVFRRLLSCTAKVDVAD +RE
Subjt:  AGVEK-------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

A0A6J1CY16 uncharacterized protein LOC111015497

2.3e-55

81.21

Show/hide

Query:  MASVCISNCINDAR--APVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK--
        MASVCISNCINDAR   PVRPTY NLY WPESDAEFIRSVSSKVNRA+RVVDSI CRQMYLRSYTFSR+D++VPEKTNKCF K+G+ +  +SRRRKKK  
Subjt:  MASVCISNCINDAR--APVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK--

Query:  DDAAGVEK-RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVREF
        +D    EK RK S LKKAKELSCAAFTSVFRRLLSCTAKVDVADNVREF
Subjt:  DDAAGVEK-RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVREF

A0A6J1G522 uncharacterized protein LOC111450987

3.6e-56

82.12

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR--KKKDD
        MASVCISNCINDAR PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE++N+PEKTNKCFGKVG MR  VSRRR  KKK  
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRR--KKKDD

Query:  AAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
         A  E+      RK STLKKAKELSCAA TSVFRRLLSCTAKVDVADN RE
Subjt:  AAGVEK------RKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

A0A6J1L3K0 uncharacterized protein LOC111499579

4.0e-55

79.22

Show/hide

Query:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK----
        MASVCISNCINDAR PVRPTYINLYKWPESDAEFIRSVSSK+NR +RVVDSISCRQMYLRSYTFSRE++NV EKTNKCFGKVG MR  VS RR KK    
Subjt:  MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKK----

Query:  -------DDAAGVEKRKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE
               DD+  +  RK STLKKAKELSCAA TSVFRRLLSCTAKVDVADN RE
Subjt:  -------DDAAGVEKRKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVRE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G46300.1 unknown protein

2.5e-17

42.07

Show/hide

Query:  MASVCISNCINDARAP--VRP--TYINLYKWPESDAEFIRSVSSKVNR-ATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKK
        MAS CI +C+N  R    VRP  TY NLYKWP ++AEF+RS++   ++  T VVDSISCRQMYLRSYTFS E+    E  +   G+    RH  S  R  
Subjt:  MASVCISNCINDARAP--VRP--TYINLYKWPESDAEFIRSVSSKVNR-ATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKK

Query:  KDDAAGVEKRKSSTLKKAKELSCAAFT-SVFRRLLSCTAKVDVAD
             G +K   + ++  K  SC  F   + R+ LSC +   V +
Subjt:  KDDAAGVEKRKSSTLKKAKELSCAAFT-SVFRRLLSCTAKVDVAD

AT3G46310.1 unknown protein

2.9e-13

50.67

Show/hide

Query:  MASVCISNCIN--DARAPVRP--TYINLYKWPESDAEFIRSVSSKVN-RATRVVDSISCRQMYLRSYTFSREDEN
        MAS CI +C+N  +    VRP  T+  ++KWP ++ EF++S+S   + R T  V+S+SCRQMYLRSYTFSR++EN
Subjt:  MASVCISNCIN--DARAPVRP--TYINLYKWPESDAEFIRSVSSKVN-RATRVVDSISCRQMYLRSYTFSREDEN

AT5G02640.1 unknown protein

1.3e-29

52.76

Show/hide

Query:  MASVCISNCINDA---RAPVRP---TYINLYKWPESDAEFIRSVSSKVN-RATRVVDSISCRQMYLRSYTFSRE-DENVPEKTN-----KCFGKVGIMRH
        M SVCIS+CINDA   R PVRP   +Y+NLYKWPESDAEF+RSV       A RVVDSISCRQMYLRSYTFSRE DE+  EK +      C G+V   + 
Subjt:  MASVCISNCINDA---RAPVRP---TYINLYKWPESDAEFIRSVSSKVN-RATRVVDSISCRQMYLRSYTFSRE-DENVPEKTN-----KCFGKVGIMRH

Query:  TVSRRRKKKDDAAGV-----------EKRKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVAD
        T S RRK K++   +           EKR+ S  K  +E +C+    +FRRLLSC A VDV D
Subjt:  TVSRRRKKKDDAAGV-----------EKRKSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVAD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCTCTGTTTGCATATCCAACTGCATCAACGACGCCCGCGCCCCCGTCCGTCCCACCTACATAAACCTCTACAAGTGGCCGGAATCCGACGCCGAGTTCATC
CGATCCGTCAGCTCCAAAGTCAACAGAGCAACCCGCGTCGTCGACAGCATCTCTTGCCGCCAGATGTACCTGAGGAGCTACACCTTCTCCAGGGAGGACGAGAAC
GTCCCGGAGAAGACGAACAAATGCTTCGGCAAAGTCGGGATCATGAGACACACAGTTTCTCGCCGGAGAAAGAAGAAGGACGACGCCGCCGGCGTTGAGAAGCGG
AAGAGTTCCACGCTCAAGAAGGCCAAGGAGTTGTCGTGCGCCGCCTTCACCTCCGTCTTCCGCCGGTTGCTATCCTGCACCGCCAAAGTCGACGTGGCCGATAAT
GTGCGGGAGTTCACTTTTTCGCTTCTCAATGGTCGTCAATGGGATCCGATTCAGCGAAGAAGCGACGGTGATGGTGTACGGAGAAATATGTCACCTACCCTCGGA
TTTCACCAGCTGAGAGAACACCCTACTCATGGAGACTCCAGAAAGATCATCAACACCCGGAATGTCAAACCGTGTGGCAGAAACACCCGCCTCGATGTCATTGAA
ATTGTTAATTTGTGGAGAGAGCTCGCCAATCATGTTTGTACTGTTATCTTCGGGATCAACTTCAATGACAGCTTCTTAGTAGAATCAATGATTTGGTCCAACTGC
CCTCTCTTCTGCCATTTCATTGCCCATTCAGCTAAGTTTACCATTTCTCTAGGAAGGGTTGGATCTATGACAGGATCAAGGTACCCAAAACTCCCTTTCACAGCT
GTACTGACATGGGTTTGGTCAATTTCAGGCCCTGTCTTTGAAAGCCCAAACATAACCGGTGTGAAGGTAATGAAGTCCTCTAGCGGCCCCAATGCAGACCTCCAG
TCTCTCCTTCCAGCTCAAACTAGGGAAACCAGAACCATAGAGATGACCTTTCAGGCAGTGGATATTGAAATCCATGTCTTCGATGGAGCTGGACGCATAGCATTT
CTTTTTCGTCTGTGCAACATAAACAGAATGCCAACCAATATGGCTGCAACAGATGCCCCAACACTCACGCCCACAATGACGCCAACATGCTTATTTGAAGAAGTC
GAGTCTGGAAAATTAATTACAGAGTCTTCCCCACTAAGACTACCAACAGAGTTGTTCATTTTCAGGATTTCCAGACCATTTAGAATGGCATTTGGATACACATTA
GCTAAAGTTGACGGGCCAATACTTACAAGAACGATAAGAATGTCAGGAACAGAAGCAACTTCAATGGCATTCAGATATGCTAAGGAGCCATTGGCAGGAGCAAAA
ATAACTTCAAGAGTATCTGATGTCACTGAAGATTCTAGCCGTTTCGAACAGCGACGAATCATTAGAAGTGGCGGGTATCGAAGTCGTATTAGCCAGAATGACTTG
CGGGAAAAGCAAGGCAGCAACGAAATTAACAAAACCCAGAAGAGTAATCCAAATCTTCTTCTACAATCCATCGCTACAGTCAGAACCCAGGAAAACGACCGAGAA
AGAACACCCTTATCATCAGAGATCCAGACAGTGATAGACCCTCTATATCCCTCGGGAGGAGGCAAATCTGAGGCCAACAAGGAAGCAACAGGGAAGCAAGGCCAG
CAAGAAAACGCCAGAAAGAACAGAAGCTATCGCCGAGAAATGAAAGGAGCAACGGAGAAAAGGGAGGTTAAGCCGTCCACCACGAGGCAGTCATCAGTGAGCACA
TGGATTTCGGGTTTTCGGGTCCGAGTCCTCTACGGTCTTGGATCTAAAAATTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASVCISNCINDARAPVRPTYINLYKWPESDAEFIRSVSSKVNRATRVVDSISCRQMYLRSYTFSREDENVPEKTNKCFGKVGIMRHTVSRRRKKKDDAAGVEKR
KSSTLKKAKELSCAAFTSVFRRLLSCTAKVDVADNVREFTFSLLNGRQWDPIQRRSDGDGVRRNMSPTLGFHQLREHPTHGDSRKIINTRNVKPCGRNTRLDVIE
IVNLWRELANHVCTVIFGINFNDSFLVESMIWSNCPLFCHFIAHSAKFTISLGRVGSMTGSRYPKLPFTAVLTWVWSISGPVFESPNITGVKVMKSSSGPNADLQ
SLLPAQTRETRTIEMTFQAVDIEIHVFDGAGRIAFLFRLCNINRMPTNMAATDAPTLTPTMTPTCLFEEVESGKLITESSPLRLPTELFIFRISRPFRMAFGYTL
AKVDGPILTRTIRMSGTEATSMAFRYAKEPLAGAKITSRVSDVTEDSSRFEQRRIIRSGGYRSRISQNDLREKQGSNEINKTQKSNPNLLLQSIATVRTQENDRE
RTPLSSEIQTVIDPLYPSGGGKSEANKEATGKQGQQENARKNRSYRREMKGATEKREVKPSTTRQSSVSTWISGFRVRVLYGLGSKN

Sgr023394 (gene) of Monk fruit (Qingpiguo) v1 genome