CuGenDBv2

Gene ID	Sgr021962
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein .
Genome location	tig00153870:178475..179338
RNA-Seq Expression	Sgr021962
Synteny	Sgr021962
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0036575.1 uncharacterized protein E6C27_scaffold191G00850 [Cucumis melo var. makuwa]

1.1e-62

68.13

Show/hide

Query:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE
        RAN+LT  RI R+ GT  SS    CNSRS    P+TT  I PPYPWST  RA+V TLN LRS+QIL ITGDVRCR+C  +Y IEYD+V+KF+EIA+F+EE
Subjt:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE

Query:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLT
        NK+   DRAP SWM P +PTC+FC  E+GA PVIP+E R+INWLFLLLG+ LG+LNL HLKYFC+YTNNHRTGAKNRLLYLT
Subjt:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLT

XP_008447299.1 PREDICTED: uncharacterized protein LOC103489770 [Cucumis melo]

1.1e-70

68.18

Show/hide

Query:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE
        RAN+LT  RI R+ GT  SS    CNSRS    P+TT  I PPYPWST  RA+V TLN LRS+QIL ITGDVRCR+C  +Y IEYD+V+KF+EIA+F+EE
Subjt:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE

Query:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPNGPFDR
        NK+   DRAP SWM P +PTC+FC  E+GA PVIP+E R+INWLFLLLG+ LG+LNL HLKYFC+YTNNHRTGAKNRLLYLTY+TLC QVDP+G F+R
Subjt:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPNGPFDR

XP_011659748.1 uncharacterized protein LOC105436256 [Cucumis sativus]

4.0e-68

61.86

Show/hide

Query:  HPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQI
        H S+     P G +   R N++T +R+ RS GT  SS    CNSRS    P+TT  I PPYPWST  RA+V TLN L+SNQIL ITGDV+CR+C  +Y I
Subjt:  HPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQI

Query:  EYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTY
        EYD+ +KF+EIA+F+EENK+S  DRAP SWM P +PTC+FC  E+GA PVIP++ R+INWLFLLLG+ LG+LNL HLKYFC+ T NHRTGAKNRLLYLTY
Subjt:  EYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTY

Query:  LTLCKQVDPNGPFDR
        +TLC QVDP+G F+R
Subjt:  LTLCKQVDPNGPFDR

XP_022135937.1 uncharacterized protein LOC111007768 [Momordica charantia]

9.8e-67

53.87

Show/hide

Query:  SDNLALELSLRPP-----VNNRVVLQQQ----PPVLLPMPPLL-----FRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHS--SSG
        S NL ++LSLRPP         +++QQ+    PP L P P  L        T+NQ++  H STS+    +      RA +   +R R S     +   + 
Subjt:  SDNLALELSLRPP-----VNNRVVLQQQ----PPVLLPMPPLL-----FRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHS--SSG

Query:  GICNSRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKF
         +   R S  + K TPI+PPYPWSTE +AVVH LNYLR NQILTITGDVRC RC +QY IEYDL+TKF+EIA+FIE+NK +LHDRAP SW  P F  CK 
Subjt:  GICNSRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKF

Query:  CNLEDGAVPVIPE-ERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN
        C  E+   P IPE + + INWLFLLLGQ +G L LEHLKYFC YTNNHRTGAKNRL+YLTYLTLCKQ+ P+
Subjt:  CNLEDGAVPVIPE-ERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN

XP_022135938.1 probable serine/threonine-protein kinase samkC [Momordica charantia]

1.0e-63

50.88

Show/hide

Query:  DHRITPMETPKNADRSRESDNLALELSLRPPVNNRVVLQQQPPVLLPMPPLLFRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSF----GT
        ++++ P +   ++  S ES +  +  S   P+++    Q QP  L   P  L  Q   +  +PHPSTS+            + SL   R RRS      T
Subjt:  DHRITPMETPKNADRSRESDNLALELSLRPPVNNRVVLQQQPPVLLPMPPLLFRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSF----GT

Query:  YHSSSGGICN----SRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSW
        + SSS         SR    KPK T I PPYPWST  RAVVH L YL+ NQILTITGDV+C +C +QY+IEYDLVTKFDEIA+FIE+NKD+LHDRAPSSW
Subjt:  YHSSSGGICN----SRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSW

Query:  MYPKFPTCKFCNLEDGAVPVIP-----EERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN
          P  P CKFC  E    PVIP     ++ + INWLFLLLGQ +G L L+HLKYFCTYTNNHRT AK+RL+YLTYL+LCKQ+ P+
Subjt:  MYPKFPTCKFCNLEDGAVPVIP-----EERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K3Q8 Uncharacterized protein

1.9e-68

61.86

Show/hide

Query:  HPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQI
        H S+     P G +   R N++T +R+ RS GT  SS    CNSRS    P+TT  I PPYPWST  RA+V TLN L+SNQIL ITGDV+CR+C  +Y I
Subjt:  HPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQI

Query:  EYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTY
        EYD+ +KF+EIA+F+EENK+S  DRAP SWM P +PTC+FC  E+GA PVIP++ R+INWLFLLLG+ LG+LNL HLKYFC+ T NHRTGAKNRLLYLTY
Subjt:  EYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTY

Query:  LTLCKQVDPNGPFDR
        +TLC QVDP+G F+R
Subjt:  LTLCKQVDPNGPFDR

A0A1S3BHR1 uncharacterized protein LOC103489770

5.4e-71

68.18

Show/hide

Query:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE
        RAN+LT  RI R+ GT  SS    CNSRS    P+TT  I PPYPWST  RA+V TLN LRS+QIL ITGDVRCR+C  +Y IEYD+V+KF+EIA+F+EE
Subjt:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE

Query:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPNGPFDR
        NK+   DRAP SWM P +PTC+FC  E+GA PVIP+E R+INWLFLLLG+ LG+LNL HLKYFC+YTNNHRTGAKNRLLYLTY+TLC QVDP+G F+R
Subjt:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPNGPFDR

A0A5A7T547 Uncharacterized protein

5.4e-63

68.13

Show/hide

Query:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE
        RAN+LT  RI R+ GT  SS    CNSRS    P+TT  I PPYPWST  RA+V TLN LRS+QIL ITGDVRCR+C  +Y IEYD+V+KF+EIA+F+EE
Subjt:  RANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTT-PIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEE

Query:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLT
        NK+   DRAP SWM P +PTC+FC  E+GA PVIP+E R+INWLFLLLG+ LG+LNL HLKYFC+YTNNHRTGAKNRLLYLT
Subjt:  NKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLT

A0A6J1C462 uncharacterized protein LOC111007768

3.6e-67

54.24

Show/hide

Query:  SDNLALELSLRPP-----VNNRVVLQQQ----PPVLLPMPPLL-----FRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHS--SSG
        S NL +ELSLRPP         +++QQ+    PP L P P  L        T+NQ++  H STS+    +      RA +   +R R S     +   + 
Subjt:  SDNLALELSLRPP-----VNNRVVLQQQ----PPVLLPMPPLL-----FRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHS--SSG

Query:  GICNSRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKF
         +   R S  + K TPI+PPYPWSTE +AVVH LNYLR NQILTITGDVRC RC +QY IEYDL+TKF+EIA+FIE+NK +LHDRAP SW  P F  CK 
Subjt:  GICNSRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKF

Query:  CNLEDGAVPVIPE-ERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN
        C  E+   P IPE + + INWLFLLLGQ +G L LEHLKYFC YTNNHRTGAKNRL+YLTYLTLCKQ+ P+
Subjt:  CNLEDGAVPVIPE-ERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN

A0A6J1C690 probable serine/threonine-protein kinase samkC

4.9e-64

50.88

Show/hide

Query:  DHRITPMETPKNADRSRESDNLALELSLRPPVNNRVVLQQQPPVLLPMPPLLFRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSF----GT
        ++++ P +   ++  S ES +  +  S   P+++    Q QP  L   P  L  Q   +  +PHPSTS+            + SL   R RRS      T
Subjt:  DHRITPMETPKNADRSRESDNLALELSLRPPVNNRVVLQQQPPVLLPMPPLLFRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSF----GT

Query:  YHSSSGGICN----SRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSW
        + SSS         SR    KPK T I PPYPWST  RAVVH L YL+ NQILTITGDV+C +C +QY+IEYDLVTKFDEIA+FIE+NKD+LHDRAPSSW
Subjt:  YHSSSGGICN----SRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSW

Query:  MYPKFPTCKFCNLEDGAVPVIP-----EERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN
          P  P CKFC  E    PVIP     ++ + INWLFLLLGQ +G L L+HLKYFCTYTNNHRT AK+RL+YLTYL+LCKQ+ P+
Subjt:  MYPKFPTCKFCNLEDGAVPVIP-----EERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPN

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G49330.1 hydroxyproline-rich glycoprotein family protein

3.2e-47

Show/hide

Query:  FRQTSN-QMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDV
        F+QT N   LV H    +G  P  S       +LT   ++R      + S  I  SRS+  K K+  I PP+PW+T  R  + +L YL SNQI TITG+V
Subjt:  FRQTSN-QMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHSSSGGICNSRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDV

Query:  RCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRT
        +CR C + YQ+ Y+L  +F E+  F    K  + DRA   W YP+   C+ C  E    PVI E + +INWLFLLLGQTLG   LE LK FC ++ NHRT
Subjt:  RCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRT

Query:  GAKNRLLYLTYLTLCKQVDP
        GAK+R+LYLTY+ LCK + P
Subjt:  GAKNRLLYLTYLTLCKQVDP

AT2G16190.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT1G49330.1)

8.9e-42

47.47

Show/hide

Query:  IRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERR
        I PPYPW+T+    + +   L SN I  I+G V C+ C R   +EY+L  KF E+  +I+ NK+ +  RAP SW  PK   C+ C  E    PV+ E + 
Subjt:  IRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERR

Query:  RINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPNGPFD
         INWLFLLLGQ LG   L+ L+YFC   + HRTG+K+R++Y+TYL+LCKQ+DP GPF+
Subjt:  RINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPNGPFD

AT2G16190.2 FUNCTIONS IN: molecular_function unknown

9.9e-25

43.8

Show/hide

Query:  IRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERR
        I PPYPW+T+    + +   L SN I  I+G V C+ C R   +EY+L  KF E+  +I+ NK+ +  RAP SW  PK   C+ C  E    PV+ E + 
Subjt:  IRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAVPVIPEERR

Query:  RINWLFLLLGQTLGILNLEHL
         INWLFLLLGQ LG   L+ L
Subjt:  RINWLFLLLGQTLGILNLEHL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAATCGGACGAACAAGAAGCTGCTCAAGATCATCGGATTACGCCAATGGAGACTCCGAAGAATGCCGACCGAAGCCGTGAAAGCGACAATCTCGCCCTGGAACTCTC
TCTCCGTCCGCCGGTGAACAACCGTGTGGTGCTGCAGCAGCAGCCGCCAGTTCTCCTTCCGATGCCGCCATTATTGTTTCGCCAAACTTCGAACCAGATGCTCGTTCCGC
ACCCTTCCACTTCCACTGGCTATCTTCCTGCAGGCAGTAGCCATATCGAGCGGGCAAATTCACTAACCGCATTGCGAATTAGGCGCAGTTTTGGAACTTATCATTCTTCA
AGTGGTGGAATCTGCAATTCGAGAAGCTCCACAGGCAAACCGAAGACCACGCCTATCAGGCCGCCCTATCCTTGGTCGACTGAACTCCGAGCGGTGGTTCACACTCTAAA
TTACCTCCGATCAAACCAGATCCTCACTATCACTGGCGATGTCCGATGCCGGCGATGCCATAGACAGTACCAGATTGAATACGACCTCGTTACGAAGTTCGATGAGATTG
CAACTTTTATAGAGGAAAACAAGGATTCTTTGCACGACAGAGCCCCGAGCTCCTGGATGTACCCTAAATTTCCGACCTGCAAGTTCTGTAACCTAGAAGACGGAGCAGTA
CCGGTGATACCAGAGGAGCGGAGGCGCATCAATTGGCTTTTCTTGCTTTTAGGACAAACGCTTGGAATTTTGAATCTCGAACATCTGAAATACTTCTGCACTTACACCAA
CAATCATCGAACAGGTGCGAAGAATCGCCTTCTTTATCTCACTTATCTTACTTTGTGCAAGCAAGTTGATCCAAACGGGCCTTTCGATCGCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MESDEQEAAQDHRITPMETPKNADRSRESDNLALELSLRPPVNNRVVLQQQPPVLLPMPPLLFRQTSNQMLVPHPSTSTGYLPAGSSHIERANSLTALRIRRSFGTYHSS
SGGICNSRSSTGKPKTTPIRPPYPWSTELRAVVHTLNYLRSNQILTITGDVRCRRCHRQYQIEYDLVTKFDEIATFIEENKDSLHDRAPSSWMYPKFPTCKFCNLEDGAV
PVIPEERRRINWLFLLLGQTLGILNLEHLKYFCTYTNNHRTGAKNRLLYLTYLTLCKQVDPNGPFDR

Sgr021962 (gene) of Monk fruit (Qingpiguo) v1 genome