; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr025054 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr025054
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
DescriptionCupin_3 domain-containing protein
Genome locationtig00003412:949292..951575
RNA-Seq ExpressionSgr025054
SyntenySgr025054
Gene Ontology termsNA
InterPro domainsIPR008579 - (S)-ureidoglycine aminohydrolase, cupin-3 domain
IPR011051 - RmlC-like cupin domain superfamily
IPR014710 - RmlC-like jelly roll fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0040221.1 RmlC-like cupins superfamily protein [Cucumis melo var. makuwa]1.2e-5788.89Show/hide
Query:  AASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQ
        AA TM SFHVN GS NY KL+STIK  H IRAMRIEKPLEELYNV+VERKVSEERL+QLGVSRWS+WKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS+Q
Subjt:  AASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQ

Query:  YMSFVAGDLVRYPKWFEADLFFSGPY
        YMSFVAGDLVRYPKWFEADLFF+GPY
Subjt:  YMSFVAGDLVRYPKWFEADLFFSGPY

KAG6589149.1 hypothetical protein SDJN03_17714, partial [Cucurbita argyrosperma subsp. sororia]1.8e-6465.6Show/hide
Query:  NWINLGSRGFRACCDPATRLAFISSNLQNSSHYSGLRVEDSVLLNSKGPFLAYFFFSATNVQFYPSSVPPWAS-TFIEGSIYIVLGMASMIAAASTMGSF
        N +  GS G R C DP T + FISSN Q                           F  T           WAS TF+EGSIYIV  MASM+ AA TM +F
Subjt:  NWINLGSRGFRACCDPATRLAFISSNLQNSSHYSGLRVEDSVLLNSKGPFLAYFFFSATNVQFYPSSVPPWAS-TFIEGSIYIVLGMASMIAAASTMGSF

Query:  HVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQYMSFVAGD
         VN GS N+ KL+STIK   KIRAMRIEKPLEELYNVRVERKVSEERL+QLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS+QYMSFVAGD
Subjt:  HVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQYMSFVAGD

Query:  LVRYPKWFEADLFFSGPY
        LVRYPKWFEADLFF+GPY
Subjt:  LVRYPKWFEADLFFSGPY

KAG7022849.1 hypothetical protein SDJN02_16585, partial [Cucurbita argyrosperma subsp. argyrosperma]1.2e-6367.14Show/hide
Query:  GFRACCDPATRLAFISSNLQNSSHYSGLRVEDSVLLNSKGPFLAYFFFSATNVQFYPSSVPPWAS-TFIEGSIYIVLGMASMIAAASTMGSFHVNRGSGN
        GFR C DP T + FISSN Q                           F  T           WAS TF+EGSIYIV  MASM+ AA TM +F VN GS N
Subjt:  GFRACCDPATRLAFISSNLQNSSHYSGLRVEDSVLLNSKGPFLAYFFFSATNVQFYPSSVPPWAS-TFIEGSIYIVLGMASMIAAASTMGSFHVNRGSGN

Query:  YRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQYMSFVAGDLVRYPKWF
        + KL+STIK   KIRAMRIEKPLEELYNVRVERKVSEERL+QLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS+QYMSFVAGDLVRYPKWF
Subjt:  YRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQYMSFVAGDLVRYPKWF

Query:  EADLFFSGPY
        EADLFF+GPY
Subjt:  EADLFFSGPY

XP_008455463.1 PREDICTED: uncharacterized protein LOC103495620 [Cucumis melo]1.5e-5887.22Show/hide
Query:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV
        MASM+ AA TM SFHVN GS NY KL+STIK  H IRAMRIEKPLEELYNV+VERKVSEERL+QLGVSRWS+WKTGKCKLPWDWQADQLVYIEEGEVRVV
Subjt:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV

Query:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV
        PEGS+QYMSFVAGDLVRYPKWFEADLFF+GPY+
Subjt:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV

XP_022135887.1 uncharacterized protein LOC111007727 [Momordica charantia]3.9e-5988.72Show/hide
Query:  MASMIAA-ASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRV
        MASMIAA A TMG+F VN+G GN RKLSS+IK  H+IRAMRIEKPLEELYNVRVERKVSEERL++LGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRV
Subjt:  MASMIAA-ASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRV

Query:  VPEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY
        VPEGS+QYMSFVAGDLVRYPKWFEADLFF+GPY
Subjt:  VPEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY

TrEMBL top hitse value%identityAlignment
A0A1S3C0I6 uncharacterized protein LOC1034956207.1e-5987.22Show/hide
Query:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV
        MASM+ AA TM SFHVN GS NY KL+STIK  H IRAMRIEKPLEELYNV+VERKVSEERL+QLGVSRWS+WKTGKCKLPWDWQADQLVYIEEGEVRVV
Subjt:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV

Query:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV
        PEGS+QYMSFVAGDLVRYPKWFEADLFF+GPY+
Subjt:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV

A0A5D3C5M8 RmlC-like cupins superfamily protein6.0e-5888.89Show/hide
Query:  AASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQ
        AA TM SFHVN GS NY KL+STIK  H IRAMRIEKPLEELYNV+VERKVSEERL+QLGVSRWS+WKTGKCKLPWDWQADQLVYIEEGEVRVVPEGS+Q
Subjt:  AASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQ

Query:  YMSFVAGDLVRYPKWFEADLFFSGPY
        YMSFVAGDLVRYPKWFEADLFF+GPY
Subjt:  YMSFVAGDLVRYPKWFEADLFFSGPY

A0A6J1C646 uncharacterized protein LOC1110077271.9e-5988.72Show/hide
Query:  MASMIAA-ASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRV
        MASMIAA A TMG+F VN+G GN RKLSS+IK  H+IRAMRIEKPLEELYNVRVERKVSEERL++LGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRV
Subjt:  MASMIAA-ASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRV

Query:  VPEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY
        VPEGS+QYMSFVAGDLVRYPKWFEADLFF+GPY
Subjt:  VPEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY

A0A6J1EXN3 uncharacterized protein LOC1114371271.6e-5585.61Show/hide
Query:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV
        MASM+ AA TM +F VN GS N+ K +STIK   KIRAMRIEKPLEELYNVRVERKVSEERL+QLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVV
Subjt:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV

Query:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY
        PEGS+QYMSFVAGDLVRYPKWFEADLFF+GPY
Subjt:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY

A0A6J1JN52 uncharacterized protein LOC1114861921.4e-5484.09Show/hide
Query:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV
        MASM+ AA TM +F VN GS N+ K +STIK   KIRAM IEKPLEELYNVRVER+VSEERL+QLGVSRWS WKTGKCKLPWDWQADQLVYIEEGEVRVV
Subjt:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV

Query:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY
        PEGS+QYMSFVAGDLVRYPKWFEADLFF+GPY
Subjt:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPY

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT2G32180.1 plastid transcriptionally active 183.4e-4563.16Show/hide
Query:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV
        MAS+I      GS    + + N      +++   ++  M+ EKPLEELYNV+VERKVS++RL +LGVSRWS+WKTGKCKLPWDWQ DQLVYIE+GEVRVV
Subjt:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV

Query:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV
        PEGS++YM F+AGDLVRYPKW EADLFF+ PY+
Subjt:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV

AT2G32650.1 RmlC-like cupins superfamily protein1.5e-4563.91Show/hide
Query:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV
        MAS+I      GS    + + N      +++   K+  M+ EKPLEELYNV+VERKVS++RL +LGVSRWS+WKTGKCKLPWDWQ DQLVYIE+GEVRVV
Subjt:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV

Query:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV
        PEGS++YM F+AGDLVRYPKW EADLFF+ PY+
Subjt:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV

AT2G32650.2 RmlC-like cupins superfamily protein1.5e-4563.91Show/hide
Query:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV
        MAS+I      GS    + + N      +++   K+  M+ EKPLEELYNV+VERKVS++RL +LGVSRWS+WKTGKCKLPWDWQ DQLVYIE+GEVRVV
Subjt:  MASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVV

Query:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV
        PEGS++YM F+AGDLVRYPKW EADLFF+ PY+
Subjt:  PEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYV

AT4G10290.1 RmlC-like cupins superfamily protein4.6e-1036.36Show/hide
Query:  ELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSR---QYMSFVAGDLVRYPK
        E++ V+V R+ S+ +LA+LGV+ W +W++   K PW ++  + +Y  EG+++V  E      + + FVAGDLV +P+
Subjt:  ELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSR---QYMSFVAGDLVRYPK

AT4G10300.1 RmlC-like cupins superfamily protein1.8e-0934.94Show/hide
Query:  AMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQYMSFVAGDLVRYPK
        A  I     E   + +E+   E +L QLGV  W  W     K PW + A +  Y+ +G+V+V P GS + +   AGD V +PK
Subjt:  AMRIEKPLEELYNVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQYMSFVAGDLVRYPK


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCCGACTCGAAGACCCTTTAAACTTAAAGCTGTTGCTATGAAGACTCCCAAAGTACCTCCACAAACCAGCACATCAAAAGTGTCAATGGCCTTCTCTCCCATATCAGA
ACGACTAAACGCACCAGAACGCGACCAACGACTTCTTGTAGGCCTTCAGCTACTGCAAAACAACGAGCAAGGCAAATACTGGACCAAATTTGATCTAACCTCTTCAATGA
GCTGTATGAATACGCACCACCAGCACCACCAACTTCCCCAGACACTGATATACCCTCCATTATCCCCTGAAACAATACAGAGCAACCAGCACTCGTTGATTCAGATGTCG
AACAAGCAATTGCAGCAGAAGAGTATTGAAGATTTAAAACGACGAGGGATTACTTTGGAAGCTAGAAATGTTGTGATTCTGGAAAAGGGACTGCCTACCTTCCGACCCTT
CTCAACGCTTTCTTCATTTATCACTTATAGAGCTGAGGTTGGCAATTGGTATCGAACTGTTTCCGAGCGGAAAATGTACACGTTAACGACTAAACGGGTCACTGTCCTTG
TCTTTCGTTATTTCTTTAGGAGGGAGATTGGGCAACCGAATTGGATAAACCTTGGCTCGAGGGGTTTTAGAGCTTGCTGCGACCCTGCAACTCGGCTTGCCTTTATTTCT
TCAAATTTGCAGAATTCTTCCCATTATTCCGGCCTCCGGGTGGAGGATTCTGTCCTTTTGAATTCTAAGGGACCATTTCTTGCATATTTCTTCTTCTCCGCAACCAACGT
ACAGTTTTATCCATCTTCGGTTCCACCTTGGGCTTCAACGTTCATTGAAGGCAGCATTTATATAGTGTTAGGCATGGCTAGTATGATTGCTGCCGCTTCCACAATGGGCT
CATTCCATGTGAATAGAGGGAGCGGAAACTATAGAAAGTTGAGTTCTACCATCAAGGAACGTCACAAAATAAGGGCAATGCGGATAGAGAAACCTCTTGAGGAGTTGTAC
AATGTAAGAGTAGAACGTAAAGTATCGGAGGAGCGACTTGCCCAGCTAGGAGTTTCGAGATGGTCGATATGGAAGACGGGGAAGTGTAAATTGCCATGGGACTGGCAAGC
AGATCAACTGGTTTACATTGAGGAAGGTGAAGTGAGAGTAGTCCCTGAGGGGAGCAGGCAATACATGAGTTTTGTGGCTGGAGACCTTGTTCGTTACCCCAAGTGGTTTG
AAGCTGACCTATTTTTCAGTGGACCGTACGTTACAGTTTCAGAGCATATGGTGATGACTATTAGTCGTTCATCACTATAA
mRNA sequenceShow/hide mRNA sequence
ATGCCGACTCGAAGACCCTTTAAACTTAAAGCTGTTGCTATGAAGACTCCCAAAGTACCTCCACAAACCAGCACATCAAAAGTGTCAATGGCCTTCTCTCCCATATCAGA
ACGACTAAACGCACCAGAACGCGACCAACGACTTCTTGTAGGCCTTCAGCTACTGCAAAACAACGAGCAAGGCAAATACTGGACCAAATTTGATCTAACCTCTTCAATGA
GCTGTATGAATACGCACCACCAGCACCACCAACTTCCCCAGACACTGATATACCCTCCATTATCCCCTGAAACAATACAGAGCAACCAGCACTCGTTGATTCAGATGTCG
AACAAGCAATTGCAGCAGAAGAGTATTGAAGATTTAAAACGACGAGGGATTACTTTGGAAGCTAGAAATGTTGTGATTCTGGAAAAGGGACTGCCTACCTTCCGACCCTT
CTCAACGCTTTCTTCATTTATCACTTATAGAGCTGAGGTTGGCAATTGGTATCGAACTGTTTCCGAGCGGAAAATGTACACGTTAACGACTAAACGGGTCACTGTCCTTG
TCTTTCGTTATTTCTTTAGGAGGGAGATTGGGCAACCGAATTGGATAAACCTTGGCTCGAGGGGTTTTAGAGCTTGCTGCGACCCTGCAACTCGGCTTGCCTTTATTTCT
TCAAATTTGCAGAATTCTTCCCATTATTCCGGCCTCCGGGTGGAGGATTCTGTCCTTTTGAATTCTAAGGGACCATTTCTTGCATATTTCTTCTTCTCCGCAACCAACGT
ACAGTTTTATCCATCTTCGGTTCCACCTTGGGCTTCAACGTTCATTGAAGGCAGCATTTATATAGTGTTAGGCATGGCTAGTATGATTGCTGCCGCTTCCACAATGGGCT
CATTCCATGTGAATAGAGGGAGCGGAAACTATAGAAAGTTGAGTTCTACCATCAAGGAACGTCACAAAATAAGGGCAATGCGGATAGAGAAACCTCTTGAGGAGTTGTAC
AATGTAAGAGTAGAACGTAAAGTATCGGAGGAGCGACTTGCCCAGCTAGGAGTTTCGAGATGGTCGATATGGAAGACGGGGAAGTGTAAATTGCCATGGGACTGGCAAGC
AGATCAACTGGTTTACATTGAGGAAGGTGAAGTGAGAGTAGTCCCTGAGGGGAGCAGGCAATACATGAGTTTTGTGGCTGGAGACCTTGTTCGTTACCCCAAGTGGTTTG
AAGCTGACCTATTTTTCAGTGGACCGTACGTTACAGTTTCAGAGCATATGGTGATGACTATTAGTCGTTCATCACTATAA
Protein sequenceShow/hide protein sequence
MPTRRPFKLKAVAMKTPKVPPQTSTSKVSMAFSPISERLNAPERDQRLLVGLQLLQNNEQGKYWTKFDLTSSMSCMNTHHQHHQLPQTLIYPPLSPETIQSNQHSLIQMS
NKQLQQKSIEDLKRRGITLEARNVVILEKGLPTFRPFSTLSSFITYRAEVGNWYRTVSERKMYTLTTKRVTVLVFRYFFRREIGQPNWINLGSRGFRACCDPATRLAFIS
SNLQNSSHYSGLRVEDSVLLNSKGPFLAYFFFSATNVQFYPSSVPPWASTFIEGSIYIVLGMASMIAAASTMGSFHVNRGSGNYRKLSSTIKERHKIRAMRIEKPLEELY
NVRVERKVSEERLAQLGVSRWSIWKTGKCKLPWDWQADQLVYIEEGEVRVVPEGSRQYMSFVAGDLVRYPKWFEADLFFSGPYVTVSEHMVMTISRSSL