CuGenDBv2

Gene ID	MC03g0667
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	Small nuclear ribonucleoprotein family protein
Genome location	MC03:13620527..13625806
RNA-Seq Expression	MC03g0667
Synteny	MC03g0667
Gene Ontology terms	GO:0031417 - NatC complex (cellular component)
InterPro domains	IPR001163 - LSM domain, eukaryotic/archaea-type IPR010920 - LSM domain superfamily IPR034110 - LSM domain containing 1

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_008444477.1 PREDICTED: uncharacterized protein LOC103487784 [Cucumis melo]

4.04e-63

90.18

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQ GSN ESN  SLDCI KVRKLLFRRMLIGIKDGRFFLG F+CIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

XP_011649337.1 uncharacterized protein LOC101206200 [Cucumis sativus]

2.84e-63

91.07

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQ GSNVESNP SLD I KVRKLLFRRMLIGIKDGRFFLG F+CIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

XP_022140017.1 uncharacterized protein LOC111010777 [Momordica charantia]

5.97e-74

100

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STIVEQLALLSV
Subjt:  STIVEQLALLSV

XP_022927243.1 uncharacterized protein LOC111434149 [Cucurbita moschata]

2.84e-63

89.29

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQVG NVESNP SLD + KVRKLLFRRMLIGIKDGRFFLG+F+C+DKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

XP_023520042.1 uncharacterized protein LOC111783348 [Cucurbita pepo subsp. pepo]

4.91e-64

90.18

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQVGSNVESNP SLD + KVRKLLFRRMLIGIKDGRFFLG+F+C+DKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LSZ5 Sm domain-containing protein

1.38e-63

91.07

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQ GSNVESNP SLD I KVRKLLFRRMLIGIKDGRFFLG F+CIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

A0A1S3BAH4 uncharacterized protein LOC103487784

1.96e-63

90.18

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQ GSN ESN  SLDCI KVRKLLFRRMLIGIKDGRFFLG F+CIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

A0A5D3DAS2 Small nuclear ribonucleoprotein family protein isoform 2

1.96e-63

90.18

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQ GSN ESN  SLDCI KVRKLLFRRMLIGIKDGRFFLG F+CIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

A0A6J1CFL8 uncharacterized protein LOC111010777

2.89e-74

100

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STIVEQLALLSV
Subjt:  STIVEQLALLSV

A0A6J1EKG3 uncharacterized protein LOC111434149

1.38e-63

89.29

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQES G  VQVG NVESNP SLD + KVRKLLFRRMLIGIKDGRFFLG+F+C+DKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
        STI EQLALLSV
Subjt:  STIVEQLALLSV

SwissProt top hits

e value

%identity

Alignment

A4IGZ4 N-alpha-acetyltransferase 38, NatC auxiliary subunit

3.0e-06

36.46

Show/hide

Query:  GSNVESNPGSLDCIA--------KVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        G + +S+PG+ D  A        K+  LL R M I + DGR  +G F C D+  N+IL  A E+     S P   E R LGL ++P    VS  V+
Subjt:  GSNVESNPGSLDCIA--------KVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

P63162 Small nuclear ribonucleoprotein-associated protein N

3.3e-05

39.71

Show/hide

Query:  RMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTR---RSSPSPMEQRCLGLILIPNSCRVSCHVD
        RM   ++DGR F+GTF   DK  N+IL D  E+R  +      P   E+R LGL+L+     VS  V+
Subjt:  RMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTR---RSSPSPMEQRCLGLILIPNSCRVSCHVD

Q17QN3 Small nuclear ribonucleoprotein-associated protein N

3.3e-05

39.71

Show/hide

Query:  RMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTR---RSSPSPMEQRCLGLILIPNSCRVSCHVD
        RM   ++DGR F+GTF   DK  N+IL D  E+R  +      P   E+R LGL+L+     VS  V+
Subjt:  RMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTR---RSSPSPMEQRCLGLILIPNSCRVSCHVD

Q55A45 Small nuclear ribonucleoprotein-associated protein B

8.7e-06

34.52

Show/hide

Query:  AKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQ-RCLGLILIPNSCRVSCHVDSTIVEQLAL
        +K+ + +  RM + I+DGR  +G F   DK  N+++ DA E+R  R+      E+ R LG+ILI     VS  V++   E+  L
Subjt:  AKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQ-RCLGLILIPNSCRVSCHVDSTIVEQLAL

Q6GQ67 N-alpha-acetyltransferase 38-A, NatC auxiliary subunit

1.5e-05

35.42

Show/hide

Query:  GSNVESNPGSLDCIA--------KVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        G + +S+P + D  A        K+  LL R M I + DGR  +G F C D+  N+IL  A E+     S P   E R LGL ++P    VS  V+
Subjt:  GSNVESNPGSLDCIA--------KVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Arabidopsis top hits

e value

%identity

Alignment

AT4G18372.1 Small nuclear ribonucleoprotein family protein

6.8e-38

67.86

Show/hide

Query:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD
        MEQ +E     V S  E +    D I+++RKLLFR+ML+GIKDGRFFLG FHCIDKQGNIILQD VEYRS RRSSPSP EQRCLG+ILIP+SCR SCHVD
Subjt:  MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVD

Query:  STIVEQLALLSV
         +I EQL+L+ +
Subjt:  STIVEQLALLSV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAACAAGAATCAGAGGGACCCAGGGTTCAGGTTGGGAGCAATGTCGAGTCTAATCCGGGCAGTTTAGATTGCATAGCAAAGGTGAGAAAGCTACTGTTTCGCCGAAT
GCTCATAGGCATTAAAGATGGAAGATTTTTCCTGGGAACTTTTCACTGCATTGACAAGCAAGGAAATATCATTCTACAAGATGCAGTGGAGTATCGTAGTACTCGACGTA
GCTCACCTTCTCCGATGGAACAACGGTGCCTCGGCCTTATTCTTATCCCCAACTCTTGCCGTGTGTCCTGTCATGTAGATAGTACCATTGTGGAACAATTAGCGCTGCTA
TCAGTCTAG

mRNA sequence

Show/hide mRNA sequence

CCCCCTTAAAAATAGTTTTTTTTTAATAGTAAATTTTCATTTATTTGGATCGGCCTCCACTCTCATCAGCGGCGACTACGAGAAGCCAAGAATTGCAATCGCCCGCCAAT
TTAGCTCTTAGCCTCTCTTTCTACTGCGGGAAGGGATCAATCGAACCATACATGGAACAAGAATCAGAGGGACCCAGGGTTCAGGTTGGGAGCAATGTCGAGTCTAATCC
GGGCAGTTTAGATTGCATAGCAAAGGTGAGAAAGCTACTGTTTCGCCGAATGCTCATAGGCATTAAAGATGGAAGATTTTTCCTGGGAACTTTTCACTGCATTGACAAGC
AAGGAAATATCATTCTACAAGATGCAGTGGAGTATCGTAGTACTCGACGTAGCTCACCTTCTCCGATGGAACAACGGTGCCTCGGCCTTATTCTTATCCCCAACTCTTGC
CGTGTGTCCTGTCATGTAGATAGTACCATTGTGGAACAATTAGCGCTGCTATCAGTCTAGAAATCAAGACTAAGCCTGGGGTTAAGAAAGGAGAAAAAAGGACTAGCACA
CTTGTTTGAAGAGAGTGTTTATGATTATTTCTTTTCAGTAGAAATATGGGATAAGGAGATAAAAAAAATTTTCTCTTACAAGGTTGTGGATAACCAGAATATATTCTCCT
TTTCTTTATTCATTGAATCAAGTGCATAAAAGTGGAATCTTCAACAATGGCATGCTATTTGGATGGAGACAGAAACACTGAATTGTTTCTAGTTTGGAAAGCTACACTCC
AGAAATTAAGGCTAGAAAGTTTTAACAGATGAGTAAAAACTCTTTGAATCTGTACAACAATAATATTTTCAATGATTGAACCACCCAACAGAGGGAAGGAAGAGTAATAT
TCCATAAATAAACAATTATTCACAACTCAGACCAAGATCTAGAAAGAATTCATATGAATCATAACACTTGTGAAGAAAGCAAATTCATTTATGTTAGCAAATTGTCATTT
TACGGTGCAGTCCACGGTCTTGGAGAGGAGTTGGAGTTGCATGAATGGTTGTGTTCCCTTGTGAAAAGATTGTAAAACTTTATCAAAATCTCTCACTGTAAGGTGTTCCG
TATACAATAAGGTATGGAACCGTACGTACAACTGTGTCTATTGGAATTGCAAAATTAACACCAGAAGACATTCCAGTTCCTGCAATGCATAAACAAAGATGAATAATATA
ACTTCGAATAGAATTGGCACAAAAAAACCGCAGTCCTTTCTTTCTTTCTTTACTATTTTATGTTCTTTCAAGTAGCAAATAAAAGAGAGAGAGAGAGAGATGGAGTTAGC
TTTGATAATTACTAAGCTTTAAGGCAAAGAAATCAGCCATATTTTTCTCTGACAAACTAAGCAGATGAAGAAATTGAGGCCCTTTACCTTTGCGAGTGAAAGTTGCTGTG
TTGACTCCAATTACATGACCGTAGGAGTCAATTAATGGCCCCCCTGAATTCCCTGTAAAACTCTAATGCATTAAAATGTGGGAAAGTTAAAATATGATGATGATTATTAC
GGGTGACTGGGGCAGTAATGAAATCAAGCCAGATTAGAAAGGAACAAGATAAGCTGCCATATATGTACAAGGAGCTTAACAGCGCTTTAGTGTCAAGAATAAAAAAGGCT
CACTCTTGCAATATACATGATGGGAAGTAGAAAATCTTTAGAAAGCGGCAGAAGAAAAGGCATGAAAAAACAAGTTTGAGAAATGGCGGTATCTGATTTCAGGTAGTTGA
ACCATGAACCTGAACTAATAGCAGCATCTGTCTGAATACCCCCCCGAATGGCCCTTCCATTTGGTGATGGAATTTCTCTACCCAATCCACTGATCACCTGCTATTCAAAC
CCTGAATGATTTACAGTTCTCGATTATTTAGTCAATCCACTATGCTGACTCTCAGCAGGTGTTTCTTGGTAAAGAACACCATCAATCTATGAGTAGGAAACTTGACAGTG
ACACTTAGAAAAACTCTTACTTCATCCACAGTCTTTGATAAATAAAACATAAATGTGTGTGAGATGAGAGATATCATATCTCCTATGAGAAATATGTTTATTATAAGAGA
GAAGTATTTTCACTATCCAATTTAGTTTTAGCTTTGAAATAGAAAATCCAAAGAGGGTTTCCTCTGAATTAAATGGAGAAAGTAACATTATTGATGTCTTACCCCTGCTG
TTAGTGTCTTCTCATAACCAAAAGGGTTGCCAATGGCATAGCAGCTCTGACCAACACGTAAATTTCGAGAGGTACCGAGAACGATGGGCTTTAGTTCACATCCTCCAAGT
TCCACCTGGATGTTACATGGCAACTTCAAACTCAGCAAATCATGGTATAGTATAAGAGATTGACAGTACAGATTGTCCAAACAGTGAAGCCTGTTTTATGGAATAGAAAA
CAAATGACATGTTATCATCATCACTCCATAGCTCACAGGGTTCACTTTCCACTCCTCCCAATCTGCTGCTTTCACACATCACATAAGGAACGGAAAACAGGATGAGAATC
ACCGAGACACAATTCACTCAATCTGGTATTCCCCTTGAGTCTCGAGCTAAATTAGAACAAAACGAAACAGAATATATATGGGCACCATCTCAAGAGGGATTTTGTAAATG
TCAAAATCATTTCAACTTCTATATTGAGTAGACAGCACCCAGTTTGAACACGACAGAGCAGACAAGAAGCTTCAAAGAAAATTAGGAAAGAAAAAAAAAAGTTTGGTTCT
ATACCTTGAGAACAGCTAGATCATACTCTGGATCAAAACCTACAATTTTTGCTTCCCTATAAATTCCATTTCCTTTAGCATCGACTAAATTTACCTACAGAAGCAAGCCA
AATGGAGTGGCTAGAGACTGATAATATATCTTCCATTATGAAGACATAAATAACAATTCAAAAGACAGTAACAAATAAACAAAACCTTACAACGCTGCAATCCACTGTTA
TCAGTAGCCAATGCGGAAACAACATGGTAATTAGTTACCTGCCACAAGTAATCACAAAGCCCTAATGAAATTCCTCTGTGAAATGAACAGAAAAAGAAATGTTTCCGATA
CCCAAAATCAATAAAATGAAAATGACAGTCACAAAGAATGAAGGCAAGTAAGAATTAAAGGAGAGAAGAGCATACGATATGGCCAAATTTATCCCATACAAAGCCCGAAC
CAGTCCCTTTGACCTTGACATTCTCATCCTCGACGAGCAGGGCCTCTTCAGAGGAGTTCTGGGGTTTCTTAGCTAATTCAAGGTCCTTAATGTAAACGACAGAAGGTGAA
GCATCCTACATTTGGAATTGGGACCCAACAGAGCAAAACAGAAAACAAAGAAGCAAGATTAAATTTCAATTGAAACTGAAGAATTCTGCAGTTATGGTGAGTGAGAAAGA
GAGGGACCTGAAAGAGAGCGACGACTCGATCTTCTTCTTGTGGAACCTGGGCCTGTATTTGGGGGAGAGCGGCGTGAGTGGGAAGAGGGAAAGCGAGGAGGGAAGCCATC
AAAGCAGATGGGGCAAAAACTAGGGCTCTTCGCGAAGTGAAGGGTAGAGAGTTGTGGGAAGAATTTGGGGGAGCTGGAATTGGAAGAAGATGAATTCCCAGTGAGGCTAA
CGCCATGGTGTTCCACTTCCTCTGATCTTGATTCTTATCGTGATTTTCCCTTTTTAAATTCAGCAACTGCAATTCAAACCTTAATCAATTGAACATTATGCTTTAGAAAC
AAACGAACATTATAAATTTTGAAGTTCTTGAAGTTCCCTTATCCCTATGAAAGATTAAAGCTATGCTCTAACTCTTTCGCCACAACTTATCTGAAAGTTGTTTAATCCAG
AAGGGTAAATCTAAGAAGTTAATTAATCTGAAATGGTTTAGTTTTGAGAGTAGAACTACTAAAGTATTGCAATTTTTACTCTCGAATAGATTTTCGTTTGAAAGATTATT
GAAAAAGTATTATTACGTGGAATGATATAAAACATATATTCGTATGGAATTGATAGGACTCAAACAAAAAATGAAAT

Protein sequence

Show/hide protein sequence

MEQESEGPRVQVGSNVESNPGSLDCIAKVRKLLFRRMLIGIKDGRFFLGTFHCIDKQGNIILQDAVEYRSTRRSSPSPMEQRCLGLILIPNSCRVSCHVDSTIVEQLALL
SV

MC03g0667 (gene) of Bitter gourd (Dali-11) v1 genome