CuGenDBv2

Gene ID	MS004251
Organism	Momordica charantia cv. TR (Bitter gourd (TR) v1)
Description	Yae1_N domain-containing protein
Genome location	scaffold92:1185178..1187195
RNA-Seq Expression	MS004251
Synteny	MS004251
Gene Ontology terms	GO:0000398 - mRNA splicing, via spliceosome (biological process) GO:0005681 - spliceosomal complex (cellular component) GO:0005737 - cytoplasm (cellular component) GO:0004386 - helicase activity (molecular function)
InterPro domains	IPR019191 - Essential protein Yae1, N-terminal IPR038881 - Yae1-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6601147.1 Crossover junction endonuclease MUS81, partial [Cucurbita argyrosperma subsp. sororia]

8.8e-80

82.61

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDEGLEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        N SKFQSLYE  NSLSTADALRLF+D+I+AQ   EECVDA+T+S+TI LLKQN D+ RLG+FYGELQALLP SPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

KAG7031946.1 hypothetical protein SDJN02_05988 [Cucurbita argyrosperma subsp. argyrosperma]

8.8e-80

82.61

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDEGLEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        N SKFQSLYE  NSLSTADALRLF+D+I+AQ   EECVDA+T+S+TI LLKQN D+ RLG+FYGELQALLP SPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

XP_022138890.1 uncharacterized protein LOC111009960 [Momordica charantia]

5.0e-99

98.37

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLI+GKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        NSSKFQSLYECTNS+STADALRLFNDEILAQD TEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

XP_023514282.1 uncharacterized protein LOC111778596 isoform X1 [Cucurbita pepo subsp. pepo]

6.7e-80

82.61

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDEGLEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        N SKFQSLYE  NSLSTADALRLF+++I+AQ   EECVDA+T+S+TI LLKQN D+ RLGKFYGELQALLP SPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

XP_023514291.1 uncharacterized protein LOC111778596 isoform X2 [Cucurbita pepo subsp. pepo]

6.7e-80

82.61

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDEGLEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        N SKFQSLYE  NSLSTADALRLF+++I+AQ   EECVDA+T+S+TI LLKQN D+ RLGKFYGELQALLP SPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CAS2 uncharacterized protein LOC111009960

2.4e-99

98.37

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLI+GKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        NSSKFQSLYECTNS+STADALRLFNDEILAQD TEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

A0A6J1H273 uncharacterized protein LOC111458903

2.8e-79

82.61

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDE LEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
          SKFQSLYE  NSLSTADALRLF+D+I+AQ   EECVDA+T+S+TI LLKQN D GRLG+FYGELQALLPKSPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

A0A6J1JR95 uncharacterized protein LOC111487537 isoform X2

1.8e-78

82.07

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDEGLEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        N SKFQSLYE  NSLSTADALRLF+D+I+AQ   EE VDA+T+S+TI LLKQN D  RLG+FYGELQALLP SPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

A0A6J1JRH1 uncharacterized protein LOC111487537 isoform X3

1.8e-78

82.07

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDEGLEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        N SKFQSLYE  NSLSTADALRLF+D+I+AQ   EE VDA+T+S+TI LLKQN D  RLG+FYGELQALLP SPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

A0A6J1JSZ3 uncharacterized protein LOC111487537 isoform X1

1.8e-78

82.07

Show/hide

Query:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE
        GS V+D C+DDGSLWGGSDEGLEE SDLDREW RRHDQFHTIGYRDGLIAGKEAA+QEGFNVGFKQSV IGYKLGLVRGVSSVLA LPDDLKEKL+G EE
Subjt:  GSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEE

Query:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ
        N SKFQSLYE  NSLSTADALRLF+D+I+AQ   EE VDA+T+S+TI LLKQN D  RLG+FYGELQALLP SPAL +HLHE+Q
Subjt:  NSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

SwissProt top hits

e value

%identity

Alignment

Q9NRH1 Protein YAE1 homolog

4.3e-05

37.18

Show/hide

Query:  LCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVL
        L Q  G      DE  +E     REWQ    +    GYRDG+ AGK    Q+GFN G+K+   +    G +RG  S L
Subjt:  LCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVL

Arabidopsis top hits

e value

%identity

Alignment

AT1G34550.1 Protein of unknown function (DUF616)

2.0e-05

32.35

Show/hide

Query:  SVLACLPDDLKEKLMGNEENSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLH
        +VLA LPD+L+EKL+  +E   KFQ L+   ++LST  A++ F   +     T+E +     + T             G +  EL +LL KSP ++  L 
Subjt:  SVLACLPDDLKEKLMGNEENSSKFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLH

Query:  ED
        +D
Subjt:  ED

AT1G34570.1 Essential protein Yae1, N-terminal

1.4e-30

41.42

Show/hide

Query:  DGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEENSSKFQSLYE
        D   +G SDE   E   LD E ++R  +FH+ GYRDG++ GKEA AQEG+N G+K+SV  GYK G+VRGVSS LA LP + +EKL+  +E   KFQ L+ 
Subjt:  DGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEENSSKFQSLYE

Query:  CTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTI-GLLKQNPDDGRLGKFYGELQALLPKSPALKV
          ++LST  A++ F + +  +   E+  +   +S ++ G          LG +  EL +LL KSP ++V
Subjt:  CTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTI-GLLKQNPDDGRLGKFYGELQALLPKSPALKV

AT3G15750.1 Essential protein Yae1, N-terminal

6.8e-30

42.37

Show/hide

Query:  LCQDDGSLWGGSD-EGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEENSSKF
        L + D   +G SD E   E   L  E ++R  +FH+ GYRDG++AGKEA AQEG+N G+K+SV  GY+ GLVRGVSS LA LPD+L+EKL+  +E   KF
Subjt:  LCQDDGSLWGGSD-EGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEENSSKF

Query:  QSLYECTNSLSTADALRLFNDEILA----QDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKV
        Q L+   ++LST  A++ F + +      +   EE  D+ ++S +   +    D   LG +  EL +LL KSP ++V
Subjt:  QSLYECTNSLSTADALRLFNDEILA----QDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACTTACTGTCTGGTTTTAGGTTCTGGTGTGGATGACTTGTGCCAAGATGATGGATCTTTATGGGGTGGTTCTGATGAAGGCTTGGAGGAAATATCTGATTTGGACAG
GGAGTGGCAGAGGAGACATGACCAATTCCATACGATTGGATACCGTGATGGTTTAATCGCTGGTAAAGAAGCTGCAGCTCAAGAGGGATTTAATGTTGGCTTCAAGCAGT
CAGTCTTTATTGGGTATAAGTTGGGTCTTGTCAGAGGTGTTAGCAGTGTGCTTGCTTGCCTTCCTGATGACTTGAAAGAGAAGCTAATGGGAAATGAAGAGAACAGTAGT
AAATTCCAAAGCTTGTATGAATGTACGAACTCTCTTTCGACAGCAGATGCGCTTAGACTATTCAATGACGAGATTTTGGCACAAGACATGACAGAAGAGTGTGTCGACGC
AGATACTAATTCCCGAACGATAGGTTTGCTGAAGCAAAATCCAGATGATGGACGTCTAGGGAAGTTCTATGGAGAGCTTCAAGCACTTTTACCAAAATCACCTGCTCTGA
AAGTTCATCTACATGAAGACCAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTYCLVLGSGVDDLCQDDGSLWGGSDEGLEEISDLDREWQRRHDQFHTIGYRDGLIAGKEAAAQEGFNVGFKQSVFIGYKLGLVRGVSSVLACLPDDLKEKLMGNEENSS
KFQSLYECTNSLSTADALRLFNDEILAQDMTEECVDADTNSRTIGLLKQNPDDGRLGKFYGELQALLPKSPALKVHLHEDQ

MS004251 (gene) of Bitter gourd (TR) v1 genome