CuGenDBv2

Gene ID	MS005430
Organism	Momordica charantia cv. TR (Bitter gourd (TR) v1)
Description	MSC domain-containing protein
Genome location	scaffold641:127637..131185
RNA-Seq Expression	MS005430
Synteny	MS005430
Gene Ontology terms	GO:0005637 - nuclear inner membrane (cellular component) GO:0016021 - integral component of membrane (cellular component) GO:0003682 - chromatin binding (molecular function)
InterPro domains	IPR018996 - Man1/Src1, C-terminal IPR041885 - MAN1, winged-helix domain IPR044780 - Heh2/Src1-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0038534.1 MSC domain-containing protein [Cucumis melo var. makuwa]

3.4e-173

84.05

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPK+R K+K NP+SD GS  DSS SSS++LLKS+K+PPRDFFPS++DL  LITVL IA LVF+SCNFFVSRL+SR P PFCDTDADSLDLLSD C+P
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CP HGECR G+LEC+ GYRKHGRLCIEDGVINEAV KLSEWLESHLCE+NAKF+CDG+G VWVKE+DIWDDLDG+ LVE+IGSDNTT MYAK KALETI 
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GL QT+QNS GIKELKCPDLLAESYKPFTCRI HWVL+HAFVVLPVFLLLVGCTWLLWKLYRRQ+LTNRAE+LYNQVCEILEENAL S R S QCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERK+PLLW+KVEELVQEDSRIDRYPRLVKG+GKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

XP_016903563.1 PREDICTED: uncharacterized protein LOC103503505 isoform X4 [Cucumis melo]

8.9e-174

83.19

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPK+R K+K NP+SD GS  DSS SSS++LLKS+K+PPRDFFPS++DL  LITVL IA LVF+SCNFFVSRL+SR P PFCDTDADSLDLLSD C+P
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CP HGECR G+LEC+ GYRKHGRLCIEDGVINEAV KLSEWLESHLCE+NAKF+CDG+G VWVKE+DIWDDLDG+ LVE+IGSDNTT MYAK KALETI 
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GL QT+QNS GIKELKCPDLLAESYKPFTCRI HWVL+HAFVVLPVFLLLVGCTWLLWKLYRRQ+LTNRAE+LYNQVCEILEENAL S R S QCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQGMKILP
        ASRLRDHLLLPRERK+PLLW+KVEELVQEDSRIDRYPRLVKG+GKEVWEWQ    LP
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQGMKILP

XP_022159868.1 uncharacterized protein LOC111026156 isoform X1 [Momordica charantia]

3.4e-205

99.72

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GLFQTQQNSLGI+ELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

XP_022159870.1 uncharacterized protein LOC111026156 isoform X2 [Momordica charantia]

3.4e-205

99.72

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GLFQTQQNSLGI+ELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

XP_038888162.1 uncharacterized protein LOC120078048 [Benincasa hispida]

2.7e-178

85.47

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPK+R K+K N +SD GS+GDSS SSST+LLKS+K+PPRDFFPS++DL  LITVLFIACL+F+SC+FFVSRLASR+P PFCDTDADSLDLLSD C+P
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CP HGECR G+L+C+ GYRKHGRLCIEDGVINEAV KLSEWLESHLCEANAKF+CDG+G VWVKEDDIWDDLDG+ LVE+IGSDNTT  YAK KALETI 
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GLFQT+QNSLGIKELKCPDLLAESYKPFTCRI HWVL+HAF VLPVFLLLVGCTWLLWKLYRRQ++TNRAE+LYNQVCEILEENALMS R SGQCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERK+PLLWRKVEELVQEDSRIDRYPRLVKG+GKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

TrEMBL top hits

e value

%identity

Alignment

A0A1S4E5Q9 uncharacterized protein LOC103503505 isoform X4

4.3e-174

83.19

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPK+R K+K NP+SD GS  DSS SSS++LLKS+K+PPRDFFPS++DL  LITVL IA LVF+SCNFFVSRL+SR P PFCDTDADSLDLLSD C+P
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CP HGECR G+LEC+ GYRKHGRLCIEDGVINEAV KLSEWLESHLCE+NAKF+CDG+G VWVKE+DIWDDLDG+ LVE+IGSDNTT MYAK KALETI 
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GL QT+QNS GIKELKCPDLLAESYKPFTCRI HWVL+HAFVVLPVFLLLVGCTWLLWKLYRRQ+LTNRAE+LYNQVCEILEENAL S R S QCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQGMKILP
        ASRLRDHLLLPRERK+PLLW+KVEELVQEDSRIDRYPRLVKG+GKEVWEWQ    LP
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQGMKILP

A0A1S4E5R9 uncharacterized protein LOC103503505 isoform X2

1.6e-173

84.05

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPK+R K+K NP+SD GS  DSS SSS++LLKS+K+PPRDFFPS++DL  LITVL IA LVF+SCNFFVSRL+SR P PFCDTDADSLDLLSD C+P
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CP HGECR G+LEC+ GYRKHGRLCIEDGVINEAV KLSEWLESHLCE+NAKF+CDG+G VWVKE+DIWDDLDG+ LVE+IGSDNTT MYAK KALETI 
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GL QT+QNS GIKELKCPDLLAESYKPFTCRI HWVL+HAFVVLPVFLLLVGCTWLLWKLYRRQ+LTNRAE+LYNQVCEILEENAL S R S QCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERK+PLLW+KVEELVQEDSRIDRYPRLVKG+GKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

A0A5A7T509 MSC domain-containing protein

1.6e-173

84.05

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPK+R K+K NP+SD GS  DSS SSS++LLKS+K+PPRDFFPS++DL  LITVL IA LVF+SCNFFVSRL+SR P PFCDTDADSLDLLSD C+P
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CP HGECR G+LEC+ GYRKHGRLCIEDGVINEAV KLSEWLESHLCE+NAKF+CDG+G VWVKE+DIWDDLDG+ LVE+IGSDNTT MYAK KALETI 
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GL QT+QNS GIKELKCPDLLAESYKPFTCRI HWVL+HAFVVLPVFLLLVGCTWLLWKLYRRQ+LTNRAE+LYNQVCEILEENAL S R S QCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERK+PLLW+KVEELVQEDSRIDRYPRLVKG+GKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

A0A6J1E002 uncharacterized protein LOC111026156 isoform X2

1.6e-205

99.72

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GLFQTQQNSLGI+ELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

A0A6J1E026 uncharacterized protein LOC111026156 isoform X1

1.6e-205

99.72

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
        GLFQTQQNSLGI+ELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVV

Query:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
Subjt:  ASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT5G46560.1 CONTAINS InterPro DOMAIN/s: Inner nuclear membrane protein MAN1 (InterPro:IPR018996); Has 58 Blast hits to 58 proteins in 29 species: Archae - 0; Bacteria - 4; Metazoa - 11; Fungi - 15; Plants - 20; Viruses - 0; Other Eukaryotes - 8 (source: NCBI BLink).

4.5e-91

45.74

Show/hide

Query:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP
        M S P++R    P  ++  G    SS+SSS +  +S+ +PP+  FPS+ +   L+ VL +AC V  +CNF    L+S   + FCD++ + +D   D C+P
Subjt:  MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKP

Query:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII
        CP +GEC  G+L+C  GY+    LC+EDG INE+ KKL  + E  +CE+ A   C G GT+WV E+D+W +L   + + N+  D + + + K KA+E + 
Subjt:  CPSHGECRGGELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETII

Query:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRI-SGQCESWV
         L + + NS GI ELKCP+ +A+SYKP TCR+H W+L+H  ++     +LVG   L  ++ R+Q  + R E LY+QVC+ LEENA+ S    +  CE WV
Subjt:  GLFQTQQNSLGIKELKCPDLLAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRI-SGQCESWV

Query:  VASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ
        +AS LRD+LLLPRER+DPLLW KVEEL++EDSRIDRY +L+KGE K VWEWQ
Subjt:  VASRLRDHLLLPRERKDPLLWRKVEELVQEDSRIDRYPRLVKGEGKEVWEWQ

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCTTCAACTCCGAAGAGGCGAAAGAAACTCAAGCCAAATCCGGACTCCGATGCCGGTTCTAAAGGCGATTCTTCTGCTTCATCTTCTACAGTGTTGCTGAAGTCTCT
CAAGCAACCGCCTCGCGATTTCTTTCCCTCCGAGAACGATCTCATTAGGCTAATTACTGTACTTTTCATCGCCTGCTTGGTTTTTCTGAGCTGTAACTTCTTCGTATCTA
GACTCGCGAGTCGCCGCCCGGAGCCTTTCTGCGACACTGACGCCGATTCCTTGGACTTGCTTTCTGATGCTTGCAAGCCTTGTCCAAGTCATGGAGAATGCCGTGGAGGT
GAGTTGGAATGTGTTCGTGGTTATAGAAAGCACGGAAGGTTATGCATAGAAGATGGAGTAATCAATGAAGCAGTTAAGAAACTTTCAGAATGGCTAGAATCTCACCTCTG
TGAAGCAAATGCCAAGTTCATGTGCGATGGAGTTGGGACAGTCTGGGTTAAAGAGGATGATATATGGGATGATTTAGATGGTCAAGCACTGGTGGAAAACATTGGCTCTG
ACAACACCACTTTTATGTATGCGAAGAGAAAGGCATTGGAAACTATTATTGGGTTATTTCAGACACAGCAAAATTCTCTTGGGATCAAGGAATTGAAATGTCCAGATCTG
CTGGCTGAAAGTTACAAGCCATTTACTTGCCGTATTCATCATTGGGTTTTGAAGCATGCTTTTGTTGTTTTGCCAGTTTTCTTACTGCTTGTGGGATGCACTTGGTTACT
ATGGAAACTTTACCGGAGACAACATCTAACAAATAGAGCTGAAAATCTGTACAACCAGGTCTGCGAAATACTTGAGGAAAATGCTTTGATGTCAAAGAGAATAAGTGGTC
AATGTGAATCATGGGTTGTTGCATCCAGGTTACGCGACCATCTTCTTTTGCCACGAGAGAGGAAGGATCCTTTGTTATGGAGGAAGGTAGAGGAATTGGTTCAGGAAGAC
TCACGAATAGATCGCTACCCGAGACTGGTCAAGGGTGAAGGAAAAGAAGTATGGGAATGGCAAGGTATGAAAATATTGCCCTTTATTTTCATTTCTTTT

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSSTPKRRKKLKPNPDSDAGSKGDSSASSSTVLLKSLKQPPRDFFPSENDLIRLITVLFIACLVFLSCNFFVSRLASRRPEPFCDTDADSLDLLSDACKPCPSHGECRGG
ELECVRGYRKHGRLCIEDGVINEAVKKLSEWLESHLCEANAKFMCDGVGTVWVKEDDIWDDLDGQALVENIGSDNTTFMYAKRKALETIIGLFQTQQNSLGIKELKCPDL
LAESYKPFTCRIHHWVLKHAFVVLPVFLLLVGCTWLLWKLYRRQHLTNRAENLYNQVCEILEENALMSKRISGQCESWVVASRLRDHLLLPRERKDPLLWRKVEELVQED
SRIDRYPRLVKGEGKEVWEWQGMKILPFIFISF

MS005430 (gene) of Bitter gourd (TR) v1 genome