CuGenDBv2

Gene ID	Moc01g20670
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Encodes a protein involved in salt tolerance, names SIS (Salt Induced Serine rich).
Genome location	chr1:14430798..14435327
RNA-Seq Expression	Moc01g20670
Synteny	Moc01g20670
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_008448572.1 PREDICTED: uncharacterized protein LOC103490707 isoform X1 [Cucumis melo]

1.7e-59

81.41

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGS ETSYSSTTGIFGSIFAPSSKVLG ESLLSQ KE ER+SVNEPW PN EA+DD ANH QKESQEMKNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
         AQPCHLSSSIYYGGQDVY+  QNS+NSG NS +KK+GGEDDSGSASRGNWWQ  L
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

XP_008448581.1 PREDICTED: uncharacterized protein LOC103490707 isoform X2 [Cucumis melo]

2.9e-59

82.35

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGS ETSYSSTTGIFGSIFAPSSKVLG ESLLSQ KE ER+SVNEPW PN EA+DD ANH QKESQEMKNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ
         AQPCHLSSSIYYGGQDVY+  QNS+NSG NS +KK+GGEDDSGSASRGNWWQ
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ

XP_022151567.1 uncharacterized protein LOC111019480 [Momordica charantia]

1.1e-74

98.69

Show/hide

Query:  MEGKKQLGSSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQRAQ
        MEGKKQLGSSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQRAQ
Subjt:  MEGKKQLGSSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQRAQ

Query:  PCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
        PCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ  L
Subjt:  PCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

XP_038882075.1 uncharacterized protein LOC120073353 isoform X1 [Benincasa hispida]

8.2e-62

83.33

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGSKETSYSSTTGIFGSIFAPSSKVLG +SLLSQ KEGERDSVNEPWIPN EA+DD ANH QKES EMKNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
        RAQPCHLSSSIYYGGQDVY+  QNS+NS VNS +KK+GGEDDSGSASRGNWWQ  L
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

XP_038882076.1 uncharacterized protein LOC120073353 isoform X2 [Benincasa hispida]

8.5e-59

81.41

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGSKETSYSSTTGIFGSIFAPSSKVLG +SLLSQ KEGERDSVNEPWIPN EA+DD ANH QKES EMKNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
        RAQPCHLSSSIYYGGQDVY+  QNS+    NS +KK+GGEDDSGSASRGNWWQ  L
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0L143 Uncharacterized protein

2.0e-58

80.13

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGS ETSYSSTTGIFGSIFAPSSKVLG ESLLS  KE ER+SVNEPW PN  A+DD ANH QKESQE KNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
        RAQPCHLSSSIYYGGQDVY+  QNS+NSG NS +KK+GGEDDSGSASRGNWWQ  L
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

A0A1S3BK03 uncharacterized protein LOC103490707 isoform X2

1.4e-59

82.35

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGS ETSYSSTTGIFGSIFAPSSKVLG ESLLSQ KE ER+SVNEPW PN EA+DD ANH QKESQEMKNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ
         AQPCHLSSSIYYGGQDVY+  QNS+NSG NS +KK+GGEDDSGSASRGNWWQ
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ

A0A1S3BKM1 uncharacterized protein LOC103490707 isoform X1

8.3e-60

81.41

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGS ETSYSSTTGIFGSIFAPSSKVLG ESLLSQ KE ER+SVNEPW PN EA+DD ANH QKESQEMKNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
         AQPCHLSSSIYYGGQDVY+  QNS+NSG NS +KK+GGEDDSGSASRGNWWQ  L
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

A0A5D3DIY4 Uncharacterized protein

8.3e-60

81.41

Show/hide

Query:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ
        MEGKK +G   SSSSLT DLFGS ETSYSSTTGIFGSIFAPSSKVLG ESLLSQ KE ER+SVNEPW PN EA+DD ANH QKESQEMKNKD+SSIYQ+Q
Subjt:  MEGKKQLG---SSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQ

Query:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
         AQPCHLSSSIYYGGQDVY+  QNS+NSG NS +KK+GGEDDSGSASRGNWWQ  L
Subjt:  RAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

A0A6J1DDV5 uncharacterized protein LOC111019480

5.3e-75

98.69

Show/hide

Query:  MEGKKQLGSSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQRAQ
        MEGKKQLGSSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQRAQ
Subjt:  MEGKKQLGSSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQRAQ

Query:  PCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
        PCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ  L
Subjt:  PCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G39855.2 unknown protein

3.0e-14

42.41

Show/hide

Query:  MEGKKQL---GSSSSLTID-LFGSKET-SY-SSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHR--QKESQEMKNKDLSS
        M+ KK +    SSSS ++D +FG + + SY SSTTG+F SIF P S V  G +L S+               N  AK    N     +  +  KNK+  S
Subjt:  MEGKKQL---GSSSSLTID-LFGSKET-SY-SSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHR--QKESQEMKNKDLSS

Query:  IYQEQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ
           E+   PC+LSSSIYYGGQD YS S  + ++     +KKDG E DS SASRGNWW+
Subjt:  IYQEQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQ

AT3G55646.1 unknown protein

2.0e-13

37.5

Show/hide

Query:  EGKKQLGSSSSLTIDL------FGSK--ETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSI
        + KK++ S+SS +  L      FG +   +S SS TG+F SIF P S     + L  Q+    +    +   PN  AK + +N ++K+          S 
Subjt:  EGKKQLGSSSSLTIDL------FGSK--ETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSI

Query:  YQEQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
        Y E+   PCHLSSS+YYGGQ+ YS    S  +  +  +KKDG E DS  ASRGNWW+  L
Subjt:  YQEQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

AT5G02020.1 Encodes a protein involved in salt tolerance, names SIS (Salt Induced Serine rich).

4.1e-27

53.12

Show/hide

Query:  MEGKKQLG------SSSSLTIDLFGSKET-SYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSI
        MEG+K+        SSSSLT +LFGS+E  S  S++GI GSIF P SKVLG ES+  +   G        W   T +K      R +E QE      S  
Subjt:  MEGKKQLG------SSSSLTIDLFGSKET-SYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSI

Query:  YQEQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL
         Q+QR QPCHLSSSIYYGG DVY Q QNS +   NS  KKDGGEDDSGSASRGNWWQ  L
Subjt:  YQEQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQL

AT5G02020.2 Encodes a protein involved in salt tolerance, names SIS (Salt Induced Serine rich).

7.2e-16

48.84

Show/hide

Query:  MEGKKQLG------SSSSLTIDLFGSKET-SYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSI
        MEG+K+        SSSSLT +LFGS+E  S  S++GI GSIF P SKVLG ES+  +   G        W   T +K      R +E QE      S  
Subjt:  MEGKKQLG------SSSSLTIDLFGSKET-SYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSI

Query:  YQEQRAQPCHLSSSIYYGGQDVYSQSQNS
         Q+QR QPCHLSSSIYYGG DVY Q QNS
Subjt:  YQEQRAQPCHLSSSIYYGGQDVYSQSQNS

AT5G59080.1 unknown protein

1.7e-12

37.42

Show/hide

Query:  MEGKKQLGS----SSSLTIDLFGSKETS-YSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQ
        MEGK ++GS    SSS T +LFGSK+ S  SS++GIF ++F   S            K   RD  N                 +  SQ  + + L++  Q
Subjt:  MEGKKQLGS----SSSLTIDLFGSKETS-YSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQ

Query:  EQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSG-----SASRGNWWQEQL
        E R +PCHLSSS+YYGGQDVY++S  +         ++  GEDD+        SRGNWWQ  L
Subjt:  EQRAQPCHLSSSIYYGGQDVYSQSQNSHNSGVNSVFKKDGGEDDSG-----SASRGNWWQEQL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGGAAAAAAGCAACTGGGTTCCTCTTCTTCTCTCACCATTGACCTGTTTGGCTCCAAAGAAACTTCCTACTCCTCAACCACTGGAATTTTCGGCTCTATATTTGC
ACCTTCTTCCAAGGTGTTAGGGGGAGAGTCTCTGCTCTCTCAGATCAAAGAGGGAGAGAGGGATTCTGTAAATGAGCCATGGATCCCCAACACTGAAGCTAAAGATGATG
CTGCTAATCATAGACAAAAGGAGAGTCAGGAGATGAAGAATAAAGATCTGAGTTCCATTTATCAGGAACAAAGAGCACAACCATGTCATCTTAGCTCATCAATCTATTAT
GGTGGCCAAGATGTTTATTCTCAGTCTCAGAATTCCCATAATTCCGGGGTGAACTCGGTGTTCAAGAAGGATGGGGGAGAAGATGATTCTGGGAGTGCTTCAAGAGGAAA
TTGGTGGCAAGAACAACTCACGGCCACACTTGAAGCCGACGGGGCGGCGAGCAATGTTGCAGCGTGTGGGGATGGTGACGGCAATTCTGGGGTCGACGCCGGCGCTTCTG
GCGGTCGGAGAAAGAAAGGCGGCGCAGAGGCAGGCTGGTCGTCGCCCAATTTGGGCCAACCGCCGGCAGCAATTTCTGGGGACATTGGCTCCGGCGTTTCGCGCGGCGGT
GATGCAGGGAAAAAGCTTCACGGCGACGCTATCTGGATCGGATTTCCCACATGGACTCGACCCCGCCGCCACTTTCAGCCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MEGKKQLGSSSSLTIDLFGSKETSYSSTTGIFGSIFAPSSKVLGGESLLSQIKEGERDSVNEPWIPNTEAKDDAANHRQKESQEMKNKDLSSIYQEQRAQPCHLSSSIYY
GGQDVYSQSQNSHNSGVNSVFKKDGGEDDSGSASRGNWWQEQLTATLEADGAASNVAACGDGDGNSGVDAGASGGRRKKGGAEAGWSSPNLGQPPAAISGDIGSGVSRGG
DAGKKLHGDAIWIGFPTWTRPRRHFQP

Moc01g20670 (gene) of Bitter gourd (OHB3-1) v2 genome