CuGenDBv2

Gene ID	MC02g0192
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	WHy domain-containing protein
Genome location	MC02:1828840..1829397
RNA-Seq Expression	MC02g0192
Synteny	MC02g0192
Gene Ontology terms	GO:0009269 - response to desiccation (biological process)
InterPro domains	IPR004864 - Late embryogenesis abundant protein, LEA_2 subgroup IPR013990 - Water stress and hypersensitive response domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0061714.1 late embryogenesis abundant hydroxyproline-rich glycoprotein [Cucumis melo var. makuwa]

7.31e-119

94.51

Show/hide

Query:  MGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARS
        MG+KRNWSWSSALVGAASA+AATA++SAKPKDPTFHLISIKFTSFK+KPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSA+VDAGSQQ RS
Subjt:  MGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARS

Query:  CQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        CQVLRLPARLDGLKLAHHG RFISDVAKREMVLDASVDIGG AKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  CQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

KAE8647360.1 hypothetical protein Csa_003928 [Cucumis sativus]

1.30e-116

92.93

Show/hide

Query:  KSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA
        K MG+KRNWSW+SALVGAASAIAATA++SAKPKDPTFHLISIKFTSFK+KPPVVD ELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSA+VDAGSQQ 
Subjt:  KSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA

Query:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        RSCQVLRLPARLDGLKLAHHG RFISDVAKREMVLDASVDIGG A+VLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

XP_004140159.2 uncharacterized protein LOC101218134 [Cucumis sativus]

1.66e-117

92.93

Show/hide

Query:  KSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA
        K MG+KRNWSW+SALVGAASAIAATA++SAKPKDPTFHLISIKFTSFK+KPPVVD ELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSA+VDAGSQQ 
Subjt:  KSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA

Query:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        RSCQVLRLPARLDGLKLAHHG RFISDVAKREMVLDASVDIGG A+VLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

XP_008449575.2 PREDICTED: uncharacterized protein LOC103491417 [Cucumis melo]

2.81e-120

94.09

Show/hide

Query:  PAKSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQ
        PAK MG+KRNWSWSSALVGAASA+AATA++SAKPKDPTFHLISIKFTSFK+KPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSA+VDAGSQ
Subjt:  PAKSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQ

Query:  QARSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        Q RSCQVLRLPARLDGLKLAHHG RFISDVAKREMVLDASVDIGG AKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  QARSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

XP_038900652.1 uncharacterized protein LOC120087813 [Benincasa hispida]

1.26e-119

95.6

Show/hide

Query:  MGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARS
        MG+KRNWSWSSALVGAASAIAATA+VSAKPKDPTFHLISIKFTSFK+KPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSA+VDAGSQQ RS
Subjt:  MGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARS

Query:  CQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        CQVLRLPARLDGLKLAHHG RFISDVAKREM+LDASVDIGG AKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  CQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KGW5 WHy domain-containing protein

8.06e-118

92.93

Show/hide

Query:  KSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA
        K MG+KRNWSW+SALVGAASAIAATA++SAKPKDPTFHLISIKFTSFK+KPPVVD ELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSA+VDAGSQQ 
Subjt:  KSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA

Query:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        RSCQVLRLPARLDGLKLAHHG RFISDVAKREMVLDASVDIGG A+VLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

A0A1S3BMZ9 uncharacterized protein LOC103491417

1.36e-120

94.09

Show/hide

Query:  PAKSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQ
        PAK MG+KRNWSWSSALVGAASA+AATA++SAKPKDPTFHLISIKFTSFK+KPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSA+VDAGSQ
Subjt:  PAKSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQ

Query:  QARSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        Q RSCQVLRLPARLDGLKLAHHG RFISDVAKREMVLDASVDIGG AKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  QARSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

A0A5D3B864 Late embryogenesis abundant hydroxyproline-rich glycoprotein

3.54e-119

94.51

Show/hide

Query:  MGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARS
        MG+KRNWSWSSALVGAASA+AATA++SAKPKDPTFHLISIKFTSFK+KPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFY+GSLLGSA+VDAGSQQ RS
Subjt:  MGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARS

Query:  CQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        CQVLRLPARLDGLKLAHHG RFISDVAKREMVLDASVDIGG AKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  CQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

A0A6J1H295 uncharacterized protein LOC111459445

1.42e-114

92.93

Show/hide

Query:  MGRKRNWSWS--SALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA
        M +KR+WSWS  SALVGAASAIAATA+VSAKPKDPTFHLISIKFTSFK+KPPVVDAELILTVHVTNPNVAPIHYSST+MSIFYDGSLLGSA VDAGSQQA
Subjt:  MGRKRNWSWS--SALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA

Query:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        RSCQVLRLPARLDGLKLAH+G RFISDV KREMVLDASVDIGGIA+VLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

A0A6J1K4X2 uncharacterized protein LOC111490777

1.42e-114

92.39

Show/hide

Query:  MGRKRNWSWS--SALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA
        M +KR+WSWS  SALVGAASAIAATA+VSAKPKDPTFHLISIKFTSFK+KPPV+DAELILTVHVTNPNVAPIHYSST+MSIFYDGSLLGSA+VDAGSQQA
Subjt:  MGRKRNWSWS--SALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQA

Query:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        RSCQVLRLPARLDGLKLAH+G RFISDV KREMVLDASVDIGGIA+VLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
Subjt:  RSCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G52330.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

4.2e-08

28.78

Show/hide

Query:  PKDPTFHLISIKFTSFKV--KP-PVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARSCQVLRLPARLDGLKLAHHGGRFISDV
        P DP   +I +K +   V  +P P +D  L++T+ V+N +V    ++   ++I Y G  LG    D G   A     L   A LDG+ +       I D+
Subjt:  PKDPTFHLISIKFTSFKV--KP-PVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARSCQVLRLPARLDGLKLAHHGGRFISDV

Query:  AKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPV
        AK  +  D   +  G   VL++    K  V   + VD V
Subjt:  AKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPV

AT1G52330.2 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

3.5e-07

28.91

Show/hide

Query:  PKDPTFHLISIKFTSFKV--KP-PVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARSCQVLRLPARLDGLKLAHHGGRFISDV
        P DP   +I +K +   V  +P P +D  L++T+ V+N +V    ++   ++I Y G  LG    D G   A     L   A LDG+ +       I D+
Subjt:  PKDPTFHLISIKFTSFKV--KP-PVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARSCQVLRLPARLDGLKLAHHGGRFISDV

Query:  AKREMVLDASVDIGGIAKVLWWSHKFKV
        AK  +  D   +  G   VL++    KV
Subjt:  AKREMVLDASVDIGGIAKVLWWSHKFKV

AT3G44380.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

3.2e-69

69.95

Show/hide

Query:  SMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQAR
        S  +K  WSWSSAL+GAASA AA +++SAKPKDPTFHLISI  TS K+  PV+DAEL+LTVHVTNPN+A IHYSST M+I YDG++LGSA V AGSQ AR
Subjt:  SMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQAR

Query:  SCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL
        SCQ+LRLPARLDG++LA H  +F SDVA REM L+A + I G AKVLWW H F+VHVDS +TVDPVFLDV+ QEN SQ++LFL
Subjt:  SCQVLRLPARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

CCGGCGAAGAGCATGGGGAGAAAGCGTAACTGGAGCTGGAGCTCCGCCCTGGTCGGAGCGGCGTCGGCGATTGCGGCGACGGCGGTCGTTTCCGCGAAACCTAAGGACCC
GACGTTCCACCTGATTTCAATCAAGTTCACTTCCTTCAAAGTGAAGCCGCCGGTGGTGGACGCCGAGCTCATCCTGACCGTCCACGTCACCAACCCCAACGTGGCCCCCA
TCCACTACTCCTCCACCGCCATGTCCATCTTCTACGACGGCTCCCTCCTCGGCTCGGCCCGGGTCGACGCCGGGTCGCAGCAGGCCCGGTCCTGCCAGGTCCTCCGTCTC
CCGGCCCGGCTCGACGGCCTCAAGCTGGCCCACCACGGCGGCCGGTTCATCTCCGACGTCGCGAAACGGGAGATGGTTCTGGACGCGAGCGTGGACATTGGGGGAATCGC
AAAAGTGCTGTGGTGGAGTCACAAGTTCAAGGTCCACGTGGACAGCCATCTCACCGTTGATCCCGTGTTCCTTGATGTACTGGATCAGGAAAATACTTCCCAACTTGAGC
TCTTTCTT

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

PAKSMGRKRNWSWSSALVGAASAIAATAVVSAKPKDPTFHLISIKFTSFKVKPPVVDAELILTVHVTNPNVAPIHYSSTAMSIFYDGSLLGSARVDAGSQQARSCQVLRL
PARLDGLKLAHHGGRFISDVAKREMVLDASVDIGGIAKVLWWSHKFKVHVDSHLTVDPVFLDVLDQENTSQLELFL

MC02g0192 (gene) of Bitter gourd (Dali-11) v1 genome