CuGenDBv2

Gene ID	MS012847
Organism	Momordica charantia cv. TR (Bitter gourd (TR) v1)
Description	Unknown protein
Genome location	scaffold63:3928640..3929242
RNA-Seq Expression	MS012847
Synteny	MS012847
Gene Ontology terms	NA
InterPro domains	IPR025322 - Protein of unknown function DUF4228, plant

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6577133.1 hypothetical protein SDJN03_24707, partial [Cucurbita argyrosperma subsp. sororia]

3.6e-76

76.35

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKG+  +CEKPIRILTDSGNIINFHG KQV QILK+YPP  YGVFRRPNLSSPLP S  LDAGKSYFLLPLSRAAE+   D           AAE
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL
        DL  GSG+EVLP GGDG+WRVKLVIDTKQL EILAEE NTEALIERMRAAAA AA +SPRR KIGGWKP  GNW K  PID+G N+KAQIKDF+SGNGCL
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL

Query:  NAT
         AT
Subjt:  NAT

XP_022136823.1 uncharacterized protein LOC111008428 [Momordica charantia]

5.6e-109

100

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLGNSKAQIKDFNSGNGCLNA
        DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLGNSKAQIKDFNSGNGCLNA
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLGNSKAQIKDFNSGNGCLNA

Query:  T
        T
Subjt:  T

XP_022985422.1 uncharacterized protein LOC111483432 [Cucurbita maxima]

2.8e-76

75.86

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKG+  +CEKPIRILTDSGNIINFHG KQV QILK+YPP  YGVFRRPNLSSPLP S PLDAGKSYFLLPLSRAAE+   D           AA 
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL
        DL  GSG+EVLP GGDG+WRVKLVIDTKQL EILAE+ NTEALIERMRAAAA AA +SPRR KIGGWKP  GNW K FPID+G N+KAQ+KDF+SGNGCL
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL

Query:  NAT
         AT
Subjt:  NAT

XP_023522023.1 uncharacterized protein LOC111785895 [Cucurbita pepo subsp. pepo]

4.3e-77

76.85

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKG+  +CEKPIRILTDSGNIINFHG KQV QILK+YPP  YGVFRRPNLSSPLP S PLDAGKSYFLLPLSRAAE+   D           AAE
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLGN-SKAQIKDFNSGNGCL
        DL  GSG+EVLP GGDG+WRVKLVIDTKQL EILAEE NTEALIERMRAAAA AA +SPRR KIGGWKP  GNW K  PID+GN +KAQIKDF+SGNGCL
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLGN-SKAQIKDFNSGNGCL

Query:  NAT
         AT
Subjt:  NAT

XP_038907067.1 uncharacterized protein LOC120092893 [Benincasa hispida]

3.6e-76

76.88

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKGMT +CEKPIRILTDSGNIINFHG KQVHQIL +YPP  YGVFRRPNLSSPLP S PLDAGKSYFLLPLSR A++V  DDG  P        +
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL
        +LG GSG+EVLPAGG+GVWRVKLVIDTKQL EILAEE NTEALIERMRAAAA   ESP+R KIGGWK   GN LK FPID+G N+KAQIKDF++GNGCL
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KYF7 Uncharacterized protein

1.6e-69

74.23

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKGM  +CEKPIRILTDSG+IINFHG KQVHQIL +YPP  YGVFRRPNLSSPLP S PLDAGKSYFLLPLS++      +DG +P       ++
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLGNS-KAQIKDFN
        D+G  SG+EVLPAGG+GVWRVKLVIDTKQL EILAEE NTEALIERMRAAAA AA +SPRR KIGGWKP+ GNW K FPID+GNS KAQ+K FN
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLGNS-KAQIKDFN

A0A5A7TTS6 Uncharacterized protein

1.8e-68

72.31

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKGM  +C KPIRILTDSG+IINFHG KQVHQIL +YPP  YGVFRRPNLSSPLP S PLDAGKSYFLLPLS+            PS+       
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNS
        DLG  SG+EVLPA G+GVWRVKLVIDTKQL EILAEE NTEALIER+RAAAA AA +SPRR KI GWKP+ GNWLK FP+D G N+KAQIK+FNS
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNS

A0A6J1C8K7 uncharacterized protein LOC111008428

2.7e-109

100

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLGNSKAQIKDFNSGNGCLNA
        DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLGNSKAQIKDFNSGNGCLNA
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLGNSKAQIKDFNSGNGCLNA

Query:  T
        T
Subjt:  T

A0A6J1EZE8 uncharacterized protein LOC111437614

5.1e-76

75.86

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKG+  +CEKPIRILTDSGNIINFHG KQV QILK+YPP  YGVFRRPNLSSPLP S  LDAGKSYFLLPLSRA E+   D           AAE
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL
        DL  GSG+EVLP GGDG+WRVKLVIDTKQL EILAEE NTEALIERMRAAAA AA +SPRR KIGGWKP  GNW K  PID+G N+KAQIKDF+SGNGCL
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL

Query:  NAT
         AT
Subjt:  NAT

A0A6J1J4V0 uncharacterized protein LOC111483432

1.3e-76

75.86

Show/hide

Query:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE
        MGNCSLKG+  +CEKPIRILTDSGNIINFHG KQV QILK+YPP  YGVFRRPNLSSPLP S PLDAGKSYFLLPLSRAAE+   D           AA 
Subjt:  MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAE

Query:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL
        DL  GSG+EVLP GGDG+WRVKLVIDTKQL EILAE+ NTEALIERMRAAAA AA +SPRR KIGGWKP  GNW K FPID+G N+KAQ+KDF+SGNGCL
Subjt:  DLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAA-AATESPRRAKIGGWKPVLGNWLKIFPIDLG-NSKAQIKDFNSGNGCL

Query:  NAT
         AT
Subjt:  NAT

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G61920.1 unknown protein

8.0e-13

32.91

Show/hide

Query:  MGNCSLKG------MTTECEKPIRILTDSGNIINFHGAKQVHQILKDYP-PAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSR
        MGNC  KG      +  + +  I+++T +G ++  H       I  ++P    +      + S PL +   L  G  Y+LLPLS +A    + D  +  +
Subjt:  MGNCSLKG------MTTECEKPIRILTDSGNIINFHGAKQVHQILKDYP-PAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSR

Query:  RSGAAAEDLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAA
         S       G    +  L  GG GVW+V+LVI  +QL EILAE+V TEAL+E +R  A
Subjt:  RSGAAAEDLGGGSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAA

AT4G10910.1 unknown protein

5.0e-07

52.63

Show/hide

Query:  GSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRA
        G  ++V P   +GVW+ K+VI +KQLEEILA E NT ALI+++R AAA A  S   A
Subjt:  GSGVEVLPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGAACTGTTCTCTCAAAGGAATGACCACCGAATGCGAGAAGCCCATCAGAATCTTAACCGATTCTGGAAACATAATCAATTTCCATGGCGCAAAGCAAGTCCATCA
AATCCTCAAGGATTACCCGCCCGCCGCCTACGGCGTTTTCCGGCGCCCCAATCTCTCTTCGCCGCTGCCCAATTCGGCGCCCCTCGACGCCGGAAAATCCTACTTTCTCC
TCCCGCTTTCCCGAGCCGCCGAGAGAGTTCCGAAGGACGACGGAGGGGCGCCGTCGAGGAGGTCCGGCGCGGCGGCGGAGGATCTGGGAGGTGGGTCGGGGGTGGAGGTG
CTTCCGGCGGGTGGCGACGGCGTTTGGAGGGTGAAATTGGTGATAGATACGAAACAATTGGAGGAGATTTTGGCGGAGGAAGTGAACACGGAGGCGTTGATTGAGAGAAT
GAGGGCAGCGGCGGCGGCGGCGACGGAAAGTCCACGGCGGGCGAAGATCGGAGGGTGGAAGCCGGTGCTGGGGAATTGGCTGAAGATTTTTCCAATTGATTTGGGTAACA
GTAAAGCACAAATTAAGGATTTTAATTCTGGAAATGGGTGTTTAAATGCAACA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGNCSLKGMTTECEKPIRILTDSGNIINFHGAKQVHQILKDYPPAAYGVFRRPNLSSPLPNSAPLDAGKSYFLLPLSRAAERVPKDDGGAPSRRSGAAAEDLGGGSGVEV
LPAGGDGVWRVKLVIDTKQLEEILAEEVNTEALIERMRAAAAAATESPRRAKIGGWKPVLGNWLKIFPIDLGNSKAQIKDFNSGNGCLNAT

MS012847 (gene) of Bitter gourd (TR) v1 genome