; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MC08g2401 (gene) of Bitter gourd (Dali-11) v1 genome

Gene IDMC08g2401
OrganismMomordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
DescriptionProtein of unknown function (DUF1068)
Genome locationMC08:32928265..32932963
RNA-Seq ExpressionMC08g2401
SyntenyMC08g2401
Gene Ontology termsGO:0016021 - integral component of membrane (cellular component)
InterPro domainsIPR010471 - Protein of unknown function DUF1068


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004139277.1 uncharacterized protein LOC101212944 [Cucumis sativus]3.02e-11496.51Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERK+TSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

XP_008457359.1 PREDICTED: uncharacterized protein LOC103497063 [Cucumis melo]1.05e-11497.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

XP_022143173.1 uncharacterized protein LOC111013108 [Momordica charantia]1.14e-118100Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

XP_023547119.1 uncharacterized protein LOC111806024 [Cucurbita pepo subsp. pepo]9.33e-10994.67Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSG+CLRCCLVIFAVVSALAVCGPALYWRFKKA  LGDSK SC PCICDCPPPLSLLKIAPGL+NLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW
        EAVSGEHTRHMNITLFEAKR ASQYQREAEKCIAATETCEEARERAEAL IKERKLTSLWERRARQMGW
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW

XP_038890751.1 uncharacterized protein LOC120080238 [Benincasa hispida]3.68e-11597.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLS+TDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

TrEMBL top hitse value%identityAlignment
A0A0A0LG38 Uncharacterized protein1.46e-11496.51Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERK+TSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A1S3C6L6 uncharacterized protein LOC1034970635.10e-11597.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A5A7VC79 DUF1068 domain-containing protein5.10e-11597.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A6J1CQ21 uncharacterized protein LOC1110131085.53e-119100Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A6J1FI57 uncharacterized protein LOC1114443446.19e-10992.4Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPAL+WRFKKA  LGDSK SC PCICDCPPPLSLLKIAPGLANLSVTDCG NDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEG
        EAV+GEHTRHMNIT+FEAKRAASQYQREAEKCI+ATETCEEARERAEAL IKERKLTSLWERRARQMGW+G
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEG

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G05070.1 Protein of unknown function (DUF1068)8.5e-3244.58Show/hide
Query:  RSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAV
        R  A L+  L +  +  A  + GP LYW   +A     S  SCP C C+C    S + I   L+N S  DC  +DP++  + EK + +LLTEELKL+EA 
Subjt:  RSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAV

Query:  SGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW
        S E  +  ++ L EAK+  S YQ+EA+KC +  ETCEEARE+AE  + +++KLTS WE RARQ GW
Subjt:  SGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW

AT2G24290.1 Protein of unknown function (DUF1068)3.0e-6974.29Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS---CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEEL
        M+RRSG C+R CLVIF+VVSAL VCGPALYW+  K F +G ++ +   CPPC+CD PPPLSLL+IAPGLANLS+T CGS+DP+LK EMEK FVDLLTEEL
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS---CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEEL

Query:  KLQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        KLQEAV+ EH+RHMN+TL EAKR ASQYQ+EAEKC AATE CE ARERA+AL++KERK+T LWERRARQ+GWEGE
Subjt:  KLQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

AT2G32580.1 Protein of unknown function (DUF1068)9.1e-3446.34Show/hide
Query:  ACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAVSGE
        A L+  L + A+     + GP LYW   +A  L  S  SC  C+CDC   L LL I  GL+N S TDC   DP++  + EK + +LLTEELK +EA S E
Subjt:  ACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAVSGE

Query:  HTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE
          + ++  L EAK+  S YQ+EA+KC +  ETCEEARE+AE  +++++KLTS+WE+RARQ G++
Subjt:  HTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE

AT4G04360.1 Protein of unknown function (DUF1068)1.2e-2842.11Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDS-KISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKL
        M+RR     +   V+  +     + GP+LYW   +   + DS   SCPPC+CDC     LL I  GL+N S  DC  ++ +   E E  F +++ EELKL
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDS-KISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKL

Query:  QEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE
        +EA + E     +  L +AK+AASQYQ+EA+KC    ETCE ARE+AEA + ++R+L+ +WE RARQ GW+
Subjt:  QEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE

AT4G30996.1 Protein of unknown function (DUF1068)9.0e-7478.74Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS--CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELK
        M RRSG C+R CLVIFAVVSAL VCGPALYW+F K F +G ++ +  CPPC+CDCPPPLSLL+IAPGLANLS+TDCGS+DP+LK EMEKQFVDLLTEELK
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS--CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELK

Query:  LQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        LQEAV+ EH+RHMN+TL EAKR ASQYQ+EAEKC AATE CE ARERAEAL+IKERK+TSLWE+RARQ GWEGE
Subjt:  LQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCACGCCGATCTGGGGCTTGCCTGCGTTGTTGTCTGGTGATTTTTGCTGTAGTTTCTGCGTTGGCTGTTTGTGGACCGGCTCTGTATTGGAGATTCAAGAAAGCTTT
TCAATTGGGAGATTCCAAAATCTCGTGTCCTCCTTGCATCTGCGATTGCCCGCCCCCATTATCCCTTTTGAAGATTGCTCCTGGTCTGGCAAATCTCTCCGTCACAGACT
GTGGGAGTAATGACCCAGATCTCAAGCATGAGATGGAAAAGCAATTTGTGGACCTTTTGACAGAGGAATTGAAGCTTCAAGAAGCAGTTTCTGGTGAACATACTCGGCAT
ATGAACATCACTTTATTTGAGGCAAAAAGGGCAGCTTCTCAGTATCAGAGGGAGGCTGAGAAATGCATTGCTGCAACAGAAACTTGTGAAGAGGCCCGAGAACGTGCCGA
GGCATTGATGATCAAGGAGAGAAAGCTAACATCATTGTGGGAGCGGCGAGCCCGCCAAATGGGTTGGGAAGGGGAATAA
mRNA sequenceShow/hide mRNA sequence
GTTGAGTTGAATCATTTCCTTTTTTTTTGTCATATAAAAAAAAAAGAACTCAACTAGCTCAGAGAAATTTATGAAATAGCCCGAAGTATCAATTATCAATTATTTTAACA
ATATCATTTTTGAAAAAAAAAAGTATAAAATAATATCACATACACAGAGATGCAAATGGTGGGGTTAGCTTCAATTATTATTCTTCTCACAGCTAATGAATTCAACTGAA
TCGAGAGGAAAAAATGGTTTCAAACTTTCTGCTGCAGCTAGATCTCGCTACCTCACTTTCTCAGTAACGCGGAAAGAGAGAGGGGAAAATTAGGGAGAGAACAAGAAGCG
AAAAGGGAGAAAAAAAAGGAAGAAAAAAAAGGAAGAAAAGAAATAGGCAAGATCAGGGTGAGAAATGTCACGCCGATCTGGGGCTTGCCTGCGTTGTTGTCTGGTGATTT
TTGCTGTAGTTTCTGCGTTGGCTGTTTGTGGACCGGCTCTGTATTGGAGATTCAAGAAAGCTTTTCAATTGGGAGATTCCAAAATCTCGTGTCCTCCTTGCATCTGCGAT
TGCCCGCCCCCATTATCCCTTTTGAAGATTGCTCCTGGTCTGGCAAATCTCTCCGTCACAGACTGTGGGAGTAATGACCCAGATCTCAAGCATGAGATGGAAAAGCAATT
TGTGGACCTTTTGACAGAGGAATTGAAGCTTCAAGAAGCAGTTTCTGGTGAACATACTCGGCATATGAACATCACTTTATTTGAGGCAAAAAGGGCAGCTTCTCAGTATC
AGAGGGAGGCTGAGAAATGCATTGCTGCAACAGAAACTTGTGAAGAGGCCCGAGAACGTGCCGAGGCATTGATGATCAAGGAGAGAAAGCTAACATCATTGTGGGAGCGG
CGAGCCCGCCAAATGGGTTGGGAAGGGGAATAAATCTATAACTCTTGCAGGCCAATCTCTTAGCTCAACTAGTTGTCGAGTCAATCTACCCACGAGATCAATAGAAGAAG
GCAAGCAAAGTGCTTGGTTCGTCGATTTCTCAAGGCATAATGTTCTCTCTTTTCCTCCATTAATTGTGTTGCACTGTTCCTGGAAACCTGTCAAATTCTACATCGTAATT
CATACATTACAATGTTATAGATCCCACTCTTCTGCATTTGCTATATATATAAGATTATCTTCTCCTCAACCGTAATGGTGTGACTTGTTATCTAGGCATTTCTGATCAGT
TCACGAGCCCGAATAGATCGTGTAACGTGTTCCCACACCGAAAAAACTATGTTCTCAGTTTTGGCACCGGGTTGATTCCCTGGTAAGTGATGTTAGTAAAATTGGGGGTC
ACTTTTGCATATTGGGA
Protein sequenceShow/hide protein sequence
MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAVSGEHTRH
MNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE