; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Moc08g43840 (gene) of Bitter gourd (OHB3-1) v2 genome

Gene IDMoc08g43840
OrganismMomordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
DescriptionProtein of unknown function (DUF1068)
Genome locationchr8:33676818..33680584
RNA-Seq ExpressionMoc08g43840
SyntenyMoc08g43840
Gene Ontology termsGO:0016021 - integral component of membrane (cellular component)
InterPro domainsIPR010471 - Protein of unknown function DUF1068


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004139277.1 uncharacterized protein LOC101212944 [Cucumis sativus]4.6e-8896.51Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERK+TSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

XP_008457359.1 PREDICTED: uncharacterized protein LOC103497063 [Cucumis melo]2.1e-8897.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

XP_022143173.1 uncharacterized protein LOC111013108 [Momordica charantia]2.0e-91100Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

XP_023547119.1 uncharacterized protein LOC111806024 [Cucurbita pepo subsp. pepo]6.9e-8494.67Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSG+CLRCCLVIFAVVSALAVCGPALYWRFKKA  LGDSK SC PCICDCPPPLSLLKIAPGL+NLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW
        EAVSGEHTRHMNITLFEAKR ASQYQREAEKCIAATETCEEARERAEAL IKERKLTSLWERRARQMGW
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW

XP_038890751.1 uncharacterized protein LOC120080238 [Benincasa hispida]9.3e-8997.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLS+TDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

TrEMBL top hitse value%identityAlignment
A0A0A0LG38 Uncharacterized protein2.2e-8896.51Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERK+TSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A1S3C6L6 uncharacterized protein LOC1034970631.0e-8897.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A5A7VC79 DUF1068 domain-containing protein1.0e-8897.09Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPALYWRFKKA QLGDSK SCPPCICDCPPPLSLLKI+PGLANLSVTDCGSNDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A6J1CQ21 uncharacterized protein LOC1110131089.7e-92100Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

A0A6J1FI57 uncharacterized protein LOC1114443444.4e-8492.4Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ
        MSRRSGACLRCCLV FAVVSALAVCGPAL+WRFKKA  LGDSK SC PCICDCPPPLSLLKIAPGLANLSVTDCG NDPDLK EMEKQFVDLLTEELKLQ
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQ

Query:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEG
        EAV+GEHTRHMNIT+FEAKRAASQYQREAEKCI+ATETCEEARERAEAL IKERKLTSLWERRARQMGW+G
Subjt:  EAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEG

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G05070.1 Protein of unknown function (DUF1068)8.5e-3244.58Show/hide
Query:  RSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAV
        R  A L+  L +  +  A  + GP LYW   +A     S  SCP C C+C    S + I   L+N S  DC  +DP++  + EK + +LLTEELKL+EA 
Subjt:  RSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAV

Query:  SGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW
        S E  +  ++ L EAK+  S YQ+EA+KC +  ETCEEARE+AE  + +++KLTS WE RARQ GW
Subjt:  SGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGW

AT2G24290.1 Protein of unknown function (DUF1068)3.0e-6974.29Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS---CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEEL
        M+RRSG C+R CLVIF+VVSAL VCGPALYW+  K F +G ++ +   CPPC+CD PPPLSLL+IAPGLANLS+T CGS+DP+LK EMEK FVDLLTEEL
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS---CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEEL

Query:  KLQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        KLQEAV+ EH+RHMN+TL EAKR ASQYQ+EAEKC AATE CE ARERA+AL++KERK+T LWERRARQ+GWEGE
Subjt:  KLQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE

AT2G32580.1 Protein of unknown function (DUF1068)9.1e-3446.34Show/hide
Query:  ACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAVSGE
        A L+  L + A+     + GP LYW   +A  L  S  SC  C+CDC   L LL I  GL+N S TDC   DP++  + EK + +LLTEELK +EA S E
Subjt:  ACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAVSGE

Query:  HTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE
          + ++  L EAK+  S YQ+EA+KC +  ETCEEARE+AE  +++++KLTS+WE+RARQ G++
Subjt:  HTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE

AT4G04360.1 Protein of unknown function (DUF1068)1.2e-2842.11Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDS-KISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKL
        M+RR     +   V+  +     + GP+LYW   +   + DS   SCPPC+CDC     LL I  GL+N S  DC  ++ +   E E  F +++ EELKL
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDS-KISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKL

Query:  QEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE
        +EA + E     +  L +AK+AASQYQ+EA+KC    ETCE ARE+AEA + ++R+L+ +WE RARQ GW+
Subjt:  QEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWE

AT4G30996.1 Protein of unknown function (DUF1068)9.0e-7478.74Show/hide
Query:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS--CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELK
        M RRSG C+R CLVIFAVVSAL VCGPALYW+F K F +G ++ +  CPPC+CDCPPPLSLL+IAPGLANLS+TDCGS+DP+LK EMEKQFVDLLTEELK
Subjt:  MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKIS--CPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELK

Query:  LQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE
        LQEAV+ EH+RHMN+TL EAKR ASQYQ+EAEKC AATE CE ARERAEAL+IKERK+TSLWE+RARQ GWEGE
Subjt:  LQEAVSGEHTRHMNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCACGCCGATCTGGGGCTTGCCTGCGTTGTTGTCTGGTGATTTTTGCTGTAGTTTCTGCGTTGGCTGTTTGTGGACCGGCTCTGTATTGGAGATTCAAGAAAGCTTT
TCAATTGGGAGATTCCAAAATCTCGTGTCCTCCTTGCATCTGCGATTGCCCGCCCCCATTATCCCTTTTGAAGATTGCTCCTGGTCTGGCAAATCTCTCCGTCACAGACT
GTGGGAGTAATGACCCAGATCTCAAGCATGAGATGGAAAAGCAATTTGTGGACCTTTTGACAGAGGAATTGAAGCTTCAAGAAGCAGTTTCTGGTGAACATACTCGGCAT
ATGAACATCACTTTATTTGAGGCAAAAAGGGCAGCTTCTCAGTATCAGAGGGAGGCTGAGAAATGCATTGCTGCAACAGAAACTTGTGAAGAGGCCCGAGAACGTGCCGA
GGCATTGATGATCAAGGAGAGAAAGCTAACATCATTGTGGGAGCGGCGAGCCCGCCAAATGGGTTGGGAAGGGGAATAA
mRNA sequenceShow/hide mRNA sequence
ATGTCACGCCGATCTGGGGCTTGCCTGCGTTGTTGTCTGGTGATTTTTGCTGTAGTTTCTGCGTTGGCTGTTTGTGGACCGGCTCTGTATTGGAGATTCAAGAAAGCTTT
TCAATTGGGAGATTCCAAAATCTCGTGTCCTCCTTGCATCTGCGATTGCCCGCCCCCATTATCCCTTTTGAAGATTGCTCCTGGTCTGGCAAATCTCTCCGTCACAGACT
GTGGGAGTAATGACCCAGATCTCAAGCATGAGATGGAAAAGCAATTTGTGGACCTTTTGACAGAGGAATTGAAGCTTCAAGAAGCAGTTTCTGGTGAACATACTCGGCAT
ATGAACATCACTTTATTTGAGGCAAAAAGGGCAGCTTCTCAGTATCAGAGGGAGGCTGAGAAATGCATTGCTGCAACAGAAACTTGTGAAGAGGCCCGAGAACGTGCCGA
GGCATTGATGATCAAGGAGAGAAAGCTAACATCATTGTGGGAGCGGCGAGCCCGCCAAATGGGTTGGGAAGGGGAATAA
Protein sequenceShow/hide protein sequence
MSRRSGACLRCCLVIFAVVSALAVCGPALYWRFKKAFQLGDSKISCPPCICDCPPPLSLLKIAPGLANLSVTDCGSNDPDLKHEMEKQFVDLLTEELKLQEAVSGEHTRH
MNITLFEAKRAASQYQREAEKCIAATETCEEARERAEALMIKERKLTSLWERRARQMGWEGE