CuGenDBv2

Gene ID	Moc08g14940
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	INVOLVED IN: biological_process unknown; LOCATED IN: chloroplast; BEST Arabidopsis thaliana protein match is: my s in 277 species: Archae - 0; Bacteria - 0; Metazoa - 736; Fungi - 347; Plants - 385; Viruses - 0; Other Eukaryotes - 339 (source: NCBI BLink).
Genome location	chr8:11551318..11554623
RNA-Seq Expression	Moc08g14940
Synteny	Moc08g14940
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022144034.1 uncharacterized protein LOC111013826 [Momordica charantia]

2.4e-98

69.78

Show/hide

Query:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG
        MFEYGL+L LHPF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAELL V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV 
Subjt:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG

Query:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTG
        KWF+A GEWLA DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE FP+GRK+ TLVTD+LLLESGLLDYN  V+PIE S      + VC F  
Subjt:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTG

Query:  SVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD
         VKRK KGRA+AL+    ++P TP           GP+S    PVIEL+ SGG S EKRPR+++EA+D
Subjt:  SVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD

XP_022158122.1 uncharacterized protein LOC111024680 [Momordica charantia]

3.7e-83

81.18

Show/hide

Query:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG
        MFEYGL+L LHPF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAELL V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV 
Subjt:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG

Query:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS
        KWF+A GEWLA DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE FP+GRK+ TLVTD+LLLESGLLDYN  V+PIE+S
Subjt:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS

XP_022158650.1 uncharacterized protein LOC111025108 [Momordica charantia]

9.7e-84

81.72

Show/hide

Query:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG
        MFEYGL+L LHPF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAELL V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV 
Subjt:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG

Query:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS
        KWF+A GEWLA DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE+FP+GRK+ TLVTDKLLLESGLLDYN  V+PIE+S
Subjt:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS

XP_022159063.1 uncharacterized protein LOC111025502, partial [Momordica charantia]

9.0e-138

71.15

Show/hide

Query:  LSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEYPSRMPEHYLGPLRRRFNIPNDILLRIPEEGERADNPPEGWVTLYLKMFEYGLKLSLH
        +SS   SD    LES+LEEIEN R SDD EDSD STSGQGLEYPSR+PEHYLG LRR F IP +ILLR+PEEGERADNPPEGWVTLY KMFEYGL+L LH
Subjt:  LSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEYPSRMPEHYLGPLRRRFNIPNDILLRIPEEGERADNPPEGWVTLYLKMFEYGLKLSLH

Query:  PFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFALGEWLA
        PF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAEL  V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV KWF+A GEWLA
Subjt:  PFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFALGEWLA

Query:  NDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTGSVKRKFKGRAN
         DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE FP+GRK+ TLVTD+LLLESGLLDYN  V+PIE+S      + VCGF   VKRK KGRA+
Subjt:  NDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTGSVKRKFKGRAN

Query:  ALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD
        AL+    ++P TP           GP+S     VIEL+ SGG S EKRPR+++EA+D
Subjt:  ALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD

XP_022159252.1 uncharacterized protein LOC111025665 [Momordica charantia]

8.0e-78

82.38

Show/hide

Query:  MCARKGACGIVKGPTSIKGWVGKWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNR
        MCARKG  GIVKGPTSIKGWVGKWFFA GEWLA DESGR FFD   RFGNLVSIK IPEL QATFDTLK YK++FP+ RKI TLVTDKLLLESGLLDYN 
Subjt:  MCARKGACGIVKGPTSIKGWVGKWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNR

Query:  LVQPIEAS------SNVCGFTGSVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALDVSP
        LV+ IEAS      + VCGFTGSVKRK KGRA+ALKTVVGTEPVTPT PRT AQGNSGPSSAV TPVIELDLSGGRS EKR REESEALDVSP
Subjt:  LVQPIEAS------SNVCGFTGSVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALDVSP

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CR42 uncharacterized protein LOC111013826

1.2e-98

69.78

Show/hide

Query:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG
        MFEYGL+L LHPF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAELL V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV 
Subjt:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG

Query:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTG
        KWF+A GEWLA DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE FP+GRK+ TLVTD+LLLESGLLDYN  V+PIE S      + VC F  
Subjt:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTG

Query:  SVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD
         VKRK KGRA+AL+    ++P TP           GP+S    PVIEL+ SGG S EKRPR+++EA+D
Subjt:  SVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD

A0A6J1DWD2 uncharacterized protein LOC111024680

1.8e-83

81.18

Show/hide

Query:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG
        MFEYGL+L LHPF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAELL V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV 
Subjt:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG

Query:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS
        KWF+A GEWLA DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE FP+GRK+ TLVTD+LLLESGLLDYN  V+PIE+S
Subjt:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS

A0A6J1DWF1 uncharacterized protein LOC111025108

4.7e-84

81.72

Show/hide

Query:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG
        MFEYGL+L LHPF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAELL V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV 
Subjt:  MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVG

Query:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS
        KWF+A GEWLA DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE+FP+GRK+ TLVTDKLLLESGLLDYN  V+PIE+S
Subjt:  KWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS

A0A6J1DXS5 uncharacterized protein LOC111025502

4.3e-138

71.15

Show/hide

Query:  LSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEYPSRMPEHYLGPLRRRFNIPNDILLRIPEEGERADNPPEGWVTLYLKMFEYGLKLSLH
        +SS   SD    LES+LEEIEN R SDD EDSD STSGQGLEYPSR+PEHYLG LRR F IP +ILLR+PEEGERADNPPEGWVTLY KMFEYGL+L LH
Subjt:  LSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEYPSRMPEHYLGPLRRRFNIPNDILLRIPEEGERADNPPEGWVTLYLKMFEYGLKLSLH

Query:  PFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFALGEWLA
        PF QEFL RTG APAQVAPNGWGVIFALAILFWLRAR  +EAEL  V+QLL CFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWV KWF+A GEWLA
Subjt:  PFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFALGEWLA

Query:  NDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTGSVKRKFKGRAN
         DESGR FFD   RFGNLVSI+P+PEL QA+FDTLK+YKE FP+GRK+ TLVTD+LLLESGLLDYN  V+PIE+S      + VCGF   VKRK KGRA+
Subjt:  NDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEAS------SNVCGFTGSVKRKFKGRAN

Query:  ALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD
        AL+    ++P TP           GP+S     VIEL+ SGG S EKRPR+++EA+D
Subjt:  ALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALD

A0A6J1DZB3 uncharacterized protein LOC111025665

3.9e-78

82.38

Show/hide

Query:  MCARKGACGIVKGPTSIKGWVGKWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNR
        MCARKG  GIVKGPTSIKGWVGKWFFA GEWLA DESGR FFD   RFGNLVSIK IPEL QATFDTLK YK++FP+ RKI TLVTDKLLLESGLLDYN 
Subjt:  MCARKGACGIVKGPTSIKGWVGKWFFALGEWLANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNR

Query:  LVQPIEAS------SNVCGFTGSVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALDVSP
        LV+ IEAS      + VCGFTGSVKRK KGRA+ALKTVVGTEPVTPT PRT AQGNSGPSSAV TPVIELDLSGGRS EKR REESEALDVSP
Subjt:  LVQPIEAS------SNVCGFTGSVKRKFKGRANALKTVVGTEPVTPTAPRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALDVSP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G32010.1 myosin heavy chain-related

1.3e-06

23.53

Show/hide

Query:  HRCVSPEDPSRSLITRVRRGGQSFLLALTLLSNMVVFLSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEY------PSRMPEHYLGPLRR
        HR  S E PS  +  R     +  + + + +  +V  L   + SD  G          N    D+ E +D + SG+  +       P+      +G    
Subjt:  HRCVSPEDPSRSLITRVRRGGQSFLLALTLLSNMVVFLSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEY------PSRMPEHYLGPLRR

Query:  RFNIPNDILLRIPEEGERADNPPEGWVTLYLKMF-EYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEA
           +P  + +RIP + +R  + PEG++ L+   F E GL+  +  F   F      A +Q+       I   A L  L AR       LSV  +      
Subjt:  RFNIPNDILLRIPEEGERADNPPEGWVTLYLKMF-EYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEA

Query:  KRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFA
         ++  K G++Y+ + +G   +  GP+  + W+G +F+A
Subjt:  KRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFA

AT2G15420.1 myosin heavy chain-related

5.1e-06

30.88

Show/hide

Query:  NIPNDILLRIPEEGERADNPPEGWVTLYLKMF-EYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKR
        N P +I L  P+  +R   PPEG++ LY   F   GL   L  F  E+  R   A +Q+          LAIL      G +    +  +         R
Subjt:  NIPNDILLRIPEEGERADNPPEGWVTLYLKMF-EYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKR

Query:  IAKKPGRYYMCARKGACGIVKGPTS-IKGWVGKWFF
        + + PG YY  A K    IV G  S I GW  ++FF
Subjt:  IAKKPGRYYMCARKGACGIVKGPTS-IKGWVGKWFF

AT5G38190.1 INVOLVED IN: biological_process unknown

8.7e-06

23.11

Show/hide

Query:  HRCVSPEDPSRSLITRVRRGGQSFLLALTLLSNMVVFLSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEY------PSRMPEHYLGPLRR
        HR  S E PS  +  R     +  +   + +  +V  L   + SD  G          N    D+ E +D + SG+  +       P+      +G    
Subjt:  HRCVSPEDPSRSLITRVRRGGQSFLLALTLLSNMVVFLSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEY------PSRMPEHYLGPLRR

Query:  RFNIPNDILLRIPEEGERADNPPEGWVTLYLKMF-EYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEA
           +P  + +RIP + +R  + PEG++ L+   F E GL+  +  F   F      A +Q+       I   A L  L AR       LSV  +      
Subjt:  RFNIPNDILLRIPEEGERADNPPEGWVTLYLKMF-EYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEA

Query:  KRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFA
         ++  K G++Y+ + +G   +   P+  + W+G +F+A
Subjt:  KRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCACTCTTTCTTCTGCACCTGGCCTTAAGCGCCTCGACCTGCTCATCGAACTTGTCAGAGTTGGAGAACTCTCGGGTGTAGGACGGAGAGTCTTCCGGCTCCCGAG
AGGCTTTCTTCTTCTTATCAGTTGGATAGATGGAGCTCCCTTTTCACCGGGTGCGCCTGAGACCCTAGAGGGAGACGCAGTTCAGTTAGCACGCGTTGCCTCGGCGTACA
TTTCTTCCATCGTGCGCAACCGATGTCGCATATCATCCAACTCGCGCTGGGGAGTAGACAAAGCCTCAGGGTCTGCCTCCGGGTTGGCCCTTCGAGAGACCTTTCTGGAG
GTTCCACCTCGACCTCGATTGGCTTTTGAGGGTTTCGGGTGGGCAAGAGATCGGGATGACTTAAGATGTTCTTCCCCACAAACGGCGCCAAATGTTTATGCAGGAATTTG
CACAACGGTTCTTCACGAATCGAGCTCGAACCCGGTCTCCGGTTCCGACCTGAACACTAGAGTGGACCTGCACAAAAGGGTGATGGATCTGACAGTACACACGACCGGCG
CTTATGTGTCTTTTCTCATATCAGACATGTCGGGTTCCGAGCAGGTTGGACCCCAGTCAGGAATTTGCACAACGGTTCTCCACGAATCGAGCTCGAACCCGGTCTCCGGT
TCTGACCTGAACACTAGAGTGGACCTACACAAGAGGGTGATGGATCCGACAGCACACACGACCGGCGGTTACATGTCTTTTCTTATATCGGACCTGTCGGGTTCCGAGCA
GGTCGGACCCCAGTCAGGTCGAACTTTGGTGCCCATACTTCATCTTTTAAGGGGCAAACCCGGTCACCTCGGCGGAGCTGAGGTGGACCTAAGCAATCCTTTTTATCTAA
TTTCTTCAAACACGAATAAGGGTCCTCCACGTGTCCCGGGTTGTCGGAGCAATCAAGCGTTTCACCGTTGCGTATCCCCAGAAGATCCCAGCCGCTCGTTGATTACACGT
GTACGACGCGGAGGTCAGTCATTTCTTCTGGCTCTTACTCTTCTTTCAAACATGGTAGTTTTCTTGTCTTCCCCCTCCAGTAGCGATAGCTTGGGTTGTTTAGAGTCCGA
GCTTGAAGAAATAGAGAACTTTAGGTTCTCAGATGACATAGAGGATAGTGATACCTCCACCTCGGGCCAGGGTCTGGAGTACCCTTCTAGGATGCCCGAGCATTATCTTG
GACCCCTTCGTAGGAGGTTTAACATTCCGAATGACATCCTCCTTAGGATTCCGGAGGAAGGGGAAAGAGCTGACAATCCCCCAGAGGGATGGGTCACTCTTTATCTCAAG
ATGTTTGAGTACGGCCTCAAGCTTTCCCTTCATCCTTTCGCCCAGGAGTTCTTAAACCGAACTGGACCGGCTCCTGCTCAAGTGGCCCCCAATGGGTGGGGTGTCATTTT
TGCTTTAGCCATTCTTTTTTGGTTGCGAGCTCGAGGCGAGGATGAGGCCGAGCTGCTAAGTGTTAACCAGCTTCTTGGGTGTTTTGAGGCCAAGAGGATAGCCAAAAAAC
CTGGTCGGTACTATATGTGCGCAAGGAAGGGCGCATGTGGCATAGTCAAGGGGCCGACCTCCATCAAGGGATGGGTAGGAAAGTGGTTCTTTGCCTTGGGTGAGTGGCTG
GCAAATGACGAGTCAGGTCGTCCATTCTTTGACGGGTCTGCTAGGTTTGGGAACCTAGTATCGATCAAGCCGATTCCCGAGCTCGATCAAGCCACTTTCGACACCCTCAA
GTTCTACAAGGAGAACTTCCCCAAGGGCAGGAAGATCGAAACCTTGGTCACCGACAAGCTTCTCTTGGAGTCGGGGCTTCTTGACTACAACCGTCTAGTTCAGCCAATCG
AAGCTTCAAGCAATGTGTGCGGATTTACTGGGAGTGTGAAGCGCAAGTTCAAGGGCCGTGCTAACGCCCTGAAGACTGTGGTGGGGACTGAACCGGTGACGCCTACGGCG
CCACGGACTGAGGCTCAGGGTAACTCTGGGCCTTCTTCTGCAGTCTCCACCCCTGTGATCGAACTAGACTTGTCTGGGGGTCGATCTGAAGAGAAGCGTCCGAGGGAAGA
GTCCGAGGCGCTTGACGTATCTCCCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSTLSSAPGLKRLDLLIELVRVGELSGVGRRVFRLPRGFLLLISWIDGAPFSPGAPETLEGDAVQLARVASAYISSIVRNRCRISSNSRWGVDKASGSASGLALRETFLE
VPPRPRLAFEGFGWARDRDDLRCSSPQTAPNVYAGICTTVLHESSSNPVSGSDLNTRVDLHKRVMDLTVHTTGAYVSFLISDMSGSEQVGPQSGICTTVLHESSSNPVSG
SDLNTRVDLHKRVMDPTAHTTGGYMSFLISDLSGSEQVGPQSGRTLVPILHLLRGKPGHLGGAEVDLSNPFYLISSNTNKGPPRVPGCRSNQAFHRCVSPEDPSRSLITR
VRRGGQSFLLALTLLSNMVVFLSSPSSSDSLGCLESELEEIENFRFSDDIEDSDTSTSGQGLEYPSRMPEHYLGPLRRRFNIPNDILLRIPEEGERADNPPEGWVTLYLK
MFEYGLKLSLHPFAQEFLNRTGPAPAQVAPNGWGVIFALAILFWLRARGEDEAELLSVNQLLGCFEAKRIAKKPGRYYMCARKGACGIVKGPTSIKGWVGKWFFALGEWL
ANDESGRPFFDGSARFGNLVSIKPIPELDQATFDTLKFYKENFPKGRKIETLVTDKLLLESGLLDYNRLVQPIEASSNVCGFTGSVKRKFKGRANALKTVVGTEPVTPTA
PRTEAQGNSGPSSAVSTPVIELDLSGGRSEEKRPREESEALDVSP

Moc08g14940 (gene) of Bitter gourd (OHB3-1) v2 genome