CuGenDBv2

Gene ID	Moc05g26200
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Flagellar attachment zone protein 1
Genome location	chr5:18669621..18674777
RNA-Seq Expression	Moc05g26200
Synteny	Moc05g26200
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

TXG53679.1 hypothetical protein EZV62_018935 [Acer yangbiense]

4.5e-09

24.76

Show/hide

Query:  TSRVLLEGSPVKSRKPRG-NKRVESPENSGDCS-DFSYSNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-----------
        TS V LE +   S    G +    S E   D S D   S   +  L  L  +Y IP +I LR+P        P  G V+ +   FE+G+           
Subjt:  TSRVLLEGSPVKSRKPRG-NKRVESPENSGDCS-DFSYSNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-----------

Query:  ---------------------------------------LAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNW
                                                 ++ LK   K+ G Y LS +PG   +V            ++ P+S KNWK +WF+ SG+W
Subjt:  ---------------------------------------LAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNW

Query:  LMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSRRWEILLGVGTSGFATE
            +E      IP  F    +    PELT E ++ +     + + DR    LL+ KNL+        S   M+ R    K      I +GV   G   +
Subjt:  LMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSRRWEILLGVGTSGFATE

Query:  EEVATSS
         +V  SS
Subjt:  EEVATSS

XP_022144034.1 uncharacterized protein LOC111013826 [Momordica charantia]

1.0e-08

36.36

Show/hide

Query:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVL
        +LA    K+ +K PG++Y+    G   +V G             PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L
Subjt:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVL

XP_022158122.1 uncharacterized protein LOC111024680 [Momordica charantia]

1.6e-09

31.51

Show/hide

Query:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA
        +LA    K+ +K PG++Y+    G   +V G             PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L 
Subjt:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA

Query:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR
                 R    L++++ L   GL+      + NP     +SSR
Subjt:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR

XP_022158650.1 uncharacterized protein LOC111025108 [Momordica charantia]

1.2e-09

32.19

Show/hide

Query:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA
        +LA    K+ +K PG++Y+    G   +V G             PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L 
Subjt:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA

Query:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR
                 R    L+++K L   GL+      + NP     +SSR
Subjt:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR

XP_022159063.1 uncharacterized protein LOC111025502, partial [Momordica charantia]

1.9e-15

31.51

Show/hide

Query:  SNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-LAIHT-----LKKSSKAPGQ----------------------------
        S  PE  L  LR  ++IP +I LR+P   E  D P  G V+ Y +MFEYG+ L +H      L ++  AP Q                            
Subjt:  SNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-LAIHT-----LKKSSKAPGQ----------------------------

Query:  ----YYLSCFPG--IAKLVNGHVM--EKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAW
              L+CF    IAK      M   K    IV  PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L         
Subjt:  ----YYLSCFPG--IAKLVNGHVM--EKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAW

Query:  DRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR
         R    L++++ L   GL+      + NP     +SSR
Subjt:  DRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR

TrEMBL top hits

e value

%identity

Alignment

A0A5C7HA73 Plus3 domain-containing protein

2.2e-09

24.76

Show/hide

Query:  TSRVLLEGSPVKSRKPRG-NKRVESPENSGDCS-DFSYSNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-----------
        TS V LE +   S    G +    S E   D S D   S   +  L  L  +Y IP +I LR+P        P  G V+ +   FE+G+           
Subjt:  TSRVLLEGSPVKSRKPRG-NKRVESPENSGDCS-DFSYSNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-----------

Query:  ---------------------------------------LAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNW
                                                 ++ LK   K+ G Y LS +PG   +V            ++ P+S KNWK +WF+ SG+W
Subjt:  ---------------------------------------LAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNW

Query:  LMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSRRWEILLGVGTSGFATE
            +E      IP  F    +    PELT E ++ +     + + DR    LL+ KNL+        S   M+ R    K      I +GV   G   +
Subjt:  LMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSRRWEILLGVGTSGFATE

Query:  EEVATSS
         +V  SS
Subjt:  EEVATSS

A0A6J1CR42 uncharacterized protein LOC111013826

4.9e-09

36.36

Show/hide

Query:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVL
        +LA    K+ +K PG++Y+    G   +V G             PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L
Subjt:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVL

A0A6J1DWD2 uncharacterized protein LOC111024680

7.6e-10

31.51

Show/hide

Query:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA
        +LA    K+ +K PG++Y+    G   +V G             PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L 
Subjt:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA

Query:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR
                 R    L++++ L   GL+      + NP     +SSR
Subjt:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR

A0A6J1DWF1 uncharacterized protein LOC111025108

5.8e-10

32.19

Show/hide

Query:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA
        +LA    K+ +K PG++Y+    G   +V G             PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L 
Subjt:  MLAIHTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLA

Query:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR
                 R    L+++K L   GL+      + NP     +SSR
Subjt:  GCATLSAWDRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR

A0A6J1DXS5 uncharacterized protein LOC111025502

9.2e-16

31.51

Show/hide

Query:  SNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-LAIHT-----LKKSSKAPGQ----------------------------
        S  PE  L  LR  ++IP +I LR+P   E  D P  G V+ Y +MFEYG+ L +H      L ++  AP Q                            
Subjt:  SNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGM-LAIHT-----LKKSSKAPGQ----------------------------

Query:  ----YYLSCFPG--IAKLVNGHVM--EKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAW
              L+CF    IAK      M   K    IV  PTSIK W  +WFY SG WL     G  + ++P  F  LV I P+PELT+ S   L         
Subjt:  ----YYLSCFPG--IAKLVNGHVM--EKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAW

Query:  DRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR
         R    L++++ L   GL+      + NP     +SSR
Subjt:  DRYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSR

SwissProt top hits

e value

%identity

Alignment

C9ZN16 Flagellar attachment zone protein 1

1.6e-04

27.01

Show/hide

Query:  SAQLANYNILMKELRKEQKFLAKEKEEFKTLKCETLNVVAASEKCILENNKFKVDKIKLEEEVSRLQVENSELKAEADQVGPLVAQLREELAELKTSTGN
        S QL N   + +EL +E++  +    + + L  E     A +E+ +LENNK + D   L  +V RL +E  ELKA  ++      +L EEL ELK +   
Subjt:  SAQLANYNILMKELRKEQKFLAKEKEEFKTLKCETLNVVAASEKCILENNKFKVDKIKLEEEVSRLQVENSELKAEADQVGPLVAQLREELAELKTSTGN

Query:  VLRAEVEKRKTIETELTRTLDAKVVRRESIEAELVNTKLKLSQTESHLATIESKFREFEKVVEDSVSKLADTESRLANTEAKISNFDLLYEIMSNFPEFR
         L  E+E +     +L   LD K    E +  EL   +LK+++ E     +E K  E EK+ E+   K A+ E      E K +  + L E +    E +
Subjt:  VLRAEVEKRKTIETELTRTLDAKVVRRESIEAELVNTKLKLSQTESHLATIESKFREFEKVVEDSVSKLADTESRLANTEAKISNFDLLYEIMSNFPEFR

Query:  QLEKDLEYFDLEYAVDWLKRFAKEVDLINSSDGPLISCIEISSDHSGDFSSSSSYSSSVPTSPVAPNPSLALKQEKESWEKEKLVLEEESRAMERRITFL
          E +    +LE      ++ A+ +DL  + +  L   +++ +  +   +             VA N  LA + E ++ E EKL  E E +A E      
Subjt:  QLEKDLEYFDLEYAVDWLKRFAKEVDLINSSDGPLISCIEISSDHSGDFSSSSSYSSSVPTSPVAPNPSLALKQEKESWEKEKLVLEEESRAMERRITFL

Query:  ERQLSMERKHK
        E +L      K
Subjt:  ERQLSMERKHK

Q585H6 Flagellar attachment zone protein 1

9.2e-05

25.28

Show/hide

Query:  EMELSHRDTAG--HKNEIKLTEATRRA----------NVCSAQLANYNILMKELRKEQKFLAKEKEEFKTLKCETLNVVAASEKCILENNKFKV-DKIKL
        E+E   RD +G   +NE    E  R+           N   + + N N+ ++ L +E +  A E E+      E L + AA  + + E  + KV +  KL
Subjt:  EMELSHRDTAG--HKNEIKLTEATRRA----------NVCSAQLANYNILMKELRKEQKFLAKEKEEFKTLKCETLNVVAASEKCILENNKFKV-DKIKL

Query:  EEEVSRLQVENSELKAEADQVGPLVAQLREELAELKTSTGNVLRAEVEKRKTIETELTRTLDAKVVRRESIEAELVNTKLKLSQTESHLATIESKFREFE
         EE+     EN +L  E +       +L EEL ELK +    L  E+E +     +L   L+ K    E +  EL   +LK ++ E     +E K  E E
Subjt:  EEEVSRLQVENSELKAEADQVGPLVAQLREELAELKTSTGNVLRAEVEKRKTIETELTRTLDAKVVRRESIEAELVNTKLKLSQTESHLATIESKFREFE

Query:  KVVEDSVSKLADTESRLANTEAKISNFDLLYEIMSNFPEFRQLEKDLEYFDLEYAVDWLKRFAKEVDLINSSDGPLISCIEISSDHSGDFSSSSSYSSSV
        K+ E+   K A+ E      E K++  + L E +    E +  E +    +LE  V   ++ A+E++L  + +  L   +E+ +  +   +      +  
Subjt:  KVVEDSVSKLADTESRLANTEAKISNFDLLYEIMSNFPEFRQLEKDLEYFDLEYAVDWLKRFAKEVDLINSSDGPLISCIEISSDHSGDFSSSSSYSSSV

Query:  PTSPVAPNPSLALKQEKESWEKEKLVLEEESRAMERRITFLERQLSMERKHK
             A N  LA + E ++ E EKL  E E +  E      E +L      K
Subjt:  PTSPVAPNPSLALKQEKESWEKEKLVLEEESRAMERRITFLERQLSMERKHK

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACTAGGACTAAATCATTCGATCCTAGCTCCCATAGGGTCTCAACTTCTCGAGTCCTTTTAGAGGGTTCTCCAGTCAAAAGCAGAAAACCTCGCGGGAATAAA
CGTGTTGAATCGCCGGAGAATAGCGGCGATTGCTCTGACTTTTCATATTCCAACTGTCCCGAAGAACTATTGAGGATTCTTAGGTATAATTACTCGATCCCGACC
GATATTGAGTTGAGAATCCCTGCGACGAGCGAAACAATCGACAAACCTTCTCTAGGGTGTGTCAGCTTCTACCCCCAAATGTTTGAGTACGGAATGTTAGCCATC
CATACCCTCAAAAAGTCGTCAAAAGCCCCAGGTCAGTACTATCTGAGTTGCTTTCCCGGTATTGCAAAACTAGTCAATGGGCATGTGATGGAAAAAGTTTTTTTC
TCAATAGTGAACGACCCAACTTCCATAAAGAACTGGAAACCAAGATGGTTTTATGTCTCAGGAAACTGGTTGATGACCACTAGCGAAGGGGCCCCTTATTGTGAG
ATCCCTATGGAATTCGATAGATTGGTTTTGATCGACCCCCTACCAGAATTGACAAAAGAGTCTCGGTCGGTTCTGGCTGGCTGTGCAACCCTTTCTGCTTGGGAT
CGCTATAGCCCCAATCTTCTGTCCAACAAGAACTTGAGGAACTGTGGACTCGTAGCCGAACTTTCTGAGGAGGAAATGAATCCTCGTTCAACGAAGTTTAAAAGT
AGCCGCCGCTGGGAGATCCTGCTGGGAGTTGGTACCTCAGGTTTTGCAACAGAAGAAGAAGTGGCTACGAGCTCTCCCTCCAAGAGGGTACAACAAATAAGAGGC
CGTGTAACACAGGTGCAATTTGTGCCTGAAGATAGGTCTGAGGAACAGTTCAAGCATCCCCAACCTCCTACGACCAAGTCACAGACTCTGAGAGATGTGTCTGGA
AAGCAACAAAGAAACACTAAAATTGATCAAGAGAAGGAAGCAAGACTTGATGATTTTGGTAGAGAAGCTGCTGGAATTTATAGCTGTGCAGAATTGTGGAACACT
TCTTCTACACGTATGCATCGGTTGGAACCACCAAAACGCATTGGAAGACGCGTTTCATTAAGGGCAAAGTTGGAAGAAAACCACGTTTTCTGCAGCAGCCCAGGC
GCCTGGCGCCTCCTGAGCGACACTGAGGGCTCGCCTTTGAGAAGAAAAAGGCTTCGACGTGATGAAGAATTAGCCGACCTGGTCAGCACACAGATAACTGATCCT
CAGACAGAGGCTCCGCCCTCTGTTCTTCCTGAGGTCAGTATCCCTTCGTCCGGAGGTCGAAAAGAGACCGCCTCTGCACTTGAAGCCCTTGGAACTGGACCTGGG
ATATCCCTCCAGGAGCTCGACGAGGCTCAATCGCGCTCCCCTTTAACTGGCAATGCGGGTTTCACCACTGGGCCTTCCGATGCTAGGGAAGGCTTTTTTGAGGTT
TCTGGAACTCCACTCGTCTCTGCGGATTTGGTGCCCCATTTCTTGACTTATCTATGTGCGGGTGAGACTTTATCTCTCACAGACAGGCTTTACCCTGTTTTTTCG
GATGAATCGGAGAAGCATATCCGAAGTATCAACCCTTCATCATCCCATGAACTCTTCCACGAGACCACTACGTGCATTGCAAGGGCCTTAGCTCTTTCTTGTAGC
GGAGTGGCTTCCATCGAAATGGAACTCTCTCACCGTGACACGGCCGGTCATAAAAATGAAATCAAGCTCACAGAGGCCACCAGAAGAGCCAATGTCTGTTCGGCT
CAGCTCGCCAATTACAATATTTTGATGAAGGAGCTTCGTAAAGAACAAAAGTTTTTGGCCAAAGAGAAGGAAGAGTTTAAAACCTTGAAGTGTGAGACTCTCAAT
GTTGTTGCTGCCTCTGAAAAATGCATCCTTGAAAACAATAAGTTTAAAGTTGATAAGATCAAATTGGAAGAAGAAGTGTCTCGTCTACAAGTCGAAAATTCCGAG
CTGAAGGCCGAGGCTGATCAAGTCGGACCTCTTGTCGCTCAACTGCGGGAGGAACTCGCTGAGCTAAAGACCTCTACAGGAAACGTTCTGAGAGCAGAGGTCGAG
AAAAGGAAAACAATCGAGACCGAGCTCACCCGAACCTTGGATGCGAAGGTTGTCAGGAGAGAATCGATTGAAGCAGAATTGGTGAATACCAAATTGAAACTCAGC
CAAACTGAGTCGCATCTAGCCACAATTGAGTCTAAATTTCGTGAATTTGAAAAAGTGGTTGAAGATTCTGTGTCAAAGCTTGCGGACACAGAATCCAGACTTGCG
AACACTGAGGCGAAAATCAGCAATTTTGACCTTCTATACGAAATAATGTCTAACTTCCCTGAATTCAGGCAACTCGAGAAAGATCTGGAGTACTTCGATCTCGAA
TATGCGGTCGACTGGTTAAAAAGATTTGCTAAAGAAGTCGACCTGATCAACTCAAGTGACGGTCCTCTCATATCTTGTATAGAGATTTCCTCCGATCATTCTGGA
GATTTTTCATCTTCTTCCTCCTATTCGTCTTCTGTTCCGACCTCTCCAGTTGCCCCCAATCCTTCACTGGCCCTGAAGCAGGAGAAGGAGAGTTGGGAGAAAGAA
AAGCTGGTCCTCGAGGAGGAGAGTCGTGCCATGGAACGCCGTATTACCTTCTTGGAGCGGCAGCTGTCCATGGAGAGGAAGCACAAACGGAGCTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTRTKSFDPSSHRVSTSRVLLEGSPVKSRKPRGNKRVESPENSGDCSDFSYSNCPEELLRILRYNYSIPTDIELRIPATSETIDKPSLGCVSFYPQMFEYGMLAI
HTLKKSSKAPGQYYLSCFPGIAKLVNGHVMEKVFFSIVNDPTSIKNWKPRWFYVSGNWLMTTSEGAPYCEIPMEFDRLVLIDPLPELTKESRSVLAGCATLSAWD
RYSPNLLSNKNLRNCGLVAELSEEEMNPRSTKFKSSRRWEILLGVGTSGFATEEEVATSSPSKRVQQIRGRVTQVQFVPEDRSEEQFKHPQPPTTKSQTLRDVSG
KQQRNTKIDQEKEARLDDFGREAAGIYSCAELWNTSSTRMHRLEPPKRIGRRVSLRAKLEENHVFCSSPGAWRLLSDTEGSPLRRKRLRRDEELADLVSTQITDP
QTEAPPSVLPEVSIPSSGGRKETASALEALGTGPGISLQELDEAQSRSPLTGNAGFTTGPSDAREGFFEVSGTPLVSADLVPHFLTYLCAGETLSLTDRLYPVFS
DESEKHIRSINPSSSHELFHETTTCIARALALSCSGVASIEMELSHRDTAGHKNEIKLTEATRRANVCSAQLANYNILMKELRKEQKFLAKEKEEFKTLKCETLN
VVAASEKCILENNKFKVDKIKLEEEVSRLQVENSELKAEADQVGPLVAQLREELAELKTSTGNVLRAEVEKRKTIETELTRTLDAKVVRRESIEAELVNTKLKLS
QTESHLATIESKFREFEKVVEDSVSKLADTESRLANTEAKISNFDLLYEIMSNFPEFRQLEKDLEYFDLEYAVDWLKRFAKEVDLINSSDGPLISCIEISSDHSG
DFSSSSSYSSSVPTSPVAPNPSLALKQEKESWEKEKLVLEEESRAMERRITFLERQLSMERKHKRS

Moc05g26200 (gene) of Bitter gourd (OHB3-1) v2 genome