CuGenDBv2

Gene ID	Moc03g08220
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	LOW QUALITY PROTEIN: uncharacterized protein LOC111022007
Genome location	chr3:5714077..5716439
RNA-Seq Expression	Moc03g08220
Synteny	Moc03g08220
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022154847.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111022007 [Momordica charantia]

2.1e-158

66.39

Show/hide

Query:  QRQLNVDGDDEDLGELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFV
        + QLNVD +DED GELPQEVHGDE E+EE+NDD+SQYEV++RTPVHESQQVDEEPP KEQEG  GPVDVPSEAMEESSSSSSQG                
Subjt:  QRQLNVDGDDEDLGELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFV

Query:  ATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRP
                                       A++RPRTR AVARLAAQKEA                          +E DST+QTPSRVKRVRLEVRRP
Subjt:  ATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRP

Query:  NFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVSEALVKEFYAALNPNRGDVVRVWGKVVKFSLSIINTHYGLLLMKFLVHPSDEQVEEA
         FT RDILLERGFDEAQEPVPEYVR+++VENGWE+LFAP TRVSEALVKEFY A+NPNRGD VRV G                   + LVHPSDEQVEEA
Subjt:  NFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVSEALVKEFYAALNPNRGDVVRVWGKVVKFSLSIINTHYGLLLMKFLVHPSDEQVEEA

Query:  RRLICRPHKTWTVSTTKKLSLKPLDINEQATIWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQ
        RRLICRPHKTWT+ST  KLSLKPLDINEQAT+WMY+VKN+LIPTS+DSSIKRNRAM+VYILVKG+EFNFGELIRNEI+SCSEK+ G              
Subjt:  RRLICRPHKTWTVSTTKKLSLKPLDINEQATIWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQ

Query:  AAVEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPETRGVVTREQYDELRHKYKLLLVTQRATCAIFKKI
          VEA DANVVMPKKPF SLR+VRGYSIVREEDSPIT ADPETRGVVTREQYDELRHKY+LLLVTQRATCA  KKI
Subjt:  AAVEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPETRGVVTREQYDELRHKYKLLLVTQRATCAIFKKI

XP_022156786.1 uncharacterized protein LOC111023620 [Momordica charantia]

2.8e-57

60.27

Show/hide

Query:  VHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVAR
        +HESQQ DEE  V+EQEG  G VDVP+EA+EESSSSSS+GK+P L +LNVSDPNFVA A TS+E+V LTKVVKK + KK + +I   A +RP TR  +A 
Subjt:  VHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVAR

Query:  LAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVS
        LAAQKEA                          +E DS +QTPS+ KRVR EV+R NFTAR+IL+E+GFDEAQEPVP+Y++R+L+ENGWE+LFAPT RVS
Subjt:  LAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVS

Query:  EALVKEFYAALNPNRGDVV
        E LVKEFYA +NPNRGD +
Subjt:  EALVKEFYAALNPNRGDVV

XP_022156935.1 uncharacterized protein LOC111023761 [Momordica charantia]

7.4e-34

51.98

Show/hide

Query:  QVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDLGELPQEVHGDEVE
        +VSGDSEHD EPLEHSDS TV+I+ QI PS I+         E     + E+LV+LNEARGEDPL+DDGNSG                            
Subjt:  QVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDLGELPQEVHGDEVE

Query:  EEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVA
                               Q DEEP  +EQEG  GP+DV SEAMEESSSS SQ KT  L +LNVSDPNFVATAE SDEEV+L KVVKKTQKKKKVA
Subjt:  EEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVA

Query:  KI
        +I
Subjt:  KI

XP_022158483.1 uncharacterized protein LOC111024964 [Momordica charantia]

8.4e-54

35.42

Show/hide

Query:  MEGSSSSKPHDKEKENKRMLLPPPTKPGMIPLEPPWISHEKLVFDSREQRRKYEDAIRMNPRRNLSIGGTIYEKINMESNDATVNKEGSSEKKLGGVNKV
        MEGSS SKP DKE E K+++LPPP  P                                                  E + A VN+ G SEKKL G +KV
Subjt:  MEGSSSSKPHDKEKENKRMLLPPPTKPGMIPLEPPWISHEKLVFDSREQRRKYEDAIRMNPRRNLSIGGTIYEKINMESNDATVNKEGSSEKKLGGVNKV

Query:  YLRKNQSLEEKGAVLDEEIARLQERVEIFSKNNEIRDKENERVYAKIEELNIKWQAFMENSKKVSEEIQLELNSMSIRHRMNLSQDNPISNSLELSIPLP
        YLRKNQS+ +K + LDE IAR+ E+V+I +K  EI DK+NE + AKI ELN KWQ FMENS+++SEEIQ+ELN                           
Subjt:  YLRKNQSLEEKGAVLDEEIARLQERVEIFSKNNEIRDKENERVYAKIEELNIKWQAFMENSKKVSEEIQLELNSMSIRHRMNLSQDNPISNSLELSIPLP

Query:  ISTTIAVQVEGQEQVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDL
                                                              +ERTT +I +ILV+LNEA GEDPLEDDGNS  AQ +LNVDG+DEDL
Subjt:  ISTTIAVQVEGQEQVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDL

Query:  GELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLT
        G+LPQEVHGDE EEEEENDD+SQYEVR+   VHESQ+   E P++  EG   PVDVP+EA  +SSSSSS+                    + S EEV+  
Subjt:  GELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLT

Query:  KVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEAQETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAP
                                              +E  ST+Q  S+ K                                                
Subjt:  KVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEAQETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAP

Query:  TTRVSEALVKEFYAALNPNRGDVVRVWG
          RV EALVKEFYAA++PN+GD VRV G
Subjt:  TTRVSEALVKEFYAALNPNRGDVVRVWG

XP_022158483.1 uncharacterized protein LOC111024964 [Momordica charantia]

9.4e-05

70.73

Show/hide

Query:  VEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPET
        ++A+D +VV PKK  TS+RRVRGY IVREEDS IT ADPET
Subjt:  VEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPET

XP_022158483.1 uncharacterized protein LOC111024964 [Momordica charantia]

1.8e-48

70.27

Show/hide

Query:  IWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQAAVEADDANVVMPKKPFTSLRRVRGYSIVRE
        +W Y+VKN LI TS+DSSI++ R M+VYIL+KGIEFNF ELIRNEI  C+EKMVGPL+FP  I ELCL+A VEAD  +VVM KK  TS+RRVRGY IVRE
Subjt:  IWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQAAVEADDANVVMPKKPFTSLRRVRGYSIVRE

Query:  EDSPITTADPETRGVVTREQYDE---LRHKYKLLLVTQRATCAIFKKI
        EDSPIT ADP+TRGVVTREQYDE   LRH Y LL  TQ ATC   KK+
Subjt:  EDSPITTADPETRGVVTREQYDE---LRHKYKLLLVTQRATCAIFKKI

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DMT3 LOW QUALITY PROTEIN: uncharacterized protein LOC111022007

1.0e-158

66.39

Show/hide

Query:  QRQLNVDGDDEDLGELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFV
        + QLNVD +DED GELPQEVHGDE E+EE+NDD+SQYEV++RTPVHESQQVDEEPP KEQEG  GPVDVPSEAMEESSSSSSQG                
Subjt:  QRQLNVDGDDEDLGELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFV

Query:  ATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRP
                                       A++RPRTR AVARLAAQKEA                          +E DST+QTPSRVKRVRLEVRRP
Subjt:  ATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRP

Query:  NFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVSEALVKEFYAALNPNRGDVVRVWGKVVKFSLSIINTHYGLLLMKFLVHPSDEQVEEA
         FT RDILLERGFDEAQEPVPEYVR+++VENGWE+LFAP TRVSEALVKEFY A+NPNRGD VRV G                   + LVHPSDEQVEEA
Subjt:  NFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVSEALVKEFYAALNPNRGDVVRVWGKVVKFSLSIINTHYGLLLMKFLVHPSDEQVEEA

Query:  RRLICRPHKTWTVSTTKKLSLKPLDINEQATIWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQ
        RRLICRPHKTWT+ST  KLSLKPLDINEQAT+WMY+VKN+LIPTS+DSSIKRNRAM+VYILVKG+EFNFGELIRNEI+SCSEK+ G              
Subjt:  RRLICRPHKTWTVSTTKKLSLKPLDINEQATIWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQ

Query:  AAVEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPETRGVVTREQYDELRHKYKLLLVTQRATCAIFKKI
          VEA DANVVMPKKPF SLR+VRGYSIVREEDSPIT ADPETRGVVTREQYDELRHKY+LLLVTQRATCA  KKI
Subjt:  AAVEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPETRGVVTREQYDELRHKYKLLLVTQRATCAIFKKI

A0A6J1DRR9 uncharacterized protein LOC111023761

3.6e-34

51.98

Show/hide

Query:  QVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDLGELPQEVHGDEVE
        +VSGDSEHD EPLEHSDS TV+I+ QI PS I+         E     + E+LV+LNEARGEDPL+DDGNSG                            
Subjt:  QVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDLGELPQEVHGDEVE

Query:  EEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVA
                               Q DEEP  +EQEG  GP+DV SEAMEESSSS SQ KT  L +LNVSDPNFVATAE SDEEV+L KVVKKTQKKKKVA
Subjt:  EEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVA

Query:  KI
        +I
Subjt:  KI

A0A6J1DW11 uncharacterized protein LOC111023620

1.4e-57

60.27

Show/hide

Query:  VHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVAR
        +HESQQ DEE  V+EQEG  G VDVP+EA+EESSSSSS+GK+P L +LNVSDPNFVA A TS+E+V LTKVVKK + KK + +I   A +RP TR  +A 
Subjt:  VHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVAKIASDAITRPRTRVAVAR

Query:  LAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVS
        LAAQKEA                          +E DS +QTPS+ KRVR EV+R NFTAR+IL+E+GFDEAQEPVP+Y++R+L+ENGWE+LFAPT RVS
Subjt:  LAAQKEA--------------------------QETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVS

Query:  EALVKEFYAALNPNRGDVV
        E LVKEFYA +NPNRGD +
Subjt:  EALVKEFYAALNPNRGDVV

A0A6J1DW79 uncharacterized protein LOC111024964

4.1e-54

35.42

Show/hide

Query:  MEGSSSSKPHDKEKENKRMLLPPPTKPGMIPLEPPWISHEKLVFDSREQRRKYEDAIRMNPRRNLSIGGTIYEKINMESNDATVNKEGSSEKKLGGVNKV
        MEGSS SKP DKE E K+++LPPP  P                                                  E + A VN+ G SEKKL G +KV
Subjt:  MEGSSSSKPHDKEKENKRMLLPPPTKPGMIPLEPPWISHEKLVFDSREQRRKYEDAIRMNPRRNLSIGGTIYEKINMESNDATVNKEGSSEKKLGGVNKV

Query:  YLRKNQSLEEKGAVLDEEIARLQERVEIFSKNNEIRDKENERVYAKIEELNIKWQAFMENSKKVSEEIQLELNSMSIRHRMNLSQDNPISNSLELSIPLP
        YLRKNQS+ +K + LDE IAR+ E+V+I +K  EI DK+NE + AKI ELN KWQ FMENS+++SEEIQ+ELN                           
Subjt:  YLRKNQSLEEKGAVLDEEIARLQERVEIFSKNNEIRDKENERVYAKIEELNIKWQAFMENSKKVSEEIQLELNSMSIRHRMNLSQDNPISNSLELSIPLP

Query:  ISTTIAVQVEGQEQVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDL
                                                              +ERTT +I +ILV+LNEA GEDPLEDDGNS  AQ +LNVDG+DEDL
Subjt:  ISTTIAVQVEGQEQVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDL

Query:  GELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLT
        G+LPQEVHGDE EEEEENDD+SQYEVR+   VHESQ+   E P++  EG   PVDVP+EA  +SSSSSS+                    + S EEV+  
Subjt:  GELPQEVHGDEVEEEEENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLT

Query:  KVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEAQETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAP
                                              +E  ST+Q  S+ K                                                
Subjt:  KVVKKTQKKKKVAKIASDAITRPRTRVAVARLAAQKEAQETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAP

Query:  TTRVSEALVKEFYAALNPNRGDVVRVWG
          RV EALVKEFYAA++PN+GD VRV G
Subjt:  TTRVSEALVKEFYAALNPNRGDVVRVWG

A0A6J1DW79 uncharacterized protein LOC111024964

4.6e-05

70.73

Show/hide

Query:  VEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPET
        ++A+D +VV PKK  TS+RRVRGY IVREEDS IT ADPET
Subjt:  VEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPET

A0A6J1DW79 uncharacterized protein LOC111024964

8.8e-49

70.27

Show/hide

Query:  IWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQAAVEADDANVVMPKKPFTSLRRVRGYSIVRE
        +W Y+VKN LI TS+DSSI++ R M+VYIL+KGIEFNF ELIRNEI  C+EKMVGPL+FP  I ELCL+A VEAD  +VVM KK  TS+RRVRGY IVRE
Subjt:  IWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNFGELIRNEIRSCSEKMVGPLVFPGLITELCLQAAVEADDANVVMPKKPFTSLRRVRGYSIVRE

Query:  EDSPITTADPETRGVVTREQYDE---LRHKYKLLLVTQRATCAIFKKI
        EDSPIT ADP+TRGVVTREQYDE   LRH Y LL  TQ ATC   KK+
Subjt:  EDSPITTADPETRGVVTREQYDE---LRHKYKLLLVTQRATCAIFKKI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGGTTCATCTTCCTCCAAGCCACACGACAAAGAGAAGGAGAATAAGAGAATGTTGTTGCCTCCACCAACTAAACCGGGTATGATTCCTCTTGAACCTCCT
TGGATTTCTCATGAAAAATTAGTTTTTGATTCTAGGGAACAAAGAAGAAAATATGAGGATGCTATAAGAATGAACCCTAGGAGAAATCTATCCATAGGTGGTACA
ATTTATGAAAAAATTAATATGGAATCTAATGATGCTACAGTTAATAAAGAAGGTTCTAGTGAAAAGAAATTAGGAGGAGTTAATAAAGTTTATCTTCGAAAAAAT
CAATCTCTAGAGGAAAAAGGTGCTGTTTTAGATGAAGAAATAGCTAGACTTCAAGAGAGAGTGGAGATTTTCAGTAAAAATAACGAAATTAGGGACAAAGAGAAT
GAGAGGGTTTATGCAAAAATTGAGGAACTAAACATAAAATGGCAAGCATTCATGGAAAACTCAAAGAAAGTGAGTGAGGAGATTCAACTTGAGTTAAATAGCATG
AGTATACGTCATAGGATGAATCTTTCTCAAGATAACCCCATTTCCAACTCTTTAGAACTGTCTATCCCTCTCCCTATTTCCACTACTATTGCTGTGCAGGTTGAA
GGTCAAGAACAGGTTAGTGGAGACTCAGAACACGACACGGAGCCCTTGGAGCACTCAGATTCGACCACGGTCGAAATTCAGAGCCAAATTGAGCCTAGCGCAATT
TTGGATAGACTCCACCAGCCACTCTACAAGGAAAGGACAACGCTGAGAATTGCTGAAATTTTAGTGTCATTGAATGAAGCAAGGGGAGAGGATCCATTAGAGGAT
GATGGAAACAGTGGGGCAGCACAAAGACAATTGAATGTTGATGGAGATGATGAAGATCTTGGAGAATTACCCCAAGAAGTGCATGGAGATGAGGTTGAAGAGGAA
GAAGAAAATGATGATGTCTCTCAATATGAAGTGAGACTACGAACTCCGGTGCACGAATCTCAGCAAGTTGATGAGGAGCCCCCTGTAAAAGAGCAAGAAGGAAAA
TTCGGCCCTGTGGATGTCCCTAGTGAGGCCATGGAGGAATCATCTTCCTCTTCTTCACAAGGTAAGACCCCTTATTTGTACAATTTGAATGTTTCTGACCCAAAC
TTTGTTGCTACTGCAGAGACTTCAGATGAGGAGGTGAGTTTGACCAAAGTGGTAAAGAAAACGCAAAAGAAGAAAAAAGTGGCAAAAATTGCGTCAGACGCAATT
ACTAGGCCTAGGACCCGCGTCGCTGTAGCACGTTTGGCTGCCCAAAAAGAAGCCCAGGAGACCGATTCTACCCAACAAACACCATCAAGAGTAAAAAGGGTGAGA
TTAGAGGTGCGAAGGCCCAACTTCACAGCACGTGATATCCTCCTTGAGAGGGGCTTTGATGAAGCACAAGAGCCCGTGCCAGAATATGTTAGGAGGAAGCTTGTG
GAGAATGGTTGGGAGTCGTTGTTTGCCCCAACTACACGTGTATCGGAGGCCTTGGTGAAGGAGTTTTATGCTGCCCTCAATCCCAACCGAGGGGATGTAGTGAGA
GTATGGGGTAAAGTGGTAAAATTCTCACTTTCCATTATTAATACTCACTATGGTTTGTTGTTAATGAAATTTTTAGTGCATCCATCGGACGAGCAAGTGGAGGAG
GCACGTAGACTTATTTGTAGACCACATAAGACATGGACCGTCTCAACCACGAAGAAGCTTTCCTTAAAGCCCCTTGACATCAATGAGCAAGCGACAATATGGATG
TATATGGTGAAGAACCAGTTGATACCCACTTCTCACGATTCCTCCATTAAGCGCAATAGAGCGATGGTGGTGTACATTCTCGTGAAGGGCATTGAGTTCAACTTT
GGGGAGCTCATAAGGAACGAGATTCGGAGTTGCTCTGAGAAAATGGTAGGTCCTCTTGTTTTTCCTGGACTAATAACTGAGTTATGCTTGCAGGCGGCAGTGGAA
GCTGATGATGCCAATGTTGTGATGCCCAAGAAGCCGTTCACATCCCTAAGAAGAGTTCGGGGGTATTCCATTGTTCGAGAGGAAGATTCTCCCATTACTACTGCG
GATCCCGAGACCCGAGGGGTGGTGACTAGGGAGCAGTATGATGAGCTTAGGCACAAGTATAAGCTTCTTTTAGTTACTCAACGTGCCACATGTGCTATCTTCAAG
AAGATATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MEGSSSSKPHDKEKENKRMLLPPPTKPGMIPLEPPWISHEKLVFDSREQRRKYEDAIRMNPRRNLSIGGTIYEKINMESNDATVNKEGSSEKKLGGVNKVYLRKN
QSLEEKGAVLDEEIARLQERVEIFSKNNEIRDKENERVYAKIEELNIKWQAFMENSKKVSEEIQLELNSMSIRHRMNLSQDNPISNSLELSIPLPISTTIAVQVE
GQEQVSGDSEHDTEPLEHSDSTTVEIQSQIEPSAILDRLHQPLYKERTTLRIAEILVSLNEARGEDPLEDDGNSGAAQRQLNVDGDDEDLGELPQEVHGDEVEEE
EENDDVSQYEVRLRTPVHESQQVDEEPPVKEQEGKFGPVDVPSEAMEESSSSSSQGKTPYLYNLNVSDPNFVATAETSDEEVSLTKVVKKTQKKKKVAKIASDAI
TRPRTRVAVARLAAQKEAQETDSTQQTPSRVKRVRLEVRRPNFTARDILLERGFDEAQEPVPEYVRRKLVENGWESLFAPTTRVSEALVKEFYAALNPNRGDVVR
VWGKVVKFSLSIINTHYGLLLMKFLVHPSDEQVEEARRLICRPHKTWTVSTTKKLSLKPLDINEQATIWMYMVKNQLIPTSHDSSIKRNRAMVVYILVKGIEFNF
GELIRNEIRSCSEKMVGPLVFPGLITELCLQAAVEADDANVVMPKKPFTSLRRVRGYSIVREEDSPITTADPETRGVVTREQYDELRHKYKLLLVTQRATCAIFK
KI

Moc03g08220 (gene) of Bitter gourd (OHB3-1) v2 genome