CuGenDBv2

Gene ID	Moc08g30560
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrotrans_gag domain-containing protein
Genome location	chr8:21914124..21920721
RNA-Seq Expression	Moc08g30560
Synteny	Moc08g30560
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	IPR005162 - Retrotransposon gag domain IPR036397 - Ribonuclease H superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022158314.1 uncharacterized protein LOC111024824 [Momordica charantia]

8.5e-133

66.67

Show/hide

Query:  NAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAMG--------------IMDGARTWLNALEPNS-INTWTELTEKFLAKYHT-----LTR
        N QDPP P NPPV+GD AGEGAANRAGE+PNPILL DNRDVA+               + DG     +  +P S + ++ E+   F     +     L  
Subjt:  NAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAMG--------------IMDGARTWLNALEPNS-INTWTELTEKFLAKYHT-----LTR

Query:  NADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQV
        NADLRE+IVSFRQKENEAVQE WERFKELLRRC SHGLP CVQIEQFYRGLDR SRMMLNTAAN SL E S++EI+DILNKM D NDQGEIGRSLPKKQV
Subjt:  NADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQV

Query:  SAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENCPANLASIFYVG-----------------------
        SA +FELDTVASMQAQMA +NQMLKQLTMEKETKT T A+ EPS  LQISDISCVYCGDN LYENCPAN  S+FYVG                       
Subjt:  SAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENCPANLASIFYVG-----------------------

Query:  -----LGVASSSAQVPAQQYKQNYTPPGFPTQPASQPQQYNQQRGQSTTQQSGSNASLEAM-----------MKEFMTRTDAAIRSLEMQVGQIANDQKS
              GVASSSAQ PAQQYKQNYTPP FPTQPASQPQQYNQQR Q+TTQQ GSN SLEAM            KEFMTRTD  IR LEMQVGQIAND+KS
Subjt:  -----LGVASSSAQVPAQQYKQNYTPPGFPTQPASQPQQYNQQRGQSTTQQSGSNASLEAM-----------MKEFMTRTDAAIRSLEMQVGQIANDQKS

Query:  RPQGTLPEHTENPK
        RPQGTLP +TENPK
Subjt:  RPQGTLPEHTENPK

XP_022158836.1 uncharacterized protein LOC111025302 [Momordica charantia]

1.0e-109

63.36

Show/hide

Query:  QNAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAM--------------------------------------------------------
        +NAQDPPPPQNPPVNGDMAGE AANR GEIPN ILLADNRDVAM                                                        
Subjt:  QNAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAM--------------------------------------------------------

Query:  ------------------------GIMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLP
                                 + DGARTW+NALEPNSINTW ELT+KFLAKYHTLT+NADLRE+IVSFRQKENEAVQEAWERFKELLRRC SHGLP
Subjt:  ------------------------GIMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLP

Query:  ACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLA
        +CVQIEQFYRGLDRSS+MMLNT ANGSLLE SVNEIVD+LNKM DINDQGE+GRSLPKKQVS GIFELDTVASMQAQMAAMNQMLKQLTMEKETKT T A
Subjt:  ACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLA

Query:  IPEPSPILQISDISCVYCGD---------NHLYENCPANLASIFYVGLGVASSSAQVPAQQYK
        IPE SPILQISDISCVYCG          ++ Y     +  +  +   GVASSSAQ PAQQYK
Subjt:  IPEPSPILQISDISCVYCGD---------NHLYENCPANLASIFYVGLGVASSSAQVPAQQYK

XP_022159127.1 uncharacterized protein LOC111025557 [Momordica charantia]

2.7e-86

73.19

Show/hide

Query:  IMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAAN
        + DGA TW+N LE N I TW ELT+KFLAKYHTLTRNADL+E+IVSFRQ+E+EAVQEAWERFKELL+RC SHGLP CVQI+QFYRGLD   RMM +TAAN
Subjt:  IMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAAN

Query:  GSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETK-TTTLAIPEPSPILQISDISCVYCGDNHLY
         SLLE SVNEI+DILNKMIDINDQ E+GRSLPKKQ SAGIFELDTV S+QAQ++AM+QMLKQLTM+K  K  T++ I EPS ILQISDISCVYC DNHLY
Subjt:  GSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETK-TTTLAIPEPSPILQISDISCVYCGDNHLY

Query:  ENCPANLASIFYVGLGVASSSAQVPAQQYKQNYTP
        ENC AN A IFYVG GV     Q     Y   Y P
Subjt:  ENCPANLASIFYVGLGVASSSAQVPAQQYKQNYTP

XP_022159235.1 uncharacterized protein LOC111025653 [Momordica charantia]

2.4e-66

43.01

Show/hide

Query:  ARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLL
        A  WLNA   ++I TW+++ +KFL KY   TRNAD+RE I+SFRQKENEAV  AWERFK+L+  C + G+PACVQIE F+RG D  ++MMLN AANG   
Subjt:  ARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLL

Query:  ENSVNEIVDILNKMIDINDQ--GEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENC
          S NEIV+IL+++ + N Q   E  R+  K+   AG+  LD + SMQ Q+  + QMLK +        +  A   PSP+ QI++ +C YCGD H  ENC
Subjt:  ENSVNEIVDILNKMIDINDQ--GEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENC

Query:  PANLASIFYVG--------------------------LGVASSSAQVPAQQYKQNYTPPGFPTQPA--SQPQQYNQQRGQ-STTQQSGSNASL-------
        P+N +S++YVG                           G  SS+     QQYK+ YTPPGFP  PA    P QYNQQ+      QQ+ SN  +       
Subjt:  PANLASIFYVG--------------------------LGVASSSAQVPAQQYKQNYTPPGFPTQPA--SQPQQYNQQRGQ-STTQQSGSNASL-------

Query:  --EAMMKEFMTRT-----------------DAAIRSLEMQVGQIANDQKSRPQGTLPEHTENPKR
          +A MKE MTRT                 D  +R LEMQ+GQ+ N+ ++RPQG+LP  TE P+R
Subjt:  --EAMMKEFMTRT-----------------DAAIRSLEMQVGQIANDQKSRPQGTLPEHTENPKR

XP_030494802.1 uncharacterized protein LOC115710583 [Cannabis sativa]

3.6e-67

46.56

Show/hide

Query:  IMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAAN
        + D AR WLN L P+S+  W +L EKFL KY   TRNA  R  I+SF+Q E+E   +AWERFKE+LR+C  HG+P C+Q+E FY GL+ +SRM+L+ +AN
Subjt:  IMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAAN

Query:  GSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYE
        G++L  S NE  +IL ++   N Q    R+ P  +  AG+ E+D + ++ AQMA+M  +LK + M            +P+  +Q ++ISCVYCGD H +E
Subjt:  GSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYE

Query:  NCPANLASIFYVGLGVASSSAQVPAQQYKQNYTPPGFPTQPASQPQQYNQQRGQSTTQQSGSNASLEAMMKEFMTRTDAAIRS-------LEMQVGQIAN
        NCP+N AS+ YVG   ASSS    AQ  KQ++ PPGF  QP  +PQQ +Q +G  T       +SLE++M+++M + DA I+S       LE+Q+GQ+AN
Subjt:  NCPANLASIFYVGLGVASSSAQVPAQQYKQNYTPPGFPTQPASQPQQYNQQRGQSTTQQSGSNASLEAMMKEFMTRTDAAIRS-------LEMQVGQIAN

Query:  DQKSRPQGTLPEHTENPKRD
        D K+RPQGTLP  TENP+RD
Subjt:  DQKSRPQGTLPEHTENPKRD

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DSZ5 uncharacterized protein LOC111024107

5.5e-61

46.08

Show/hide

Query:  ARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLL
        A  WLNA    +I TW+++ +KFL KY   TRNAD+RE I+SFRQKENEAV  AWE FK+L+R C + G+PACVQIE F+RG D  ++MMLN AANG   
Subjt:  ARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLL

Query:  ENSVNEIVDILNKMIDINDQ--GEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENC
          S NEIV+IL+++ + NDQ   E  R+  K+   AG+  LD + SMQ Q+  + QMLK +        +  A   PSP+ QI++ +C YCGD H  ENC
Subjt:  ENSVNEIVDILNKMIDINDQ--GEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENC

Query:  PANLASIFYVG--------------------------LGVASSSAQVPAQQYKQNYTPPGFPTQPA--SQPQQYNQQRGQ-STTQQSGSNASLEAMMKEF
        P+N +S++YVG                           G  SSS     QQYKQ YTPPGFP  PA    P QYNQQ+      QQ+ SN  +E +MKEF
Subjt:  PANLASIFYVG--------------------------LGVASSSAQVPAQQYKQNYTPPGFPTQPA--SQPQQYNQQRGQ-STTQQSGSNASLEAMMKEF

Query:  MTRTDA
        +T+ DA
Subjt:  MTRTDA

A0A6J1DY39 uncharacterized protein LOC111025653

1.1e-66

43.01

Show/hide

Query:  ARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLL
        A  WLNA   ++I TW+++ +KFL KY   TRNAD+RE I+SFRQKENEAV  AWERFK+L+  C + G+PACVQIE F+RG D  ++MMLN AANG   
Subjt:  ARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLL

Query:  ENSVNEIVDILNKMIDINDQ--GEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENC
          S NEIV+IL+++ + N Q   E  R+  K+   AG+  LD + SMQ Q+  + QMLK +        +  A   PSP+ QI++ +C YCGD H  ENC
Subjt:  ENSVNEIVDILNKMIDINDQ--GEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENC

Query:  PANLASIFYVG--------------------------LGVASSSAQVPAQQYKQNYTPPGFPTQPA--SQPQQYNQQRGQ-STTQQSGSNASL-------
        P+N +S++YVG                           G  SS+     QQYK+ YTPPGFP  PA    P QYNQQ+      QQ+ SN  +       
Subjt:  PANLASIFYVG--------------------------LGVASSSAQVPAQQYKQNYTPPGFPTQPA--SQPQQYNQQRGQ-STTQQSGSNASL-------

Query:  --EAMMKEFMTRT-----------------DAAIRSLEMQVGQIANDQKSRPQGTLPEHTENPKR
          +A MKE MTRT                 D  +R LEMQ+GQ+ N+ ++RPQG+LP  TE P+R
Subjt:  --EAMMKEFMTRT-----------------DAAIRSLEMQVGQIANDQKSRPQGTLPEHTENPKR

A0A6J1DYY9 uncharacterized protein LOC111025557

9.9e-87

73.62

Show/hide

Query:  IMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAAN
        + DGA TWLN LE N I TW ELT+KFLAKYHTLTRNADL+E+IVSFRQ+E+EAVQEAWERFKELL+RC SHGLP CVQI+QFYRGLD   RMM +TAAN
Subjt:  IMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAAN

Query:  GSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETK-TTTLAIPEPSPILQISDISCVYCGDNHLY
         SLLE SVNEI+DILNKMIDINDQ E+GRSLPKKQ SAGIFELDTV S+QAQ++AM+QMLKQLTM+K  K  T++ I EPS ILQISDISCVYC DNHLY
Subjt:  GSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETK-TTTLAIPEPSPILQISDISCVYCGDNHLY

Query:  ENCPANLASIFYVGLGVASSSAQVPAQQYKQNYTP
        ENC AN A IFYVG GV     Q     Y   Y P
Subjt:  ENCPANLASIFYVGLGVASSSAQVPAQQYKQNYTP

A0A6J1DZ19 uncharacterized protein LOC111024824

4.1e-133

66.67

Show/hide

Query:  NAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAMG--------------IMDGARTWLNALEPNS-INTWTELTEKFLAKYHT-----LTR
        N QDPP P NPPV+GD AGEGAANRAGE+PNPILL DNRDVA+               + DG     +  +P S + ++ E+   F     +     L  
Subjt:  NAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAMG--------------IMDGARTWLNALEPNS-INTWTELTEKFLAKYHT-----LTR

Query:  NADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQV
        NADLRE+IVSFRQKENEAVQE WERFKELLRRC SHGLP CVQIEQFYRGLDR SRMMLNTAAN SL E S++EI+DILNKM D NDQGEIGRSLPKKQV
Subjt:  NADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQV

Query:  SAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENCPANLASIFYVG-----------------------
        SA +FELDTVASMQAQMA +NQMLKQLTMEKETKT T A+ EPS  LQISDISCVYCGDN LYENCPAN  S+FYVG                       
Subjt:  SAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENCPANLASIFYVG-----------------------

Query:  -----LGVASSSAQVPAQQYKQNYTPPGFPTQPASQPQQYNQQRGQSTTQQSGSNASLEAM-----------MKEFMTRTDAAIRSLEMQVGQIANDQKS
              GVASSSAQ PAQQYKQNYTPP FPTQPASQPQQYNQQR Q+TTQQ GSN SLEAM            KEFMTRTD  IR LEMQVGQIAND+KS
Subjt:  -----LGVASSSAQVPAQQYKQNYTPPGFPTQPASQPQQYNQQRGQSTTQQSGSNASLEAM-----------MKEFMTRTDAAIRSLEMQVGQIANDQKS

Query:  RPQGTLPEHTENPK
        RPQGTLP +TENPK
Subjt:  RPQGTLPEHTENPK

A0A6J1E251 uncharacterized protein LOC111025302

4.9e-110

63.36

Show/hide

Query:  QNAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAM--------------------------------------------------------
        +NAQDPPPPQNPPVNGDMAGE AANR GEIPN ILLADNRDVAM                                                        
Subjt:  QNAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAM--------------------------------------------------------

Query:  ------------------------GIMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLP
                                 + DGARTW+NALEPNSINTW ELT+KFLAKYHTLT+NADLRE+IVSFRQKENEAVQEAWERFKELLRRC SHGLP
Subjt:  ------------------------GIMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFRQKENEAVQEAWERFKELLRRCSSHGLP

Query:  ACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLA
        +CVQIEQFYRGLDRSS+MMLNT ANGSLLE SVNEIVD+LNKM DINDQGE+GRSLPKKQVS GIFELDTVASMQAQMAAMNQMLKQLTMEKETKT T A
Subjt:  ACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQMAAMNQMLKQLTMEKETKTTTLA

Query:  IPEPSPILQISDISCVYCGD---------NHLYENCPANLASIFYVGLGVASSSAQVPAQQYK
        IPE SPILQISDISCVYCG          ++ Y     +  +  +   GVASSSAQ PAQQYK
Subjt:  IPEPSPILQISDISCVYCGD---------NHLYENCPANLASIFYVGLGVASSSAQVPAQQYK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCTTCGACCTGTAGAGCTAACATGAATTTTGTTATGGAGAACAAAAACGACCTGAAACGGGACAAGGAGTTGAAGCCTAAAATCATCGATTGGGGGAGACCG
ACCCGTGACGTAACGGACCGGCCCAAAGAACGACCTAGCGTCGGGGCAAAGAACGAGGAAAGCGACCAGCGGAGAACTAACCGGGCCGAGAGGGCTCGGTCCCGA
CCCCTGCTCGTGAGATCCTACCCTGAAGAGGCAGGTATCGGTTCCTTTATCATCGAGTTTGGTGTGTGCGAGAAGAAGAGCCGGAAGGTCAAAATCCACGCATCA
ACAATTGGCGTTGTCTGTGGGAATGATACAGTAAAGCGAGCTTCGTCAAAGCGAAATCCCAATCCAAGCGACATGAATCTTGATGAGAGCCATCGGTGCTTCGAA
AAGAAGAGCTTGAAAGAAGCGGCCGATCACTCGGGTGAGGCAAGACCGAGCCTTGGCCATCGACTTAATCCGACCACCCTTGATAGGGGAGAACCAGTGACGAGC
TTGAGTGAAGCGACTGACCTCTCGGGTGAGGCAAGGCCGAGCCCTGGTCATCGACTTAATTCGACCACCCTTGACAAGGGAGAACCGGCTAAGGAAGTAGAATCT
GTCCCTCTGACAGCCGAAGATCAACAGGTGAAAGATGAGTTTCAGGCTAGAGAACCGCGAATGGAGAAATACCTTTCACAGGTAAGAAACCAGCTCGAACAGTTC
TCAAAATATGAGATTCGACAAATTCCACGTGCTCAAAACGTCAACACCGATGCGTTAGCTCGACTAGCTGCAGTTTATGAAACCGACCTAGGCAGAACTGTACCG
GTCGAGATTCTACCTGAGCCAAGCATAGTAGCTCATGAAGTAATGGATATCGACGAGCAAAGGCAACAAGAAGAAAACTGGAAGAGCCATTTGATCAAATATTTG
AGAGACAAGATCCTGCCTACTGAAAAGATAGAGGCCCAAAATGCACAAGATCCTCCACCGCCACAAAATCCACCTGTGAATGGAGATATGGCAGGTGAAGGAGCA
GCAAACCGAGCAGGAGAAATTCCTAATCCGATTCTTCTAGCAGATAATCGAGATGTAGCCATGGGAATTATGGATGGTGCAAGGACTTGGCTAAACGCGTTAGAA
CCAAATTCTATCAACACATGGACAGAACTGACGGAGAAATTTTTGGCAAAGTACCATACTTTGACCAGGAACGCAGACCTTCGAGAGAACATTGTGTCTTTTAGA
CAGAAGGAGAACGAAGCAGTTCAAGAAGCTTGGGAGCGTTTTAAGGAATTACTTAGAAGGTGCTCGAGCCATGGATTGCCTGCATGTGTGCAGATTGAACAATTC
TATAGAGGATTGGATCGTTCATCACGGATGATGTTGAACACTGCAGCCAATGGCTCGTTGTTAGAGAATTCGGTAAATGAGATCGTTGATATCTTGAATAAGATG
ATAGACATTAATGACCAAGGTGAAATAGGAAGGTCATTACCAAAGAAGCAAGTATCAGCTGGAATCTTTGAGTTAGACACAGTAGCTTCAATGCAAGCCCAAATG
GCAGCTATGAACCAAATGTTAAAGCAGTTGACAATGGAGAAAGAAACCAAAACCACAACTTTGGCGATACCTGAACCCTCTCCTATTTTACAAATTTCAGATATA
TCTTGTGTATATTGTGGTGATAACCACTTGTATGAGAACTGTCCAGCTAATCTAGCGTCTATTTTCTATGTAGGTCTAGGAGTAGCTAGTAGCAGTGCACAAGTA
CCCGCTCAACAATACAAACAAAACTACACTCCTCCTGGTTTTCCAACTCAACCGGCGTCGCAGCCTCAACAATACAATCAGCAAAGAGGTCAAAGTACTACTCAG
CAAAGTGGTAGCAACGCAAGTTTGGAGGCCATGATGAAAGAGTTCATGACAAGAACTGATGCTGCGATAAGAAGCTTGGAGATGCAAGTGGGGCAGATTGCAAAT
GACCAGAAATCTAGACCCCAAGGTACATTGCCTGAACACACAGAAAACCCGAAGCGAGATCGTGACGGAGCACTGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MPSTCRANMNFVMENKNDLKRDKELKPKIIDWGRPTRDVTDRPKERPSVGAKNEESDQRRTNRAERARSRPLLVRSYPEEAGIGSFIIEFGVCEKKSRKVKIHAS
TIGVVCGNDTVKRASSKRNPNPSDMNLDESHRCFEKKSLKEAADHSGEARPSLGHRLNPTTLDRGEPVTSLSEATDLSGEARPSPGHRLNSTTLDKGEPAKEVES
VPLTAEDQQVKDEFQAREPRMEKYLSQVRNQLEQFSKYEIRQIPRAQNVNTDALARLAAVYETDLGRTVPVEILPEPSIVAHEVMDIDEQRQQEENWKSHLIKYL
RDKILPTEKIEAQNAQDPPPPQNPPVNGDMAGEGAANRAGEIPNPILLADNRDVAMGIMDGARTWLNALEPNSINTWTELTEKFLAKYHTLTRNADLRENIVSFR
QKENEAVQEAWERFKELLRRCSSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLENSVNEIVDILNKMIDINDQGEIGRSLPKKQVSAGIFELDTVASMQAQM
AAMNQMLKQLTMEKETKTTTLAIPEPSPILQISDISCVYCGDNHLYENCPANLASIFYVGLGVASSSAQVPAQQYKQNYTPPGFPTQPASQPQQYNQQRGQSTTQ
QSGSNASLEAMMKEFMTRTDAAIRSLEMQVGQIANDQKSRPQGTLPEHTENPKRDRDGAL

Moc08g30560 (gene) of Bitter gourd (OHB3-1) v2 genome