CuGenDBv2

Gene ID	Moc07g13580
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Gag/pol protein
Genome location	chr7:10206202..10209026
RNA-Seq Expression	Moc07g13580
Synteny	Moc07g13580
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008234 - cysteine-type peptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022151295.1 uncharacterized protein LOC111019259 [Momordica charantia]

3.0e-55

78.15

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MS SIIALLA +KLN ENYKQ KSNLN ILVI+DLRFVLQE+ P APA +ATVAV   YD+WIKANDKA+VYIL SIS+VLAKKHE+ VTAKEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQ SSQA+HE LKFVYNS M EG SVRE++LNLM+HFN+AE+N AIIDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

XP_022152352.1 uncharacterized protein LOC111020095 [Momordica charantia]

1.7e-71

92.72

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MSTSIIALLAAQ+LNGENYKQWKSNLNTILVIDDL+FVLQEDCPQA APNATVAVR AYD+WIKANDKAKVYILASISDVLAKKHEDT+TAKEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQPSSQARHEALKF+YNSRM EGSSVRE++LNLMVHFNVAESNGA+IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

XP_022157844.1 uncharacterized protein LOC111024457 [Momordica charantia]

3.3e-54

70.2

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        M++SI+ LLA++KLNG NY  WK+NLNTILV+DDLRFVL E+CPQ PA NA   VR A+D+W+KANDKA+VYILAS++DVLAKKHE  +TAKEIMDSL++
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFG+PSS  RHEALK+VYN  M EG+SVRE++L++MVHFN AE NGA IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

XP_022158062.1 uncharacterized protein LOC111024637 [Momordica charantia]

1.0e-63

84.77

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MSTSII LL AQKLN ENYKQWKSN+NTIL+IDDLRFVLQEDCPQAPAPNATVAVRN YD+WIKANDKAKV ILASISDVLAKKHE++V  KEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQPSSQARHEAL  +YNSRM + SSVRE++LNLMVHFNVAESN  +IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

XP_022158197.1 uncharacterized protein LOC111024734 [Momordica charantia]

5.6e-70

91.39

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MS SIIALLAAQKLNGENY+QWKSNLNTILVIDDLRFVLQEDCPQAP  NATVAVRNAYD+WIK+NDKAKVYILASISDVLAKKHEDTVT KEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQPS QARHEALKFVYNSRM EGSSVRE++LNLMVHFNVAESNG +IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DAT1 uncharacterized protein LOC111019259

1.4e-55

78.15

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MS SIIALLA +KLN ENYKQ KSNLN ILVI+DLRFVLQE+ P APA +ATVAV   YD+WIKANDKA+VYIL SIS+VLAKKHE+ VTAKEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQ SSQA+HE LKFVYNS M EG SVRE++LNLM+HFN+AE+N AIIDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

A0A6J1DFZ2 uncharacterized protein LOC111020095

8.5e-72

92.72

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MSTSIIALLAAQ+LNGENYKQWKSNLNTILVIDDL+FVLQEDCPQA APNATVAVR AYD+WIKANDKAKVYILASISDVLAKKHEDT+TAKEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQPSSQARHEALKF+YNSRM EGSSVRE++LNLMVHFNVAESNGA+IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

A0A6J1DW68 uncharacterized protein LOC111024637

5.0e-64

84.77

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MSTSII LL AQKLN ENYKQWKSN+NTIL+IDDLRFVLQEDCPQAPAPNATVAVRN YD+WIKANDKAKV ILASISDVLAKKHE++V  KEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQPSSQARHEAL  +YNSRM + SSVRE++LNLMVHFNVAESN  +IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

A0A6J1DWL0 uncharacterized protein LOC111024734

2.7e-70

91.39

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        MS SIIALLAAQKLNGENY+QWKSNLNTILVIDDLRFVLQEDCPQAP  NATVAVRNAYD+WIK+NDKAKVYILASISDVLAKKHEDTVT KEIMDSLQS
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFGQPS QARHEALKFVYNSRM EGSSVRE++LNLMVHFNVAESNG +IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

A0A6J1DXQ5 uncharacterized protein LOC111024457

1.6e-54

70.2

Show/hide

Query:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS
        M++SI+ LLA++KLNG NY  WK+NLNTILV+DDLRFVL E+CPQ PA NA   VR A+D+W+KANDKA+VYILAS++DVLAKKHE  +TAKEIMDSL++
Subjt:  MSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQS

Query:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE
        MFG+PSS  RHEALK+VYN  M EG+SVRE++L++MVHFN AE NGA IDE
Subjt:  MFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCGTCACTCGTTTTCTGCAGAAGTTCTACAATGGTTACAGAACAAGATGAGAACAGAACTCCAATTCTTCTCTCTCAATTTGATCTCTCAAACTCTCCCTCAC
ATTCCAGAGAATTGCTCCCACAAGCACGATCTCGAGACCCAAGAGGATAGCAAGGAAGATCGTTTGGTGGTGTTCGTTGAGAAATCATTGAAGAAACGTTCTTCA
AAGAAAACAGCGAAGAAGACGAAGCAGACTGCGCAGACGGCGCTATGGCGCTACGCAGCAGTGCCATGGCGCCGTGCCTGTGCGCCGCGGCGCTGCTGCTGCGGC
ATTTTGCTGCAGCAGCGCGGTGGCACTGCCTTTAGGCGCCGAGGCACTGTCCCGGGTGTTTTTCGGCGCGTTTCCGTGGCTCTGGTTGTTTTTACTTTCAACATG
TCTACTTCCATTATTGCACTCCTAGCCGCTCAAAAACTTAACGGCGAGAATTACAAACAATGGAAATCGAATCTAAATACTATTCTCGTGATAGATGATCTTAGG
TTCGTCTTGCAAGAGGATTGTCCTCAAGCTCCTGCGCCTAACGCCACTGTGGCGGTGCGCAACGCCTATGATAAGTGGATCAAGGCCAATGACAAGGCCAAGGTC
TACATCTTGGCGAGCATATCTGATGTGCTTGCCAAGAAGCATGAGGACACGGTCACCGCTAAGGAGATCATGGACTCGCTGCAGAGCATGTTTGGACAACCGTCC
TCACAGGCTCGACATGAAGCCCTTAAGTTCGTTTATAACTCCCGCATGAATGAGGGTTCCTCAGTGCGAGAAAACATTCTCAACCTGATGGTCCACTTCAATGTG
GCTGAGTCGAACGGGGCCATCATAGACGAGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MRHSFSAEVLQWLQNKMRTELQFFSLNLISQTLPHIPENCSHKHDLETQEDSKEDRLVVFVEKSLKKRSSKKTAKKTKQTAQTALWRYAAVPWRRACAPRRCCCG
ILLQQRGGTAFRRRGTVPGVFRRVSVALVVFTFNMSTSIIALLAAQKLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPAPNATVAVRNAYDKWIKANDKAKV
YILASISDVLAKKHEDTVTAKEIMDSLQSMFGQPSSQARHEALKFVYNSRMNEGSSVRENILNLMVHFNVAESNGAIIDE

Moc07g13580 (gene) of Bitter gourd (OHB3-1) v2 genome