CuGenDBv2

Gene ID	Moc01g01990
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Gag/pol protein
Genome location	chr1:1336678..1341620
RNA-Seq Expression	Moc01g01990
Synteny	Moc01g01990
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008234 - cysteine-type peptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022151295.1 uncharacterized protein LOC111019259 [Momordica charantia]

1.0e-39

79.28

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQE+ P APA +ATVAV   YDRWIKANDKA+VYIL SIS+VLAKKHE+ VTAKEIMDSLQSMFGQSSSQA+HE LKF+YNS MKEG SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWN
        LM+HFN+AE N
Subjt:  LMVHFNVAEWN

XP_022152352.1 uncharacterized protein LOC111020095 [Momordica charantia]

2.5e-49

93.75

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        +KFVLQEDCPQA APNATVAVR AYDRWIKANDKAKVYILASISDVLAKKHEDT+TAKEIMDSLQSMFGQ SSQARHEALKFIYNSRMKEG SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWNG
        LMVHFNVAE NG
Subjt:  LMVHFNVAEWNG

XP_022154837.1 uncharacterized protein LOC111022000 [Momordica charantia]

4.2e-49

91.89

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQEDCPQAPAPNAT+AVRNAYDRWIKANDKAKVYIL+SISDVLAKKHEDTVTAKEIMDSLQSMFGQ SSQARHEALKF+YNSRMK+G SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWN
        LMVHFNVAE N
Subjt:  LMVHFNVAEWN

XP_022158062.1 uncharacterized protein LOC111024637 [Momordica charantia]

1.2e-43

86.49

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQEDCPQAPAPNATVAVRN YDRWIKANDKAKV ILASISDVLAKKHE++V  KEIMDSLQSMFGQ SSQARHEAL  IYNSRMK+  SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWN
        LMVHFNVAE N
Subjt:  LMVHFNVAEWN

XP_022158197.1 uncharacterized protein LOC111024734 [Momordica charantia]

4.6e-48

90.18

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQEDCPQAP  NATVAVRNAYDRWIK+NDKAKVYILASISDVLAKKHEDTVT KEIMDSLQSMFGQ S QARHEALKF+YNSRMKEG SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWNG
        LMVHFNVAE NG
Subjt:  LMVHFNVAEWNG

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DAT1 uncharacterized protein LOC111019259

5.0e-40

79.28

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQE+ P APA +ATVAV   YDRWIKANDKA+VYIL SIS+VLAKKHE+ VTAKEIMDSLQSMFGQSSSQA+HE LKF+YNS MKEG SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWN
        LM+HFN+AE N
Subjt:  LMVHFNVAEWN

A0A6J1DFZ2 uncharacterized protein LOC111020095

1.2e-49

93.75

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        +KFVLQEDCPQA APNATVAVR AYDRWIKANDKAKVYILASISDVLAKKHEDT+TAKEIMDSLQSMFGQ SSQARHEALKFIYNSRMKEG SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWNG
        LMVHFNVAE NG
Subjt:  LMVHFNVAEWNG

A0A6J1DMS3 uncharacterized protein LOC111022000

2.0e-49

91.89

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQEDCPQAPAPNAT+AVRNAYDRWIKANDKAKVYIL+SISDVLAKKHEDTVTAKEIMDSLQSMFGQ SSQARHEALKF+YNSRMK+G SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWN
        LMVHFNVAE N
Subjt:  LMVHFNVAEWN

A0A6J1DW68 uncharacterized protein LOC111024637

5.7e-44

86.49

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQEDCPQAPAPNATVAVRN YDRWIKANDKAKV ILASISDVLAKKHE++V  KEIMDSLQSMFGQ SSQARHEAL  IYNSRMK+  SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWN
        LMVHFNVAE N
Subjt:  LMVHFNVAEWN

A0A6J1DWL0 uncharacterized protein LOC111024734

2.2e-48

90.18

Show/hide

Query:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN
        ++FVLQEDCPQAP  NATVAVRNAYDRWIK+NDKAKVYILASISDVLAKKHEDTVT KEIMDSLQSMFGQ S QARHEALKF+YNSRMKEG SVREHVLN
Subjt:  VKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLN

Query:  LMVHFNVAEWNG
        LMVHFNVAE NG
Subjt:  LMVHFNVAEWNG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGTCGGCTGCTCCGCATCGCGATGACGTTGTGACAGAACTCAGAACCAAACTCGGTGTGGTTTCCTTCCCCACTCGTTTGAGAGGGAATGTCAAGATAGCT
ATGTGCTACCACAAGCACGATCCCGAGACCCAAGAGGATAGCGAGGAAGATCCGGTGGTGGTGTTCGAGGGGAACTCACTGAAGAAACGTTCTTCAAAGTCGTTC
GTGGCGTCGGATTGGGCAAAAAGTTGCAGAAAACGGCAAAGAAGACGAAGCAGACTGCACAGACAGCACACAGCGCCACGGCGCTGCACTGTCGCGTCGCGGCGC
TGTGTAGCACCATGGCGCCATGCTAGGGCGCCGCGGCGCTGCTGCTGCAGCATTTTGCTGCCATTAGGCGCCGAGGCGCTGTCCCGAGTGTCTTTCGACCCGGTT
CCGAAGCTCCGGTTCGCGGTTCGAGGGCGGATGCAGTCGGATTATTGGGGTGGACCTCTGAGGTCCGAAAATGTTGGGTCACACTTACGAGGAGTTGTTAAGTTC
GTCTTGCAAGAGGATTGTCCTCAAGCTCCTGCGCCTAACGCCACTGTGGCGGTGCGCAACGCCTATGACAGGTGGATCAAGGCCAATGACAAGGCCAAGGTCTAC
ATCTTGGCGAGCATATCTGATGTGCTTGCCAAGAAGCACGAGGACACGGTCACCGCTAAGGAGATCATGGACTCGCTGCAAAGCATGTTTGGACAATCGTCCTCA
CAGGCTCGACATGAAGCCCTTAAGTTCATTTACAACTCCCGCATGAAGGAGGGCTTCTCAGTGCGAGAACACGTTCTCAACCTGATGGTTCACTTCAATGTGGCT
GAGTGGAACGGAGGCAGCTTGACGCCGGAGAGATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTSAAPHRDDVVTELRTKLGVVSFPTRLRGNVKIAMCYHKHDPETQEDSEEDPVVVFEGNSLKKRSSKSFVASDWAKSCRKRQRRRSRLHRQHTAPRRCTVASRR
CVAPWRHARAPRRCCCSILLPLGAEALSRVSFDPVPKLRFAVRGRMQSDYWGGPLRSENVGSHLRGVVKFVLQEDCPQAPAPNATVAVRNAYDRWIKANDKAKVY
ILASISDVLAKKHEDTVTAKEIMDSLQSMFGQSSSQARHEALKFIYNSRMKEGFSVREHVLNLMVHFNVAEWNGGSLTPER

Moc01g01990 (gene) of Bitter gourd (OHB3-1) v2 genome