CuGenDBv2

Gene ID	Moc01g04550
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Gag/pol protein
Genome location	chr1:2998370..3000536
RNA-Seq Expression	Moc01g04550
Synteny	Moc01g04550
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022152352.1 uncharacterized protein LOC111020095 [Momordica charantia]

1.9e-46

92.38

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MSTSI+ALLAAQRLNG+NYKQWKSN+N ILVIDDL+FVLQEDCPQA APNATVAVR  YDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQP
        MFGQP
Subjt:  MFGQP

XP_022157449.1 uncharacterized protein LOC111024145 [Momordica charantia]

5.3e-36

55.63

Show/hide

Query:  VLRRVSVAPVRVSAIGLHREVSYMTCVSSWSDHPYGGFIDYWGGPLSMSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATV
        +++ VS  PVR+ A   H +  Y  C      + Y           S STSI+ALLAA++ N +NY QWK+N+N ILV+DDLRF+L E+CPQAP PNA  
Subjt:  VLRRVSVAPVRVSAIGLHREVSYMTCVSSWSDHPYGGFIDYWGGPLSMSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATV

Query:  AVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQSMFGQ
        A R+ YDRWIKANDKA VYIL SISDVL+KKHE  +TA+EIMDSLQ +F Q
Subjt:  AVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQSMFGQ

XP_022158062.1 uncharacterized protein LOC111024637 [Momordica charantia]

9.0e-44

78.45

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MSTSI+ LL AQ+LN +NYKQWKSN+N IL+IDDLRFVLQEDCPQAPAPNATVAVRN+YDRWIKANDKAKV ILASISDVLAKKHE+++  KEIMDSLQS
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQPPHRLDMKPLSS
        MFGQP  +   + L+S
Subjt:  MFGQPPHRLDMKPLSS

XP_022158197.1 uncharacterized protein LOC111024734 [Momordica charantia]

3.6e-45

87.62

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MS SI+ALLAAQ+LNG+NY+QWKSN+N ILVIDDLRFVLQEDCPQAP  NATVAVRN YDRWIK+NDKAKVYILASISDVLAKKHEDT+T KEIMDSLQS
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQP
        MFGQP
Subjt:  MFGQP

XP_022158202.1 uncharacterized protein LOC111024739 [Momordica charantia]

1.2e-35

72.12

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MSTS++ALLA ++LNGKNY QWK+N+N ILV+DDLRFVL E+C Q P PNA  A R+ YDRWIKANDKAKVYI ASISDVLAKKH+  +T +EIMDSL+ 
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQ
        MFGQ
Subjt:  MFGQ

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DFZ2 uncharacterized protein LOC111020095

9.4e-47

92.38

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MSTSI+ALLAAQRLNG+NYKQWKSN+N ILVIDDL+FVLQEDCPQA APNATVAVR  YDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQP
        MFGQP
Subjt:  MFGQP

A0A6J1DW68 uncharacterized protein LOC111024637

4.3e-44

78.45

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MSTSI+ LL AQ+LN +NYKQWKSN+N IL+IDDLRFVLQEDCPQAPAPNATVAVRN+YDRWIKANDKAKV ILASISDVLAKKHE+++  KEIMDSLQS
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQPPHRLDMKPLSS
        MFGQP  +   + L+S
Subjt:  MFGQPPHRLDMKPLSS

A0A6J1DWI4 uncharacterized protein LOC111024145

2.6e-36

55.63

Show/hide

Query:  VLRRVSVAPVRVSAIGLHREVSYMTCVSSWSDHPYGGFIDYWGGPLSMSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATV
        +++ VS  PVR+ A   H +  Y  C      + Y           S STSI+ALLAA++ N +NY QWK+N+N ILV+DDLRF+L E+CPQAP PNA  
Subjt:  VLRRVSVAPVRVSAIGLHREVSYMTCVSSWSDHPYGGFIDYWGGPLSMSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATV

Query:  AVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQSMFGQ
        A R+ YDRWIKANDKA VYIL SISDVL+KKHE  +TA+EIMDSLQ +F Q
Subjt:  AVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQSMFGQ

A0A6J1DWL0 uncharacterized protein LOC111024734

1.8e-45

87.62

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MS SI+ALLAAQ+LNG+NY+QWKSN+N ILVIDDLRFVLQEDCPQAP  NATVAVRN YDRWIK+NDKAKVYILASISDVLAKKHEDT+T KEIMDSLQS
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQP
        MFGQP
Subjt:  MFGQP

A0A6J1DWL4 uncharacterized protein LOC111024739

5.7e-36

72.12

Show/hide

Query:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS
        MSTS++ALLA ++LNGKNY QWK+N+N ILV+DDLRFVL E+C Q P PNA  A R+ YDRWIKANDKAKVYI ASISDVLAKKH+  +T +EIMDSL+ 
Subjt:  MSTSILALLAAQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQS

Query:  MFGQ
        MFGQ
Subjt:  MFGQ

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCAGCAACGCCATGGCGTTGCGGGGACAGCACACAGCGCCACGACGCTGCACTGTAGCGCCGCGGCGCTGTGCAGCGCCATGGCGCCATGCCAGGGCGCCGCGGCGCT
GCTGCTGCAGCATTTTGCTGCCTTTAGGCACCGAGGCGCTGTCCCTGGTGTTCTTCGGCGCGTTTCCGTGGCTCCGGTTCGCGTCTCCGCCATTGGTTTGCACCGTGAGG
TTTCATACATGACCTGCGTGTCGTCCTGGAGCGACCATCCCTACGGAGGGTTCATTGATTATTGGGGTGGACCTCTGAGCATGTCTACTTCTATTCTTGCACTCTTAGCC
GCACAAAGACTTAATGGCAAAAATTACAAACAATGGAAGTCAAACGTAAACATTATTCTCGTGATAGATGATCTTAGATTCGTCTTGCAAGAGGATTGTCCTCAAGCTCC
TGCGCCTAATGCCACTGTGGCGGTGCGCAACGTCTATGACAGGTGGATCAAGGCCAATGACAAGGCCAAAGTCTACATCTTGGCGAGCATATCTGATGTGCTTGCTAAGA
AGCACGAGGACACGATCACCGCTAAGGAGATCATGGACTCGCTGCAGAGCATGTTTGGACAACCACCTCACAGGCTCGACATGAAGCCCTTAAGTTCGTTTACAACTCTC
GCATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MQQRHGVAGTAHSATTLHCSAAALCSAMAPCQGAAALLLQHFAAFRHRGAVPGVLRRVSVAPVRVSAIGLHREVSYMTCVSSWSDHPYGGFIDYWGGPLSMSTSILALLA
AQRLNGKNYKQWKSNVNIILVIDDLRFVLQEDCPQAPAPNATVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTITAKEIMDSLQSMFGQPPHRLDMKPLSSFTTL
A

Moc01g04550 (gene) of Bitter gourd (OHB3-1) v2 genome