CuGenDBv2

Gene ID	Moc09g25090
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Gag/pol protein
Genome location	chr9:18809692..18812812
RNA-Seq Expression	Moc09g25090
Synteny	Moc09g25090
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0035676.1 gag/pol protein [Cucumis melo var. makuwa]

1.0e-19

71.01

Show/hide

Query:  SKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI
        S  + LLA +KLNG+NY  WK NLNTILVVDDLRF+LTEECPQ PT +A RASR+AYDRWI+ANEK ++
Subjt:  SKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI

KAA0067803.1 gag/pol protein [Cucumis melo var. makuwa]

3.9e-19

35.74

Show/hide

Query:  MSKSIA-LLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNT-------QSKVVLNEISDEATN
        M++SI  LLA EKLN +NY  WK NLNT LVVDDLRFVL EECPQ    +A RASR AYDRWI+ANEK  + +  + +       +S     EI D    
Subjt:  MSKSIA-LLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNT-------QSKVVLNEISDEATN

Query:  -------TSTRVADKAITSTRVVDGASTSR---------------------------------------QSHSS------------------QKLIVSRR
               +  + A K I + R+ +G S                                          Q+++S                  Q L    R
Subjt:  -------TSTRVADKAITSTRVVDGASTSR---------------------------------------QSHSS------------------QKLIVSRR

Query:  SGRIMSQLDRYVGLTEIQVVIPDDGVEDPLTYKNA
          RI  Q DRY GL E Q++IPDDG++D LTYK A
Subjt:  SGRIMSQLDRYVGLTEIQVVIPDDGVEDPLTYKNA

XP_022156751.1 uncharacterized protein LOC111023591 [Momordica charantia]

1.1e-21

53.91

Show/hide

Query:  MSKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNTQSKVVLNEISDEATNTSTRVADK
        MSKSIALLA +KLN +NY QWK NLNTILVVDDLRFVLTE+CPQAPT +AARAS+DAYDRWI+AN+K KI   I  T S V+  +      + S   A +
Subjt:  MSKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNTQSKVVLNEISDEATNTSTRVADK

Query:  AITSTRVVDGASTSRQSHSSQKLIVSRR
         + S + + G  + +  H + K I + R
Subjt:  AITSTRVVDGASTSRQSHSSQKLIVSRR

XP_022157449.1 uncharacterized protein LOC111024145 [Momordica charantia]

2.2e-22

67.03

Show/hide

Query:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITL--EITNTQSK-----VVLNEISD
        IALLA EK N ENY QWK NLNTILVVDDLRF+LTEECPQAPTP+AARASRDAYDRWI+AN+K  + +   I++  SK     V   EI D
Subjt:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITL--EITNTQSK-----VVLNEISD

XP_022158202.1 uncharacterized protein LOC111024739 [Momordica charantia]

8.3e-22

80.3

Show/hide

Query:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI
        IALLA+EKLNG+NY QWK NLN ILVVDDLRFVLTEEC Q PTP+A RASRDAYDRWI+AN+K K+
Subjt:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI

TrEMBL top hits

e value

%identity

Alignment

A0A5A7T0E9 Gag/pol protein

4.9e-20

71.01

Show/hide

Query:  SKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI
        S  + LLA +KLNG+NY  WK NLNTILVVDDLRF+LTEECPQ PT +A RASR+AYDRWI+ANEK ++
Subjt:  SKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI

A0A5A7VI85 Gag/pol protein

1.9e-19

35.74

Show/hide

Query:  MSKSIA-LLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNT-------QSKVVLNEISDEATN
        M++SI  LLA EKLN +NY  WK NLNT LVVDDLRFVL EECPQ    +A RASR AYDRWI+ANEK  + +  + +       +S     EI D    
Subjt:  MSKSIA-LLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNT-------QSKVVLNEISDEATN

Query:  -------TSTRVADKAITSTRVVDGASTSR---------------------------------------QSHSS------------------QKLIVSRR
               +  + A K I + R+ +G S                                          Q+++S                  Q L    R
Subjt:  -------TSTRVADKAITSTRVVDGASTSR---------------------------------------QSHSS------------------QKLIVSRR

Query:  SGRIMSQLDRYVGLTEIQVVIPDDGVEDPLTYKNA
          RI  Q DRY GL E Q++IPDDG++D LTYK A
Subjt:  SGRIMSQLDRYVGLTEIQVVIPDDGVEDPLTYKNA

A0A6J1DVX8 uncharacterized protein LOC111023591

5.3e-22

53.91

Show/hide

Query:  MSKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNTQSKVVLNEISDEATNTSTRVADK
        MSKSIALLA +KLN +NY QWK NLNTILVVDDLRFVLTE+CPQAPT +AARAS+DAYDRWI+AN+K KI   I  T S V+  +      + S   A +
Subjt:  MSKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNTQSKVVLNEISDEATNTSTRVADK

Query:  AITSTRVVDGASTSRQSHSSQKLIVSRR
         + S + + G  + +  H + K I + R
Subjt:  AITSTRVVDGASTSRQSHSSQKLIVSRR

A0A6J1DWI4 uncharacterized protein LOC111024145

1.1e-22

67.03

Show/hide

Query:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITL--EITNTQSK-----VVLNEISD
        IALLA EK N ENY QWK NLNTILVVDDLRF+LTEECPQAPTP+AARASRDAYDRWI+AN+K  + +   I++  SK     V   EI D
Subjt:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITL--EITNTQSK-----VVLNEISD

A0A6J1DWL4 uncharacterized protein LOC111024739

4.0e-22

80.3

Show/hide

Query:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI
        IALLA+EKLNG+NY QWK NLN ILVVDDLRFVLTEEC Q PTP+A RASRDAYDRWI+AN+K K+
Subjt:  IALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCTTGGCCTGGTGTCGCCCTGGGCGCGGCCTCCCTACGGAAGGTGTTTGCATGGTTCAATACCAAGCATGTCTAAATCTATTGCCTTGCTTGCCGTCGAAAAACTCAA
CGGCGAAAATTACAGACAATGGAAAATGAACCTTAACACAATACTCGTGGTAGATGATCTGAGGTTCGTCTTAACTGAGGAGTGTCCTCAGGCTCCCACGCCTAGTGCAG
CTCGAGCGAGTCGGGATGCCTATGACAGATGGATCCAGGCCAATGAGAAGAAGAAGATCACATTAGAGATCACAAACACACAAAGCAAGGTTGTGTTAAATGAGATTTCC
GATGAAGCTACAAATACATCAACAAGAGTTGCTGATAAAGCTATCACTTCAACAAGAGTTGTTGATGGCGCTAGTACATCACGTCAGTCACATTCATCTCAAAAGTTGAT
AGTGTCTCGACGTAGTGGGAGGATTATGTCACAACTTGATCGTTACGTGGGTTTAACAGAAATCCAGGTCGTCATACCTGATGATGGCGTTGAGGATCCATTGACATACA
AAAATGCAAATGGAAGATGTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MLGLVSPWARPPYGRCLHGSIPSMSKSIALLAVEKLNGENYRQWKMNLNTILVVDDLRFVLTEECPQAPTPSAARASRDAYDRWIQANEKKKITLEITNTQSKVVLNEIS
DEATNTSTRVADKAITSTRVVDGASTSRQSHSSQKLIVSRRSGRIMSQLDRYVGLTEIQVVIPDDGVEDPLTYKNANGRC

Moc09g25090 (gene) of Bitter gourd (OHB3-1) v2 genome