CuGenDBv2

Gene ID	Moc07g10200
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Gag/pol protein
Genome location	chr7:7820955..7823665
RNA-Seq Expression	Moc07g10200
Synteny	Moc07g10200
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR036875 - Zinc finger, CCHC-type superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0046201.1 gag/pol protein [Cucumis melo var. makuwa]

6.6e-42

44.87

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        M+ SI+ LL +QKLNG+NY  WK NLNT LV++DLRFVL E+C QA A  A   VR AYDRW+KAN+KA+VYI+A++S+VLAKKHE   TAKEIMDSL  
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALK------VERGCHRRA---------KSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSG-SKTIKKKKAAGKGFKPDSATAAP
        MFGQPS   +HEA+K      ++ G   R             + +  ++  +   +      TE   +  S S +    ++ K K  GK          P
Subjt:  MFGQPSSQARHEALK------VERGCHRRA---------KSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSG-SKTIKKKKAAGKGFKPDSATAAP

Query:  KKGKAKVAEKGKCFHCNMDGHRKRNCPKYLPNRR
           K K   KGKC+HCN DGH  RNCPKYL  ++
Subjt:  KKGKAKVAEKGKCFHCNMDGHRKRNCPKYLPNRR

TYK14981.1 DNA-binding protein HEXBP-like [Cucumis melo var. makuwa]

1.5e-41

50.68

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MS+SIIALL   +L  ENY  WKS LN  LVI DLRFVL E+C      NA  +VR+AYDRW KANDKA++YILA +SN+L+KKHE  VTA++IMDSL+ 
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALKVERGCHRRAKSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSGSKTIKKKKAAGKGFKPDSATAAPKKGKAKVAEKGKCFHC
        MFGQPS Q                                I Q+      R   P  SSSGSK I+K+K  GKG  P    A   KGKAKVA KGKCFHC
Subjt:  MFGQPSSQARHEALKVERGCHRRAKSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSGSKTIKKKKAAGKGFKPDSATAAPKKGKAKVAEKGKCFHC

Query:  NMDGHRKRNCPKYLPNRRK
        N++ H KRNCPKYL  +++
Subjt:  NMDGHRKRNCPKYLPNRRK

XP_022152352.1 uncharacterized protein LOC111020095 [Momordica charantia]

4.3e-49

89.57

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MS SIIALL AQ+LNGENYKQWKSNLNT LVIDDL+FVLQEDC QA APNATVAVR AYDRWIKANDKAKVYILAS+S+VLAKKHEDT+TAKEIMDSLQ+
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALK
        MFGQPSSQARHEALK
Subjt:  MFGQPSSQARHEALK

XP_022158062.1 uncharacterized protein LOC111024637 [Momordica charantia]

2.4e-44

84.21

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MS SII LL AQKLN ENYKQWKSN+NT L+IDDLRFVLQEDC QA APNATVAVRN YDRWIKANDKAKV ILAS+S+VLAKKHE++V  KEIMDSLQ+
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEAL
        MFGQPSSQARHEAL
Subjt:  MFGQPSSQARHEAL

XP_022158197.1 uncharacterized protein LOC111024734 [Momordica charantia]

4.7e-48

88.7

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MSASIIALL AQKLNGENY+QWKSNLNT LVIDDLRFVLQEDC QA   NATVAVRNAYDRWIK+NDKAKVYILAS+S+VLAKKHEDTVT KEIMDSLQ+
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALK
        MFGQPS QARHEALK
Subjt:  MFGQPSSQARHEALK

TrEMBL top hits

e value

%identity

Alignment

A0A5A7TXW7 Gag/pol protein

3.2e-42

44.87

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        M+ SI+ LL +QKLNG+NY  WK NLNT LV++DLRFVL E+C QA A  A   VR AYDRW+KAN+KA+VYI+A++S+VLAKKHE   TAKEIMDSL  
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALK------VERGCHRRA---------KSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSG-SKTIKKKKAAGKGFKPDSATAAP
        MFGQPS   +HEA+K      ++ G   R             + +  ++  +   +      TE   +  S S +    ++ K K  GK          P
Subjt:  MFGQPSSQARHEALK------VERGCHRRA---------KSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSG-SKTIKKKKAAGKGFKPDSATAAP

Query:  KKGKAKVAEKGKCFHCNMDGHRKRNCPKYLPNRR
           K K   KGKC+HCN DGH  RNCPKYL  ++
Subjt:  KKGKAKVAEKGKCFHCNMDGHRKRNCPKYLPNRR

A0A5D3CT18 DNA-binding protein HEXBP-like

7.1e-42

50.68

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MS+SIIALL   +L  ENY  WKS LN  LVI DLRFVL E+C      NA  +VR+AYDRW KANDKA++YILA +SN+L+KKHE  VTA++IMDSL+ 
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALKVERGCHRRAKSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSGSKTIKKKKAAGKGFKPDSATAAPKKGKAKVAEKGKCFHC
        MFGQPS Q                                I Q+      R   P  SSSGSK I+K+K  GKG  P    A   KGKAKVA KGKCFHC
Subjt:  MFGQPSSQARHEALKVERGCHRRAKSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLSSSGSKTIKKKKAAGKGFKPDSATAAPKKGKAKVAEKGKCFHC

Query:  NMDGHRKRNCPKYLPNRRK
        N++ H KRNCPKYL  +++
Subjt:  NMDGHRKRNCPKYLPNRRK

A0A6J1DFZ2 uncharacterized protein LOC111020095

2.1e-49

89.57

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MS SIIALL AQ+LNGENYKQWKSNLNT LVIDDL+FVLQEDC QA APNATVAVR AYDRWIKANDKAKVYILAS+S+VLAKKHEDT+TAKEIMDSLQ+
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALK
        MFGQPSSQARHEALK
Subjt:  MFGQPSSQARHEALK

A0A6J1DW68 uncharacterized protein LOC111024637

1.2e-44

84.21

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MS SII LL AQKLN ENYKQWKSN+NT L+IDDLRFVLQEDC QA APNATVAVRN YDRWIKANDKAKV ILAS+S+VLAKKHE++V  KEIMDSLQ+
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEAL
        MFGQPSSQARHEAL
Subjt:  MFGQPSSQARHEAL

A0A6J1DWL0 uncharacterized protein LOC111024734

2.3e-48

88.7

Show/hide

Query:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN
        MSASIIALL AQKLNGENY+QWKSNLNT LVIDDLRFVLQEDC QA   NATVAVRNAYDRWIK+NDKAKVYILAS+S+VLAKKHEDTVT KEIMDSLQ+
Subjt:  MSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATVAVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQN

Query:  MFGQPSSQARHEALK
        MFGQPS QARHEALK
Subjt:  MFGQPSSQARHEALK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCAGCAGCGCCATGGCGCTGCAGGGATAGCACACGGCGCCATGACGTTGCACTGTAGCTCCGCGGCGCTGTGCAGCCTCATGGCGCCATCCCTGGGCGCCGCG
GCATTGCTGGTGCGGCATTTTGCTGCAGCAGCGCCGAGGCGCTGTCCCGGCATGTCTGCTTCCATTATTGCACTCCTACCCGCTCAAAAACTTAACGGCGAGAAT
TACAAACAATGGAAATCAAACCTAAATACTACTCTCGTGATAGATGATCTTAGGTTTGTCTTGCAAGAGGATTGTTCTCAAGCTCTTGCGCCTAACGCCACTGTG
GCGGTGCGCAACGCCTATGACAGGTGGATCAAGGCCAATGACAAGGCCAAGGTCTACATCTTGGCGAGCGTATCTAATGTGCTTGCCAAGAAGCATGAGGACACG
GTCACCGCTAAGGAGATCATGGACTCACTGCAGAACATGTTTGGACAACCGTCCTCACAGGCTAGACATGAAGCCCTTAAAGTTGAACGGGGCTGTCATAGACGA
GCAAAGTCAGGTCAGCTTTATTCTGGAATCTCTTTCGAAGAGTTTCCTGCCATTCCGCAGCAATGTGGTTCAACCGAGGTTCGTCCTTTGGAACCAAGTCTCTCT
TCTTCTGGAAGTAAGACTATTAAGAAGAAGAAGGCTGCTGGTAAGGGGTTTAAACCTGACTCCGCTACTGCCGCTCCCAAGAAAGGCAAGGCCAAGGTTGCAGAG
AAAGGAAAGTGTTTCCACTGCAATATGGACGGGCATCGGAAGCGCAACTGCCCAAAGTACTTGCCGAACAGAAGAAAGCCAACGAAGGAGCCACTAATCACGTTT
GTTCTTCATTTCAGGGAATTAGTTCCTAGAGGCAGCTTGACGCCGGAGAGATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MQQRHGAAGIAHGAMTLHCSSAALCSLMAPSLGAAALLVRHFAAAAPRRCPGMSASIIALLPAQKLNGENYKQWKSNLNTTLVIDDLRFVLQEDCSQALAPNATV
AVRNAYDRWIKANDKAKVYILASVSNVLAKKHEDTVTAKEIMDSLQNMFGQPSSQARHEALKVERGCHRRAKSGQLYSGISFEEFPAIPQQCGSTEVRPLEPSLS
SSGSKTIKKKKAAGKGFKPDSATAAPKKGKAKVAEKGKCFHCNMDGHRKRNCPKYLPNRRKPTKEPLITFVLHFRELVPRGSLTPER

Moc07g10200 (gene) of Bitter gourd (OHB3-1) v2 genome