CuGenDBv2

Gene ID	Moc02g15520
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	CCHC-type domain-containing protein
Genome location	chr2:11681666..11682659
RNA-Seq Expression	Moc02g15520
Synteny	Moc02g15520
Gene Ontology terms	GO:0006807 - nitrogen compound metabolic process (biological process) GO:0016310 - phosphorylation (biological process) GO:0044238 - primary metabolic process (biological process) GO:0044260 - cellular macromolecule metabolic process (biological process) GO:0016021 - integral component of membrane (cellular component) GO:0000166 - nucleotide binding (molecular function) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function) GO:0016301 - kinase activity (molecular function) GO:0016787 - hydrolase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7561662.1 Zinc finger CCHC-type superfamily [Arabidopsis thaliana x Arabidopsis arenosa]

5.1e-47

55.9

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M ++EW  LDR+VLG IRLTL+KNV  +VAKE T  GLM  L++MYEKPS NNKV+L  K F+LKM EG P+ TH+NEF+ ++N+L +V++EF DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR---KSWKSLSC
        +L+ SLP+SWEPMRAA+SNS G +K+KF DVRD  L EE+RR D+G   TSS+     RGR+ NR   NRG     RSKSRN +   KS K + C
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR---KSWKSLSC

KAG7584790.1 Zinc finger CCHC-type superfamily [Arabidopsis thaliana x Arabidopsis arenosa]

1.5e-46

55.9

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M ++EW  LDR+VLG IRLTL+KNV  +VAKE T  GLM  L++MYEKPS NNKV+L  K F+LKM EG P+ TH+NEF+ ++N+L +V++EF DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR---KSWKSLSC
        +LL SLP+SWEPMRAA+SNS G +K+KF DVRD  L EE+RR D+G    SS+     RGR+ NR   NRG     RSKSRN +   KS K + C
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR---KSWKSLSC

KAG7593230.1 Pentatricopeptide repeat [Arabidopsis thaliana x Arabidopsis arenosa]

3.0e-47

56.41

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M ++EW  LDR+VLG IRLTL+KNV  +VAKE T  GLM  L++MYEKPS NNKV+L  K F+LKM EG P+ TH+NEF+ ++N+L +V++EF DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR---KSWKSLSC
        +LL SLP+SWEPMRAA+SNS G +K+KF DVRD  L EE+RR D+G   TSS+     RGR+ NR   NRG     RSKSRN +   KS K + C
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR---KSWKSLSC

POO03940.1 hypothetical protein TorRG33x02_002440, partial [Trema orientale]

9.1e-44

55.61

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M + +W+ LDR+VLG IRLTLTKNV  +VA+  T   +M+ L++MYEKPS NNKV+L  K F LKM EG  + TH+NEF+ ++++L +V++ F DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVA-RGR----NNNRGYGNRGKLKNNRSKSRN
        +LL SLP SWEPMRAA+SNS GK K++F DVRD  LAEE+RR DSG   +SSS LN+  RGR    N+NRG G R K +N R KSR+
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVA-RGR----NNNRGYGNRGKLKNNRSKSRN

XP_022152845.1 uncharacterized protein LOC111020469 [Momordica charantia]

1.4e-81

91.3

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        MGEKEWK LDRKVLGTIRLTLTKNVQSSVAK TT MGLMNALANMYEK SVNNKVYLATKFFNLKMAE TPIT HLNEFD LINKLVAVDLEFS E YAI
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR
        LLLRSLPDSWEPMRAAISNSC KEK+KFEDVRDAALAEEIRRKDSGIAPTS SVLNV RGRNNNRGYGNRGK KNNRS+SRN+R
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR

TrEMBL top hits

e value

%identity

Alignment

A0A0D3BM55 Uncharacterized protein

2.3e-45

55.45

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M + EW+ LDR+VLG IRLTL+KNV  +VAKE T  GLM  L++MYEKPS NNKV+L  K F+LKM EG  +  H+NEF+ ++N+L +V++EF DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNRKSWKSLSCRWRALGYH
        +LL SLP+SWEPMRAA+SNS G +K+KF DVRD  LAEE+RR DSG A TSS+     RGRN +R   NR    N RSKSRN    W     R  A    
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNRKSWKSLSCRWRALGYH

Query:  CW
        CW
Subjt:  CW

A0A0D3CS45 Uncharacterized protein

5.2e-45

58.15

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M + EW+ LDR+VLG IRLTL+KNV  +VAKE    GLM  L++MYEKPS NNKV+L  K F+LKM EG  +  H+NEF+ ++N+L +V++EF DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR
        +LL SLP+SWEPMRAA+SNS G +K+KF DVRD  LAEE+RR DSG A TSS+     RGRN +R   NR    N RSKSRN R
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR

A0A0D3DMW7 CCHC-type domain-containing protein

3.0e-45

57.61

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M + EW+ LDR+VLG IRLTL+KNV  ++AKE T  GLM  L++MYEKPSVNNKV+L  K F+LKM EG  +  H+NEF+ ++N+L +V++EF DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR
        +LL SLP+SWEPMRAA++NS G +K+KF DVRD  LAEE+RR DSG   TSS+     RGRN +R   NR    N RSKSRN R
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR

A0A6J1DF43 uncharacterized protein LOC111020469

6.9e-82

91.3

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        MGEKEWK LDRKVLGTIRLTLTKNVQSSVAK TT MGLMNALANMYEK SVNNKVYLATKFFNLKMAE TPIT HLNEFD LINKLVAVDLEFS E YAI
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR
        LLLRSLPDSWEPMRAAISNSC KEK+KFEDVRDAALAEEIRRKDSGIAPTS SVLNV RGRNNNRGYGNRGK KNNRS+SRN+R
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNR

A0A7N2LG47 Integrase catalytic domain-containing protein

3.0e-45

50.93

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M  +EW  LDR+VLG IRLTL+++V  +V KE T + LM AL+ MYEKPS NNKV+L  K FNLKMAE   +  HLNEF+ + N+L +V+++F DE  A+
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNV-ARGRNNNRGYGNRGKLKNNRSKSRNNRKSWKSLSCRWRALGY
        ++L SLP+SWE MR A+SNS GKEK+K+ D+RD  LAEEIRR+D+G +  S S LN+  RGR NNR   NRG+ K +R+ +RN  KS      +W   G 
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNV-ARGRNNNRGYGNRGKLKNNRSKSRNNRKSWKSLSCRWRALGY

Query:  HCWIMKDVKYPLVK
         C      K P  K
Subjt:  HCWIMKDVKYPLVK

SwissProt top hits

e value

%identity

Alignment

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-94

3.4e-17

33.33

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI
        M  ++W +LD +    IRL L+ +V +++  E T  G+   L ++Y   ++ NK+YL  + + L M+EGT   +HLN F+ LI +L  + ++  +E  AI
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAI

Query:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNRKS
        LLL SLP S++ +   I +  GK  ++ +DV  A L  E  RK         +++   RGR+  R   N G+    R KS+N  KS
Subjt:  LLLRSLPDSWEPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNRKS

Arabidopsis top hits

e value

%identity

Alignment

AT3G29785.1 unknown protein

5.0e-08

49.09

Show/hide

Query:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKV
        M + +W  L R+VL  IRLT++KN+  +VAKE +  GLM  L+++Y+KPS NN V
Subjt:  MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGAGAAAAAGAATGGAAGAATTTGGACAGGAAAGTGTTGGGTACGATTCGCCTGACATTAACTAAAAATGTTCAGAGCAGCGTGGCGAAGGAGACGACCATAATGGG
GTTGATGAATGCCCTGGCTAACATGTATGAAAAACCTTCGGTAAATAATAAGGTGTATCTTGCAACTAAATTTTTTAATTTGAAAATGGCTGAAGGTACACCTATTACTA
CCCATTTAAATGAGTTTGACGCGTTGATTAATAAACTGGTAGCTGTTGATTTAGAATTCAGTGATGAATTTTATGCTATTTTGTTATTAAGATCTTTGCCTGATAGTTGG
GAACCCATGCGAGCTGCTATTTCAAATTCTTGTGGGAAAGAGAAAATGAAATTTGAAGATGTTAGAGATGCAGCTCTTGCAGAAGAAATTCGCAGGAAGGATTCTGGTAT
CGCTCCTACTTCTAGTTCAGTATTGAATGTGGCTAGAGGAAGAAATAATAACAGAGGTTATGGGAATCGAGGCAAGTTGAAAAACAACAGAAGCAAGTCGAGAAACAACA
GGAAATCATGGAAAAGTCTATCTTGCCGATGGAGAGCTTTAGGATATCATTGTTGGATAATGAAGGATGTGAAATATCCTTTGGTCAAGGAAACTGGAAAGTTACAAAGG
GTGTCATGGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGEKEWKNLDRKVLGTIRLTLTKNVQSSVAKETTIMGLMNALANMYEKPSVNNKVYLATKFFNLKMAEGTPITTHLNEFDALINKLVAVDLEFSDEFYAILLLRSLPDSW
EPMRAAISNSCGKEKMKFEDVRDAALAEEIRRKDSGIAPTSSSVLNVARGRNNNRGYGNRGKLKNNRSKSRNNRKSWKSLSCRWRALGYHCWIMKDVKYPLVKETGKLQR
VSW

Moc02g15520 (gene) of Bitter gourd (OHB3-1) v2 genome