CuGenDBv2

Gene ID	Moc01g28470
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	CCHC-type domain-containing protein
Genome location	chr1:20210697..20211553
RNA-Seq Expression	Moc01g28470
Synteny	Moc01g28470
Gene Ontology terms	GO:0110165 - cellular anatomical structure (cellular component) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR036875 - Zinc finger, CCHC-type superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAF5758504.1 putative RNA-directed DNA polymerase [Helianthus annuus]

3.8e-47

45.29

Show/hide

Query:  SPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG
        SP++  ++K+DGRINFGLWQVQVKDVLIQSGLHKAL+G+ +  +SK  SG                 S   DE+WE++DLRAASAIR  LAKN+LANVHG
Subjt:  SPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG

Query:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRME----------------------------------------------------------------
        ISTAK+LWEKLE LYQ KGISNRLYLKEQFHTLRM+                                                                
Subjt:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRME----------------------------------------------------------------

Query:  ---EEERRLKSEGRTSHEDSALVARNWKKKDSVQKKACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDD
            EE+RL S G TS E + L+  N KKK   QK   CW CGQSGH+K++CP  A S+      A+NV+++ GDD
Subjt:  ---EEERRLKSEGRTSHEDSALVARNWKKKDSVQKKACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDD

KAF5765959.1 putative RNA-directed DNA polymerase [Helianthus annuus]

1.3e-47

45.29

Show/hide

Query:  SPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG
        SP++ D++K+DGRINFGLWQVQVKDVLIQSGLHKAL+G+ +  +SK  SG                 S   DE+WE++DLRAASAIR  LAKN+LANVHG
Subjt:  SPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG

Query:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRME----------------------------------------------------------------
        ISTAK+LWEKLE LYQ KGI NRLYLKEQFHTLRM+                                                                
Subjt:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRME----------------------------------------------------------------

Query:  ---EEERRLKSEGRTSHEDSALVARNWKKKDSVQKKACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDD
            EE+RL S G TS E + L+  N KKK   QK   CW CGQSGH+K++CP  A S+      A+NV+++ GDD
Subjt:  ---EEERRLKSEGRTSHEDSALVARNWKKKDSVQKKACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDD

KAF7802225.1 cytochrome p450 [Senna tora]

1.2e-48

51.23

Show/hide

Query:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL
        MS F S VK D++KFDGRINFGLWQVQVKDVLIQSGLHKAL+G+ S   S+K                   +SSMSD DWEE+DLRAAS IR SLAKN+L
Subjt:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL

Query:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEEEER--------------------RLKSEGRT---------SHEDSALVARNWKKKDSV
        ANV GISTAKELW+KLE LYQAKGISN L LKEQFHTL M+E  +                    ++  E +T         S+E    +  + +KK   
Subjt:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEEEER--------------------RLKSEGRT---------SHEDSALVARNWKKKDSV

Query:  QKKACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDDD
         K   CW CG+SGH+KK+CP  A  + G   DA +VSL+RG+ D
Subjt:  QKKACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDDD

KAF7810708.1 cytochrome p450 [Senna tora]

2.0e-51

52.89

Show/hide

Query:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL
        MS F S +K D++KFDGRINFG WQVQVKDVLIQSGL KAL+G+ S   S+K                   +SSMSD DWEE+DLRAAS IR  LAKN+L
Subjt:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL

Query:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE--------------------------EERRLKSEGRTSHEDSALVARNWKK-KDSVQK
        ANV GISTAKELW+KLE LYQAKGISNRL LKEQFHTLRM E                          EE+R+K E R S  DS +V +N    +    K
Subjt:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE--------------------------EERRLKSEGRTSHEDSALVARNWKK-KDSVQK

Query:  KACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDDD
           CW CG+SGH+KK+CP  A  + G   DA +VSL+RG+ D
Subjt:  KACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDDD

XP_022139673.1 uncharacterized protein LOC111010521 [Momordica charantia]

9.1e-81

68.2

Show/hide

Query:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL
        MSFFMSPVKID++KFDG INFGLWQVQVKDVLIQS LHKALKGR SEGAS+KLS DGG M+ SGGSSRGSKKSSMS EDWEEMDLRAASAIRTSLAKNIL
Subjt:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL

Query:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE----------------------------------------------------------
        ANVH ISTAKELWEKLEALYQAKGISNRLYLKEQFHTL+MEE                                                          
Subjt:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE----------------------------------------------------------

Query:  ---------EERRLKSEGRTSHEDSALVARNW-KKKDSVQKKACCWGCGQSGHMKKDCPNR
                 EERRLKSEGRTSHEDSALV  NW KKKDSVQKKACCWGCGQSGHMKKDCPNR
Subjt:  ---------EERRLKSEGRTSHEDSALVARNW-KKKDSVQKKACCWGCGQSGHMKKDCPNR

TrEMBL top hits

e value

%identity

Alignment

A0A6A2Y9V1 CCHC-type domain-containing protein

2.7e-46

56.72

Show/hide

Query:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG
        + D++KFDGRINFGLWQVQVKD+LIQSGL+KALKG+    SEG       D         SS    KS MS+E+WEE+D+RAAS IR  LAKN+LANV  
Subjt:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG

Query:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE--------EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPNRAGS
         S+  ELWEKLE +YQAK +SNRLYLKE+FH L+MEE        EERRLK+    S E  AL V  N KK    +KK  CWGCGQ GH+KKDC N   +
Subjt:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE--------EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPNRAGS

Query:  S
        S
Subjt:  S

A0A6A2YS90 Transcription initiation factor IIA subunit 2

1.2e-43

43.97

Show/hide

Query:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG
        + D++KFDGRINFGLWQVQVKD+LIQSGL+KALKG+    SEG       D         SS    KS MS+E+WEE+D+RAAS IR  LAKN+LANV  
Subjt:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG

Query:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE---------------------------------------------------------------
         S+ KELWEKLE +YQAK +SNRLYLKE+FH L+MEE                                                               
Subjt:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE---------------------------------------------------------------

Query:  ----EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPN-RAGSSKGFGWDADNVSLIRGDDDQFL
            EERRLK+    S E  AL V  N KK    +KK  CWGCGQ GH+KKDC N  A S+ G   DA NV +   +DD+F+
Subjt:  ----EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPN-RAGSSKGFGWDADNVSLIRGDDDQFL

A0A6A3BK59 CCHC-type domain-containing protein

1.2e-43

43.97

Show/hide

Query:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG
        + D++KFDGRINFGLWQVQVKD+LIQSGL+KALKG+    SEG       D         SS    KS MS+E+WEE+D+RAAS IR  LAKN+LANV  
Subjt:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG

Query:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE---------------------------------------------------------------
         S+ KELWEKLE +YQAK +SNRLYLKE+FH L+MEE                                                               
Subjt:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE---------------------------------------------------------------

Query:  ----EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPN-RAGSSKGFGWDADNVSLIRGDDDQFL
            EERRLK+    S E  AL V  N KK    +KK  CWGCGQ GH+KKDC N  A S+ G   DA NV +   +DD+F+
Subjt:  ----EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPN-RAGSSKGFGWDADNVSLIRGDDDQFL

A0A6A3CWI3 CCHC-type domain-containing protein

6.2e-43

43.62

Show/hide

Query:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG
        + D++KFDGRINFGLWQVQVKD+LIQSGL+KALKG+    SEG       D         SS    KS MS+E+WEE+D+RAAS IR  LAKN+LANV  
Subjt:  KIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQ---SEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHG

Query:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE---------------------------------------------------------------
         S+ KELWEKLE +YQAK +SNRLYLKE+FH L+MEE                                                               
Subjt:  ISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE---------------------------------------------------------------

Query:  ----EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPN-RAGSSKGFGWDADNVSLIRGDDDQFL
            EERRLK+    S E  AL V  N KK    +KK  CWGCGQ GH+KKDC N  A  + G   DA NV +   +DD+F+
Subjt:  ----EERRLKSEGRTSHEDSAL-VARNWKKKDSVQKKACCWGCGQSGHMKKDCPN-RAGSSKGFGWDADNVSLIRGDDDQFL

A0A6J1CG82 uncharacterized protein LOC111010521

4.4e-81

68.2

Show/hide

Query:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL
        MSFFMSPVKID++KFDG INFGLWQVQVKDVLIQS LHKALKGR SEGAS+KLS DGG M+ SGGSSRGSKKSSMS EDWEEMDLRAASAIRTSLAKNIL
Subjt:  MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNIL

Query:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE----------------------------------------------------------
        ANVH ISTAKELWEKLEALYQAKGISNRLYLKEQFHTL+MEE                                                          
Subjt:  ANVHGISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRMEE----------------------------------------------------------

Query:  ---------EERRLKSEGRTSHEDSALVARNW-KKKDSVQKKACCWGCGQSGHMKKDCPNR
                 EERRLKSEGRTSHEDSALV  NW KKKDSVQKKACCWGCGQSGHMKKDCPNR
Subjt:  ---------EERRLKSEGRTSHEDSALVARNW-KKKDSVQKKACCWGCGQSGHMKKDCPNR

SwissProt top hits

e value

%identity

Alignment

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-94

3.6e-16

Show/hide

Query:  MSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVH
        MS VK ++ KF+G   F  WQ +++D+LIQ GLHK L                             K  +M  EDW ++D RAASAIR  L+ +++ N+ 
Subjt:  MSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVH

Query:  GISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRM---------------------------EEEERRL------------------------------
           TA+ +W +LE+LY +K ++N+LYLK+Q + L M                           EEE++ +                              
Subjt:  GISTAKELWEKLEALYQAKGISNRLYLKEQFHTLRM---------------------------EEEERRL------------------------------

Query:  -------KSEGRTSHEDSALV-------------------ARNWKKKDSVQKKACCWGCGQSGHMKKDCPN---RAGSSKGFGWDADNVSLIRGDDDQFL
               K   +  ++  AL+                   AR   K  S  +   C+ C Q GH K+DCPN     G + G   D +  ++++ +D+  L
Subjt:  -------KSEGRTSHEDSALV-------------------ARNWKKKDSVQKKACCWGCGQSGHMKKDCPN---RAGSSKGFGWDADNVSLIRGDDDQFL

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCATTCTTTATGAGTCCAGTGAAGATTGACATGGATAAATTTGACGGAAGGATCAACTTTGGCTTGTGGCAAGTGCAAGTCAAGGATGTGCTGATACAATCTGGGTT
ACACAAGGCATTGAAGGGAAGACAGAGTGAAGGTGCTTCGAAAAAGCTAAGCGGTGATGGTGGTTCAATGAAGTTCAGTGGTGGTTCCAGCAGAGGTTCTAAGAAGTCTA
GCATGAGTGATGAAGATTGGGAGGAAATGGATTTGAGAGCTGCAAGCGCGATACGAACAAGTTTGGCTAAGAATATTCTTGCGAATGTGCATGGAATTTCGACAGCCAAA
GAACTTTGGGAGAAGCTCGAAGCGTTGTATCAGGCAAAGGGTATCTCAAATCGGCTGTACCTGAAGGAGCAGTTTCACACGCTGCGAATGGAGGAAGAGGAAAGAAGGCT
GAAGAGTGAAGGGCGTACTTCACATGAAGATTCGGCACTGGTAGCTCGCAATTGGAAGAAGAAAGACTCCGTACAAAAGAAAGCTTGTTGCTGGGGATGCGGACAGTCTG
GACACATGAAGAAAGATTGTCCCAACAGAGCCGGTTCGTCAAAGGGCTTTGGGTGGGATGCTGACAATGTTTCTCTCATCAGAGGAGACGATGATCAGTTCCTTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSFFMSPVKIDMDKFDGRINFGLWQVQVKDVLIQSGLHKALKGRQSEGASKKLSGDGGSMKFSGGSSRGSKKSSMSDEDWEEMDLRAASAIRTSLAKNILANVHGISTAK
ELWEKLEALYQAKGISNRLYLKEQFHTLRMEEEERRLKSEGRTSHEDSALVARNWKKKDSVQKKACCWGCGQSGHMKKDCPNRAGSSKGFGWDADNVSLIRGDDDQFL

Moc01g28470 (gene) of Bitter gourd (OHB3-1) v2 genome