CuGenDBv2

Gene ID	Moc02g19930
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	DNA-directed DNA polymerase
Genome location	chr2:14800213..14812044
RNA-Seq Expression	Moc02g19930
Synteny	Moc02g19930
Gene Ontology terms	GO:0016740 - transferase activity (molecular function)
InterPro domains	IPR021109 - Aspartic peptidase domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022143608.1 uncharacterized protein LOC111013464 [Momordica charantia]

1.4e-38

89.01

Show/hide

Query:  RAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPADFIILD
        RAAPKKQDPAGVLALDIATSMQKEMVTMNQRLK MALGIKNPLA PIQPVQ DYCTPAPVCQVNDLICSFC+ENHIYDNCPHNPA    ++
Subjt:  RAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPADFIILD

XP_022158408.1 uncharacterized protein LOC111024897, partial [Momordica charantia]

1.2e-74

50.54

Show/hide

Query:  STRSFLLPLDPEIERTLRKTRKEQRLRKQLEKQKEREGEISPESEVESTSTSMADIPPRDPVDPPAVNGNMRDHARNDEFNHIQMADNRDVAMREYAATA
        STRSFLLPLDPEIERTLRKTRKEQRLRKQLE QKEREGEISPESEVESTSTSMADIPPRDPVDPPAVNGNMRDHARNDEFN+IQMADNRDVAMREYAATA
Subjt:  STRSFLLPLDPEIERTLRKTRKEQRLRKQLEKQKEREGEISPESEVESTSTSMADIPPRDPVDPPAVNGNMRDHARNDEFNHIQMADNRDVAMREYAATA

Query:  FQNFDSGIVNPIPAHANFELKPMIFQI-------------------------------------------------------------------------
        FQNFDSGIVNPIPAH NFELKPM+FQ+                                                                         
Subjt:  FQNFDSGIVNPIPAHANFELKPMIFQI-------------------------------------------------------------------------

Query:  ----------------------------------------------------------------------------------------------------
                                                                                                            
Subjt:  ----------------------------------------------------------------------------------------------------

Query:  ---SRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLIC
           SRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLK MALGIKNPLAT IQPVQSDYCT APVCQVNDLIC
Subjt:  ---SRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLIC

XP_022159345.1 uncharacterized protein LOC111025764 [Momordica charantia]

6.8e-38

90.91

Show/hide

Query:  QISRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPA
        Q SRAAPKKQDPAGVLALDIA+SMQKE VTMNQRLK M LG+KNPLATPIQPVQSDYCTPAPVCQVNDLICSFC+ENHIYD CPHNPA
Subjt:  QISRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPA

XP_030479560.1 uncharacterized protein LOC115696816 [Cannabis sativa]

1.2e-29

37.88

Show/hide

Query:  LKPMIFQISRAAPKKQDPAGVLAL-DIATSMQK----EMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPAD
        LK +   IS     +Q P  V  L DI T  ++    E V + +    M LGI   + T +    SD     P  ++ D++          D    +P D
Subjt:  LKPMIFQISRAAPKKQDPAGVLAL-DIATSMQK----EMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPAD

Query:  FIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAINSLNPVMFDEFY-----DSLVTEIEEELDKIAEGPE
        FIILD EAD +VPIILGRPFLAT  T+ +V+ GE+TMRVN++++ FNV +AM+ P + ++CS ++ ++ ++ + F+     D  V    E+L+ ++E  E
Subjt:  FIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAINSLNPVMFDEFY-----DSLVTEIEEELDKIAEGPE

Query:  -DVA-----NPIEK---------IQKEECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV
          VA      P  K         +++   K   PSI  PP LE KPLPSHLKYAYLGDN+TLPV
Subjt:  -DVA-----NPIEK---------IQKEECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV

XP_030504461.1 uncharacterized protein LOC115719521 [Cannabis sativa]

8.9e-30

46.99

Show/hide

Query:  ADFIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAINSLNPVMFDEFY-----DSLVTEIEEELDKIAEG
        ADF ILD EAD +VPIILGRPFLATG T+ +V+ GE+TMRVN+++V FNV +AM+ P + EECS ++ ++ ++ + F+     D  V    E+L+ ++E 
Subjt:  ADFIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAINSLNPVMFDEFY-----DSLVTEIEEELDKIAEG

Query:  PEDVANPIEKIQ---------------KEECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV
         E   + +E +Q               +   K L PSI  PP LE KPLPSHLKYAYLG+N+TLPV
Subjt:  PEDVANPIEKIQ---------------KEECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV

TrEMBL top hits

e value

%identity

Alignment

A0A2G9GK35 Reverse transcriptase

2.4e-28

46.34

Show/hide

Query:  PADFIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAINSL-----NPVMFDEFYDSLVTEIEEELDKIAE
        PADF++LD E D++VPIILGRPFLATG T+ +V+KGE+TMRV ++++ FNV  AMK P + +EC A+N       N  + ++  D L   + + LD+  E
Subjt:  PADFIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAINSL-----NPVMFDEFYDSLVTEIEEELDKIAE

Query:  GPEDV-----------ANPIEKIQK-EECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV
           +V           +  +E +++    K L PSI  PPTLE KPLPSHL YAYLG++DTLPV
Subjt:  GPEDV-----------ANPIEKIQK-EECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV

A0A2G9HH15 Reverse transcriptase

1.5e-27

45.12

Show/hide

Query:  PADFIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAIN---------SLNPVMFDEFYDSLVTEIEEELD
        PADF++LD E D++VPIILGRPFLATG T+ +V+KGE+TMRV ++++ FNV  AMK P + +EC A++         S+     D    +L+  ++EE +
Subjt:  PADFIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAIN---------SLNPVMFDEFYDSLVTEIEEELD

Query:  KIAEGPEDV-------ANPIEKIQK-EECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV
        +  E  + +       +  +E +++    K L PSI  PPTLE KPLPSHL YAYLG++DTLPV
Subjt:  KIAEGPEDV-------ANPIEKIQK-EECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPV

A0A6J1CR45 uncharacterized protein LOC111013464

6.6e-39

89.01

Show/hide

Query:  RAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPADFIILD
        RAAPKKQDPAGVLALDIATSMQKEMVTMNQRLK MALGIKNPLA PIQPVQ DYCTPAPVCQVNDLICSFC+ENHIYDNCPHNPA    ++
Subjt:  RAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPADFIILD

A0A6J1DW02 uncharacterized protein LOC111024897

5.8e-75

50.54

Show/hide

Query:  STRSFLLPLDPEIERTLRKTRKEQRLRKQLEKQKEREGEISPESEVESTSTSMADIPPRDPVDPPAVNGNMRDHARNDEFNHIQMADNRDVAMREYAATA
        STRSFLLPLDPEIERTLRKTRKEQRLRKQLE QKEREGEISPESEVESTSTSMADIPPRDPVDPPAVNGNMRDHARNDEFN+IQMADNRDVAMREYAATA
Subjt:  STRSFLLPLDPEIERTLRKTRKEQRLRKQLEKQKEREGEISPESEVESTSTSMADIPPRDPVDPPAVNGNMRDHARNDEFNHIQMADNRDVAMREYAATA

Query:  FQNFDSGIVNPIPAHANFELKPMIFQI-------------------------------------------------------------------------
        FQNFDSGIVNPIPAH NFELKPM+FQ+                                                                         
Subjt:  FQNFDSGIVNPIPAHANFELKPMIFQI-------------------------------------------------------------------------

Query:  ----------------------------------------------------------------------------------------------------
                                                                                                            
Subjt:  ----------------------------------------------------------------------------------------------------

Query:  ---SRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLIC
           SRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLK MALGIKNPLAT IQPVQSDYCT APVCQVNDLIC
Subjt:  ---SRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLIC

A0A6J1DYG0 uncharacterized protein LOC111025764

3.3e-38

90.91

Show/hide

Query:  QISRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPA
        Q SRAAPKKQDPAGVLALDIA+SMQKE VTMNQRLK M LG+KNPLATPIQPVQSDYCTPAPVCQVNDLICSFC+ENHIYD CPHNPA
Subjt:  QISRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVNDLICSFCNENHIYDNCPHNPA

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCTTCTCCATCTCTTTTCGGCTCTATCGTTTTTGTCTCTATCCTTTCATCTCTTTGTACTTCGCCGCGACGTCTATACTCCTCAGCCAAAACTTCTTTTATTAATATC
AGCTGTGTTCCGAATTTTACCTGTTCTTATTTTGCTTTGTACTCCACAGCTGCAAGTCTTTAAAGCCTTTAAATTTTCCAAGTCTCAATTCACACCTTACCTCGAACTCG
TAAGACCAAGTGTCAGATCTGAAAACTTTGAGGTCGGACTCTCGAGTTATAGTGCCTTGCCATTCGATTTTGGAGGGGTAATGAAAATCCGCGCCGGTACATTGTTCCGT
CTCAAAGCAAGTACCAAAGTTGCTTTCCTTGTCAATTTTTTGGCTTCCCTCGGGTCCATTGGAATATTGCCTTCTCGGAAGTTTCTAATCAGATCCATCCATGACAGAGG
CTGGGAGTCGACTTCCATCATATCCGGCTCCACGATGGACGGGTTGTACAAGATTTCCACCAAGACCGATCACGCCAGGACCATTTGGGAGTGCAAATTAATCAAAAGAA
GCAAAAAGACGAAAAAAGCTTCATGGGAGGCGCCAGGCGCCTGCGTGCCTGCAGAAAACAGTTTTTCTTCCAACTTTGCCCTTAATGAAACGCGTCTTCCCATGCGTTTT
GGTGGTTCCAACCGATGCATACGTGTAGAAGAAGTGTTCCACTATCAGTTTGAGCACGATTTGGGTAAGTTAAAGTGCACGAGCACAAGATCTTTTCTTCTACCCCTTGA
CCCTGAGATTGAGCGGACCCTTCGAAAAACTCGAAAGGAGCAAAGACTTCGAAAACAACTAGAAAAGCAAAAAGAGAGAGAAGGTGAAATCAGTCCTGAAAGTGAGGTAG
AGAGTACAAGCACATCAATGGCAGATATTCCACCTCGTGATCCGGTTGATCCACCTGCTGTTAACGGTAATATGAGGGATCATGCAAGAAATGATGAATTCAACCATATC
CAGATGGCGGACAACAGAGACGTGGCAATGCGAGAATATGCCGCCACGGCTTTTCAGAACTTTGATTCAGGGATAGTCAACCCTATTCCAGCCCACGCAAACTTTGAGCT
TAAACCAATGATATTCCAAATATCTAGGGCAGCACCAAAGAAGCAAGATCCAGCTGGAGTTTTGGCTCTGGACATTGCGACTTCGATGCAAAAAGAGATGGTTACAATGA
ACCAGAGGCTGAAAGGGATGGCGTTGGGAATAAAAAATCCATTAGCCACGCCGATACAACCTGTGCAGTCGGATTATTGCACTCCTGCCCCTGTTTGCCAAGTCAACGAT
CTCATTTGTTCATTTTGCAATGAAAACCATATTTATGATAATTGTCCACATAACCCTGCGGACTTTATCATTCTAGATTGCGAGGCAGACTTAGACGTTCCCATTATTTT
GGGAAGACCATTTCTAGCCACTGGGGATACAGTTTTTAATGTGAGGAAGGGAGAAATTACAATGAGGGTAAATAATGAAGAAGTTAAATTTAACGTTCTAGATGCCATGA
AATTACCAGGAGACTTTGAAGAGTGCTCTGCTATAAATAGCTTGAATCCTGTTATGTTTGATGAGTTTTATGACTCGTTAGTTACAGAGATTGAAGAAGAGCTTGATAAG
ATAGCAGAAGGACCAGAAGATGTGGCTAATCCTATTGAAAAAATACAAAAAGAAGAATGCAAGTCGTTACTTCCGTCCATAGTGGCACCACCCACGTTGGAGCAGAAGCC
ATTGCCGTCGCATTTGAAATATGCGTATCTAGGGGATAACGACACTTTACCAGTTCGAGAAGTCGTGCAACATATCTACAACTTAAGGGCTTCATTGGATTTTGCAGTTT
TACCTTCATGGCCTCCAGCGCTAGCTGCTATCCTTGGTCATCCATCTCCCAGTACTGACACTGATCCTTGTGCTAGTACCCGGTCTGTCAGATGTAAAAGTCTTAGTGTA
AGGAGGGAGTGTGCAGATTCCTTAGGGGACCATTTGGGAGTGCAAATTAATCAAAAGAAGCAAAAAGATGGAAAAACCTACATGGGAGGCGCCAGGCGCCTGGGAAGCCT
GCAGAAAAACTGGTTTTCTTCCAACTTTGCCCTTAATGAAACACGTCTTCCAATGCGTTTTGGTGGTTCCAACCGATGCATACGTGTAGAAGAAGTGTTCCACTATCAGT
TTGAGCACGATTTGGATTTGGAGAAGGCCACTGTAAGTCTTAACAAGTCAATACTGAAAAGGTTGCTTATTTGCATTGTTGAGTGGTTAAACCGAGGAGAGGAGCGCCTT
AGACATAAGGGTTCCTCTTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MLLHLFSALSFLSLSFHLFVLRRDVYTPQPKLLLLISAVFRILPVLILLCTPQLQVFKAFKFSKSQFTPYLELVRPSVRSENFEVGLSSYSALPFDFGGVMKIRAGTLFR
LKASTKVAFLVNFLASLGSIGILPSRKFLIRSIHDRGWESTSIISGSTMDGLYKISTKTDHARTIWECKLIKRSKKTKKASWEAPGACVPAENSFSSNFALNETRLPMRF
GGSNRCIRVEEVFHYQFEHDLGKLKCTSTRSFLLPLDPEIERTLRKTRKEQRLRKQLEKQKEREGEISPESEVESTSTSMADIPPRDPVDPPAVNGNMRDHARNDEFNHI
QMADNRDVAMREYAATAFQNFDSGIVNPIPAHANFELKPMIFQISRAAPKKQDPAGVLALDIATSMQKEMVTMNQRLKGMALGIKNPLATPIQPVQSDYCTPAPVCQVND
LICSFCNENHIYDNCPHNPADFIILDCEADLDVPIILGRPFLATGDTVFNVRKGEITMRVNNEEVKFNVLDAMKLPGDFEECSAINSLNPVMFDEFYDSLVTEIEEELDK
IAEGPEDVANPIEKIQKEECKSLLPSIVAPPTLEQKPLPSHLKYAYLGDNDTLPVREVVQHIYNLRASLDFAVLPSWPPALAAILGHPSPSTDTDPCASTRSVRCKSLSV
RRECADSLGDHLGVQINQKKQKDGKTYMGGARRLGSLQKNWFSSNFALNETRLPMRFGGSNRCIRVEEVFHYQFEHDLDLEKATVSLNKSILKRLLICIVEWLNRGEERL
RHKGSS

Moc02g19930 (gene) of Bitter gourd (OHB3-1) v2 genome