; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cmc08g0224611 (gene) of Melon (Charmono) v1.1 genome

Gene IDCmc08g0224611
OrganismCucumis melo var. cantalupensis cv. Charmono (Melon (Charmono) v1.1)
DescriptionGag-pol polyprotein
Genome locationCMiso1.1chr08:14855069..14855587
RNA-Seq ExpressionCmc08g0224611
SyntenyCmc08g0224611
Gene Ontology termsGO:0015074 - DNA integration (biological process)
GO:0003676 - nucleic acid binding (molecular function)
GO:0008270 - zinc ion binding (molecular function)
InterPro domainsIPR013103 - Reverse transcriptase, RNA-dependent DNA polymerase
IPR043502 - DNA/RNA polymerase superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0035157.1 gag-pol polyprotein [Cucumis melo var. makuwa]1.2e-7291.5Show/hide
Query:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF
        NAMQEELLQFRRN +W LV K  GVNVIGTKWIFKNK DEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLE IRLLLGISCIQKFKLYQMD+KS F
Subjt:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF

Query:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG
        LNGYLNEEVYVAQPKGFVD EHPKHVYKLNKALYGLKQA  AWYDRLTVYLRG
Subjt:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG

KAA0053137.1 gag-pol polyprotein [Cucumis melo var. makuwa]2.6e-7592.16Show/hide
Query:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF
        N MQEELLQFRRN +WTL+SK EGVNVIGTKWIFKNK DE GCVTKNKARLVAQGYTQVEGVDFDETFAPVARLE IRLLLGISCIQKFKLYQ+D+KS F
Subjt:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF

Query:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG
        LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQAL+AWYDRLTVYLRG
Subjt:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG

KAA0053200.1 gag-pol polyprotein [Cucumis melo var. makuwa]1.0e-8798.81Show/hide
Query:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
        MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKID IGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
Subjt:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL

Query:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV
        GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLT+
Subjt:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV

KAA0066164.1 gag-pol polyprotein [Cucumis melo var. makuwa]1.6e-7288.24Show/hide
Query:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF
        NAMQEELLQFR+N +WTLVSK EGVNVIGTKW+FKNK DE GCVTKNKA+LVAQGYTQVEG+DFDETFA VARLE IRLLLGISCIQKFKLYQMD+KS F
Subjt:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF

Query:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG
        L+GYLNEEVYVAQPKGFVDSEHPKH+YKLNKALYGLKQA +AWYD+LTVYLRG
Subjt:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG

TYK00141.1 gag-pol polyprotein [Cucumis melo var. makuwa]3.5e-8898.81Show/hide
Query:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
        MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
Subjt:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL

Query:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV
        GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNK+LYGLKQALKAWYDRLT+
Subjt:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV

TrEMBL top hitse value%identityAlignment
A0A5A7T0Q0 Gag-pol polyprotein5.9e-7391.5Show/hide
Query:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF
        NAMQEELLQFRRN +W LV K  GVNVIGTKWIFKNK DEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLE IRLLLGISCIQKFKLYQMD+KS F
Subjt:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF

Query:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG
        LNGYLNEEVYVAQPKGFVD EHPKHVYKLNKALYGLKQA  AWYDRLTVYLRG
Subjt:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG

A0A5A7UDB5 Gag-pol polyprotein5.0e-8898.81Show/hide
Query:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
        MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKID IGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
Subjt:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL

Query:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV
        GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLT+
Subjt:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV

A0A5D3BJZ7 Gag-pol polyprotein1.7e-8898.81Show/hide
Query:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
        MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL
Subjt:  MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLL

Query:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV
        GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNK+LYGLKQALKAWYDRLT+
Subjt:  GISCIQKFKLYQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTV

A0A5D3BPB3 Gag-pol polyprotein1.3e-7592.16Show/hide
Query:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF
        N MQEELLQFRRN +WTL+SK EGVNVIGTKWIFKNK DE GCVTKNKARLVAQGYTQVEGVDFDETFAPVARLE IRLLLGISCIQKFKLYQ+D+KS F
Subjt:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF

Query:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG
        LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQAL+AWYDRLTVYLRG
Subjt:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG

A0A5D3CXU0 Gag-pol polyprotein7.7e-7388.24Show/hide
Query:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF
        NAMQEELLQFR+N +WTLVSK EGVNVIGTKW+FKNK DE GCVTKNKA+LVAQGYTQVEG+DFDETFA VARLE IRLLLGISCIQKFKLYQMD+KS F
Subjt:  NAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF

Query:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG
        L+GYLNEEVYVAQPKGFVDSEHPKH+YKLNKALYGLKQA +AWYD+LTVYLRG
Subjt:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG

SwissProt top hitse value%identityAlignment
P04146 Copia protein3.9e-2943.06Show/hide
Query:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVFL
        A+  EL   + N  WT+  + E  N++ ++W+F  K +E+G   + KARLVA+G+TQ   +D++ETFAPVAR+   R +L +      K++QMD+K+ FL
Subjt:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVFL

Query:  NGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYD
        NG L EE+Y+  P+G   S +  +V KLNKA+YGLKQA + W++
Subjt:  NGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYD

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-944.7e-2740.4Show/hide
Query:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVFL
        AMQEE+   ++N  + LV   +G   +  KW+FK K D    + + KARLV +G+ Q +G+DFDE F+PV ++  IR +L ++     ++ Q+D+K+ FL
Subjt:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVFL

Query:  NGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLR
        +G L EE+Y+ QP+GF  +     V KLNK+LYGLKQA + WY +   +++
Subjt:  NGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLR

P92520 Uncharacterized mitochondrial protein AtMg008201.3e-1345.78Show/hide
Query:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGIS
        AMQEEL    RN  W LV      N++G KW+FK K+   G + + KARLVA+G+ Q EG+ F ET++PV R   IR +L ++
Subjt:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGIS

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE11.6e-3044.08Show/hide
Query:  NAMQEELLQFRRNIIWTLVSKLEG-VNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSV
        NAM  E+     N  W LV      V ++G +WIF  K +  G + + KARLVA+GY Q  G+D+ ETF+PV +   IR++LG++  + + + Q+D+ + 
Subjt:  NAMQEELLQFRRNIIWTLVSKLEG-VNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSV

Query:  FLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYL
        FL G L ++VY++QP GF+D + P +V KL KALYGLKQA +AWY  L  YL
Subjt:  FLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYL

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE24.6e-3043.71Show/hide
Query:  AMQEELLQFRRNIIWTLV-SKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF
        AM  E+     N  W LV      V ++G +WIF  K +  G + + KARLVA+GY Q  G+D+ ETF+PV +   IR++LG++  + + + Q+D+ + F
Subjt:  AMQEELLQFRRNIIWTLV-SKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVF

Query:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYL
        L G L +EVY++QP GFVD + P +V +L KA+YGLKQA +AWY  L  YL
Subjt:  LNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYL

Arabidopsis top hitse value%identityAlignment
AT4G23160.1 cysteine-rich RLK (RECEPTOR-like protein kinase) 81.6e-3042.31Show/hide
Query:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVFL
        AM +E+        W + +       IG KW++K K +  G + + KARLVA+GYTQ EG+DF ETF+PV +L  ++L+L IS I  F L+Q+D+ + FL
Subjt:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKLYQMDLKSVFL

Query:  NGYLNEEVYVAQPKGFV----DSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG
        NG L+EE+Y+  P G+     DS  P  V  L K++YGLKQA + W+ + +V L G
Subjt:  NGYLNEEVYVAQPKGFV----DSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG

ATMG00820.1 Reverse transcriptase (RNA-dependent DNA polymerase)9.5e-1545.78Show/hide
Query:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGIS
        AMQEEL    RN  W LV      N++G KW+FK K+   G + + KARLVA+G+ Q EG+ F ET++PV R   IR +L ++
Subjt:  AMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGIS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTTTCCACCATTGAACCTTCGACTGTTGACTCTGCTCTCAAGGATGAGTATTGGAAATGCTATGCAAGAGGAGCTACTGCAATTTAGACGAAACATTATCTGGACGTT
AGTCTCAAAGTTAGAAGGTGTAAATGTTATTGGCACCAAATGGATATTCAAAAATAAGATTGATGAAATTGGATGTGTGACGAAAAATAAAGCTAGATTAGTAGCTCAAG
GGTATACTCAAGTTGAAGGTGTTGACTTTGATGAAACGTTTGCTCCTGTTGCTCGACTTGAAGTTATTCGACTTTTACTGGGTATATCATGCATACAGAAATTTAAATTG
TATCAGATGGATTTAAAGAGTGTCTTCTTAAATGGGTACTTGAATGAGGAAGTTTATGTTGCTCAACCAAAAGGCTTTGTAGATTCCGAGCACCCGAAGCATGTGTATAA
GCTCAACAAAGCCTTATATGGACTAAAGCAAGCTTTGAAAGCTTGGTATGACCGGCTAACTGTATACTTAAGAGGTTGA
mRNA sequenceShow/hide mRNA sequence
ATGTTTCCACCATTGAACCTTCGACTGTTGACTCTGCTCTCAAGGATGAGTATTGGAAATGCTATGCAAGAGGAGCTACTGCAATTTAGACGAAACATTATCTGGACGTT
AGTCTCAAAGTTAGAAGGTGTAAATGTTATTGGCACCAAATGGATATTCAAAAATAAGATTGATGAAATTGGATGTGTGACGAAAAATAAAGCTAGATTAGTAGCTCAAG
GGTATACTCAAGTTGAAGGTGTTGACTTTGATGAAACGTTTGCTCCTGTTGCTCGACTTGAAGTTATTCGACTTTTACTGGGTATATCATGCATACAGAAATTTAAATTG
TATCAGATGGATTTAAAGAGTGTCTTCTTAAATGGGTACTTGAATGAGGAAGTTTATGTTGCTCAACCAAAAGGCTTTGTAGATTCCGAGCACCCGAAGCATGTGTATAA
GCTCAACAAAGCCTTATATGGACTAAAGCAAGCTTTGAAAGCTTGGTATGACCGGCTAACTGTATACTTAAGAGGTTGA
Protein sequenceShow/hide protein sequence
MFPPLNLRLLTLLSRMSIGNAMQEELLQFRRNIIWTLVSKLEGVNVIGTKWIFKNKIDEIGCVTKNKARLVAQGYTQVEGVDFDETFAPVARLEVIRLLLGISCIQKFKL
YQMDLKSVFLNGYLNEEVYVAQPKGFVDSEHPKHVYKLNKALYGLKQALKAWYDRLTVYLRG