; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cmc03g0074471 (gene) of Melon (Charmono) v1.1 genome

Gene IDCmc03g0074471
OrganismCucumis melo var. cantalupensis cv. Charmono (Melon (Charmono) v1.1)
DescriptionReverse transcriptase
Genome locationCMiso1.1chr03:21967207..21967746
RNA-Seq ExpressionCmc03g0074471
SyntenyCmc03g0074471
Gene Ontology termsGO:0006278 - RNA-dependent DNA biosynthetic process (biological process)
GO:0006508 - proteolysis (biological process)
GO:0015074 - DNA integration (biological process)
GO:0043227 - membrane-bounded organelle (cellular component)
GO:0003676 - nucleic acid binding (molecular function)
GO:0003964 - RNA-directed DNA polymerase activity (molecular function)
GO:0004190 - aspartic-type endopeptidase activity (molecular function)
GO:0008270 - zinc ion binding (molecular function)
InterPro domainsIPR001584 - Integrase, catalytic core
IPR012337 - Ribonuclease H-like superfamily
IPR036397 - Ribonuclease H superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0025425.1 pol protein [Cucumis melo var. makuwa]4.4e-8989.39Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGF +IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIVSDRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGM PFEALY KCC SP+CW EVGEQRL GLELVQSTNEAI
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

KAA0031931.1 pol protein [Cucumis melo var. makuwa]7.4e-8989.94Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGFI+IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIV DRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGMTPFEALY KCC SPICW EVGEQRL G ELVQSTNEAI
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

KAA0041424.1 pol protein [Cucumis melo var. makuwa]5.7e-8988.83Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGF +IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIVSDRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGM PFEALY KCC SP+CWDEVGEQRL G ELVQSTNEA+
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

KAA0064005.1 pol protein [Cucumis melo var. makuwa]1.7e-8888.83Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGF +IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIVSDRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGMTPFEALY +CC SP+CW EVGEQRL G ELVQSTNEAI
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

TYK11727.1 putative polyprotein [Cucumis melo var. makuwa]1.1e-9597.7Show/hide
Query:  GLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTERLNQVL
        GLHRTPRGFIMIWVVVDRLFKSAHFI KKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTERLNQVL
Subjt:  GLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTERLNQVL

Query:  EDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        EDMLRA ALEF GSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSP+CWDEVGEQRLRGLELVQSTNEAI
Subjt:  EDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

TrEMBL top hitse value%identityAlignment
A0A5A7SLT0 Pol protein2.1e-8989.39Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGF +IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIVSDRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGM PFEALY KCC SP+CW EVGEQRL GLELVQSTNEAI
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

A0A5A7SQU8 Reverse transcriptase3.6e-8989.94Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGFI+IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIV DRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGMTPFEALY KCC SPICW EVGEQRL G ELVQSTNEAI
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

A0A5A7TDB5 Pol protein2.8e-8988.83Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGF +IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIVSDRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGM PFEALY KCC SP+CWDEVGEQRL G ELVQSTNEA+
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

A0A5A7VDP3 Pol protein8.0e-8988.83Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD ITGL RT RGF +IWVVVDRL KSAHF+P KSTYTASKWAQLYMSEIVRLHGVP+SIVSDRDARFTSKFWKGLQ AMGTRLDF TAFHPQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        LNQVLEDMLRA ALEFPGSWDSHLHLMEFAYNNS+QATIGMTPFEALY +CC SP+CW EVGEQRL G ELVQSTNEAI
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

A0A5D3CIH0 Putative polyprotein5.2e-9697.7Show/hide
Query:  GLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTERLNQVL
        GLHRTPRGFIMIWVVVDRLFKSAHFI KKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTERLNQVL
Subjt:  GLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTERLNQVL

Query:  EDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI
        EDMLRA ALEF GSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSP+CWDEVGEQRLRGLELVQSTNEAI
Subjt:  EDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI

SwissProt top hitse value%identityAlignment
P0CT34 Transposon Tf2-1 polyprotein1.3e-2436.91Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD IT L  +  G+  ++VVVDR  K A  +P   + TA + A+++   ++   G P  I++D D  FTS+ WK         + F   + PQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYR
         NQ +E +LR      P +W  H+ L++ +YNN+  +   MTPFE ++R
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYR

P0CT41 Transposon Tf2-12 polyprotein1.3e-2436.91Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD IT L  +  G+  ++VVVDR  K A  +P   + TA + A+++   ++   G P  I++D D  FTS+ WK         + F   + PQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYR
         NQ +E +LR      P +W  H+ L++ +YNN+  +   MTPFE ++R
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYR

Q7LHG5 Transposon Ty3-I Gag-Pol polyprotein2.1e-2542.07Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD +TGL  T     MI VVVDR  K AHFI  + T  A++   L    I   HG P +I SDRD R T+  ++ L   +G +    +A HPQTDGQ+ER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFE
          Q L  +LRAY      +W  +L  +EF YN++   T+G +PFE
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFE

Q99315 Transposon Ty3-G Gag-Pol polyprotein7.1e-2642.76Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD +TGL  T     MI VVVDR  K AHFI  + T  A++   L    I   HG P +I SDRD R T+  ++ L   +G +    +A HPQTDGQ+ER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFE
          Q L  +LRAYA     +W  +L  +EF YN++   T+G +PFE
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFE

Q9UR07 Transposon Tf2-11 polyprotein1.3e-2436.91Show/hide
Query:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER
        MD IT L  +  G+  ++VVVDR  K A  +P   + TA + A+++   ++   G P  I++D D  FTS+ WK         + F   + PQTDGQTER
Subjt:  MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTER

Query:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYR
         NQ +E +LR      P +W  H+ L++ +YNN+  +   MTPFE ++R
Subjt:  LNQVLEDMLRAYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYR

Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGATATCATTACAGGACTACATAGAACTCCGAGGGGTTTTATTATGATTTGGGTTGTTGTTGACAGGCTTTTCAAGTCAGCACACTTCATTCCAAAGAAATCCACTTA
TACTGCTAGTAAGTGGGCACAGTTGTACATGTCTGAGATAGTGAGACTACATGGAGTGCCATTGTCGATTGTTTCTGATAGAGATGCCCGTTTCACTTCCAAGTTCTGGA
AGGGTTTACAAGCTGCTATGGGCACGAGGTTAGACTTTGGTACCGCTTTCCACCCACAGACTGATGGTCAGACTGAGCGTCTGAACCAAGTTTTAGAGGATATGTTACGA
GCTTACGCATTAGAATTCCCAGGTAGTTGGGATTCTCACTTGCATTTGATGGAATTTGCTTATAACAACAGTTTTCAGGCTACCATTGGCATGACACCGTTTGAGGCCTT
GTATCGCAAATGTTGTGGATCTCCTATTTGCTGGGATGAGGTTGGTGAGCAGAGATTGAGGGGTCTTGAGTTAGTTCAGTCTACTAATGAAGCGATATAG
mRNA sequenceShow/hide mRNA sequence
ATGGATATCATTACAGGACTACATAGAACTCCGAGGGGTTTTATTATGATTTGGGTTGTTGTTGACAGGCTTTTCAAGTCAGCACACTTCATTCCAAAGAAATCCACTTA
TACTGCTAGTAAGTGGGCACAGTTGTACATGTCTGAGATAGTGAGACTACATGGAGTGCCATTGTCGATTGTTTCTGATAGAGATGCCCGTTTCACTTCCAAGTTCTGGA
AGGGTTTACAAGCTGCTATGGGCACGAGGTTAGACTTTGGTACCGCTTTCCACCCACAGACTGATGGTCAGACTGAGCGTCTGAACCAAGTTTTAGAGGATATGTTACGA
GCTTACGCATTAGAATTCCCAGGTAGTTGGGATTCTCACTTGCATTTGATGGAATTTGCTTATAACAACAGTTTTCAGGCTACCATTGGCATGACACCGTTTGAGGCCTT
GTATCGCAAATGTTGTGGATCTCCTATTTGCTGGGATGAGGTTGGTGAGCAGAGATTGAGGGGTCTTGAGTTAGTTCAGTCTACTAATGAAGCGATATAG
Protein sequenceShow/hide protein sequence
MDIITGLHRTPRGFIMIWVVVDRLFKSAHFIPKKSTYTASKWAQLYMSEIVRLHGVPLSIVSDRDARFTSKFWKGLQAAMGTRLDFGTAFHPQTDGQTERLNQVLEDMLR
AYALEFPGSWDSHLHLMEFAYNNSFQATIGMTPFEALYRKCCGSPICWDEVGEQRLRGLELVQSTNEAI