; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Chy2G033480 (gene) of Cucumber (hystrix) v1 genome

Gene IDChy2G033480
OrganismCucumis hystrix (Cucumber (hystrix) v1)
DescriptionRetrovirus-related Pol polyprotein from transposon TNT 1-94
Genome locationchrH02:7546988..7551347
RNA-Seq ExpressionChy2G033480
SyntenyChy2G033480
Gene Ontology termsGO:0015074 - DNA integration (biological process)
GO:0003676 - nucleic acid binding (molecular function)
GO:0008270 - zinc ion binding (molecular function)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0032274.1 putative gag-pol polyprotein, identical [Cucumis melo var. makuwa]1.03e-7584.56Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KTAEVWFIDS C NH+ GLKPVFKELNEGEKL  EL NGKELQV+GKGT+GIETHHG RILTNVQYVPDIGYNLLSVGQLM+SG+SILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVLAKVKMTQSKMFPLEVSNV++FAL AT T  NTTK NS+LW+L
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

KAA0045239.1 putative gag-pol polyprotein, identical [Cucumis melo var. makuwa]4.49e-7683.89Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        ++KTAEVWFIDS C NH+ GLKPVFKE NEGEKL  ELENGKELQV+GKGT+GIETHHG RILTNVQYVPDIGYNLLSVGQLM+SG+SILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQT RVL KVKMTQSKMFPLEV NVENFALTAT T  NTTK NS+LW+L
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

KAA0054939.1 putative gag-pol polyprotein, identical [Cucumis melo var. makuwa]3.94e-7384.56Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KTAEVWFIDS C NH+ GLKPVFKELNEGEKL  EL NGKELQV+GKG +GIETHHG RILTNVQ+VPDIGYNLLSVGQLM+SG+SILF+DGA LIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVL KVKMTQSKMFPLEVSNVE+FALT  TT TNTTK NSELWHL
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

TYK27735.1 putative gag-pol polyprotein, identical [Cucumis melo var. makuwa]5.75e-7485.91Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KTAEVWFIDS C NH+ GLKPVFKELNEGEKL  +L NGKELQV+GKGT+ IETHHG RILTNVQYVPDIGYNLLSVGQLM+SG+SILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVLAKVKMTQSKMFPLEVSNVE+FALTAT T  NTTK NSELWHL
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

TYK28117.1 putative gag-pol polyprotein, identical [Cucumis melo var. makuwa]1.91e-7285.91Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KT EVWFIDS   NH+  LKPVFKELNEGEKL  EL NGKELQV+GK TMGIETH+G RILTNVQYVPDIGYNLLSVGQLM+SGHSILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVLAKVKMTQSKMFPLEVSNVENFALTAT T  NTTK NSELWHL
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

TrEMBL top hitse value%identityAlignment
A0A5A7SM62 Putative gag-pol polyprotein, identical2.9e-6384.56Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KTAEVWFIDS C NH+ GLKPVFKELNEGEKL  EL NGKELQV+GKGT+GIETHHG RILTNVQYVPDIGYNLLSVGQLM+SG+SILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVLAKVKMTQSKMFPLEVSNV++FAL A  T TNTTK NS+LW+L
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

A0A5A7TVH1 Putative gag-pol polyprotein, identical1.1e-6283.89Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        ++KTAEVWFIDS C NH+ GLKPVFKE NEGEKL  ELENGKELQV+GKGT+GIETHHG RILTNVQYVPDIGYNLLSVGQLM+SG+SILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQT RVL KVKMTQSKMFPLEV NVENFALTA  T TNTTK NS+LW+L
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

A0A5A7UN91 Putative gag-pol polyprotein, identical1.1e-6284.56Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KTAEVWFIDS C NH+ GLKPVFKELNEGEKL  EL NGKELQV+GKG +GIETHHG RILTNVQ+VPDIGYNLLSVGQLM+SG+SILF+DGA LIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVL KVKMTQSKMFPLEVSNVE+FAL  TTT TNTTK NSELWHL
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

A0A5D3DWC7 Putative gag-pol polyprotein, identical1.1e-6285.91Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KT EVWFIDS   NH+  LKPVFKELNEGEKL  EL NGKELQV+GK TMGIETH+G RILTNVQYVPDIGYNLLSVGQLM+SGHSILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVLAKVKMTQSKMFPLEVSNVENFALTA  T TNTTK NSELWHL
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

A0A5D3DWP2 Putative gag-pol polyprotein, identical1.5e-6485.91Show/hide
Query:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN
        D+KTAEVWFIDS C NH+ GLKPVFKELNEGEKL  +L NGKELQV+GKGT+ IETHHG RILTNVQYVPDIGYNLLSVGQLM+SG+SILF+DGACLIKN
Subjt:  DEKTAEVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKN

Query:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL
        KQTGRVLAKVKMTQSKMFPLEVSNVE+FALTA  T TNTTK NSELWHL
Subjt:  KQTGRVLAKVKMTQSKMFPLEVSNVENFALTATTTTTNTTKINSELWHL

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT3G21000.1 Gag-Pol-related retrotransposon family protein3.5e-0525.2Show/hide
Query:  EVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHG-KRILTNVQYVPDIGYNLLSVGQLMDSGHSI-LFEDGACLIKNKQT
        ++W I    P ++      F  L+   K      +G  L V+GKG + I    G K+ + NV +VP +  N+LS G+++   +SI     G C++ ++  
Subjt:  EVWFIDSCCPNHIKGLKPVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHG-KRILTNVQYVPDIGYNLLSVGQLMDSGHSI-LFEDGACLIKNKQT

Query:  GRVLAKVKMTQSKMFPLEVSNVE
         ++   + MT      L +  +E
Subjt:  GRVLAKVKMTQSKMFPLEVSNVE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTGTTCCGAAAATAAGTCTGTGTCAAGGGACGTGCAAGAAATTGGACATAATGCAGTCCGCATACACAACGAAGAAAAACCAGACACTTTGATTTTCCTTCGTGTGAT
AAACTACTTGGAATATGTAAATCATACTTGCAAGAGGTATGCTATAGTGCTAGAAGCTATAAATAAGGATAAAATTATCTGGACATATGTGACTTCGATTGCAATTCCAC
GACCATCAGTCTTTGAACTCGTATCTTTTAAAGATCTCCTCGGAGATGAAAAGACAGCGGAGGTGTGGTTCATTGATAGCTGTTGTCCGAATCACATAAAAGGTTTGAAG
CCTGTATTCAAGGAGCTTAACGAAGGGGAAAAGTTGATATGGGAGCTCGAAAATGGCAAGGAGCTACAAGTCGATGGCAAAGGAACGATGGGAATTGAAACTCACCATGG
AAAAAGAATTCTCACAAATGTTCAGTATGTGCCCGATATTGGATATAATTTGCTGAGTGTCGGACAACTAATGGATAGTGGGCATTCTATCTTGTTTGAGGATGGTGCGT
GCTTGATAAAAAATAAGCAAACGGGACGAGTTTTGGCAAAAGTAAAGATGACTCAAAGCAAAATGTTTCCGCTGGAAGTCTCAAATGTGGAAAATTTTGCTCTTACTGCT
ACTACTACAACAACTAATACAACGAAGATCAACTCGGAGCTATGGCATTTAAGTATGTGTTCCGAAAATAAGGGATCACCCATTCATAACATCAATCAGCGAAAGGACGT
GCAAGAAATTGGATATAATGCAGTCCGCATACACAACGAAGAAAAACCAGACACTTTGATTTTCCTTCGTGTGATAAACGGCCTGGAGGATGTAAATGATACTTGCAAGT
CGTATACTCTGGTGGTGGAAGCTATAAATAAGGATAAAATTATCTGGACATATGTGACTTGGATTAAAACTACAGAACCTGATGGTACCTATCAACAATCTTTTAAAGAT
CCCCTCGGGTACTACACCTAA
mRNA sequenceShow/hide mRNA sequence
ATGTGTTCCGAAAATAAGTCTGTGTCAAGGGACGTGCAAGAAATTGGACATAATGCAGTCCGCATACACAACGAAGAAAAACCAGACACTTTGATTTTCCTTCGTGTGAT
AAACTACTTGGAATATGTAAATCATACTTGCAAGAGGTATGCTATAGTGCTAGAAGCTATAAATAAGGATAAAATTATCTGGACATATGTGACTTCGATTGCAATTCCAC
GACCATCAGTCTTTGAACTCGTATCTTTTAAAGATCTCCTCGGAGATGAAAAGACAGCGGAGGTGTGGTTCATTGATAGCTGTTGTCCGAATCACATAAAAGGTTTGAAG
CCTGTATTCAAGGAGCTTAACGAAGGGGAAAAGTTGATATGGGAGCTCGAAAATGGCAAGGAGCTACAAGTCGATGGCAAAGGAACGATGGGAATTGAAACTCACCATGG
AAAAAGAATTCTCACAAATGTTCAGTATGTGCCCGATATTGGATATAATTTGCTGAGTGTCGGACAACTAATGGATAGTGGGCATTCTATCTTGTTTGAGGATGGTGCGT
GCTTGATAAAAAATAAGCAAACGGGACGAGTTTTGGCAAAAGTAAAGATGACTCAAAGCAAAATGTTTCCGCTGGAAGTCTCAAATGTGGAAAATTTTGCTCTTACTGCT
ACTACTACAACAACTAATACAACGAAGATCAACTCGGAGCTATGGCATTTAAGTATGTGTTCCGAAAATAAGGGATCACCCATTCATAACATCAATCAGCGAAAGGACGT
GCAAGAAATTGGATATAATGCAGTCCGCATACACAACGAAGAAAAACCAGACACTTTGATTTTCCTTCGTGTGATAAACGGCCTGGAGGATGTAAATGATACTTGCAAGT
CGTATACTCTGGTGGTGGAAGCTATAAATAAGGATAAAATTATCTGGACATATGTGACTTGGATTAAAACTACAGAACCTGATGGTACCTATCAACAATCTTTTAAAGAT
CCCCTCGGGTACTACACCTAA
Protein sequenceShow/hide protein sequence
MCSENKSVSRDVQEIGHNAVRIHNEEKPDTLIFLRVINYLEYVNHTCKRYAIVLEAINKDKIIWTYVTSIAIPRPSVFELVSFKDLLGDEKTAEVWFIDSCCPNHIKGLK
PVFKELNEGEKLIWELENGKELQVDGKGTMGIETHHGKRILTNVQYVPDIGYNLLSVGQLMDSGHSILFEDGACLIKNKQTGRVLAKVKMTQSKMFPLEVSNVENFALTA
TTTTTNTTKINSELWHLSMCSENKGSPIHNINQRKDVQEIGYNAVRIHNEEKPDTLIFLRVINGLEDVNDTCKSYTLVVEAINKDKIIWTYVTWIKTTEPDGTYQQSFKD
PLGYYT