CuGenDBv2

Gene ID	Lag0034853
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Retrovirus-related Pol polyprotein from transposon TNT 1-94
Genome location	chr3:11639370..11643326
RNA-Seq Expression	Lag0034853
Synteny	Lag0034853
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0016020 - membrane (cellular component) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function) GO:0016779 - nucleotidyltransferase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KZV33171.1 Integrase, catalytic core domain containing protein [Dorcoceras hygrometricum]

5.9e-48

66.03

Show/hide

Query:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI
        L ENR +  E+ +  A  D+S    STWYLDNG +NHMTGDK KFVELDTS+KGFVSFGDNTKV+I GK  +L E K+G HKVL DVYY+PKLTSNILSI
Subjt:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI

Query:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        GQLLE  YKI+MED  LW+RD +S L+A+V MTKN MF L+LK+ G  CLKS V D
Subjt:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

KZV34378.1 Integrase, catalytic core domain containing protein [Dorcoceras hygrometricum]

2.8e-50

69.23

Show/hide

Query:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI
        L ENR +  E+ +  A KD+S    STWYLDNGASNHMTGDK KFVELDTS+KGFVSFGDNTKV+I GKG +L E K+G HKVL DV Y+PKLTSNILSI
Subjt:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI

Query:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        GQLLE  YKI+M D  LW+RD +S L+AKV MTKNRMFLL+LK+ G  CLKS V D
Subjt:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

KZV44615.1 hypothetical protein F511_33023 [Dorcoceras hygrometricum]

3.7e-50

68.59

Show/hide

Query:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI
        L ENR +  E+ +  A KD+S    STWYLDNGASNHMTGDK KFVELDTS+KGFVSFGDNTKV+I GKG +L E K+G HKVL DVYY+P LTSNILSI
Subjt:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI

Query:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        GQLLE  YKI++ED  LW+RD  S L+AKV MTKNR FLL+LK+ G  CLKS V D
Subjt:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

XP_021649648.1 uncharacterized protein LOC110642034 [Hevea brasiliensis]

2.8e-42

60.84

Show/hide

Query:  EASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSIGQLLEGGYKIHMED
        +A KD   D+ S+WYLDNGASNHM G K KFVELD   K  VSF D++KV+I G+G +L+ +KDGGH ++ +VYY+PKL SNILS+GQLLE GY+I ++D
Subjt:  EASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSIGQLLEGGYKIHMED

Query:  CMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDDE
        C LWLRDQ + ++AKV M+KNRMF+LNLK   A+CLK+ V+DE
Subjt:  CMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDDE

XP_021649651.1 uncharacterized protein LOC110642036 [Hevea brasiliensis]

2.8e-42

60.84

Show/hide

Query:  EASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSIGQLLEGGYKIHMED
        +A KD   D+ S+WYLDNGASNHM G K KFVELD   K  VSF D++KV+I G+G +L+ +KDGGH ++ +VYY+PKL SNILS+GQLLE GY+I ++D
Subjt:  EASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSIGQLLEGGYKIHMED

Query:  CMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDDE
        C LWLRDQ + ++AKV M+KNRMF+LNLK   A+CLK+ V+DE
Subjt:  CMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDDE

TrEMBL top hits

e value

%identity

Alignment

A0A2I0WQY0 Retrovirus-related Pol polyprotein from transposon TNT 1-94

7.1e-39

51.59

Show/hide

Query:  VKWLGENRGWEKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILS
        V ++ E R  + I+  A K++   E  TWYLD GASNHM G +S FVELD +  G VSFGD++K+E+ GKG +L+  K+G H+ + +VY++P + SNILS
Subjt:  VKWLGENRGWEKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILS

Query:  IGQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        +GQLLE GY IH+++  L+L+D    L+AKVPM++NRMFLLN++N  AKCLK+C  D
Subjt:  IGQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

A0A2Z7BMK3 Integrase, catalytic core domain containing protein

2.9e-48

66.03

Show/hide

Query:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI
        L ENR +  E+ +  A  D+S    STWYLDNG +NHMTGDK KFVELDTS+KGFVSFGDNTKV+I GK  +L E K+G HKVL DVYY+PKLTSNILSI
Subjt:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI

Query:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        GQLLE  YKI+MED  LW+RD +S L+A+V MTKN MF L+LK+ G  CLKS V D
Subjt:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

A0A2Z7BQJ1 Integrase, catalytic core domain containing protein

1.4e-50

69.23

Show/hide

Query:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI
        L ENR +  E+ +  A KD+S    STWYLDNGASNHMTGDK KFVELDTS+KGFVSFGDNTKV+I GKG +L E K+G HKVL DV Y+PKLTSNILSI
Subjt:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI

Query:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        GQLLE  YKI+M D  LW+RD +S L+AKV MTKNRMFLL+LK+ G  CLKS V D
Subjt:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

A0A2Z7CD47 CCHC-type domain-containing protein

1.8e-50

68.59

Show/hide

Query:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI
        L ENR +  E+ +  A KD+S    STWYLDNGASNHMTGDK KFVELDTS+KGFVSFGDNTKV+I GKG +L E K+G HKVL DVYY+P LTSNILSI
Subjt:  LGENRGW--EKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSI

Query:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        GQLLE  YKI++ED  LW+RD  S L+AKV MTKNR FLL+LK+ G  CLKS V D
Subjt:  GQLLEGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

A0A445J0L7 Retrovirus-related Pol polyprotein from transposon TNT 1-94

3.5e-38

51.97

Show/hide

Query:  ENRGWEKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSIGQLL
        E  G E+ +  A ++   ++ + WYLD GASNHM GDKS FVE++    G VSFGD++K+ + GKGK+L+  K+G H+ + +VYY+P + +NILS+GQLL
Subjt:  ENRGWEKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSIGQLL

Query:  EGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD
        E GY IH+++  L+LRD    L+AKVPM+KNRMFLLN++N  AKCLK+C  D
Subjt:  EGGYKIHMEDCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTAGTTATCAAGCGACAACAACTCATCTTTCTTCTTCTCTCACTCACGAACCAACAATCCGAGGGCTATCATTGATGGCCAGTTATCAAGTGAACGAAATACACTT
ATTTTTTTTAGTTGGAGAAAATCGTTGTCGTTGTGCCTTGTTCGCCGTCGTCGTCACCTTCGTCGTGCCTGTCTCTTTCGCCGTCGCCTTCGTCGTGCCTGTCGCTTTCA
CCGTCGCCTTCGTCGTGCCTGTCGCTTTTGTCGTCGCCTTCGTCTTCGTCGTGCCTATCGTTGTCGTCGTCGCCTCCGTCGTGCCTGTCGCCGTCGCCGTGAAGTGGTTG
GGAGAAAATCGTGGTTGGGAGAAAATCGTGGAGGAGGCTTCAAAGGATGATTCCATTGATGAGACAAGCACCTGGTATCTTGACAATGGTGCTAGCAATCATATGACAGG
TGATAAAAGCAAATTTGTGGAGCTTGATACAAGCAAGAAAGGCTTTGTAAGCTTTGGTGACAACACGAAGGTGGAGATCATGGGCAAAGGTAAAGTTTTGGTTGAGACAA
AAGATGGAGGCCATAAAGTTCTTTGTGATGTTTATTACATTCCAAAGTTGACTAGTAATATTCTAAGTATTGGTCAACTTTTGGAAGGAGGCTACAAGATTCACATGGAG
GATTGTATGCTTTGGCTTAGAGACCAAGAGTCCAAACTTGTAGCCAAAGTGCCAATGACCAAAAATCGGATGTTCTTGTTGAACTTGAAGAATGGTGGTGCCAAGTGCTT
GAAAAGTTGTGTTGATGATGAAGGGAATAAAAGTCCCCACGCAGCGGAAGCGCAACGATTGGACCTTACGCCGTATATTAATTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASYQATTTHLSSSLTHEPTIRGLSLMASYQVNEIHLFFLVGENRCRCALFAVVVTFVVPVSFAVAFVVPVAFTVAFVVPVAFVVAFVFVVPIVVVVASVVPVAVAVKWL
GENRGWEKIVEEASKDDSIDETSTWYLDNGASNHMTGDKSKFVELDTSKKGFVSFGDNTKVEIMGKGKVLVETKDGGHKVLCDVYYIPKLTSNILSIGQLLEGGYKIHME
DCMLWLRDQESKLVAKVPMTKNRMFLLNLKNGGAKCLKSCVDDEGNKSPHAAEAQRLDLTPYIN

Lag0034853 (gene) of Sponge gourd (AG-4) v1 genome