CuGenDBv2

Gene ID	Spg002304
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Gag-protease polyprotein
Genome location	scaffold1:30174361..30179718
RNA-Seq Expression	Spg002304
Synteny	Spg002304
Gene Ontology terms	GO:0006278 - RNA-dependent DNA biosynthetic process (biological process) GO:0006508 - proteolysis (biological process) GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0003964 - RNA-directed DNA polymerase activity (molecular function) GO:0008233 - peptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0026081.1 pol protein [Cucumis melo var. makuwa]

6.8e-12

75.56

Show/hide

Query:  RDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDF
        RDCPLIC GESGQ  DSI LSF GQDR+GSW+HN+TRWN L+P F
Subjt:  RDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDF

KAA0026081.1 pol protein [Cucumis melo var. makuwa]

6.6e+01

33.33

Show/hide

Query:  GQKRKHEQTTTNLQRSQHSSESSRQKTQRDKQEGNG--NDKPKCNSCGRQHWGQCMAGKGVCFKCHQEGHMANFQPTAALVSSS
        GQKRK E     + +         Q+ +R+         + P C  CGR H G C+AG GVCF+C Q GH  +  P   + ++S
Subjt:  GQKRKHEQTTTNLQRSQHSSESSRQKTQRDKQEGNG--NDKPKCNSCGRQHWGQCMAGKGVCFKCHQEGHMANFQPTAALVSSS

KAA0026081.1 pol protein [Cucumis melo var. makuwa]

4.6e-08

80.56

Show/hide

Query:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH
        M+ RDCPLIC GESGQ  DSI LSFWGQDRVG WKH
Subjt:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH

KAA0047821.1 uncharacterized protein E6C27_scaffold133G00730 [Cucumis melo var. makuwa]

1.1e-12

67.31

Show/hide

Query:  DCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEEVDECSL
        DCPLI   ESGQ  DS+ LSFWGQDRV SW+HNHTRWNSL+P F E+ + S+
Subjt:  DCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEEVDECSL

KAA0049822.1 reverse transcriptase [Cucumis melo var. makuwa]

4.6e-08

80.56

Show/hide

Query:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH
        M+ RDCPLIC GESGQ  DSI LSFWGQDRVG WKH
Subjt:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH

TYK05792.1 gag/pol protein [Cucumis melo var. makuwa]

3.9e-15

Show/hide

Query:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEE
        M+ RDCPL C GESGQ  DSI LSFWGQDRVGSW+HNHTRWNS IP F +
Subjt:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEE

TrEMBL top hits

e value

%identity

Alignment

A0A5A7SPG1 Pol protein

3.3e-12

75.56

Show/hide

Query:  RDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDF
        RDCPLIC GESGQ  DSI LSF GQDR+GSW+HN+TRWN L+P F
Subjt:  RDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDF

A0A5A7SPG1 Pol protein

3.2e+01

33.33

Show/hide

Query:  GQKRKHEQTTTNLQRSQHSSESSRQKTQRDKQEGNG--NDKPKCNSCGRQHWGQCMAGKGVCFKCHQEGHMANFQPTAALVSSS
        GQKRK E     + +         Q+ +R+         + P C  CGR H G C+AG GVCF+C Q GH  +  P   + ++S
Subjt:  GQKRKHEQTTTNLQRSQHSSESSRQKTQRDKQEGNG--NDKPKCNSCGRQHWGQCMAGKGVCFKCHQEGHMANFQPTAALVSSS

A0A5A7SPG1 Pol protein

2.2e-08

80.56

Show/hide

Query:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH
        M+ RDCPLIC GESGQ  DSI LSFWGQDRVG WKH
Subjt:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH

A0A5A7U2P4 Integrase catalytic domain-containing protein

5.1e-13

67.31

Show/hide

Query:  DCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEEVDECSL
        DCPLI   ESGQ  DS+ LSFWGQDRV SW+HNHTRWNSL+P F E+ + S+
Subjt:  DCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEEVDECSL

A0A5D3C3J6 Gag/pol protein

1.9e-15

Show/hide

Query:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEE
        M+ RDCPL C GESGQ  DSI LSFWGQDRVGSW+HNHTRWNS IP F +
Subjt:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEE

A0A5D3CBX3 Reverse transcriptase

2.2e-08

80.56

Show/hide

Query:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH
        M+ RDCPLIC GESGQ  DSI LSFWGQDRVG WKH
Subjt:  MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKH

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTCACGAGGGATTGTCCTTTGATTTGTATGGGTGAGAGTGGTCAGTACACTGACTCAATAAGCCTATCATTTTGGGGACAAGACCGAGTGGGGAGCTGGAAACATAA
TCACACAAGATGGAATTCACTCATTCCGGACTTTGAGGAAGTAGATGAGTGTTCCCTTAAGTGGTGTCTCCGGGTCTTGAACAAAGGGCCCTACCCAGTCACTGACCCGA
GAGGGATTTCTATTTGGTGGTTAGACCACAAACAGCGTCGAGACGCCACAGACTTTAGTCTTCGTGTGAATTTTGCGTCGGCGTCGAGACGCCAGGGGCAGCGTCTCTAC
GGCGTCCCTAGTTCGAGCTTGCTGCTTTCTTCTCGGCCTTGTCTCGCTTCATCTCGGTATGGGGCTCCAATCTTCGGCTTTTGGTGTCGTTCTTCAGGACCCCTAGGGTG
GGGTGAAAGGCATCCCATTCATTCTCTCTCAGAGAATTCCCCTGAAGGCTCCCACCAGTCTTCTGCCACTAGAAGTCTCAGAGTCATACCGGTCCTAGTTGGTGATAAGC
TTGAAGTCAATGCAACTCTAGTAGCCAAGGAGTCGGAGCTCAACGCAGGACAGAAAAGGAAACACGAGCAGACAACTACCAACCTCCAGCGATCTCAACACTCATCCGAA
AGTTCTAGACAGAAAACTCAGCGTGACAAACAAGAGGGCAACGGTAACGATAAACCGAAGTGCAACTCTTGTGGAAGACAACATTGGGGTCAGTGCATGGCAGGGAAGGG
TGTGTGTTTTAAATGTCACCAGGAAGGGCATATGGCAAATTTTCAGCCAACAGCAGCCCTTGTTTCTTCTTCTCGGCCGGCAATCACAGCAGTCTTCATCTCCGGCGATC
CTTCTTCCGACGAGTGGTTGCACGGCGGCGGCGCTCGCGATTCCAACCGCAACCCTCAAGTTCAACAGCAGCAGTGTCTTCTTCGTGGTTCAGGCGGTAGCTTCGTTCGG
CAACTTGTGACAGCAAGCAGCGGCGCGGCAGACACGACTCACAGCGGGCATTCGCGGGTGTTGGCAGCGTCGGTTTCAGCAAGGTGCAGTGGCGCGTGTTCTTTTTCGAT
GAGCTCCCTTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFTRDCPLICMGESGQYTDSISLSFWGQDRVGSWKHNHTRWNSLIPDFEEVDECSLKWCLRVLNKGPYPVTDPRGISIWWLDHKQRRDATDFSLRVNFASASRRQGQRLY
GVPSSSLLLSSRPCLASSRYGAPIFGFWCRSSGPLGWGERHPIHSLSENSPEGSHQSSATRSLRVIPVLVGDKLEVNATLVAKESELNAGQKRKHEQTTTNLQRSQHSSE
SSRQKTQRDKQEGNGNDKPKCNSCGRQHWGQCMAGKGVCFKCHQEGHMANFQPTAALVSSSRPAITAVFISGDPSSDEWLHGGGARDSNRNPQVQQQQCLLRGSGGSFVR
QLVTASSGAADTTHSGHSRVLAASVSARCSGACSFSMSSL

Spg002304 (gene) of Sponge gourd (cylindrica) v1 genome