CuGenDBv2

Gene ID	Spg019224
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Integrase catalytic domain-containing protein
Genome location	scaffold1:48012897..48015016
RNA-Seq Expression	Spg019224
Synteny	Spg019224
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0026081.1 pol protein [Cucumis melo var. makuwa]

5.0e-07

76.32

Show/hide

Query:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFR
        GESGQ  DSI L F GQDR+GSWEHN TRWN LLP FR
Subjt:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFR

KAA0047821.1 uncharacterized protein E6C27_scaffold133G00730 [Cucumis melo var. makuwa]

8.2e-10

64.58

Show/hide

Query:  ESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFREVDESGVTDTR
        ESGQ ADS+ L FWGQDRV SWEHN TRWNSLLP FRE+ +  + + +
Subjt:  ESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFREVDESGVTDTR

PON59596.1 hypothetical protein PanWU01x14_158080 [Parasponia andersonii]

2.9e-07

36.27

Show/hide

Query:  TISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRAGKLFFGSLINQLCKRVKIVSGKDEERHFFKPTIDLSLTGKL-QPNIIQMKDKASTSQATPPSG
        T+S DR++LLY ++ G  IN+G +I  EI AC  +++G LFF SLI QLC+  +     +EE+      ID     ++ Q    ++  + STS+ T  S 
Subjt:  TISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRAGKLFFGSLINQLCKRVKIVSGKDEERHFFKPTIDLSLTGKL-QPNIIQMKDKASTSQATPPSG

Query:  PR
         R
Subjt:  PR

TYK05792.1 gag/pol protein [Cucumis melo var. makuwa]

5.3e-09

76.92

Show/hide

Query:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFRE
        GESGQ  DSI L FWGQDRVGSWEHN TRWNS +P FR+
Subjt:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFRE

XP_024971944.1 uncharacterized protein LOC112510826 [Cynara cardunculus var. scolymus]

1.1e-06

38.1

Show/hide

Query:  NSTISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRAGKLFFGSLINQLCKRVKIVSGKDE---ERHFFKPTIDLSLTGKLQ
        +S+ISV++++LLYC++ G  IN+G ++   IL C ++R GKLFF SLI++L  +  +    D+   +    K TID+    KL+
Subjt:  NSTISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRAGKLFFGSLINQLCKRVKIVSGKDE---ERHFFKPTIDLSLTGKLQ

TrEMBL top hits

e value

%identity

Alignment

A0A2P5CEY2 Uncharacterized protein

1.4e-07

36.27

Show/hide

Query:  TISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRAGKLFFGSLINQLCKRVKIVSGKDEERHFFKPTIDLSLTGKL-QPNIIQMKDKASTSQATPPSG
        T+S DR++LLY ++ G  IN+G +I  EI AC  +++G LFF SLI QLC+  +     +EE+      ID     ++ Q    ++  + STS+ T  S 
Subjt:  TISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRAGKLFFGSLINQLCKRVKIVSGKDEERHFFKPTIDLSLTGKL-QPNIIQMKDKASTSQATPPSG

Query:  PR
         R
Subjt:  PR

A0A392PCH7 Uncharacterized protein

2.7e-06

37.86

Show/hide

Query:  NSTISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRA--GKLFFGSLINQLCKRVKI-VSGKDE----ERHFFKPTIDLSLTGKLQPNIIQMKDKAST
        N T++  R++LL+CI+ G +IN+G II  EI+ C  K++  G L+F  LI +LCK+  + VSG+DE       F +  I+  L G       Q   +A+T
Subjt:  NSTISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRA--GKLFFGSLINQLCKRVKI-VSGKDE----ERHFFKPTIDLSLTGKLQPNIIQMKDKAST

Query:  SQA
        S A
Subjt:  SQA

A0A5A7SPG1 Pol protein

2.4e-07

76.32

Show/hide

Query:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFR
        GESGQ  DSI L F GQDR+GSWEHN TRWN LLP FR
Subjt:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFR

A0A5A7U2P4 Integrase catalytic domain-containing protein

4.0e-10

64.58

Show/hide

Query:  ESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFREVDESGVTDTR
        ESGQ ADS+ L FWGQDRV SWEHN TRWNSLLP FRE+ +  + + +
Subjt:  ESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFREVDESGVTDTR

A0A5D3C3J6 Gag/pol protein

2.6e-09

76.92

Show/hide

Query:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFRE
        GESGQ  DSI L FWGQDRVGSWEHN TRWNS +P FR+
Subjt:  GESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFRE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGTGAGAGTGGCCAATTCGCCGACTCAATAAGCCTACCATTTTGGGGACAAGACCGAGTGGGGAGCTGGGAACATAATCGTACAAGATGGAATTCACTCCTTCCCGA
CTTTAGAGAAGTAGATGAGTCTGGTGTTACGGACACTCGTGAAGGACTAACTAGTCGATATTGGTCTATATCCGTGGACACAGAAAATATGTCTGCAGTGAGAAGAGTGC
AACTAAATTTCCAGCGAATAAAAGACAAGAGGGCTGCTGCGTTTTTGTTCGTTGAAGCGTCGTTGGCGAAGAACGGTCAAGTCTACAACGAAGGTCCAAACGATGCTCTT
CCGCTGCGTGGGGCTTTTATCCCCTTCAACAGCACCATCTCAGTAGATAGAGTTATGCTCCTCTACTGCATCATGAAGGGGTTGGAGATCAACATTGGGAGCATAATTAG
GGATGAAATTCTAGCCTGTGGAAGGAAACGAGCAGGTAAACTTTTCTTTGGATCACTTATCAACCAGCTTTGCAAAAGGGTGAAGATAGTTTCGGGCAAGGACGAGGAGC
GTCATTTCTTCAAGCCGACCATTGACCTGTCCTTGACCGGGAAGCTCCAACCGAACATCATCCAAATGAAAGACAAAGCCTCCACATCTCAGGCCACTCCACCATCAGGG
CCGAGGATGAGGCCATTAGAGAGTTCTATCTCTCTATTGCCCCCGAGTATTGCTCCAGTCTTTTCCAATTTCCCTCAGTCGCTGCTGCCTCAAGAAGACAAGCATTCCGA
TGAGGAAGATGATGAAAATGATGATGAAGAAGTTGAAGAGAAAGAGACTTCCTCGGACGAGGACTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGESGQFADSISLPFWGQDRVGSWEHNRTRWNSLLPDFREVDESGVTDTREGLTSRYWSISVDTENMSAVRRVQLNFQRIKDKRAAAFLFVEASLAKNGQVYNEGPNDAL
PLRGAFIPFNSTISVDRVMLLYCIMKGLEINIGSIIRDEILACGRKRAGKLFFGSLINQLCKRVKIVSGKDEERHFFKPTIDLSLTGKLQPNIIQMKDKASTSQATPPSG
PRMRPLESSISLLPPSIAPVFSNFPQSLLPQEDKHSDEEDDENDDEEVEEKETSSDED

Spg019224 (gene) of Sponge gourd (cylindrica) v1 genome