CuGenDBv2

Gene ID	CSPI07G00620
Organism	Cucumis sativus L. var. sativus cv. PI 183967 (Cucumber (PI 183967) v1)
Description	Retrotran_gag_3 domain-containing protein
Genome location	Chr7:662073..665021
RNA-Seq Expression	CSPI07G00620
Synteny	CSPI07G00620
Gene Ontology terms	NA
InterPro domains	IPR029472 - Retrotransposon Copia-like, N-terminal

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0049700.1 T4.5 [Cucumis melo var. makuwa]

1.7e-231

90.24

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKL+GF+DGTNPCP    + S+TSTVPPQ+NP YEDWIAKDQALMTVINATLSPEALAY
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY

Query:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
        VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
Subjt:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE

Query:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF
        LHVLLRAEESALAKQSK DDSYNQPTVLLSSSQSLLSCAPTF+NNFVRGNGHGK+YGHGRFSFDAQTRGHG S EQK VHDNHATCQICSRRGHTALDCF
Subjt:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF

Query:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSYFSLSNLLPPVCCS
        NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNT ITSDMNYVSLAPEYNGEEQVG+GNGQTRP+SH              S  LPPVCCS
Subjt:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSYFSLSNLLPPVCCS

Query:  TVANVADKSSFAYIAVLHNFVVSLLHLPFTSNKGISNSSWPLAQQVSHNRFVPLTMHDGKL
        TVA VADKSSFA+IAVL  FVV LLHLP+TSNKGISNSSWPLAQQVSHN FVPLTM DGK+
Subjt:  TVANVADKSSFAYIAVLHNFVVSLLHLPFTSNKGISNSSWPLAQQVSHNRFVPLTMHDGKL

KAE8645659.1 hypothetical protein Csa_020439 [Cucumis sativus]

7.8e-213

98.44

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVV
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVV
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVV

Query:  GSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELH
        GSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELH
Subjt:  GSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELH

Query:  VLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNR
        VLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNR
Subjt:  VLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNR

Query:  MNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS
        MNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSG    E +S
Subjt:  MNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS

XP_008448007.1 PREDICTED: uncharacterized protein LOC103490319 isoform X2 [Cucumis melo]

4.0e-201

93.52

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKL+GF+DGTNPCP    + S+TSTVPPQ+NP YEDWIAKDQALMTVINATLSPEALAY
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY

Query:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
        VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
Subjt:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE

Query:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF
        LHVLLRAEESALAKQSK DDSYNQPTVLLSSSQSLLSCAPTF+NNFVRGNGHGK+YGHGRFSFDAQTRGHG S EQK VHDNHATCQICSRRGHTALDCF
Subjt:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF

Query:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS
        NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNT ITSDMNYVSLAPEYNGEEQVG+GNGQTRP+SHSG   FE +S
Subjt:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS

XP_011658579.1 uncharacterized protein LOC105436058 [Cucumis sativus]

1.3e-212

100

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVV
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVV
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVV

Query:  GSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELH
        GSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELH
Subjt:  GSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELH

Query:  VLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNR
        VLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNR
Subjt:  VLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNR

Query:  MNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSG
        MNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSG
Subjt:  MNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSG

XP_016900446.1 PREDICTED: uncharacterized protein LOC103490319 isoform X1 [Cucumis melo]

4.0e-201

93.52

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKL+GF+DGTNPCP    + S+TSTVPPQ+NP YEDWIAKDQALMTVINATLSPEALAY
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY

Query:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
        VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
Subjt:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE

Query:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF
        LHVLLRAEESALAKQSK DDSYNQPTVLLSSSQSLLSCAPTF+NNFVRGNGHGK+YGHGRFSFDAQTRGHG S EQK VHDNHATCQICSRRGHTALDCF
Subjt:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF

Query:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS
        NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNT ITSDMNYVSLAPEYNGEEQVG+GNGQTRP+SHSG   FE +S
Subjt:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BI58 uncharacterized protein LOC103490319 isoform X2

1.9e-201

93.52

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKL+GF+DGTNPCP    + S+TSTVPPQ+NP YEDWIAKDQALMTVINATLSPEALAY
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY

Query:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
        VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
Subjt:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE

Query:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF
        LHVLLRAEESALAKQSK DDSYNQPTVLLSSSQSLLSCAPTF+NNFVRGNGHGK+YGHGRFSFDAQTRGHG S EQK VHDNHATCQICSRRGHTALDCF
Subjt:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF

Query:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS
        NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNT ITSDMNYVSLAPEYNGEEQVG+GNGQTRP+SHSG   FE +S
Subjt:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS

A0A1S3BIR3 uncharacterized protein LOC103490319 isoform X3

1.6e-200

94.71

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKL+GF+DGTNPCP    + S+TSTVPPQ+NP YEDWIAKDQALMTVINATLSPEALAY
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY

Query:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
        VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
Subjt:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE

Query:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF
        LHVLLRAEESALAKQSK DDSYNQPTVLLSSSQSLLSCAPTF+NNFVRGNGHGK+YGHGRFSFDAQTRGHG S EQK VHDNHATCQICSRRGHTALDCF
Subjt:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF

Query:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSG
        NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNT ITSDMNYVSLAPEYNGEEQVG+GNGQTRP+SHSG
Subjt:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSG

A0A1S4DWT9 uncharacterized protein LOC103490319 isoform X1

1.9e-201

93.52

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKL+GF+DGTNPCP    + S+TSTVPPQ+NP YEDWIAKDQALMTVINATLSPEALAY
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY

Query:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
        VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
Subjt:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE

Query:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF
        LHVLLRAEESALAKQSK DDSYNQPTVLLSSSQSLLSCAPTF+NNFVRGNGHGK+YGHGRFSFDAQTRGHG S EQK VHDNHATCQICSRRGHTALDCF
Subjt:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF

Query:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS
        NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNT ITSDMNYVSLAPEYNGEEQVG+GNGQTRP+SHSG   FE +S
Subjt:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSS

A0A5D3CLI6 T4.5

8.1e-232

90.24

Show/hide

Query:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY
        AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKL+GF+DGTNPCP    + S+TSTVPPQ+NP YEDWIAKDQALMTVINATLSPEALAY
Subjt:  AEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCP--QTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAY

Query:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
        VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE
Subjt:  VVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEE

Query:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF
        LHVLLRAEESALAKQSK DDSYNQPTVLLSSSQSLLSCAPTF+NNFVRGNGHGK+YGHGRFSFDAQTRGHG S EQK VHDNHATCQICSRRGHTALDCF
Subjt:  LHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCF

Query:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSYFSLSNLLPPVCCS
        NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNT ITSDMNYVSLAPEYNGEEQVG+GNGQTRP+SH              S  LPPVCCS
Subjt:  NRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSYFSLSNLLPPVCCS

Query:  TVANVADKSSFAYIAVLHNFVVSLLHLPFTSNKGISNSSWPLAQQVSHNRFVPLTMHDGKL
        TVA VADKSSFA+IAVL  FVV LLHLP+TSNKGISNSSWPLAQQVSHN FVPLTM DGK+
Subjt:  TVANVADKSSFAYIAVLHNFVVSLLHLPFTSNKGISNSSWPLAQQVSHNRFVPLTMHDGKL

A0A6J1D9L6 uncharacterized protein LOC111018892

3.5e-118

56.35

Show/hide

Query:  QFADLSSRTGSVYISTSVGVQIQPLPFRAEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQ---------TSPSTTS
        QF  +S    SV+  TS            +KD  SPIFLLSNICNL+S+RLDST+F+LWKFQLTAILKAHKLFGF+DG+   P           S  TT+
Subjt:  QFADLSSRTGSVYISTSVGVQIQPLPFRAEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQ---------TSPSTTS

Query:  TVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFI
        T  P  NP +EDWIAKDQALMT+INATLS EALAYVV S +SKQVW+VL K YSS SR+NVVNLKSDLQ+I KK +ESIDAY+KRIKEIKDK ANVS  I
Subjt:  TVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFI

Query:  NEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDA
        N+E LLIYALNGL  EYNT  TSMRTR+Q V+FEELHV +++EESA+ KQ K +D   QP  L +SS    +    F+ N     G GKN G G+ +F  
Subjt:  NEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDA

Query:  QTRGHGLSQEQKPVH-----DNHATCQICSRRGHTALDCFNRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSS---LTDSGCNTHITSD---MNYVSL
             G  +           DN + CQIC + GHTALDC+NRMN++FQGRHPP QLAAMVA QNN++L++ NSS    L DS CNTH+T+D   ++  S+
Subjt:  QTRGHGLSQEQKPVH-----DNHATCQICSRRGHTALDCFNRMNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSS---LTDSGCNTHITSD---MNYVSL

Query:  APEYNGEEQVGVGNGQTRPISHSGSDTFEPSSY
        A +YNGEE + VG+GQ+ PI+H G      S+Y
Subjt:  APEYNGEEQVGVGNGQTRPISHSGSDTFEPSSY

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

7.5e-33

27.49

Show/hide

Query:  RLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTST-VPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGS
        +L STN+++W  Q+ A+   ++L GF+DG+   P   P+T  T   P+ NP Y  W  +D+ + + +   +S      V  +T++ Q+W+ L K+Y++ S
Subjt:  RLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTST-VPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGS

Query:  RSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRAEESALAKQSKCDDSY
          +V  L++ L+  + K  ++ID Y++ +    D+LA +   ++ ++ +   L  LP EY      +  +  P T  E+H  L   ES +   S      
Subjt:  RSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRAEESALAKQSKCDDSY

Query:  NQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGK-----NYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNRMNY--NFQGRHPPQQ
           TV+  ++ ++     T  NN   GN + +     N  + +    + T  H  + + KP       CQIC  +GH+A  C    ++  +   + PP  
Subjt:  NQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGK-----NYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNRMNY--NFQGRHPPQQ

Query:  LAAMVASQNNAFLSIVNSSS-LTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSY-FSLSNLLPPVCCSTVANVADKSSFAY
                N A  S  +S++ L DSG   HITSD N +SL   Y G + V V +G T PISH+GS +    S   +L N+L                  Y
Subjt:  LAAMVASQNNAFLSIVNSSS-LTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSY-FSLSNLLPPVCCSTVANVADKSSFAY

Query:  IAVLHNFVVSLLHLPFTSNKGISNSSWPLAQQVSH-NRFVPLTMHDGKLND
        +  +H  ++S+  L   +  G+S   +P + QV   N  VPL    GK  D
Subjt:  IAVLHNFVVSLLHLPFTSNKGISNSSWPLAQQVSH-NRFVPLTMHDGKLND

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

3.0e-26

26.12

Show/hide

Query:  RLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTST-VPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGS
        +L STN+++W  Q+ A+   ++L GF+DG+ P P   P+T  T   P+ NP Y  W  +D+ + + I   +S      V  +T++ Q+W+ L K+Y++ S
Subjt:  RLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTST-VPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGS

Query:  RSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRAEESALAKQSKCDDSY
          +V  L+                +I R     D+LA +   ++ ++ +   L  LP++Y      +  +  P +  E+H  L   ES L   +  +   
Subjt:  RSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRAEESALAKQSKCDDSY

Query:  NQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDA-QTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNRMNYNFQGRHPPQQLAAMVA
             ++  + ++++   T  N      G  +NY +     ++ Q    G   + +        CQICS +GH+A  C     + FQ     QQ  +   
Subjt:  NQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDA-QTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNRMNYNFQGRHPPQQLAAMVA

Query:  ----SQNNAFLSIVNSSS-LTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSYFSLSNLLPPVCCSTVANVADKSSFAYIAV
              N A  S  N+++ L DSG   HITSD N +S    Y G + V + +G T PI+H+GS +  P+S  SL                D +   Y+  
Subjt:  ----SQNNAFLSIVNSSS-LTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSYFSLSNLLPPVCCSTVANVADKSSFAYIAV

Query:  LHNFVVSLLHLPFTSNKGISNSSWPLAQQVSH-NRFVPLTMHDGKLND
        +H  ++S+  L  T+   +S   +P + QV   N  VPL    GK  D
Subjt:  LHNFVVSLLHLPFTSNKGISNSSWPLAQQVSH-NRFVPLTMHDGKLND

Arabidopsis top hits

e value

%identity

Alignment

AT1G21280.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162); Has 707 Blast hits to 705 proteins in 25 species: Archae - 0; Bacteria - 0; Metazoa - 4; Fungi - 0; Plants - 703; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink).

3.6e-06

22.48

Show/hide

Query:  DSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGSRSN
        D  N+V WK +  + L+  K FGF+DGT P            P   +PLY+ W   +  +M  +  +++ + L  V+ + ++ ++W+ L +++       
Subjt:  DSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGSRSN

Query:  VVNLKSDLQTIYKKPDESIDAYIKRIKEI
        +  L+  L T+ ++  +S++ Y  ++ ++
Subjt:  VVNLKSDLQTIYKKPDESIDAYIKRIKEI

AT1G34070.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162)

4.8e-11

24.46

Show/hide

Query:  IFLLSNICNLISMRLD--STNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEAL-AYVVGSTSS
        I+ +SNI + I + LD   +N+  W+        +  + G +DGT             +P   N +  +W  +D  +   +  TL+P+      V S++S
Subjt:  IFLLSNICNLISMRLD--STNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKDQALMTVINATLSPEAL-AYVVGSTSS

Query:  KQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRA
        + +W  +   + +   +  + L S+L+T     D  +  Y +++K++ D L NV   + + +L++Y LNGL  +++     ++ R    +F++   +L+ 
Subjt:  KQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTRSQPVTFEELHVLLRA

Query:  EESALAKQSKCDDSYNQPTVLLSSSQSLLSC--APTFNNNFVRGNGHGKNY-GHGRFSFDAQTRGHGLSQEQKPVHDN
        EE  L +  K + ++    V  SSS ++L+C  AP    NF R  G+   Y G GR +   + RG   S    P  ++
Subjt:  EESALAKQSKCDDSYNQPTVLLSSSQSLLSC--APTFNNNFVRGNGHGKNY-GHGRFSFDAQTRGHGLSQEQKPVHDN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTCAGTTTGCTGACTTATCATCAAGAACTGGTTCTGTTTATATCAGTACATCGGTTGGTGTACAAATCCAGCCGCTACCTTTTCGTGCTGAGAAAGACTCACTTTC
ACCAATTTTTCTACTGTCCAACATTTGTAACCTGATTTCAATGAGGCTTGACTCTACAAATTTTGTCCTTTGGAAGTTCCAATTGACAGCGATTTTGAAAGCTCATAAAC
TTTTTGGCTTTGTTGATGGTACTAATCCATGTCCTCAGACTAGTCCGTCTACTACCTCGACCGTTCCGCCTCAAACGAATCCTTTATATGAAGATTGGATTGCTAAGGAT
CAGGCTCTTATGACAGTCATAAATGCTACACTTTCACCTGAGGCTTTGGCATATGTTGTTGGAAGCACTTCTTCCAAACAGGTTTGGGATGTTCTTGCAAAGCTTTATTC
TTCTGGTTCCCGGTCTAATGTGGTGAATTTGAAGTCCGATTTGCAAACTATTTACAAGAAGCCTGATGAGTCTATTGATGCCTATATTAAACGGATTAAGGAGATCAAGG
ATAAACTTGCTAATGTTTCTACTTTTATCAATGAAGAGGATCTTCTTATCTATGCTTTAAATGGCCTTCCAAATGAGTACAACACTTTCCGAACGTCAATGCGTACACGT
TCTCAACCTGTTACTTTTGAAGAACTTCATGTTCTTCTAAGAGCTGAGGAATCGGCTCTTGCAAAACAATCTAAGTGTGATGATTCGTATAATCAACCGACTGTTTTACT
CTCTTCTTCTCAATCTCTCCTGTCATGTGCTCCTACTTTCAATAACAACTTTGTTCGAGGCAACGGACATGGTAAAAATTATGGACATGGACGTTTTTCTTTCGATGCTC
AAACTCGTGGTCATGGTTTGTCTCAAGAACAAAAGCCCGTTCATGATAATCATGCAACTTGTCAGATTTGTTCACGTCGTGGCCACACTGCACTCGATTGTTTCAATCGC
ATGAACTATAATTTTCAAGGACGTCATCCTCCACAACAACTTGCTGCAATGGTTGCATCGCAAAATAATGCATTTCTATCTATTGTGAATTCGTCTTCTTTGACCGATTC
GGGTTGCAACACTCATATTACTTCAGACATGAATTATGTTTCTCTTGCACCTGAATATAATGGTGAAGAACAAGTTGGTGTTGGTAATGGACAGACTCGGCCTATTTCTC
ACTCAGGTTCTGATACTTTTGAACCTTCTTCCTATTTCTCTCTATCTAATCTTCTTCCACCAGTCTGTTGTTCTACAGTTGCTAATGTTGCTGACAAGTCTTCTTTTGCT
TATATTGCTGTTCTTCATAACTTCGTTGTTTCCTTGTTGCATTTGCCGTTTACTTCAAATAAAGGCATTTCAAACTCGAGTTGGCCTCTTGCTCAGCAAGTGTCGCACAA
TCGTTTTGTGCCACTAACCATGCATGATGGAAAGTTAAACGATGGGATAGCCAAATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAQFADLSSRTGSVYISTSVGVQIQPLPFRAEKDSLSPIFLLSNICNLISMRLDSTNFVLWKFQLTAILKAHKLFGFVDGTNPCPQTSPSTTSTVPPQTNPLYEDWIAKD
QALMTVINATLSPEALAYVVGSTSSKQVWDVLAKLYSSGSRSNVVNLKSDLQTIYKKPDESIDAYIKRIKEIKDKLANVSTFINEEDLLIYALNGLPNEYNTFRTSMRTR
SQPVTFEELHVLLRAEESALAKQSKCDDSYNQPTVLLSSSQSLLSCAPTFNNNFVRGNGHGKNYGHGRFSFDAQTRGHGLSQEQKPVHDNHATCQICSRRGHTALDCFNR
MNYNFQGRHPPQQLAAMVASQNNAFLSIVNSSSLTDSGCNTHITSDMNYVSLAPEYNGEEQVGVGNGQTRPISHSGSDTFEPSSYFSLSNLLPPVCCSTVANVADKSSFA
YIAVLHNFVVSLLHLPFTSNKGISNSSWPLAQQVSHNRFVPLTMHDGKLNDGIAK

CSPI07G00620 (gene) of Cucumber (PI 183967) v1 genome