CuGenDBv2

Gene ID	Tan0022514
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Gag/pol protein
Genome location	LG10:31175470..31175691
RNA-Seq Expression	Tan0022514
Synteny	Tan0022514
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008234 - cysteine-type peptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0044955.1 gag/pol protein [Cucumis melo var. makuwa]

7.1e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

KAA0048404.1 gag/pol protein [Cucumis melo var. makuwa]

7.1e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

KAA0054490.1 gag/pol protein [Cucumis melo var. makuwa]

7.1e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

TYK14550.1 gag/pol protein [Cucumis melo var. makuwa]

7.1e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

XP_022158197.1 uncharacterized protein LOC111024734 [Momordica charantia]

4.2e-22

79.45

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ+MFGQPS Q RHE+LK+VYNSRM EGSSVREHVL+LMVHFNVAE N  VID+QSQ SFILESLPK+FL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

TrEMBL top hits

e value

%identity

Alignment

A0A5A7SMH8 Gag/pol protein

3.4e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

A0A5A7TU93 Gag/pol protein

3.4e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

A0A5A7V4M1 Gag/pol protein

3.4e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

A0A5D3CPJ6 Gag/pol protein

3.4e-22

75.34

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ MFGQ S Q++H++LKY+YN+RMNEG+SVREHVL++MVHFNVAEMN AVID+ SQVSFILESLP+SFL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

A0A6J1DWL0 uncharacterized protein LOC111024734

2.0e-22

79.45

Show/hide

Query:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL
        M  LQ+MFGQPS Q RHE+LK+VYNSRM EGSSVREHVL+LMVHFNVAE N  VID+QSQ SFILESLPK+FL
Subjt:  MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGTTTGTTGCAGAACATGTTTGGACAACCGTCTGGACAGCTTCGACACGAATCCCTCAAGTACGTTTATAACTCCCGTATGAATGAGGGGTCGTCGGTGAGAGAACA
CGTTCTCGATCTGATGGTCCACTTTAACGTGGCTGAAATGAACGACGCAGTCATAGATAAGCAAAGTCAGGTGTCGTTCATCCTGGAATCTCTTCCGAAGAGTTTCTTGT
AA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSLLQNMFGQPSGQLRHESLKYVYNSRMNEGSSVREHVLDLMVHFNVAEMNDAVIDKQSQVSFILESLPKSFL

Tan0022514 (gene) of Snake gourd v1 genome