CuGenDBv2

Gene ID	Tan0000418
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Gag/pol protein
Genome location	LG01:34021359..34052513
RNA-Seq Expression	Tan0000418
Synteny	Tan0000418
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0016021 - integral component of membrane (cellular component) GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0035445.1 putative polyprotein [Cucumis melo var. makuwa]

5.1e-07

83.78

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECP
        LLAF KL GDNY T KSNLNTILV+DD RFVLTEECP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECP

XP_022158568.1 uncharacterized protein LOC111025021 [Momordica charantia]

3.9e-07

81.58

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP
        LLA +KL GDNYG  KSNLNTILV+DD RFVLTEECPP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP

XP_022158791.1 uncharacterized protein LOC111025258 [Momordica charantia]

3.9e-07

81.58

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP
        LLA +KL GDNYG  KSNLNTILV+DD RFVLTEECPP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP

XP_038876370.1 uncharacterized protein LOC120068812, partial [Benincasa hispida]

1.0e-07

84.21

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP
        LLA  KL GDNYGT KSNLNTILV+DD RFVLTEECPP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP

XP_038904195.1 uncharacterized protein LOC120090541 [Benincasa hispida]

1.7e-07

81.58

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP
        LLA  KL GDNYGT KSN+NTILV+DD RFVLTEECPP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP

TrEMBL top hits

e value

%identity

Alignment

A0A5A7T1X5 Putative polyprotein

2.5e-07

83.78

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECP
        LLAF KL GDNY T KSNLNTILV+DD RFVLTEECP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECP

A0A6J1DFQ7 uncharacterized protein LOC111020396 isoform X3

4.2e-07

51.79

Show/hide

Query:  SLCCQLKSSSNSSVSLLSNNCNLVSVCLDTTNYVLWRYQISPLLKSHKLFKYADGS
        SLC  +++  NS + LLSN CNL+S+ LD+TN++LW++Q++ +LK+HKLF + DGS
Subjt:  SLCCQLKSSSNSSVSLLSNNCNLVSVCLDTTNYVLWRYQISPLLKSHKLFKYADGS

A0A6J1DIP4 uncharacterized protein LOC111020396 isoform X1

4.2e-07

51.79

Show/hide

Query:  SLCCQLKSSSNSSVSLLSNNCNLVSVCLDTTNYVLWRYQISPLLKSHKLFKYADGS
        SLC  +++  NS + LLSN CNL+S+ LD+TN++LW++Q++ +LK+HKLF + DGS
Subjt:  SLCCQLKSSSNSSVSLLSNNCNLVSVCLDTTNYVLWRYQISPLLKSHKLFKYADGS

A0A6J1DWG6 uncharacterized protein LOC111025021

1.9e-07

81.58

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP
        LLA +KL GDNYG  KSNLNTILV+DD RFVLTEECPP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP

A0A6J1E205 uncharacterized protein LOC111025258

1.9e-07

81.58

Show/hide

Query:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP
        LLA +KL GDNYG  KSNLNTILV+DD RFVLTEECPP
Subjt:  LLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTCGAAAAAAGTTTAGGGAACGACCGACCACTTGTTAAATTGGTCGGCATAAATGGAAAAGCCCGACCATTCTTTAAAATGGTCGGCATAAGCGAACTAAATTATCT
AATTAGGAGATTGACTAACGTCGTCATATCATTTTTCCCTTCTCTCAGTCGCCACGTCTCCCCGCATCACCACATATCCCTTTGTTGTCAATTGAAGTCATCTTCAAACT
CTTCAGTTTCTCTCCTTTCCAATAACTGCAATTTGGTTTCTGTTTGTCTGGATACAACCAATTATGTGCTTTGGCGCTATCAGATTTCACCTCTCCTCAAGTCGCACAAG
TTGTTCAAATATGCCGATGGATCGTTTAAAGCCCATGATCCGATCATTCGATTTGATGGGTCTCATAATCTGTCCTTTGATGAACTTCATGTTCTAATGAAGACTGGGGA
GAATGCGCTCGATAAACGGGCCAAGATTGATGAGGTTGCTTCTGTTTCGCATCTAGCCATGGCAGCTAATCTTGAATCTCAAGGTCGAGGGAACTGGAAACATAATGGAA
GAGTGAGAGGTCGAGTCGATAATAATAATAGATCCAGTGGGCGTGGGAGTTGTCGACGACGACCCCTCGGGGCTTGTCTTGTGGCACCGGTGGTTACAAACAATTCACTA
ATAGAATTCATTCTTTTCAAAGATGTCGAACTCTTTTATCCATTACTCGCTTTCAATAAACTCGGTGGCGACAATTATGGAACCCGGAAATCAAACTTGAATACGATTCT
TGTTCTTGATGATCCGAGGTTCGTCTTAACGGAGGAATGTCCTCCCCCCTACTCGACAAAGAAACCGAATTGTTCGGGATGCTTATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVEKSLGNDRPLVKLVGINGKARPFFKMVGISELNYLIRRLTNVVISFFPSLSRHVSPHHHISLCCQLKSSSNSSVSLLSNNCNLVSVCLDTTNYVLWRYQISPLLKSHK
LFKYADGSFKAHDPIIRFDGSHNLSFDELHVLMKTGENALDKRAKIDEVASVSHLAMAANLESQGRGNWKHNGRVRGRVDNNNRSSGRGSCRRRPLGACLVAPVVTNNSL
IEFILFKDVELFYPLLAFNKLGGDNYGTRKSNLNTILVLDDPRFVLTEECPPPYSTKKPNCSGCL

Tan0000418 (gene) of Snake gourd v1 genome