CuGenDBv2

Gene ID	Tan0004975
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Transposon Ty3-I Gag-Pol polyprotein
Genome location	LG01:81941798..81962615
RNA-Seq Expression	Tan0004975
Synteny	Tan0004975
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0051908.1 putative gag protein [Cucumis melo var. makuwa]

3.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

TYK02449.1 F15O4.13 [Cucumis melo var. makuwa]

3.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

TYK21797.1 uncharacterized protein E5676_scaffold991G00010 [Cucumis melo var. makuwa]

1.0e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R+ QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

TYK22420.1 Transposon Ty3-I Gag-Pol polyprotein [Cucumis melo var. makuwa]

3.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

TYK26105.1 F15O4.13 [Cucumis melo var. makuwa]

3.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

TrEMBL top hits

e value

%identity

Alignment

A0A5A7U9D0 Putative gag protein

1.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

A0A5A7VII0 Uncharacterized protein

1.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

A0A5D3C3D3 F15O4.13

1.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

A0A5D3DDM5 Uncharacterized protein

5.0e-15

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R+ QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

A0A5D3DRJ1 F15O4.13

1.9e-14

67.11

Show/hide

Query:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN
        MS D  E+VP+V+DPN+AILQ IQG++E+MREER+ERRAQQQRE R  QEDE MFDL   ER LGGRGN     RN
Subjt:  MSQDNKEKVPQVVDPNMAILQGIQGVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRN

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAACAAACAATTGATCCATTGCATGTATCTGAAGGAGCAATAACAAGGAGCAAGACCAAGAATATTCAAGAGGCTTCCACATTGCATCTCCAAAAGCTCGTTAATGC
ACATGGAGAGATAAAGATATTTGAGCCCAAAATTATTTATAATATGGCACGAGAAAAGTTGTGTAGTTTGAAAGATGGCACGGTGGACAAAAAAAGTATTCATTGGATTA
GCCCCGATCAAGCTAATTCTGGAGTTCTTATAAAAAATATGTCACAAGATAATAAAGAAAAAGTTCCGCAAGTGGTAGATCCAAATATGGCTATTCTTCAAGGAATTCAA
GGTGTGATGGAGATGATGAGGGAAGAAAGAGAAGAAAGGAGAGCACAACAACAAAGAGAAGAACGAATCTTGCAAGAAGATGAATGCATGTTTGATTTACAGGTACAAGA
AAGAAACTTAGGAGGAAGAGGAAATGATAGTTTTGTGAATAGGAATGAACCGACACAACAAAGAAGCATGTTTGTTGCTGTCAAAAGAGTGGAGGCGGAAAGCTCCAATG
CTAAAAAGAATGAAGCTTCAAAGGAGAAATTTACTTTACTTCCATTGTCTCCATATGAAGTACATTGTGATCATTTGAAATTAGAGAAGAAAAGAAAAGAACTTGAACAA
AAGGCCCGACCCGCTCATTGGCCCGAGAGGGACTCTGTTTTTAGTGTTACGAACATTCGTGAAGGATTGACTTGTTGTTATTGGTCAATATCCGTGGACACAGAAATATA
TCTGCAGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKQTIDPLHVSEGAITRSKTKNIQEASTLHLQKLVNAHGEIKIFEPKIIYNMAREKLCSLKDGTVDKKSIHWISPDQANSGVLIKNMSQDNKEKVPQVVDPNMAILQGIQ
GVMEMMREEREERRAQQQREERILQEDECMFDLQVQERNLGGRGNDSFVNRNEPTQQRSMFVAVKRVEAESSNAKKNEASKEKFTLLPLSPYEVHCDHLKLEKKRKELEQ
KARPAHWPERDSVFSVTNIREGLTCCYWSISVDTEIYLQ

Tan0004975 (gene) of Snake gourd v1 genome