CuGenDBv2

Gene ID	Tan0022408
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Gag/pol protein
Genome location	LG09:6684761..6688170
RNA-Seq Expression	Tan0022408
Synteny	Tan0022408
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0046201.1 gag/pol protein [Cucumis melo var. makuwa]

1.1e-34

71.03

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M++SI+ LLAS KL  DN+ TWK N+NTILV +DL+FVLTEECPQ P+STA+R+VR+AYDRW+K NEKA+VYIIAN+S+VLAKKHE + TAKEIMDSL  
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQQSF
        MFGQ S+
Subjt:  MFGQQSF

KAA0048103.1 gag/pol protein [Cucumis melo var. makuwa]

3.3e-34

71.15

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M+S I+ LLAS+KL RDN+ TWK+N+NTILV DDL+FVLTEECPQ P+S A+R+ R+AYDRWIK NEKA+VYI+A++S+VLAKKHE + TAKEIMDSL+ 
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQ
        MFGQ
Subjt:  MFGQ

XP_022158568.1 uncharacterized protein LOC111025021 [Momordica charantia]

8.1e-33

67.59

Show/hide

Query:  KNMSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSL
        K MS+S I LLASDKL  DN+  WK+N+NTILV DDL+FVLTEECP  P+  A+R+VRDAYDRW+K NEKA+VYI+A++SEVL+KKHE + T +EIMDSL
Subjt:  KNMSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSL

Query:  QDMFGQQS
        Q +FGQ S
Subjt:  QDMFGQQS

XP_038882242.1 uncharacterized protein LOC120073466 [Benincasa hispida]

4.8e-33

68.22

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M+S ++ LLAS+ L  DN+ TWK+++NTILV DDLKFVLT+ECP +P+S A+R VRDAYDRW KVNEKA+VYI+AN+S+VLAKKHE M T+KEIM+SL+ 
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQQSF
        MFGQ SF
Subjt:  MFGQQSF

XP_038882358.1 uncharacterized protein LOC120073622 [Benincasa hispida]

1.3e-33

66.36

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M+SSII LL S+KL  DN+  WK+N+NTILV DDL+FVLTEECPQ P+S A+R+VR+AYDRW+K NEKA++YI+A++S+VLAKKHE + TAKEI+DSL++
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQQSF
        +FGQ S+
Subjt:  MFGQQSF

TrEMBL top hits

e value

%identity

Alignment

A0A5A7T0E9 Gag/pol protein

3.9e-33

68.27

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M+SSI+ LLAS KL  DN+ TWK+N+NTILV DDL+F+LTEECPQ P+S A+R+ R+AYDRWIK NEKA+VYI+A++S+VLAKKHE + T KEI+DSL+ 
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQ
        MFGQ
Subjt:  MFGQ

A0A5A7TWX1 Gag/pol protein

1.6e-34

71.15

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M+S I+ LLAS+KL RDN+ TWK+N+NTILV DDL+FVLTEECPQ P+S A+R+ R+AYDRWIK NEKA+VYI+A++S+VLAKKHE + TAKEIMDSL+ 
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQ
        MFGQ
Subjt:  MFGQ

A0A5A7TXW7 Gag/pol protein

5.5e-35

71.03

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M++SI+ LLAS KL  DN+ TWK N+NTILV +DL+FVLTEECPQ P+STA+R+VR+AYDRW+K NEKA+VYIIAN+S+VLAKKHE + TAKEIMDSL  
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQQSF
        MFGQ S+
Subjt:  MFGQQSF

A0A5D3BBF3 Gag/pol protein

5.1e-33

69.23

Show/hide

Query:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD
        M+S I+ LLAS+KL RDN+ TWK+N+NTILV DDL+FVLTEECPQ  +S A+R+ R+AYDRWIK NEKA+VYI++++S+VLAKKHE + TAKEIMDSL+ 
Subjt:  MSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQD

Query:  MFGQ
        MFGQ
Subjt:  MFGQ

A0A6J1DWG6 uncharacterized protein LOC111025021

3.9e-33

67.59

Show/hide

Query:  KNMSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSL
        K MS+S I LLASDKL  DN+  WK+N+NTILV DDL+FVLTEECP  P+  A+R+VRDAYDRW+K NEKA+VYI+A++SEVL+KKHE + T +EIMDSL
Subjt:  KNMSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSL

Query:  QDMFGQQS
        Q +FGQ S
Subjt:  QDMFGQQS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATGGGGTTGGAGACCTAATCCTGGATATACTCAGGATGCGACCGCTTTGTATTAAGATACAAACGAGAACAAAAAAGATCCTACCATCTTCCTTCTTCCAAAAGAA
GAACATCCGAGAAGCCAAGTGGTGGTGTTCGGTCTTCGTTCGAGAGAAGAGTTCGAGTAGTTTGAGATCGTTGGGAGAACACGAAGAGTTCGTGAACGGAAACGAAAATC
GAAGCACGTCTACAATAAATCTAAGAGTTAGATTGATTTTAACGAAATTCAGCTGCACAACTTCACTGCGACGATTCGATCGTCTTCCGCTGCGTGGAAGTTTCATTCCC
TTCAATTGGTATCAGAGCCATACGTTGGTTCTTTGTTGTGCACTGTTTTTCGGTAAAATTAGGCATTTTGTTGTAAATCGAGTCTGTAAGCTCGAGTCGTTCGTGGCAAG
AGTTGGTGTGAAGAAATCGGAGGGGAAATGGGCGAGAATCGACGAAAAACAGCAAGAGTTTGACTTGGACCAGACAATCCCTTCGGAGGGCCTTGATCATGGGAGTCGAA
ACACCGTGAATTCTCAAAAGGGATACAGTTTCCTTGTTGTTTTGCCTTCCTGGTTCACCCTTCGGTGGCTATTGTTTGGACGGATACTTGGAAACTTAAAGATTGAGGCT
AAAAATATGTCTAGCTCAATAATCGCTTTACTTGCTTCCGACAAACTAGTGAGAGATAACTTCCAAACGTGGAAGAACAACATAAACACGATTTTAGTAACTGATGACCT
GAAGTTCGTGCTTACTGAAGAGTGTCCTCAGTTGCCGAGCTCGACTGCATCACGAAGTGTTCGTGATGCATACGATCGATGGATCAAGGTCAATGAAAAGGCCAAGGTCT
ATATCATTGCCAACTTGTCTGAAGTATTGGCAAAGAAGCATGAGTTGATGGTCACCGCCAAGGAGATCATGGATTCGTTGCAGGACATGTTTGGACAACAGTCCTTTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDGVGDLILDILRMRPLCIKIQTRTKKILPSSFFQKKNIREAKWWCSVFVREKSSSSLRSLGEHEEFVNGNENRSTSTINLRVRLILTKFSCTTSLRRFDRLPLRGSFIP
FNWYQSHTLVLCCALFFGKIRHFVVNRVCKLESFVARVGVKKSEGKWARIDEKQQEFDLDQTIPSEGLDHGSRNTVNSQKGYSFLVVLPSWFTLRWLLFGRILGNLKIEA
KNMSSSIIALLASDKLVRDNFQTWKNNINTILVTDDLKFVLTEECPQLPSSTASRSVRDAYDRWIKVNEKAKVYIIANLSEVLAKKHELMVTAKEIMDSLQDMFGQQSF

Tan0022408 (gene) of Snake gourd v1 genome