CuGenDBv2

Gene ID	Tan0004826
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Retrovirus-related Pol polyprotein from transposon TNT 1-94
Genome location	LG09:13834881..13835659
RNA-Seq Expression	Tan0004826
Synteny	Tan0004826
Gene Ontology terms	GO:0006278 - RNA-dependent DNA biosynthetic process (biological process) GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0003964 - RNA-directed DNA polymerase activity (molecular function) GO:0008194 - UDP-glycosyltransferase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

RVW19779.1 Retrovirus-related Pol polyprotein from transposon TNT 1-94 [Vitis vinifera]

2.8e-67

60.17

Show/hide

Query:  MDASSSTNGVAPTMMGSTIIK--THVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLY
        M+ +  +N   P +     IK  TH EKP+KF  ++FKRWQQK++FYL+TLNL H+LKEECP   PE  T +   A +AW H +FLCRNYIL+GL D+LY
Subjt:  MDASSSTNGVAPTMMGSTIIK--THVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLY

Query:  NVYCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELS
        NVY +++ T+R LWEAL+KKYK +DA TKKF+VGKFLD+KMID+  V+NQ+EELQI+I+ + +EG+ I+E FQVA+  EKL PSWKDFK Y KHKRKELS
Subjt:  NVYCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELS

Query:  MENLVVKLRIEEDNRKRDKSWLE--VEARAH
        ME+L+V+LRIEEDNRK DKS  +  +EA+AH
Subjt:  MENLVVKLRIEEDNRKRDKSWLE--VEARAH

RVW83338.1 Retrovirus-related Pol polyprotein from transposon TNT 1-94 [Vitis vinifera]

1.6e-67

Show/hide

Query:  TIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCNAYNTSRQLWEALDK
        T+  TH EKPEKF G  FKRWQQKM+FYL+TLNLA  L EECPI        E  AA  AW H DFLCRNY+L+GL +TLYNVYC +  T+++LW++LDK
Subjt:  TIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCNAYNTSRQLWEALDK

Query:  KYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLVVKLRIEEDNRKRDK
        KYK EDA  KKF+VGKFLD+KMID+K+V++Q++ELQ+I+ ++ S+G+ +S+ FQVAAV EKLPP WKDFK Y KHKRKE+++E L+V+LRIEEDNRK +K
Subjt:  KYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLVVKLRIEEDNRKRDK

XP_022147763.1 uncharacterized protein LOC111016620 [Momordica charantia]

2.1e-91

75.33

Show/hide

Query:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV
        M A++STN  AP MMGSTI K+H EKPEKFKGENFKRWQQKM+FY +TLNLAH++KE CP T  E +TPETEAAKQAW+H DFLC NYILS + DTLYNV
Subjt:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV

Query:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME
        YCNA++TSRQLWEALDKKYKLEDA TKKFLVGKFLDYKM+D KLVVN +EELQIIISDLQSEGL I+EPFQV  V EKL P+W++FKCY KHK+KELS+E
Subjt:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME

Query:  NLVVKLRIEEDNRKRDKSWLEVEARAH
        NL VKLRI+E+N K DK   + EA+AH
Subjt:  NLVVKLRIEEDNRKRDKSWLEVEARAH

XP_022148559.1 uncharacterized protein LOC111017193 [Momordica charantia]

2.4e-87

74.11

Show/hide

Query:  SSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCN
        +++T+  AP+MMGSTI+K+H EK EKFKGENFKRWQQKMIFY +TLNLAH+LKE CP T  E +T ETEA KQA +H +FLC NYILS L DTL+NVYCN
Subjt:  SSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCN

Query:  AYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLV
        A++TSRQLWEALDKKYKLEDA TKKFLV KFLDYK+ID KLV+NQ+EELQII SDLQSE L I+EPFQ+ AV EKLPP+W++FK Y KHKRKELSMENL 
Subjt:  AYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLV

Query:  VKLRIEEDNRKRDKSWLEVEARAH
        VKLRIEEDNRK DK   + EA+AH
Subjt:  VKLRIEEDNRKRDKSWLEVEARAH

XP_022156727.1 uncharacterized protein LOC111023572 [Momordica charantia]

3.4e-81

73.73

Show/hide

Query:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV
        M A++STN  APTMMGSTIIK H EK EKF+G+NFK WQ KMIFYL+TLNLAH+L++ CP T  E + PETEAAKQAW+H DFL  NYIL+ L  TL NV
Subjt:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV

Query:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME
        YCNA++TSRQLW+ LDKKYKLED  TKKFLVGKFLDYKM++ KLVVNQ+EELQII SDLQSEGL I+E FQVAAV E LP  W++FKCY KHKRK+LSME
Subjt:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME

Query:  NLVVKLRIEEDNRKRDK
        NL VKLRIEED RK DK
Subjt:  NLVVKLRIEEDNRKRDK

TrEMBL top hits

e value

%identity

Alignment

A0A438C9B6 Retrovirus-related Pol polyprotein from transposon TNT 1-94

1.3e-67

60.17

Show/hide

Query:  MDASSSTNGVAPTMMGSTIIK--THVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLY
        M+ +  +N   P +     IK  TH EKP+KF  ++FKRWQQK++FYL+TLNL H+LKEECP   PE  T +   A +AW H +FLCRNYIL+GL D+LY
Subjt:  MDASSSTNGVAPTMMGSTIIK--THVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLY

Query:  NVYCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELS
        NVY +++ T+R LWEAL+KKYK +DA TKKF+VGKFLD+KMID+  V+NQ+EELQI+I+ + +EG+ I+E FQVA+  EKL PSWKDFK Y KHKRKELS
Subjt:  NVYCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELS

Query:  MENLVVKLRIEEDNRKRDKSWLE--VEARAH
        ME+L+V+LRIEEDNRK DKS  +  +EA+AH
Subjt:  MENLVVKLRIEEDNRKRDKSWLE--VEARAH

A0A438HFY7 Retrovirus-related Pol polyprotein from transposon TNT 1-94

7.8e-68

Show/hide

Query:  TIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCNAYNTSRQLWEALDK
        T+  TH EKPEKF G  FKRWQQKM+FYL+TLNLA  L EECPI        E  AA  AW H DFLCRNY+L+GL +TLYNVYC +  T+++LW++LDK
Subjt:  TIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCNAYNTSRQLWEALDK

Query:  KYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLVVKLRIEEDNRKRDK
        KYK EDA  KKF+VGKFLD+KMID+K+V++Q++ELQ+I+ ++ S+G+ +S+ FQVAAV EKLPP WKDFK Y KHKRKE+++E L+V+LRIEEDNRK +K
Subjt:  KYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLVVKLRIEEDNRKRDK

A0A6J1D271 uncharacterized protein LOC111016620

1.0e-91

75.33

Show/hide

Query:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV
        M A++STN  AP MMGSTI K+H EKPEKFKGENFKRWQQKM+FY +TLNLAH++KE CP T  E +TPETEAAKQAW+H DFLC NYILS + DTLYNV
Subjt:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV

Query:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME
        YCNA++TSRQLWEALDKKYKLEDA TKKFLVGKFLDYKM+D KLVVN +EELQIIISDLQSEGL I+EPFQV  V EKL P+W++FKCY KHK+KELS+E
Subjt:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME

Query:  NLVVKLRIEEDNRKRDKSWLEVEARAH
        NL VKLRI+E+N K DK   + EA+AH
Subjt:  NLVVKLRIEEDNRKRDKSWLEVEARAH

A0A6J1D4C8 uncharacterized protein LOC111017193

1.2e-87

74.11

Show/hide

Query:  SSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCN
        +++T+  AP+MMGSTI+K+H EK EKFKGENFKRWQQKMIFY +TLNLAH+LKE CP T  E +T ETEA KQA +H +FLC NYILS L DTL+NVYCN
Subjt:  SSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCN

Query:  AYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLV
        A++TSRQLWEALDKKYKLEDA TKKFLV KFLDYK+ID KLV+NQ+EELQII SDLQSE L I+EPFQ+ AV EKLPP+W++FK Y KHKRKELSMENL 
Subjt:  AYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLV

Query:  VKLRIEEDNRKRDKSWLEVEARAH
        VKLRIEEDNRK DK   + EA+AH
Subjt:  VKLRIEEDNRKRDKSWLEVEARAH

A0A6J1DSQ3 uncharacterized protein LOC111023572

1.6e-81

73.73

Show/hide

Query:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV
        M A++STN  APTMMGSTIIK H EK EKF+G+NFK WQ KMIFYL+TLNLAH+L++ CP T  E + PETEAAKQAW+H DFL  NYIL+ L  TL NV
Subjt:  MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNV

Query:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME
        YCNA++TSRQLW+ LDKKYKLED  TKKFLVGKFLDYKM++ KLVVNQ+EELQII SDLQSEGL I+E FQVAAV E LP  W++FKCY KHKRK+LSME
Subjt:  YCNAYNTSRQLWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSME

Query:  NLVVKLRIEEDNRKRDK
        NL VKLRIEED RK DK
Subjt:  NLVVKLRIEEDNRKRDK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATGCAAGCTCCTCCACTAATGGTGTTGCTCCTACAATGATGGGATCAACCATCATCAAAACTCATGTTGAAAAACCAGAGAAATTCAAAGGAGAAAACTTCAAGAG
ATGGCAACAGAAGATGATCTTCTACCTCTCAACATTGAACCTTGCTCACCTCTTGAAGGAAGAATGTCCAATTACCCTACCAGAAGTTGTCACTCCTGAAACTGAAGCTG
CCAAACAAGCATGGATGCATATAGACTTCTTATGTCGCAATTATATACTAAGTGGTCTTCAAGACACCTTGTATAATGTCTACTGCAATGCTTATAATACATCAAGGCAA
TTGTGGGAGGCATTAGACAAGAAGTATAAGCTGGAAGATGCTGACACTAAGAAATTCCTTGTAGGAAAATTCTTAGATTATAAAATGATTGATGCCAAATTGGTAGTCAA
TCAGATGGAAGAATTGCAAATTATCATTAGTGATTTGCAAAGTGAAGGATTGGACATCAGTGAACCATTCCAAGTTGCTGCTGTGTTTGAGAAGTTGCCTCCTTCCTGGA
AGGACTTCAAATGCTATTTCAAACACAAGCGAAAGGAATTATCCATGGAGAATCTTGTTGTTAAACTCCGAATAGAAGAGGATAATAGAAAAAGAGATAAAAGTTGGCTA
GAAGTTGAAGCCAGAGCTCATGAATGGCGTCAACAAACACATTTGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDASSSTNGVAPTMMGSTIIKTHVEKPEKFKGENFKRWQQKMIFYLSTLNLAHLLKEECPITLPEVVTPETEAAKQAWMHIDFLCRNYILSGLQDTLYNVYCNAYNTSRQ
LWEALDKKYKLEDADTKKFLVGKFLDYKMIDAKLVVNQMEELQIIISDLQSEGLDISEPFQVAAVFEKLPPSWKDFKCYFKHKRKELSMENLVVKLRIEEDNRKRDKSWL
EVEARAHEWRQQTHL

Tan0004826 (gene) of Snake gourd v1 genome