CuGenDBv2

Gene ID	Tan0020765
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Reverse transcriptase
Genome location	LG08:35859211..35865578
RNA-Seq Expression	Tan0020765
Synteny	Tan0020765
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR021109 - Aspartic peptidase domain superfamily IPR036875 - Zinc finger, CCHC-type superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_023520282.1 uncharacterized protein LOC111783592 [Cucurbita pepo subsp. pepo]

8.3e-129

80.6

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +NQEI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV
        GDLLLGRPWQFDRRV+YDGYANRYSFT+NGRKTTLVPLSPKDVFID CKLEKKRQEADAKA+     IEKES EK SLSEKQES+ QPR K ERKAK V
Subjt:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV

XP_023520835.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111784339 [Cucurbita pepo subsp. pepo]

5.4e-128

80.27

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +N EI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV
        GDLLLGRPWQFDRRV+YDGYANRYSFT+NGRKTTLVPLSPKDVFID CKLEKKRQEADAKA+     IEKES EK SLSEKQES+ QPR K ERKAK V
Subjt:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV

XP_023521183.1 uncharacterized protein LOC111784872 [Cucurbita pepo subsp. pepo]

5.4e-128

80.27

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +N EI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV
        GDLLLGRPWQFDRRV+YDGYANRYSFT+NGRKTTLVPLSPKDVFID CKLEKKRQEADAKA+     IEKES EK SLSEKQES+ QPR K ERKAK V
Subjt:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV

XP_023530046.1 uncharacterized protein LOC111792716 [Cucurbita pepo subsp. pepo]

8.9e-123

80.92

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +N EI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQE
        GDLLLGRPWQFDRRV+YDGYANRYSFT+NGRKTTLVPLSPKDVFID CKLEKKRQEADAKA+     IEKES EK SLSEKQE
Subjt:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQE

XP_023553652.1 uncharacterized protein LOC111811140 [Cucurbita pepo subsp. pepo]

5.4e-128

80.27

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +N EI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV
        GDLLLGRPWQFDRRV+YDGYANRYSFT+NGRKTTLVPLSPKDVFID CKLEKKRQEADAKA+     IEKES EK SLSEKQES+ QPR K ERKAK V
Subjt:  GDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQESSNQPRGKNERKAKIV

TrEMBL top hits

e value

%identity

Alignment

A0A6J1EQJ1 uncharacterized protein LOC111436530

1.6e-93

80.37

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +NQEI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRR
        GDLLLGRPWQFDRR
Subjt:  GDLLLGRPWQFDRR

A0A6J1EVV9 uncharacterized protein LOC111436463

3.0e-92

79.91

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +NQEI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+ QGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRR
        GDLLLGRPWQFDRR
Subjt:  GDLLLGRPWQFDRR

A0A6J1G2Q3 uncharacterized protein LOC111450286

1.6e-93

80.37

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +NQEI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRR
        GDLLLGRPWQFDRR
Subjt:  GDLLLGRPWQFDRR

A0A6J1I622 LOW QUALITY PROTEIN: uncharacterized protein LOC111469947

1.0e-92

79.91

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +NQEI EKP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV R 
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRR
        GDLLLGRPWQFDRR
Subjt:  GDLLLGRPWQFDRR

A0A6J1I8S0 uncharacterized protein LOC111472489

1.0e-92

79.91

Show/hide

Query:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR
        +NQEI  KP+A  EKGESS+ GKEK+++SNVRNRDLKCW+CQGVGHYSRDCPN RIMTI+EGEIVTDDE  D++ EE DES  EE SEEDP ++SLV RR
Subjt:  KNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREGEIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARR

Query:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA
        AL+T IKED LDQRENLF TRCL+QS+PCSVVIDSGSCTNVVS+ILVKRLNL+T+PHPRPYKLQWLNDC +VRV++Q LVSFTIGKY DDVLCDVVSMH 
Subjt:  ALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQVRVSKQALVSFTIGKYNDDVLCDVVSMHA

Query:  GDLLLGRPWQFDRR
        GDLLLGRPWQFDRR
Subjt:  GDLLLGRPWQFDRR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAGAGAATGATTCGTGGAATAGAAGAGTTATCGGAGAGGAGAATTCCACCCCCTCCACAACAACGTGAGGATGACCATGACAACGAATATGAGGGAGGAAGTTACGA
TCAACTAGAAGATGACCAAGTTACATTAATAGCAAAAAACCAAGAGATATATGAGAAACCTAAAGCAAATGTAGAGAAAGGGGAGAGTTCTAAAAAGGGGAAAGAGAAGA
TAGATGAATCTAATGTGCGAAATAGGGATTTGAAATGTTGGAAATGTCAAGGGGTAGGTCACTATAGTAGAGATTGCCCTAATAGGAGAATTATGACCATTAGAGAGGGA
GAGATTGTGACTGATGATGAAGAGGAAGATGAGGTTAAGGAAGAAAATGATGAGAGTGAGAATGAGGAGTTAAGCGAAGAGGATCCCGCAAACTTGTCCTTAGTTGCTAG
GAGAGCTTTAAGCACCCAAATTAAGGAGGATAGTCTAGACCAAAGAGAGAACTTGTTTCACACTAGGTGCCTTATTCAATCTATGCCTTGTAGTGTGGTCATTGATAGTG
GTAGTTGCACCAATGTTGTGAGTACAATTCTGGTCAAGAGGCTTAATTTAGAGACCAAACCACATCCTAGACCATATAAACTTCAATGGTTGAATGATTGTGCGCAAGTA
AGGGTGAGTAAGCAAGCTCTTGTTTCTTTTACCATTGGAAAGTATAATGATGATGTTTTGTGTGATGTTGTATCCATGCATGCTGGAGATTTATTGTTGGGGAGGCCTTG
GCAATTTGATCGTCGGGTAGTATATGATGGGTATGCAAATCGTTACTCTTTTACTTATAATGGTAGAAAAACTACTCTTGTTCCATTGTCTCCAAAAGATGTATTTATTG
ATCAATGCAAACTTGAAAAAAAAAGGCAAGAGGCTGATGCAAAAGCAAAAAGTGAAAATGAAATAATAGAAAAAGAATCGAGAGAAAAAAAGAGTTTGAGTGAAAAGCAA
GAGAGTAGCAATCAGCCTAGAGGAAAAAATGAGAGAAAAGCCAAAATAGTTAAGGGTCTCAAAGGCTATATAAAGCCCTCTCTTCTTCCATTTTCTTTTCTCTTTAGCTT
CAGTTTTTGCAGATCCGAGCATGTTCTTATTCTGAATAAAAATACAAAAATATCCTTTCCGTTCCGTATTTCATTATATCGTCTTCTACAAGATTTGAGATCTAGATCTG
ATCTACAATTTAAGAGTTATCGGAGCGTATACGGAGGTTGGAGGTTCAAAACCACGCTAGGAGGAGAATTCCACCCCCTCCACAACAACGTGAGGATGACCATGACAACG
AATATGAGGGAGGAAGTTACGATCAACTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MERMIRGIEELSERRIPPPPQQREDDHDNEYEGGSYDQLEDDQVTLIAKNQEIYEKPKANVEKGESSKKGKEKIDESNVRNRDLKCWKCQGVGHYSRDCPNRRIMTIREG
EIVTDDEEEDEVKEENDESENEELSEEDPANLSLVARRALSTQIKEDSLDQRENLFHTRCLIQSMPCSVVIDSGSCTNVVSTILVKRLNLETKPHPRPYKLQWLNDCAQV
RVSKQALVSFTIGKYNDDVLCDVVSMHAGDLLLGRPWQFDRRVVYDGYANRYSFTYNGRKTTLVPLSPKDVFIDQCKLEKKRQEADAKAKSENEIIEKESREKKSLSEKQ
ESSNQPRGKNERKAKIVKGLKGYIKPSLLPFSFLFSFSFCRSEHVLILNKNTKISFPFRISLYRLLQDLRSRSDLQFKSYRSVYGGWRFKTTLGGEFHPLHNNVRMTMTT
NMREEVTIN

Tan0020765 (gene) of Snake gourd v1 genome