CuGenDBv2

Gene ID	Lag0034801
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Reverse transcriptase domain-containing protein
Genome location	chr3:10958532..10960894
RNA-Seq Expression	Lag0034801
Synteny	Lag0034801
Gene Ontology terms	GO:0006281 - DNA repair (biological process) GO:0004518 - nuclease activity (molecular function) GO:0140097 - catalytic activity, acting on DNA (molecular function)
InterPro domains	IPR004808 - AP endonuclease 1

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0045287.1 uncharacterized protein E6C27_scaffold316G00450 [Cucumis melo var. makuwa]

1.1e-19

42.19

Show/hide

Query:  LSPSQIPNEFSLLVETCGLQLCKISSPSPKETKQSKI--DLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVC
        L  S +  E  + ++T G++ CK          +SKI      IK+LWS  +IG  F+E+ G+SGG+L MWDES++SV E +KG + LS KC T+C K C
Subjt:  LSPSQIPNEFSLLVETCGLQLCKISSPSPKETKQSKI--DLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVC

Query:  WVTNVYGPNDYKERRFLWPELRSLSYYC
        W++NVYGP  ++ER+ +W EL   +  C
Subjt:  WVTNVYGPNDYKERRFLWPELRSLSYYC

KAA0063088.1 uncharacterized protein E6C27_scaffold623G00050 [Cucumis melo var. makuwa]

1.9e-32

61.54

Show/hide

Query:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDP
        +E+K+ + D+ FIKSLWSSK+ GW   E +G SGG+L +WD SKL V+E LKGGY+LS   +T+C K CW+TNVYGPND+KERR +WPEL SLS YCT  
Subjt:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDP

Query:  WCIA
        WCI+
Subjt:  WCIA

TYJ98683.1 hypothetical protein E5676_scaffold429G00120 [Cucumis melo var. makuwa]

1.5e-29

62.89

Show/hide

Query:  KIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDPWCI
        +ID+  IKSLWSSK+IGW  VE++G+ GG+L MWD SK+ V+E LKGGY+LS   +T C K CW+TNVYGP DY+ERRF+W  L SLS YCT  WCI
Subjt:  KIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDPWCI

XP_010269625.1 PREDICTED: uncharacterized protein LOC104606223 [Nelumbo nucifera]

4.7e-15

37.14

Show/hide

Query:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWV-TNVYGPNDYKERRFLWPELRSLSYYCTD
        +E+K   +D ++++S W S+ +GW+   ++G SGG++ +W E  + V+E L G +++S KC  +     WV TNVYGPN Y+ER  +W EL ++      
Subjt:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWV-TNVYGPNDYKERRFLWPELRSLSYYCTD

Query:  PWCIA
        PWC++
Subjt:  PWCIA

XP_038876676.1 uncharacterized protein LOC120069076 [Benincasa hispida]

6.3e-28

60.19

Show/hide

Query:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDP
        +ETK+ +I+  FIKSLWSSKE+G  FVEA GKSGGLL +WD+SK+ V    K  ++LS KC T+  K+CW+TNVYGP DY+ERR LW EL SL+    DP
Subjt:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDP

Query:  WCI
        WCI
Subjt:  WCI

TrEMBL top hits

e value

%identity

Alignment

A0A1U8B190 uncharacterized protein LOC104606223

2.3e-15

37.14

Show/hide

Query:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWV-TNVYGPNDYKERRFLWPELRSLSYYCTD
        +E+K   +D ++++S W S+ +GW+   ++G SGG++ +W E  + V+E L G +++S KC  +     WV TNVYGPN Y+ER  +W EL ++      
Subjt:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWV-TNVYGPNDYKERRFLWPELRSLSYYCTD

Query:  PWCIA
        PWC++
Subjt:  PWCIA

A0A438EG68 Transposon TX1 uncharacterized 149 kDa protein

8.6e-15

33.1

Show/hide

Query:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWV-TNVYGPNDYKERRFLWPELRSLSYYCTD
        +ETK  ++  + +KS+   + +GW  ++A G +GG+L+MWD+  L  LEF  G +++S +         WV + +YGP+  +ERR LW EL ++   C D
Subjt:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWV-TNVYGPNDYKERRFLWPELRSLSYYCTD

Query:  PWCIADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESF
        PWCIA    FN      F  + ++G  +S  M     + + F
Subjt:  PWCIADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESF

A0A5A7TTX5 Uncharacterized protein

5.2e-20

42.19

Show/hide

Query:  LSPSQIPNEFSLLVETCGLQLCKISSPSPKETKQSKI--DLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVC
        L  S +  E  + ++T G++ CK          +SKI      IK+LWS  +IG  F+E+ G+SGG+L MWDES++SV E +KG + LS KC T+C K C
Subjt:  LSPSQIPNEFSLLVETCGLQLCKISSPSPKETKQSKI--DLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVC

Query:  WVTNVYGPNDYKERRFLWPELRSLSYYC
        W++NVYGP  ++ER+ +W EL   +  C
Subjt:  WVTNVYGPNDYKERRFLWPELRSLSYYC

A0A5A7V639 Uncharacterized protein

9.2e-33

61.54

Show/hide

Query:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDP
        +E+K+ + D+ FIKSLWSSK+ GW   E +G SGG+L +WD SKL V+E LKGGY+LS   +T+C K CW+TNVYGPND+KERR +WPEL SLS YCT  
Subjt:  KETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDP

Query:  WCIA
        WCI+
Subjt:  WCIA

A0A5D3BHE3 Uncharacterized protein

7.3e-30

62.89

Show/hide

Query:  KIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDPWCI
        +ID+  IKSLWSSK+IGW  VE++G+ GG+L MWD SK+ V+E LKGGY+LS   +T C K CW+TNVYGP DY+ERRF+W  L SLS YCT  WCI
Subjt:  KIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVLEFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDPWCI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G30470.1 SIT4 phosphatase-associated family protein

2.5e-06

44.78

Show/hide

Query:  IADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESFGRLLKLLDVSS-----VTIFGKFQPFLG
        + DP+RF  GT  ++  Q+ HG S+    E+VEG   S G LL LL+VSS     +T +GK QP LG
Subjt:  IADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESFGRLLKLLDVSS-----VTIFGKFQPFLG

AT1G30470.2 SIT4 phosphatase-associated family protein

2.5e-06

44.78

Show/hide

Query:  IADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESFGRLLKLLDVSS-----VTIFGKFQPFLG
        + DP+RF  GT  ++  Q+ HG S+    E+VEG   S G LL LL+VSS     +T +GK QP LG
Subjt:  IADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESFGRLLKLLDVSS-----VTIFGKFQPFLG

AT1G30470.3 SIT4 phosphatase-associated family protein

2.5e-06

44.78

Show/hide

Query:  IADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESFGRLLKLLDVSS-----VTIFGKFQPFLG
        + DP+RF  GT  ++  Q+ HG S+    E+VEG   S G LL LL+VSS     +T +GK QP LG
Subjt:  IADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESFGRLLKLLDVSS-----VTIFGKFQPFLG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCCATGATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTCAAATCTTCAGTCTTGATCAATCCTTTTATGGATGATAAAGCTTTGATTCAGGTGGCTGA
TTGTAGTTTGGATCCATCTGTGAATGGTAAGTGGAAACTATTCGAGAACCTTCATTTGAAATTGGAATTTTGGTCCTCTGATTTTCATTCCCAGCCAAAATTTATAATAA
GTTATGGAGGATGGATTGCAATAAAAAGATTACCTTTGGATTTGTGGCATGGGACTCCTTTGAAGCTATTGGAAAAAACCTTGGTGGGTTGCATTGGAAAAGTGGGTAAT
CAGCCAGCAGCTTCCGAAAGTGTTATTAATAGCATTGAAAATGAGTGTATCCAGCAGGCAGCTTTAAAGACTTACTCTCGGAAAAAGGGGTCTCGGTTATTGGTTGAAAA
GGCCAATATTAATGCTGATCATTTGGAATCTGAATGTACTAATATGATTATTTCAAATAAGGCATTGGGATCCTCAAAAAACAGTGGTGAAAATAGTCTTTCAAAGTCCA
AGGCATTTATTGAATCGTCTGTGCAATTTCCAGGGGTGAAAAATCAATTTGTCAAAGGAATTGTTTGTTCTTCCAGCCCTAAAGTTCATTCTTCTATAGATTCTGATGAT
GAGTCTTCGGTTAGTGTGAGTAGTGATGATTCTGAGTCTTTGATTGCTGAAGAAGATTGGGAGGATGTTGGTTTTGGCAATCAAATTCAAGATACCTTGTTGTCTCCTTC
TCAAATCCCTAATGAGTTCTCTTTACTAGTGGAAACTTGTGGACTTCAATTGTGCAAGATTTCATCTCCATCACCGAAAGAAACCAAACAGTCGAAAATTGATTTAAAAT
TCATTAAATCTTTATGGAGTTCAAAGGAAATTGGATGGACTTTTGTGGAAGCTTATGGGAAATCAGGAGGTCTTCTTATTATGTGGGATGAGAGCAAATTATCAGTGCTG
GAATTCTTAAAGGGTGGTTATACTCTTTCAACTAAATGTCTTACTCTTTGTATAAAAGTTTGTTGGGTCACCAATGTTTATGGTCCGAATGACTACAAGGAAAGGAGATT
CTTATGGCCTGAATTGCGTTCCCTCTCTTACTATTGCACGGATCCATGGTGTATTGCAGATCCTAGGAGGTTTAATACTGGAACAACTTTTGTATTCACCGGCCAAATAG
CCCATGGATATTCTGTTTCAGCAACTATGGAGTCGGTGGAAGGTTGGTCGGAGAGTTTTGGTAGGTTGCTCAAGCTTCTGGATGTTTCTTCAGTTACTATATTTGGAAAG
TTTCAGCCATTTCTTGGATACTCTGTCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAHDSWKEVKLVLEDFFKSSVLINPFMDDKALIQVADCSLDPSVNGKWKLFENLHLKLEFWSSDFHSQPKFIISYGGWIAIKRLPLDLWHGTPLKLLEKTLVGCIGKVGN
QPAASESVINSIENECIQQAALKTYSRKKGSRLLVEKANINADHLESECTNMIISNKALGSSKNSGENSLSKSKAFIESSVQFPGVKNQFVKGIVCSSSPKVHSSIDSDD
ESSVSVSSDDSESLIAEEDWEDVGFGNQIQDTLLSPSQIPNEFSLLVETCGLQLCKISSPSPKETKQSKIDLKFIKSLWSSKEIGWTFVEAYGKSGGLLIMWDESKLSVL
EFLKGGYTLSTKCLTLCIKVCWVTNVYGPNDYKERRFLWPELRSLSYYCTDPWCIADPRRFNTGTTFVFTGQIAHGYSVSATMESVEGWSESFGRLLKLLDVSSVTIFGK
FQPFLGYSV

Lag0034801 (gene) of Sponge gourd (AG-4) v1 genome