CuGenDBv2

Gene ID	Spg019797
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Transposon TX1 uncharacterized 149 kDa protein
Genome location	scaffold5:30671530..30674244
RNA-Seq Expression	Spg019797
Synteny	Spg019797
Gene Ontology terms	GO:0006284 - base-excision repair (biological process) GO:0005634 - nucleus (cellular component) GO:0016020 - membrane (cellular component) GO:0003677 - DNA binding (molecular function) GO:0003906 - DNA-(apurinic or apyrimidinic site) endonuclease activity (molecular function) GO:0004519 - endonuclease activity (molecular function) GO:0008081 - phosphoric diester hydrolase activity (molecular function) GO:0008311 - double-stranded DNA 3'-5' exodeoxyribonuclease activity (molecular function) GO:0016740 - transferase activity (molecular function)
InterPro domains	IPR004808 - AP endonuclease 1 IPR020847 - AP endonuclease 1, binding site IPR036691 - Endonuclease/exonuclease/phosphatase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

RVW35852.1 hypothetical protein CK203_084592 [Vitis vinifera]

6.7e-15

39.74

Show/hide

Query:  QNITKEGNEEGG---------PDKAGEENRGALTPTTQTESSKGNEGKVRDRPK--------EMTPTALAVILRRH--MIISWNVRGLGARPKRALIKDL
        Q I+K   E+GG         PD+  EEN+ AL+    TES    +  VR   +         ++P  +A   R +  + +SWNVRGLG+R KR ++KD 
Subjt:  QNITKEGNEEGG---------PDKAGEENRGALTPTTQTESSKGNEGKVRDRPK--------EMTPTALAVILRRH--MIISWNVRGLGARPKRALIKDL

Query:  LSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMW
        L  ENPD+V++QE+K    DR  + SVW++R+  WV L A G+ GGILI+W
Subjt:  LSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMW

RVW64166.1 Transposon TX1 uncharacterized 149 kDa protein [Vitis vinifera]

6.7e-15

38.96

Show/hide

Query:  NEEGGPDKAGEENRGALTPTTQTESSKGNEGKVRDR-------------PKEMTPTALA-VILRRHMIISWNVRGLGARPKRALIKDLLSRENPDLVILQ
        N    PD+  EEN+ AL+    +ES    +  VR               P++M     A V +    IISWNVRGLG+R KR +IKD L  ENPD+V++Q
Subjt:  NEEGGPDKAGEENRGALTPTTQTESSKGNEGKVRDR-------------PKEMTPTALA-VILRRHMIISWNVRGLGARPKRALIKDLLSRENPDLVILQ

Query:  ESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVDSGEIVL
        E+K    DR  + SVW+ R+  WV L A G+ GGILI+W     +++   E+V+
Subjt:  ESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVDSGEIVL

XP_010263157.1 PREDICTED: uncharacterized protein LOC104601500 [Nelumbo nucifera]

8.8e-15

49.38

Show/hide

Query:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD
        I+SWNVRGLG   KRALIK++L +ENPD+ ++QESKL  +D+  ++SVW +  + WV   + GS GGI+ +WK+  +E V+
Subjt:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD

XP_010269625.1 PREDICTED: uncharacterized protein LOC104606223 [Nelumbo nucifera]

1.6e-16

55.56

Show/hide

Query:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD
        IISWNVRGLG+  KR +IKDLL RE PD+V+LQESKL  +D   ++S W SR +GW    + G+ GGI+ +WKE  +EVV+
Subjt:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD

XP_022149859.1 uncharacterized protein LOC111018186 [Momordica charantia]

4.1e-28

36.16

Show/hide

Query:  EVRRINWNEVIVLTKRDFHDDWGRILEILQHQLETTLIINPFQPDKALMKYPNKDLADLL----------------------------------------
        EVRR+NW E IV+T+RDFHDDW RIL  ++ Q E++ IINPFQ DKALMK P+KDLA LL                                        
Subjt:  EVRRINWNEVIVLTKRDFHDDWGRILEILQHQLETTLIINPFQPDKALMKYPNKDLADLL----------------------------------------

Query:  ----------TKKQRVECLGGFIDYAELNSLLIDCIEVGIRISNNYCD------------------------------RAARIHGTFSSEAAHAFHRGPH
                  T K     LGGFIDY + NS  I+C +V I++ +NYC                               +   IHG FSSEAA +FH+G  
Subjt:  ----------TKKQRVECLGGFIDYAELNSLLIDCIEVGIRISNNYCD------------------------------RAARIHGTFSSEAAHAFHRGPH

Query:  DSCFNPVDKWQIENALNRPVVIIQ
        +   N +D+W++EN  N P V IQ
Subjt:  DSCFNPVDKWQIENALNRPVVIIQ

TrEMBL top hits

e value

%identity

Alignment

A0A1U8A916 uncharacterized protein LOC104601500

4.2e-15

49.38

Show/hide

Query:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD
        I+SWNVRGLG   KRALIK++L +ENPD+ ++QESKL  +D+  ++SVW +  + WV   + GS GGI+ +WK+  +E V+
Subjt:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD

A0A1U8B190 uncharacterized protein LOC104606223

7.7e-17

55.56

Show/hide

Query:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD
        IISWNVRGLG+  KR +IKDLL RE PD+V+LQESKL  +D   ++S W SR +GW    + G+ GGI+ +WKE  +EVV+
Subjt:  IISWNVRGLGARPKRALIKDLLSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVD

A0A438DK43 Uncharacterized protein

3.3e-15

39.74

Show/hide

Query:  QNITKEGNEEGG---------PDKAGEENRGALTPTTQTESSKGNEGKVRDRPK--------EMTPTALAVILRRH--MIISWNVRGLGARPKRALIKDL
        Q I+K   E+GG         PD+  EEN+ AL+    TES    +  VR   +         ++P  +A   R +  + +SWNVRGLG+R KR ++KD 
Subjt:  QNITKEGNEEGG---------PDKAGEENRGALTPTTQTESSKGNEGKVRDRPK--------EMTPTALAVILRRH--MIISWNVRGLGARPKRALIKDL

Query:  LSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMW
        L  ENPD+V++QE+K    DR  + SVW++R+  WV L A G+ GGILI+W
Subjt:  LSRENPDLVILQESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMW

A0A438FW30 Transposon TX1 uncharacterized 149 kDa protein

3.3e-15

38.96

Show/hide

Query:  NEEGGPDKAGEENRGALTPTTQTESSKGNEGKVRDR-------------PKEMTPTALA-VILRRHMIISWNVRGLGARPKRALIKDLLSRENPDLVILQ
        N    PD+  EEN+ AL+    +ES    +  VR               P++M     A V +    IISWNVRGLG+R KR +IKD L  ENPD+V++Q
Subjt:  NEEGGPDKAGEENRGALTPTTQTESSKGNEGKVRDR-------------PKEMTPTALA-VILRRHMIISWNVRGLGARPKRALIKDLLSRENPDLVILQ

Query:  ESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVDSGEIVL
        E+K    DR  + SVW+ R+  WV L A G+ GGILI+W     +++   E+V+
Subjt:  ESKLTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVDSGEIVL

A0A6J1D6X4 uncharacterized protein LOC111018186

2.0e-28

36.16

Show/hide

Query:  EVRRINWNEVIVLTKRDFHDDWGRILEILQHQLETTLIINPFQPDKALMKYPNKDLADLL----------------------------------------
        EVRR+NW E IV+T+RDFHDDW RIL  ++ Q E++ IINPFQ DKALMK P+KDLA LL                                        
Subjt:  EVRRINWNEVIVLTKRDFHDDWGRILEILQHQLETTLIINPFQPDKALMKYPNKDLADLL----------------------------------------

Query:  ----------TKKQRVECLGGFIDYAELNSLLIDCIEVGIRISNNYCD------------------------------RAARIHGTFSSEAAHAFHRGPH
                  T K     LGGFIDY + NS  I+C +V I++ +NYC                               +   IHG FSSEAA +FH+G  
Subjt:  ----------TKKQRVECLGGFIDYAELNSLLIDCIEVGIRISNNYCD------------------------------RAARIHGTFSSEAAHAFHRGPH

Query:  DSCFNPVDKWQIENALNRPVVIIQ
        +   N +D+W++EN  N P V IQ
Subjt:  DSCFNPVDKWQIENALNRPVVIIQ

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCAGAAAATATCGAACAAACGGGGAAGCTTCTTGGAGATCACAAAAGTAGCTAACTTGGGCGGCAAACATAATCTGGTTGTCCCAGCGGGAGTGGACTTCAGGGGGTG
GAAGGATTTTTTGCTCCTTTTGAGAAGTTTTGTTGATGGAAAATCTACGGAGGATGCCAACTTAGACAAGGATGAGGAACCCAAAAGGAAGGCTGGAAGGAAATCCTTCG
CAGATGCTTTAAAAGGTCCCATTAATAGAGATACAAAATCACCCCAAAACAGAGGAATGAGACCAAAAGAGAACCTCTATATGGACGCCTCGAAAACCTGCGTTAATGAA
GTGAGAAGAATTAACTGGAATGAGGTGATTGTGTTAACAAAGAGAGATTTTCATGATGATTGGGGTCGAATCCTAGAAATCTTGCAACATCAATTAGAGACCACCCTAAT
TATAAACCCATTCCAGCCAGACAAAGCCCTTATGAAATACCCGAACAAGGACCTTGCGGATTTGTTGACAAAAAAACAGAGGGTGGAATGCTTGGGAGGCTTCATTGATT
ACGCGGAACTAAACTCTTTGCTCATTGATTGCATTGAGGTGGGAATCAGAATAAGCAATAACTATTGCGATAGGGCTGCCAGAATCCATGGAACTTTCTCGTCGGAAGCT
GCCCATGCGTTTCACAGAGGTCCCCATGACTCGTGCTTCAATCCAGTGGATAAATGGCAAATTGAAAACGCTCTGAATCGCCCAGTGGTTATTATCCAGGGGTTGTGCAT
GGACAACGAGATATCGGATGTCCAAGGGGGGAAATCTCGAAGAATTAATTTTGAATTACCCCGCCAAAAAGATGATATGGAAAAAAGGAAATCTGACGACCCCGAAGCTG
AGATGGAAAAAAAGATGTATGATGGCCCAAACCTGATACAGAAACCCACAAATGAGGCCCACAAGTTGAAAGGAAAGGAAGCCCACCAAAAAGAACCTGAAGGAAAACAA
AAAAGGAAAATTGCAGATGGATATGCGTTGACTCCCACTTGGCAAAATATTACTAAAGAAGGAAATGAAGAGGGCGGACCCGATAAAGCAGGGGAGGAAAACAGAGGTGC
GTTGACCCCCACTACCCAGACTGAATCTTCGAAGGGAAATGAAGGGAAAGTTAGAGATAGGCCCAAGGAGATGACTCCGACAGCCTTGGCAGTTATCCTCCGACGACACA
TGATTATCTCTTGGAATGTTAGAGGCTTGGGAGCTCGACCGAAAAGAGCTTTAATCAAAGATTTGCTTAGTAGGGAGAATCCAGACCTGGTGATTCTCCAAGAATCCAAA
TTGACCAAGGTTGACAGGGGGATGATTAAATCAGTCTGGAGCTCTAGACATGTTGGTTGGGTGACTCTAGAGGCAATGGGATCCGTGGGAGGTATCCTTATCATGTGGAA
AGAGAGCTGCATCGAGGTGGTTGATTCAGGGGAAATTGTGCTAGATGGCTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MQKISNKRGSFLEITKVANLGGKHNLVVPAGVDFRGWKDFLLLLRSFVDGKSTEDANLDKDEEPKRKAGRKSFADALKGPINRDTKSPQNRGMRPKENLYMDASKTCVNE
VRRINWNEVIVLTKRDFHDDWGRILEILQHQLETTLIINPFQPDKALMKYPNKDLADLLTKKQRVECLGGFIDYAELNSLLIDCIEVGIRISNNYCDRAARIHGTFSSEA
AHAFHRGPHDSCFNPVDKWQIENALNRPVVIIQGLCMDNEISDVQGGKSRRINFELPRQKDDMEKRKSDDPEAEMEKKMYDGPNLIQKPTNEAHKLKGKEAHQKEPEGKQ
KRKIADGYALTPTWQNITKEGNEEGGPDKAGEENRGALTPTTQTESSKGNEGKVRDRPKEMTPTALAVILRRHMIISWNVRGLGARPKRALIKDLLSRENPDLVILQESK
LTKVDRGMIKSVWSSRHVGWVTLEAMGSVGGILIMWKESCIEVVDSGEIVLDG

Spg019797 (gene) of Sponge gourd (cylindrica) v1 genome