CuGenDBv2

Gene ID	ClCG01G014100
Organism	Citrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
Description	ENDO3c domain-containing protein
Genome location	CG_Chr01:28366347..28369989
RNA-Seq Expression	ClCG01G014100
Synteny	ClCG01G014100
Gene Ontology terms	GO:0006284 - base-excision repair (biological process) GO:0019104 - DNA N-glycosylase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0055207.1 putative DNA glycosylase [Cucumis melo var. makuwa]

1.0e-41

85.58

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA
        +PYP+HSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECC  +DG   EH DNVESELV EKESVLDGLV+TVLSQNTTEANSERAF SLKSAF+
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA

Query:  NWED
         WED
Subjt:  NWED

XP_008438070.1 PREDICTED: putative DNA glycosylase At3g47830 [Cucumis melo]

9.4e-43

87.5

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA
        +PYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECCS +DG   EH DNVESELV EKESVLDGLV+TVLSQNTTEANSERAF SLKSAF+
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA

Query:  NWED
         WED
Subjt:  NWED

XP_011651429.1 putative DNA glycosylase At3g47830 [Cucumis sativus]

5.9e-45

89.62

Show/hide

Query:  SIDPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSA
        +IDPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECCS +DG   EHRDNVESE V EKESVLDGLV+TVLSQNTTEANSERAFASLKSA
Subjt:  SIDPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSA

Query:  FANWED
        FA WED
Subjt:  FANWED

XP_022136993.1 putative DNA glycosylase At3g47830 [Momordica charantia]

1.1e-38

82.86

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERL-SECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAF
        DPYPAH+SPTSD+CLS+RDDLLNLHGFPREF+KYRK+R+R  SECCS + GG GE  D+V+SELV EKESVLDGLVRTVLSQNTTEANSERAFASLKSAF
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERL-SECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAF

Query:  ANWED
        A WED
Subjt:  ANWED

XP_038894941.1 putative DNA glycosylase At3g47830 [Benincasa hispida]

5.3e-46

92.31

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA
        DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECCS +DGG GEHRDNVESE V EKESVLDGLVRTVLSQNTTEANSERAF+SLKSAFA
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA

Query:  NWED
         WED
Subjt:  NWED

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LTF1 ENDO3c domain-containing protein

2.9e-45

89.62

Show/hide

Query:  SIDPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSA
        +IDPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECCS +DG   EHRDNVESE V EKESVLDGLV+TVLSQNTTEANSERAFASLKSA
Subjt:  SIDPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSA

Query:  FANWED
        FA WED
Subjt:  FANWED

A0A1S3AW45 putative DNA glycosylase At3g47830

4.6e-43

87.5

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA
        +PYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECCS +DG   EH DNVESELV EKESVLDGLV+TVLSQNTTEANSERAF SLKSAF+
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA

Query:  NWED
         WED
Subjt:  NWED

A0A5A7UKV1 Putative DNA glycosylase

5.0e-42

85.58

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA
        +PYP+HSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECC  +DG   EH DNVESELV EKESVLDGLV+TVLSQNTTEANSERAF SLKSAF+
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA

Query:  NWED
         WED
Subjt:  NWED

A0A5D3BJ43 Putative DNA glycosylase

4.6e-43

87.5

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA
        +PYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRK+RERLSECCS +DG   EH DNVESELV EKESVLDGLV+TVLSQNTTEANSERAF SLKSAF+
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFA

Query:  NWED
         WED
Subjt:  NWED

A0A6J1C919 putative DNA glycosylase At3g47830

5.2e-39

82.86

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERL-SECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAF
        DPYPAH+SPTSD+CLS+RDDLLNLHGFPREF+KYRK+R+R  SECCS + GG GE  D+V+SELV EKESVLDGLVRTVLSQNTTEANSERAFASLKSAF
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERL-SECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAF

Query:  ANWED
        A WED
Subjt:  ANWED

SwissProt top hits

e value

%identity

Alignment

F4JCQ3 Putative DNA glycosylase At3g47830

7.3e-22

53.77

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVH--EKESVLDGLVRTVLSQNTTEANSERAFASLKSA
        +PYP    PT++EC  VRD LL+LHGFP EF  YR+QR R      D D      + N++SE ++  E+ESVLDGLV+ +LSQNTTE+NS+RAFASLK+ 
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVH--EKESVLDGLVRTVLSQNTTEANSERAFASLKSA

Query:  FANWED
        F  W+D
Subjt:  FANWED

Arabidopsis top hits

e value

%identity

Alignment

AT3G47830.1 DNA glycosylase superfamily protein

5.2e-23

53.77

Show/hide

Query:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVH--EKESVLDGLVRTVLSQNTTEANSERAFASLKSA
        +PYP    PT++EC  VRD LL+LHGFP EF  YR+QR R      D D      + N++SE ++  E+ESVLDGLV+ +LSQNTTE+NS+RAFASLK+ 
Subjt:  DPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVH--EKESVLDGLVRTVLSQNTTEANSERAFASLKSA

Query:  FANWED
        F  W+D
Subjt:  FANWED

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCTATTGACCCGTATCCGGCTCATTCTTCGCCCACTTCGGACGAATGTCTGTCCGTGAGGGACGATCTGTTGAATCTTCATGGTTTCCCTCGAGAGTTTCTTAAGTA
TCGGAAGCAGCGAGAGAGACTGAGCGAGTGCTGCTCCGACATGGACGGCGGCAGCGGTGAGCACCGGGATAATGTGGAATCGGAGCTCGTCCATGAGAAGGAGAGCGTTT
TGGATGGATTGGTGAGGACTGTGCTCTCGCAGAACACTACTGAGGCTAATTCCGAGAGGGCTTTTGCTTCTCTCAAGTCTGCTTTTGCTAACTGGGAGGATAAAGATGAT
TTTCCAGTAGACACCCATGTGAGTAACTGGATTCTTGATTCTGATGAGTTTGTGATCTCTAAAGACCATTGGAAGGTTTTGATTTTCCAACATGTTTGCAGGTCTTTGAG
ATTGCGAAATTTGCCGGTTGGGTCCCGGATGAGGCAGACAGGAACAAAACATATCTTCATCTTAACTAAAGGATCCCAAATCATCTCAAATTTGATCTCAACTGTCTTCT
TTACACTCATGGCAAGGTCTATTCGAAATGTACGAAGAGAACAGGCGGGCGACAACGAAAGGGATCAGAAGATCAGTCTTGTCCCTTGTTCAAGTACTCCAAGAACCCGT
AAATTTGTGAATATAAATGTGGCTATTAGCTATGCGTCACGGGGCTTATGCGTTGAAGGTGGTTACCGTAGGTTGTTAAGGACGAATAAGCAAGAAGGTATAAAGTTAAG
TCATGGAGTGTTAGAAAGAGATCTAAGTGTCATGGATGGAAATAACGCCATTTCAAACCGCGACACAAACGCCCTTGACTCGCCTCGCATTGTCAAGGGAAGGTCGAGAG
TGAAGGGCCAAGGCGTTGACAAAACCGCTGCACGAGGATGCCATCGCATGCAGACGGGACGCAAGTGCCATCGGGCCACACCCATGCCTCAGGTGTATGCCTTCGACATA
GCCGGATCCCCACCCGAGTGCCTCAACAGACACCTATGTGCGTTGACACATGGCAGAGTGGCTGCGCAGCCAACCATAAGTATGCGGCATGCACGCTCAACTGCAAGGGT
GAGTAGCATGACGTGCCCGCATATGCGAAGTTACCAGGTGTGCAAGTTCGACGCATATCCACGATGCATTCAGAGTGGGAACAACGCATGCGCGCCTCGTAAGTGCCAGC
AGTGTACGCATATCGTCGACGCCTCATGTGTACACCGCCTAGAGACCATGTGTCCAACTGCATCCTTCGACGCATGGAACATCCCAGACGCCTTGAGTAAGTCCTGGAAG
ATTCTAGACGCATCGGGACAAGGCCAGAGACCTCGACAACCCTCTGGACGCGTCTGGAGAGGCGGGCAGGCCGCTGGGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSIDPYPAHSSPTSDECLSVRDDLLNLHGFPREFLKYRKQRERLSECCSDMDGGSGEHRDNVESELVHEKESVLDGLVRTVLSQNTTEANSERAFASLKSAFANWEDKDD
FPVDTHVSNWILDSDEFVISKDHWKVLIFQHVCRSLRLRNLPVGSRMRQTGTKHIFILTKGSQIISNLISTVFFTLMARSIRNVRREQAGDNERDQKISLVPCSSTPRTR
KFVNINVAISYASRGLCVEGGYRRLLRTNKQEGIKLSHGVLERDLSVMDGNNAISNRDTNALDSPRIVKGRSRVKGQGVDKTAARGCHRMQTGRKCHRATPMPQVYAFDI
AGSPPECLNRHLCALTHGRVAAQPTISMRHARSTARVSSMTCPHMRSYQVCKFDAYPRCIQSGNNACAPRKCQQCTHIVDASCVHRLETMCPTASFDAWNIPDALSKSWK
ILDASGQGQRPRQPSGRVWRGGQAAG

ClCG01G014100 (gene) of Watermelon (Charleston Gray) v2.5 genome