; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CaUC09G160880 (gene) of Watermelon (USVL246-FR2) v1 genome

Gene IDCaUC09G160880
OrganismCitrullus amarus (Watermelon (USVL246-FR2) v1)
DescriptionDNA glycosylase superfamily protein
Genome locationCiama_Chr09:2926726..2929171
RNA-Seq ExpressionCaUC09G160880
SyntenyCaUC09G160880
Gene Ontology termsGO:0006284 - base-excision repair (biological process)
GO:0008725 - DNA-3-methyladenine glycosylase activity (molecular function)
InterPro domainsIPR005019 - Methyladenine glycosylase
IPR011257 - DNA glycosylase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004136097.2 uncharacterized protein LOC101205558 [Cucumis sativus]1.4e-9867.46Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDP AVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSFNVY+WNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKD-GEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLI CFRF ECIETQTAEKGE+D GE+KL  NEKMPEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKD-GEIKLTVNEKMPEALKNLEL

XP_008461179.1 PREDICTED: probable GMP synthase [glutamine-hydrolyzing] [Cucumis melo]7.3e-10067.35Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDP  VSKLNEKKMVAPGSAATSLLSELK+RAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSFNVY+WNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRF ECIETQTAEKGE+DGE+KL  NEKMPEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

XP_022155202.1 uncharacterized protein LOC111022341 [Momordica charantia]7.6e-9767.01Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVA GSAATSLLSELKVRAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSF+VYIWNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRF ECIE  TAE+GEKDGEIK  +NEK+PEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

XP_022960311.1 uncharacterized protein LOC111461081 [Cucurbita moschata]7.8e-9464.95Show/hide
Query:  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANS
        DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWP IL KRHLFRE FLDFDPNAVSKLNEKKMVAPGSAATSLLSE KVRAIIENGRQMCK     
Subjt:  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANS

Query:  RLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIV
                                                                                      VIDE GSFNVY+WNFVNHKP +
Subjt:  RLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIV

Query:  SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        SQFRYPRQVPDKTSKA+VISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHL+SCFRFQECIE  T EKGE+DG+IK T+ EK+PEALKNLEL
Subjt:  SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

XP_038900164.1 probable GMP synthase [glutamine-hydrolyzing] [Benincasa hispida]1.2e-10269.39Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKR+LFREIFLDFDPN VSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSFNVY+WNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

TrEMBL top hitse value%identityAlignment
A0A0A0K8L6 Uncharacterized protein6.7e-9967.46Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDP AVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSFNVY+WNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKD-GEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLI CFRF ECIETQTAEKGE+D GE+KL  NEKMPEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKD-GEIKLTVNEKMPEALKNLEL

A0A1S3CE52 probable GMP synthase [glutamine-hydrolyzing]3.5e-10067.35Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDP  VSKLNEKKMVAPGSAATSLLSELK+RAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSFNVY+WNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRF ECIETQTAEKGE+DGE+KL  NEKMPEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

A0A5A7UYZ9 Putative GMP synthase3.5e-10067.35Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDP  VSKLNEKKMVAPGSAATSLLSELK+RAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSFNVY+WNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRF ECIETQTAEKGE+DGE+KL  NEKMPEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

A0A6J1DNQ3 uncharacterized protein LOC1110223413.7e-9767.01Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVA GSAATSLLSELKVRAIIENGRQMCK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VIDE GSF+VYIWNFVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        PI+SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRF ECIE  TAE+GEKDGEIK  +NEK+PEALKNLEL
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

A0A6J1H7A2 uncharacterized protein LOC1114610813.8e-9464.95Show/hide
Query:  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANS
        DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWP IL KRHLFRE FLDFDPNAVSKLNEKKMVAPGSAATSLLSE KVRAIIENGRQMCK     
Subjt:  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANS

Query:  RLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIV
                                                                                      VIDE GSFNVY+WNFVNHKP +
Subjt:  RLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIV

Query:  SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL
        SQFRYPRQVPDKTSKA+VISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHL+SCFRFQECIE  T EKGE+DG+IK T+ EK+PEALKNLEL
Subjt:  SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL

SwissProt top hitse value%identityAlignment
P05100 DNA-3-methyladenine glycosylase 11.5e-2629.64Show/hide
Query:  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANS
        DP Y A+HD EWGVP  D KKLFE++CL G  A L+W  +L KR  +R  F  FDP  V+ + E+ +      A  +    K++AII N R   +++ N 
Subjt:  DPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANS

Query:  RLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIV
                                                                  GE                         F  ++W+FVNH+P V
Subjt:  RLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIV

Query:  SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISC
        +Q     ++P  TS ++ +SK L KRGF+ VG T+ Y+FMQ  GL NDH++ C
Subjt:  SQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISC

P44321 DNA-3-methyladenine glycosylase4.9e-2228.8Show/hide
Query:  YAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANSRLS
        Y  +HD+EWG P  D +KLFE +CL G  A L+W  +L KR  +RE F  FDP  ++K+    + A    +  +    K+ AI++N +            
Subjt:  YAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANSRLS

Query:  FRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIVSQF
            YL +                                                  E+ G+                  +F+ +IW+FVNHKPIV+  
Subjt:  FRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIVSQF

Query:  RYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISC
           R VP KT  ++ +SK L KRGF  +G T  Y FMQ  GL +DHL  C
Subjt:  RYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISC

Q7VG78 Probable GMP synthase [glutamine-hydrolyzing]1.6e-2530.39Show/hide
Query:  YAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANSRLS
        Y  +HD EWG P+H+DKKLFE L L G  A L+W  IL KR  FR  F DFDP+ V+  +E K          +   ++   II N     K++A     
Subjt:  YAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVDANSRLS

Query:  FRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIVSQF
                        +++N  A                                                 F  V  E GSF+ YIW FV  KPI++ F
Subjt:  FRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPIVSQF

Query:  RYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRF-----QECIETQTAEKGEKDGEIKLTVNEK
             +P  T  ++ I+KDL KRGF+ VG T +Y  MQ  G+ NDHL SCF+       +C +     +G       LT N K
Subjt:  RYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRF-----QECIETQTAEKGEKDGEIKLTVNEK

Arabidopsis top hitse value%identityAlignment
AT1G15970.1 DNA glycosylase superfamily protein3.9e-6748.75Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCY AFHDEEWGVPVHDDKKLFELLCLSGALAEL+W  IL++RH+ RE+F+DFDP AV++LN+KK+ APG+AA SLLSE+K+R+I++N R + K  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         +I E GS   Y+WNFVN+K
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQEC---IETQTAEKGEKDGE
        P  SQFRY RQVP KTSKAE ISKDLV+RGFRSV PTVIY+FMQ AGLTNDHLI CFR+Q+C    ET T  K +K  E
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQEC---IETQTAEKGEKDGE

AT1G75090.1 DNA glycosylase superfamily protein3.7e-4937.76Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DP Y  FHDEEWGVPV DDKKLFELL  S ALAE +WP+IL +R  FR++F +FDP+A+++  EK++++       +LSE K+RAI+EN + + KV 
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                            E GSF+ Y W FVNHK
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQEC-IETQTAEKGEKDGEIKLTVNEKM
        P+ + +RY RQVP K+ KAE ISKD+++RGFR VGPTV+Y+F+Q +G+ NDHL +CFR+QEC +ET+   K   + E KL ++  +
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQEC-IETQTAEKGEKDGEIKLTVNEKM

AT1G80850.1 DNA glycosylase superfamily protein1.0e-6248.67Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  D CY AFHDEEWGVPVHDDK+LFELL LSGALAEL+W  IL+KR LFRE+F+DFDP A+S+L  KK+ +P  AAT+LLSE K+R+I+EN  Q+CK  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         +I   GSF+ YIWNFVN K
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECI
        P  SQFRYPRQVP KTSKAE+ISKDLV+RGFRSV PTVIY+FMQ AGLTNDHL  CFR  +C+
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECI

AT5G57970.1 DNA glycosylase superfamily protein1.9e-6650.19Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCY  FHDEEWGVPVHDDK+LFELL LSGALAE TWP IL+KR  FRE+F DFDPNA+ K+NEKK++ PGS A++LLS+LK+RA+IEN RQ+ K  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VI+E GSF+ YIW+FV +K
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECI
         IVS+FRY RQVP KT KAEVISKDLV+RGFRSVGPTV+Y+FMQ AG+TNDHL SCFRF  CI
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECI

AT5G57970.2 DNA glycosylase superfamily protein1.9e-6650.19Show/hide
Query:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD
        P  DPCY  FHDEEWGVPVHDDK+LFELL LSGALAE TWP IL+KR  FRE+F DFDPNA+ K+NEKK++ PGS A++LLS+LK+RA+IEN RQ+ K  
Subjt:  PLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIENGRQMCKVD

Query:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK
                                                                                         VI+E GSF+ YIW+FV +K
Subjt:  ANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHK

Query:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECI
         IVS+FRY RQVP KT KAEVISKDLV+RGFRSVGPTV+Y+FMQ AG+TNDHL SCFRF  CI
Subjt:  PIVSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGTCATTGCCCCTCTAGTCAGTGACTCAGTTATGAGCATTGTCAGGTTGATTAGTACACGAAGGAATGAATTTCATTATATCAATGTGGGCTCTAGGAATGTTCTTTT
TACGATCATAAAGGACTGTAGTCATAAAATATCGGGAGTTCAAATGTATATTAAGAAAAGCATTTTTGATCCATCAATCAGGGAAATAGAGTCAATGACGAATTCTAGTG
ACCCTTCTCTACTTTTTCCATCTCCATCCTTTTTGATATGTGATGGTGAATTTCAAACTGAGGATAATAAAACAGGGGGCCAATATATGTGCTATGTGTCATCTAGATTG
TGTGCCGTTTTTTTCTTTTCTGAAGAGTGGTCATCATGTAAGCATCGAGTCCCCTTTACCTTTGAAACTTTCAGTCCTTTATTCATTAACATTTCAGATAAGAATATTAA
ATGTATTGTTCATTTAATGGTTTGCAAAATTAAGTTCGTGACTAGCAGGGGCTCAAGAGTTGTTATAGAAATGATACGAATTGTTTCACATATTTTCCCTCAAGCAGTAA
ATATGGGATTGAAATGTTTAACGCAATGTGCACCACTTAGTATGTTGCTAGTTATCACCAAAATTGCTTATGCTTTCCTTGAGGCTACGGCTGCCTATCTCATGGCTCAT
GCTTCGATAGTCTTTTCAAGTTTGGTTGGGGCCCTAAGCATGATTGCTTTTCTTCCTTTGCTAGATCCATGTTATGCTGCTTTTCATGATGAAGAATGGGGAGTACCAGT
TCACGATGACAAAAAATTGTTTGAACTGCTTTGCCTATCGGGCGCGTTGGCTGAACTTACATGGCCTGCCATCCTCAACAAAAGACATCTATTTAGGGAAATCTTTTTGG
ACTTTGACCCAAATGCCGTTTCAAAATTAAACGAGAAAAAGATGGTTGCTCCTGGAAGTGCTGCTACTTCTTTACTGTCAGAACTCAAGGTTCGAGCTATCATTGAAAAC
GGTCGTCAAATGTGCAAGGTAGATGCTAACTCTCGCCTCTCCTTTCGGATTGTATATCTGTTTGTTTTGTTGCATAAAACAGAAATGTTGTCTATGTTGAATCTGAATGC
GCTCTGTTTGAGAATTCTTGTCTTGTCATTGATGGCTTTGGTTTCTTTAATTTGTTCATATGTCATGTTTACAACGTCTAATCTCAAACCAATCAAAGGAGAGAGAGAGA
GGGGAGGAAAAATGGCTTTTAACTCTTATCTTTACCTCTTCTCCATTGTAATTGATGAACTTGGTTCCTTCAACGTGTACATCTGGAACTTTGTGAACCATAAACCGATC
GTCAGTCAGTTCCGGTACCCACGTCAAGTCCCAGATAAGACGTCGAAAGCAGAGGTGATTAGCAAGGATCTCGTAAAGAGAGGGTTTCGAAGCGTAGGACCAACAGTCAT
CTATACATTCATGCAGGTGGCTGGGTTAACTAATGACCATCTCATCAGTTGCTTTAGGTTTCAAGAATGTATAGAGACACAAACAGCAGAGAAAGGAGAAAAAGATGGTG
AAATCAAGCTTACTGTTAATGAGAAAATGCCAGAGGCTTTGAAAAACTTGGAACTATAA
mRNA sequenceShow/hide mRNA sequence
ATGGTCATTGCCCCTCTAGTCAGTGACTCAGTTATGAGCATTGTCAGGTTGATTAGTACACGAAGGAATGAATTTCATTATATCAATGTGGGCTCTAGGAATGTTCTTTT
TACGATCATAAAGGACTGTAGTCATAAAATATCGGGAGTTCAAATGTATATTAAGAAAAGCATTTTTGATCCATCAATCAGGGAAATAGAGTCAATGACGAATTCTAGTG
ACCCTTCTCTACTTTTTCCATCTCCATCCTTTTTGATATGTGATGGTGAATTTCAAACTGAGGATAATAAAACAGGGGGCCAATATATGTGCTATGTGTCATCTAGATTG
TGTGCCGTTTTTTTCTTTTCTGAAGAGTGGTCATCATGTAAGCATCGAGTCCCCTTTACCTTTGAAACTTTCAGTCCTTTATTCATTAACATTTCAGATAAGAATATTAA
ATGTATTGTTCATTTAATGGTTTGCAAAATTAAGTTCGTGACTAGCAGGGGCTCAAGAGTTGTTATAGAAATGATACGAATTGTTTCACATATTTTCCCTCAAGCAGTAA
ATATGGGATTGAAATGTTTAACGCAATGTGCACCACTTAGTATGTTGCTAGTTATCACCAAAATTGCTTATGCTTTCCTTGAGGCTACGGCTGCCTATCTCATGGCTCAT
GCTTCGATAGTCTTTTCAAGTTTGGTTGGGGCCCTAAGCATGATTGCTTTTCTTCCTTTGCTAGATCCATGTTATGCTGCTTTTCATGATGAAGAATGGGGAGTACCAGT
TCACGATGACAAAAAATTGTTTGAACTGCTTTGCCTATCGGGCGCGTTGGCTGAACTTACATGGCCTGCCATCCTCAACAAAAGACATCTATTTAGGGAAATCTTTTTGG
ACTTTGACCCAAATGCCGTTTCAAAATTAAACGAGAAAAAGATGGTTGCTCCTGGAAGTGCTGCTACTTCTTTACTGTCAGAACTCAAGGTTCGAGCTATCATTGAAAAC
GGTCGTCAAATGTGCAAGGTAGATGCTAACTCTCGCCTCTCCTTTCGGATTGTATATCTGTTTGTTTTGTTGCATAAAACAGAAATGTTGTCTATGTTGAATCTGAATGC
GCTCTGTTTGAGAATTCTTGTCTTGTCATTGATGGCTTTGGTTTCTTTAATTTGTTCATATGTCATGTTTACAACGTCTAATCTCAAACCAATCAAAGGAGAGAGAGAGA
GGGGAGGAAAAATGGCTTTTAACTCTTATCTTTACCTCTTCTCCATTGTAATTGATGAACTTGGTTCCTTCAACGTGTACATCTGGAACTTTGTGAACCATAAACCGATC
GTCAGTCAGTTCCGGTACCCACGTCAAGTCCCAGATAAGACGTCGAAAGCAGAGGTGATTAGCAAGGATCTCGTAAAGAGAGGGTTTCGAAGCGTAGGACCAACAGTCAT
CTATACATTCATGCAGGTGGCTGGGTTAACTAATGACCATCTCATCAGTTGCTTTAGGTTTCAAGAATGTATAGAGACACAAACAGCAGAGAAAGGAGAAAAAGATGGTG
AAATCAAGCTTACTGTTAATGAGAAAATGCCAGAGGCTTTGAAAAACTTGGAACTATAAAGAAACCCATTGGTAGCCTTGAACCTTGCCTCAGTGTAATTAGCTTCCAGA
GTTCTTTTTTTCTTTTCTTTTCTTTTTTTTTTTTTTT
Protein sequenceShow/hide protein sequence
MVIAPLVSDSVMSIVRLISTRRNEFHYINVGSRNVLFTIIKDCSHKISGVQMYIKKSIFDPSIREIESMTNSSDPSLLFPSPSFLICDGEFQTEDNKTGGQYMCYVSSRL
CAVFFFSEEWSSCKHRVPFTFETFSPLFINISDKNIKCIVHLMVCKIKFVTSRGSRVVIEMIRIVSHIFPQAVNMGLKCLTQCAPLSMLLVITKIAYAFLEATAAYLMAH
ASIVFSSLVGALSMIAFLPLLDPCYAAFHDEEWGVPVHDDKKLFELLCLSGALAELTWPAILNKRHLFREIFLDFDPNAVSKLNEKKMVAPGSAATSLLSELKVRAIIEN
GRQMCKVDANSRLSFRIVYLFVLLHKTEMLSMLNLNALCLRILVLSLMALVSLICSYVMFTTSNLKPIKGERERGGKMAFNSYLYLFSIVIDELGSFNVYIWNFVNHKPI
VSQFRYPRQVPDKTSKAEVISKDLVKRGFRSVGPTVIYTFMQVAGLTNDHLISCFRFQECIETQTAEKGEKDGEIKLTVNEKMPEALKNLEL