; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lag0009791 (gene) of Sponge gourd (AG-4) v1 genome

Gene IDLag0009791
OrganismLuffa acutangula AG-4 (Sponge gourd (AG-4) v1)
DescriptionDNA glycosylase superfamily protein
Genome locationchr9:42402743..42404184
RNA-Seq ExpressionLag0009791
SyntenyLag0009791
Gene Ontology termsGO:0006284 - base-excision repair (biological process)
GO:0008725 - DNA-3-methyladenine glycosylase activity (molecular function)
InterPro domainsIPR005019 - Methyladenine glycosylase
IPR011257 - DNA glycosylase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0054725.1 putative GMP synthase [Cucumis melo var. makuwa]1.5e-15188.89Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
        M SSS+KILIPAAA   +R RA LDRKKSKSFKLGGNGN    ICDN   EVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE

Query:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG
        KIVP+DSKIKP+VEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFS+KQM+SIS+EYG
Subjt:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG

Query:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
        IDINRVRGVVDN+IRIL+IKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
Subjt:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT

Query:  LIAAGRR--APAVAAAEVEETTTA
        LIAAGRR  AP     EVEE T A
Subjt:  LIAAGRR--APAVAAAEVEETTTA

KAG6570606.1 hypothetical protein SDJN03_29521, partial [Cucurbita argyrosperma subsp. sororia]2.5e-15188.38Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
        M SSSDKILIPAAA   +R +AALDRKKSKSFKL GNG  N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS

Query:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS
        ARF+K+VP+DSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS
Subjt:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS

Query:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH
        SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRH
Subjt:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH

Query:  LHCTLIAAGRRAPAVAAAEVEETTTAA
        LHC++ AA RRAPAV    VEETTTA+
Subjt:  LHCTLIAAGRRAPAVAAAEVEETTTAA

XP_004139917.2 uncharacterized protein LOC101218536 [Cucumis sativus]6.6e-15288.52Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
        M SSS+KILIPAA    +R RA LDRKKSKSFKLGGNGN    ICDN   EVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE

Query:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG
        KIVP+DSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQM+SIS+EYG
Subjt:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG

Query:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
        IDINRVRGVVDNAIRIL+IKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
Subjt:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT

Query:  LIAAGRR--APAVAAAEVEETTTAAAAAETL
        LIAAGRR  AP     EVE+T   AA  ETL
Subjt:  LIAAGRR--APAVAAAEVEETTTAAAAAETL

XP_022943791.1 uncharacterized protein LOC111448434 [Cucurbita moschata]2.5e-15188.38Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
        M SSSDKILIPAAA   +R +AALDRKKSKSFKL GNG  N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS

Query:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS
        ARF+K+VP+DSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS
Subjt:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS

Query:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH
        SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRH
Subjt:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH

Query:  LHCTLIAAGRRAPAVAAAEVEETTTAA
        LHC++ AA RRAPAV    VEETTTA+
Subjt:  LHCTLIAAGRRAPAVAAAEVEETTTAA

XP_038902889.1 uncharacterized protein LOC120089476 [Benincasa hispida]5.8e-15689.49Show/hide
Query:  MTSSSDKILIPAAATAG---ARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA
        M SSSDKILIPAA   G   +R RA LDRKKSKSFKLGGNG  N  ICDN   EVA LSYASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA
Subjt:  MTSSSDKILIPAAATAG---ARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA

Query:  RFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISS
        RFEKIVP+DSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVA FSDKQM+SISS
Subjt:  RFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISS

Query:  EYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHL
        EYGIDINRVRGVVDNAIRIL+IKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHL
Subjt:  EYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHL

Query:  HCTLIAAGRRAPA-VAAAEVEETTTAAAAAETL
        HCTLIAAGRR  A     EVEET TA A +ETL
Subjt:  HCTLIAAGRRAPA-VAAAEVEETTTAAAAAETL

TrEMBL top hitse value%identityAlignment
A0A0A0KED6 Uncharacterized protein3.2e-15288.52Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
        M SSS+KILIPAA    +R RA LDRKKSKSFKLGGNGN    ICDN   EVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE

Query:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG
        KIVP+DSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQM+SIS+EYG
Subjt:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG

Query:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
        IDINRVRGVVDNAIRIL+IKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
Subjt:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT

Query:  LIAAGRR--APAVAAAEVEETTTAAAAAETL
        LIAAGRR  AP     EVE+T   AA  ETL
Subjt:  LIAAGRR--APAVAAAEVEETTTAAAAAETL

A0A5A7UM21 Putative GMP synthase7.2e-15288.89Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
        M SSS+KILIPAAA   +R RA LDRKKSKSFKLGGNGN    ICDN   EVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE

Query:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG
        KIVP+DSKIKP+VEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFS+KQM+SIS+EYG
Subjt:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG

Query:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
        IDINRVRGVVDN+IRIL+IKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
Subjt:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT

Query:  LIAAGRR--APAVAAAEVEETTTA
        LIAAGRR  AP     EVEE T A
Subjt:  LIAAGRR--APAVAAAEVEETTTA

A0A6J1D778 uncharacterized protein LOC1110179894.5e-14686.56Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE
        M SSSDK+++PAA    AR R ALDRKKSKSFKLGG+G +             SLSYASSLIT+SPGSIAAVRREQVALQQAQRKM+IAHYGRSKSARFE
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFE

Query:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG
        KIVPIDSK KPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVH+DK+LFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFD+E VANFSDKQM+SIS+EYG
Subjt:  KIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYG

Query:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT
        IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHL CT
Subjt:  IDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCT

Query:  LIAAGRRAPAVAAAEVEETT
        L+AAGRRAP   A EVEET+
Subjt:  LIAAGRRAPAVAAAEVEETT

A0A6J1FSP1 uncharacterized protein LOC1114484341.2e-15188.38Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
        M SSSDKILIPAAA   +R +AALDRKKSKSFKL GNG  N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS

Query:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS
        ARF+K+VP+DSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS
Subjt:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS

Query:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH
        SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRH
Subjt:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH

Query:  LHCTLIAAGRRAPAVAAAEVEETTTAA
        LHC++ AA RRAPAV    VEETTTA+
Subjt:  LHCTLIAAGRRAPAVAAAEVEETTTAA

A0A6J1J7H3 uncharacterized protein LOC1114841733.6e-15188.07Show/hide
Query:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
        M SSSDKILIPAAA   +R +AALDRKKSKSFKL GNG  N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS
Subjt:  MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKS

Query:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS
        ARF+K+VP+DSKIKPAVE RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS
Subjt:  ARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISIS

Query:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH
        SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQ AGLTNDHLT+CHRH
Subjt:  SEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRH

Query:  LHCTLIAAGRRAPAVAAAEVEETTTAA
        LHC++ AAGRRAPAV    VEETTTA+
Subjt:  LHCTLIAAGRRAPAVAAAEVEETTTAA

SwissProt top hitse value%identityAlignment
P05100 DNA-3-methyladenine glycosylase 11.2e-3439.66Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRGVVDNAI
        RC ++  + DP+Y+AYHD EWGVP  D K LFE++ L   Q G  W ++LKKR+++R  F  FD   VA   ++ +  +  + GI  +R  ++ ++ NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRGVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          L++++    F  ++W FVNH+P   Q  +  +IP  TS S+ +SK + +RGF+ VG T+ +SFMQA GL NDH+  C
Subjt:  RILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

P44321 DNA-3-methyladenine glycosylase2.5e-2936.87Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVR--GVVDNAI
        RC ++   S  IY+ YHD+EWG P  D + LFE + L   Q G  W ++LKKR+ +R AF  FD + +A  +   + +     G+  +R +   +V NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVR--GVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          L ++K   +F  +IW FVNHKP          +P KT  S+ +SK + +RGF  +G T  ++FMQ+ GL +DHL  C
Subjt:  RILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

Q7VG78 Probable GMP synthase [glutamine-hydrolyzing]7.1e-4043.85Show/hide
Query:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRG
        E  RC++ T   +    +Y  YHD EWG P+H+DK LFE LVL   Q G  W +ILKKR+ FR AF  FD  IVAN+ + ++  +    GI  NR  +  
Subjt:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRG

Query:  VVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR
         + NA   + +++EFGSFDKYIWGFV  KP    ++S   +P  T  S+ I+KD+ +RGF+ VG T +++ MQ+ G+ NDHLT+C +
Subjt:  VVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR

Arabidopsis top hitse value%identityAlignment
AT1G75090.1 DNA glycosylase superfamily protein3.0e-5753.19Show/hide
Query:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN--RVRGVVDNA
        +RC +ITPNSDPIYV +HDEEWGVPV DDK LFELLV S A     W SIL++R DFR  F  FD   +A F++K+++S+     + ++  ++R +V+NA
Subjt:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN--RVRGVVDNA

Query:  IRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL
          +L++K+EFGSF  Y W FVNHKP    Y+ G ++PVK+ K+E ISKDM++RGFR VGPTV++SF+QA+G+ NDHLT C R+  C +
Subjt:  IRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL

AT3G12710.1 DNA glycosylase superfamily protein4.1e-9965.05Show/hide
Query:  ARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPIDSKIKPAVE
        A+ R +L+RKKSKSFK G                    SY+S LIT++PGSIAAVRREQVA QQA RK++IAHYGRSKS       K+VP+ +   P   
Subjt:  ARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPIDSKIKPAVE

Query:  DRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAI
         +RCSF+TP SDPIYVAYHDEEWGVPVHDDK LFELL LS AQVGSDWTS L+KR D+R AF  F++E+VA  ++K+M +IS EY I++++VRGVV+NA 
Subjt:  DRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIA
        +I+EIKK F S +KY+WGFVNHKP S  YK GHKIPVKTSKSE+ISKDMVRRGFR VGPTVVHSFMQAAGLTNDHL TC RH  CTL+A
Subjt:  RILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIA

AT5G44680.1 DNA glycosylase superfamily protein2.7e-8763.67Show/hide
Query:  LITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVG
        ++   PGSIAA RRE+VA++Q +RK +I+HYGR KS +  EK + ++ + K     +RCSFIT +SDPIYVAYHD+EWGVPVHDD +LFELLVL+ AQVG
Subjt:  LITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVG

Query:  SDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETI
        SDWTS+LK+R  FR AFS F++E+VA+F++K++ SI ++YGI++++V  VVDNA +IL++K++ GSF+KYIWGF+ HKP + +Y S  KIPVKTSKSETI
Subjt:  SDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETI

Query:  SKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAA
        SKDMVRRGFR VGPTV+HS MQAAGLTNDHL TC RHL CT +AA
Subjt:  SKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAA

AT5G57970.1 DNA glycosylase superfamily protein7.8e-5852.79Show/hide
Query:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN
        +DS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K++I   S     ++
Subjt:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN

Query:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV +K    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC

AT5G57970.2 DNA glycosylase superfamily protein7.8e-5852.79Show/hide
Query:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN
        +DS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K++I   S     ++
Subjt:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN

Query:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV +K    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGACCTCCAGCTCCGACAAGATCCTCATTCCGGCCGCCGCCACCGCCGGAGCTCGTTCTCGTGCCGCCCTGGATAGGAAGAAATCCAAAAGCTTCAAATTGGGTGGCAA
TGGTAATAATAATGGTGGGATTTGTGATAATGTCGTCGTTGAGGTCGCGTCCTTGAGCTACGCTTCTTCGTTGATCACTGACTCGCCGGGGAGTATCGCCGCCGTGAGAA
GAGAGCAGGTGGCGCTGCAGCAGGCGCAGAGGAAGATGAGAATTGCCCATTATGGAAGATCCAAATCTGCTCGGTTTGAAAAAATTGTTCCCATTGATTCTAAAATTAAA
CCCGCTGTTGAAGATAGAAGATGCAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTATCATGATGAAGAATGGGGTGTCCCTGTTCATGATGACAAAATGCT
GTTTGAATTGCTGGTTCTGAGTGTGGCCCAAGTGGGTTCTGATTGGACTTCAATTTTGAAGAAACGCCAAGATTTCAGAAATGCATTTTCAAGTTTCGATTCAGAAATTG
TGGCGAATTTTTCCGACAAACAGATGATCTCAATCAGCTCAGAATACGGCATCGACATTAACAGAGTCCGAGGAGTCGTCGACAACGCAATCCGAATCCTCGAGATTAAG
AAGGAATTTGGGTCATTCGACAAATACATTTGGGGATTTGTGAACCACAAGCCATTTTCACCGCAGTACAAATCCGGCCACAAGATTCCGGTCAAGACATCAAAATCCGA
GACCATAAGCAAAGATATGGTCCGACGAGGATTCCGGTCGGTCGGTCCGACGGTGGTCCACTCCTTCATGCAAGCCGCCGGTCTGACCAACGACCACCTGACCACCTGCC
ACAGGCACCTTCACTGCACCTTGATCGCCGCCGGCCGCCGTGCGCCGGCGGTGGCAGCGGCGGAAGTGGAGGAGACGACGACGGCGGCGGCAGCTGCTGAAACTCTCTAG
mRNA sequenceShow/hide mRNA sequence
ATGACCTCCAGCTCCGACAAGATCCTCATTCCGGCCGCCGCCACCGCCGGAGCTCGTTCTCGTGCCGCCCTGGATAGGAAGAAATCCAAAAGCTTCAAATTGGGTGGCAA
TGGTAATAATAATGGTGGGATTTGTGATAATGTCGTCGTTGAGGTCGCGTCCTTGAGCTACGCTTCTTCGTTGATCACTGACTCGCCGGGGAGTATCGCCGCCGTGAGAA
GAGAGCAGGTGGCGCTGCAGCAGGCGCAGAGGAAGATGAGAATTGCCCATTATGGAAGATCCAAATCTGCTCGGTTTGAAAAAATTGTTCCCATTGATTCTAAAATTAAA
CCCGCTGTTGAAGATAGAAGATGCAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTATCATGATGAAGAATGGGGTGTCCCTGTTCATGATGACAAAATGCT
GTTTGAATTGCTGGTTCTGAGTGTGGCCCAAGTGGGTTCTGATTGGACTTCAATTTTGAAGAAACGCCAAGATTTCAGAAATGCATTTTCAAGTTTCGATTCAGAAATTG
TGGCGAATTTTTCCGACAAACAGATGATCTCAATCAGCTCAGAATACGGCATCGACATTAACAGAGTCCGAGGAGTCGTCGACAACGCAATCCGAATCCTCGAGATTAAG
AAGGAATTTGGGTCATTCGACAAATACATTTGGGGATTTGTGAACCACAAGCCATTTTCACCGCAGTACAAATCCGGCCACAAGATTCCGGTCAAGACATCAAAATCCGA
GACCATAAGCAAAGATATGGTCCGACGAGGATTCCGGTCGGTCGGTCCGACGGTGGTCCACTCCTTCATGCAAGCCGCCGGTCTGACCAACGACCACCTGACCACCTGCC
ACAGGCACCTTCACTGCACCTTGATCGCCGCCGGCCGCCGTGCGCCGGCGGTGGCAGCGGCGGAAGTGGAGGAGACGACGACGGCGGCGGCAGCTGCTGAAACTCTCTAG
Protein sequenceShow/hide protein sequence
MTSSSDKILIPAAATAGARSRAALDRKKSKSFKLGGNGNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIK
PAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEIK
KEFGSFDKYIWGFVNHKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAVAAAEVEETTTAAAAAETL