; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Spg000306 (gene) of Sponge gourd (cylindrica) v1 genome

Gene IDSpg000306
OrganismLuffa cylindrica (Sponge gourd (cylindrica) v1)
DescriptionDNA glycosylase superfamily protein
Genome locationscaffold8:43285110..43287044
RNA-Seq ExpressionSpg000306
SyntenySpg000306
Gene Ontology termsGO:0006284 - base-excision repair (biological process)
GO:0008725 - DNA-3-methyladenine glycosylase activity (molecular function)
InterPro domainsIPR005019 - Methyladenine glycosylase
IPR011257 - DNA glycosylase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6570606.1 hypothetical protein SDJN03_29521, partial [Cucurbita argyrosperma subsp. sororia]1.9e-18587.04Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK
        MCRSEQ+LEAT+VVVD KF  RPVLQPTCNRVLDRRNSLKKPPS   AAVSPTSPKSKSPRPP TKRAND+NPM SSSDKILIPAAA   +R +AALDRK
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK

Query:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS
        KSKSFKL GNG      N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VP+DSKIKPAVEDRRCS
Subjt:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI
        FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SISSEYGIDINRVRGVVDNAIRILEI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET
        KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RRAPA V   VEET
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET

Query:  TTAAAAETL
        TT  A+ETL
Subjt:  TTAAAAETL

XP_004139917.2 uncharacterized protein LOC101218536 [Cucumis sativus]2.4e-18386.41Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLK------KPPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARS
        MCRSE++LEATSVVVD KFN RPVLQPT NRVLDRRNSLK      KPPSA  AAVSPTSPKSKSPRPP TKRAND +NPM SSS+KILIPAA    +R 
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLK------KPPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARS

Query:  RAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDR
        RA LDRKKSKSFKLGGNGN        ICDN   EVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVP+DSKIKPAVEDR
Subjt:  RAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDR

Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRI
        RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQM+SIS+EYGIDINRVRGVVDNAIRI
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRI

Query:  LEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEV
        L+IKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRR PA      
Subjt:  LEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEV

Query:  EETTTAAAAETL
        E   TAA  ETL
Subjt:  EETTTAAAAETL

XP_022943791.1 uncharacterized protein LOC111448434 [Cucurbita moschata]8.7e-18687.29Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK
        MCRSEQ+LEATSVVVD KF  RPVLQPTCNRVLDRRNSLKKPPS   AAVSPTSPKSKSPRPP TKRAND+NPM SSSDKILIPAAA   +R +AALDRK
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK

Query:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS
        KSKSFKL GNG      N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VP+DSKIKPAVEDRRCS
Subjt:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI
        FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SISSEYGIDINRVRGVVDNAIRILEI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET
        KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RRAPA V   VEET
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET

Query:  TTAAAAETL
        TT  A+ETL
Subjt:  TTAAAAETL

XP_022986422.1 uncharacterized protein LOC111484173 [Cucurbita maxima]9.6e-18587.13Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK
        MCRSEQ+LEATSVVVD KF  RPVLQPTCNRVLDRRNSLKKPPS   AAVSPTSPKSKSPRPP TKRAN++NPM SSSDKILIPAAA   +R +AALDRK
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK

Query:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS
        KSKSFKL GNG      N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VP+DSKIKPAVE RRCS
Subjt:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI
        FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SISSEYGIDINRVRGVVDNAIRILEI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET
        KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQ AGLTNDHLT+CHRHLHC++ AAGRRAPA V   VEET
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET

Query:  TTAA
        TTA+
Subjt:  TTAA

XP_038902889.1 uncharacterized protein LOC120089476 [Benincasa hispida]9.3e-18887.26Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLK-----KPPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGG---A
        MCRSE++LEA++VVVD KFN RPVLQPTCNRVLDRRNSLK     KPPSA  AAVSPTSPKSKSPRPP TKRAND +NPM SSSDKILIPAA  GG   +
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLK-----KPPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGG---A

Query:  RSRAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVE
        R RA LDRKKSKSFKLGGNG      N  ICDN   EVA LSYASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVP+DSKIKPAVE
Subjt:  RSRAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVE

Query:  DRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAI
        DRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVA FSDKQM+SISSEYGIDINRVRGVVDNAI
Subjt:  DRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPA-AVA
        RIL+IKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRR  A    
Subjt:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPA-AVA

Query:  AEVEETTTA-AAAETL
         EVEET TA A +ETL
Subjt:  AEVEETTTA-AAAETL

TrEMBL top hitse value%identityAlignment
A0A0A0KED6 Uncharacterized protein1.1e-18386.41Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLK------KPPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARS
        MCRSE++LEATSVVVD KFN RPVLQPT NRVLDRRNSLK      KPPSA  AAVSPTSPKSKSPRPP TKRAND +NPM SSS+KILIPAA    +R 
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLK------KPPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARS

Query:  RAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDR
        RA LDRKKSKSFKLGGNGN        ICDN   EVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVP+DSKIKPAVEDR
Subjt:  RAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDR

Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRI
        RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQM+SIS+EYGIDINRVRGVVDNAIRI
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRI

Query:  LEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEV
        L+IKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRR PA      
Subjt:  LEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEV

Query:  EETTTAAAAETL
        E   TAA  ETL
Subjt:  EETTTAAAAETL

A0A5A7UM21 Putative GMP synthase4.3e-18386.24Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKK-----PPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARSR
        MCRSE++LEATSVVVD KFN RPVLQPTCNRVLDRRNSLKK      P +  AAVSPTSPKSKSPRPP TKRAND +NPM SSS+KILIPAAA   +R R
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKK-----PPSATPAAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARSR

Query:  AALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRR
        A LDRKKSKSFKLGGNGN        ICDN   EVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVP+DSKIKP+VEDRR
Subjt:  AALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRR

Query:  CSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRIL
        CSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFS+KQM+SIS+EYGIDINRVRGVVDN+IRIL
Subjt:  CSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRIL

Query:  EIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRR--APAAVAAE
        +IKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRR  AP     E
Subjt:  EIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRR--APAAVAAE

Query:  VEETTTA
        VEE T A
Subjt:  VEETTTA

A0A6J1D778 uncharacterized protein LOC1110179891.4e-16582.04Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKK-PPSATP--AAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARSRAA
        MCRSEQ +EATSVV      GR VLQPTCNR L RRNSLKK PPS +P  +  SP SPKSKSPRPP TKRAND +  M SSSDK+++PAA    AR R A
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKK-PPSATP--AAVSPTSPKSKSPRPPPTKRAND-SNPMTSSSDKILIPAAATGGARSRAA

Query:  LDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS
        LDRKKSKSFKLGG+G +                 SLSYASSLIT+SPGSIAAVRREQVALQQAQRKM+IAHYGRSKSARFEKIVPIDSK KPAVEDRRCS
Subjt:  LDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI
        FITPNSDPIYVAYHDEEWGVPVH+DK+LFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFD+E VANFSDKQM+SIS+EYGIDINRVRGVVDNAIRILEI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET
        KKEFGSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHL CTL+AAGRRAP AV  EVEET
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET

Query:  T
        +
Subjt:  T

A0A6J1FSP1 uncharacterized protein LOC1114484344.2e-18687.29Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK
        MCRSEQ+LEATSVVVD KF  RPVLQPTCNRVLDRRNSLKKPPS   AAVSPTSPKSKSPRPP TKRAND+NPM SSSDKILIPAAA   +R +AALDRK
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK

Query:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS
        KSKSFKL GNG      N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VP+DSKIKPAVEDRRCS
Subjt:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI
        FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SISSEYGIDINRVRGVVDNAIRILEI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET
        KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RRAPA V   VEET
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET

Query:  TTAAAAETL
        TT  A+ETL
Subjt:  TTAAAAETL

A0A6J1J7H3 uncharacterized protein LOC1114841734.6e-18587.13Show/hide
Query:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK
        MCRSEQ+LEATSVVVD KF  RPVLQPTCNRVLDRRNSLKKPPS   AAVSPTSPKSKSPRPP TKRAN++NPM SSSDKILIPAAA   +R +AALDRK
Subjt:  MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRK

Query:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS
        KSKSFKL GNG      N  ICDNV      EVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VP+DSKIKPAVE RRCS
Subjt:  KSKSFKLGGNGNNNNNNNGGICDNVV----VEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI
        FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SISSEYGIDINRVRGVVDNAIRILEI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET
        KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQ AGLTNDHLT+CHRHLHC++ AAGRRAPA V   VEET
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEET

Query:  TTAA
        TTA+
Subjt:  TTAA

SwissProt top hitse value%identityAlignment
P05100 DNA-3-methyladenine glycosylase 19.4e-3439.11Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRGVVDNAI
        RC ++  + DP+Y+AYHD EWGVP  D K LFE++ L   Q G  W ++LKKR+++R  F  FD   VA   ++ +  +  + GI  +R  ++ ++ NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRGVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          L++++    F  ++W FVN++P   Q  +  +IP  TS S+ +SK + +RGF+ VG T+ +SFMQA GL NDH+  C
Subjt:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

P44321 DNA-3-methyladenine glycosylase2.0e-2836.31Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVR--GVVDNAI
        RC ++   S  IY+ YHD+EWG P  D + LFE + L   Q G  W ++LKKR+ +R AF  FD + +A  +   + +     G+  +R +   +V NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVR--GVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          L ++K   +F  +IW FVN+KP          +P KT  S+ +SK + +RGF  +G T  ++FMQ+ GL +DHL  C
Subjt:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

Q7VG78 Probable GMP synthase [glutamine-hydrolyzing]5.2e-4043.85Show/hide
Query:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRG
        E  RC++ T   +    +Y  YHD EWG P+H+DK LFE LVL   Q G  W +ILKKR+ FR AF  FD  IVAN+ + ++  +    GI  NR  +  
Subjt:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINR--VRG

Query:  VVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR
         + NA   + +++EFGSFDKYIWGFV  KP    ++S   +P  T  S+ I+KD+ +RGF+ VG T +++ MQ+ G+ NDHLT+C +
Subjt:  VVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR

Arabidopsis top hitse value%identityAlignment
AT1G75090.1 DNA glycosylase superfamily protein2.4e-5652.66Show/hide
Query:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN--RVRGVVDNA
        +RC +ITPNSDPIYV +HDEEWGVPV DDK LFELLV S A     W SIL++R DFR  F  FD   +A F++K+++S+     + ++  ++R +V+NA
Subjt:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN--RVRGVVDNA

Query:  IRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL
          +L++K+EFGSF  Y W FVN+KP    Y+ G ++PVK+ K+E ISKDM++RGFR VGPTV++SF+QA+G+ NDHLT C R+  C +
Subjt:  IRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL

AT3G12710.1 DNA glycosylase superfamily protein3.3e-9863.73Show/hide
Query:  GGARSRAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPIDSK
        G A+ R +L+RKKSKSFK G                        SY+S LIT++PGSIAAVRREQVA QQA RK++IAHYGRSKS       K+VP+ + 
Subjt:  GGARSRAALDRKKSKSFKLGGNGNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPIDSK

Query:  IKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRG
          P    +RCSF+TP SDPIYVAYHDEEWGVPVHDDK LFELL LS AQVGSDWTS L+KR D+R AF  F++E+VA  ++K+M +IS EY I++++VRG
Subjt:  IKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRG

Query:  VVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIA
        VV+NA +I+EIKK F S +KY+WGFVN+KP S  YK GHKIPVKTSKSE+ISKDMVRRGFR VGPTVVHSFMQAAGLTNDHL TC RH  CTL+A
Subjt:  VVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIA

AT5G44680.1 DNA glycosylase superfamily protein7.8e-9252.59Show/hide
Query:  KFNGRPVLQPTCNRV--LDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRKKSKSFKLGGNGNNNN
        + NGRPVLQP  N+V  LDRRNSLKK P   P  ++P + K  SPRP     +  S P++ ++  +  PA   G  +        KSK         +  
Subjt:  KFNGRPVLQPTCNRV--LDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRKKSKSFKLGGNGNNNN

Query:  NNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEW
        N++GG  + + + +         +   PGSIAA RRE+VA++Q +RK +I+HYGR KS +  EK + ++ + K     +RCSFIT +SDPIYVAYHD+EW
Subjt:  NNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEW

Query:  GVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNK
        GVPVHDD +LFELLVL+ AQVGSDWTS+LK+R  FR AFS F++E+VA+F++K++ SI ++YGI++++V  VVDNA +IL++K++ GSF+KYIWGF+ +K
Subjt:  GVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNK

Query:  PFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAA
        P + +Y S  KIPVKTSKSETISKDMVRRGFR VGPTV+HS MQAAGLTNDHL TC RHL CT +AA
Subjt:  PFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAA

AT5G57970.1 DNA glycosylase superfamily protein2.5e-5853.3Show/hide
Query:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN
        +DS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K++I   S     ++
Subjt:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN

Query:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC

AT5G57970.2 DNA glycosylase superfamily protein2.5e-5853.3Show/hide
Query:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN
        +DS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K++I   S     ++
Subjt:  IDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDIN

Query:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTGTCGTTCCGAGCAATCCTTGGAAGCCACTTCTGTCGTCGTCGATCCCAAATTCAACGGCCGTCCCGTCCTTCAACCCACCTGCAACCGCGTCCTCGACCGCCGTAA
TTCCCTCAAAAAACCCCCCTCCGCCACCCCCGCCGCCGTCTCCCCCACCTCCCCCAAGTCCAAATCCCCCCGCCCTCCGCCCACCAAGCGCGCCAATGACAGCAACCCCA
TGACCTCCAGCTCCGATAAGATCCTCATTCCGGCCGCCGCCACCGGCGGAGCTCGTTCTCGAGCCGCCCTGGATAGGAAGAAATCCAAAAGCTTCAAATTGGGTGGCAAT
GGGAATAATAATAATAATAATAATGGTGGGATTTGTGATAATGTCGTCGTTGAGGTCGCGTCCTTGAGCTACGCTTCTTCGTTGATCACTGACTCGCCGGGGAGTATCGC
CGCCGTGAGAAGAGAGCAGGTGGCGCTGCAGCAGGCGCAGAGGAAGATGAGAATTGCCCATTACGGAAGATCCAAATCTGCTCGGTTTGAAAAAATTGTTCCCATCGATT
CTAAAATTAAACCCGCTGTTGAAGATAGAAGATGCAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTATCATGATGAAGAATGGGGTGTCCCTGTTCATGAT
GACAAAATGCTGTTTGAATTGCTGGTTCTGAGTGTGGCCCAAGTGGGTTCTGATTGGACTTCAATTTTGAAGAAACGCCAAGATTTCAGAAATGCATTTTCAAGTTTCGA
TTCAGAAATTGTGGCGAATTTTTCCGACAAACAGATGATCTCAATCAGCTCAGAATACGGCATCGACATTAACAGAGTCCGAGGAGTCGTCGACAACGCAATCCGAATCC
TCGAGATTAAGAAGGAATTTGGGTCATTCGACAAATACATTTGGGGATTTGTGAACAACAAGCCATTTTCACCGCAGTACAAATCCGGCCACAAAATTCCGGTCAAGACA
TCGAAATCTGAGACCATAAGCAAAGATATGGTCCGACGAGGATTCCGGTCGGTCGGTCCGACGGTGGTCCACTCCTTCATGCAAGCCGCCGGTCTGACCAACGACCACCT
GACCACCTGCCACAGGCACCTTCACTGCACCTTGATCGCCGCCGGCCGCCGTGCGCCAGCGGCGGTGGCGGCGGAAGTGGAGGAGACGACGACGGCGGCAGCTGCTGAAA
CCCTCTAG
mRNA sequenceShow/hide mRNA sequence
ATGTGTCGTTCCGAGCAATCCTTGGAAGCCACTTCTGTCGTCGTCGATCCCAAATTCAACGGCCGTCCCGTCCTTCAACCCACCTGCAACCGCGTCCTCGACCGCCGTAA
TTCCCTCAAAAAACCCCCCTCCGCCACCCCCGCCGCCGTCTCCCCCACCTCCCCCAAGTCCAAATCCCCCCGCCCTCCGCCCACCAAGCGCGCCAATGACAGCAACCCCA
TGACCTCCAGCTCCGATAAGATCCTCATTCCGGCCGCCGCCACCGGCGGAGCTCGTTCTCGAGCCGCCCTGGATAGGAAGAAATCCAAAAGCTTCAAATTGGGTGGCAAT
GGGAATAATAATAATAATAATAATGGTGGGATTTGTGATAATGTCGTCGTTGAGGTCGCGTCCTTGAGCTACGCTTCTTCGTTGATCACTGACTCGCCGGGGAGTATCGC
CGCCGTGAGAAGAGAGCAGGTGGCGCTGCAGCAGGCGCAGAGGAAGATGAGAATTGCCCATTACGGAAGATCCAAATCTGCTCGGTTTGAAAAAATTGTTCCCATCGATT
CTAAAATTAAACCCGCTGTTGAAGATAGAAGATGCAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTATCATGATGAAGAATGGGGTGTCCCTGTTCATGAT
GACAAAATGCTGTTTGAATTGCTGGTTCTGAGTGTGGCCCAAGTGGGTTCTGATTGGACTTCAATTTTGAAGAAACGCCAAGATTTCAGAAATGCATTTTCAAGTTTCGA
TTCAGAAATTGTGGCGAATTTTTCCGACAAACAGATGATCTCAATCAGCTCAGAATACGGCATCGACATTAACAGAGTCCGAGGAGTCGTCGACAACGCAATCCGAATCC
TCGAGATTAAGAAGGAATTTGGGTCATTCGACAAATACATTTGGGGATTTGTGAACAACAAGCCATTTTCACCGCAGTACAAATCCGGCCACAAAATTCCGGTCAAGACA
TCGAAATCTGAGACCATAAGCAAAGATATGGTCCGACGAGGATTCCGGTCGGTCGGTCCGACGGTGGTCCACTCCTTCATGCAAGCCGCCGGTCTGACCAACGACCACCT
GACCACCTGCCACAGGCACCTTCACTGCACCTTGATCGCCGCCGGCCGCCGTGCGCCAGCGGCGGTGGCGGCGGAAGTGGAGGAGACGACGACGGCGGCAGCTGCTGAAA
CCCTCTAG
Protein sequenceShow/hide protein sequence
MCRSEQSLEATSVVVDPKFNGRPVLQPTCNRVLDRRNSLKKPPSATPAAVSPTSPKSKSPRPPPTKRANDSNPMTSSSDKILIPAAATGGARSRAALDRKKSKSFKLGGN
GNNNNNNNGGICDNVVVEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPIDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHD
DKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMISISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKT
SKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRAPAAVAAEVEETTTAAAAETL