; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CSPI06G10900 (gene) of Cucumber (PI 183967) v1 genome

Gene IDCSPI06G10900
OrganismCucumis sativus L. var. sativus cv. PI 183967 (Cucumber (PI 183967) v1)
DescriptionDNA glycosylase superfamily protein
Genome locationChr6:9510827..9513383
RNA-Seq ExpressionCSPI06G10900
SyntenyCSPI06G10900
Gene Ontology termsGO:0006284 - base-excision repair (biological process)
GO:0008725 - DNA-3-methyladenine glycosylase activity (molecular function)
InterPro domainsIPR005019 - Methyladenine glycosylase
IPR011257 - DNA glycosylase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0054725.1 putative GMP synthase [Cucumis melo var. makuwa]9.7e-21497.24Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL
        MCRSEE LEATSVVVDSKFNSRPVLQPT NRVLDRRNSLKKQHPSLKPPS AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA SRPRATL
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL

Query:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV
        DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKP+VEDRRCSFITPNSDPIYV
Subjt:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFS+KQMVSISTEYGIDINRVRGVVDN+IRILQIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEV-EDTAAVCETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL AAGRRTPAPTTTTPEV EDTAAVC+ L
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEV-EDTAAVCETL

KAG6570606.1 hypothetical protein SDJN03_29521, partial [Cucurbita argyrosperma subsp. sororia]1.5e-18285.47Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL
        MCRSE+ LEAT+VVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIP AA+SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL

Query:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGN VICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDRRCSFIT
Subjt:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++TAA RR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           ETL
Subjt:  AVCETL

XP_004139917.2 uncharacterized protein LOC101218536 [Cucumis sativus]8.2e-22199.75Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
        MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD

Query:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
        RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
Subjt:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA

Query:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
        YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
Subjt:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW

Query:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTAAVCETL
        GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL AAGRRTPAPTTTTPEVEDTAAVCETL
Subjt:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTAAVCETL

XP_022943791.1 uncharacterized protein LOC111448434 [Cucurbita moschata]6.7e-18385.71Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL
        MCRSE+ LEATSVVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIP AA+SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL

Query:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGN VICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDRRCSFIT
Subjt:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++TAA RR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           ETL
Subjt:  AVCETL

XP_038902889.1 uncharacterized protein LOC120089476 [Benincasa hispida]5.1e-19993.3Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSA--AAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA------V
        MCRSEE LEA++VVVDSKFN+RPVLQPT NRVLDRRNSLKKQ PSLKPPSA  AAVSPTSPKSKSPRPPATKRANDGNNPMNSSS+KILIPAA      V
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSA--AAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA------V

Query:  SRPRATLDRKKSKSFKLGGNGN-VICDNGGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCS
        SRPRATLDRKKSKSFKLGGNGN VICDNGG+EVA   YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCS
Subjt:  SRPRATLDRKKSKSFKLGGNGN-VICDNGGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQI
        FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVA FSDKQMVSIS+EYGIDINRVRGVVDNAIRILQI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVE
        KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL AAGRRT A TTTT EVE
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVE

Query:  DTA
        +TA
Subjt:  DTA

TrEMBL top hitse value%identityAlignment
A0A0A0KED6 Uncharacterized protein3.9e-22199.75Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
        MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD

Query:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
        RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
Subjt:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA

Query:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
        YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
Subjt:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW

Query:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTAAVCETL
        GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL AAGRRTPAPTTTTPEVEDTAAVCETL
Subjt:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTAAVCETL

A0A5A7UM21 Putative GMP synthase4.7e-21497.24Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL
        MCRSEE LEATSVVVDSKFNSRPVLQPT NRVLDRRNSLKKQHPSLKPPS AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA SRPRATL
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL

Query:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV
        DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKP+VEDRRCSFITPNSDPIYV
Subjt:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFS+KQMVSISTEYGIDINRVRGVVDN+IRILQIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEV-EDTAAVCETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTL AAGRRTPAPTTTTPEV EDTAAVC+ L
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEV-EDTAAVCETL

A0A6J1D778 uncharacterized protein LOC1110179891.5e-16782.61Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
        MCRSE+ +EATSVV       R VLQPT NR L RRNSLKKQ PS  PP  +  SP SPKSKSPRPPATKRAND    MNSSS+K+++PAA +RPRA LD
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD

Query:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
        RKKSKSFKLGG+G    D     ++YASSLITESPGSIAAVRREQVALQQAQRKM+IAHYGRSKSARFEKIVP+DSK KPAVEDRRCSFITPNSDPIYVA
Subjt:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA

Query:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
        YHDEEWGVPVH+DK+LFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFD+E VANFSDKQMVSISTEYGIDINRVRGVVDNAIRIL+IKKEFGSFDKYIW
Subjt:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW

Query:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA
        GFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHL CTL AAGRR P       EVE+T+
Subjt:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA

A0A6J1FSP1 uncharacterized protein LOC1114484343.3e-18385.71Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL
        MCRSE+ LEATSVVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIP AA+SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL

Query:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGN VICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDRRCSFIT
Subjt:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++TAA RR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           ETL
Subjt:  AVCETL

A0A6J1J7H3 uncharacterized protein LOC1114841738.0e-18284.98Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL
        MCRSE+ LEATSVVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAN+  NPMNSSS+KILIP AA+SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIP-AAVSRPRATL

Query:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGN VICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVE RRCSFIT
Subjt:  DRKKSKSFKLGGNGN-VICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQ AGLTNDHLT+CHRHLHC++TAAGRR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           E+L
Subjt:  AVCETL

SwissProt top hitse value%identityAlignment
P05100 DNA-3-methyladenine glycosylase 14.1e-3439.66Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRGVVDNAI
        RC ++  + DP+Y+AYHD EWGVP  D K LFE++ L   Q G  W ++LKKR+++R  F  FD   VA   ++ +  +  + GI  +R  ++ ++ NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRGVVDNAI

Query:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          LQ+++    F  ++W FVN++P   Q  +  +IP  TS S+ +SK + +RGF+ VG T+ +SFMQA GL NDH+  C
Subjt:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

P44321 DNA-3-methyladenine glycosylase2.6e-2836.31Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVR--GVVDNAI
        RC ++   S  IY+ YHD+EWG P  D + LFE + L   Q G  W ++LKKR+ +R AF  FD + +A  +   + +     G+  +R +   +V NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVR--GVVDNAI

Query:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          L ++K   +F  +IW FVN+KP          +P KT  S+ +SK + +RGF  +G T  ++FMQ+ GL +DHL  C
Subjt:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

Q7VG78 Probable GMP synthase [glutamine-hydrolyzing]3.9e-4043.85Show/hide
Query:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRG
        E  RC++ T   +    +Y  YHD EWG P+H+DK LFE LVL   Q G  W +ILKKR+ FR AF  FD  IVAN+ + ++  +    GI  NR  +  
Subjt:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRG

Query:  VVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR
         + NA   + +++EFGSFDKYIWGFV  KP    ++S   +P  T  S+ I+KD+ +RGF+ VG T +++ MQ+ G+ NDHLT+C +
Subjt:  VVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR

Arabidopsis top hitse value%identityAlignment
AT1G75090.1 DNA glycosylase superfamily protein3.0e-5650.99Show/hide
Query:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN--RVRGVVDNA
        +RC +ITPNSDPIYV +HDEEWGVPV DDK LFELLV S A     W SIL++R DFR  F  FD   +A F++K+++S+     + ++  ++R +V+NA
Subjt:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN--RVRGVVDNA

Query:  IRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTT
          +L++K+EFGSF  Y W FVN+KP    Y+ G ++PVK+ K+E ISKDM++RGFR VGPTV++SF+QA+G+ NDHLT C R+  C +    R T +  T
Subjt:  IRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTT

Query:  TT
         T
Subjt:  TT

AT3G12710.1 DNA glycosylase superfamily protein1.4e-9865.72Show/hide
Query:  SRPRATLDRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPLDSKIKPAVEDRRCSF
        ++ R +L+RKKSKSFK G              +Y+S LITE+PGSIAAVRREQVA QQA RK++IAHYGRSKS       K+VPL +   P    +RCSF
Subjt:  SRPRATLDRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPLDSKIKPAVEDRRCSF

Query:  ITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIK
        +TP SDPIYVAYHDEEWGVPVHDDK LFELL LS AQVGSDWTS L+KR D+R AF  F++E+VA  ++K+M +IS EY I++++VRGVV+NA +I++IK
Subjt:  ITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIK

Query:  KEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTA
        K F S +KY+WGFVN+KP S  YK GHKIPVKTSKSE+ISKDMVRRGFR VGPTVVHSFMQAAGLTNDHL TC RH  CTL A
Subjt:  KEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTA

AT5G44680.1 DNA glycosylase superfamily protein1.3e-9453.33Show/hide
Query:  SKFNSRPVLQPTGNRV--LDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLDRKKSKSFKLGGNGN
        S+ N RPVLQP  N+V  LDRRNSLKK  P  KP     ++P + K  SPRP +       + P++ +++ +  PA   +        KSK      N  
Subjt:  SKFNSRPVLQPTGNRV--LDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLDRKKSKSFKLGGNGN

Query:  VICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDD
            +GG++      ++ + PGSIAA RRE+VA++Q +RK +I+HYGR KS +  EK + ++ + K     +RCSFIT +SDPIYVAYHD+EWGVPVHDD
Subjt:  VICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDD

Query:  KMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYK
         +LFELLVL+ AQVGSDWTS+LK+R  FR AFS F++E+VA+F++K++ SI  +YGI++++V  VVDNA +IL++K++ GSF+KYIWGF+ +KP + +Y 
Subjt:  KMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYK

Query:  SGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAA
        S  KIPVKTSKSETISKDMVRRGFR VGPTV+HS MQAAGLTNDHL TC RHL CT  AA
Subjt:  SGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAA

AT5G57970.1 DNA glycosylase superfamily protein3.2e-5852.79Show/hide
Query:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN
        LDS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K+++   +     ++
Subjt:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN

Query:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC

AT5G57970.2 DNA glycosylase superfamily protein3.2e-5852.79Show/hide
Query:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN
        LDS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K+++   +     ++
Subjt:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN

Query:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTGTCGTTCCGAGGAGACCTTGGAAGCCACTTCTGTCGTGGTCGATTCAAAATTCAATTCCCGTCCTGTCCTTCAACCCACTGGTAACCGTGTCCTCGACCGCCGTAA
TTCCCTCAAAAAACAACACCCTTCTCTCAAACCCCCTTCCGCCGCCGCCGTCTCCCCCACTTCTCCTAAATCCAAATCCCCCCGTCCTCCGGCCACCAAACGAGCCAATG
ACGGTAATAATCCCATGAACTCCAGCTCCGAGAAGATCCTCATTCCGGCCGCAGTGTCACGGCCCAGAGCTACGTTGGATAGAAAGAAATCGAAAAGCTTTAAACTGGGT
GGAAATGGGAATGTGATTTGTGATAATGGTGGGTTTGAGGTGGCGTATGCTTCTTCTTTGATTACTGAATCGCCAGGAAGTATCGCCGCCGTGAGAAGAGAACAGGTGGC
GCTGCAACAGGCGCAGAGGAAAATGAGAATTGCTCATTACGGAAGATCTAAATCTGCTCGTTTTGAAAAAATCGTTCCTCTTGATTCTAAAATTAAACCCGCTGTTGAAG
ATAGAAGATGTAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTACCATGATGAGGAATGGGGTGTCCCTGTTCATGATGACAAGATGCTGTTTGAATTGCTG
GTTCTAAGTGTAGCCCAGGTGGGTTCGGATTGGACTTCAATTCTGAAGAAACGTCAAGATTTCAGGAATGCATTTTCAAGTTTCGATTCAGAAATTGTGGCAAATTTTTC
GGACAAACAAATGGTTTCAATCAGCACAGAATATGGCATCGACATCAACAGAGTCCGAGGAGTTGTGGATAACGCAATTCGAATCCTCCAGATTAAGAAGGAATTTGGGT
CATTCGACAAATACATTTGGGGATTTGTGAACAACAAACCATTCTCACCGCAGTACAAATCCGGCCACAAAATTCCGGTGAAGACATCAAAATCAGAAACCATAAGCAAA
GACATGGTCAGACGAGGTTTCCGGTCCGTCGGACCCACGGTGGTTCACTCCTTCATGCAAGCCGCCGGTCTAACCAACGACCATCTCACCACTTGCCACAGGCACCTCCA
TTGCACCTTAACCGCCGCCGGCCGCCGTACTCCGGCTCCGACGACGACAACACCCGAAGTGGAGGATACGGCGGCGGTTTGTGAAACACTCTAG
mRNA sequenceShow/hide mRNA sequence
GAGGATGCATCCAACTTCTTCTCTCATCCAATTCCTTTATAAAACCCATCTCTCTCCCATTCCACCTCTCTTCACTAATTCCCATTTCCCAATTCTCTCTCTCTCTCTCT
CTCTCTCTCTCTCTTAATTCACCAAAACTAAAAACCAAAAACTAAAAAAACGATGTGTCGTTCCGAGGAGACCTTGGAAGCCACTTCTGTCGTGGTCGATTCAAAATTCA
ATTCCCGTCCTGTCCTTCAACCCACTGGTAACCGTGTCCTCGACCGCCGTAATTCCCTCAAAAAACAACACCCTTCTCTCAAACCCCCTTCCGCCGCCGCCGTCTCCCCC
ACTTCTCCTAAATCCAAATCCCCCCGTCCTCCGGCCACCAAACGAGCCAATGACGGTAATAATCCCATGAACTCCAGCTCCGAGAAGATCCTCATTCCGGCCGCAGTGTC
ACGGCCCAGAGCTACGTTGGATAGAAAGAAATCGAAAAGCTTTAAACTGGGTGGAAATGGGAATGTGATTTGTGATAATGGTGGGTTTGAGGTGGCGTATGCTTCTTCTT
TGATTACTGAATCGCCAGGAAGTATCGCCGCCGTGAGAAGAGAACAGGTGGCGCTGCAACAGGCGCAGAGGAAAATGAGAATTGCTCATTACGGAAGATCTAAATCTGCT
CGTTTTGAAAAAATCGTTCCTCTTGATTCTAAAATTAAACCCGCTGTTGAAGATAGAAGATGTAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTACCATGA
TGAGGAATGGGGTGTCCCTGTTCATGATGACAAGATGCTGTTTGAATTGCTGGTTCTAAGTGTAGCCCAGGTGGGTTCGGATTGGACTTCAATTCTGAAGAAACGTCAAG
ATTTCAGGAATGCATTTTCAAGTTTCGATTCAGAAATTGTGGCAAATTTTTCGGACAAACAAATGGTTTCAATCAGCACAGAATATGGCATCGACATCAACAGAGTCCGA
GGAGTTGTGGATAACGCAATTCGAATCCTCCAGATTAAGAAGGAATTTGGGTCATTCGACAAATACATTTGGGGATTTGTGAACAACAAACCATTCTCACCGCAGTACAA
ATCCGGCCACAAAATTCCGGTGAAGACATCAAAATCAGAAACCATAAGCAAAGACATGGTCAGACGAGGTTTCCGGTCCGTCGGACCCACGGTGGTTCACTCCTTCATGC
AAGCCGCCGGTCTAACCAACGACCATCTCACCACTTGCCACAGGCACCTCCATTGCACCTTAACCGCCGCCGGCCGCCGTACTCCGGCTCCGACGACGACAACACCCGAA
GTGGAGGATACGGCGGCGGTTTGTGAAACACTCTAGAATTGACTCGAGAATTTTAATTAACAGACAAAAAGAAAAAATGATAACCTTTACGAGGAGTCAATCAACCATGA
TTTGCTTGCTAATTAACTAGATAACTAAATATATATCTTTGGGTTTTTCTTTTGTGGGGTTTGTGTATATTATAAAAAAATAGACTTGTAAGAGAAAAAGAAAAAAAAAA
GAGATTGTGGGGTTGTGAATTTGTGTGGTTTTTTTTCTTTCTTTTCTTTTTTGTGGGAATTTTAGTGAAAGTGTTTTATATAATTAGAAGAAAAAAAGAAAAAAAGAAGA
AGGTTATTTGAAGTGGTAGGGTTAGAATAGGAGACAGAGAGCATGTGCTTGTGCAATTGGGAGGCAATGGCATGTGAGTTTGTGTCAGTTTGCTTTTGTAAATTCCCATG
TGATCCATCTAAATTTCAAACATTATTAATCATTATTATCTTATTATTATTCTTTTATTTTCAACACCCTGTTTCCTTTGCTTTGCTTTATT
Protein sequenceShow/hide protein sequence
MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLDRKKSKSFKLG
GNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELL
VLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISK
DMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLTAAGRRTPAPTTTTPEVEDTAAVCETL