; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cucsat.G17976 (gene) of Cucumber (B10) v3 genome

Gene IDCucsat.G17976
OrganismCucumis sativus L. var. sativus cv. B10 (Cucumber (B10) v3)
DescriptionDNA glycosylase superfamily protein
Genome locationctg3345:2540808..2543273
RNA-Seq ExpressionCucsat.G17976
SyntenyCucsat.G17976
Gene Ontology termsGO:0006284 - base-excision repair (biological process)
GO:0008725 - DNA-3-methyladenine glycosylase activity (molecular function)
InterPro domainsIPR005019 - Methyladenine glycosylase
IPR011257 - DNA glycosylase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0054725.1 putative GMP synthase [Cucumis melo var. makuwa]5.80e-27597.49Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL
        MCRSEE LEATSVVVDSKFNSRPVLQPT NRVLDRRNSLKKQHPSLKPPS AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA SRPRATL
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL

Query:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV
        DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKP+VEDRRCSFITPNSDPIYV
Subjt:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFS+KQMVSISTEYGIDINRVRGVVDN+IRILQIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE-DTAAVCETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE DTAAVC+ L
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE-DTAAVCETL

KAG6570606.1 hypothetical protein SDJN03_29521, partial [Cucurbita argyrosperma subsp. sororia]2.11e-23285.22Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL
        MCRSE+ LEAT+VVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIPAA +SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL

Query:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGNV ICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDRRCSFIT
Subjt:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           ETL
Subjt:  AVCETL

XP_004139917.2 uncharacterized protein LOC101218536 [Cucumis sativus]2.71e-284100Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
        MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD

Query:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
        RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
Subjt:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA

Query:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
        YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
Subjt:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW

Query:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTAAVCETL
        GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTAAVCETL
Subjt:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTAAVCETL

XP_022943791.1 uncharacterized protein LOC111448434 [Cucurbita moschata]7.36e-23385.47Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL
        MCRSE+ LEATSVVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIPAA +SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL

Query:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGNV ICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDRRCSFIT
Subjt:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           ETL
Subjt:  AVCETL

XP_038902889.1 uncharacterized protein LOC120089476 [Benincasa hispida]1.39e-25593.55Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAA--AVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA------V
        MCRSEE LEA++VVVDSKFN+RPVLQPT NRVLDRRNSLKKQ PSLKPPSAA  AVSPTSPKSKSPRPPATKRANDGNNPMNSSS+KILIPAA      V
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAA--AVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA------V

Query:  SRPRATLDRKKSKSFKLGGNGNV-ICDNGGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCS
        SRPRATLDRKKSKSFKLGGNGNV ICDNGG+EVA   YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCS
Subjt:  SRPRATLDRKKSKSFKLGGNGNV-ICDNGGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCS

Query:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQI
        FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVA FSDKQMVSIS+EYGIDINRVRGVVDNAIRILQI
Subjt:  FITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQI

Query:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE
        KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRT A TTTT EVE
Subjt:  KKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE

Query:  DTA
        +TA
Subjt:  DTA

TrEMBL top hitse value%identityAlignment
A0A0A0KED6 Uncharacterized protein1.31e-284100Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
        MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD

Query:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
        RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
Subjt:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA

Query:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
        YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
Subjt:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW

Query:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTAAVCETL
        GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTAAVCETL
Subjt:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTAAVCETL

A0A5A7UM21 Putative GMP synthase2.81e-27597.49Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL
        MCRSEE LEATSVVVDSKFNSRPVLQPT NRVLDRRNSLKKQHPSLKPPS AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA SRPRATL
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPS-AAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATL

Query:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV
        DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKP+VEDRRCSFITPNSDPIYV
Subjt:  DRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFS+KQMVSISTEYGIDINRVRGVVDN+IRILQIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE-DTAAVCETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE DTAAVC+ L
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVE-DTAAVCETL

A0A6J1D778 uncharacterized protein LOC1110179892.29e-21482.82Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD
        MCRSE+ +EATSVV       R VLQPT NR L RRNSLKKQ PS  PP  +  SP SPKSKSPRPPATKRAND    MNSSS+K+++PAA  RPRA LD
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLD

Query:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA
        RKKSKSFKLGG+G    D     ++YASSLITESPGSIAAVRREQVALQQAQRKM+IAHYGRSKSARFEKIVP+DSK KPAVEDRRCSFITPNSDPIYVA
Subjt:  RKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVA

Query:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW
        YHDEEWGVPVH+DK+LFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFD+E VANFSDKQMVSISTEYGIDINRVRGVVDNAIRIL+IKKEFGSFDKYIW
Subjt:  YHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIW

Query:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDT
        GFVN+KPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHL CTL+AAGRR P       EVE+T
Subjt:  GFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDT

A0A6J1FSP1 uncharacterized protein LOC1114484343.56e-23385.47Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL
        MCRSE+ LEATSVVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIPAA +SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL

Query:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGNV ICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDRRCSFIT
Subjt:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           ETL
Subjt:  AVCETL

A0A6J1J7H3 uncharacterized protein LOC1114841732.39e-23184.73Show/hide
Query:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL
        MCRSE+ LEATSVVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAN+  NPMNSSS+KILIPAA +SRP+A L
Subjt:  MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAA-VSRPRATL

Query:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGNV ICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVE RRCSFIT
Subjt:  DRKKSKSFKLGGNGNV-ICDN----GGFEVA---YASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQ AGLTNDHLT+CHRHLHC++ AAGRR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTA

Query:  AVCETL
           E+L
Subjt:  AVCETL

SwissProt top hitse value%identityAlignment
P05100 DNA-3-methyladenine glycosylase 13.2e-3439.66Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRGVVDNAI
        RC ++  + DP+Y+AYHD EWGVP  D K LFE++ L   Q G  W ++LKKR+++R  F  FD   VA   ++ +  +  + GI  +R  ++ ++ NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRGVVDNAI

Query:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          LQ+++    F  ++W FVN++P   Q  +  +IP  TS S+ +SK + +RGF+ VG T+ +SFMQA GL NDH+  C
Subjt:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

P44321 DNA-3-methyladenine glycosylase2.0e-2836.31Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVR--GVVDNAI
        RC ++   S  IY+ YHD+EWG P  D + LFE + L   Q G  W ++LKKR+ +R AF  FD + +A  +   + +     G+  +R +   +V NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVR--GVVDNAI

Query:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC
          L ++K   +F  +IW FVN+KP          +P KT  S+ +SK + +RGF  +G T  ++FMQ+ GL +DHL  C
Subjt:  RILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTC

Q7VG78 Probable GMP synthase [glutamine-hydrolyzing]3.0e-4043.85Show/hide
Query:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRG
        E  RC++ T   +    +Y  YHD EWG P+H+DK LFE LVL   Q G  W +ILKKR+ FR AF  FD  IVAN+ + ++  +    GI  NR  +  
Subjt:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINR--VRG

Query:  VVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR
         + NA   + +++EFGSFDKYIWGFV  KP    ++S   +P  T  S+ I+KD+ +RGF+ VG T +++ MQ+ G+ NDHLT+C +
Subjt:  VVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHR

Arabidopsis top hitse value%identityAlignment
AT1G75090.1 DNA glycosylase superfamily protein1.4e-5650.99Show/hide
Query:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN--RVRGVVDNA
        +RC +ITPNSDPIYV +HDEEWGVPV DDK LFELLV S A     W SIL++R DFR  F  FD   +A F++K+++S+     + ++  ++R +V+NA
Subjt:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN--RVRGVVDNA

Query:  IRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTT
          +L++K+EFGSF  Y W FVN+KP    Y+ G ++PVK+ K+E ISKDM++RGFR VGPTV++SF+QA+G+ NDHLT C R+  C  +   R T +  T
Subjt:  IRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTT

Query:  TT
         T
Subjt:  TT

AT3G12710.1 DNA glycosylase superfamily protein2.9e-9965.72Show/hide
Query:  SRPRATLDRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPLDSKIKPAVEDRRCSF
        ++ R +L+RKKSKSFK G              +Y+S LITE+PGSIAAVRREQVA QQA RK++IAHYGRSKS       K+VPL +   P    +RCSF
Subjt:  SRPRATLDRKKSKSFKLGGNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFEKIVPLDSKIKPAVEDRRCSF

Query:  ITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIK
        +TP SDPIYVAYHDEEWGVPVHDDK LFELL LS AQVGSDWTS L+KR D+R AF  F++E+VA  ++K+M +IS EY I++++VRGVV+NA +I++IK
Subjt:  ITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIK

Query:  KEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIA
        K F S +KY+WGFVN+KP S  YK GHKIPVKTSKSE+ISKDMVRRGFR VGPTVVHSFMQAAGLTNDHL TC RH  CTL+A
Subjt:  KEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIA

AT5G44680.1 DNA glycosylase superfamily protein3.3e-9553.33Show/hide
Query:  SKFNSRPVLQPTGNRV--LDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLDRKKSKSFKLGGNGN
        S+ N RPVLQP  N+V  LDRRNSLKK  P  KP     ++P + K  SPRP +       + P++ +++ +  PA   +        KSK      N  
Subjt:  SKFNSRPVLQPTGNRV--LDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLDRKKSKSFKLGGNGN

Query:  VICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDD
            +GG++      ++ + PGSIAA RRE+VA++Q +RK +I+HYGR KS +  EK + ++ + K     +RCSFIT +SDPIYVAYHD+EWGVPVHDD
Subjt:  VICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-EKIVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDD

Query:  KMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYK
         +LFELLVL+ AQVGSDWTS+LK+R  FR AFS F++E+VA+F++K++ SI  +YGI++++V  VVDNA +IL++K++ GSF+KYIWGF+ +KP + +Y 
Subjt:  KMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYK

Query:  SGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAA
        S  KIPVKTSKSETISKDMVRRGFR VGPTV+HS MQAAGLTNDHL TC RHL CT +AA
Subjt:  SGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAA

AT5G57970.1 DNA glycosylase superfamily protein3.2e-5852.79Show/hide
Query:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN
        LDS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K+++   +     ++
Subjt:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN

Query:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC

AT5G57970.2 DNA glycosylase superfamily protein3.2e-5852.79Show/hide
Query:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN
        LDS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ FD   +   ++K+++   +     ++
Subjt:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDIN

Query:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD+VRRGFRSVGPTVV+SFMQAAG+TNDHLT+C R  HC
Subjt:  --RVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHC


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTGTCGTTCCGAGGAGACCTTGGAAGCCACTTCTGTCGTGGTCGATTCAAAATTCAATTCCCGTCCTGTCCTTCAACCCACTGGTAACCGTGTCCTCGACCGCCGTAA
TTCCCTCAAAAAACAACACCCTTCTCTCAAACCCCCTTCCGCCGCCGCCGTCTCCCCCACTTCTCCTAAATCCAAATCCCCCCGTCCTCCGGCCACCAAACGAGCCAATG
ACGGTAATAATCCCATGAACTCCAGCTCCGAGAAGATCCTCATTCCGGCCGCAGTGTCACGGCCCAGAGCTACGTTGGATAGAAAGAAATCGAAAAGCTTTAAACTGGGT
GGAAATGGGAATGTGATTTGTGATAATGGTGGGTTTGAGGTGGCGTATGCTTCTTCTTTGATTACTGAATCGCCGGGAAGTATCGCCGCCGTGAGAAGAGAACAGGTGGC
GCTGCAACAGGCGCAGAGGAAAATGAGAATTGCTCATTACGGAAGATCTAAATCTGCTCGTTTTGAAAAAATCGTTCCTCTTGATTCTAAAATTAAACCCGCTGTTGAAG
ATAGAAGATGTAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTACCATGATGAGGAATGGGGTGTCCCTGTTCATGATGACAAGATGCTGTTTGAATTGCTG
GTTCTAAGTGTAGCCCAGGTGGGTTCGGATTGGACTTCAATTCTGAAGAAACGTCAAGATTTCAGGAATGCATTTTCAAGTTTCGATTCAGAAATTGTGGCAAATTTTTC
GGACAAACAAATGGTTTCAATCAGCACAGAATATGGCATCGACATCAACAGAGTCCGAGGAGTTGTGGATAACGCAATTCGAATCCTCCAGATTAAGAAGGAATTTGGGT
CATTCGACAAATACATTTGGGGATTTGTGAACAACAAACCATTCTCACCGCAGTACAAATCCGGCCACAAAATTCCGGTGAAGACATCAAAATCAGAAACCATAAGCAAA
GACATGGTCCGACGAGGTTTCCGGTCCGTCGGACCCACGGTGGTTCACTCCTTCATGCAAGCCGCCGGTCTAACCAACGACCATCTCACCACTTGCCACAGGCACCTCCA
TTGCACCTTAATCGCCGCCGGCCGCCGTACTCCGGCTCCGACGACGACAACACCCGAAGTGGAGGATACGGCGGCGGTTTGTGAAACACTCTAG
mRNA sequenceShow/hide mRNA sequence
ATGTGTCGTTCCGAGGAGACCTTGGAAGCCACTTCTGTCGTGGTCGATTCAAAATTCAATTCCCGTCCTGTCCTTCAACCCACTGGTAACCGTGTCCTCGACCGCCGTAA
TTCCCTCAAAAAACAACACCCTTCTCTCAAACCCCCTTCCGCCGCCGCCGTCTCCCCCACTTCTCCTAAATCCAAATCCCCCCGTCCTCCGGCCACCAAACGAGCCAATG
ACGGTAATAATCCCATGAACTCCAGCTCCGAGAAGATCCTCATTCCGGCCGCAGTGTCACGGCCCAGAGCTACGTTGGATAGAAAGAAATCGAAAAGCTTTAAACTGGGT
GGAAATGGGAATGTGATTTGTGATAATGGTGGGTTTGAGGTGGCGTATGCTTCTTCTTTGATTACTGAATCGCCGGGAAGTATCGCCGCCGTGAGAAGAGAACAGGTGGC
GCTGCAACAGGCGCAGAGGAAAATGAGAATTGCTCATTACGGAAGATCTAAATCTGCTCGTTTTGAAAAAATCGTTCCTCTTGATTCTAAAATTAAACCCGCTGTTGAAG
ATAGAAGATGTAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTACCATGATGAGGAATGGGGTGTCCCTGTTCATGATGACAAGATGCTGTTTGAATTGCTG
GTTCTAAGTGTAGCCCAGGTGGGTTCGGATTGGACTTCAATTCTGAAGAAACGTCAAGATTTCAGGAATGCATTTTCAAGTTTCGATTCAGAAATTGTGGCAAATTTTTC
GGACAAACAAATGGTTTCAATCAGCACAGAATATGGCATCGACATCAACAGAGTCCGAGGAGTTGTGGATAACGCAATTCGAATCCTCCAGATTAAGAAGGAATTTGGGT
CATTCGACAAATACATTTGGGGATTTGTGAACAACAAACCATTCTCACCGCAGTACAAATCCGGCCACAAAATTCCGGTGAAGACATCAAAATCAGAAACCATAAGCAAA
GACATGGTCCGACGAGGTTTCCGGTCCGTCGGACCCACGGTGGTTCACTCCTTCATGCAAGCCGCCGGTCTAACCAACGACCATCTCACCACTTGCCACAGGCACCTCCA
TTGCACCTTAATCGCCGCCGGCCGCCGTACTCCGGCTCCGACGACGACAACACCCGAAGTGGAGGATACGGCGGCGGTTTGTGAAACACTCTAG
Protein sequenceShow/hide protein sequence
MCRSEETLEATSVVVDSKFNSRPVLQPTGNRVLDRRNSLKKQHPSLKPPSAAAVSPTSPKSKSPRPPATKRANDGNNPMNSSSEKILIPAAVSRPRATLDRKKSKSFKLG
GNGNVICDNGGFEVAYASSLITESPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFEKIVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELL
VLSVAQVGSDWTSILKKRQDFRNAFSSFDSEIVANFSDKQMVSISTEYGIDINRVRGVVDNAIRILQIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISK
DMVRRGFRSVGPTVVHSFMQAAGLTNDHLTTCHRHLHCTLIAAGRRTPAPTTTTPEVEDTAAVCETL