; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh20G003170 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh20G003170
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
DescriptionDNA glycosylase superfamily protein
Genome locationCmo_Chr20:1547928..1550124
RNA-Seq ExpressionCmoCh20G003170
SyntenyCmoCh20G003170
Gene Ontology termsGO:0006284 - base-excision repair (biological process)
GO:0008725 - DNA-3-methyladenine glycosylase activity (molecular function)
InterPro domainsIPR005019 - Methyladenine glycosylase
IPR011257 - DNA glycosylase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6570606.1 hypothetical protein SDJN03_29521, partial [Cucurbita argyrosperma subsp. sororia]6.0e-21699.75Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
        MCRSEQALEAT+VVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF

Query:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
        KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
Subjt:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL

XP_022943791.1 uncharacterized protein LOC111448434 [Cucurbita moschata]2.7e-216100Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
        MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF

Query:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
        KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
Subjt:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL

XP_022986422.1 uncharacterized protein LOC111484173 [Cucurbita maxima]2.8e-21398.73Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
        MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRAN+TNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF

Query:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
        KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVE RRCSFITPNSDPIYV
Subjt:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQ AGLTNDHLTSCHRHLHCSITAA RRAPAVVVEETTTASE+L
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL

XP_023511876.1 uncharacterized protein LOC111776761 [Cucurbita pepo subsp. pepo]4.7e-21398.73Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
        MCRSEQALEATSVVVDSKFTARPVLQPT NRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF

Query:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
        KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVP+DSKIKPAVEDRRCSFITPNSDPIYV
Subjt:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEF SFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTV+HSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASET+
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL

XP_038902889.1 uncharacterized protein LOC120089476 [Benincasa hispida]2.4e-18885.99Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPS--------AAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAA-----ALS
        MCRSE+ALEA++VVVDSKF ARPVLQPTCNRVLDRRNSLKK PS        AAVSPTSPKSKSPRPPATKRAND  NPMNSSSDKILIPAA     ++S
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPS--------AAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAA-----ALS

Query:  RPKAALDRKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDR
        RP+A LDRKKSKSFKL GNGNVVICDN    GG+EVA LSYASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDR
Subjt:  RPKAALDRKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDR

Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRI
        RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA+FSDKQM+SISSEYGIDINRVRGVVDNAIRI
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRI

Query:  LEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVV----
        L+IKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RR  A      
Subjt:  LEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVV----

Query:  VEETTTA---SETL
        VEET TA   SETL
Subjt:  VEETTTA---SETL

TrEMBL top hitse value%identityAlignment
A0A0A0KED6 Uncharacterized protein3.6e-18285.47Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKK-------PPSAAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAAALSRPKAAL
        MCRSE+ LEATSVVVDSKF +RPVLQPT NRVLDRRNSLKK       P +AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIP AA+SRP+A L
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKK-------PPSAAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAAALSRPKAAL

Query:  DRKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFIT
        DRKKSKSFKL GNGN VICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKPAVEDRRCSFIT
Subjt:  DRKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFIT

Query:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKE
        PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FSDKQM+SIS+EYGIDINRVRGVVDNAIRIL+IKKE
Subjt:  PNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKE

Query:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVV-----VEETT
        FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RR PA       VE+T 
Subjt:  FGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVV-----VEETT

Query:  TASETL
           ETL
Subjt:  TASETL

A0A5A7UM21 Putative GMP synthase2.1e-18285.86Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKK--------PPSAAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAAALSRPKAA
        MCRSE+ALEATSVVVDSKF +RPVLQPTCNRVLDRRNSLKK         P+AAVSPTSPKSKSPRPPATKRAND  NPMNSSS+KILIPAAA SRP+A 
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKK--------PPSAAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAAALSRPKAA

Query:  LDRKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFI
        LDRKKSKSFKL GNGN VICDN    GGFEVA   YASSLIT+SPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF+K+VPLDSKIKP+VEDRRCSFI
Subjt:  LDRKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFI

Query:  TPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKK
        TPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF +E VA FS+KQM+SIS+EYGIDINRVRGVVDN+IRIL+IKK
Subjt:  TPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKK

Query:  EFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVV-----VEET
        EFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLT+CHRHLHC++ AA RR PA       VEE 
Subjt:  EFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVV-----VEET

Query:  TTA
        T A
Subjt:  TTA

A0A6J1D778 uncharacterized protein LOC1110179892.0e-16481.3Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKK------PPSAAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAAALSRPKAALD
        MCRSEQ +EATSVV       R VLQPTCNR L RRNSLKK      PP +  SP SPKSKSPRPPATKRAND    MNSSSDK+++PAAA  RP+ ALD
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKK------PPSAAVSPTSPKSKSPRPPATKRAND-TNPMNSSSDKILIPAAALSRPKAALD

Query:  RKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITP
        RKKSKSFKL G+G     D  A        SLSYASSLIT+SPGSIAAVRREQVALQQAQRKM+IAHYGRSKSARF+K+VP+DSK KPAVEDRRCSFITP
Subjt:  RKKSKSFKLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITP

Query:  NSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEF
        NSDPIYVAYHDEEWGVPVH+DK+LFELLVLSVAQVGSDWTSILKKRQDFRNAFSSF AETVA FSDKQM+SIS+EYGIDINRVRGVVDNAIRILEIKKEF
Subjt:  NSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEF

Query:  GSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRA-PAVVVEETTTASET
        GSFDKYIWGFVN+KPFSPQYKSGHKIPVKTSKSETISKDM+RRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHL C++ AA RRA PAV VEET   SET
Subjt:  GSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRA-PAVVVEETTTASET

Query:  L
        L
Subjt:  L

A0A6J1FSP1 uncharacterized protein LOC1114484341.3e-216100Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
        MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF

Query:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
        KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
Subjt:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL

A0A6J1J7H3 uncharacterized protein LOC1114841731.3e-21398.73Show/hide
Query:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
        MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRAN+TNPMNSSSDKILIPAAALSRPKAALDRKKSKSF
Subjt:  MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSF

Query:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV
        KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVE RRCSFITPNSDPIYV
Subjt:  KLAGNGNVVICDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYV

Query:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
        AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI
Subjt:  AYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYI

Query:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL
        WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQ AGLTNDHLTSCHRHLHCSITAA RRAPAVVVEETTTASE+L
Subjt:  WGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL

SwissProt top hitse value%identityAlignment
P05100 DNA-3-methyladenine glycosylase 11.2e-3338.55Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINR--VRGVVDNAI
        RC ++  + DP+Y+AYHD EWGVP  D K LFE++ L   Q G  W ++LKKR+++R  F  F    VA   ++ +  +  + GI  +R  ++ ++ NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINR--VRGVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSC
          L++++    F  ++W FVN++P   Q  +  +IP  TS S+ +SK + +RGF+ VG T+ +SFMQA GL NDH+  C
Subjt:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSC

P44321 DNA-3-methyladenine glycosylase1.3e-2735.75Show/hide
Query:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVR--GVVDNAI
        RC ++   S  IY+ YHD+EWG P  D + LFE + L   Q G  W ++LKKR+ +R AF  F  + +A  +   + +     G+  +R +   +V NA 
Subjt:  RCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVR--GVVDNAI

Query:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSC
          L ++K   +F  +IW FVN+KP          +P KT  S+ +SK + +RGF  +G T  ++FMQ+ GL +DHL  C
Subjt:  RILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSC

Q7VG78 Probable GMP synthase [glutamine-hydrolyzing]4.7e-3842.78Show/hide
Query:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINR--VRG
        E  RC++ T   +    +Y  YHD EWG P+H+DK LFE LVL   Q G  W +ILKKR+ FR AF  F    VA + + ++  +    GI  NR  +  
Subjt:  EDRRCSFITPNSD---PIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINR--VRG

Query:  VVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHR
         + NA   + +++EFGSFDKYIWGFV  KP    ++S   +P  T  S+ I+KD+ +RGF+ VG T +++ MQ+ G+ NDHLTSC +
Subjt:  VVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHR

Arabidopsis top hitse value%identityAlignment
AT1G75090.1 DNA glycosylase superfamily protein3.9e-5652.13Show/hide
Query:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDIN--RVRGVVDNA
        +RC +ITPNSDPIYV +HDEEWGVPV DDK LFELLV S A     W SIL++R DFR  F  F    +A F++K+++S+     + ++  ++R +V+NA
Subjt:  RRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDIN--RVRGVVDNA

Query:  IRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSI
          +L++K+EFGSF  Y W FVN+KP    Y+ G ++PVK+ K+E ISKDM++RGFR VGPTV++SF+QA+G+ NDHLT+C R+  C++
Subjt:  IRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSI

AT3G12710.1 DNA glycosylase superfamily protein3.3e-9555Show/hide
Query:  TARPVLQP-TCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSFKLAGNGNVVICDNVAGGG
        T R +L P +CN ++DR  SLK+                                  D ++   AA  + + +L+RKKSKSFK    G+           
Subjt:  TARPVLQP-TCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSFKLAGNGNVVICDNVAGGG

Query:  GFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDK
               SY+S LIT++PGSIAAVRREQVA QQA RK++IAHYGRSKS       KVVPL +   P    +RCSF+TP SDPIYVAYHDEEWGVPVHDDK
Subjt:  GFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSA---RFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDK

Query:  MLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKS
         LFELL LS AQVGSDWTS L+KR D+R AF  F AE VA  ++K+M +IS EY I++++VRGVV+NA +I+EIKK F S +KY+WGFVN+KP S  YK 
Subjt:  MLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKS

Query:  GHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAAD
        GHKIPVKTSKSE+ISKDM+RRGFR VGPTVVHSFMQAAGLTNDHL +C RH  C++ A +
Subjt:  GHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAAD

AT5G44680.1 DNA glycosylase superfamily protein9.8e-9252.63Show/hide
Query:  SKFTARPVLQPTCNRV--LDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSFKLAGNGNVVICDNV
        S+   RPVLQP  N+V  LDRRNSLKK P   ++P + K  SPRP +      + P++ ++  +  PA +    K  L    +KS         VI    
Subjt:  SKFTARPVLQPTCNRV--LDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSFKLAGNGNVVICDNV

Query:  AGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-DKVVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHD
        + GG  EV  +     ++   PGSIAA RRE+VA++Q +RK +I+HYGR KS +  +K + ++ + K     +RCSFIT +SDPIYVAYHD+EWGVPVHD
Subjt:  AGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARF-DKVVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHD

Query:  DKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQY
        D +LFELLVL+ AQVGSDWTS+LK+R  FR AFS F AE VA F++K++ SI ++YGI++++V  VVDNA +IL++K++ GSF+KYIWGF+ +KP + +Y
Subjt:  DKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQY

Query:  KSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAA
         S  KIPVKTSKSETISKDM+RRGFR VGPTV+HS MQAAGLTNDHL +C RHL C+  AA
Subjt:  KSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAA

AT5G57970.1 DNA glycosylase superfamily protein9.3e-5852.79Show/hide
Query:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDIN
        LDS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ F    +   ++K+++   S     ++
Subjt:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDIN

Query:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD++RRGFRSVGPTVV+SFMQAAG+TNDHLTSC R  HC
Subjt:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHC

AT5G57970.2 DNA glycosylase superfamily protein9.3e-5852.79Show/hide
Query:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDIN
        LDS    +   +RC+++TPNSDP Y+ +HDEEWGVPVHDDK LFELLVLS A     W +IL KRQ FR  F+ F    +   ++K+++   S     ++
Subjt:  LDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFELLVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDIN

Query:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHC
          ++R V++NA +IL++ +E+GSFDKYIW FV NK    +++   ++P KT K+E ISKD++RRGFRSVGPTVV+SFMQAAG+TNDHLTSC R  HC
Subjt:  --RVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETISKDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHC


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTGTCGTTCGGAGCAGGCCTTGGAAGCCACCTCTGTCGTCGTTGATTCCAAATTCACCGCCCGGCCCGTCCTTCAACCCACCTGCAACCGTGTCCTCGACCGCCGTAA
TTCCCTCAAAAAACCCCCTTCTGCCGCCGTCTCCCCTACCTCCCCCAAGTCCAAATCGCCGCGTCCTCCGGCCACCAAGCGAGCCAATGACACTAACCCCATGAACTCCA
GCTCTGACAAGATTCTAATTCCGGCCGCTGCTCTGTCTCGCCCCAAGGCTGCCTTGGATAGGAAGAAATCAAAAAGCTTCAAATTGGCTGGAAATGGGAATGTTGTGATT
TGTGATAATGTTGCAGGTGGTGGCGGATTTGAGGTTGCGTCCTTGAGCTACGCTTCTTCTTTGATTACTGACTCGCCGGGAAGTATCGCCGCCGTGAGAAGAGAGCAGGT
GGCTCTGCAACAGGCGCAGAGGAAGATGAGAATTGCCCATTATGGAAGATCTAAATCTGCCCGGTTTGATAAAGTTGTTCCTCTTGATTCTAAAATTAAACCCGCCGTTG
AAGATCGGAGATGCAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTACCATGATGAAGAATGGGGCGTCCCTGTTCATGATGACAAAATGCTGTTTGAATTG
CTGGTTCTAAGCGTGGCCCAGGTGGGTTCGGATTGGACTTCAATTTTGAAGAAACGCCAAGATTTCAGAAATGCATTTTCAAGTTTCGTTGCAGAAACGGTGGCCATTTT
TTCCGACAAACAGATGCTATCAATCAGCTCGGAATACGGCATAGACATTAACAGAGTCCGAGGAGTCGTCGACAACGCTATCCGAATCCTCGAGATTAAGAAGGAGTTTG
GATCATTCGACAAATACATTTGGGGGTTTGTGAACAACAAGCCGTTTTCACCGCAGTACAAATCCGGCCACAAAATTCCGGTGAAGACATCAAAATCAGAGACCATAAGC
AAAGACATGATCAGACGAGGTTTCCGGTCGGTCGGACCAACGGTCGTCCATTCCTTCATGCAAGCCGCCGGTCTGACCAACGACCATCTGACCAGCTGCCACAGGCATCT
CCACTGCTCCATAACCGCCGCCGACCGTCGCGCTCCGGCGGTGGTAGTGGAGGAGACAACGACGGCGTCTGAAACTCTATAG
mRNA sequenceShow/hide mRNA sequence
CTCTTCACTAATTCCCATTTCTCTCTCTCTCTCTCTCTAAAAGCAGAACGATGTGTCGTTCGGAGCAGGCCTTGGAAGCCACCTCTGTCGTCGTTGATTCCAAATTCACC
GCCCGGCCCGTCCTTCAACCCACCTGCAACCGTGTCCTCGACCGCCGTAATTCCCTCAAAAAACCCCCTTCTGCCGCCGTCTCCCCTACCTCCCCCAAGTCCAAATCGCC
GCGTCCTCCGGCCACCAAGCGAGCCAATGACACTAACCCCATGAACTCCAGCTCTGACAAGATTCTAATTCCGGCCGCTGCTCTGTCTCGCCCCAAGGCTGCCTTGGATA
GGAAGAAATCAAAAAGCTTCAAATTGGCTGGAAATGGGAATGTTGTGATTTGTGATAATGTTGCAGGTGGTGGCGGATTTGAGGTTGCGTCCTTGAGCTACGCTTCTTCT
TTGATTACTGACTCGCCGGGAAGTATCGCCGCCGTGAGAAGAGAGCAGGTGGCTCTGCAACAGGCGCAGAGGAAGATGAGAATTGCCCATTATGGAAGATCTAAATCTGC
CCGGTTTGATAAAGTTGTTCCTCTTGATTCTAAAATTAAACCCGCCGTTGAAGATCGGAGATGCAGCTTCATCACTCCCAATTCAGATCCCATTTATGTTGCTTACCATG
ATGAAGAATGGGGCGTCCCTGTTCATGATGACAAAATGCTGTTTGAATTGCTGGTTCTAAGCGTGGCCCAGGTGGGTTCGGATTGGACTTCAATTTTGAAGAAACGCCAA
GATTTCAGAAATGCATTTTCAAGTTTCGTTGCAGAAACGGTGGCCATTTTTTCCGACAAACAGATGCTATCAATCAGCTCGGAATACGGCATAGACATTAACAGAGTCCG
AGGAGTCGTCGACAACGCTATCCGAATCCTCGAGATTAAGAAGGAGTTTGGATCATTCGACAAATACATTTGGGGGTTTGTGAACAACAAGCCGTTTTCACCGCAGTACA
AATCCGGCCACAAAATTCCGGTGAAGACATCAAAATCAGAGACCATAAGCAAAGACATGATCAGACGAGGTTTCCGGTCGGTCGGACCAACGGTCGTCCATTCCTTCATG
CAAGCCGCCGGTCTGACCAACGACCATCTGACCAGCTGCCACAGGCATCTCCACTGCTCCATAACCGCCGCCGACCGTCGCGCTCCGGCGGTGGTAGTGGAGGAGACAAC
GACGGCGTCTGAAACTCTATAGAATTGATTGGAGAATTTAATTAACAAGACAAAAAGAAAAAGTGGTAACCTTTACGAGGAGTCAGTCGATCAACGATGATTTGCTTGCT
AATTAACTAGATAACCTTTTTTTGTTTTTGTTTTTTTGTGGGGTTTGTGTATATTAATGTCTATATATAAATAGACTTGTAAGTGAGAGAGAACAAAAAAAATTAAAGAA
AAAAAAGAGATTGTGGGGTTGTGAATTAGTGTGGTTTTTTTTTTTTTTTTTTTT
Protein sequenceShow/hide protein sequence
MCRSEQALEATSVVVDSKFTARPVLQPTCNRVLDRRNSLKKPPSAAVSPTSPKSKSPRPPATKRANDTNPMNSSSDKILIPAAALSRPKAALDRKKSKSFKLAGNGNVVI
CDNVAGGGGFEVASLSYASSLITDSPGSIAAVRREQVALQQAQRKMRIAHYGRSKSARFDKVVPLDSKIKPAVEDRRCSFITPNSDPIYVAYHDEEWGVPVHDDKMLFEL
LVLSVAQVGSDWTSILKKRQDFRNAFSSFVAETVAIFSDKQMLSISSEYGIDINRVRGVVDNAIRILEIKKEFGSFDKYIWGFVNNKPFSPQYKSGHKIPVKTSKSETIS
KDMIRRGFRSVGPTVVHSFMQAAGLTNDHLTSCHRHLHCSITAADRRAPAVVVEETTTASETL