CuGenDBv2

Gene ID	Spg038659
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	formamidopyrimidine-DNA glycosylase isoform X1
Genome location	scaffold12:6790490..6799585
RNA-Seq Expression	Spg038659
Synteny	Spg038659
Gene Ontology terms	GO:0006284 - base-excision repair (biological process) GO:0005634 - nucleus (cellular component) GO:0003684 - damaged DNA binding (molecular function) GO:0003906 - DNA-(apurinic or apyrimidinic site) endonuclease activity (molecular function) GO:0008270 - zinc ion binding (molecular function) GO:0019104 - DNA N-glycosylase activity (molecular function)
InterPro domains	IPR010979 - Ribosomal protein S13-like, H2TH IPR012319 - Formamidopyrimidine-DNA glycosylase, catalytic domain IPR015886 - DNA glycosylase/AP lyase, H2TH DNA-binding IPR035937 - MutM-like, N-terminal

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0044473.1 formamidopyrimidine-DNA glycosylase isoform X2 [Cucumis melo var. makuwa]

9.7e-166

71.25

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKAVIADD KVIDGVSPSDFEASL+GKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL+EF ESL KKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQEV         K +  + A+S          SF + +  H                             F +G   G   
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK ND+K+MNDE  GEL SKT+K   TAD 
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVG-RIRDASEAEKSSKQTVQSSRNGGQRKKSK
        K KPKPKGRSKK  +KRKS+S+++DGSDEEAENDDASD+D+G   G KK+G+K N+G R   ASE EKS KQTVQSSRNG +RKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVG-RIRDASEAEKSSKQTVQSSRNGGQRKKSK

XP_022949541.1 formamidopyrimidine-DNA glycosylase isoform X1 [Cucurbita moschata]

5.3e-164

68.16

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKAVIADD KVIDG+SPSDFEASL+GKTILSAHRKGKH+W+RLDSPPFP FHFGMAGAIYIKGVAVTNYKRS+VN+D
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL++F ESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQE                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK+N+ K+MNDE  GE  SKTKKTADT DT
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAE---KSSKQTVQSSRNGGQRKKSK
        KTK KPKG SKK +TKRKS+ +EDDGSDEEAENDDASD++D  H +GK K G++ NVGR+ DASE+E   K SKQTV SSR+G QRKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAE---KSSKQTVQSSRNGGQRKKSK

XP_022998520.1 formamidopyrimidine-DNA glycosylase isoform X1 [Cucurbita maxima]

8.2e-165

68.38

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKAVIADD KVIDG+SPSDFEASL+GKTILSAHRKGKH+WLRLDSPPFP FHFGMAGAIYIKGVAVTNYKRS+VN+D
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL++F ESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQ+                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK+N+ K+MNDE  GEL SKTKKTADT DT
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK
        KTK KPKG SKK +TKRKS+ +EDDGSDEEAENDDASD++D  H +GK K G++ NVGR+ +AS +EK SKQTV SSR+G QRKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK

XP_023523304.1 formamidopyrimidine-DNA glycosylase isoform X1 [Cucurbita pepo subsp. pepo]

3.3e-166

68.58

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKA+IADD KVIDG+SPSDFEASL+GKTILSAHRKGKH+WLRLDSPPFP FHFGMAGAIYIKGVAVTNYKRS+VN+D
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL++F ESLGKKKLAIKTLLLDQSYISGIGNW+ADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQE                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK+N+ K+MNDE  GEL SKTKKTADT DT
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDG-HGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK
        KTK KPKG SKK +TKRKS+ +EDDGSDEEAENDDASD++D  H +GK K G++ NVGR+ DASE+EK SKQTV SSR+G QRKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDG-HGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK

XP_038877199.1 formamidopyrimidine-DNA glycosylase isoform X3 [Benincasa hispida]

2.0e-163

69.47

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKAVIADD KVIDGVSP+DFEASL+GKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL++F ES+GKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQE                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAE KNQNSKRK N+SK+MNDE A EL SKT+KTADTADT
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTK-PKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVGRIRD-ASEAEKSSKQTVQSSRNGGQRKKSK
        K K PKPKGR KK +TKRKS+SD+ DGS+EEAENDDASD+DDGH VGKKKVG+  N GR+ + ASE EKS KQTV SS++G  RKK+K
Subjt:  KTK-PKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVGRIRD-ASEAEKSSKQTVQSSRNGGQRKKSK

TrEMBL top hits

e value

%identity

Alignment

A0A5A7TLT5 Formamidopyrimidine-DNA glycosylase isoform X2

4.7e-166

71.25

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKAVIADD KVIDGVSPSDFEASL+GKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL+EF ESL KKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQEV         K +  + A+S          SF + +  H                             F +G   G   
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK ND+K+MNDE  GEL SKT+K   TAD 
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVG-RIRDASEAEKSSKQTVQSSRNGGQRKKSK
        K KPKPKGRSKK  +KRKS+S+++DGSDEEAENDDASD+D+G   G KK+G+K N+G R   ASE EKS KQTVQSSRNG +RKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVG-RIRDASEAEKSSKQTVQSSRNGGQRKKSK

A0A5D3E227 Formamidopyrimidine-DNA glycosylase isoform X1

1.6e-161

68.99

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHC+ KVIKKAVIADD KVIDGVSPSDFEASL+GKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL+EF ESL KKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQE                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK ND+K+MNDE  GEL SKT+K   TAD 
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVG-RIRDASEAEKSSKQTVQSSRNGGQRKKSK
        K KPKPKGRSKK  +KRKS+S+++DGSDEEAENDDASD+D+G   G KK+G+K N+G R   ASE EKS KQTVQSSRNG +RKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVG-RIRDASEAEKSSKQTVQSSRNGGQRKKSK

A0A6J1DKS0 formamidopyrimidine-DNA glycosylase isoform X3

2.4e-162

68.31

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV K+IKKA+IADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAI+IKGVAVTNYKRSMV DD
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       P SVPPISKLGPDALLEPM L+ F ESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        +QSAATLSKE+CA LHKCIQE                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSS+FPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKL GAEPK QNSKRK++  KQM+DE  GEL SKTK+TADT DT
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK
        K KPKP GRSKK  TKRKS+S E D SDEE ENDDA  +DDGH VGKKK G+K N+GRIRDASE +KS KQTVQS  NG QRKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK

A0A6J1GCA1 formamidopyrimidine-DNA glycosylase isoform X1

2.6e-164

68.16

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKAVIADD KVIDG+SPSDFEASL+GKTILSAHRKGKH+W+RLDSPPFP FHFGMAGAIYIKGVAVTNYKRS+VN+D
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL++F ESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQE                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK+N+ K+MNDE  GE  SKTKKTADT DT
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAE---KSSKQTVQSSRNGGQRKKSK
        KTK KPKG SKK +TKRKS+ +EDDGSDEEAENDDASD++D  H +GK K G++ NVGR+ DASE+E   K SKQTV SSR+G QRKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAE---KSSKQTVQSSRNGGQRKKSK

A0A6J1KCR6 formamidopyrimidine-DNA glycosylase isoform X1

4.0e-165

68.38

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEEHCV KVIKKAVIADD KVIDG+SPSDFEASL+GKTILSAHRKGKH+WLRLDSPPFP FHFGMAGAIYIKGVAVTNYKRS+VN+D
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        DEWPSKYSKFFVE                       PASVPPISKLGPDALLEPMAL++F ESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
        NQSAATLSKE+CAALHK IQ+                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT
          VIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRK+N+ K+MNDE  GEL SKTKKTADT DT
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADT

Query:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK
        KTK KPKG SKK +TKRKS+ +EDDGSDEEAENDDASD++D  H +GK K G++ NVGR+ +AS +EK SKQTV SSR+G QRKK+K
Subjt:  KTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDD-GHGVGKKKVGQKMNVGRIRDASEAEKSSKQTVQSSRNGGQRKKSK

SwissProt top hits

e value

%identity

Alignment

A9B0X2 Formamidopyrimidine-DNA glycosylase

3.0e-21

31.92

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKG------------VA
        MPELPEVE  RR++E+  V +          PK++D  SP  F  ++  + I    R+ K+L + LD+      H  M G + +              VA
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKG------------VA

Query:  VTNYKRSMVNDDDEWPSKYSKF-FVEPASVPPIS-KLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHPNQSAATLSK
        + N +    +D    P K+ ++  V+ + V  ++ +LGP+ L +   L++F + L +K   IK  LLDQS ++G+GN  ADE L+ A+IHP +SA +L+ 
Subjt:  VTNYKRSMVNDDDEWPSKYSKF-FVEPASVPPIS-KLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHPNQSAATLSK

Query:  ENCAALHKCIQEV
           A L + I+ V
Subjt:  ENCAALHKCIQEV

B0TER7 Formamidopyrimidine-DNA glycosylase

9.8e-20

30.18

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVE  RR++        I+K  +   PK+   +  + F  +L G+ I+   R+GK+L L LD       H  M G +         + R    ++
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVEPASV-----------------------PPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
         E    ++ FF++  S+                       P   +LGP+ L +  +  +F  +L K+K  +K LLLDQS+++G+GN  ADE L +AR+HP
Subjt:  DEWPSKYSKFFVEPASV-----------------------PPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEV
        +++A +L  E    L+ CI+ V
Subjt:  NQSAATLSKENCAALHKCIQEV

O80358 Formamidopyrimidine-DNA glycosylase

3.2e-103

51.14

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEE+C+ K IK+ +IADD KVI G+SPSDF+ S++GKTI+SA RKGK+LWL LDSPPFP+F FGMAGAIYIKGVAVT YKRS V D 
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        +EWPSKYSKFFVE                       P SV PIS+LGPDALLEPM ++EF ESL KKK+ IK LLLDQ YISGIGNW+ADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
         Q+A++LSKE C ALH  I+E                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSK-----QMNDEDAGELASKTKKTA
          VIEKA+EV ADSS+FP+ WIFH+REKKPGKAFVDGK+I FIT GGRT+A+VPELQKL G   K+     KV  +K     + +D D  E   +T+K  
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSK-----QMNDEDAGELASKTKKTA

Query:  DTADTKTKPKPK-GRSKKSATKRKSQSDEDDGSDEEAEND
        ++A +K   KP+ GR KK A+K K++  +DDG D EAE +
Subjt:  DTADTKTKPKPK-GRSKKSATKRKSQSDEDDGSDEEAEND

Q8FP17 Formamidopyrimidine-DNA glycosylase

8.3e-19

33.94

Show/hide

Query:  MPELPEVEAARRAIEEHCV-RKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPA-------FHFGMAGAIYIKGVAVT--
        MPELPEVE  RR +EEH V R ++  AV+            ++ EA+L G  + + +R+GK LWL LD     A        H GM+G + +K    T  
Subjt:  MPELPEVEAARRAIEEHCV-RKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPA-------FHFGMAGAIYIKGVAVT--

Query:  --NYKRSMVNDDDE-WPSKYSKF----FVEPASVPP--ISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHPNQSA
             R+ ++D +E W      F      E     P  +S +  D L + + +      L  K   IK LLL+Q  +SGIGN  ADE+L++A IHP Q A
Subjt:  --NYKRSMVNDDDE-WPSKYSKF----FVEPASVPP--ISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHPNQSA

Query:  ATLSKENCAALHKCIQEV
        + +S     AL +  +EV
Subjt:  ATLSKENCAALHKCIQEV

Q8NNV7 Formamidopyrimidine-DNA glycosylase

1.4e-18

35.58

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVID--GVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFP--------AFHFGMAGAIYIK--GVA
        MPELPEVE  RR +E+H V   I  A +       +  G  P + EA++ G  + +A R+GK LWL L   P            H GM+G + IK     
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVID--GVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFP--------AFHFGMAGAIYIK--GVA

Query:  VTNYKRSMV---NDDDEWPSKYSKF-------FVEPASVPP-ISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        ++ + R+ V   N D+ W      F        V+   VP  +S +  D L E    +    +L  +K  IK LLL+Q  +SGIGN  ADE+L+QA+IHP
Subjt:  VTNYKRSMV---NDDDEWPSKYSKF-------FVEPASVPP-ISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLS
         Q A  LS
Subjt:  NQSAATLS

Arabidopsis top hits

e value

%identity

Alignment

AT1G52500.1 MUTM homolog-1

7.1e-82

68.47

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEE+C+ K IK+ +IADD KVI G+SPSDF+ S++GKTI+SA RKGK+LWL LDSPPFP+F FGMAGAIYIKGVAVT YKRS V D 
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        +EWPSKYSKFFVE                       P SV PIS+LGPDALLEPM ++EF ESL KKK+ IK LLLDQ YISGIGNW+ADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEV
         Q+A++LSKE C ALH  I+EV
Subjt:  NQSAATLSKENCAALHKCIQEV

AT1G52500.2 MUTM homolog-1

2.3e-104

51.14

Show/hide

Query:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD
        MPELPEVEAARRAIEE+C+ K IK+ +IADD KVI G+SPSDF+ S++GKTI+SA RKGK+LWL LDSPPFP+F FGMAGAIYIKGVAVT YKRS V D 
Subjt:  MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDD

Query:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP
        +EWPSKYSKFFVE                       P SV PIS+LGPDALLEPM ++EF ESL KKK+ IK LLLDQ YISGIGNW+ADEVLYQARIHP
Subjt:  DEWPSKYSKFFVE-----------------------PASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHP

Query:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR
         Q+A++LSKE C ALH  I+E                                                                               
Subjt:  NQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGLSHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDR

Query:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSK-----QMNDEDAGELASKTKKTA
          VIEKA+EV ADSS+FP+ WIFH+REKKPGKAFVDGK+I FIT GGRT+A+VPELQKL G   K+     KV  +K     + +D D  E   +T+K  
Subjt:  SMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFVPELQKLTGAEPKNQNSKRKVNDSK-----QMNDEDAGELASKTKKTA

Query:  DTADTKTKPKPK-GRSKKSATKRKSQSDEDDGSDEEAEND
        ++A +K   KP+ GR KK A+K K++  +DDG D EAE +
Subjt:  DTADTKTKPKPK-GRSKKSATKRKSQSDEDDGSDEEAEND

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCGGAGCTACCGGAGGTAGAGGCGGCGAGGAGGGCCATTGAAGAGCATTGCGTCAGGAAAGTCATCAAGAAGGCCGTGATAGCCGACGATCCGAAGGTAATCGACGG
CGTATCGCCCTCCGACTTCGAGGCTTCGCTCGTAGGCAAGACCATTCTCTCCGCCCATCGCAAGGGCAAGCATCTGTGGCTCCGCCTCGATTCTCCTCCTTTCCCTGCAT
TTCACTTTGGGATGGCGGGTGCCATATATATCAAGGGCGTAGCTGTCACAAACTATAAAAGGTCTATGGTTAATGATGATGATGAGTGGCCTTCCAAGTACTCTAAGTTC
TTTGTTGAGCCAGCTTCAGTGCCCCCAATATCTAAGCTTGGCCCAGATGCTCTCTTAGAACCTATGGCACTGAATGAGTTTACCGAATCCTTGGGCAAGAAGAAACTGGC
AATTAAGACTCTATTGCTTGATCAGAGCTATATTTCAGGTATTGGCAATTGGGTCGCAGATGAAGTGCTATATCAAGCGAGAATTCATCCAAATCAAAGTGCTGCAACCT
TATCTAAAGAGAATTGTGCAGCTTTGCACAAGTGCATACAAGAGGTACGCCTTTGCTCTTTTCCCTCCCCCTCCAAACCATCCCCAACCCTTGCTGCCCAGTCAGGGTTA
AGCCATGCTGCGCTCTTAGAGATTTCTTTTAGTAAAACATTCACTCTTCATGGAAAGTATAGAGGAACCACCTGTAGGTCCTTAAAAGAGCAGTTGAAGTTGATGCTGAG
TCCAACAACTTTCCTGAAGAATGGTTGTTTCATTTTCGGTGGGGAAAAAGGCCTGGACAGGTCAATGGTAATTGAAAAAGCACTTGAAGTTGGAGCAGATAGTAGTCGGT
TCCCAAATAATTGGATTTTCCATTCACGTGAAAAGAAGCCTGGCAAGGCTTTTGTTGATGGTAAGGAAATCCATTTCATCACTACAGGCGGCAGGACATCGGCCTTCGTA
CCCGAGTTGCAAAAGCTTACTGGAGCTGAACCGAAAAATCAAAATTCAAAGAGGAAAGTCAATGATAGCAAACAAATGAATGATGAGGATGCTGGTGAACTAGCGAGCAA
GACAAAGAAAACTGCAGATACAGCTGATACAAAGACAAAGCCAAAGCCTAAAGGTCGCTCTAAGAAGTCTGCAACAAAAAGAAAATCCCAAAGCGACGAGGATGATGGCT
CTGATGAAGAAGCTGAAAACGACGATGCCAGTGATAACGACGATGGTCATGGTGTTGGAAAGAAGAAAGTGGGACAGAAAATGAACGTCGGGCGAATACGTGATGCTTCT
GAAGCAGAGAAGTCTTCGAAGCAAACAGTTCAAAGCAGTCGAAATGGTGGGCAGAGGAAGAAATCAAAGAGAATGGCAGGAGCAGACAAACAAGCAAAACATATATGGAC
GAGGTTGGAGGAGGCAAAATTGGTTGAATGCCTCGTGGAGCTTTCCCACTTAGCTGCAAAGGGTCTACTGAACAAGCCATTTCCTCAGTACGAGGAACTCGCCTTCGTGT
TCGGCAAGGATCGGGCTAGTGGATCGGGGTGCAATGATTATTATGTCCCCATCCCTCCAGTAGAAAATTTGGCCACAGATGTCGAGTTTGAGGATGTCCCCATAACGCCC
ACGAGCCGATCGAGTACAGCGGGGTCCTCGCAAGGACGGAAGAGGAGTAGAGCATCATATGAAGCAGAAGCACTGGAAATAATGAGGCAGGCAGTCAGCATACAGGAGAC
ACAATTCACGAAAATTGCTGACTGGCCAGACACACAAGACGCTAGGGAGTTCAAGAGGCGAGAAACAGTTGGGGAGATGCTCATGGCTCAGTCGGAGCTAACAGATCGCG
AGAGAGTCTCCCTTATGCGTGTCCTCTTCGTCGACACCAAGATGACCAATATGATACTGATTACCGATCATATGTCGTCACATGTTACAGACGATCTGGTGGATGATGTG
TCTGACACAAGCAGCAGTAATGTGGGACCAGCTGAGACATCAACAGGATCAAGTAGTAGGAGACGAACTTCCTATAACAGAGAGATGATTGAGGTCGTGAAGGCTGCAAT
GGATAGCCAAATTACCAGCCTTCAAAAGATCGCATCCTGGCGAGAACAAAAAAACGAACGGGAGGCTGCACGACGAAAGTTGAATGGCCGGTTCGTCCACAACCCTGAAG
CACACTTGTACGAAAAACGAGGATGCGAAGCTGGTAGAATGCTTCGTGTCTTTTGTCCATGTTGGCGGTTGGAGGGTTTGAACCCTGAAGAAACAGTACCAGGCGATTGC
AGAAATGATGGGGCCAGATGCAACGACTTTGGGTGGAACGAAGAATTTAAGTGTATTGAGGTAGAGAAGAAAACATTCGACCTATGGGTGAAGGACCATCCTATAGCAAA
AGGCATGCGAAACAAATCGTTCCAGCATTTTGACGACTTGGCCTTTGTATTCGAAAAGGATCAAGCTACAGAGGCAGGGTTGAAATGTCGTGGAGATATGGCATCAAATG
TGCCAGAGCATATGGAAGAGGAGATACACCTCGGTGGATCTCAAGAGAACAACATCTTAATCTCGTCGTTCACCATGCCTAGTGTGGACATGCCCTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MPELPEVEAARRAIEEHCVRKVIKKAVIADDPKVIDGVSPSDFEASLVGKTILSAHRKGKHLWLRLDSPPFPAFHFGMAGAIYIKGVAVTNYKRSMVNDDDEWPSKYSKF
FVEPASVPPISKLGPDALLEPMALNEFTESLGKKKLAIKTLLLDQSYISGIGNWVADEVLYQARIHPNQSAATLSKENCAALHKCIQEVRLCSFPSPSKPSPTLAAQSGL
SHAALLEISFSKTFTLHGKYRGTTCRSLKEQLKLMLSPTTFLKNGCFIFGGEKGLDRSMVIEKALEVGADSSRFPNNWIFHSREKKPGKAFVDGKEIHFITTGGRTSAFV
PELQKLTGAEPKNQNSKRKVNDSKQMNDEDAGELASKTKKTADTADTKTKPKPKGRSKKSATKRKSQSDEDDGSDEEAENDDASDNDDGHGVGKKKVGQKMNVGRIRDAS
EAEKSSKQTVQSSRNGGQRKKSKRMAGADKQAKHIWTRLEEAKLVECLVELSHLAAKGLLNKPFPQYEELAFVFGKDRASGSGCNDYYVPIPPVENLATDVEFEDVPITP
TSRSSTAGSSQGRKRSRASYEAEALEIMRQAVSIQETQFTKIADWPDTQDAREFKRRETVGEMLMAQSELTDRERVSLMRVLFVDTKMTNMILITDHMSSHVTDDLVDDV
SDTSSSNVGPAETSTGSSSRRRTSYNREMIEVVKAAMDSQITSLQKIASWREQKNEREAARRKLNGRFVHNPEAHLYEKRGCEAGRMLRVFCPCWRLEGLNPEETVPGDC
RNDGARCNDFGWNEEFKCIEVEKKTFDLWVKDHPIAKGMRNKSFQHFDDLAFVFEKDQATEAGLKCRGDMASNVPEHMEEEIHLGGSQENNILISSFTMPSVDMP

Spg038659 (gene) of Sponge gourd (cylindrica) v1 genome