; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmaCh04G015400 (gene) of Cucurbita maxima (Rimu) v1.1 genome

Gene IDCmaCh04G015400
OrganismCucurbita maxima Rimu (Cucurbita maxima (Rimu) v1.1)
DescriptionP-loop containing nucleoside triphosphate hydrolases superfamily protein
Genome locationCma_Chr04:7807234..7810074
RNA-Seq ExpressionCmaCh04G015400
SyntenyCmaCh04G015400
Gene Ontology termsNA
InterPro domainsIPR008978 - HSP20-like chaperone
IPR025723 - Anion-transporting ATPase-like domain
IPR027417 - P-loop containing nucleoside triphosphate hydrolase
IPR040612 - ArsA, HSP20-like domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7032107.1 putative protein, chloroplastic, partial [Cucurbita argyrosperma subsp. argyrosperma]3.5e-22893.1Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSLLFSASFFGHPIPISIRTRT PCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        +SPVECSHNLSAVRLETTQMLLEPLKRLKQADS LNMTQGTLEG+VGEELGILPGMDSIFSVLQLERFLG SGIMAQTDQK KYDIVVYDGICTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSKARLYLKYLRSIAEKTDLGRLATPSI+RLVDEAMNISSPGSHLSGRTSTDTWQALE MLEKGSSAIAEPRRFSCFIVMDPTSPASVKSA RYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLM-PGFEKS
        TIQAGAQISGAFASISSGLDAESAARLKENF PL LAFMPQISVGSPVDWNTVL DASSKGPRNLLSSSKSHSSNL SPVKF+PGNKS +     GF + 
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLM-PGFEKS

Query:  EIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
              YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKF DRSLVITMR
Subjt:  EIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_022956773.1 uncharacterized protein At1g26090, chloroplastic [Cucurbita moschata]1.5e-23996.43Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        +SPVECS NLSAVRLETTQMLLEPLKRLKQADS LNMTQGTLEG+VGEELGILPGMDSIFSVLQLERFLG SGIMAQTDQK KYDIVVYDGICTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSKARLYLKYLRSIAEKTDLGRLATPSI+RLVDEAM ISSPGSHLSGRTSTDTWQALE MLEKGSSAIAEPRRFSCFIVMDPTSPASVKSA RYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
        TIQAGAQISGAFASISSGLDAESAARLKENF PL L FMPQISVGSPVDWNTVL DASSKGPRNLLSSSKSHSSNL SPVKF+PGNKSVTLLMPGFEKSE
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE

Query:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_022979170.1 uncharacterized protein At1g26090, chloroplastic [Cucurbita maxima]1.9e-250100Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
        TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE

Query:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_023529730.1 uncharacterized protein At1g26090, chloroplastic [Cucurbita pepo subsp. pepo]1.5e-24297.1Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVF ARHFALSGLRTCLVIHNQDATPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        +SPVECSHNLSAVRLETTQMLLEPLKRLKQADS LNMTQGTLEG+VGEELGILPGMDSIFSVLQLERFLG SGIMAQTDQKAKYDIVVYDGICTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSKARLYLKYLRSIAEKTDLGRLATPSI+RLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSA RYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
        TIQAGAQISGAFASISSGLDAESAARLKENF PLPLAFMPQISVGSPVDWNTVL DASSKGPRNLLSSSKSHS+NL SPVKF+PGNKSVTLLMPGFEKSE
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE

Query:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKF DRSLVITMR
Subjt:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_038891424.1 uncharacterized protein At1g26090, chloroplastic [Benincasa hispida]1.2e-21587.28Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSL FSASFFG+PIPISIRTRTAPCR R +A++ASKE+TDVSSQN  RMLTFLGKGGSGKTTSAVFAA+HFALSGLRTCLVIHNQD TPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        +SPVECS NLSAVRLETTQMLLEPLKRLKQADS LNMTQG LEGVVGEELG+LPG DSIFS+LQLERFLGFSGIM Q DQK KYD+V+YDGICTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAM+IS PGSHLS RTSTD W+ALEH+LEKGSSA AEPR+FSCFIVMDPTSPASV+SALRYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
        TIQAG QISGA A ISS L AES A LKE F PL LAFMPQ S GS VDWNTVL DASSKGPR+LLS SKS +S+LLSPVKFDPGNKSVTLLMPGF KSE
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE

Query:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        I+LYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAK  DR LVITMR
Subjt:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

TrEMBL top hitse value%identityAlignment
A0A1S3BET7 uncharacterized protein At1g26090, chloroplastic1.7e-21284.6Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSLLFS SFFG+PIPISIRTRT PC  R + ++ASK+  DVSSQN  R+LTFLGKGGSGKTTSAVFAA+HFALSGLRTCLVI NQD TPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        +SPVECSHNLSAVRLETTQMLLEPLKRLKQADS LNMTQG LEGVVGEEL +LPGMDSIFS+LQLERF+GFSGIM Q DQK KYDIV+YDG+CTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSK RLYLKYLRSIAEKTDLGRLATPSILRLVDEAM+IS PGSHL GRTSTD W+ LEH+LEKGSSA AEPR+FSC+IVMDPTSPASV+SALRYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
        TIQAGAQI GA A  SS  +AE++A LKE F PL LAF+PQ S+GS VDWNTVL DASSKGPR+LLSSSKS +S+L+ PVKFDPGNKSVTLLMPGF KSE
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE

Query:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        I+LYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

A0A5A7STS2 ArsA_ATPase domain-containing protein6.0e-19485.78Show/hide
Query:  DVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGT
        DVSSQN  R+LTFLGKGGSGKTTSAVFAA+HFALSGLRTCLVI NQD TPEYLLDCKIG+SPVECSHNLSAVRLETTQMLLEPLKRLKQADS LNMTQG 
Subjt:  DVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGT

Query:  LEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNI
        LEGVVGEEL +LPGMDSIFS+LQLERF+GFSGIM Q DQK KYDIV+YDG+CTEETIRMIGATSK RLYLKYLRSIAEKTDLGRLATPSILRLVDEAM+I
Subjt:  LEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNI

Query:  SSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQ
        S PGSHL GRTSTD W+ LEH+LEKGSSA AEPR+FSC+IVMDPTSPASV+SALRYWGCTIQAGAQI GA A  SS  +AE++A LKE F PL LAF+PQ
Subjt:  SSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQ

Query:  ISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYR-GGSELLVEAGDQRRVISLPKEIQGKVGGAKFMD
         S+GS VDWNTVL DASSKGPR+LLSSSKS +S+L+ PVKFDPGNKSVTLLMPGF KSEI+LYQ R GGSELLVEAGDQRRVISLPKEIQGKVGGAKFMD
Subjt:  ISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYR-GGSELLVEAGDQRRVISLPKEIQGKVGGAKFMD

Query:  RSLVITMR
        RSLVITMR
Subjt:  RSLVITMR

A0A6J1D944 uncharacterized protein At1g26090, chloroplastic1.7e-20481.64Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPC----RRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLD
        MASSLL+S SFFG+PIPIS+  RT       RRR++ +++SKE+ D   Q   R+LTFLGKGGSGKT+SAVFAA+HFAL+GLRTCLVIHNQD T EYLLD
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPC----RRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLD

Query:  CKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEE
        CKIG+SPVEC HNLSAVRLETTQMLLEPLK+L+QADS LNMTQG LEGVVGEELG+LPGMDS+FSVL LE+FLGFS  MAQ D+KA YDIV+YDGI TEE
Subjt:  CKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEE

Query:  TIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR
        TIR++GA SKARLYLKY+RS AEKTDLGRLATPSILRLVDEAM IS PGSHLSGRTSTD W+ALE MLE+GSSA +EP +F CFIVMDPTSPASV+SALR
Subjt:  TIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR

Query:  YWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGF
        YWGCTIQAGAQISGAFA ISS LDAES +RLKENF PL LAFMP+ S+GSPVDWNTVL DASSKGPR+LLSSSKSH S+LLSPVKFDPGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGF

Query:  EKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        EKSEI+LYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

A0A6J1GY43 uncharacterized protein At1g26090, chloroplastic7.3e-24096.43Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        +SPVECS NLSAVRLETTQMLLEPLKRLKQADS LNMTQGTLEG+VGEELGILPGMDSIFSVLQLERFLG SGIMAQTDQK KYDIVVYDGICTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSKARLYLKYLRSIAEKTDLGRLATPSI+RLVDEAM ISSPGSHLSGRTSTDTWQALE MLEKGSSAIAEPRRFSCFIVMDPTSPASVKSA RYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
        TIQAGAQISGAFASISSGLDAESAARLKENF PL L FMPQISVGSPVDWNTVL DASSKGPRNLLSSSKSHSSNL SPVKF+PGNKSVTLLMPGFEKSE
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE

Query:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

A0A6J1ISG8 uncharacterized protein At1g26090, chloroplastic9.2e-251100Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
        MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIG

Query:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
        SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM
Subjt:  SSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRM

Query:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
        IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC
Subjt:  IGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGC

Query:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
        TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE
Subjt:  TIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSE

Query:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  IRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

SwissProt top hitse value%identityAlignment
O50593 Arsenical pump-driving ATPase5.4e-0626.67Show/hide
Query:  QNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSS--PVECSHNLSAVRLETTQ-------MLLEPLKRLKQADSPLN
        QN P  L F GKGG GKT+ +   A H A  G R  LV  +  +    + D  IG++  PV     LSA+ ++  +        +++P+K L   D  +N
Subjt:  QNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSS--PVECSHNLSAVRLETTQ-------MLLEPLKRLKQADSPLN

Query:  MTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMI
             L G    E+                 F  F+G++       ++D +++D   T  TIR++
Subjt:  MTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMI

Q46366 Putative arsenical pump-driving ATPase3.5e-1322.41Show/hide
Query:  RMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEE
        R+LTF GKGG GKT+ +   A   +  G RT ++  +   +     + ++G+ P +   NL A+ +     L +    +++  + + M QG + GV+ +E
Subjt:  RMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEE

Query:  LGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLS
        + ILPGM+ +FS+L+++R+               YD +V D   T ET+R++              S+ +    G  A  ++ + +     +S P S +S
Subjt:  LGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLS

Query:  GRTS-----TDTWQALEHM---LEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR------YWGCTIQ-------AGAQISGAFASISSGLDAESAARLK
         + +      D  ++++ +   LE     + +  + +  +VM+     S+K  +R       +G  +          AQ +  +     G+  +    ++
Subjt:  GRTS-----TDTWQALEHM---LEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR------YWGCTIQ-------AGAQISGAFASISSGLDAESAARLK

Query:  ENFLPLP---LAFMPQISVG---SPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYRGGSELLVEAGDQRRV
        E F PLP   L    Q  VG     V  + +  D     P  ++            P+KF        + +     + + +  +  G EL V+ G+QR++
Subjt:  ENFLPLP---LAFMPQISVG---SPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYRGGSELLVEAGDQRRV

Query:  ISLPKEIQG-KVGGAKFMDRSLVI
        I+LP  + G + G A F D+ L I
Subjt:  ISLPKEIQG-KVGGAKFMDRSLVI

Q46465 Putative arsenical pump-driving ATPase1.6e-1322.64Show/hide
Query:  RMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEE
        R+LTF GKGG GKT+ +   A   +  G RT ++  +   +     + ++G+ P +   NL A+ +     L E    +++  + + M QG + GV+ +E
Subjt:  RMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEE

Query:  LGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLS
        + ILPGM+ +FS+L+++R+               YD +V D   T ET+R++              S+ +    G  A  ++ + +     +S P S +S
Subjt:  LGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLS

Query:  GRTS-----TDTWQALEHM---LEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR------YWGCTIQ-------AGAQISGAFASISSGLDAESAARLK
         + +      D  ++++ +   LE     + +  + +  +VM+     S+K  +R       +G  +          AQ +  +     G+  +    ++
Subjt:  GRTS-----TDTWQALEHM---LEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR------YWGCTIQ-------AGAQISGAFASISSGLDAESAARLK

Query:  ENFLPLP---LAFMPQISVG---SPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYRGGSELLVEAGDQRRV
        E F PLP   L    Q  VG     V  + +  D     P +++            P+KF        + +     + + +  +  G EL V+ G+QR++
Subjt:  ENFLPLP---LAFMPQISVG---SPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYRGGSELLVEAGDQRRV

Query:  ISLPKEIQG-KVGGAKFMDRSLVI
        I+LP  + G + G A F D+ L I
Subjt:  ISLPKEIQG-KVGGAKFMDRSLVI

Q55794 Putative arsenical pump-driving ATPase7.3e-1122.68Show/hide
Query:  RMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEE
        R++   GKGG GKT+ A       A  G +T ++  +   +     D ++G  P     NL    L+    L      +K+  + +   +G L+GV  EE
Subjt:  RMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEE

Query:  LGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLS
        L ILPGMD IF +++++R             +A YD+++ D   T   +R++        Y++      +   +        LR + E +     G  L 
Subjt:  LGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLS

Query:  GRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR--YWGCTIQAGAQISGAFASISSGLDAESAARLK-----------ENFLPLPL
         +   D        +E     + +  + S  +V +P     +K +LR   +         +  A   +   +D     R K           +NF PLP+
Subjt:  GRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALR--YWGCTIQAGAQISGAFASISSGLDAESAARLK-----------ENFLPLPL

Query:  AFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQG-KVGG
           P  S    +     L        ++   S   +  N ++ V+    + S+ L +PG  K +I+L   + G EL V  G+ RR + LP+ +      G
Subjt:  AFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQG-KVGG

Query:  AKFMDRSLVI
        AK  D  L I
Subjt:  AKFMDRSLVI

Q6DYE4 Uncharacterized protein At1g26090, chloroplastic1.3e-14058.33Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRS----MAIEASKEVTDV---SSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEY
        + +S L  +S   + +PI +RT T    R+     +A  +S++V D    SSQ   + +TFLGKGGSGKTT+AVFAA+H+AL+GL TCLVIHNQD + E+
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRS----MAIEASKEVTDV---SSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEY

Query:  LLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAK-YDIVVYDGI
        LL  KIG+SP   + NLS +RLETT+MLLEPLK+LKQAD+ LNMTQG LEGVVGEELG+LPGMDSIFS+L+LER +GF     + + K K +D+++YDGI
Subjt:  LLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAK-YDIVVYDGI

Query:  CTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVK
         TEET+RMIG +SK RLY KYLRS+AEKTDLGRL +PSI+R VDE+MNI+S  S   G TS   W  LE  LE G+SA  +P RF  F+VMDP +P SVK
Subjt:  CTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVK

Query:  SALRYWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLL
        +ALRYWGCT+QAG+ +SGAFA  SS L ++     K +F+PLP A        + +DW+ +L D ++   R LLS + SH ++L   V FD   K VTL 
Subjt:  SALRYWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLL

Query:  MPGFEKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        MPGFEKSEI+LYQYRGGSELL+EAGDQRRVI LP +IQGKVGGAKF+DRSL++TMR
Subjt:  MPGFEKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

Arabidopsis top hitse value%identityAlignment
AT1G26090.1 P-loop containing nucleoside triphosphate hydrolases superfamily protein9.1e-14258.33Show/hide
Query:  MASSLLFSASFFGHPIPISIRTRTAPCRRRS----MAIEASKEVTDV---SSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEY
        + +S L  +S   + +PI +RT T    R+     +A  +S++V D    SSQ   + +TFLGKGGSGKTT+AVFAA+H+AL+GL TCLVIHNQD + E+
Subjt:  MASSLLFSASFFGHPIPISIRTRTAPCRRRS----MAIEASKEVTDV---SSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEY

Query:  LLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAK-YDIVVYDGI
        LL  KIG+SP   + NLS +RLETT+MLLEPLK+LKQAD+ LNMTQG LEGVVGEELG+LPGMDSIFS+L+LER +GF     + + K K +D+++YDGI
Subjt:  LLDCKIGSSPVECSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAK-YDIVVYDGI

Query:  CTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVK
         TEET+RMIG +SK RLY KYLRS+AEKTDLGRL +PSI+R VDE+MNI+S  S   G TS   W  LE  LE G+SA  +P RF  F+VMDP +P SVK
Subjt:  CTEETIRMIGATSKARLYLKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVK

Query:  SALRYWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLL
        +ALRYWGCT+QAG+ +SGAFA  SS L ++     K +F+PLP A        + +DW+ +L D ++   R LLS + SH ++L   V FD   K VTL 
Subjt:  SALRYWGCTIQAGAQISGAFASISSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLL

Query:  MPGFEKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        MPGFEKSEI+LYQYRGGSELL+EAGDQRRVI LP +IQGKVGGAKF+DRSL++TMR
Subjt:  MPGFEKSEIRLYQYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGTCGTCTCTGCTCTTCTCTGCTTCTTTCTTCGGGCACCCAATTCCCATCTCAATTCGAACAAGAACAGCTCCATGTAGAAGAAGATCTATGGCCATTGAG
GCTTCAAAAGAGGTTACGGACGTTTCTTCTCAAAACCAACCCAGGATGCTCACTTTTCTTGGCAAAGGCGGCTCAGGAAAGACTACTTCCGCAGTATTCGCCGCT
CGGCACTTTGCATTGTCTGGACTGCGAACATGCCTGGTGATACATAATCAAGACGCTACTCCTGAGTATCTTCTTGATTGCAAAATTGGAAGTTCTCCCGTTGAA
TGCAGTCACAACCTTTCAGCTGTTAGGTTGGAAACCACTCAAATGCTTCTTGAACCTCTTAAACGGCTAAAGCAAGCTGATTCCCCTCTTAATATGACACAAGGA
ACTCTTGAAGGGGTTGTTGGAGAAGAGCTTGGGATACTCCCAGGAATGGATTCTATCTTTTCAGTACTTCAGCTTGAGAGATTTCTTGGGTTCTCAGGTATTATG
GCCCAAACAGACCAAAAAGCTAAATATGACATAGTAGTATATGACGGTATCTGCACCGAAGAAACGATAAGGATGATCGGAGCAACCAGTAAAGCAAGGTTGTAC
TTAAAATATCTGAGGAGTATTGCTGAAAAAACTGATCTTGGGAGGTTGGCTACTCCTTCAATTCTGAGGCTTGTTGATGAAGCCATGAATATAAGCAGCCCAGGC
TCCCATCTCAGTGGTAGAACCAGTACCGATACATGGCAGGCACTGGAACACATGTTAGAGAAAGGATCTTCTGCAATTGCAGAGCCAAGAAGATTTAGCTGCTTC
ATAGTGATGGACCCGACTAGTCCTGCCTCTGTGAAGTCTGCATTGCGGTACTGGGGTTGCACTATTCAAGCTGGTGCACAAATTTCTGGTGCATTTGCTTCCATT
TCTTCAGGCTTGGATGCAGAATCAGCTGCTAGATTGAAGGAGAATTTTTTACCCTTGCCTTTGGCCTTTATGCCACAGATCTCAGTTGGTTCCCCTGTAGATTGG
AACACAGTTCTTCCTGATGCATCAAGTAAAGGCCCGAGGAACCTTCTTTCTTCGTCCAAAAGCCACTCCAGCAATCTGCTATCACCTGTCAAATTCGATCCTGGA
AACAAATCAGTTACACTTCTCATGCCAGGCTTCGAGAAGTCAGAAATCAGGCTTTACCAGTATAGGGGAGGATCTGAGCTATTGGTGGAAGCTGGGGATCAGAGG
CGTGTAATTTCTCTGCCTAAAGAAATTCAAGGGAAGGTGGGTGGTGCCAAGTTCATGGACAGAAGTCTTGTGATCACAATGCGTTGA
mRNA sequenceShow/hide mRNA sequence
GGTTAGGCGATAGCGGCAGAGCGGGAAGTGCCAAAATGGCGTTGCCAGAGGAATAGCGTTAGCTACTTCACATGCTTATGTTTGGCTATGCCTATATAAACGCAG
CCAGCGACTCCACCCACCTACGCAAACATTGTTGCAGTTTCCGATATCTATGGCGTCGTCTCTGCTCTTCTCTGCTTCTTTCTTCGGGCACCCAATTCCCATCTC
AATTCGAACAAGAACAGCTCCATGTAGAAGAAGATCTATGGCCATTGAGGCTTCAAAAGAGGTTACGGACGTTTCTTCTCAAAACCAACCCAGGATGCTCACTTT
TCTTGGCAAAGGCGGCTCAGGAAAGACTACTTCCGCAGTATTCGCCGCTCGGCACTTTGCATTGTCTGGACTGCGAACATGCCTGGTGATACATAATCAAGACGC
TACTCCTGAGTATCTTCTTGATTGCAAAATTGGAAGTTCTCCCGTTGAATGCAGTCACAACCTTTCAGCTGTTAGGTTGGAAACCACTCAAATGCTTCTTGAACC
TCTTAAACGGCTAAAGCAAGCTGATTCCCCTCTTAATATGACACAAGGAACTCTTGAAGGGGTTGTTGGAGAAGAGCTTGGGATACTCCCAGGAATGGATTCTAT
CTTTTCAGTACTTCAGCTTGAGAGATTTCTTGGGTTCTCAGGTATTATGGCCCAAACAGACCAAAAAGCTAAATATGACATAGTAGTATATGACGGTATCTGCAC
CGAAGAAACGATAAGGATGATCGGAGCAACCAGTAAAGCAAGGTTGTACTTAAAATATCTGAGGAGTATTGCTGAAAAAACTGATCTTGGGAGGTTGGCTACTCC
TTCAATTCTGAGGCTTGTTGATGAAGCCATGAATATAAGCAGCCCAGGCTCCCATCTCAGTGGTAGAACCAGTACCGATACATGGCAGGCACTGGAACACATGTT
AGAGAAAGGATCTTCTGCAATTGCAGAGCCAAGAAGATTTAGCTGCTTCATAGTGATGGACCCGACTAGTCCTGCCTCTGTGAAGTCTGCATTGCGGTACTGGGG
TTGCACTATTCAAGCTGGTGCACAAATTTCTGGTGCATTTGCTTCCATTTCTTCAGGCTTGGATGCAGAATCAGCTGCTAGATTGAAGGAGAATTTTTTACCCTT
GCCTTTGGCCTTTATGCCACAGATCTCAGTTGGTTCCCCTGTAGATTGGAACACAGTTCTTCCTGATGCATCAAGTAAAGGCCCGAGGAACCTTCTTTCTTCGTC
CAAAAGCCACTCCAGCAATCTGCTATCACCTGTCAAATTCGATCCTGGAAACAAATCAGTTACACTTCTCATGCCAGGCTTCGAGAAGTCAGAAATCAGGCTTTA
CCAGTATAGGGGAGGATCTGAGCTATTGGTGGAAGCTGGGGATCAGAGGCGTGTAATTTCTCTGCCTAAAGAAATTCAAGGGAAGGTGGGTGGTGCCAAGTTCAT
GGACAGAAGTCTTGTGATCACAATGCGTTGATGTAATCAATCACACAGACTCAAATCAAAGTAATTGTCAATTAACCAAGGCCCTGTTCAAGGGTCATAAGGCAA
ATGTACAATGATTATAATCTGCCAAAAGGTTTAGGATACAAAATATTCAGAGGAAAAAAATAGTGCAGGGCTTCGATTGGGGCAGAAAATTTGCAATTTGACTTG
ATATTGTTTAAAATGAGGCATCAAAAGATAATTTTATTTCCCAT
Protein sequenceShow/hide protein sequence
MASSLLFSASFFGHPIPISIRTRTAPCRRRSMAIEASKEVTDVSSQNQPRMLTFLGKGGSGKTTSAVFAARHFALSGLRTCLVIHNQDATPEYLLDCKIGSSPVE
CSHNLSAVRLETTQMLLEPLKRLKQADSPLNMTQGTLEGVVGEELGILPGMDSIFSVLQLERFLGFSGIMAQTDQKAKYDIVVYDGICTEETIRMIGATSKARLY
LKYLRSIAEKTDLGRLATPSILRLVDEAMNISSPGSHLSGRTSTDTWQALEHMLEKGSSAIAEPRRFSCFIVMDPTSPASVKSALRYWGCTIQAGAQISGAFASI
SSGLDAESAARLKENFLPLPLAFMPQISVGSPVDWNTVLPDASSKGPRNLLSSSKSHSSNLLSPVKFDPGNKSVTLLMPGFEKSEIRLYQYRGGSELLVEAGDQR
RVISLPKEIQGKVGGAKFMDRSLVITMR