CuGenDBv2

Gene ID	MC09g1556
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	P-loop containing nucleoside triphosphate hydrolases superfamily protein
Genome location	MC09:21284640..21290846
RNA-Seq Expression	MC09g1556
Synteny	MC09g1556
Gene Ontology terms	NA
InterPro domains	IPR008978 - HSP20-like chaperone IPR025723 - Anion-transporting ATPase-like domain IPR027417 - P-loop containing nucleoside triphosphate hydrolase IPR040612 - ArsA, HSP20-like domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_008446550.1 PREDICTED: uncharacterized protein At1g26090, chloroplastic [Cucumis melo]

1.02e-254

80.39

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD
        MASSLL+S SFFGNPIPIS+  RT   ++    R + +Q+SK+ MD   Q PTRLLTFLGKGGSGKT+SAVFAAQHFAL+GLRTCLVI NQDPT EYLLD
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD

Query:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE
        CKIGNSPVEC HNLSAVRLETTQMLLEPLK+L+QADSRLNMTQGVLEGVVGEEL VLPGMDS+FS+L LE+F+GFS  M QRD+K  YDIVIYDG+ TEE
Subjt:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE

Query:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR
        TIR++GA SK RLYLKY+RS AEKTDLGRLATPSILRLVDEAM ISRPGSHL GRTSTDIWE LE +LE+GSSAF+EP KF C+IVMDPTSPASVQSALR
Subjt:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR

Query:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF
        YWGCTIQAGAQI GA AF SSH +AE+ + LKE FSPLSLAF+P+FSIGS VDWNTVL DASSKGPRDLLSSSKS  SSL+ PVKFDPGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF

Query:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
         KSEIKLYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_022150659.1 uncharacterized protein At1g26090, chloroplastic [Momordica charantia]

0.0

98.46

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKI
        MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKI
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKI

Query:  GNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIR
        GNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIR
Subjt:  GNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIR

Query:  IMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWG
        IMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWG
Subjt:  IMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWG

Query:  CTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKS
        CTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKS
Subjt:  CTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKS

Query:  EIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        EIKLYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_022956773.1 uncharacterized protein At1g26090, chloroplastic [Cucurbita moschata]

6.84e-253

79.52

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD
        MASSLL+S SFFG+PIPIS+  RT       RRR++ +++SKE+ D   Q   R+LTFLGKGGSGKT+SAVFAA+HFAL+GLRTCLVIHNQD T EYLLD
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD

Query:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE
        CKIGNSPVEC  NLSAVRLETTQMLLEPLK+L+QADSRLNMTQG LEG+VGEELG+LPGMDS+FSVL LE+FLG S  MAQ D+K  YDIV+YDGI TEE
Subjt:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE

Query:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR
        TIR++GA SKARLYLKY+RS AEKTDLGRLATPSI+RLVDEAM IS PGSHLSGRTSTD W+ALERMLE+GSSA +EP +F CFIVMDPTSPASV+SA R
Subjt:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR

Query:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF
        YWGCTIQAGAQISGAFA ISS LDAES +RLKENFSPLSL FMP+ S+GSPVDWNTVL DASSKGPR+LLSSSKSH S+L SPVKF+PGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF

Query:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        EKSEI+LYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_022979170.1 uncharacterized protein At1g26090, chloroplastic [Cucurbita maxima]

8.76e-256

80.39

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD
        MASSLL+S SFFG+PIPIS+  RT       RRR++ +++SKE+ D   Q   R+LTFLGKGGSGKT+SAVFAA+HFAL+GLRTCLVIHNQD T EYLLD
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD

Query:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE
        CKIG+SPVEC HNLSAVRLETTQMLLEPLK+L+QADS LNMTQG LEGVVGEELG+LPGMDS+FSVL LE+FLGFS  MAQ D+KA YDIV+YDGI TEE
Subjt:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE

Query:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR
        TIR++GA SKARLYLKY+RS AEKTDLGRLATPSILRLVDEAM IS PGSHLSGRTSTD W+ALE MLE+GSSA +EP +F CFIVMDPTSPASV+SALR
Subjt:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR

Query:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF
        YWGCTIQAGAQISGAFA ISS LDAES +RLKENF PL LAFMP+ S+GSPVDWNTVL DASSKGPR+LLSSSKSH S+LLSPVKFDPGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF

Query:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        EKSEI+LYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

XP_038891424.1 uncharacterized protein At1g26090, chloroplastic [Benincasa hispida]

3.51e-254

81.26

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD
        MASSL +S SFFGNPIPIS+  RT       R R + +Q+SKEI D   Q PTR+LTFLGKGGSGKT+SAVFAAQHFAL+GLRTCLVIHNQDPT EYLLD
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD

Query:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE
        CKIGNSPVEC  NLSAVRLETTQMLLEPLK+L+QADSRLNMTQG+LEGVVGEELGVLPG DS+FS+L LE+FLGFS  M QRD+K  YD+VIYDGI TEE
Subjt:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE

Query:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR
        TIR++GA SKARLYLKY+RS AEKTDLGRLATPSILRLVDEAM ISRPGSHLS RTSTDIWEALE +LE+GSSAF+EP KF CFIVMDPTSPASVQSALR
Subjt:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR

Query:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF
        YWGCTIQAG QISGA AFISSHL AES + LKE FSPLSLAFMP+FS GS VDWNTVL DASSKGPRDLLS SKS  SSLLSPVKFDPGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF

Query:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
         KSEIKLYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAK  DR LVITMR
Subjt:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BET7 uncharacterized protein At1g26090, chloroplastic

4.93e-255

80.39

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD
        MASSLL+S SFFGNPIPIS+  RT   ++    R + +Q+SK+ MD   Q PTRLLTFLGKGGSGKT+SAVFAAQHFAL+GLRTCLVI NQDPT EYLLD
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD

Query:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE
        CKIGNSPVEC HNLSAVRLETTQMLLEPLK+L+QADSRLNMTQGVLEGVVGEEL VLPGMDS+FS+L LE+F+GFS  M QRD+K  YDIVIYDG+ TEE
Subjt:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE

Query:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR
        TIR++GA SK RLYLKY+RS AEKTDLGRLATPSILRLVDEAM ISRPGSHL GRTSTDIWE LE +LE+GSSAF+EP KF C+IVMDPTSPASVQSALR
Subjt:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR

Query:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF
        YWGCTIQAGAQI GA AF SSH +AE+ + LKE FSPLSLAF+P+FSIGS VDWNTVL DASSKGPRDLLSSSKS  SSL+ PVKFDPGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF

Query:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
         KSEIKLYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

A0A5A7STS2 ArsA_ATPase domain-containing protein

1.43e-242

83.33

Show/hide

Query:  EIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGV
        ++  Q PTRLLTFLGKGGSGKT+SAVFAAQHFAL+GLRTCLVI NQDPT EYLLDCKIGNSPVEC HNLSAVRLETTQMLLEPLK+L+QADSRLNMTQGV
Subjt:  EIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGV

Query:  LEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGI
        LEGVVGEEL VLPGMDS+FS+L LE+F+GFS  M QRD+K  YDIVIYDG+ TEETIR++GA SK RLYLKY+RS AEKTDLGRLATPSILRLVDEAM I
Subjt:  LEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGI

Query:  SRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPK
        SRPGSHL GRTSTDIWE LE +LE+GSSAF+EP KF C+IVMDPTSPASVQSALRYWGCTIQAGAQI GA AF SSH +AE+ + LKE FSPLSLAF+P+
Subjt:  SRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPK

Query:  FSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVG
        FSIGS VDWNTVL DASSKGPRDLLSSSKS  SSL+ PVKFDPGN+SVTL MPGF KSEIKLYQARS      GGSELLVEAGDQRRVISLPKEIQGKVG
Subjt:  FSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVG

Query:  GAKFMDRSLVITMR
        GAKFMDRSLVITMR
Subjt:  GAKFMDRSLVITMR

A0A6J1D944 uncharacterized protein At1g26090, chloroplastic

0.0

98.46

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKI
        MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKI
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKI

Query:  GNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIR
        GNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIR
Subjt:  GNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIR

Query:  IMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWG
        IMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWG
Subjt:  IMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWG

Query:  CTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKS
        CTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKS
Subjt:  CTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKS

Query:  EIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        EIKLYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

A0A6J1GY43 uncharacterized protein At1g26090, chloroplastic

3.31e-253

79.52

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD
        MASSLL+S SFFG+PIPIS+  RT       RRR++ +++SKE+ D   Q   R+LTFLGKGGSGKT+SAVFAA+HFAL+GLRTCLVIHNQD T EYLLD
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD

Query:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE
        CKIGNSPVEC  NLSAVRLETTQMLLEPLK+L+QADSRLNMTQG LEG+VGEELG+LPGMDS+FSVL LE+FLG S  MAQ D+K  YDIV+YDGI TEE
Subjt:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE

Query:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR
        TIR++GA SKARLYLKY+RS AEKTDLGRLATPSI+RLVDEAM IS PGSHLSGRTSTD W+ALERMLE+GSSA +EP +F CFIVMDPTSPASV+SA R
Subjt:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR

Query:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF
        YWGCTIQAGAQISGAFA ISS LDAES +RLKENFSPLSL FMP+ S+GSPVDWNTVL DASSKGPR+LLSSSKSH S+L SPVKF+PGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF

Query:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        EKSEI+LYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

A0A6J1ISG8 uncharacterized protein At1g26090, chloroplastic

4.24e-256

80.39

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD
        MASSLL+S SFFG+PIPIS+  RT       RRR++ +++SKE+ D   Q   R+LTFLGKGGSGKT+SAVFAA+HFAL+GLRTCLVIHNQD T EYLLD
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMD---QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLD

Query:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE
        CKIG+SPVEC HNLSAVRLETTQMLLEPLK+L+QADS LNMTQG LEGVVGEELG+LPGMDS+FSVL LE+FLGFS  MAQ D+KA YDIV+YDGI TEE
Subjt:  CKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEE

Query:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR
        TIR++GA SKARLYLKY+RS AEKTDLGRLATPSILRLVDEAM IS PGSHLSGRTSTD W+ALE MLE+GSSA +EP +F CFIVMDPTSPASV+SALR
Subjt:  TIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALR

Query:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF
        YWGCTIQAGAQISGAFA ISS LDAES +RLKENF PL LAFMP+ S+GSPVDWNTVL DASSKGPR+LLSSSKSH S+LLSPVKFDPGN+SVTL MPGF
Subjt:  YWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGF

Query:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        EKSEI+LYQ       YRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
Subjt:  EKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

SwissProt top hits

e value

%identity

Alignment

O52027 Putative arsenical pump-driving ATPase

1.1e-06

28.99

Show/hide

Query:  SKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGH-NLSAVRLETTQMLLE----PLKQLRQADSR
        ++E++  + TR L F GKGG GK++ A   A   A AG  T +V  +       + +  +G+ P   G  NL A R++  + L E     L  +R+    
Subjt:  SKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGH-NLSAVRLETTQMLLE----PLKQLRQADSR

Query:  LNMTQGVLEGVVG--EELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIM
         + TQ  +E  V   EE    P  + + +   LEKF+ + E       +  YDIV++D   T  T+R++
Subjt:  LNMTQGVLEGVVG--EELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIM

Q46366 Putative arsenical pump-driving ATPase

2.1e-13

22.7

Show/hide

Query:  RLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEE
        R+LTF GKGG GKTS +   A   +  G RT ++  +   +     + ++G  P +   NL A+ +     L +    +++  +R+ M QGV  GV+ +E
Subjt:  RLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEE

Query:  LGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLS
        + +LPGM+ +FS+L ++++               YD ++ D   T ET+R++              S  +    G  A  ++ + +     +S+P S +S
Subjt:  LGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLS

Query:  GRTS-----TDIWEALERM---LERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPK
         + +      D  E+++++   LE      ++  K    +VM+     S++  +R        G ++      ++  LDA+  S   E +  +   ++ +
Subjt:  GRTS-----TDIWEALERM---LERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPK

Query:  FSIG-SPVDWNTV-LHDASSKGPRDLL--------SSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFL-LYRGGSELLVEAGDQRRVI
           G SP+    + ++D    G + L          +  S +     P+KF        +      + ++KL  A    + ++  G EL V+ G+QR++I
Subjt:  FSIG-SPVDWNTV-LHDASSKGPRDLL--------SSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFL-LYRGGSELLVEAGDQRRVI

Query:  SLPKEIQG-KVGGAKFMDRSLVI
        +LP  + G + G A F D+ L I
Subjt:  SLPKEIQG-KVGGAKFMDRSLVI

Q46465 Putative arsenical pump-driving ATPase

5.5e-14

22.9

Show/hide

Query:  RLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEE
        R+LTF GKGG GKTS +   A   +  G RT ++  +   +     + ++G  P +   NL A+ +     L E    +++  +R+ M QGV  GV+ +E
Subjt:  RLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEE

Query:  LGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLS
        + +LPGM+ +FS+L ++++               YD ++ D   T ET+R++              S  +    G  A  ++ + +     +S+P S +S
Subjt:  LGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLS

Query:  GRTS-----TDIWEALERM---LERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPK
         + +      D  E+++++   LE      ++  K    +VM+     S++  +R        G ++      ++  LDA+  S   E +  +   ++ +
Subjt:  GRTS-----TDIWEALERM---LERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPK

Query:  FSIG-SPVDWNTV-LHDASSKGPRDLL--------SSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFL------LYRGGSELLVEAGD
           G SP+    + ++D    G + L          +  S +     P+KF               K +I   Q +  F       ++  G EL V+ G+
Subjt:  FSIG-SPVDWNTV-LHDASSKGPRDLL--------SSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFL------LYRGGSELLVEAGD

Query:  QRRVISLPKEIQG-KVGGAKFMDRSLVI
        QR++I+LP  + G + G A F D+ L I
Subjt:  QRRVISLPKEIQG-KVGGAKFMDRSLVI

Q55794 Putative arsenical pump-driving ATPase

1.1e-11

21.39

Show/hide

Query:  RLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEE
        R++   GKGG GKTS A       A  G +T ++  +   +     D ++G+ P     NL    L+    L      +++  +++   +G L+GV  EE
Subjt:  RLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEE

Query:  LGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLS
        L +LPGMD +F ++           M +   +A+YD++I D   T   +R++        Y++      +   +     P +  L     G S P   + 
Subjt:  LGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLS

Query:  GRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTI-QAGAQISGAFAFISSHLDAESVSRLK-----------ENFSPLSLA
             + +E +E +        ++ ++    +V +P      +S   +   ++      +  A   +   +D     R K           +NF PL + 
Subjt:  GRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTI-QAGAQISGAFAFISSHLDAESVSRLK-----------ENFSPLSLA

Query:  FMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQ
          P FS    +     L        +D   S   +  + ++ V+    + S+ L++PG  K +I+L +          G EL V  G+ RR + LP+ + 
Subjt:  FMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQ

Query:  G-KVGGAKFMDRSLVI
             GAK  D  L I
Subjt:  G-KVGGAKFMDRSLVI

Q6DYE4 Uncharacterized protein At1g26090, chloroplastic

1.5e-141

57.63

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRA--LPVQSSKEIMD------QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTS
        + +S L  +S   N +PI   +RT   + +R+RRA  +   SS+++ D      QK T+ +TFLGKGGSGKT++AVFAAQH+ALAGL TCLVIHNQDP++
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRA--LPVQSSKEIMD------QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTS

Query:  EYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKAN-YDIVIYD
        E+LL  KIG SP     NLS +RLETT+MLLEPLKQL+QAD+RLNMTQGVLEGVVGEELGVLPGMDS+FS+L LE+ +GF     +++ K   +D++IYD
Subjt:  EYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKAN-YDIVIYD

Query:  GISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPAS
        GISTEET+R++G +SK RLY KY+RS AEKTDLGRL +PSI+R VDE+M I+   S   G TS  +W+ LER LE G+SA+ +P +F  F+VMDP +P S
Subjt:  GISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPAS

Query:  VQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVT
        V++ALRYWGCT+QAG+ +SGAFA  SSHL ++     K +F PL  A        + +DW+ +L D ++   R+LLS + SH +SL   V FD   + VT
Subjt:  VQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVT

Query:  LFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        LFMPGFEKSEIKLYQ       YRGGSELL+EAGDQRRVI LP +IQGKVGGAKF+DRSL++TMR
Subjt:  LFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

Arabidopsis top hits

e value

%identity

Alignment

AT1G26090.1 P-loop containing nucleoside triphosphate hydrolases superfamily protein

1.1e-142

57.63

Show/hide

Query:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRA--LPVQSSKEIMD------QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTS
        + +S L  +S   N +PI   +RT   + +R+RRA  +   SS+++ D      QK T+ +TFLGKGGSGKT++AVFAAQH+ALAGL TCLVIHNQDP++
Subjt:  MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRA--LPVQSSKEIMD------QKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTS

Query:  EYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKAN-YDIVIYD
        E+LL  KIG SP     NLS +RLETT+MLLEPLKQL+QAD+RLNMTQGVLEGVVGEELGVLPGMDS+FS+L LE+ +GF     +++ K   +D++IYD
Subjt:  EYLLDCKIGNSPVECGHNLSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKAN-YDIVIYD

Query:  GISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPAS
        GISTEET+R++G +SK RLY KY+RS AEKTDLGRL +PSI+R VDE+M I+   S   G TS  +W+ LER LE G+SA+ +P +F  F+VMDP +P S
Subjt:  GISTEETIRIMGAASKARLYLKYMRSAAEKTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPAS

Query:  VQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVT
        V++ALRYWGCT+QAG+ +SGAFA  SSHL ++     K +F PL  A        + +DW+ +L D ++   R+LLS + SH +SL   V FD   + VT
Subjt:  VQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKENFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVT

Query:  LFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR
        LFMPGFEKSEIKLYQ       YRGGSELL+EAGDQRRVI LP +IQGKVGGAKF+DRSL++TMR
Subjt:  LFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGKVGGAKFMDRSLVITMR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTTCGTCTCTGCTATATTCCACTTCTTTCTTTGGAAACCCAATTCCCATTTCAATGCCAATTCGAACCGGAAGAGCAGCATCTACTCGCAGGAGAAGAGCTCTGCC
AGTCCAGTCTTCCAAAGAGATTATGGACCAGAAACCAACCAGGCTGCTCACTTTTCTTGGCAAAGGCGGCTCGGGGAAGACCTCTTCAGCGGTATTCGCCGCTCAGCACT
TTGCATTGGCTGGACTGCGGACGTGTCTGGTGATACATAATCAAGACCCTACGTCTGAGTATCTTCTGGATTGTAAAATTGGGAATTCTCCCGTCGAATGCGGTCACAAC
CTCTCAGCTGTTAGGTTGGAAACCACTCAAATGCTTCTTGAACCTCTCAAACAGCTAAGGCAAGCAGATTCTCGTCTTAACATGACACAAGGAGTTCTTGAAGGGGTGGT
TGGAGAAGAGCTTGGAGTACTTCCAGGAATGGATTCTGTCTTCTCGGTACTTCTACTTGAGAAATTTCTTGGGTTCTCAGAGAATATGGCCCAAAGAGACCGAAAAGCTA
ACTATGACATAGTAATATATGACGGTATCAGCACCGAGGAAACAATAAGGATCATGGGAGCGGCCAGTAAAGCGAGGTTGTACCTAAAATATATGAGGAGCGCTGCTGAA
AAAACCGATCTTGGGAGATTGGCTACTCCTTCAATTTTGAGGCTTGTTGATGAAGCCATGGGTATAAGCAGGCCAGGCTCCCATCTCAGTGGTAGAACCAGTACAGATAT
ATGGGAGGCACTGGAACGCATGTTAGAGAGAGGGTCTTCTGCATTTTCAGAGCCAAGTAAATTTGGCTGCTTTATAGTGATGGATCCAACTAGTCCTGCCTCTGTTCAGT
CTGCATTACGGTACTGGGGTTGCACTATTCAAGCTGGTGCACAAATTTCTGGTGCATTTGCTTTCATTTCTTCACACCTGGATGCAGAATCCGTTTCTAGGTTGAAGGAG
AACTTTTCCCCTTTATCTTTGGCCTTTATGCCAAAGTTCTCAATTGGTTCCCCTGTAGATTGGAACACAGTTCTGCATGATGCATCAAGTAAAGGCCCGAGAGACCTTCT
GTCTTCGTCAAAAAGCCATATCAGCAGTCTGCTATCACCTGTAAAATTCGATCCTGGAAACAGATCGGTTACACTTTTCATGCCAGGCTTCGAGAAGTCAGAAATCAAGC
TTTACCAGGCACGTTCATTCTTTCTATTATATAGGGGAGGGTCTGAGCTGTTGGTAGAAGCTGGAGATCAGAGGCGTGTCATTTCTCTGCCTAAAGAAATTCAAGGGAAG
GTGGGTGGTGCCAAGTTCATGGACAGAAGTCTTGTGATCACAATGCGTTGA

mRNA sequence

Show/hide mRNA sequence

AGGTAGCCGAGCCGGAGCGGGAAGTGCGGAAATGGAGGTGATATAAAGCGAAATTCCTCCACCTGTTCCAGTCCAGTTACCTATCAGGACATTGCTCTATGGCTTCGTCT
CTGCTATATTCCACTTCTTTCTTTGGAAACCCAATTCCCATTTCAATGCCAATTCGAACCGGAAGAGCAGCATCTACTCGCAGGAGAAGAGCTCTGCCAGTCCAGTCTTC
CAAAGAGATTATGGACCAGAAACCAACCAGGCTGCTCACTTTTCTTGGCAAAGGCGGCTCGGGGAAGACCTCTTCAGCGGTATTCGCCGCTCAGCACTTTGCATTGGCTG
GACTGCGGACGTGTCTGGTGATACATAATCAAGACCCTACGTCTGAGTATCTTCTGGATTGTAAAATTGGGAATTCTCCCGTCGAATGCGGTCACAACCTCTCAGCTGTT
AGGTTGGAAACCACTCAAATGCTTCTTGAACCTCTCAAACAGCTAAGGCAAGCAGATTCTCGTCTTAACATGACACAAGGAGTTCTTGAAGGGGTGGTTGGAGAAGAGCT
TGGAGTACTTCCAGGAATGGATTCTGTCTTCTCGGTACTTCTACTTGAGAAATTTCTTGGGTTCTCAGAGAATATGGCCCAAAGAGACCGAAAAGCTAACTATGACATAG
TAATATATGACGGTATCAGCACCGAGGAAACAATAAGGATCATGGGAGCGGCCAGTAAAGCGAGGTTGTACCTAAAATATATGAGGAGCGCTGCTGAAAAAACCGATCTT
GGGAGATTGGCTACTCCTTCAATTTTGAGGCTTGTTGATGAAGCCATGGGTATAAGCAGGCCAGGCTCCCATCTCAGTGGTAGAACCAGTACAGATATATGGGAGGCACT
GGAACGCATGTTAGAGAGAGGGTCTTCTGCATTTTCAGAGCCAAGTAAATTTGGCTGCTTTATAGTGATGGATCCAACTAGTCCTGCCTCTGTTCAGTCTGCATTACGGT
ACTGGGGTTGCACTATTCAAGCTGGTGCACAAATTTCTGGTGCATTTGCTTTCATTTCTTCACACCTGGATGCAGAATCCGTTTCTAGGTTGAAGGAGAACTTTTCCCCT
TTATCTTTGGCCTTTATGCCAAAGTTCTCAATTGGTTCCCCTGTAGATTGGAACACAGTTCTGCATGATGCATCAAGTAAAGGCCCGAGAGACCTTCTGTCTTCGTCAAA
AAGCCATATCAGCAGTCTGCTATCACCTGTAAAATTCGATCCTGGAAACAGATCGGTTACACTTTTCATGCCAGGCTTCGAGAAGTCAGAAATCAAGCTTTACCAGGCAC
GTTCATTCTTTCTATTATATAGGGGAGGGTCTGAGCTGTTGGTAGAAGCTGGAGATCAGAGGCGTGTCATTTCTCTGCCTAAAGAAATTCAAGGGAAGGTGGGTGGTGCC
AAGTTCATGGACAGAAGTCTTGTGATCACAATGCGTTGACGTAATTAATCACAAAAATCCATTTGGCTCCCATTTCAGATCTTGAGCATTTCTCTTCAACATTCTGACAC
CATCAATGGTGATGGAAAAAATTCCTGGCTAGGGGGCTCAACTAGGGCGGAGAATTTGCAATTTGACCATGGTTGGTCTGAAATTAAGGATAAAGAGAGAACTGTATATT
TCCAATTCTATATTTCTGATTCATTTCTATTTGACTGTCTATTCTTGAATTGAATTCAGTATTTTCTTGCTTTTTAATTCCATACTGTACAGCGCACAGAAGCTACCAGA
CTGAGTACATAATCTCTCGCATCTTTCCAGTAGATTGGTAAATATACAATGTCCAATGCGAATGATCTTCTGTAGTAGCATTGAGTTACATGTAGTATATGATTGCTGAA
ATTAAATTGGGATAATAATGAACTTGAAGAAAAAAATTCAGGCTTCTTGCTTATTGTCGTCTCCTATCTGTGTTGTTTGAACTCGGCTCCTCAATTCTTCAAAAGCCTTC
ATGCTCTCCGCATCGAAGCCTCCTGCAAACTGGAAACATATAGAATCCAATGTCAGCTTTGCAGGTTTCGTTTATCAGTTAGAACTTGATTGGAAACAAGATTATTCAAC
TTTGAAATGCAGTTGCTCGTCTGATGATGGCTTGTAACTATTGTTTTCTTTTTGAAGAATGAAGAGAGGCAATATGTACCTGATGAACACGGAAAGCAAACCGTACGCCT
TGTAAGACCAAAAACTCTCTGTTCGGCTCCTTCTCCAGTTCGTTCATTGCATCAAGTTCTGATGCTACACGCTTCATGTATTTCCTTGCTAATTGTACAGAAGACAGCTT
AATCTGCACTTGTTAAAGTATGATTACATTACACATTTTGAGACATTTATGGCCGCATATGAACATACTCCATATTTGCAAGTTCCAGTACTTTTGCTAACAAATGCTAA
CTATGCTCAAAATAAAAATTTCTTGATAACGAAAAGATTGAACTTTTCAAGCTATACCTTTCCAACAACTCCTGTGTCTGACAACCAATCAACTGGAATTCCAAACTCTC
GATAACGCGAGATAGCCATGTCTCTTGTGCGTAGGAGTGCATAGACACTCTGCTCAACCCTGTCAAAAGACGAGAACAAAAACAATGGTTGGAGATGACAACATAATTAG
AGACGGGGATATGTTCTCAATATTTGAAAATGGCAGCACACAGTAATGCATATGCATTAGTTCGAAAGCAGTGACACAGTAAATTTTTTGACAAATTTTTTGACAGTTGA
TCATATCAAAATTTACAAGAATCATGAGATGGTGATTGAACTACTTAACATGCCAAAGATGAGTATTTCCAAAATGGTTGACGTTCCATCACAAATTCTCTTCCAGGAAC
CGCGTCGTTGTAAGGGAATACTTACTTTTCAAGCAAGGAGTACATTTTCTTTAAAGCTGCTTCACATTGGAGTTTAGGGTCATCAACAAACGTGGTGATCCGCTTCTCCA
ACTTCATTAGGTCTTGATATTCAAAAGACGCCTCTCTCAATGCATCTGCTTTACCTTCTGGCCAATCAAAGTGCTTGAGCACTGCCCTTTCATCAACCTTAATCAAAGGC
AGAAAAGAAAGAAACTAGTAAACATAAAGGTCTAAGGAACTGAGTTCAGACTTGAGGACTAGCTGGATTACAGCAATGCACAACAAAAACCACTTCTTTCAATTTATTTT
CAACCTATTCAGAATGATAGCCATTAGCCAGTCCTTTTCTTCTGCATCAAAATTCAATGCATATTGGAGTTCAGTAAATAAAATGACCGTCTTACCAAGAATGATAGCTC
TTCATCTAACCAATTAACGAAGGCCACAACATCCTCGATATTAGAGAATGTAGCTGCTCGTACTTCTGCCGCTAATGACATGACAAAATCACCTTGAGTTTCAACATCAG
CTTTTACCTGGATTTAGTCAACAAAGTTACCAACTGGCAAATCACTATTAATGACAAAGATGAGAAGATAATGCAAAGGCAAAAGCAAAAGGATGATCTACTAACCGCTA
AGAGGAATGATGATCTATTCTCAATCTCCCCAATCATGTTACTTCTGGCATCAGATACATTAGATGATGTAGAAGAAAGTAAAGGAGTATCCTTCTTTGCTTCTCGTTTC
ATCAATGTCTGATAGAATTCAACTAACTCAGGCGCTCTGTGAACCTTATCACCACCTACACCCTTAGACAAGCTTCCTGGAGGAGGAGGCGGTCGAGGTGGTCCACCAGC
TGGAGGCAGTGGTGGGGCACCAGGAGGTGGAGGTGGTAGAGGTGGAGCAGCTGGTACTCCACCCTGAGGATTGGGATTTGTACTTACAGAAGCACCTGCAGATGGTTTTG
GTGGTGGCTTAGGTGTCCGTGGAGATCGCTTCTCAATCTCTGCTAGCTTCATCCTACTGATAGCTGGAGACTCTGTTGTCTTATTTTCACCAGATGGATCAGCAGAATCA
CTAGATACAACTGGTTTCTCCTTTATTAGAGAAAGTTTTGGCGGCAAAACTGCAGGTTTCTCTCTCTCGGTCTTACCTTTAAATCCAGAGTTCAAATTTGAATTTGAAAT
ATTGCCAAACCTTTCTGCTCTTGCCTGATCGGCCCTTTCCTTAATTTGCTTCTCCCTTGCTAATGCCAACTTATGTCGGTCTTTGTATGCTGGATATTTCTCATCTAACA
CTCCATCAACAGATTTAGACATCAGTTGGAATGATGTTGCCACTGAATTCAAGGAGTCACTAGAAGGTGTTTGTGTTCTGATATTAGGGAGATTCGGAGTGCCCGGAGAG
TCGGGAGTTTCCTGTTCCATCGTACCAAAGGTGGTGATTGCGACACTATCACTAGCATTTCTGAGCATCAACATTTCTAATGGACCCCTTTGCTTCTGACTCATGCTCAT
CCTGCTTGGAGAACCCCCAGAAAAGGATCTGGCTGGTGATGAAACAACACTAGAATCATCTTTGCTTTTACCACCCCATTTCTTCAACTTCTGGAGCAAGCTGGGTTTCT
TACTGAGACTACTATATCTACTAAAGGAACTATCTATTGAAGCATTGTCAAAATCCTCACTTCCAGGAGAAGATGGTTGGGAGAAGTTGCTTTCAAGATCTGTGTCCCCT
TGTCCACGTTCTGATCCAGCATACTCCAACATGAGCTGCTTAGCCTTCTCCTGAGATTTTGGGCTTAAATTCTTGTTGAGGTCACGAGCTGATACTTTTCCAGTAGGAGC
CTGGTAATTGCGGAGTTCATACCTTAAGCATGCATTGACCCATCGAAGGTACACTAATTCTTCAACTTCACTGAACCTGTTCATCTGAAGTCCTTCAACTTGCTTCATTA
AGTCCTCATTTGCATGCCTTAAATTGT

Protein sequence

Show/hide protein sequence

MASSLLYSTSFFGNPIPISMPIRTGRAASTRRRRALPVQSSKEIMDQKPTRLLTFLGKGGSGKTSSAVFAAQHFALAGLRTCLVIHNQDPTSEYLLDCKIGNSPVECGHN
LSAVRLETTQMLLEPLKQLRQADSRLNMTQGVLEGVVGEELGVLPGMDSVFSVLLLEKFLGFSENMAQRDRKANYDIVIYDGISTEETIRIMGAASKARLYLKYMRSAAE
KTDLGRLATPSILRLVDEAMGISRPGSHLSGRTSTDIWEALERMLERGSSAFSEPSKFGCFIVMDPTSPASVQSALRYWGCTIQAGAQISGAFAFISSHLDAESVSRLKE
NFSPLSLAFMPKFSIGSPVDWNTVLHDASSKGPRDLLSSSKSHISSLLSPVKFDPGNRSVTLFMPGFEKSEIKLYQARSFFLLYRGGSELLVEAGDQRRVISLPKEIQGK
VGGAKFMDRSLVITMR

MC09g1556 (gene) of Bitter gourd (Dali-11) v1 genome