CuGenDBv2

Gene ID	Lsi05G013830
Organism	Lagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
Description	protein CHUP1, chloroplastic
Genome location	chr05:21712347..21726867
RNA-Seq Expression	Lsi05G013830
Synteny	Lsi05G013830
Gene Ontology terms	GO:0009658 - chloroplast organization (biological process) GO:0019432 - triglyceride biosynthetic process (biological process) GO:0005829 - cytosol (cellular component) GO:0009707 - chloroplast outer membrane (cellular component) GO:0004144 - diacylglycerol O-acyltransferase activity (molecular function)
InterPro domains	IPR036249 - Thioredoxin-like superfamily IPR040265 - Protein CHUP1-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

ADN34042.1 hydroxyproline-rich glycoprotein family protein [Cucumis melo subsp. melo]

2.6e-232

91.68

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKST VKNS TMSSRGGRVSLKAMESPKRVVSVS VES+PQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQ+SHRRS S  G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKL FAEDLIKDLQSQLVELKEEL+KSQSLNLELQSQNDLLVRDLAAAEAKFA+ASNND+R+SV+E SQR  EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI
        SS RN RDL+CK PPPRA   PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEFI
Subjt:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI

Query:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR
        NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQR
Subjt:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR

Query:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQPSD
        LITLRSTVMHSYQDLKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ S+
Subjt:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQPSD

KAA0052149.1 protein CHUP1 [Cucumis melo var. makuwa]

1.7e-231

91.84

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKST VKNS TMSSRGGRVSLKAMESPKRVVSVS VES+PQSG+KKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQ+SHRRS S  G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKL FAEDLIKDLQSQLVELKEEL+KSQSLNLELQSQNDLLVRDLAAAEAKFA+ASNND+R+SV+E SQR  EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI
        SS RN RDL+CK PPPRA   PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEFI
Subjt:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI

Query:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR
        NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQR
Subjt:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR

Query:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        LITLRSTVMHSYQDLKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ
Subjt:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

XP_004147632.1 protein CHUP1, chloroplastic [Cucumis sativus]

6.5e-231

91.02

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKS  VKNS TMSSRGGRVSLKAMESPKRVVSVSAVES+PQSGVKKQSS+VSRSLTPN PKKGRDGENVGVSARTVNRGGLKQ+ HRRS SG G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEEL KSQSLN ELQSQNDLLVRDLAAAEAKFA+ SNND+R+SV+E SQR+ EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA----PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEF
        SS RN RDL+CK PPPRA    PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEF
Subjt:  SSYRNARDLECKVPPPRA----PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEF

Query:  INGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQ
        INGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQ
Subjt:  INGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQ

Query:  RLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        RLITLRSTVMHSYQ+LKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ
Subjt:  RLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

XP_008439003.1 PREDICTED: protein CHUP1, chloroplastic [Cucumis melo]

7.7e-232

92.05

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKST VKNS TMSSRGGRVSLKAMESPKRVVSVS VES+PQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQ+SHRRS S  G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKL FAEDLIKDLQSQLVELKEEL+KSQSLNLELQSQNDLLVRDLAAAEAKFA+ASNND+R+SV+E SQR  EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI
        SS RN RDL+CK PPPRA   PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEFI
Subjt:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI

Query:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR
        NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQR
Subjt:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR

Query:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        LITLRSTVMHSYQDLKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ
Subjt:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

XP_038902728.1 protein CHUP1, chloroplastic [Benincasa hispida]

7.2e-230

90.78

Show/hide

Query:  QRGKSTPVKNSTMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCANV
        QRGKSTP+KN T SSRGGRVSLKAMESPKR+VSVSAVES+PQSGVKKQSS+V RSLTP APKKGRDGENVGV ARTVNRGGLKQ+SHRRS SGTGPCANV
Subjt:  QRGKSTPVKNSTMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCANV

Query:  EDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPPS
        EDCNGVKSGLQEKLCFAEDLIKDLQSQLV LKEELQKSQSLN+ELQS NDLLVRDLAAAEAK A+ SNNDQRESVAE SQRN EDNQKL NGKLET P S
Subjt:  EDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPPS

Query:  SYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFIN
        S R+ RDLECK PPPRA   PPPPPLPVQSMPR AATQKSPDLVR+FHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEFIN
Subjt:  SYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFIN

Query:  GLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQRL
        GLIDKVLVAAHTDIED+LKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDT+SPCE ALKKMASL   SER IQRL
Subjt:  GLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQRL

Query:  ITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        I LRST MHSYQDLKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESN ESLLLQGIHFAYRTHQ
Subjt:  ITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

TrEMBL top hits

e value

%identity

Alignment

A0A0A0L5G9 Uncharacterized protein

3.2e-231

91.02

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKS  VKNS TMSSRGGRVSLKAMESPKRVVSVSAVES+PQSGVKKQSS+VSRSLTPN PKKGRDGENVGVSARTVNRGGLKQ+ HRRS SG G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEEL KSQSLN ELQSQNDLLVRDLAAAEAKFA+ SNND+R+SV+E SQR+ EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA----PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEF
        SS RN RDL+CK PPPRA    PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEF
Subjt:  SSYRNARDLECKVPPPRA----PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEF

Query:  INGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQ
        INGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQ
Subjt:  INGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQ

Query:  RLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        RLITLRSTVMHSYQ+LKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ
Subjt:  RLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

A0A1S4DT91 protein CHUP1, chloroplastic

3.7e-232

92.05

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKST VKNS TMSSRGGRVSLKAMESPKRVVSVS VES+PQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQ+SHRRS S  G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKL FAEDLIKDLQSQLVELKEEL+KSQSLNLELQSQNDLLVRDLAAAEAKFA+ASNND+R+SV+E SQR  EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI
        SS RN RDL+CK PPPRA   PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEFI
Subjt:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI

Query:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR
        NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQR
Subjt:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR

Query:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        LITLRSTVMHSYQDLKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ
Subjt:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

A0A5D3C1G2 Protein CHUP1

8.3e-232

91.84

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKST VKNS TMSSRGGRVSLKAMESPKRVVSVS VES+PQSG+KKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQ+SHRRS S  G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKL FAEDLIKDLQSQLVELKEEL+KSQSLNLELQSQNDLLVRDLAAAEAKFA+ASNND+R+SV+E SQR  EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI
        SS RN RDL+CK PPPRA   PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEFI
Subjt:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI

Query:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR
        NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQR
Subjt:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR

Query:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        LITLRSTVMHSYQDLKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ
Subjt:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

A0A6J1G7Z6 protein CHUP1, chloroplastic

5.8e-201

82.85

Show/hide

Query:  QRGKSTPVKNSTMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCANV
        QRGKST V NSTMSSRGGRVS KAMESPKR+VSVSAV+S+PQS VKKQSSRVSRSLTPNAPKKGRDGENVGVSAR VNRGGLKQ S RR       C+NV
Subjt:  QRGKSTPVKNSTMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCANV

Query:  EDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPPS
        EDCNGVKS LQ+KLCF EDLIKDLQSQLV LKEELQKSQSLNLELQS+NDLLVRDLAAAEAK ANASNNDQ  SV        E NQKLENGKL+  P +
Subjt:  EDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPPS

Query:  SYRNARDLECKV-----PPPR-----APPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIE
        S RN +D E K      PPPR      PPPPPLPV+S+PR  A+QKSPDLVRLFHSL+KKEGKR PPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIE
Subjt:  SYRNARDLECKV-----PPPR-----APPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIE

Query:  TKGEFINGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---S
        TKGEFINGLIDKVLVAA+TDIED+LKFVDWLD QLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEIS YKDDTNSPCE ALKKMASL   S
Subjt:  TKGEFINGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---S

Query:  ERAIQRLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        ER IQRLI LR+TVMHSYQDLKLPT+WMLDSGI SKIKQASMNLAKMYMKRVKTEL+SIRSSDKESN ESLLLQG+HF YRTHQ
Subjt:  ERAIQRLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

E5GC44 Hydroxyproline-rich glycoprotein family protein

1.3e-232

91.68

Show/hide

Query:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN
        Q+GKST VKNS TMSSRGGRVSLKAMESPKRVVSVS VES+PQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQ+SHRRS S  G C N
Subjt:  QRGKSTPVKNS-TMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLKQISHRRSFSGTGPCAN

Query:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP
        VEDCNGVKSGLQEKL FAEDLIKDLQSQLVELKEEL+KSQSLNLELQSQNDLLVRDLAAAEAKFA+ASNND+R+SV+E SQR  EDNQKLENGKLET P 
Subjt:  VEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGKLETHPP

Query:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI
        SS RN RDL+CK PPPRA   PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLA+KADIETKGEFI
Subjt:  SSYRNARDLECKVPPPRA---PPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFI

Query:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR
        NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALK LENEISFYKDDTNSPCE ALKKMASL   SER IQR
Subjt:  NGLIDKVLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQR

Query:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQPSD
        LITLRSTVMHSYQDLKLPT+WMLDSGIMSKIKQASMNLAKMYMKRVKTELDS+RSSDKESNHESLLLQGIHFAYRTHQ S+
Subjt:  LITLRSTVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQPSD

SwissProt top hits

e value

%identity

Alignment

Q9C5W0 Diacylglycerol O-acyltransferase 3

7.4e-36

38.14

Show/hide

Query:  VEVSSADARRAPCSMSVSGGSVGTA---------TRVIGLVGRR---NMESARFCDDSHLRYYLGPTCHGGR------LKKEKEAVKKKLKLLKGLSAT-
        +EVS    R+ PC   VS GSV            TR +G   RR    + +  F D  H+ YY+ PT  G        ++KEK+A+KKK K+LK LS   
Subjt:  VEVSSADARRAPCSMSVSGGSVGTA---------TRVIGLVGRR---NMESARFCDDSHLRYYLGPTCHGGR------LKKEKEAVKKKLKLLKGLSAT-

Query:  DYESSLLFRFD--HGSISEFQADRFSIEETRETLARQLQQLKSEEKEHKRKRKLEKAKLKAARAQTIHDS-SSSSSESSDNE---GHMINKSYRVRKA--
        D  SS+ F  D   G + E Q    +I E  E L +QL+QLK+EEK  K++RK EKAK KA +  T  DS SSSSSESSD++   G +++ S    KA  
Subjt:  DYESSLLFRFD--HGSISEFQADRFSIEETRETLARQLQQLKSEEKEHKRKRKLEKAKLKAARAQTIHDS-SSSSSESSDNE---GHMINKSYRVRKA--

Query:  LSQPFPDQWQTKSI------------QGSTLPPPLQTQLLNSNTKNIG----VAQSASV-----GRIEVCMGNKCKKAGATALMEEFERVM-GAEGAVCG
        + +P   +    ++                L   LQT  +  +  N G      ++ SV      R+EVCMG KCK++G   L++EF+R M G EG+   
Subjt:  LSQPFPDQWQTKSI------------QGSTLPPPLQTQLLNSNTKNIG----VAQSASV-----GRIEVCMGNKCKKAGATALMEEFERVM-GAEGAVCG

Query:  CKCMGKCRDGPNVRVSGSLDI---------QKALCIGVGVEDVGRIVAEYARQE
        CKCMGKCRDGPNVRV    D           K LC+GVG++DV  IV  +  +E
Subjt:  CKCMGKCRDGPNVRVSGSLDI---------QKALCIGVGVEDVGRIVAEYARQE

Q9LI74 Protein CHUP1, chloroplastic

2.1e-62

48.52

Show/hide

Query:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL
        PP   PPPPP P  ++ R A       ++P+LV  + SL K+E K++  P L+  G   +  A N+++GEI+NRS  LLAVKAD+ET+G+F+  L  +V 
Subjt:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL

Query:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV
         ++ TDIED+L FV WLD +LS L DERAVLKHF WPE KADA+REAA EY+ L +LE +++ + DD N  CE ALKKM  L E+   ++  L+  R   
Subjt:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV

Query:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        +  Y++  +P  W+ D+G++ KIK +S+ LAK YMKRV  ELDS+  SDK+ N E LLLQG+ FA+R HQ
Subjt:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

Arabidopsis top hits

e value

%identity

Alignment

AT1G48280.1 hydroxyproline-rich glycoprotein family protein

2.8e-91

46.86

Show/hide

Query:  ARTVNRGGL--------KQISHRRSFSGTGPCANVEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFAN
        AR+VNR  +        + IS +   +     A  ++       L+EKL   E LIKDLQ Q++ LK EL+++++ N+EL+  N  L +DL +AEAK ++
Subjt:  ARTVNRGGL--------KQISHRRSFSGTGPCANVEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFAN

Query:  ASNND--------------QRESVAEGSQRNVEDNQKLENGKLETHPPSSYR------------------NARDLECK--VPPPRAPPPPPLPVQSMPRA
         S+ND              QR   ++  Q  V+    +E+ +L    PS  R                    RD       PP   PPPPP P + + +A
Subjt:  ASNND--------------QRESVAEGSQRNVEDNQKLENGKLETHPPSSYR------------------NARDLECK--VPPPRAPPPPPLPVQSMPRA

Query:  AATQKSPDLVRLFHSLRKKEGKRD--PPLLGKPAAIN-AHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVLVAAHTDIEDILKFVDWLDSQLSSL
        A  QKSP + +LF  L K++  R+    + G  + +N AHNSIVGEIQNRSAHL+A+KADIETKGEFIN LI KVL    +D+ED++KFVDWLD +L++L
Subjt:  AATQKSPDLVRLFHSLRKKEGKRD--PPLLGKPAAIN-AHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVLVAAHTDIEDILKFVDWLDSQLSSL

Query:  ADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQRLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIK
        ADERAVLKHFKWPEKKAD ++EAA+EYR LK+LE E+S Y DD N     ALKKMA+L   SE+ I+RL+ LR + M SYQD K+P  WMLDSG++ KIK
Subjt:  ADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASL---SERAIQRLITLRSTVMHSYQDLKLPTSWMLDSGIMSKIK

Query:  QASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        +AS+ LAK YM RV  EL S R+ D+ES  E+LLLQG+ FAYRTHQ
Subjt:  QASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

AT3G25690.1 Hydroxyproline-rich glycoprotein family protein

1.5e-63

48.52

Show/hide

Query:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL
        PP   PPPPP P  ++ R A       ++P+LV  + SL K+E K++  P L+  G   +  A N+++GEI+NRS  LLAVKAD+ET+G+F+  L  +V 
Subjt:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL

Query:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV
         ++ TDIED+L FV WLD +LS L DERAVLKHF WPE KADA+REAA EY+ L +LE +++ + DD N  CE ALKKM  L E+   ++  L+  R   
Subjt:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV

Query:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        +  Y++  +P  W+ D+G++ KIK +S+ LAK YMKRV  ELDS+  SDK+ N E LLLQG+ FA+R HQ
Subjt:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

AT3G25690.2 Hydroxyproline-rich glycoprotein family protein

1.5e-63

48.52

Show/hide

Query:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL
        PP   PPPPP P  ++ R A       ++P+LV  + SL K+E K++  P L+  G   +  A N+++GEI+NRS  LLAVKAD+ET+G+F+  L  +V 
Subjt:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL

Query:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV
         ++ TDIED+L FV WLD +LS L DERAVLKHF WPE KADA+REAA EY+ L +LE +++ + DD N  CE ALKKM  L E+   ++  L+  R   
Subjt:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV

Query:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        +  Y++  +P  W+ D+G++ KIK +S+ LAK YMKRV  ELDS+  SDK+ N E LLLQG+ FA+R HQ
Subjt:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

AT3G25690.3 Hydroxyproline-rich glycoprotein family protein

1.5e-63

48.52

Show/hide

Query:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL
        PP   PPPPP P  ++ R A       ++P+LV  + SL K+E K++  P L+  G   +  A N+++GEI+NRS  LLAVKAD+ET+G+F+  L  +V 
Subjt:  PPPRAPPPPPLPVQSMPRAAA----TQKSPDLVRLFHSLRKKEGKRD--PPLL--GKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKVL

Query:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV
         ++ TDIED+L FV WLD +LS L DERAVLKHF WPE KADA+REAA EY+ L +LE +++ + DD N  CE ALKKM  L E+   ++  L+  R   
Subjt:  VAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRSTV

Query:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        +  Y++  +P  W+ D+G++ KIK +S+ LAK YMKRV  ELDS+  SDK+ N E LLLQG+ FA+R HQ
Subjt:  MHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

AT4G18570.1 Tetratricopeptide repeat (TPR)-like superfamily protein

1.1e-53

45.22

Show/hide

Query:  KVPPPRAPPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKE---GKRDPPLLGKPA--AINAHNS---IVGEIQNRSAHLLAVKADIETKGEFINGLIDK
        K PPP  PPPPP P      +A  ++ P++V  +HSL +++    +RD    G  A  AI A+++   ++GEI+NRS +LLA+K D+ET+G+FI  LI +
Subjt:  KVPPPRAPPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKE---GKRDPPLLGKPA--AINAHNS---IVGEIQNRSAHLLAVKADIETKGEFINGLIDK

Query:  VLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRS
        V  AA +DIED++ FV WLD +LS L DERAVLKHF+WPE+KADA+REAA  Y  LK+L +E S +++D      +ALKKM +L E+    +  L  +R 
Subjt:  VLVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSER---AIQRLITLRS

Query:  TVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ
        +    ++  ++P  WML++GI S+IK AS+ LA  YMKRV  EL++I     E   E L++QG+ FA+R HQ
Subjt:  TVMHSYQDLKLPTSWMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQ

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGATAAGTTTCTTGATTCTCGGTTAGATCCTTCAAAGGTCATCCTTCTGGTTTGGCCGGTGCATGGCGGCGGCCGCCAGAGAGGGAAATCAACTCCCGTGAAGAA
CTCTACGATGTCATCTCGCGGCGGAAGGGTTTCTTTGAAGGCTATGGAGTCGCCGAAGCGGGTGGTTTCTGTATCGGCAGTTGAATCGTCGCCTCAGTCTGGTGTGAAGA
AGCAAAGTTCGAGAGTTAGCAGATCTCTGACGCCGAATGCTCCGAAGAAGGGGAGGGATGGCGAGAATGTTGGAGTTTCGGCTCGAACGGTCAACCGTGGTGGTCTTAAG
CAAATTTCCCACCGGCGTTCTTTTTCTGGTACTGGTCCGTGTGCGAATGTTGAGGATTGTAATGGAGTTAAGAGTGGATTGCAGGAGAAGCTTTGTTTTGCGGAGGATTT
GATTAAAGATTTGCAGTCTCAATTGGTGGAGTTGAAGGAGGAGTTGCAGAAGTCTCAGAGCTTGAACCTAGAACTTCAATCGCAGAACGATTTGCTCGTTCGTGACCTAG
CCGCTGCTGAAGCGAAGTTCGCTAATGCTAGCAATAACGACCAGAGGGAGTCAGTTGCAGAGGGCTCGCAACGAAACGTCGAGGACAATCAGAAACTCGAAAATGGAAAG
TTGGAGACCCATCCACCAAGCTCGTATCGGAATGCTAGAGATTTGGAATGCAAGGTGCCACCACCACGGGCGCCGCCGCCGCCGCCTCTTCCTGTCCAGTCCATGCCCCG
AGCAGCGGCCACACAGAAATCTCCAGACCTTGTACGCCTCTTTCACTCGTTAAGAAAGAAAGAGGGGAAGAGAGATCCTCCATTGTTGGGGAAACCAGCTGCGATCAATG
CGCATAATAGCATTGTTGGGGAAATTCAGAACCGTTCTGCGCATCTTTTAGCGGTAAAAGCAGACATTGAAACCAAAGGAGAGTTCATCAATGGCCTCATTGACAAGGTG
CTTGTTGCAGCTCATACGGACATAGAGGATATCCTCAAGTTTGTCGATTGGCTTGATTCCCAACTTTCATCATTGGCTGATGAGCGAGCTGTGTTAAAGCATTTCAAGTG
GCCTGAGAAAAAAGCTGATGCCATGCGAGAAGCTGCCATAGAATACCGTGCACTCAAACGGTTGGAAAATGAGATCTCTTTTTACAAGGATGATACTAATTCTCCATGTG
AGACAGCCTTGAAGAAGATGGCGAGCTTGTCGGAGCGAGCCATACAACGGTTAATCACACTTCGGAGTACTGTCATGCATTCTTATCAAGACCTGAAACTCCCTACAAGT
TGGATGCTAGACTCCGGAATCATGAGTAAAATAAAGCAAGCTTCTATGAATCTAGCCAAGATGTACATGAAAAGGGTGAAAACGGAGCTGGATTCGATTCGTAGTTCGGA
TAAAGAATCCAATCATGAATCTCTTCTACTTCAGGGAATTCATTTCGCATACAGAACTCACCAGCCATCCGATCCATGTAACATTCATCCAACGGCAGAAGTTAACGCCG
CGCTCGCGCGGGAATGCAAAAAGCTCGTGGTCCACGAACGTCGCCACGAGGTCCTACGCTCTCCAATCAAAATTCGCCACGTCTCCGGCGCCGTTTCCCGGCAGATCTCC
GGCCTCTTCCGCCGCGATTTTGCTCAGTCCGTCGAGGTCTCCTCTGCCGATGCCCGGCGGGCCCCTTGTAGCATGTCCGTTTCCGGTGGTTCTGTTGGTACTGCAACTCG
CGTTATAGGGCTCGTCGGTCGTCGGAATATGGAATCTGCTAGGTTTTGCGATGACAGTCATTTAAGGTATTATCTTGGACCGACGTGCCATGGCGGGAGGTTGAAGAAGG
AGAAGGAAGCGGTGAAGAAGAAATTGAAATTGTTGAAAGGATTGTCCGCTACGGATTATGAATCAAGCTTATTATTTCGTTTCGATCATGGCTCGATCAGCGAATTTCAG
GCGGATCGGTTCTCTATTGAGGAAACAAGAGAAACATTGGCAAGACAACTCCAACAGCTAAAATCAGAGGAGAAGGAACATAAAAGAAAGAGGAAGTTAGAGAAGGCCAA
GCTAAAAGCAGCTCGAGCACAAACCATTCACGACTCATCATCTTCATCCTCTGAATCCAGTGACAATGAAGGCCATATGATCAACAAAAGCTACCGAGTAAGGAAGGCAC
TTTCGCAGCCATTCCCAGATCAATGGCAAACCAAGTCCATTCAAGGATCAACATTGCCTCCTCCATTGCAAACCCAACTTCTCAATTCGAACACCAAAAACATCGGTGTC
GCCCAATCGGCATCTGTAGGGAGGATTGAAGTGTGTATGGGAAACAAGTGCAAGAAGGCAGGAGCAACAGCATTGATGGAGGAATTTGAGAGGGTAATGGGAGCTGAAGG
TGCTGTTTGTGGGTGTAAATGCATGGGAAAATGCAGAGATGGACCAAATGTGAGAGTTTCTGGTTCTTTGGACATACAAAAGGCTCTGTGTATTGGAGTTGGAGTGGAGG
ATGTTGGTAGAATTGTAGCTGAATATGCAAGACAAGAAGGGGGGCAGAAACAATCCAGGTTCGCACCAGCAATCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MEDKFLDSRLDPSKVILLVWPVHGGGRQRGKSTPVKNSTMSSRGGRVSLKAMESPKRVVSVSAVESSPQSGVKKQSSRVSRSLTPNAPKKGRDGENVGVSARTVNRGGLK
QISHRRSFSGTGPCANVEDCNGVKSGLQEKLCFAEDLIKDLQSQLVELKEELQKSQSLNLELQSQNDLLVRDLAAAEAKFANASNNDQRESVAEGSQRNVEDNQKLENGK
LETHPPSSYRNARDLECKVPPPRAPPPPPLPVQSMPRAAATQKSPDLVRLFHSLRKKEGKRDPPLLGKPAAINAHNSIVGEIQNRSAHLLAVKADIETKGEFINGLIDKV
LVAAHTDIEDILKFVDWLDSQLSSLADERAVLKHFKWPEKKADAMREAAIEYRALKRLENEISFYKDDTNSPCETALKKMASLSERAIQRLITLRSTVMHSYQDLKLPTS
WMLDSGIMSKIKQASMNLAKMYMKRVKTELDSIRSSDKESNHESLLLQGIHFAYRTHQPSDPCNIHPTAEVNAALARECKKLVVHERRHEVLRSPIKIRHVSGAVSRQIS
GLFRRDFAQSVEVSSADARRAPCSMSVSGGSVGTATRVIGLVGRRNMESARFCDDSHLRYYLGPTCHGGRLKKEKEAVKKKLKLLKGLSATDYESSLLFRFDHGSISEFQ
ADRFSIEETRETLARQLQQLKSEEKEHKRKRKLEKAKLKAARAQTIHDSSSSSSESSDNEGHMINKSYRVRKALSQPFPDQWQTKSIQGSTLPPPLQTQLLNSNTKNIGV
AQSASVGRIEVCMGNKCKKAGATALMEEFERVMGAEGAVCGCKCMGKCRDGPNVRVSGSLDIQKALCIGVGVEDVGRIVAEYARQEGGQKQSRFAPAI

Lsi05G013830 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome