CuGenDBv2

Gene ID	Sgr018214
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family
Genome location	tig00153145:261677..268999
RNA-Seq Expression	Sgr018214
Synteny	Sgr018214
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0043818.1 protein YLS9 [Cucumis melo var. makuwa]

1.0e-195

56.33

Show/hide

Query:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR
        M +TV GVSFP+VFHDGERDT+IG V+VS+STEFKNFQS LSK IGISSHQFTVYLAEYK +LDSSTKIRRRIPITGKVNFGAI+GEKNSFFLVVLKRSR
Subjt:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR

Query:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN
        RERRRK  HDNE++YYF + TKT+TKTNQPKKKNPPENVMLLRRN GI NE LS F+SPVM R+EYE+RIRKLQLE+EKYLI++ ++ L++   GDGGRN
Subjt:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN

Query:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGEKGRESGGLGNIPMKLGAPCGSPTRDRRLLTGRTPFQGVVWILEIWAWC
         + ++E  ICR C SA+E GV A FHCCA+DAV  GFRS AGPIARP    EK +E                                          WC
Subjt:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGEKGRESGGLGNIPMKLGAPCGSPTRDRRLLTGRTPFQGVVWILEIWAWC

Query:  RLVIGFEKHKKKAIGNDILRDFFSFFFSFFGVGNEVGVFGKWVGVCLFVCLFVVCANVVEINNMYSAEAVFWKVKVKPIDKKPLKSPPNSFNFSPFHSST
                                        G+                    C+ V+E +                      KS PN        SS 
Subjt:  RLVIGFEKHKKKAIGNDILRDFFSFFFSFFGVGNEVGVFGKWVGVCLFVCLFVVCANVVEINNMYSAEAVFWKVKVKPIDKKPLKSPPNSFNFSPFHSST

Query:  SHLQPHLLSLSLQIFKKPREREKKTETQKPMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP
         +     ++ ++   +  RE + +     PMASSSED  SQSKA DP   H  PSS+ NNPPP+YPPPT+GYPP   H GY PAMGYPP APHP Y  PP
Subjt:  SHLQPHLLSLSLQIFKKPREREKKTETQKPMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP

Query:  ---NYPAYPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEAN
           NYP  P N Y     YAQAPPAAYYNN Q Y+   I+AGF+RGI +ALILLV +MTLSSIITW+ILRPE+P+FKVDSFSV+N N++K NYSG W+A+
Subjt:  ---NYPAYPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEAN

Query:  VTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVI
        VTV+N N KLNV+ +RIQSFVDYK +TLAMS+ DPFFLDV+KS QM VKLTS+SPDDPG+W E  EK+G+ERATG VSFNLRFFAW+TFR+G+WWTR V+
Subjt:  VTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVI

Query:  MRVFCEDLKVGFAGTAAANGKFLADGHPKACLVYV
        MRV CED+K+ F G AA +  +LAD H K C V V
Subjt:  MRVFCEDLKVGFAGTAAANGKFLADGHPKACLVYV

XP_008442912.1 PREDICTED: uncharacterized protein LOC103486674 [Cucumis melo]

3.1e-99

67.87

Show/hide

Query:  MASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP---NYPAYPQNGYNGGYAYAQAPPAAYYNN
        MASSSED  SQSKA DP   H  PSS+ NNPPP+YPPPT+GYPP   H GY PAMGYPP APHP Y  PP   NYP  P N Y     YAQAPPAAYYNN
Subjt:  MASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP---NYPAYPQNGYNGGYAYAQAPPAAYYNN

Query:  -QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAM
         Q Y+   I+AGF+RGI +ALILLV +MTLSSIITW+ILRPE+P+FKVDSFSV+N N++K NYSG W+A+VTV+N N KLNV+ +RIQSFVDYK +TLAM
Subjt:  -QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAM

Query:  SFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKA
        S+ DPFFLDV+KS QM VKLTS+SPDDPG+W E  EK+G+ERATG VSFNLRFFAW+TFR+G+WWTR V+MRV CED+K+ F G AA +  +LAD H K 
Subjt:  SFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKA

Query:  CLVYV
        C V V
Subjt:  CLVYV

XP_011652032.1 uncharacterized protein LOC105434983 [Cucumis sativus]

3.9e-102

62.72

Show/hide

Query:  SFNFSPFHSSTSHLQ---PHLLSLSLQIFKKP-REREKKTETQK-PMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPGYPPAM
        S N SP+  S+S        LLSLSL + K   REREK T     PMASSSED  SQSKA DP   H  PSS+ NNPPP+YPPPT+GYPP    GY PAM
Subjt:  SFNFSPFHSSTSHLQ---PHLLSLSLQIFKKP-REREKKTETQK-PMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPGYPPAM

Query:  GYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLN
        GYPP  P PGY  +P NYP  P N Y     YAQAPPAAYYNN Q Y+ + ++AGF+RGI +ALILLV +MTLSSIITW++LRP+IP+FKVDSFSV+N N
Subjt:  GYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLN

Query:  LAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWS
        ++K NYSG W  ++TVEN N KL V+ +RIQSFV+YK++TLAMS+ DPFF+DV+KS+QM VKLTS+SPDDPG+W E  EK+GQE+A+G VSFNLRFFAW+
Subjt:  LAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWS

Query:  TFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLV
         FRSG+WWTR ++M+VFCEDLK+ F G AA +G +LAD H K C V
Subjt:  TFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLV

XP_031739121.1 uncharacterized protein LOC116402855 [Cucumis sativus]

4.6e-95

Show/hide

Query:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR
        M ETV GVSFP+VFHDGERDT+IG V+VS+STEFKNFQS LSK IGISSHQFTVYLAEYK +LDSSTKIRRRIPITGKVNFGAI+GEKNSFFLVVLKRSR
Subjt:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR

Query:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN
        RERRRK  HDNE++YYF + TKT+TKTN  KKKNPPENVMLLRRN GI NE L+ FISPVM R+EYE RIRKLQLEKEKYL+++ +S L +   GDGGRN
Subjt:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN

Query:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGE
         + ++E  IC  C SA+E GV A FHCCA+DAV  GFRS AGPIARP +  E
Subjt:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGE

XP_038905898.1 uncharacterized protein LOC120091828 [Benincasa hispida]

1.0e-97

63.8

Show/hide

Query:  LLSLSLQIFKK-PRERE-KKTETQKPMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPGYPPAMGYPPAAPHPGY-SSPPNYPA
        LLSLSL + K   RERE +K      MASSS+D  SQSKA DP     PP S+ NNPPP+YPPPT+GYPP     YPPAMGYPP APHPGY  +P NYP 
Subjt:  LLSLSLQIFKK-PRERE-KKTETQKPMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPGYPPAMGYPPAAPHPGY-SSPPNYPA

Query:  YPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSN
         P N Y     YAQAPPAAYYNN Q Y+ E +N GF+RGI +ALIL V +MTLSSI+TW+ILRPEIP+F++DSFSV N N++KSNYSG W+ N+TV+N N
Subjt:  YPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSN

Query:  RKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCED
         +LNV+ +R+QSFVDYKD+TLAMS+ DPFFLDV+KS QM VKLTS+SPDDPG W+E  +K+GQE+ATG VSFNLRF AW+TFR G+WWTR V++RVFCED
Subjt:  RKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCED

Query:  LKVGFAGTAAANGKFLADGHPKACLV
        LK+ FAG AA    +  + +PK C V
Subjt:  LKVGFAGTAAANGKFLADGHPKACLV

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LER6 Uncharacterized protein

2.2e-95

Show/hide

Query:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR
        M ETV GVSFP+VFHDGERDT+IG V+VS+STEFKNFQS LSK IGISSHQFTVYLAEYK +LDSSTKIRRRIPITGKVNFGAI+GEKNSFFLVVLKRSR
Subjt:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR

Query:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN
        RERRRK  HDNE++YYF + TKT+TKTN  KKKNPPENVMLLRRN GI NE L+ FISPVM R+EYE RIRKLQLEKEKYL+++ +S L +   GDGGRN
Subjt:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN

Query:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGE
         + ++E  IC  C SA+E GV A FHCCA+DAV  GFRS AGPIARP +  E
Subjt:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGE

A0A0A0LGS8 Uncharacterized protein

1.3e-98

65.67

Show/hide

Query:  MASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPGYPPAMGYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYYNN-QT
        MASSSED  SQSKA DP   H  PSS+ NNPPP+YPPPT+GYPP    GY PAMGYPP  P PGY  +P NYP  P N Y     YAQAPPAAYYNN Q 
Subjt:  MASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPGYPPAMGYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYYNN-QT

Query:  YQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFV
        Y+ + ++AGF+RGI +ALILLV +MTLSSIITW++LRP+IP+FKVDSFSV+N N++K NYSG W  ++TVEN N KL V+ +RIQSFV+YK++TLAMS+ 
Subjt:  YQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFV

Query:  DPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLV
        DPFF+DV+KS+QM VKLTS+SPDDPG+W E  EK+GQE+A+G VSFNLRFFAW+ FRSG+WWTR ++M+VFCEDLK+ F G AA +G +LAD H K C V
Subjt:  DPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLV

A0A1S3B6W4 uncharacterized protein LOC103486674

1.5e-99

67.87

Show/hide

Query:  MASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP---NYPAYPQNGYNGGYAYAQAPPAAYYNN
        MASSSED  SQSKA DP   H  PSS+ NNPPP+YPPPT+GYPP   H GY PAMGYPP APHP Y  PP   NYP  P N Y     YAQAPPAAYYNN
Subjt:  MASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP---NYPAYPQNGYNGGYAYAQAPPAAYYNN

Query:  -QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAM
         Q Y+   I+AGF+RGI +ALILLV +MTLSSIITW+ILRPE+P+FKVDSFSV+N N++K NYSG W+A+VTV+N N KLNV+ +RIQSFVDYK +TLAM
Subjt:  -QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAM

Query:  SFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKA
        S+ DPFFLDV+KS QM VKLTS+SPDDPG+W E  EK+G+ERATG VSFNLRFFAW+TFR+G+WWTR V+MRV CED+K+ F G AA +  +LAD H K 
Subjt:  SFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKA

Query:  CLVYV
        C V V
Subjt:  CLVYV

A0A5A7TLT1 Protein YLS9

5.0e-196

56.33

Show/hide

Query:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR
        M +TV GVSFP+VFHDGERDT+IG V+VS+STEFKNFQS LSK IGISSHQFTVYLAEYK +LDSSTKIRRRIPITGKVNFGAI+GEKNSFFLVVLKRSR
Subjt:  MVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYKSALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSR

Query:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN
        RERRRK  HDNE++YYF + TKT+TKTNQPKKKNPPENVMLLRRN GI NE LS F+SPVM R+EYE+RIRKLQLE+EKYLI++ ++ L++   GDGGRN
Subjt:  RERRRKG-HDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIRKLQLEKEKYLINMGLSKLSV--DGDGGRN

Query:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGEKGRESGGLGNIPMKLGAPCGSPTRDRRLLTGRTPFQGVVWILEIWAWC
         + ++E  ICR C SA+E GV A FHCCA+DAV  GFRS AGPIARP    EK +E                                          WC
Subjt:  GTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGEKGRESGGLGNIPMKLGAPCGSPTRDRRLLTGRTPFQGVVWILEIWAWC

Query:  RLVIGFEKHKKKAIGNDILRDFFSFFFSFFGVGNEVGVFGKWVGVCLFVCLFVVCANVVEINNMYSAEAVFWKVKVKPIDKKPLKSPPNSFNFSPFHSST
                                        G+                    C+ V+E +                      KS PN        SS 
Subjt:  RLVIGFEKHKKKAIGNDILRDFFSFFFSFFGVGNEVGVFGKWVGVCLFVCLFVVCANVVEINNMYSAEAVFWKVKVKPIDKKPLKSPPNSFNFSPFHSST

Query:  SHLQPHLLSLSLQIFKKPREREKKTETQKPMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP
         +     ++ ++   +  RE + +     PMASSSED  SQSKA DP   H  PSS+ NNPPP+YPPPT+GYPP   H GY PAMGYPP APHP Y  PP
Subjt:  SHLQPHLLSLSLQIFKKPREREKKTETQKPMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP-HPGYPPAMGYPPAAPHPGYSSPP

Query:  ---NYPAYPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEAN
           NYP  P N Y     YAQAPPAAYYNN Q Y+   I+AGF+RGI +ALILLV +MTLSSIITW+ILRPE+P+FKVDSFSV+N N++K NYSG W+A+
Subjt:  ---NYPAYPQNGYNGGYAYAQAPPAAYYNN-QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEAN

Query:  VTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVI
        VTV+N N KLNV+ +RIQSFVDYK +TLAMS+ DPFFLDV+KS QM VKLTS+SPDDPG+W E  EK+G+ERATG VSFNLRFFAW+TFR+G+WWTR V+
Subjt:  VTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVI

Query:  MRVFCEDLKVGFAGTAAANGKFLADGHPKACLVYV
        MRV CED+K+ F G AA +  +LAD H K C V V
Subjt:  MRVFCEDLKVGFAGTAAANGKFLADGHPKACLVYV

A0A6J1J6I9 uncharacterized protein LOC111481675

2.0e-91

58.56

Show/hide

Query:  PLKSPPNSFNFSPFHSSTSHLQPHLLSLSLQIFKKPREREKKTETQKPMASSSEDP---PSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPG
        P+  PP    F P   S S      LSLSLQ     RE+  K +    MASSS D     SQSK  DP    P P S+ NNPPPIYPPPT+GYPP  H G
Subjt:  PLKSPPNSFNFSPFHSSTSHLQPHLLSLSLQIFKKPREREKKTETQKPMASSSEDP---PSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPG

Query:  YPPAMGYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYYNN--------QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPI
        YPPAMGYPP APHPGY  +P NYP Y        YAY QAPPAAYYN+        Q Y+ E   AGF+RGIF+AL+LLVV+MT+SSIITW+ILRPEIP 
Subjt:  YPPAMGYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYYNN--------QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPI

Query:  FKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATG
        FKVDSFSV N N++KSNYSG+W+  VTV+N N KLN+HF+RI+SFVDY D+T+A SF DPFFLD++KS QM VK+TS+SPDDPG+W +  EK+ +ERATG
Subjt:  FKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATG

Query:  LVSFNLRFFAWSTFR--SGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLVYV
         VSF LR  AW+TFR  SG+ WTR VI+RVFCEDLK+ F G    +G +    HPK C V V
Subjt:  LVSFNLRFFAWSTFR--SGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLVYV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G27080.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

5.3e-04

25.76

Show/hide

Query:  SPPNYPAYPQNGYNGGYAYAQAPPAAYY-----NNQTYQV--------------ERINAGFVRGIF----SALILLVVLMTLSSIITWMILRPEIPIFKV
        SPP    +  N  +G +    APP + Y      +Q Y++              ++ N    R  F    +A+ +L+VL  +S  + ++I RPE P + +
Subjt:  SPPNYPAYPQNGYNGGYAYAQAPPAAYY-----NNQTYQV--------------ERINAGFVRGIF----SALILLVVLMTLSSIITWMILRPEIPIFKV

Query:  DSFSVTNLNL-AKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLV
        + FSV+ +NL + S  S  +   V   N N K+ V++++  S   Y +     + V P F    K N   VKL   S       S + ++M  E +   V
Subjt:  DSFSVTNLNL-AKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLV

Query:  SFNLRFFAWSTFRSGTWWTRHVIMRVFCE
         F L+  A    + G+  T  +I+ V C+
Subjt:  SFNLRFFAWSTFRSGTWWTRHVIMRVFCE

AT2G27080.2 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

5.3e-04

25.76

Show/hide

Query:  SPPNYPAYPQNGYNGGYAYAQAPPAAYY-----NNQTYQV--------------ERINAGFVRGIF----SALILLVVLMTLSSIITWMILRPEIPIFKV
        SPP    +  N  +G +    APP + Y      +Q Y++              ++ N    R  F    +A+ +L+VL  +S  + ++I RPE P + +
Subjt:  SPPNYPAYPQNGYNGGYAYAQAPPAAYY-----NNQTYQV--------------ERINAGFVRGIF----SALILLVVLMTLSSIITWMILRPEIPIFKV

Query:  DSFSVTNLNL-AKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLV
        + FSV+ +NL + S  S  +   V   N N K+ V++++  S   Y +     + V P F    K N   VKL   S       S + ++M  E +   V
Subjt:  DSFSVTNLNL-AKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLV

Query:  SFNLRFFAWSTFRSGTWWTRHVIMRVFCE
         F L+  A    + G+  T  +I+ V C+
Subjt:  SFNLRFFAWSTFRSGTWWTRHVIMRVFCE

AT2G27260.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.2e-16

29.48

Show/hide

Query:  PAMGYPPAAPHPGYSSPPNYPAYPQNGYNGGYAYAQAPPAAYYNNQTYQVERIN--AGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVT
        PA GYP   P+P     P     P NGY    A    P   Y N+  Y   + N  A  +R +F      ++L+ L   I ++I+RP++P   ++S SV+
Subjt:  PAMGYPPAAPHPGYSSPPNYPAYPQNGYNGGYAYAQAPPAAYYNNQTYQVERIN--AGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVT

Query:  NLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERAT-GLVSFNLRF
        N N++ +  SG W+  +   N N K+++H++     + Y   +L+ + + PF  D  K +Q  V  T +      D   + + +G+ER+  G V F+LR 
Subjt:  NLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERAT-GLVSFNLRF

Query:  FAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLVY
         ++ TFR G +  R  +  V+C+D+ VG    ++  GK +  G  K C  Y
Subjt:  FAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHPKACLVY

AT3G52460.1 hydroxyproline-rich glycoprotein family protein

7.2e-46

42.39

Show/hide

Query:  PPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP---HPGYPPAMGYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYY-------NN
        PP +     P       S    N PP  PPP    PP P      YPP MGY      PGY   PP YP YP   Y   Y YAQAPPA+YY        N
Subjt:  PPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAP---HPGYPPAMGYPPAAPHPGY-SSPPNYPAYPQNGYNGGYAYAQAPPAAYY-------NN

Query:  QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDY-----KDH
          YQ    ++GFVRGIF+ LI+LVVL+ +S+ ITW++LRP+IP+F V++FSV+N N+    +S  W AN+T+EN N KL  +FDRIQ  V +     +D 
Subjt:  QTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQSFVDY-----KDH

Query:  TLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADG
         LA +F  P F++ +KS  +   LT+   + P   S V ++M +ER TG V+F+LR   W TF++  W  R   ++VFC  LKVGF G  + NG  L   
Subjt:  TLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADG

Query:  HPKACLVYV
         P  C+VYV
Subjt:  HPKACLVYV

AT5G22870.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.9e-09

23.21

Show/hide

Query:  IFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNY-SGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQ
        IF  ++ L+ +  +  +ITW+  +P+   + V++ SV N NL   N+ S  ++  +   N N +++V++  ++ FV +KD TLA   V+PF        Q
Subjt:  IFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNY-SGLWEANVTVENSNRKLNVHFDRIQSFVDYKDHTLAMSFVDPFFLDVQKSNQ

Query:  MHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFA
        +   L +   ++        + +  + + G + F +   A   F+ G W + H   ++ C  + V  +
Subjt:  MHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAGAAGACGAAGCTCGGAAGAGACAACTCAGCGGAAGACTCCTCCAATGAGGAGTTGACGAGAATTCAACTGAATAATAGGGGCAGTTCGGTCCATAGACCCCCAAC
GCGACCATTACGCTGTCGTTTTGGTTTCCTTGATTCTCAAATGGTGGAGACAGTCGGGGGCGTCTCGTTCCCGGTCGTTTTCCACGACGGCGAACGAGACACCCACATCG
GTTACGTTGTCGTTTCTGCTTCGACGGAATTCAAGAATTTTCAGTCGATTTTGAGCAAGAAGATCGGAATCTCTTCGCACCAGTTCACGGTTTACCTCGCGGAGTACAAG
AGCGCACTGGATTCCTCGACGAAGATTCGGCGGAGAATCCCCATCACCGGGAAGGTCAACTTCGGCGCAATCGCTGGCGAGAAGAACAGCTTTTTTCTCGTGGTTTTGAA
ACGGTCTAGGCGCGAGAGGAGGCGAAAGGGCCACGACAACGAAGACGAATACTACTTCCCGACTACGACGAAGACGAAGACGAAAACGAATCAACCGAAGAAGAAGAATC
CACCGGAGAATGTGATGCTGTTGCGACGGAACACGGGCATTGGAAACGAACCGCTCTCCGAGTTCATCTCACCGGTGATGGGGCGATTCGAATACGAACAGCGAATTCGG
AAACTGCAGCTCGAGAAGGAGAAGTATTTAATAAACATGGGGCTAAGCAAACTGAGTGTGGACGGAGACGGTGGCCGGAACGGTACAGCGAAAGCCGAAGCGGCGATCTG
CCGGTACTGCCAGAGTGCGGAAGAGACGGGCGTGGAGGCCGAGTTCCACTGCTGCGCCCACGACGCCGTGATCACAGGATTCCGGTCACGGGCGGGTCCAATTGCCCGAC
CCAGTAGGTTAGGAGAGAAGGGAAGGGAGAGTGGTGGATTGGGGAATATTCCTATGAAGTTGGGTGCACCGTGTGGTTCGCCGACACGCGATCGAAGGTTGCTCACGGGA
AGAACTCCATTTCAAGGCGTCGTATGGATCTTAGAGATCTGGGCATGGTGTCGCTTGGTGATCGGATTTGAGAAGCATAAAAAGAAGGCTATAGGGAATGATATTTTGAG
GGATTTTTTTTCTTTCTTTTTTTCTTTTTTTGGTGTTGGGAATGAAGTAGGAGTTTTTGGGAAATGGGTTGGTGTTTGTTTGTTTGTTTGTTTGTTTGTTGTGTGTGCAA
ATGTGGTGGAAATAAATAATATGTACAGTGCAGAAGCTGTTTTTTGGAAAGTCAAAGTCAAACCAATTGACAAAAAGCCATTGAAAAGCCCTCCAAATTCCTTCAACTTC
TCTCCTTTCCATTCTTCTACCTCTCATCTCCAACCCCATCTCCTCTCTCTCTCTCTCCAAATTTTCAAAAAACCTAGAGAGAGAGAGAAAAAAACCGAAACACAGAAACC
CATGGCTTCTTCCTCCGAGGATCCACCGTCGCAATCCAAGGCAGCTGACCCAGCAGCCGCCCATCCCCCACCCTCCTCCTCCCCAAACAACCCGCCTCCGATCTACCCTC
CGCCCACAATGGGCTACCCTCCGGCTCCCCATCCCGGCTACCCCCCGGCCATGGGCTACCCTCCGGCCGCCCCCCATCCCGGCTACTCCTCCCCGCCTAACTATCCCGCT
TACCCTCAGAACGGATACAACGGCGGCTACGCCTACGCCCAGGCCCCGCCGGCGGCGTATTACAACAACCAAACGTATCAGGTGGAACGGATCAACGCTGGCTTCGTCCG
CGGCATTTTCTCGGCGTTGATTCTGCTGGTGGTGTTGATGACCCTCAGCAGCATCATCACGTGGATGATCCTCCGCCCGGAGATCCCCATCTTCAAAGTCGACTCCTTCT
CTGTCACCAATTTAAACCTCGCAAAATCCAACTACTCCGGTCTCTGGGAAGCCAACGTCACCGTCGAGAACTCCAACCGGAAACTCAACGTCCATTTCGACCGAATCCAG
AGCTTCGTCGACTACAAAGACCACACCCTCGCCATGTCGTTCGTGGATCCGTTCTTCCTCGACGTCCAGAAGAGCAACCAGATGCATGTGAAGTTGACGTCGAACAGCCC
CGACGACCCCGGCGACTGGAGCGAGGTGACGGAGAAGATGGGCCAGGAGAGGGCCACCGGACTGGTGAGTTTCAACCTGAGATTCTTCGCCTGGTCGACGTTCCGATCTG
GGACGTGGTGGACGAGGCACGTGATCATGAGAGTGTTCTGCGAGGATTTGAAGGTGGGGTTCGCCGGAACGGCGGCGGCCAACGGGAAGTTCTTGGCCGACGGCCACCCC
AAGGCTTGTTTGGTTTATGTATAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKKTKLGRDNSAEDSSNEELTRIQLNNRGSSVHRPPTRPLRCRFGFLDSQMVETVGGVSFPVVFHDGERDTHIGYVVVSASTEFKNFQSILSKKIGISSHQFTVYLAEYK
SALDSSTKIRRRIPITGKVNFGAIAGEKNSFFLVVLKRSRRERRRKGHDNEDEYYFPTTTKTKTKTNQPKKKNPPENVMLLRRNTGIGNEPLSEFISPVMGRFEYEQRIR
KLQLEKEKYLINMGLSKLSVDGDGGRNGTAKAEAAICRYCQSAEETGVEAEFHCCAHDAVITGFRSRAGPIARPSRLGEKGRESGGLGNIPMKLGAPCGSPTRDRRLLTG
RTPFQGVVWILEIWAWCRLVIGFEKHKKKAIGNDILRDFFSFFFSFFGVGNEVGVFGKWVGVCLFVCLFVVCANVVEINNMYSAEAVFWKVKVKPIDKKPLKSPPNSFNF
SPFHSSTSHLQPHLLSLSLQIFKKPREREKKTETQKPMASSSEDPPSQSKAADPAAAHPPPSSSPNNPPPIYPPPTMGYPPAPHPGYPPAMGYPPAAPHPGYSSPPNYPA
YPQNGYNGGYAYAQAPPAAYYNNQTYQVERINAGFVRGIFSALILLVVLMTLSSIITWMILRPEIPIFKVDSFSVTNLNLAKSNYSGLWEANVTVENSNRKLNVHFDRIQ
SFVDYKDHTLAMSFVDPFFLDVQKSNQMHVKLTSNSPDDPGDWSEVTEKMGQERATGLVSFNLRFFAWSTFRSGTWWTRHVIMRVFCEDLKVGFAGTAAANGKFLADGHP
KACLVYV

Sgr018214 (gene) of Monk fruit (Qingpiguo) v1 genome