; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr019565 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr019565
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
DescriptionARM repeat superfamily protein
Genome locationtig00153348:825295..827040
RNA-Seq ExpressionSgr019565
SyntenySgr019565
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR000225 - Armadillo
IPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7019647.1 U-box domain-containing protein 4, partial [Cucurbita argyrosperma subsp. argyrosperma]8.9e-29390.71Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PRP ETGPT +PDFS+DKPTLRQVI  ISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETA EC DLA R
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+II
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLH ISGF+SYK VLVGNG+IAPLIRV+E GSE GK+IA RCL+KFTENS NAWSVSAHGGVTALLKICS+ D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELI PACGVL NLVGVEEIKRFMIEEGAI TFIRLARS+DEAVQINSIVFLQNIAYGDESVNK LVK+GG+RALVRVLDPKSSSS+KTLEV +RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN LMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NV MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_022140205.1 uncharacterized protein LOC111010930 [Momordica charantia]0.0e+0096.04Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PRPAET PTN+PDFSV+KPTLRQVIQFISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATECHDLARR
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        E+GEIVNLLVNFLGSPE ELQEAALKVLHIISGF+SYKAVLVGNGIIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSS D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        KTELIGPACGVL NLVGVEEIKRFMIEEGAI TFIR+ARS+DEAVQINSIVFLQNIAYGDESVN LLVKEGGVRALVRVLDPKSSSSSKTLEV LRAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN LMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEE KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_022927631.1 uncharacterized protein LOC111434400 [Cucurbita moschata]2.3e-29390.88Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PRP ETGPT +PDFS+DKPTLRQVI  ISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA R
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+II
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLH ISGF+SYK VLVGNG+IAPLIRV+E GSE GK+IA RCL+KFTENS NAWSVSAHGGVTALLKICS+ D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELI PACGVL NLVGVEEIKRFMIEEGAI TFIRLARS+DEAVQINSIVFLQNIAYGDESVNK LVK+GG+RALVRVLDPKSSSS+KTLEV +RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN LMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NV MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_023519872.1 uncharacterized protein LOC111783203 [Cucurbita pepo subsp. pepo]8.1e-29490.88Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PRP ETGPT +PDFS+DKPTLRQVI  IS+LISLSHS+KVF+SKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA R
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+II
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLHIISGF+SYK VLVGNG+IAPLIRV+E GSE GK+IA RCL+KFTENS NAWSVSAHGGVTALLKICS+ D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELI PACGVL NLVGVEEIKRFMIEEGAI TFIRLARS+DEAVQINSIVFLQNIAYGDESVNK LVK+GG+RALVRVLDPKSSSS+KTLEV +RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN LMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTSEE KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NV MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_038895092.1 uncharacterized protein LOC120083411 [Benincasa hispida]5.6e-29591.74Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+E+G PR AET PT +PDF ++ PTLRQVI  ISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC+DLARR
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVII
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLHIISGF+SYKAVLVGNG+IAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICS+ D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELIGPACGVL NLV VEEIKRFMIEEGAI TFIRLARSRDEAVQINSIVFLQNIAYGDESV KLLVK+GG+RALVRV+DPKSSSSSKTLEVT+RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCG SEE KKAMGDGGFMPEFV+FLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NV  LLQMLDTEEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

TrEMBL top hitse value%identityAlignment
A0A1S3B433 uncharacterized protein LOC1034859499.6e-29391.22Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PR AET P  +PDFS++ PTLRQVI  ISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC+DLARR
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVII
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLHIISGF+SYKAVLVGNG+IAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICS+ D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELI PACGVL NLVGVEEIKRFMIEE AI TFI LA+SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGG+RALVRV+DPKSSSSSKTLEVT+RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSIS VN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEE KKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        N+ MLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A5A7UPA9 Vacuolar protein 89.6e-29391.22Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PR AET P  +PDFS++ PTLRQVI  ISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC+DLARR
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVII
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLHIISGF+SYKAVLVGNG+IAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICS+ D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELI PACGVL NLVGVEEIKRFMIEE AI TFI LA+SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGG+RALVRV+DPKSSSSSKTLEVT+RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSIS VN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEE KKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        N+ MLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1CEG2 uncharacterized protein LOC1110109300.0e+0096.04Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PRPAET PTN+PDFSV+KPTLRQVIQFISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATECHDLARR
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        E+GEIVNLLVNFLGSPE ELQEAALKVLHIISGF+SYKAVLVGNGIIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSS D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        KTELIGPACGVL NLVGVEEIKRFMIEEGAI TFIR+ARS+DEAVQINSIVFLQNIAYGDESVN LLVKEGGVRALVRVLDPKSSSSSKTLEV LRAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN LMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEE KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1EI74 uncharacterized protein LOC1114344001.1e-29390.88Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+ERG PRP ETGPT +PDFS+DKPTLRQVI  ISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA R
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+II
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLH ISGF+SYK VLVGNG+IAPLIRV+E GSE GK+IA RCL+KFTENS NAWSVSAHGGVTALLKICS+ D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELI PACGVL NLVGVEEIKRFMIEEGAI TFIRLARS+DEAVQINSIVFLQNIAYGDESVNK LVK+GG+RALVRVLDPKSSSS+KTLEV +RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN LMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NV MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1KJB3 uncharacterized protein LOC1114951325.6e-29390.71Show/hide
Query:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR
        MR+E+G PRPAETGPT +PDFS+DKPTLRQVI  ISSLISLSHS+KVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC DLA R
Subjt:  MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARR

Query:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII
        CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+II
Subjt:  CVDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVII

Query:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA
        EIGEIVNLLVNFLGSPE ELQEAALKVLHIISGF+SYKAVLVGNG+IAPLIRV+E GSE GK+IA RCL+KFTENS NAWSVSAHGGVTALLKICS  D+
Subjt:  EIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDA

Query:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN
        K ELI PACGVL NLVGVEEIKRFMIEEGAI TFIRLARS+DEAVQ+NSIVFLQNIAYGDESVNK LVK+GG+RALVRVLDPKSSSS+KTLEV +RAIEN
Subjt:  KTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIEN

Query:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR
        LCFSSISYVN LMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTSE+ KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+R
Subjt:  LCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDR

Query:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        NV MLLQML TEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  NVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

SwissProt top hitse value%identityAlignment
O22193 U-box domain-containing protein 43.6e-1026.62Show/hide
Query:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVG
        +VS P     +D  ++   V+ +V  +K    D +RQA   L      +     VI   G IV LLV  L S +   QE A+  L  +S  ++ K  +  
Subjt:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVG

Query:  NGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDE
         G I PLI V+E GS   K+ +A  L   +   EN   +   G +  L+ +  +G  + +    A   L NL   +E K  +++ GA+   I L      
Subjt:  NGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDE

Query:  AVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVA
         V   ++  L N+A   E  N  + +EGG+  LV V++     S++  E    A+  L  +S  + N ++  G +  L+   ++G    +E A
Subjt:  AVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVA

P39968 Vacuolar protein 85.9e-1326.36Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  N  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI

Query:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  S   + +    A G L N+   EE ++ ++  GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGG-VRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEET
         L NIA  + +  KL   E   V  LV ++D  S SS    + TL A+ NL  S  SY   ++  G + HL+  +++  + L  +A    +R        
Subjt:  FLQNIAYGDESVNKLLVKEGG-VRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEET

Query:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ
        +  + D GF+   V+ L  K S E++  A   L  +     KNRK F +
Subjt:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ

Q6CX49 Vacuolar protein 89.4e-1123.56Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI
        KD   FY    +R + T +     +L+R A    LA     EKYV  +    +++  ++  L +P+ +++ A+   L  ++  N  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI

Query:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  S + + +    A G L N+    E ++ +++ GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETK
         L NIA  DES N+  + +   + + +++   +S+S +       A+ NL  S  +Y   ++  G +  L+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETK

Query:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFVQ
          + D GF+P  VK L   +S E++  A   L  +     KNR  F Q
Subjt:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFVQ

Q6FJV1 Vacuolar protein 87.0e-1426.93Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    +++  ++  L S + ++Q AA   L  ++  N  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI

Query:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  S   + +    A G L N+   EE +R ++  GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGG-VRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEET
         L NIA  + +  KL   E   V  LV ++D  S SS    + TL A+ NL  S  SY   ++  G + HL+  +++  V L  +A    +R        
Subjt:  FLQNIAYGDESVNKLLVKEGG-VRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEET

Query:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ
        +  + D GF+P  VK L  + S E++  A   L  +     KNRK F +
Subjt:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ

Q757R0 Vacuolar protein 83.6e-1024.57Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI
        KD+  FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  N  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLI

Query:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  S + + +    A G L N+    E ++ +++ GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETK
         L NIA  + +  KL   E  + + + VL    S+  K  + TL A+ NL  S   Y   ++  G + HL+  ++   + L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETK

Query:  KAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGM----VMIPKNRKRFVQ
          + D GF+   VK L     E  E+   A+S +        KNR+ F +
Subjt:  KAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGM----VMIPKNRKRFVQ

Arabidopsis top hitse value%identityAlignment
AT1G61350.1 ARM repeat superfamily protein6.8e-18259.57Show/hide
Query:  KPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFD
        K ++ + I+ ISSLISLSHSIK F  KW+LIR KL+EL SGL +  N +S  +P++S LIS ++ +  + +DLA RCV++SFSGKLLMQSDLDV+  KFD
Subjt:  KPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFD

Query:  RHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAA
         H + LS IY+AGILS GFAIVV +P   ACKDDMRFY+RD++TRMKIG  ++K+QALV L  A+ ED++YVK++IEI ++VN+LV FL S E+ +QE +
Subjt:  RHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMELQEAA

Query:  LKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRF
         K +  ISGF SY+ VL+ +G+I PL+RV+E G+ VG++ +ARCL+K TENSENAWSVSAHGGV+ALLKICS  D   ELIG +CGVLRNLVGVEEIKRF
Subjt:  LKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRF

Query:  MIEEG-AILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVL-DPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLL
        MIEE   + TFI+L  S++E VQ+NSI  L ++   DE    +LV+EGG++ LV VL DP S SSSK+ E+ LRAI+NLCF S   +N LM   F+DHLL
Subjt:  MIEEG-AILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVL-DPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLL

Query:  FFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEG-----NSG
          LRNGE+S+QE ALKV  RLC   EE K+ MG+ GFMPE VKFL AKS +VREMA+ AL  ++ +P+NRK+F QDD N+  +LQ+LD E+G     +SG
Subjt:  FFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEG-----NSG

Query:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        N +FL SIL SLT  +S RRKI +SGY+K+IEKLAE E  DAKKLV+KLS N+FRS+L+GIWHS
Subjt:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

AT2G05810.1 ARM repeat superfamily protein1.2e-6130.21Show/hide
Query:  AETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFS-G
        A +G    P  +  +P +  +   +S L+  S +++ F  +W+++R KL  LNS L + +++    +NP +  L+  ++        L+ +C   SFS G
Subjt:  AETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFS-G

Query:  KLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNL
        KLLMQSDLD+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G  V  
Subjt:  KLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNL

Query:  LVNFLGSPEMEL-QEAALKVLHII--SGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELI
        LV  L      L +E AL  + ++  S  +S K V    G + PL+R++E GS   K  AA  +   T +   AW++SA+GGVT L++ C SG  + +  
Subjt:  LVNFLGSPEMEL-QEAALKVLHII--SGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELI

Query:  GPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFS
            G + N+  VEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V+E GG++ L+ ++  + SS+  T+E  L A+  +  S
Subjt:  GPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFS

Query:  SISYVNFLMNYG--FMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        ++  V+ +++    F+  L   +++G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK  ++D+++
Subjt:  SISYVNFLMNYG--FMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        V  L+QMLD       NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G05810.2 ARM repeat superfamily protein1.2e-6130.21Show/hide
Query:  AETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFS-G
        A +G    P  +  +P +  +   +S L+  S +++ F  +W+++R KL  LNS L + +++    +NP +  L+  ++        L+ +C   SFS G
Subjt:  AETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFS-G

Query:  KLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNL
        KLLMQSDLD+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G  V  
Subjt:  KLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNL

Query:  LVNFLGSPEMEL-QEAALKVLHII--SGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELI
        LV  L      L +E AL  + ++  S  +S K V    G + PL+R++E GS   K  AA  +   T +   AW++SA+GGVT L++ C SG  + +  
Subjt:  LVNFLGSPEMEL-QEAALKVLHII--SGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELI

Query:  GPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFS
            G + N+  VEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V+E GG++ L+ ++  + SS+  T+E  L A+  +  S
Subjt:  GPACGVLRNLVGVEEIKRFMIEEGAILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFS

Query:  SISYVNFLMNYG--FMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        ++  V+ +++    F+  L   +++G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK  ++D+++
Subjt:  SISYVNFLMNYG--FMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        V  L+QMLD       NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G45720.1 ARM repeat superfamily protein1.2e-5829.27Show/hide
Query:  ETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFSGK
        +TG     D +V+   L Q  + +   +S + ++K F+S+W++I  +LE++ + L  +++  C S ++      +  V+ET  E  +LA  CV     GK
Subjt:  ETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFSGK

Query:  LLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEI-VNL
        L MQSDLD + AK D   K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  
Subjt:  LLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEI-VNL

Query:  LVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPA
        LV  L +    ++E A+ V+  ++     +  L+    +  LIR++E GS V K+ A   L + + +SE + S+  HGGV  L++IC +GD+ ++    A
Subjt:  LVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPA

Query:  CGVLRNLVGVEEIKRFMIEEGAILTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLC
        C  L+N+  V E+++ + EEG +   I       L  S++ A +      LQN+   +E++ + ++ E G++ L+  LD      S      + AI NL 
Subjt:  CGVLRNLVGVEEIKRFMIEEGAILTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLC

Query:  FSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNV
           +  V+    +  +  L+  L++G +  Q+ A     R+  TS ETK+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D+++V
Subjt:  FSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNV

Query:  GMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN
          L+ +L+   GNS  K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  GMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN

AT2G45720.2 ARM repeat superfamily protein1.2e-5829.27Show/hide
Query:  ETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFSGK
        +TG     D +V+   L Q  + +   +S + ++K F+S+W++I  +LE++ + L  +++  C S ++      +  V+ET  E  +LA  CV     GK
Subjt:  ETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFSGK

Query:  LLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEI-VNL
        L MQSDLD + AK D   K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  
Subjt:  LLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEI-VNL

Query:  LVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPA
        LV  L +    ++E A+ V+  ++     +  L+    +  LIR++E GS V K+ A   L + + +SE + S+  HGGV  L++IC +GD+ ++    A
Subjt:  LVNFLGSPEMELQEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPA

Query:  CGVLRNLVGVEEIKRFMIEEGAILTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLC
        C  L+N+  V E+++ + EEG +   I       L  S++ A +      LQN+   +E++ + ++ E G++ L+  LD      S      + AI NL 
Subjt:  CGVLRNLVGVEEIKRFMIEEGAILTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLC

Query:  FSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNV
           +  V+    +  +  L+  L++G +  Q+ A     R+  TS ETK+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D+++V
Subjt:  FSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNV

Query:  GMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN
          L+ +L+   GNS  K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  GMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGAAAAGAGCGGGGGGTTCCGAGACCTGCAGAAACAGGCCCGACGAACGCGCCGGATTTCTCAGTCGATAAGCCCACTCTCCGGCAAGTTATTCAATTCATTTCTTC
CTTGATATCTCTTTCTCATTCCATTAAAGTCTTTGCCTCCAAATGGAAATTAATCCGGGACAAGCTTGAAGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATT
CCGACGAAAATCCAGCAATCTCAGGCCTAATTTCGAAGGTAATAGAGACAGCTACTGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTT
TTGATGCAGAGTGATTTGGATGTCATCTGTGCGAAATTTGATCGCCATGCGAAGAAGCTTTCGGACATATATACAGCAGGCATTTTATCACAAGGGTTTGCCATCGTCGT
TTCTAGGCCTGGCCTCGGAGCTTGCAAGGATGACATGAGATTTTATGTGAGGGACATAGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGGCAAGCTTTGGTTA
ATCTGCTTGCGGCCGTAATCGAAGACGAAAAGTATGTGAAAGTGATAATAGAAATCGGCGAGATAGTGAATCTCTTGGTTAATTTTCTTGGTTCCCCGGAGATGGAGCTT
CAAGAAGCGGCTTTGAAAGTGCTTCATATTATTTCTGGGTTTAATTCCTATAAAGCAGTTCTAGTTGGGAATGGGATAATCGCGCCATTGATTCGGGTTATGGAATGTGG
GAGTGAGGTGGGAAAGGATATTGCCGCCAGGTGTTTGTTAAAATTCACGGAGAATTCAGAAAATGCTTGGTCTGTATCTGCTCATGGCGGAGTAACAGCTCTATTAAAAA
TATGTTCGAGTGGTGATGCTAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGAAATCTCGTTGGTGTTGAAGAAATAAAGAGATTTATGATTGAAGAAGGTGCA
ATTTTAACGTTTATTAGGCTCGCTCGATCGAGAGATGAAGCTGTGCAGATAAACTCTATCGTCTTCCTCCAAAACATAGCTTATGGGGATGAATCAGTAAACAAATTGCT
GGTTAAAGAAGGAGGAGTTCGAGCTTTAGTTCGTGTTTTGGATCCGAAATCTTCGTCCTCATCCAAAACCCTAGAGGTAACGCTGCGAGCAATTGAAAACCTATGTTTCT
CATCAATCAGTTATGTAAATTTTCTGATGAACTACGGGTTCATGGATCATCTTCTTTTCTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCA
GTTAGGCTATGCGGGACATCAGAGGAAACCAAGAAAGCAATGGGCGATGGAGGTTTCATGCCAGAATTTGTCAAGTTTCTTGGTGCAAAGTCCTTTGAAGTTCGGGAAAT
GGCAGCCGAGGCACTCTCAGGCATGGTCATGATCCCTAAAAACAGAAAGAGATTTGTTCAGGACGACCGAAATGTAGGGATGCTTCTGCAAATGCTCGACACAGAGGAGG
GGAATTCAGGTAACAAAAGATTCCTCTTTTCGATATTAAACTCATTAACAGGAAGCAGTAGTGGAAGAAGAAAGATTGTGAATTCTGGGTATATGAAAAACATAGAGAAA
CTTGCAGAAGCTGAAGTTTACGATGCCAAGAAGCTCGTCAGGAAATTATCCACAAACAAATTCCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
mRNA sequenceShow/hide mRNA sequence
ATGAGAAAAGAGCGGGGGGTTCCGAGACCTGCAGAAACAGGCCCGACGAACGCGCCGGATTTCTCAGTCGATAAGCCCACTCTCCGGCAAGTTATTCAATTCATTTCTTC
CTTGATATCTCTTTCTCATTCCATTAAAGTCTTTGCCTCCAAATGGAAATTAATCCGGGACAAGCTTGAAGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATT
CCGACGAAAATCCAGCAATCTCAGGCCTAATTTCGAAGGTAATAGAGACAGCTACTGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTT
TTGATGCAGAGTGATTTGGATGTCATCTGTGCGAAATTTGATCGCCATGCGAAGAAGCTTTCGGACATATATACAGCAGGCATTTTATCACAAGGGTTTGCCATCGTCGT
TTCTAGGCCTGGCCTCGGAGCTTGCAAGGATGACATGAGATTTTATGTGAGGGACATAGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGGCAAGCTTTGGTTA
ATCTGCTTGCGGCCGTAATCGAAGACGAAAAGTATGTGAAAGTGATAATAGAAATCGGCGAGATAGTGAATCTCTTGGTTAATTTTCTTGGTTCCCCGGAGATGGAGCTT
CAAGAAGCGGCTTTGAAAGTGCTTCATATTATTTCTGGGTTTAATTCCTATAAAGCAGTTCTAGTTGGGAATGGGATAATCGCGCCATTGATTCGGGTTATGGAATGTGG
GAGTGAGGTGGGAAAGGATATTGCCGCCAGGTGTTTGTTAAAATTCACGGAGAATTCAGAAAATGCTTGGTCTGTATCTGCTCATGGCGGAGTAACAGCTCTATTAAAAA
TATGTTCGAGTGGTGATGCTAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGAAATCTCGTTGGTGTTGAAGAAATAAAGAGATTTATGATTGAAGAAGGTGCA
ATTTTAACGTTTATTAGGCTCGCTCGATCGAGAGATGAAGCTGTGCAGATAAACTCTATCGTCTTCCTCCAAAACATAGCTTATGGGGATGAATCAGTAAACAAATTGCT
GGTTAAAGAAGGAGGAGTTCGAGCTTTAGTTCGTGTTTTGGATCCGAAATCTTCGTCCTCATCCAAAACCCTAGAGGTAACGCTGCGAGCAATTGAAAACCTATGTTTCT
CATCAATCAGTTATGTAAATTTTCTGATGAACTACGGGTTCATGGATCATCTTCTTTTCTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCA
GTTAGGCTATGCGGGACATCAGAGGAAACCAAGAAAGCAATGGGCGATGGAGGTTTCATGCCAGAATTTGTCAAGTTTCTTGGTGCAAAGTCCTTTGAAGTTCGGGAAAT
GGCAGCCGAGGCACTCTCAGGCATGGTCATGATCCCTAAAAACAGAAAGAGATTTGTTCAGGACGACCGAAATGTAGGGATGCTTCTGCAAATGCTCGACACAGAGGAGG
GGAATTCAGGTAACAAAAGATTCCTCTTTTCGATATTAAACTCATTAACAGGAAGCAGTAGTGGAAGAAGAAAGATTGTGAATTCTGGGTATATGAAAAACATAGAGAAA
CTTGCAGAAGCTGAAGTTTACGATGCCAAGAAGCTCGTCAGGAAATTATCCACAAACAAATTCCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
Protein sequenceShow/hide protein sequence
MRKERGVPRPAETGPTNAPDFSVDKPTLRQVIQFISSLISLSHSIKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISGLISKVIETATECHDLARRCVDLSFSGKL
LMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEIGEIVNLLVNFLGSPEMEL
QEAALKVLHIISGFNSYKAVLVGNGIIAPLIRVMECGSEVGKDIAARCLLKFTENSENAWSVSAHGGVTALLKICSSGDAKTELIGPACGVLRNLVGVEEIKRFMIEEGA
ILTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGVRALVRVLDPKSSSSSKTLEVTLRAIENLCFSSISYVNFLMNYGFMDHLLFFLRNGEVSLQEVALKVA
VRLCGTSEETKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEK
LAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS