; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MC03g0834 (gene) of Bitter gourd (Dali-11) v1 genome

Gene IDMC03g0834
OrganismMomordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
DescriptionARM repeat superfamily protein
Genome locationMC03:14971992..14973731
RNA-Seq ExpressionMC03g0834
SyntenyMC03g0834
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR000225 - Armadillo
IPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7019647.1 U-box domain-containing protein 4, partial [Cucurbita argyrosperma subsp. argyrosperma]0.091.9Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETA EC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLH ISGFDSYK VLVGNG+IAPLIRV+E GSE GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_022140205.1 uncharacterized protein LOC111010930 [Momordica charantia]0.0100Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_022927631.1 uncharacterized protein LOC111434400 [Cucurbita moschata]0.092.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLH ISGFDSYK VLVGNG+IAPLIRV+E GSE GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_023519872.1 uncharacterized protein LOC111783203 [Cucurbita pepo subsp. pepo]0.092.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  IS+LISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYK VLVGNG+IAPLIRV+E GSE GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTSEE KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_038895092.1 uncharacterized protein LOC120083411 [Benincasa hispida]0.092.93Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREE+GPR AETDPT SPDF +  PTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LIPKVI TATEC+DLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELIGPACGVLSNLV VEEIKRFMIEEGAISTFIR+ARS+DEAVQINSIVFLQNIAYGDESV  LLVK+GG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCG SEEAKKAMGDGGFMPEFV+FLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V  LLQMLDTEEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

TrEMBL top hitse value%identityAlignment
A0A0A0LRT3 Uncharacterized protein0.091.55Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPR AETDP  SPDFS+  PTLRQ+I  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI K+I TATEC+DLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+G+IAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFI +++S+DEAVQI+SIVFLQNIAYGDESVN LLVKEGG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSS+S VN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEEAKK MGDGGFMPEF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        + MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIW+S
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A5A7UPA9 Vacuolar protein 80.092.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPR AETDP  SPDFS+  PTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC+DLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI +A+S+DEAVQINSIVFLQNIAYGDESVN LLVKEGG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSIS VN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        + MLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIW+S
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A6J1CEG2 uncharacterized protein LOC1110109300.0100Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A6J1EI74 uncharacterized protein LOC1114344000.092.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLH ISGFDSYK VLVGNG+IAPLIRV+E GSE GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A6J1KJB3 uncharacterized protein LOC1114951320.091.9Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREE+GPRPAET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRV+E GSE GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS +DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARSKDEAVQ+NSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTSE+ KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQML TEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

SwissProt top hitse value%identityAlignment
O22193 U-box domain-containing protein 49.4e-1126.62Show/hide
Query:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG
        +VS P     +D  ++   V+ +V  +K    D +RQA   L      +     VI   G IV LLV  L S ++  QE A+  L  +S  D+ K  +  
Subjt:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG

Query:  NGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDE
         G I PLI V+E GS   K  +A  L   +   EN   +   G +  L+ +  +   + +    A   L NL   +E K  +++ GA+   I +      
Subjt:  NGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDE

Query:  AVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVA
         V   ++  L N+A   E   N + +EGG+  LV V++     S++  E A  A+  L  +S  + N+++  G +  L+   ++G    +E A
Subjt:  AVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVA

P39968 Vacuolar protein 81.9e-1124.43Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI

Query:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  S   + +    A G L N+   EE ++ ++  GA+   + +  S D  VQ     
Subjt:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIV

Query:  FLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAK
         L NIA  + +   L   E   R + +++    S SS+    A  A+ NL  S  SY   ++  G + HL+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAK

Query:  KAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ
          + D GF+   V+ L  K S E++  A   L  +     KNRK F +
Subjt:  KAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ

Q2U5T5 Vacuolar protein 83.9e-0924.32Show/hide
Query:  DLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTEN
        DL+R A +        D + V       + +  ++  L S + E+Q AA   L  ++     K ++V  G +APLIR M   +   +  A  C+     +
Subjt:  DLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTEN

Query:  SENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGG-VR
         +N   ++  G +  L+++  S D + +    A G L N+   ++ ++ ++  GAI   +++  S D  VQ      L NIA    +   L   E   V+
Subjt:  SENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGG-VR

Query:  ALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEV
        +LV ++D   SS+ K    A  A+ NL       + I+   G +  LL  L++  + L   A+   +R        +  + D GF+   V  LG+   E 
Subjt:  ALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEV

Query:  REMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQ
         E+   A+S +      R      DRN  ++LQ
Subjt:  REMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQ

Q6CX49 Vacuolar protein 83.6e-1023.56Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI
        KD   FY    +R + T +     +L+R A    LA     EKYV  +    +++  ++  L +P+ +++ A+   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI

Query:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  SS+ + +    A G L N+    E ++ +++ GA+   + +  S D  VQ     
Subjt:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSIV

Query:  FLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAK
         L NIA  DES N   + +   + + +++   +S+S +    A  A+ NL  S  +Y   ++  G +  L+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAK

Query:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFVQ
          + D GF+P  VK L   +S E++  A   L  +     KNR  F Q
Subjt:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFVQ

Q6FJV1 Vacuolar protein 81.0e-1225.79Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    +++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI

Query:  -RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSI
         ++M    EV  N A  C+       +N   ++  G +  L K+  S   + +    A G L N+   EE +R ++  GA+   + +  S D  VQ    
Subjt:  -RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRVARSKDEAVQINSI

Query:  VFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEA
          L NIA  + +   L   E   R + +++    S SS+    A  A+ NL  S  SY   ++  G + HL+  +++  V L  +A    +R        
Subjt:  VFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEA

Query:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ
        +  + D GF+P  VK L  + S E++  A   L  +     KNRK F +
Subjt:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ

Arabidopsis top hitse value%identityAlignment
AT1G61350.1 ARM repeat superfamily protein2.0e-18159.4Show/hide
Query:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFD
        K ++ + I+ ISSLISLSHS+K F  KW+LIR KL+EL SGL +  N +S  +P++S+LI  ++ +  + +DLA RCV++SFSGKLLMQSDLDV+  KFD
Subjt:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFD

Query:  RHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAA
         H + LS IY+AGILS GFAIVV +P   ACKDDMRFY+RD++TRMKIG  ++K+QALV L  A+ ED++YVK++IE+ ++VN+LV FL S E  +QE +
Subjt:  RHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF
         K +  ISGF SY+ VL+ +G+I PL+RV+E G+ VG+  +ARCL+K TENSENAWSVSAHGGV+ALLKICS SD   ELIG +CGVL NLVGVEEIKRF
Subjt:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEG-AISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVL-DPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLL
        MIEE   ++TFI++  SK+E VQ+NSI  L ++   DE   ++LV+EGG++ LV VL DP S SSSK+ E+ALRAI+NLCF S   +N LM   F+DHLL
Subjt:  MIEEG-AISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVL-DPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLL

Query:  FFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEG-----NSG
          LRNGE+S+QE ALKV  RLC   EE K+ MG+ GFMPE VKFL AKS +VREMA+ AL  ++ +P+NRK+F QDD N+  +LQ+LD E+G     +SG
Subjt:  FFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEG-----NSG

Query:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        N +FL SIL SLT  +S RRKI +SGY+K+IEKLAE E  DAKKLV+KLS N+FRS+LSGIWHS
Subjt:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

AT2G05810.1 ARM repeat superfamily protein1.4e-6230.18Show/hide
Query:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK
        +P +  +   +S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP +  L+P ++        L+ +C   SFS GKLLMQSDLD+  + 
Subjt:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK

Query:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE
           H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G +  L+          ++E
Subjt:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE

Query:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE
         AL  + ++  S  DS K V    G + PL+R++E GS   K  AA  +   T +   AW++SA+GGVT L++ C S   + +      G +SN+  VEE
Subjt:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE

Query:  IKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM
        I+  + EEGAI   I++  S   +VQ  +  F+  I+   E   +L+V+E GG++ L+ ++  + SS+  T+E  L A+  +    ++S V +  +  F+
Subjt:  IKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG
          L   +++G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK  ++D+++V  L+QMLD       
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG

Query:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G05810.2 ARM repeat superfamily protein1.4e-6230.18Show/hide
Query:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK
        +P +  +   +S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP +  L+P ++        L+ +C   SFS GKLLMQSDLD+  + 
Subjt:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK

Query:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE
           H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G +  L+          ++E
Subjt:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE

Query:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE
         AL  + ++  S  DS K V    G + PL+R++E GS   K  AA  +   T +   AW++SA+GGVT L++ C S   + +      G +SN+  VEE
Subjt:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE

Query:  IKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM
        I+  + EEGAI   I++  S   +VQ  +  F+  I+   E   +L+V+E GG++ L+ ++  + SS+  T+E  L A+  +    ++S V +  +  F+
Subjt:  IKRFMIEEGAISTFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG
          L   +++G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK  ++D+++V  L+QMLD       
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG

Query:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G45720.1 ARM repeat superfamily protein2.8e-5829.57Show/hide
Query:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR
        L Q  + +   +S + +VK F+S+W++I  +LE++ + L  +++  C S ++      +  V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K  A   L + + +SE + S+  HGGV  L++IC + DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIRVAR------SKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM
        + EEG +   I +        SK+ A +      LQN+   +E++   ++ E G++ L+  LD      S      + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIRVAR------SKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN
          L+  L++G +  Q+ A     R+  TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D+++V  L+ +L+   GNS  
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN

Query:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS
        K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  S
Subjt:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS

AT2G45720.2 ARM repeat superfamily protein2.8e-5829.57Show/hide
Query:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR
        L Q  + +   +S + +VK F+S+W++I  +LE++ + L  +++  C S ++      +  V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K  A   L + + +SE + S+  HGGV  L++IC + DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIRVAR------SKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM
        + EEG +   I +        SK+ A +      LQN+   +E++   ++ E G++ L+  LD      S      + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIRVAR------SKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN
          L+  L++G +  Q+ A     R+  TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D+++V  L+ +L+   GNS  
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN

Query:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS
        K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  S
Subjt:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGAGAAGAGCGGGGCCCGAGACCTGCAGAAACAGACCCGACGAACTCGCCGGATTTCTCAGTCGAAAAGCCAACTCTCCGGCAAGTTATTCAATTCATTTCTTCCTT
GATATCTCTTTCTCATTCCGTTAAAGTTTTTGCCTCAAAATGGAAGTTAATCAGGGACAAGCTCGAGGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCTGCAATCTCAGCCCTAATTCCGAAAGTAATAGAGACTGCTACTGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTAATCTGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGATATATATACAGCCGGCATTTTGTCCCAAGGGTTTGCCATCGTCGTTTC
TAGGCCCGGCCTCGGTGCTTGTAAAGACGACATGAGGTTTTATGTGAGGGACATAGTAACGAGAATGAAGATCGGTTGTTCAGATCTGAAGAGGCAAGCTCTGGTTAATC
TGCTTGCTGCCGTAATTGAAGACGAGAAGTATGTGAAAGTGATAATAGAAGTTGGGGAGATAGTGAATCTCCTGGTTAATTTTCTTGGTTCTCCGGAGACGGAACTCCAA
GAAGCGGCTCTGAAAGTGCTTCATATTATTTCTGGGTTTGATTCCTACAAAGCAGTTCTAGTTGGGAATGGGATCATCGCGCCATTGATTCGGGTTATGGAATGTGGGAG
TGAGGTGGGAAAGAACATTGCCGCCAGGTGTTTGTTAAAATTCACGGAGAATTCAGAAAACGCTTGGTCTGTATCTGCCCATGGCGGAGTAACAGCTCTATTAAAAATAT
GTTCGAGTAGTGATTCTAAAACAGAATTGATCGGCCCGGCTTGTGGGGTGCTTAGTAATCTCGTTGGTGTTGAAGAAATTAAGAGATTCATGATTGAAGAAGGTGCAATT
TCAACGTTTATTAGGGTCGCTCGATCCAAAGATGAAGCTGTGCAAATAAATTCCATCGTCTTTCTCCAAAACATAGCCTATGGGGATGAATCAGTAAACAATTTGCTGGT
CAAAGAAGGTGGAGTTCGCGCTTTAGTTCGTGTTTTGGATCCGAAATCTTCGTCCTCATCCAAAACCCTGGAGGTAGCGCTGCGAGCAATTGAAAACCTGTGTTTCTCAT
CAATCAGTTATGTAAATATTTTGATGAACTACGGGTTCATGGATCATCTTCTTTTCTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTT
AGGCTCTGCGGGACATCAGAGGAGGCCAAGAAAGCCATGGGGGATGGAGGGTTCATGCCAGAATTTGTGAAGTTTCTTGGTGCAAAGTCCTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGCATGGTCATGATCCCTAAAAACAGAAAGAGATTTGTGCAGGACGATCGAAACGTAGGGATGCTTTTGCAAATGCTCGACACAGAGGAGGGAA
ATTCAGGTAACAAAAGGTTCCTCTTTTCGATATTAAACTCATTAACTGGAAGCAGTAGTGGAAGAAGAAAGATTGTGAATTCTGGGTATATGAAAAACATTGAGAAACTT
GCAGAAGCTGAAGTTTACGATGCCAAGAAGCTGGTCAGGAAATTGTCCACAAACAAATTCCGTAGTCTGTTGAGTGGAATCTGGCATTCT
mRNA sequenceShow/hide mRNA sequence
ATGAGAGAAGAGCGGGGCCCGAGACCTGCAGAAACAGACCCGACGAACTCGCCGGATTTCTCAGTCGAAAAGCCAACTCTCCGGCAAGTTATTCAATTCATTTCTTCCTT
GATATCTCTTTCTCATTCCGTTAAAGTTTTTGCCTCAAAATGGAAGTTAATCAGGGACAAGCTCGAGGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCTGCAATCTCAGCCCTAATTCCGAAAGTAATAGAGACTGCTACTGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTAATCTGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGATATATATACAGCCGGCATTTTGTCCCAAGGGTTTGCCATCGTCGTTTC
TAGGCCCGGCCTCGGTGCTTGTAAAGACGACATGAGGTTTTATGTGAGGGACATAGTAACGAGAATGAAGATCGGTTGTTCAGATCTGAAGAGGCAAGCTCTGGTTAATC
TGCTTGCTGCCGTAATTGAAGACGAGAAGTATGTGAAAGTGATAATAGAAGTTGGGGAGATAGTGAATCTCCTGGTTAATTTTCTTGGTTCTCCGGAGACGGAACTCCAA
GAAGCGGCTCTGAAAGTGCTTCATATTATTTCTGGGTTTGATTCCTACAAAGCAGTTCTAGTTGGGAATGGGATCATCGCGCCATTGATTCGGGTTATGGAATGTGGGAG
TGAGGTGGGAAAGAACATTGCCGCCAGGTGTTTGTTAAAATTCACGGAGAATTCAGAAAACGCTTGGTCTGTATCTGCCCATGGCGGAGTAACAGCTCTATTAAAAATAT
GTTCGAGTAGTGATTCTAAAACAGAATTGATCGGCCCGGCTTGTGGGGTGCTTAGTAATCTCGTTGGTGTTGAAGAAATTAAGAGATTCATGATTGAAGAAGGTGCAATT
TCAACGTTTATTAGGGTCGCTCGATCCAAAGATGAAGCTGTGCAAATAAATTCCATCGTCTTTCTCCAAAACATAGCCTATGGGGATGAATCAGTAAACAATTTGCTGGT
CAAAGAAGGTGGAGTTCGCGCTTTAGTTCGTGTTTTGGATCCGAAATCTTCGTCCTCATCCAAAACCCTGGAGGTAGCGCTGCGAGCAATTGAAAACCTGTGTTTCTCAT
CAATCAGTTATGTAAATATTTTGATGAACTACGGGTTCATGGATCATCTTCTTTTCTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTT
AGGCTCTGCGGGACATCAGAGGAGGCCAAGAAAGCCATGGGGGATGGAGGGTTCATGCCAGAATTTGTGAAGTTTCTTGGTGCAAAGTCCTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGCATGGTCATGATCCCTAAAAACAGAAAGAGATTTGTGCAGGACGATCGAAACGTAGGGATGCTTTTGCAAATGCTCGACACAGAGGAGGGAA
ATTCAGGTAACAAAAGGTTCCTCTTTTCGATATTAAACTCATTAACTGGAAGCAGTAGTGGAAGAAGAAAGATTGTGAATTCTGGGTATATGAAAAACATTGAGAAACTT
GCAGAAGCTGAAGTTTACGATGCCAAGAAGCTGGTCAGGAAATTGTCCACAAACAAATTCCGTAGTCTGTTGAGTGGAATCTGGCATTCT
Protein sequenceShow/hide protein sequence
MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLL
MQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQ
EAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAI
STFIRVARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAV
RLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKL
AEAEVYDAKKLVRKLSTNKFRSLLSGIWHS