; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS006124 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS006124
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
DescriptionARM repeat superfamily protein
Genome locationscaffold96:219372..221111
RNA-Seq ExpressionMS006124
SyntenyMS006124
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR000225 - Armadillo
IPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7019647.1 U-box domain-containing protein 4, partial [Cucurbita argyrosperma subsp. argyrosperma]3.9e-29691.9Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETA EC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLH ISGFDSYK VLVGNG+IAPLIRV+E G+E GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_022140205.1 uncharacterized protein LOC111010930 [Momordica charantia]0.0e+0099.66Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECG+EVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_022927631.1 uncharacterized protein LOC111434400 [Cucurbita moschata]1.0e-29692.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLH ISGFDSYK VLVGNG+IAPLIRV+E G+E GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_023519872.1 uncharacterized protein LOC111783203 [Cucurbita pepo subsp. pepo]3.5e-29792.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  IS+LISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYK VLVGNG+IAPLIRV+E G+E GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTSEE KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

XP_038895092.1 uncharacterized protein LOC120083411 [Benincasa hispida]9.8e-30092.93Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREE+GPR AETDPT SPDF +  PTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LIPKVI TATEC+DLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECG+EVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELIGPACGVLSNLV VEEIKRFMIEEGAISTFIRLARS+DEAVQINSIVFLQNIAYGDESV  LLVK+GG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCG SEEAKKAMGDGGFMPEFV+FLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V  LLQMLDTEEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

TrEMBL top hitse value%identityAlignment
A0A0A0LRT3 Uncharacterized protein2.4e-29691.55Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPR AETDP  SPDFS+  PTLRQ+I  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI K+I TATEC+DLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+G+IAPLIRVMECG+EVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFI L++S+DEAVQI+SIVFLQNIAYGDESVN LLVKEGG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSS+S VN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEEAKK MGDGGFMPEF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        + MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIW+S
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A5A7UPA9 Vacuolar protein 84.2e-29692.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPR AETDP  SPDFS+  PTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC+DLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECG+EVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI LA+S+DEAVQINSIVFLQNIAYGDESVN LLVKEGG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSIS VN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        + MLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIW+S
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A6J1CEG2 uncharacterized protein LOC1110109300.0e+0099.66Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECG+EVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A6J1EI74 uncharacterized protein LOC1114344004.9e-29792.07Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREERGPRP ET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLH ISGFDSYK VLVGNG+IAPLIRV+E G+E GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS++DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

A0A6J1KJB3 uncharacterized protein LOC1114951322.4e-29691.9Show/hide
Query:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC
        MREE+GPRPAET PT SPDFS++KPTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVI TATEC DLA RC
Subjt:  MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIE

Query:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRV+E G+E GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICS +DSK
Subjt:  VGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQ+NSIVFLQNIAYGDESVN  LVK+GG+RALVRVLDPKSSSS+KTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENL

Query:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN
        CFSSISYVNILMNYGFMD+LL+FLRNGEVSLQEVALKVA RLCGTSE+ KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF QD+RN
Subjt:  CFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRN

Query:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        V MLLQML TEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+L+GIWHS
Subjt:  VGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

SwissProt top hitse value%identityAlignment
O22193 U-box domain-containing protein 47.2e-1126.62Show/hide
Query:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG
        +VS P     +D  ++   V+ +V  +K    D +RQA   L      +     VI   G IV LLV  L S ++  QE A+  L  +S  D+ K  +  
Subjt:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG

Query:  NGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDE
         G I PLI V+E G+   K  +A  L   +   EN   +   G +  L+ +  +   + +    A   L NL   +E K  +++ GA+   I L      
Subjt:  NGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDE

Query:  AVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVA
         V   ++  L N+A   E   N + +EGG+  LV V++     S++  E A  A+  L  +S  + N+++  G +  L+   ++G    +E A
Subjt:  AVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVA

P39968 Vacuolar protein 83.8e-1225.5Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI

Query:  -RVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSI
         ++M    EV  N A  C+       +N   ++  G +  L K+  S   + +    A G L N+   EE ++ ++  GA+   + L  S D  VQ    
Subjt:  -RVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSI

Query:  VFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEA
          L NIA  + +   L   E   R + +++    S SS+    A  A+ NL  S  SY   ++  G + HL+  +++  + L  +A    +R        
Subjt:  VFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEA

Query:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ
        +  + D GF+   V+ L  K S E++  A   L  +     KNRK F +
Subjt:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ

Q2U5T5 Vacuolar protein 88.0e-1025.45Show/hide
Query:  DLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIR-VMECGTEVGKNIAARCLLKFTE
        DL+R A +        D + V       + +  ++  L S + E+Q AA   L  ++     K ++V  G +APLIR +M    EV  N A  C+     
Subjt:  DLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLIR-VMECGTEVGKNIAARCLLKFTE

Query:  NSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGG-V
        + +N   ++  G +  L+++  S D + +    A G L N+   ++ ++ ++  GAI   ++L  S D  VQ      L NIA    +   L   E   V
Subjt:  NSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGG-V

Query:  RALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFE
        ++LV ++D   SS+ K    A  A+ NL       + I+   G +  LL  L++  + L   A+   +R        +  + D GF+   V  LG+   E
Subjt:  RALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFE

Query:  VREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQ
          E+   A+S +      R      DRN  ++LQ
Subjt:  VREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQ

Q6CX49 Vacuolar protein 81.6e-1023.85Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI
        KD   FY    +R + T +     +L+R A    LA     EKYV  +    +++  ++  L +P+ +++ A+   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI

Query:  RVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIV
          M+      +  A  C+       +N   ++  G +  L K+  SS+ + +    A G L N+    E ++ +++ GA+   + L  S D  VQ     
Subjt:  RVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSIV

Query:  FLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAK
         L NIA  DES N   + +   + + +++   +S+S +    A  A+ NL  S  +Y   ++  G +  L+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAK

Query:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFVQ
          + D GF+P  VK L   +S E++  A   L  +     KNR  F Q
Subjt:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFVQ

Q6FJV1 Vacuolar protein 82.0e-1326.07Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    +++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGIIAPLI

Query:  -RVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSI
         ++M    EV  N A  C+       +N   ++  G +  L K+  S   + +    A G L N+   EE +R ++  GA+   + L  S D  VQ    
Subjt:  -RVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSKDEAVQINSI

Query:  VFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEA
          L NIA  + +   L   E   R + +++    S SS+    A  A+ NL  S  SY   ++  G + HL+  +++  V L  +A    +R        
Subjt:  VFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAVRLCGTSEEA

Query:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ
        +  + D GF+P  VK L  + S E++  A   L  +     KNRK F +
Subjt:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRFVQ

Arabidopsis top hitse value%identityAlignment
AT1G61350.1 ARM repeat superfamily protein8.9e-18259.57Show/hide
Query:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFD
        K ++ + I+ ISSLISLSHS+K F  KW+LIR KL+EL SGL +  N +S  +P++S+LI  ++ +  + +DLA RCV++SFSGKLLMQSDLDV+  KFD
Subjt:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFD

Query:  RHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAA
         H + LS IY+AGILS GFAIVV +P   ACKDDMRFY+RD++TRMKIG  ++K+QALV L  A+ ED++YVK++IE+ ++VN+LV FL S E  +QE +
Subjt:  RHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF
         K +  ISGF SY+ VL+ +G+I PL+RV+E G  VG+  +ARCL+K TENSENAWSVSAHGGV+ALLKICS SD   ELIG +CGVL NLVGVEEIKRF
Subjt:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEG-AISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVL-DPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLL
        MIEE   ++TFI+L  SK+E VQ+NSI  L ++   DE   ++LV+EGG++ LV VL DP S SSSK+ E+ALRAI+NLCF S   +N LM   F+DHLL
Subjt:  MIEEG-AISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVL-DPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLL

Query:  FFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEG-----NSG
          LRNGE+S+QE ALKV  RLC   EE K+ MG+ GFMPE VKFL AKS +VREMA+ AL  ++ +P+NRK+F QDD N+  +LQ+LD E+G     +SG
Subjt:  FFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEG-----NSG

Query:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS
        N +FL SIL SLT  +S RRKI +SGY+K+IEKLAE E  DAKKLV+KLS N+FRS+LSGIWHS
Subjt:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLSGIWHS

AT2G05810.1 ARM repeat superfamily protein1.1e-6230.18Show/hide
Query:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK
        +P +  +   +S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP +  L+P ++        L+ +C   SFS GKLLMQSDLD+  + 
Subjt:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK

Query:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE
           H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G +  L+          ++E
Subjt:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE

Query:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE
         AL  + ++  S  DS K V    G + PL+R++E G+   K  AA  +   T +   AW++SA+GGVT L++ C S   + +      G +SN+  VEE
Subjt:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE

Query:  IKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM
        I+  + EEGAI   I+L  S   +VQ  +  F+  I+   E   +L+V+E GG++ L+ ++  + SS+  T+E  L A+  +    ++S V +  +  F+
Subjt:  IKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG
          L   +++G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK  ++D+++V  L+QMLD       
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG

Query:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G05810.2 ARM repeat superfamily protein1.1e-6230.18Show/hide
Query:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK
        +P +  +   +S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP +  L+P ++        L+ +C   SFS GKLLMQSDLD+  + 
Subjt:  KPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFS-GKLLMQSDLDVICAK

Query:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE
           H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G +  L+          ++E
Subjt:  FDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQE

Query:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE
         AL  + ++  S  DS K V    G + PL+R++E G+   K  AA  +   T +   AW++SA+GGVT L++ C S   + +      G +SN+  VEE
Subjt:  AALKVLHII--SGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEE

Query:  IKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM
        I+  + EEGAI   I+L  S   +VQ  +  F+  I+   E   +L+V+E GG++ L+ ++  + SS+  T+E  L A+  +    ++S V +  +  F+
Subjt:  IKRFMIEEGAISTFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKE-GGVRALVRVLDPKSSSSSKTLEVALRAIENL-CFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG
          L   +++G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK  ++D+++V  L+QMLD       
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSG

Query:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G45720.1 ARM repeat superfamily protein6.2e-5829.57Show/hide
Query:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR
        L Q  + +   +S + +VK F+S+W++I  +LE++ + L  +++  C S ++      +  V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E G+ V K  A   L + + +SE + S+  HGGV  L++IC + DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIR------LARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM
        + EEG +   I       L  SK+ A +      LQN+   +E++   ++ E G++ L+  LD      S      + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIR------LARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN
          L+  L++G +  Q+ A     R+  TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D+++V  L+ +L+   GNS  
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN

Query:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS
        K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  S
Subjt:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS

AT2G45720.2 ARM repeat superfamily protein6.2e-5829.57Show/hide
Query:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR
        L Q  + +   +S + +VK F+S+W++I  +LE++ + L  +++  C S ++      +  V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLLMQSDLDVICAKFDR

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E G+ V K  A   L + + +SE + S+  HGGV  L++IC + DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIR------LARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM
        + EEG +   I       L  SK+ A +      LQN+   +E++   ++ E G++ L+  LD      S      + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIR------LARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFM

Query:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN
          L+  L++G +  Q+ A     R+  TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D+++V  L+ +L+   GNS  
Subjt:  DHLLFFLRNGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGN

Query:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS
        K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  S
Subjt:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGAGAAGAGCGGGGCCCGAGACCTGCAGAAACAGACCCGACGAACTCGCCGGATTTCTCAGTCGAAAAGCCAACTCTCCGGCAAGTTATTCAATTCATTTCTTCCTT
GATATCTCTTTCTCATTCCGTTAAAGTTTTTGCCTCAAAATGGAAGTTAATCAGGGACAAGCTCGAGGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCAGCAATCTCAGCCCTAATTCCGAAAGTAATAGAGACTGCTACTGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTAATCTGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGATATATATACAGCCGGCATTTTATCCCAAGGGTTTGCCATCGTCGTTTC
TAGGCCCGGCCTCGGTGCTTGTAAAGACGACATGAGGTTTTATGTGAGGGACATAGTAACGAGAATGAAGATCGGTTGTTCAGATCTGAAGAGGCAAGCTCTGGTTAATC
TGCTTGCTGCCGTAATTGAAGACGAGAAGTATGTGAAAGTGATAATAGAAGTTGGGGAGATAGTGAATCTCCTGGTTAATTTTCTTGGTTCTCCGGAGACGGAACTCCAA
GAAGCGGCTCTGAAAGTGCTTCATATTATTTCTGGGTTTGATTCCTACAAAGCAGTTCTAGTTGGGAATGGGATCATCGCGCCATTGATTCGGGTTATGGAATGTGGGAC
TGAGGTGGGAAAGAACATTGCCGCCAGGTGTTTGTTAAAATTCACGGAGAATTCAGAAAACGCTTGGTCTGTATCTGCCCATGGCGGGGTAACAGCTCTATTAAAAATAT
GTTCGAGTAGTGATTCTAAAACAGAATTGATCGGCCCGGCTTGTGGGGTGCTTAGTAATCTCGTTGGTGTTGAAGAAATTAAGAGATTCATGATTGAAGAAGGTGCAATT
TCAACGTTTATTAGGCTCGCTCGATCCAAAGATGAAGCTGTGCAAATAAATTCCATCGTCTTTCTCCAAAACATAGCCTATGGGGATGAATCAGTAAACAATTTGCTGGT
CAAAGAAGGTGGAGTTCGCGCTTTAGTTCGTGTTTTGGATCCGAAATCTTCGTCCTCATCCAAAACCCTGGAGGTAGCGCTGCGAGCAATTGAAAACCTGTGTTTCTCAT
CAATCAGTTATGTAAATATTTTGATGAACTACGGGTTCATGGATCATCTTCTTTTCTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTT
AGGCTCTGCGGGACATCAGAGGAGGCCAAGAAAGCCATGGGGGATGGAGGGTTCATGCCAGAATTTGTGAAGTTTCTTGGTGCAAAGTCCTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGCATGGTCATGATCCCTAAAAACAGAAAGAGATTTGTGCAGGACGATCGAAACGTAGGGATGCTTCTGCAAATGCTCGACACAGAGGAGGGAA
ATTCAGGTAACAAAAGGTTCCTCTTTTCGATATTAAACTCATTAACTGGAAGCAGTAGTGGAAGAAGAAAGATTGTGAATTCTGGGTATATGAAAAACATTGAGAAACTT
GCAGAAGCTGAAGTTTACGATGCCAAGAAGCTGGTCAGGAAATTGTCCACAAACAAATTCCGTAGTCTGTTGAGTGGAATCTGGCATTCT
mRNA sequenceShow/hide mRNA sequence
ATGAGAGAAGAGCGGGGCCCGAGACCTGCAGAAACAGACCCGACGAACTCGCCGGATTTCTCAGTCGAAAAGCCAACTCTCCGGCAAGTTATTCAATTCATTTCTTCCTT
GATATCTCTTTCTCATTCCGTTAAAGTTTTTGCCTCAAAATGGAAGTTAATCAGGGACAAGCTCGAGGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCAGCAATCTCAGCCCTAATTCCGAAAGTAATAGAGACTGCTACTGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTAATCTGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGATATATATACAGCCGGCATTTTATCCCAAGGGTTTGCCATCGTCGTTTC
TAGGCCCGGCCTCGGTGCTTGTAAAGACGACATGAGGTTTTATGTGAGGGACATAGTAACGAGAATGAAGATCGGTTGTTCAGATCTGAAGAGGCAAGCTCTGGTTAATC
TGCTTGCTGCCGTAATTGAAGACGAGAAGTATGTGAAAGTGATAATAGAAGTTGGGGAGATAGTGAATCTCCTGGTTAATTTTCTTGGTTCTCCGGAGACGGAACTCCAA
GAAGCGGCTCTGAAAGTGCTTCATATTATTTCTGGGTTTGATTCCTACAAAGCAGTTCTAGTTGGGAATGGGATCATCGCGCCATTGATTCGGGTTATGGAATGTGGGAC
TGAGGTGGGAAAGAACATTGCCGCCAGGTGTTTGTTAAAATTCACGGAGAATTCAGAAAACGCTTGGTCTGTATCTGCCCATGGCGGGGTAACAGCTCTATTAAAAATAT
GTTCGAGTAGTGATTCTAAAACAGAATTGATCGGCCCGGCTTGTGGGGTGCTTAGTAATCTCGTTGGTGTTGAAGAAATTAAGAGATTCATGATTGAAGAAGGTGCAATT
TCAACGTTTATTAGGCTCGCTCGATCCAAAGATGAAGCTGTGCAAATAAATTCCATCGTCTTTCTCCAAAACATAGCCTATGGGGATGAATCAGTAAACAATTTGCTGGT
CAAAGAAGGTGGAGTTCGCGCTTTAGTTCGTGTTTTGGATCCGAAATCTTCGTCCTCATCCAAAACCCTGGAGGTAGCGCTGCGAGCAATTGAAAACCTGTGTTTCTCAT
CAATCAGTTATGTAAATATTTTGATGAACTACGGGTTCATGGATCATCTTCTTTTCTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTT
AGGCTCTGCGGGACATCAGAGGAGGCCAAGAAAGCCATGGGGGATGGAGGGTTCATGCCAGAATTTGTGAAGTTTCTTGGTGCAAAGTCCTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGCATGGTCATGATCCCTAAAAACAGAAAGAGATTTGTGCAGGACGATCGAAACGTAGGGATGCTTCTGCAAATGCTCGACACAGAGGAGGGAA
ATTCAGGTAACAAAAGGTTCCTCTTTTCGATATTAAACTCATTAACTGGAAGCAGTAGTGGAAGAAGAAAGATTGTGAATTCTGGGTATATGAAAAACATTGAGAAACTT
GCAGAAGCTGAAGTTTACGATGCCAAGAAGCTGGTCAGGAAATTGTCCACAAACAAATTCCGTAGTCTGTTGAGTGGAATCTGGCATTCT
Protein sequenceShow/hide protein sequence
MREERGPRPAETDPTNSPDFSVEKPTLRQVIQFISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISALIPKVIETATECHDLARRCVDLSFSGKLL
MQSDLDVICAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVIEDEKYVKVIIEVGEIVNLLVNFLGSPETELQ
EAALKVLHIISGFDSYKAVLVGNGIIAPLIRVMECGTEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSSSDSKTELIGPACGVLSNLVGVEEIKRFMIEEGAI
STFIRLARSKDEAVQINSIVFLQNIAYGDESVNNLLVKEGGVRALVRVLDPKSSSSSKTLEVALRAIENLCFSSISYVNILMNYGFMDHLLFFLRNGEVSLQEVALKVAV
RLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFVQDDRNVGMLLQMLDTEEGNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKL
AEAEVYDAKKLVRKLSTNKFRSLLSGIWHS