; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Spg036845 (gene) of Sponge gourd (cylindrica) v1 genome

Gene IDSpg036845
OrganismLuffa cylindrica (Sponge gourd (cylindrica) v1)
DescriptionARM repeat superfamily protein
Genome locationscaffold5:42222726..42224468
RNA-Seq ExpressionSpg036845
SyntenySpg036845
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR000225 - Armadillo
IPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004153509.2 uncharacterized protein LOC101214844 [Cucumis sativus]1.3e-29692.59Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQ+ILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRK+I TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+GVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFI L++SRDEAVQI+SIVFLQNIAYGDESVN+LLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS++ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKK MGDGGFMPEF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_008441952.1 PREDICTED: uncharacterized protein LOC103485949 [Cucumis melo]7.0e-29893.62Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI LA+SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLD EE NSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_022140205.1 uncharacterized protein LOC111010930 [Momordica charantia]8.0e-30293.62Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PRPA+TDPTNSPDFS++KPTLRQVI  ISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+S LI KVIETA ECHDLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV+EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARS+DEAVQINSIVFLQNIAYGDESVN LLVKEGG+RALVRVLDPKSS SSKTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVNIL+NYGFMD+LL+FLRNGEVSLQEVALKVAVRL GTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        V  LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_023519872.1 uncharacterized protein LOC111783203 [Cucurbita pepo subsp. pepo]1.6e-29792.93Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PRP +T PT SPDFSLDKPTLRQVILLIS+LISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVIETA EC DLA RC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYK VLVGNGVIAPLIRV+E GSE GK+IA RCL+KFTENS NAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIRLARS+DEAVQINSIVFLQNIAYGDESVNK LVK+GGIRALVRVLDPKSS S+KTLEVAMRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVNIL+NYGFMDNLLYFLRNGEVSLQEVALKVA RL GTSEE KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF+QDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VE LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_038895092.1 uncharacterized protein LOC120083411 [Benincasa hispida]1.4e-30194.66Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREEQ PR A+TDPT SPDF L+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLI KVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELIGPACGVLSNLV VEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESV KLLVK+GGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL G SEEAKKAMGDGGFMPEFV+FLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VE LLQMLDTEE NSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

TrEMBL top hitse value%identityAlignment
A0A0A0LRT3 Uncharacterized protein6.4e-29792.59Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQ+ILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRK+I TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+GVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFI L++SRDEAVQI+SIVFLQNIAYGDESVN+LLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS++ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKK MGDGGFMPEF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A1S3B433 uncharacterized protein LOC1034859493.4e-29893.62Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI LA+SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLD EE NSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A5A7UPA9 Vacuolar protein 83.4e-29893.62Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI LA+SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLD EE NSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1CEG2 uncharacterized protein LOC1110109303.9e-30293.62Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PRPA+TDPTNSPDFS++KPTLRQVI  ISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+S LI KVIETA ECHDLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV+EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIR+ARS+DEAVQINSIVFLQNIAYGDESVN LLVKEGG+RALVRVLDPKSS SSKTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVNIL+NYGFMD+LL+FLRNGEVSLQEVALKVAVRL GTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        V  LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1GST6 uncharacterized protein LOC111457208 isoform X18.4e-29791.38Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MR+E+ PRPA+TDPTNSPD +LDKP+LRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDE PA+SDLIRK+I T  EC DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLS+IYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMK+GCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAAL+VLHIISGFDSYKAVLVGNGVIAPLIRVMECGS VGK IA RCL+KFTENSENAWSVSAHGGVTALLKICSN+DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        TELI PACGVL+NLVGVEEIKRFMIEEGAISTFIRL+RSR+++VQINSIVFLQNIAYGDESVNKLLVKEGGIR LVRVLDPKS  SSKTLE AM+AIEN+
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS+NYVNILINYGFM+NLL+FLRNG+VSLQ +ALKVAV+LS TSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS MVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VETLLQMLDTEEVNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAE+EVYDAKKL+RKLSTNKFRSLLNGIWH+
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

SwissProt top hitse value%identityAlignment
O22193 U-box domain-containing protein 46.5e-1227.65Show/hide
Query:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG
        +VS P     +D  ++   V+ +V  +K    D +RQA   L      +     VI   G IV LLV  L S ++  QE A+  L  +S  D+ K  +  
Subjt:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG

Query:  NGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDE
         G I PLI V+E GS   K  +A  L   +   EN   +   G +  L+ +  N   + +    A   L NL   +E K  +++ GA+   I L      
Subjt:  NGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDE

Query:  AVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVA
         V   ++  L N+A   E  N  + +EGGI  LV V++     S++  E A  A+  L  +S  + N+++  G +  L+   ++G    +E A
Subjt:  AVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVA

P39968 Vacuolar protein 82.9e-1224.57Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  +   + +    A G L N+   EE ++ ++  GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK
         L NIA  + +  KL   E   R + +++    SPSS+    A  A+ NL  S  +Y   ++  G + +L+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK

Query:  KAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF
          + D GF+   V+ L  K S E++  A   L  +     KNRK F
Subjt:  KAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF

Q4WVW4 Vacuolar protein 81.1e-0822.28Show/hide
Query:  SDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTE
        +D +R+A+ +LL  +   E   +     GE +  L   + S   +LQ +A      I+  D  +   V    + P++ +++      +  A+  L     
Subjt:  SDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTE

Query:  NSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIR
        N+EN   + A GG+T L++         E+   A G ++NL   E+ K  +   GA+   IRLA+S+D  VQ N+   L N+ + D++  + LV  G I 
Subjt:  NSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIR

Query:  ALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEV
         LV++L   SSP          A+ N+   + N   +      +   L  L +      +    +A+R   + E+ +  +     +P  ++ L +    +
Subjt:  ALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEV

Query:  REMAAEALSGMVMIPKNRKRFAQDN--RNVETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIV
           A   +  + + P N          + +  LL   D EE+        +S L +L  SS   +++V
Subjt:  REMAAEALSGMVMIPKNRKRFAQDN--RNVETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIV

Q6CX49 Vacuolar protein 82.5e-1123.85Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD   FY    +R + T +     +L+R A    LA     EKYV  +    +++  ++  L +P+ +++ A+   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  +++ + +    A G L N+    E ++ +++ GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK
         L NIA  DES  + L K    + + +++   +S S +    A  A+ NL  S  NY   ++  G + +L+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK

Query:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFAQ
          + D GF+P  VK L   +S E++  A   L  +     KNR  F Q
Subjt:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFAQ

Q6FJV1 Vacuolar protein 83.4e-1325.14Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    +++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  +   + +    A G L N+   EE +R ++  GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK
         L NIA  + +  KL   E   R + +++    SPSS+    A  A+ NL  S  +Y   ++  G + +L+  +++  V L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK

Query:  KAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF
          + D GF+P  VK L  + S E++  A   L  +     KNRK F
Subjt:  KAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF

Arabidopsis top hitse value%identityAlignment
AT1G61350.1 ARM repeat superfamily protein1.9e-17658.69Show/hide
Query:  KPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFD
        K ++ + I  ISSLISLSHS+K F+ KW+LIR KL+EL SGL +  N +S  +P+LS LI  ++ +  + +DLA RCV++SFSGKLLMQSDLDV+  KFD
Subjt:  KPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFD

Query:  HHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAA
         H + LS IY+AGILS GFAIVV +P   ACKDDMRFY+RD++TRMKIG  ++K+QALV L  A+ ED++YVK++IEI ++VN+LV FL S E  +QE +
Subjt:  HHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF
         K +  ISGF SY+ VL+ +GVI PL+RV+E G+ VG+  +ARCL+K TENSENAWSVSAHGGV+ALLKICS +D   ELIG +CGVL NLVGVEEIKRF
Subjt:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEG-AISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVL-DPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLL
        MIEE   ++TFI+L  S++E VQ+NSI  L ++   DE    +LV+EGGI+ LV VL DP S  SSK+ E+A+RAI+NLCF S   +N L+   F+D+LL
Subjt:  MIEEG-AISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVL-DPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLL

Query:  YFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEE-----VNSG
          LRNGE+S+QE ALKV  RL    EE K+ MG+ GFMPE VKFL AKS +VREMA+ AL  ++ +P+NRK+FAQD+ N+  +LQ+LD E+      +SG
Subjt:  YFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEE-----VNSG

Query:  NKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        N +FL+SIL SLT  +S RRKI +SGY+K+IEKLAE E  DAKKLV+KLS N+FRS+L+GIWHS
Subjt:  NKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

AT2G05810.1 ARM repeat superfamily protein4.6e-6129.53Show/hide
Query:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS
        P   A +     P  +  +P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP L  L+  ++        L+ +C   S
Subjt:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS

Query:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE
        FS GKLLMQSDLD+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G 
Subjt:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE

Query:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT
        +  L+          ++E AL  + ++  S  DS K V    G + PL+R++E GS   K+ AA  +   T +   AW++SA+GGVT L++ C +   + 
Subjt:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT

Query:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        +      G +SN+  VEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V+E GG++ L+ ++   S+P   T+E  + A+  +
Subjt:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD
          S++  V+ +++    F+  L   +++G V LQ+++  +   L+  S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK   +D
Subjt:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD

Query:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
         ++V  L+QMLD       NK   + ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G05810.2 ARM repeat superfamily protein4.6e-6129.53Show/hide
Query:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS
        P   A +     P  +  +P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP L  L+  ++        L+ +C   S
Subjt:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS

Query:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE
        FS GKLLMQSDLD+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G 
Subjt:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE

Query:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT
        +  L+          ++E AL  + ++  S  DS K V    G + PL+R++E GS   K+ AA  +   T +   AW++SA+GGVT L++ C +   + 
Subjt:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT

Query:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        +      G +SN+  VEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V+E GG++ L+ ++   S+P   T+E  + A+  +
Subjt:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD
          S++  V+ +++    F+  L   +++G V LQ+++  +   L+  S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK   +D
Subjt:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD

Query:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
         ++V  L+QMLD       NK   + ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G45720.1 ARM repeat superfamily protein1.6e-5829.75Show/hide
Query:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH
        L Q   L+   +S + +VK FSS+W++I  +LE++ + L  +++  C S ++    + ++ V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K  A   L + + +SE + S+  HGGV  L++IC   DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM
        + EEG +   I       L  S++ A +      LQN+   +E++ + ++ E GI+ L+  LD          E  + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM

Query:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN
         +L++ L++G +  Q+ A     R++ TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D ++V +L+ +L+    NS  
Subjt:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN

Query:  KRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN
        K++ +S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  KRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN

AT2G45720.2 ARM repeat superfamily protein1.6e-5829.75Show/hide
Query:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH
        L Q   L+   +S + +VK FSS+W++I  +LE++ + L  +++  C S ++    + ++ V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K  A   L + + +SE + S+  HGGV  L++IC   DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM
        + EEG +   I       L  S++ A +      LQN+   +E++ + ++ E GI+ L+  LD          E  + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIR------LARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM

Query:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN
         +L++ L++G +  Q+ A     R++ TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D ++V +L+ +L+    NS  
Subjt:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN

Query:  KRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN
        K++ +S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  KRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGAGAAGAACAGCCTCCGAGACCTGCACAAACGGACCCTACCAACTCGCCGGATTTCTCGCTCGACAAGCCCACTCTCCGGCAAGTTATTCTACTCATTTCTTCCCT
GATTTCTCTTTCTCATTCCGTTAAAGTATTTTCCTCCAAATGGAAATTAATTCGCGACAAGCTTGAAGAGTTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCCGCACTTTCCGACCTAATTCGGAAGGTAATCGAGACGGCAAATGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTGATCTGTGCGAAATTTGACCACCATGCGAAGAAGCTTTCGGACATTTATACAGCCGGCATTTTGTCGCAAGGGTTCGCCATCGTCGTTTC
TAGGCCTGGCCTCGGAGCTTGCAAGGATGATATGAGGTTTTATGTGAGGGATATTGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGGCAAGCTCTCGTTAATC
TGCTCGCTGCTGTACTTGAAGACGAAAAGTATGTGAAAGTGATAATAGAAATCGGCGAGATAGTAAATCTTCTGGTTAATTTTCTTGGTTCTCCGGAGACGGAACTCCAA
GAAGCGGCGCTGAAAGTGCTTCATATAATTTCTGGGTTCGATTCTTATAAAGCAGTTCTAGTTGGGAATGGGGTAATTGCGCCATTGATTCGGGTTATGGAATGTGGGAG
TGAGGTGGGGAAGAGTATAGCCGCTAGGTGTTTGTTGAAATTCACGGAGAATTCTGAAAACGCTTGGTCTGTATCTGCTCATGGCGGAGTAACAGCTTTGTTAAAAATCT
GTTCCAATGCTGATTCTAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGCAATCTCGTTGGTGTTGAAGAAATCAAGAGATTTATGATCGAAGAAGGTGCAATT
TCAACTTTTATTAGGCTCGCTCGATCTAGAGATGAAGCTGTGCAGATAAACTCCATTGTCTTTCTCCAAAACATAGCTTATGGGGATGAATCAGTGAACAAACTGCTGGT
TAAAGAAGGTGGAATTCGGGCTTTAGTTCGAGTTTTGGATCCAAAATCTTCGCCCTCATCTAAAACCCTAGAGGTAGCAATGCGAGCAATTGAAAACCTCTGTTTCTCAT
CGATTAATTATGTAAATATTTTGATAAACTACGGGTTCATGGATAATCTTCTTTATTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTC
AGGCTAAGTGGGACATCAGAGGAAGCCAAGAAAGCAATGGGGGATGGAGGTTTCATGCCAGAATTCGTCAAGTTTCTTGGTGCAAAGTCCTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGGATGGTCATGATCCCTAAAAACAGAAAGAGATTTGCTCAGGACAATCGAAATGTAGAGACGCTTCTGCAAATGCTCGACACAGAGGAGGTAA
ATTCAGGTAACAAAAGGTTCCTCTTGTCAATATTAAACTCATTAACAGGAAGCAGTAGTGGAAGAAGGAAGATTGTGAATTCTGGGTACATGAAAAACATCGAAAAACTT
GCAGAAGCTGAAGTTTATGATGCCAAGAAGCTCGTAAGGAAATTGTCCACAAACAAATTTCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
mRNA sequenceShow/hide mRNA sequence
ATGAGAGAAGAACAGCCTCCGAGACCTGCACAAACGGACCCTACCAACTCGCCGGATTTCTCGCTCGACAAGCCCACTCTCCGGCAAGTTATTCTACTCATTTCTTCCCT
GATTTCTCTTTCTCATTCCGTTAAAGTATTTTCCTCCAAATGGAAATTAATTCGCGACAAGCTTGAAGAGTTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCCGCACTTTCCGACCTAATTCGGAAGGTAATCGAGACGGCAAATGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTGATCTGTGCGAAATTTGACCACCATGCGAAGAAGCTTTCGGACATTTATACAGCCGGCATTTTGTCGCAAGGGTTCGCCATCGTCGTTTC
TAGGCCTGGCCTCGGAGCTTGCAAGGATGATATGAGGTTTTATGTGAGGGATATTGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGGCAAGCTCTCGTTAATC
TGCTCGCTGCTGTACTTGAAGACGAAAAGTATGTGAAAGTGATAATAGAAATCGGCGAGATAGTAAATCTTCTGGTTAATTTTCTTGGTTCTCCGGAGACGGAACTCCAA
GAAGCGGCGCTGAAAGTGCTTCATATAATTTCTGGGTTCGATTCTTATAAAGCAGTTCTAGTTGGGAATGGGGTAATTGCGCCATTGATTCGGGTTATGGAATGTGGGAG
TGAGGTGGGGAAGAGTATAGCCGCTAGGTGTTTGTTGAAATTCACGGAGAATTCTGAAAACGCTTGGTCTGTATCTGCTCATGGCGGAGTAACAGCTTTGTTAAAAATCT
GTTCCAATGCTGATTCTAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGCAATCTCGTTGGTGTTGAAGAAATCAAGAGATTTATGATCGAAGAAGGTGCAATT
TCAACTTTTATTAGGCTCGCTCGATCTAGAGATGAAGCTGTGCAGATAAACTCCATTGTCTTTCTCCAAAACATAGCTTATGGGGATGAATCAGTGAACAAACTGCTGGT
TAAAGAAGGTGGAATTCGGGCTTTAGTTCGAGTTTTGGATCCAAAATCTTCGCCCTCATCTAAAACCCTAGAGGTAGCAATGCGAGCAATTGAAAACCTCTGTTTCTCAT
CGATTAATTATGTAAATATTTTGATAAACTACGGGTTCATGGATAATCTTCTTTATTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTC
AGGCTAAGTGGGACATCAGAGGAAGCCAAGAAAGCAATGGGGGATGGAGGTTTCATGCCAGAATTCGTCAAGTTTCTTGGTGCAAAGTCCTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGGATGGTCATGATCCCTAAAAACAGAAAGAGATTTGCTCAGGACAATCGAAATGTAGAGACGCTTCTGCAAATGCTCGACACAGAGGAGGTAA
ATTCAGGTAACAAAAGGTTCCTCTTGTCAATATTAAACTCATTAACAGGAAGCAGTAGTGGAAGAAGGAAGATTGTGAATTCTGGGTACATGAAAAACATCGAAAAACTT
GCAGAAGCTGAAGTTTATGATGCCAAGAAGCTCGTAAGGAAATTGTCCACAAACAAATTTCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
Protein sequenceShow/hide protein sequence
MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLL
MQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQ
EAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAI
STFIRLARSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAV
RLSGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKL
AEAEVYDAKKLVRKLSTNKFRSLLNGIWHS