; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lag0024849 (gene) of Sponge gourd (AG-4) v1 genome

Gene IDLag0024849
OrganismLuffa acutangula AG-4 (Sponge gourd (AG-4) v1)
DescriptionARM repeat superfamily protein
Genome locationchr10:6370159..6371901
RNA-Seq ExpressionLag0024849
SyntenyLag0024849
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR000225 - Armadillo
IPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004153509.2 uncharacterized protein LOC101214844 [Cucumis sativus]4.3e-29592.24Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQ+ILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRK+I TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+GVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFI L +SRDEAVQI+SIVFLQNIAYGDESVN+LLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS++ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKK MGDGGFM EF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_008441952.1 PREDICTED: uncharacterized protein LOC103485949 [Cucumis melo]5.0e-29693.1Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI L +SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKKAMGDGGFM EF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLD EE NSGNKRFLLSILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_022140205.1 uncharacterized protein LOC111010930 [Momordica charantia]5.8e-30093.1Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PRPA+TDPTNSPDFS++KPTLRQVI  ISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+S LI KVIETA ECHDLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV+EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIR+ RS+DEAVQINSIVFLQNIAYGDESVN LLVKEGG+RALVRVLDPKSS SSKTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVNIL+NYGFMD+LL+FLRNGEVSLQEVALKVAVRL GTSEEAKKAMGDGGFM EFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        V  LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_023519872.1 uncharacterized protein LOC111783203 [Cucurbita pepo subsp. pepo]1.1e-29592.41Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PRP +T PT SPDFSLDKPTLRQVILLIS+LISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVIETA EC DLA RC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYK VLVGNGVIAPLIRV+E GSE GK+IA RCL+KFTENS NAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFIRL RS+DEAVQINSIVFLQNIAYGDESVNK LVK+GGIRALVRVLDPKSS S+KTLEVAMRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVNIL+NYGFMDNLLYFLRNGEVSLQEVALKVA RL GTSEE KKAMGDGGFM EFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF+QDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VE LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_038895092.1 uncharacterized protein LOC120083411 [Benincasa hispida]9.8e-30094.14Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREEQ PR A+TDPT SPDF L+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLI KVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELIGPACGVLSNLV VEEIKRFMIEEGAISTFIRL RSRDEAVQINSIVFLQNIAYGDESV KLLVK+GGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL G SEEAKKAMGDGGFM EFV+FLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VE LLQMLDTEE NSGNKRFLLSILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

TrEMBL top hitse value%identityAlignment
A0A0A0LRT3 Uncharacterized protein2.1e-29592.24Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQ+ILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRK+I TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+GVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVLSNLVGVEEIKRFMIEEGAISTFI L +SRDEAVQI+SIVFLQNIAYGDESVN+LLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS++ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKK MGDGGFM EF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A1S3B433 uncharacterized protein LOC1034859492.4e-29693.1Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI L +SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKKAMGDGGFM EF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLD EE NSGNKRFLLSILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A5A7UPA9 Vacuolar protein 82.4e-29693.1Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PR A+TDP  SPDFSL+ PTLRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+SDLIRKVI TA EC+DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
         ELI PACGVL NLVGVEEIKRFMIEE AISTFI L +SRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRV+DPKSS SSKTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+ VN LINYGFMDNLLYFLR+GEVSLQEVALKVAVRL GTSEEAKKAMGDGGFM EF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +E LLQMLD EE NSGNKRFLLSILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1CEG2 uncharacterized protein LOC1110109302.8e-30093.1Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MREE+ PRPA+TDPTNSPDFS++KPTLRQVI  ISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPA+S LI KVIETA ECHDLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV+EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGK+IAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIR+ RS+DEAVQINSIVFLQNIAYGDESVN LLVKEGG+RALVRVLDPKSS SSKTLEVA+RAIENL
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSI+YVNIL+NYGFMD+LL+FLRNGEVSLQEVALKVAVRL GTSEEAKKAMGDGGFM EFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        V  LLQMLDTEE NSGNKRFL SILNSLTGSSSGRRKI+NSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1GST6 uncharacterized protein LOC111457208 isoform X12.7e-29591.03Show/hide
Query:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC
        MR+E+ PRPA+TDPTNSPD +LDKP+LRQVILLISSLISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDE PA+SDLIRK+I T  EC DLARRC
Subjt:  MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFD HAKKLS+IYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMK+GCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAAL+VLHIISGFDSYKAVLVGNGVIAPLIRVMECGS VGK IA RCL+KFTENSENAWSVSAHGGVTALLKICSN+DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        TELI PACGVL+NLVGVEEIKRFMIEEGAISTFIRL RSR+++VQINSIVFLQNIAYGDESVNKLLVKEGGIR LVRVLDPKS  SSKTLE AM+AIEN+
Subjt:  TELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS+NYVNILINYGFM+NLL+FLRNG+VSLQ +ALKVAV+LS TSEEAKKAMGDGGFM EFVKFLGAKSFEVREMAAEALS MVMIPKNRKRFAQDNRN
Subjt:  CFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VETLLQMLDTEEVNSGNKRFL SILNSLTGSSSGRRKI+NSGYMKNIEKLAE+EVYDAKKL+RKLSTNKFRSLLNGIWH+
Subjt:  VETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

SwissProt top hitse value%identityAlignment
O22193 U-box domain-containing protein 46.5e-1227.65Show/hide
Query:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG
        +VS P     +D  ++   V+ +V  +K    D +RQA   L      +     VI   G IV LLV  L S ++  QE A+  L  +S  D+ K  +  
Subjt:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG

Query:  NGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDE
         G I PLI V+E GS   K  +A  L   +   EN   +   G +  L+ +  N   + +    A   L NL   +E K  +++ GA+   I L      
Subjt:  NGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDE

Query:  AVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVA
         V   ++  L N+A   E  N  + +EGGI  LV V++     S++  E A  A+  L  +S  + N+++  G +  L+   ++G    +E A
Subjt:  AVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVA

P39968 Vacuolar protein 86.5e-1224.57Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  +   + +    A G L N+   EE ++ ++  GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK
         L NIA  + +  KL   E   R + +++    SPSS+    A  A+ NL  S  +Y   ++  G + +L+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK

Query:  KAMGDGGFMAEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF
          + D GF+   V+ L  K S E++  A   L  +     KNRK F
Subjt:  KAMGDGGFMAEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF

Q6CX49 Vacuolar protein 86.1e-1023.56Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD   FY    +R + T +     +L+R A    LA     EKYV  +    +++  ++  L +P+ +++ A+   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  +++ + +    A G L N+    E ++ +++ GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK
         L NIA  DES  + L K    + + +++   +S S +    A  A+ NL  S  NY   ++  G + +L+  +++  + L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK

Query:  KAMGDGGFMAEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFAQ
          + D GF+   VK L   +S E++  A   L  +     KNR  F Q
Subjt:  KAMGDGGFMAEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFAQ

Q6FJV1 Vacuolar protein 86.5e-1224.86Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    +++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  +   + +    A G L N+   EE +R ++  GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK
         L NIA  + +  KL   E   R + +++    SPSS+    A  A+ NL  S  +Y   ++  G + +L+  +++  V L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK

Query:  KAMGDGGFMAEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF
          + D GF+   VK L  + S E++  A   L  +     KNRK F
Subjt:  KAMGDGGFMAEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF

Q757R0 Vacuolar protein 82.3e-0923.85Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD+  FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  + + + +    A G L N+    E ++ +++ GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK
         L NIA  + +  KL   E  + + + VL    SPS++    A  A+ NL  S   Y   ++  G + +L+  ++   + L  +A    +R        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAK

Query:  KAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGM----VMIPKNRKRF
          + D GF+   VK L     E  E+   A+S +        KNR+ F
Subjt:  KAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGM----VMIPKNRKRF

Arabidopsis top hitse value%identityAlignment
AT1G61350.1 ARM repeat superfamily protein4.7e-17558.51Show/hide
Query:  KPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFD
        K ++ + I  ISSLISLSHS+K F+ KW+LIR KL+EL SGL +  N +S  +P+LS LI  ++ +  + +DLA RCV++SFSGKLLMQSDLDV+  KFD
Subjt:  KPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFD

Query:  HHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAA
         H + LS IY+AGILS GFAIVV +P   ACKDDMRFY+RD++TRMKIG  ++K+QALV L  A+ ED++YVK++IEI ++VN+LV FL S E  +QE +
Subjt:  HHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF
         K +  ISGF SY+ VL+ +GVI PL+RV+E G+ VG+  +ARCL+K TENSENAWSVSAHGGV+ALLKICS +D   ELIG +CGVL NLVGVEEIKRF
Subjt:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEG-AISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVL-DPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLL
        MIEE   ++TFI+L  S++E VQ+NSI  L ++   DE    +LV+EGGI+ LV VL DP S  SSK+ E+A+RAI+NLCF S   +N L+   F+D+LL
Subjt:  MIEEG-AISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVL-DPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLL

Query:  YFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEE-----VNSG
          LRNGE+S+QE ALKV  RL    EE K+ MG+ GFM E VKFL AKS +VREMA+ AL  ++ +P+NRK+FAQD+ N+  +LQ+LD E+      +SG
Subjt:  YFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEE-----VNSG

Query:  NKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        N +FL+SIL SLT  +S RRKI +SGY+K+IEKLAE E  DAKKLV+KLS N+FRS+L+GIWHS
Subjt:  NKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

AT2G05810.1 ARM repeat superfamily protein1.0e-6029.53Show/hide
Query:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS
        P   A +     P  +  +P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP L  L+  ++        L+ +C   S
Subjt:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS

Query:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE
        FS GKLLMQSDLD+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G 
Subjt:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE

Query:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT
        +  L+          ++E AL  + ++  S  DS K V    G + PL+R++E GS   K+ AA  +   T +   AW++SA+GGVT L++ C +   + 
Subjt:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT

Query:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        +      G +SN+  VEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V+E GG++ L+ ++   S+P   T+E  + A+  +
Subjt:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD
          S++  V+ +++    F+  L   +++G V LQ+++  +   L+  S+  K+A+ D   ++  ++ +   K   ++E A EA   ++ +  NRK   +D
Subjt:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD

Query:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
         ++V  L+QMLD       NK   + ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G05810.2 ARM repeat superfamily protein1.0e-6029.53Show/hide
Query:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS
        P   A +     P  +  +P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP L  L+  ++        L+ +C   S
Subjt:  PPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIA-ADNCDSDENPALSDLIRKVIETANECHDLARRCVDLS

Query:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE
        FS GKLLMQSDLD+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  + ++EK  ++I + G 
Subjt:  FS-GKLLMQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGE

Query:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT
        +  L+          ++E AL  + ++  S  DS K V    G + PL+R++E GS   K+ AA  +   T +   AW++SA+GGVT L++ C +   + 
Subjt:  IVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKT

Query:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL
        +      G +SN+  VEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V+E GG++ L+ ++   S+P   T+E  + A+  +
Subjt:  ELIGPACGVLSNLVGVEEIKRFMIEEGAISTFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKE-GGIRALVRVLDPKSSPSSKTLEVAMRAIENL

Query:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD
          S++  V+ +++    F+  L   +++G V LQ+++  +   L+  S+  K+A+ D   ++  ++ +   K   ++E A EA   ++ +  NRK   +D
Subjt:  CFSSINYVNILINYG--FMDNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFAQD

Query:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
         ++V  L+QMLD       NK   + ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  NRNVETLLQMLDTEEVNSGNKRFLLSILNSLT--GSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G45720.1 ARM repeat superfamily protein8.9e-5729.39Show/hide
Query:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH
        L Q   L+   +S + +VK FSS+W++I  +LE++ + L  +++  C S ++    + ++ V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K  A   L + + +SE + S+  HGGV  L++IC   DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIR------LGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM
        + EEG +   I       L  S++ A +      LQN+   +E++ + ++ E GI+ L+  LD          E  + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIR------LGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM

Query:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN
         +L++ L++G +  Q+ A     R++ TS E K+ +G+ G +   ++ L AK+   RE+AA+A++ +V +P+N +   +D ++V +L+ +L+    NS  
Subjt:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN

Query:  KRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN
        K++ +S L +L  S   ++ +++ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  KRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN

AT2G45720.2 ARM repeat superfamily protein8.9e-5729.39Show/hide
Query:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH
        L Q   L+   +S + +VK FSS+W++I  +LE++ + L  +++  C S ++    + ++ V+ET  E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGL--IAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLLMQSDLDVICAKFDH

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA

Query:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K  A   L + + +SE + S+  HGGV  L++IC   DS ++    AC  L N+  V E+++ 
Subjt:  LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRF

Query:  MIEEGAISTFIR------LGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM
        + EEG +   I       L  S++ A +      LQN+   +E++ + ++ E GI+ L+  LD          E  + AI NL    +  V++   +  +
Subjt:  MIEEGAISTFIR------LGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFM

Query:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN
         +L++ L++G +  Q+ A     R++ TS E K+ +G+ G +   ++ L AK+   RE+AA+A++ +V +P+N +   +D ++V +L+ +L+    NS  
Subjt:  DNLLYFLRNGEVSLQEVALKVAVRLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN

Query:  KRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN
        K++ +S L +L  S   ++ +++ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  KRFLLSILNSLTGSSSGRRKILNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGAGAAGAACAGCCTCCGAGACCTGCACAAACGGACCCTACCAACTCGCCGGATTTCTCCCTCGACAAGCCCACTCTCCGGCAAGTTATTCTACTCATTTCTTCCCT
GATTTCTCTTTCTCATTCCGTTAAAGTATTTTCCTCCAAATGGAAATTAATTCGCGACAAGCTTGAAGAGTTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCCGCACTTTCAGACCTAATTCGAAAGGTAATCGAGACGGCAAATGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTAATCTGTGCGAAATTTGACCACCATGCGAAGAAGCTTTCGGACATTTATACAGCCGGCATTTTGTCGCAAGGGTTCGCCATCGTCGTTTC
TAGGCCTGGCCTCGGAGCTTGCAAGGATGATATGAGGTTTTATGTGAGGGATATTGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGGCAAGCTCTCGTTAATC
TGCTCGCTGCTGTACTTGAAGACGAAAAGTATGTGAAAGTGATAATAGAAATCGGCGAGATAGTGAATCTTCTGGTTAATTTTCTTGGTTCGCCGGAGACGGAACTCCAA
GAAGCGGCGCTGAAAGTGCTTCATATAATTTCTGGGTTTGATTCTTATAAAGCAGTTCTAGTTGGAAATGGGGTAATTGCGCCATTGATTCGGGTTATGGAATGTGGGAG
TGAGGTGGGGAAGAGTATAGCCGCTAGGTGTTTGTTGAAATTCACGGAGAATTCTGAAAACGCTTGGTCTGTATCTGCTCATGGCGGAGTAACAGCTTTGTTAAAAATCT
GTTCCAATGCTGATTCTAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGCAATCTCGTTGGTGTTGAAGAAATCAAGAGATTTATGATCGAAGAAGGTGCAATT
TCAACTTTTATTAGGCTCGGTCGATCTAGAGATGAAGCTGTGCAGATAAACTCCATTGTCTTTCTCCAAAACATAGCTTATGGGGATGAATCAGTGAACAAACTGCTGGT
TAAAGAAGGTGGAATTCGGGCTTTAGTTCGAGTTTTGGATCCAAAATCTTCGCCCTCATCCAAAACCCTAGAGGTAGCAATGCGAGCAATTGAAAATCTCTGTTTCTCAT
CGATTAATTATGTAAATATTTTGATAAACTACGGGTTCATGGATAATCTTCTTTATTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTA
AGGCTAAGTGGGACATCAGAGGAAGCCAAGAAAGCAATGGGGGATGGAGGTTTCATGGCAGAATTCGTCAAGTTTCTTGGTGCAAAGTCGTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGGATGGTCATGATCCCTAAAAACAGAAAGAGATTTGCTCAGGACAATCGAAATGTAGAGACGCTTCTGCAAATGCTGGACACAGAGGAGGTAA
ATTCAGGTAACAAAAGGTTCCTCTTGTCAATATTAAACTCATTAACAGGAAGCAGTAGTGGAAGAAGGAAGATTTTGAATTCTGGGTACATGAAAAACATCGAAAAACTT
GCAGAAGCTGAAGTTTATGATGCCAAGAAGCTCGTAAGGAAATTGTCCACAAACAAATTTCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
mRNA sequenceShow/hide mRNA sequence
ATGAGAGAAGAACAGCCTCCGAGACCTGCACAAACGGACCCTACCAACTCGCCGGATTTCTCCCTCGACAAGCCCACTCTCCGGCAAGTTATTCTACTCATTTCTTCCCT
GATTTCTCTTTCTCATTCCGTTAAAGTATTTTCCTCCAAATGGAAATTAATTCGCGACAAGCTTGAAGAGTTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAAATCCCGCACTTTCAGACCTAATTCGAAAGGTAATCGAGACGGCAAATGAATGCCACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTG
ATGCAGAGTGATTTGGATGTAATCTGTGCGAAATTTGACCACCATGCGAAGAAGCTTTCGGACATTTATACAGCCGGCATTTTGTCGCAAGGGTTCGCCATCGTCGTTTC
TAGGCCTGGCCTCGGAGCTTGCAAGGATGATATGAGGTTTTATGTGAGGGATATTGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGGCAAGCTCTCGTTAATC
TGCTCGCTGCTGTACTTGAAGACGAAAAGTATGTGAAAGTGATAATAGAAATCGGCGAGATAGTGAATCTTCTGGTTAATTTTCTTGGTTCGCCGGAGACGGAACTCCAA
GAAGCGGCGCTGAAAGTGCTTCATATAATTTCTGGGTTTGATTCTTATAAAGCAGTTCTAGTTGGAAATGGGGTAATTGCGCCATTGATTCGGGTTATGGAATGTGGGAG
TGAGGTGGGGAAGAGTATAGCCGCTAGGTGTTTGTTGAAATTCACGGAGAATTCTGAAAACGCTTGGTCTGTATCTGCTCATGGCGGAGTAACAGCTTTGTTAAAAATCT
GTTCCAATGCTGATTCTAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGCAATCTCGTTGGTGTTGAAGAAATCAAGAGATTTATGATCGAAGAAGGTGCAATT
TCAACTTTTATTAGGCTCGGTCGATCTAGAGATGAAGCTGTGCAGATAAACTCCATTGTCTTTCTCCAAAACATAGCTTATGGGGATGAATCAGTGAACAAACTGCTGGT
TAAAGAAGGTGGAATTCGGGCTTTAGTTCGAGTTTTGGATCCAAAATCTTCGCCCTCATCCAAAACCCTAGAGGTAGCAATGCGAGCAATTGAAAATCTCTGTTTCTCAT
CGATTAATTATGTAAATATTTTGATAAACTACGGGTTCATGGATAATCTTCTTTATTTCTTACGAAATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTA
AGGCTAAGTGGGACATCAGAGGAAGCCAAGAAAGCAATGGGGGATGGAGGTTTCATGGCAGAATTCGTCAAGTTTCTTGGTGCAAAGTCGTTCGAAGTTCGAGAAATGGC
AGCCGAGGCACTCTCAGGGATGGTCATGATCCCTAAAAACAGAAAGAGATTTGCTCAGGACAATCGAAATGTAGAGACGCTTCTGCAAATGCTGGACACAGAGGAGGTAA
ATTCAGGTAACAAAAGGTTCCTCTTGTCAATATTAAACTCATTAACAGGAAGCAGTAGTGGAAGAAGGAAGATTTTGAATTCTGGGTACATGAAAAACATCGAAAAACTT
GCAGAAGCTGAAGTTTATGATGCCAAGAAGCTCGTAAGGAAATTGTCCACAAACAAATTTCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
Protein sequenceShow/hide protein sequence
MREEQPPRPAQTDPTNSPDFSLDKPTLRQVILLISSLISLSHSVKVFSSKWKLIRDKLEELNSGLIAADNCDSDENPALSDLIRKVIETANECHDLARRCVDLSFSGKLL
MQSDLDVICAKFDHHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVLEDEKYVKVIIEIGEIVNLLVNFLGSPETELQ
EAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKSIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVGVEEIKRFMIEEGAI
STFIRLGRSRDEAVQINSIVFLQNIAYGDESVNKLLVKEGGIRALVRVLDPKSSPSSKTLEVAMRAIENLCFSSINYVNILINYGFMDNLLYFLRNGEVSLQEVALKVAV
RLSGTSEEAKKAMGDGGFMAEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGNKRFLLSILNSLTGSSSGRRKILNSGYMKNIEKL
AEAEVYDAKKLVRKLSTNKFRSLLNGIWHS