; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lsi02G007020 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome

Gene IDLsi02G007020
OrganismLagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
DescriptionARM repeat superfamily protein
Genome locationchr02:6277097..6278830
RNA-Seq ExpressionLsi02G007020
SyntenyLsi02G007020
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR000225 - Armadillo
IPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004153509.2 uncharacterized protein LOC101214844 [Cucumis sativus]1.8e-30194.66Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  RSAETD   +PDFSLN+PTLRQ+ILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRK+I TATECNDLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+GVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELI PACGVLSNLV VEEIKRFMIEEGAISTFI L++SRDEAVQI+SIVFLQNIAYGDESV +LLVK+GGIRALVRVMDPKSSSSSKTLEVTMRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS+S VNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKK MGDGGFMPEF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +EMLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_008441952.1 PREDICTED: uncharacterized protein LOC103485949 [Cucumis melo]2.5e-30395.86Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  RSAETD   +PDFSLN+PTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVI TATECNDLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELI PACGVL NLV VEEIKRFMIEE AISTFI LA+SRDEAVQINSIVFLQNIAYGDESV KLLVK+GGIRALVRVMDPKSSSSSKTLEVTMRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSIS VNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +EMLLQMLD EEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_022140205.1 uncharacterized protein LOC111010930 [Momordica charantia]1.5e-29592.76Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  R AETD   +PDFS+  PTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC+DLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
        TELIGPACGVLSNLV VEEIKRFMIEEGAISTFIR+ARS+DEAVQINSIVFLQNIAYGDESV  LLVK+GG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSISYVN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        V MLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_023519872.1 uncharacterized protein LOC111783203 [Cucurbita pepo subsp. pepo]1.4e-29392.41Show/hide
Query:  MREERSSRSAE---TDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  R  E   T +PDFSL+ PTLRQVILLIS+LISLSHSVKVF+SKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATEC DLA RC
Subjt:  MREERSSRSAE---TDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYK VLVGNGVIAPLIRV+E GSE GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELI PACGVLSNLV VEEIKRFMIEEGAISTFIRLARS+DEAVQINSIVFLQNIAYGDESV K LVKDGGIRALVRV+DPKSSSS+KTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSISYVN L+NYGFMDNLLYFLR+GEVSLQEVALKVA RLCGTSEE KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF+QDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VEMLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

XP_038895092.1 uncharacterized protein LOC120083411 [Benincasa hispida]4.4e-30897.24Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREE+  RSAETD   +PDF LNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLI KVI TATECNDLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCG SEEAKKAMGDGGFMPEFV+FLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VE LLQMLD EEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

TrEMBL top hitse value%identityAlignment
A0A0A0LRT3 Uncharacterized protein8.6e-30294.66Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  RSAETD   +PDFSLN+PTLRQ+ILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRK+I TATECNDLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG+GVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELI PACGVLSNLV VEEIKRFMIEEGAISTFI L++SRDEAVQI+SIVFLQNIAYGDESV +LLVK+GGIRALVRVMDPKSSSSSKTLEVTMRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSS+S VNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKK MGDGGFMPEF+KFLGAKS+EVREMAAEALSGMVMIPKNRKRFAQDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +EMLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A1S3B433 uncharacterized protein LOC1034859491.2e-30395.86Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  RSAETD   +PDFSLN+PTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVI TATECNDLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELI PACGVL NLV VEEIKRFMIEE AISTFI LA+SRDEAVQINSIVFLQNIAYGDESV KLLVK+GGIRALVRVMDPKSSSSSKTLEVTMRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSIS VNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +EMLLQMLD EEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A5A7UPA9 Vacuolar protein 81.2e-30395.86Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  RSAETD   +PDFSLN+PTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVI TATECNDLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELI PACGVL NLV VEEIKRFMIEE AISTFI LA+SRDEAVQINSIVFLQNIAYGDESV KLLVK+GGIRALVRVMDPKSSSSSKTLEVTMRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSIS VNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEF+KFLGAKSFEVREMAAEALSGMV IPKNRKRFAQDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +EMLLQMLD EEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIW+S
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1CEG2 uncharacterized protein LOC1110109307.1e-29692.76Show/hide
Query:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  R AETD   +PDFS+  PTLRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAIS LI KVIETATEC+DLARRC
Subjt:  MREERSSRSAETD---TPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        +GEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNG+IAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICS++DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
        TELIGPACGVLSNLV VEEIKRFMIEEGAISTFIR+ARS+DEAVQINSIVFLQNIAYGDESV  LLVK+GG+RALVRV+DPKSSSSSKTLEV +RAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSISYVN L+NYGFMD+LL+FLR+GEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRF QD+RN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        V MLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLL+GIWHS
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

A0A6J1EI74 uncharacterized protein LOC1114344001.9e-29392.41Show/hide
Query:  MREERSSRSAE---TDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC
        MREER  R  E   T +PDFSL+ PTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATEC DLA RC
Subjt:  MREERSSRSAE---TDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRC

Query:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVI AKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK
        IGEIVNLLVNFLGSPETELQEAALKVLH ISGFDSYK VLVGNGVIAPLIRV+E GSE GKNIA RCL+KFTENS NAWSVSAHGGVTALLKICSNADSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSK

Query:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
         ELI PACGVLSNLV VEEIKRFMIEEGAISTFIRLARS+DEAVQINSIVFLQNIAYGDESV K LVKDGGIRALVRV+DPKSSSS+KTLEV MRAIENL
Subjt:  TELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
        CFSSISYVN L+NYGFMDNLLYFLR+GEVSLQEVALKVA RLCGTS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF+QDNRN
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        VEMLLQMLD EEGNSGNKRFL SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRS+LNGIWHS
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

SwissProt top hitse value%identityAlignment
O22193 U-box domain-containing protein 49.3e-1126.62Show/hide
Query:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG
        +VS P     +D  ++   V+ +V  +K    D +RQA   L      +     VI   G IV LLV  L S ++  QE A+  L  +S  D+ K  +  
Subjt:  VVSRPGLGACKD--DMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVG

Query:  NGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDE
         G I PLI V+E GS   K  +A  L   +   EN   +   G +  L+ +  N   + +    A   L NL   +E K  +++ GA+   I L      
Subjt:  NGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDE

Query:  AVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVA
         V   ++  L N+A   E     + ++GGI  LV V++     S++  E    A+  L  +S  + N ++  G +  L+   + G    +E A
Subjt:  AVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVA

P39968 Vacuolar protein 82.5e-1125.07Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    E++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  +   + +    A G L N+   EE ++ ++  GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVIKLLVKDGG-IRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEA
         L NIA  + +  KL   +   +  LV +MD  S SS    + T+ A+ NL  S  SY   ++  G + +L+  ++   + L  +A    +R        
Subjt:  FLQNIAYGDESVIKLLVKDGG-IRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEA

Query:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF
        +  + D GF+   V+ L  K S E++  A   L  +     KNRK F
Subjt:  KKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF

Q4WVW4 Vacuolar protein 86.7e-0923.96Show/hide
Query:  DLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTEN
        DL+R A +        D + V       + +  ++  L S + E+Q AA   L  ++     K ++V  G + PLIR M   +   +  A  C+     +
Subjt:  DLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTEN

Query:  SENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGG--I
         +N   ++  G +  L+++  + D + +    A G L N+   ++ ++ ++  GAI   ++L  S D  VQ      L NIA  D S  K L +     +
Subjt:  SENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGG--I

Query:  RALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFE
        ++LV +MD   SS+ K       A+ NL  S   Y   ++    +  LL  L+   + L   A+   +R        +  + D GF+   V  LG+   E
Subjt:  RALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFE

Query:  VREMAAEALSGMVMIPKNRKRFAQDNRNVEMLLQMLDAEEGNSGNKRFLLSILNSLTGS
          E+   A+S +      R   A  +RN E++LQ    ++      R  LS+ + +T +
Subjt:  VREMAAEALSGMVMIPKNRKRFAQDNRNVEMLLQMLDAEEGNSGNKRFLLSILNSLTGS

Q6CX49 Vacuolar protein 82.1e-1023.28Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD   FY    +R + T +     +L+R A    LA     EKYV  +    +++  ++  L +P+ +++ A+   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  +++ + +    A G L N+    E ++ +++ GA+   + L  S D  VQ     
Subjt:  RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIV

Query:  FLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAK
         L NIA  DES  + L K    + + +++   +S+S +       A+ NL  S  +Y   ++  G + +L+  ++   + L  +A    +R        +
Subjt:  FLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAK

Query:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFAQ
          + D GF+P  VK L   +S E++  A   L  +     KNR  F Q
Subjt:  KAMGDGGFMPEFVKFLG-AKSFEVREMAAEALSGM-VMIPKNRKRFAQ

Q6FJV1 Vacuolar protein 81.3e-1226.44Show/hide
Query:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    +++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLI

Query:  -RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSI
         ++M    EV  N A  C+       +N   ++  G +  L K+  +   + +    A G L N+   EE +R ++  GA+   + L  S D  VQ    
Subjt:  -RVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSI

Query:  VFLQNIAYGDESVIKLLVKDGG-IRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEE
          L NIA  + +  KL   +   +  LV +MD  S SS    + T+ A+ NL  S  SY   ++  G + +L+  ++   V L  +A    +R       
Subjt:  VFLQNIAYGDESVIKLLVKDGG-IRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEE

Query:  AKKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF
         +  + D GF+P  VK L  + S E++  A   L  +     KNRK F
Subjt:  AKKAMGDGGFMPEFVKFLGAK-SFEVREMAAEALSGM-VMIPKNRKRF

Arabidopsis top hitse value%identityAlignment
AT1G61350.1 ARM repeat superfamily protein2.7e-17558.19Show/hide
Query:  TLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRCVDLSFSGKLLMQSDLDVISAKFDRH
        ++ + I  ISSLISLSHS+K F  KW+LIR KL+EL SGL +  N +S  +P++S LI  ++ +  +  DLA RCV++SFSGKLLMQSDLDV++ KFD H
Subjt:  TLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRCVDLSFSGKLLMQSDLDVISAKFDRH

Query:  AKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALK
         + LS IY+AGILS GFAIVV +P   ACKDDMRFY+RD++TRMKIG  ++K+QALV L  A+ ED++YVK++IEI ++VN+LV FL S E  +QE + K
Subjt:  AKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALK

Query:  VLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMI
         +  ISGF SY+ VL+ +GVI PL+RV+E G+ VG+  +ARCL+K TENSENAWSVSAHGGV+ALLKICS +D   ELIG +CGVL NLV VEEIKRFMI
Subjt:  VLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMI

Query:  EEG-AISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVM-DPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYF
        EE   ++TFI+L  S++E VQ+NSI  L ++   DE    +LV++GGI+ LV V+ DP S SSSK+ E+ +RAI+NLCF S   +N L+   F+D+LL  
Subjt:  EEG-AISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVM-DPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYF

Query:  LRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVEMLLQMLDAEEG-----NSGNK
        LR+GE+S+QE ALKV  RLC   EE K+ MG+ GFMPE VKFL AKS +VREMA+ AL  ++ +P+NRK+FAQD+ N+  +LQ+LD E+G     +SGN 
Subjt:  LRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVEMLLQMLDAEEG-----NSGNK

Query:  RFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS
        +FL+SIL SLT  +S RRKI +SGY+K+IEKLAE E  DAKKLV+KLS N+FRS+L+GIWHS
Subjt:  RFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLNGIWHS

AT2G05810.1 ARM repeat superfamily protein9.1e-6229.78Show/hide
Query:  MREERSSRSAETDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISDLIRKVIETATECNDLARRCVD
        M    ++ S E   P  +   P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP +  L+  ++      + L+ +C  
Subjt:  MREERSSRSAETDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISDLIRKVIETATECNDLARRCVD

Query:  LSFS-GKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEI
         SFS GKLLMQSDLD+ S+    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  +T++EK  ++I + 
Subjt:  LSFS-GKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEI

Query:  GEIVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADS
        G +  L+          ++E AL  + ++  S  DS K V    G + PL+R++E GS   K  AA  +   T +   AW++SA+GGVT L++ C +   
Subjt:  GEIVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADS

Query:  KTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKD-GGIRALVRVMDPKSSSSSKTLEVTMRAIE
        + +      G +SN+ AVEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V++ GG++ L+ ++  + SS+  T+E  + A+ 
Subjt:  KTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKD-GGIRALVRVMDPKSSSSSKTLEVTMRAIE

Query:  NLCFSSISYVNTLINYG--FMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFA
         +  S++  V+ +++    F+  L   ++ G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK   
Subjt:  NLCFSSISYVNTLINYG--FMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFA

Query:  QDNRNVEMLLQMLDAEEGNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        +D ++V  L+QMLD       NK   + ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  QDNRNVEMLLQMLDAEEGNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G05810.2 ARM repeat superfamily protein9.1e-6229.78Show/hide
Query:  MREERSSRSAETDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISDLIRKVIETATECNDLARRCVD
        M    ++ S E   P  +   P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    +NP +  L+  ++      + L+ +C  
Subjt:  MREERSSRSAETDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDENPAISDLIRKVIETATECNDLARRCVD

Query:  LSFS-GKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEI
         SFS GKLLMQSDLD+ S+    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR++IG ++ K+++L +LL  +T++EK  ++I + 
Subjt:  LSFS-GKLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEI

Query:  GEIVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADS
        G +  L+          ++E AL  + ++  S  DS K V    G + PL+R++E GS   K  AA  +   T +   AW++SA+GGVT L++ C +   
Subjt:  GEIVNLLVNFLGSPETELQEAALKVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADS

Query:  KTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKD-GGIRALVRVMDPKSSSSSKTLEVTMRAIE
        + +      G +SN+ AVEEI+  + EEGAI   I+L  S   +VQ  +  F+  I+   E    L+V++ GG++ L+ ++  + SS+  T+E  + A+ 
Subjt:  KTELIGPACGVLSNLVAVEEIKRFMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKD-GGIRALVRVMDPKSSSSSKTLEVTMRAIE

Query:  NLCFSSISYVNTLINYG--FMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFA
         +  S++  V+ +++    F+  L   ++ G V LQ+++  +   L   S+  K+A+ D   +   ++ +   K   ++E A EA   ++ +  NRK   
Subjt:  NLCFSSISYVNTLINYG--FMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSGMVMIPKNRKRFA

Query:  QDNRNVEMLLQMLDAEEGNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL
        +D ++V  L+QMLD       NK   + ++ ++   GS + R K++  G  + ++ L E EV  AKK V++L+  N+ +S+
Subjt:  QDNRNVEMLLQMLDAEEGNSGNKRFLLSILNSLT--GSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLST-NKFRSL

AT2G45720.1 ARM repeat superfamily protein1.2e-5829.39Show/hide
Query:  ETDTPDFSLNSPTLRQVIL----LISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISDLIRKVIETATECNDLARRCVDLSFSG
        E  T + +L   T+  ++L    L+   +S + +VK F+S+W++I  +LE++ + L  +++  C S ++    + ++ V+ET  E  +LA  CV     G
Subjt:  ETDTPDFSLNSPTLRQVIL----LISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDENPAISDLIRKVIETATECNDLARRCVDLSFSG

Query:  KLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEI-VN
        KL MQSDLD +SAK D   K    +   G+L +     V++P   + +D   F VR+++ R++IG  + KR+AL  L+  + EDEK   VI  +G   V 
Subjt:  KLLMQSDLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEI-VN

Query:  LLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGP
         LV  L +    ++E A+ V+  ++     +  L+    +  LIR++E GS V K  A   L + + +SE + S+  HGGV  L++IC   DS ++    
Subjt:  LLVNFLGSPETELQEAALKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGP

Query:  ACGVLSNLVAVEEIKRFMIEEGAISTFIR------LARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL
        AC  L N+ AV E+++ + EEG +   I       L  S++ A +      LQN+   +E++ + ++ + GI+ L+  +D      S      + AI NL
Subjt:  ACGVLSNLVAVEEIKRFMIEEGAISTFIR------LARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENL

Query:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN
            +  V+    +  + +L++ L+ G +  Q+ A     R+  TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++ +V +P+N +   +D ++
Subjt:  CFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRN

Query:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN
        V  L+ +L+   GNS  K++ +S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  VEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNKFRSLLN

AT5G50900.1 ARM repeat superfamily protein4.5e-6132.54Show/hide
Query:  RQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLI-AADNCDSDENPAISDLIRKVIETATECNDLARRC--VDLSFSGKLLMQSDLDVISAKFDR
        R +  +I+SLI    ++  F  KW  IR KL +L + L   +D   S  N    DL+  V ET  +   +A RC   DL+  GKL  QS++D + A+ DR
Subjt:  RQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLI-AADNCDSDENPAISDLIRKVIETATECNDLARRC--VDLSFSGKLLMQSDLDVISAKFDR

Query:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAAL
        H K    +  +G+L     IVVS   + + K+ +R   R++V R++IG  + K  A+ +L+  + ED+K V + +  G +V +LV  L S    ++E  +
Subjt:  HAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAAL

Query:  KVLHIISGFDSYKAVLVGNG--VIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKR
         V+  IS  +S K VL+  G  ++  L+RV+E GS   K  A   L   + + ENA ++   GG+++LL+IC      ++    A GVL NL    E K 
Subjt:  KVLHIISGFDSYKAVLVGNG--VIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKR

Query:  FMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLY
          +EE AI   I +  S     Q N++  L N+  GDE ++  +V++GGI+ L    D  S SS K+LEV +  ++NL    I     +I+ GF+  L+ 
Subjt:  FMIEEGAISTFIRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLY

Query:  FLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVEMLLQMLDAEEGNSGNKRFLL
         L  G + ++ +A   AV   G S +++K MG+ G +   +  L  K+ E +E A++ALS +++   NRK F + ++ V  L+Q+LD +     +KR+ +
Subjt:  FLRDGEVSLQEVALKVAVRLCGTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVEMLLQMLDAEEGNSGNKRFLL

Query:  SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNK
        S L  L  S   R+++V +G   +++KL + +   AKKL   LS +K
Subjt:  SILNSLTGSSSGRRKIVNSGYMKNIEKLAEAEVYDAKKLVRKLSTNK


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGAGAAGAACGGAGTTCGAGATCTGCAGAAACGGACACGCCGGATTTCTCACTCAACAGTCCCACACTCCGGCAAGTAATTTTACTCATTTCTTCCTTGATATCTCT
TTCTCATTCCGTTAAAGTATTTGCTTCCAAATGGAAGCTAATCCGCGACAAGCTTGAAGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCGACGAAAATC
CTGCAATCTCAGACCTAATTCGGAAGGTGATTGAGACGGCTACTGAATGCAACGATCTCGCTCGGCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTGATGCAGAGT
GATTTGGATGTAATCAGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGACATATATACAGCAGGCATTTTGTCGCAAGGGTTCGCCATCGTCGTTTCTAGGCCTGG
GCTTGGAGCTTGTAAGGATGATATGAGGTTTTACGTGAGGGATATTGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGACAAGCTCTCGTTAATCTGCTCGCTG
CTGTAACTGAAGACGAAAAGTATGTGAAAGTAATAATAGAAATCGGCGAGATAGTGAATCTCCTTGTTAATTTTCTTGGTTCTCCCGAAACGGAACTCCAAGAAGCGGCT
CTGAAAGTGCTTCATATAATTTCTGGGTTTGATTCTTATAAAGCAGTTCTAGTTGGGAATGGGGTAATTGCGCCATTGATTCGCGTTATGGAATGTGGGAGCGAGGTGGG
AAAGAATATAGCCGCAAGGTGTTTGCTGAAATTCACGGAGAATTCTGAAAATGCTTGGTCTGTATCTGCTCACGGCGGAGTAACAGCTCTGTTAAAAATCTGTTCCAATG
CTGATTCCAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGCAATCTCGTTGCTGTTGAAGAAATTAAGAGATTTATGATTGAAGAAGGTGCAATTTCAACGTTT
ATTAGGCTCGCTCGATCTAGAGATGAAGCTGTGCAGATAAATTCCATCGTCTTTCTCCAAAATATAGCTTATGGGGATGAATCAGTAATCAAATTGCTGGTTAAAGATGG
TGGAATTCGGGCTTTAGTTCGTGTTATGGATCCAAAATCATCGTCCTCATCCAAAACCCTAGAGGTCACGATGCGAGCAATTGAAAACCTCTGTTTCTCATCTATTAGTT
ATGTAAATACTTTGATTAACTACGGGTTCATGGATAATCTTCTTTATTTCTTACGAGATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTTAGGCTATGT
GGGACATCAGAGGAAGCCAAGAAAGCAATGGGGGATGGTGGTTTCATGCCAGAATTCGTTAAGTTTCTTGGTGCAAAGTCCTTTGAAGTTCGAGAAATGGCAGCTGAGGC
ACTCTCAGGAATGGTCATGATCCCTAAAAACAGGAAGAGATTTGCTCAGGACAATCGAAATGTAGAGATGCTTCTGCAAATGCTCGACGCAGAGGAGGGAAATTCAGGTA
ACAAAAGATTCCTCCTTTCGATATTGAACTCATTAACCGGAAGCAGTAGTGGAAGAAGGAAGATTGTGAATTCTGGGTATATGAAAAATATTGAAAAACTTGCAGAAGCT
GAAGTTTATGATGCTAAGAAGCTCGTTAGGAAATTGTCCACAAATAAATTCCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
mRNA sequenceShow/hide mRNA sequence
ATGAGAGAAGAACGGAGTTCGAGATCTGCAGAAACGGACACGCCGGATTTCTCACTCAACAGTCCCACACTCCGGCAAGTAATTTTACTCATTTCTTCCTTGATATCTCT
TTCTCATTCCGTTAAAGTATTTGCTTCCAAATGGAAGCTAATCCGCGACAAGCTTGAAGAATTGAATTCCGGCTTAATCGCGGCCGATAACTGTGATTCCGACGAAAATC
CTGCAATCTCAGACCTAATTCGGAAGGTGATTGAGACGGCTACTGAATGCAACGATCTCGCTCGGCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTTTTGATGCAGAGT
GATTTGGATGTAATCAGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGACATATATACAGCAGGCATTTTGTCGCAAGGGTTCGCCATCGTCGTTTCTAGGCCTGG
GCTTGGAGCTTGTAAGGATGATATGAGGTTTTACGTGAGGGATATTGTAACGAGAATGAAGATTGGTTGTTCAGATCTGAAGAGACAAGCTCTCGTTAATCTGCTCGCTG
CTGTAACTGAAGACGAAAAGTATGTGAAAGTAATAATAGAAATCGGCGAGATAGTGAATCTCCTTGTTAATTTTCTTGGTTCTCCCGAAACGGAACTCCAAGAAGCGGCT
CTGAAAGTGCTTCATATAATTTCTGGGTTTGATTCTTATAAAGCAGTTCTAGTTGGGAATGGGGTAATTGCGCCATTGATTCGCGTTATGGAATGTGGGAGCGAGGTGGG
AAAGAATATAGCCGCAAGGTGTTTGCTGAAATTCACGGAGAATTCTGAAAATGCTTGGTCTGTATCTGCTCACGGCGGAGTAACAGCTCTGTTAAAAATCTGTTCCAATG
CTGATTCCAAAACAGAATTGATCGGCCCTGCTTGTGGGGTGCTCAGCAATCTCGTTGCTGTTGAAGAAATTAAGAGATTTATGATTGAAGAAGGTGCAATTTCAACGTTT
ATTAGGCTCGCTCGATCTAGAGATGAAGCTGTGCAGATAAATTCCATCGTCTTTCTCCAAAATATAGCTTATGGGGATGAATCAGTAATCAAATTGCTGGTTAAAGATGG
TGGAATTCGGGCTTTAGTTCGTGTTATGGATCCAAAATCATCGTCCTCATCCAAAACCCTAGAGGTCACGATGCGAGCAATTGAAAACCTCTGTTTCTCATCTATTAGTT
ATGTAAATACTTTGATTAACTACGGGTTCATGGATAATCTTCTTTATTTCTTACGAGATGGGGAAGTTTCTCTTCAAGAAGTAGCTCTGAAAGTTGCAGTTAGGCTATGT
GGGACATCAGAGGAAGCCAAGAAAGCAATGGGGGATGGTGGTTTCATGCCAGAATTCGTTAAGTTTCTTGGTGCAAAGTCCTTTGAAGTTCGAGAAATGGCAGCTGAGGC
ACTCTCAGGAATGGTCATGATCCCTAAAAACAGGAAGAGATTTGCTCAGGACAATCGAAATGTAGAGATGCTTCTGCAAATGCTCGACGCAGAGGAGGGAAATTCAGGTA
ACAAAAGATTCCTCCTTTCGATATTGAACTCATTAACCGGAAGCAGTAGTGGAAGAAGGAAGATTGTGAATTCTGGGTATATGAAAAATATTGAAAAACTTGCAGAAGCT
GAAGTTTATGATGCTAAGAAGCTCGTTAGGAAATTGTCCACAAATAAATTCCGTAGTCTGTTAAATGGAATCTGGCATTCTTGA
Protein sequenceShow/hide protein sequence
MREERSSRSAETDTPDFSLNSPTLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDENPAISDLIRKVIETATECNDLARRCVDLSFSGKLLMQS
DLDVISAKFDRHAKKLSDIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKIGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAA
LKVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSEVGKNIAARCLLKFTENSENAWSVSAHGGVTALLKICSNADSKTELIGPACGVLSNLVAVEEIKRFMIEEGAISTF
IRLARSRDEAVQINSIVFLQNIAYGDESVIKLLVKDGGIRALVRVMDPKSSSSSKTLEVTMRAIENLCFSSISYVNTLINYGFMDNLLYFLRDGEVSLQEVALKVAVRLC
GTSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSGMVMIPKNRKRFAQDNRNVEMLLQMLDAEEGNSGNKRFLLSILNSLTGSSSGRRKIVNSGYMKNIEKLAEA
EVYDAKKLVRKLSTNKFRSLLNGIWHS