; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh18G003210 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh18G003210
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
DescriptionARM repeat superfamily protein
Genome locationCmo_Chr18:2077719..2079461
RNA-Seq ExpressionCmoCh18G003210
SyntenyCmoCh18G003210
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR000225 - Armadillo
IPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6573234.1 U-box domain-containing protein 4, partial [Cucurbita argyrosperma subsp. sororia]0.0e+0098.79Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGIL QGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIA RCL+KFTENSENAWSVSAHGGVTALLKICSNSDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKL+VKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSS+NYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKL ETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMV+IPKNRKRFAQDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

KAG7012405.1 U-box domain-containing protein 4, partial [Cucurbita argyrosperma subsp. argyrosperma]0.0e+0099.14Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVI PLIRVMECGSAVGKKIA RCL+KFTENSENAWSVSAHGGVTALLKICSNSDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSS+NYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKL ETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

XP_022955157.1 uncharacterized protein LOC111457208 isoform X1 [Cucurbita moschata]0.0e+00100Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

XP_022994365.1 armadillo repeat-containing protein 4-like isoform X1 [Cucurbita maxima]0.0e+0098.62Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAALQVLHIISGF SYKAVLVGNGVIAPLIRVMECGSAVGKKIA RCL+KFTENSENAWSVSAHGGVTALLKICSNSDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSRE+SVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSSV+YVNILINYGFM+NLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVR MAAEALSAMVMIPKNRKRFAQDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNS YMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

XP_023542619.1 armadillo repeat-containing protein 4-like isoform X1 [Cucurbita pepo subsp. pepo]0.0e+0098.62Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGE VNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIA LIRVMECGSAVGKKIA RCL+KFTENSENAWSVSAHGGVTALLKICSNSDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSRE+SVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKL +TSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMA EALSAMVMIPKNRKRFAQDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

TrEMBL top hitse value%identityAlignment
A0A6J1CEG2 uncharacterized protein LOC1110109306.4e-28988.79Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MR+ER PRPAETDPTNSPD +++KP+LRQVI  ISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDE PAIS LI K+I T TEC DLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLS+IYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMK+GCSDLKRQALVNLLAAV EDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        +GEIVNLLVNFLGSPETELQEAAL+VLHIISGFDSYKAVLVGNG+IAPLIRVMECGS VGK IA RCL+KFTENSENAWSVSAHGGVTALLKICS+SDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELI PACGVL+NLVGVEEIKRFMIEEGAISTFIR++RS++++VQINSIVFLQNIAYGDESVN LLVKEGG+R LVRVLDPKS SSSKTLE A++AIEN+
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSS++YVNIL+NYGFM++LL FLRNG+VSLQ +ALKVAV+L  TSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS MVMIPKNRKRF QD+RN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        V  LLQMLDTEE NSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAE+EVYDAKKL+RKLSTNKFRSLL+GIWH+
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

A0A6J1EI74 uncharacterized protein LOC1114344004.2e-28888.79Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MR+ER PRP ET PT SPD +LDKP+LRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDE PAISDLIRK+I T TEC DLA RC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLS+IYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMK+GCSDLKRQALVNLLAAVTEDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAAL+VLH ISGFDSYK VLVGNGVIAPLIRV+E GS  GK IATRCLMKFTENS NAWSVSAHGGVTALLKICSN+DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
         ELISPACGVL+NLVGVEEIKRFMIEEGAISTFIRL+RS++++VQINSIVFLQNIAYGDESVNK LVK+GGIR LVRVLDPKS SS+KTLE AM+AIEN+
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSS++YVNIL+NYGFM+NLL+FLRNG+VSLQ +ALKVA +L  TS+E KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF+QDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VE LLQMLDTEE NSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAE+EVYDAKKL+RKLSTNKFRS+LNGIWH+
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

A0A6J1GST6 uncharacterized protein LOC111457208 isoform X10.0e+00100Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

A0A6J1K106 armadillo repeat-containing protein 4-like isoform X10.0e+0098.62Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAALQVLHIISGF SYKAVLVGNGVIAPLIRVMECGSAVGKKIA RCL+KFTENSENAWSVSAHGGVTALLKICSNSDSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
        TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSRE+SVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSSV+YVNILINYGFM+NLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVR MAAEALSAMVMIPKNRKRFAQDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNS YMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

A0A6J1KJB3 uncharacterized protein LOC1114951321.4e-28888.79Show/hide
Query:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC
        MR+E+ PRPAET PT SPD +LDKP+LRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDE PAISDLIRK+IGT TEC DLA RC
Subjt:  MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRC

Query:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE
        VDLSFSGKLLMQSDLDVICAKFDRHAKKLS+IYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMK+GCSDLKRQALVNLLAAVTEDEKYVK+IIE
Subjt:  VDLSFSGKLLMQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIE

Query:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK
        IGEIVNLLVNFLGSPETELQEAAL+VLHIISGFDSYKAVLVGNGVIAPLIRV+E GS  GK IATRCLMKFTENS NAWSVSAHGGVTALLKICS +DSK
Subjt:  IGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSK

Query:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI
         ELISPACGVL+NLVGVEEIKRFMIEEGAISTFIRL+RS++++VQ+NSIVFLQNIAYGDESVNK LVK+GGIR LVRVLDPKS SS+KTLE AM+AIEN+
Subjt:  TELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENI

Query:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN
        CFSS++YVNIL+NYGFM+NLL+FLRNG+VSLQ +ALKVA +L  TSE+ KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALS +VMIPKNRKRF+QDNRN
Subjt:  CFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRN

Query:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        VE LLQML TEE NSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAE+EVYDAKKL+RKLSTNKFRS+LNGIWH+
Subjt:  VETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

SwissProt top hitse value%identityAlignment
O22193 U-box domain-containing protein 46.5e-1227.02Show/hide
Query:  VVSRPGLGACKD--DMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVG
        +VS P     +D  ++   V+ +V  +K    D +RQA   L      +     VI   G IV LLV  L S ++  QE A+  L  +S  D+ K  +  
Subjt:  VVSRPGLGACKD--DMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVG

Query:  NGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSRED
         G I PLI V+E GS+  K+ +   L   +   EN   +   G +  L+ +  N   + +    A   L NL   +E K  +++ GA+   I L      
Subjt:  NGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSRED

Query:  SVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNG
         V   ++  L N+A   E  N  + +EGGI  LV V++     S++  E A  A+  +  +S  + N+++  G +  L+   ++G
Subjt:  SVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNG

Q2U5T5 Vacuolar protein 84.4e-0822.91Show/hide
Query:  ALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAW
        AL NL  AV  D K   +I+ +G +  L+   + SP  E+Q  A+  +  ++  +  KA +  +G + PLIR+ +      ++ AT  L+  T + +N  
Subjt:  ALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAW

Query:  SVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF-MIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRV
         +   G +  L+++ S+SD   +       + N  V     KR    E   + + + L  S    VQ  + + L+N+A  DE     +V+  G+  L+R+
Subjt:  SVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF-MIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRV

Query:  LDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNGD-VSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMA
        L     S    + +A+  I NI    +N  + +I+ GF++ L+  L + D   +Q  A+     L+ +S+  K+ +   G + +    +      V+   
Subjt:  LDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNGD-VSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMA

Query:  AEALSAMVMIPKNRKRFAQDNRNV-ETLLQMLDTEEVN-SGNKRFLFSILNSLTGSSS
          A++ + +  + +      N  V + L+ + ++E +   GN       L+S  G  S
Subjt:  AEALSAMVMIPKNRKRFAQDNRNV-ETLLQMLDTEEVN-SGNKRFLFSILNSLTGSSS

Q6CX49 Vacuolar protein 87.2e-1122.86Show/hide
Query:  KDDMRFY----VRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLI
        KD   FY    +R + T +     +L+R A    LA     EKYV  +    +++  ++  L +P+ +++ A+   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIV
          M+  +   +  A  C+       +N   ++  G +  L K+  +S+ + +    A G L N+    E ++ +++ GA+   + L  S +  VQ     
Subjt:  RVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAK
         L NIA  DES  + L K    + + +++   + +S +    A  A+ N+  S  NY   ++  G + +L+  +++  + L  +A    ++        +
Subjt:  FLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAK

Query:  KAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAM----VMIPKNRKRFAQ
          + D GF+P  VK L  +  E  E+   A+S +        KNR  F Q
Subjt:  KAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAM----VMIPKNRKRFAQ

Q6FJV1 Vacuolar protein 86.5e-1224.07Show/hide
Query:  KDDMRFY----VRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLI
        KD + FY    ++ + T +     +L+R A    LA     EKYV+ +    +++  ++  L S + ++Q AA   L  ++  +  K ++V  G + PLI
Subjt:  KDDMRFY----VRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLI

Query:  RVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIV
          M   +   +  A  C+       +N   ++  G +  L K+  +   + +    A G L N+   EE +R ++  GA+   + L  S +  VQ     
Subjt:  RVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIV

Query:  FLQNIAYGDESVNKLLVKEGG-IRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEA
         L NIA  + +  KL   E   +  LV ++D     SS+    A  A+ N+  S  +Y   ++  G + +L++ +++  V L  +A    ++        
Subjt:  FLQNIAYGDESVNKLLVKEGG-IRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAVKLSETSEEA

Query:  KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAM----VMIPKNRKRF
        +  + D GF+P  VK L  +  E  E+   A+S +        KNRK F
Subjt:  KKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAM----VMIPKNRKRF

Q757R0 Vacuolar protein 84.7e-1024.25Show/hide
Query:  ALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAW
        AL NL  AV  + K   +I+E+G +   L+  + S   E+Q  A+  +  ++  D  KA +  +G + PL ++ +  +   ++ AT  L+  T + EN  
Subjt:  ALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAW

Query:  SVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMI---EEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLV
         +   G V  L+ + S+SD+  +     C    + + V+E  R  +   E   +S  + L+ S    V+  + + L+N+A  D      +V+ GG+  LV
Subjt:  SVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMI---EEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLV

Query:  RVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFL-RNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVRE
        +++    C+S   + A++  I NI    +N   ++++ GF++ L+  L  N +  +Q  A+     L+ +SE+ ++   + G + E  K L   S    +
Subjt:  RVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFL-RNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVRE

Query:  MAAEALSAMVMIPKNRKRFAQDNRNVETLLQM-LDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNS
            A  A++ +  N K    D   +E L+ M   T +  +GN     + L +L    +   KI+ S
Subjt:  MAAEALSAMVMIPKNRKRFAQDNRNVETLLQM-LDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNS

Arabidopsis top hitse value%identityAlignment
AT1G61350.1 ARM repeat superfamily protein4.4e-17357.27Show/hide
Query:  KPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFSGKLLMQSDLDVICAKFD
        K S+ + I  ISSLISLSHS+K F  KW+LIR KL+EL SGL +  N +S   P++S LI  I+ ++ +  DLA RCV++SFSGKLLMQSDLDV+  KFD
Subjt:  KPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFSGKLLMQSDLDVICAKFD

Query:  RHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAA
         H + LS IY+AGILS GFAIVV +P   ACKDDMRFY+RD++TRMK+G  ++K+QALV L  A+ ED++YVK++IEI ++VN+LV FL S E  +QE +
Subjt:  RHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQEAA

Query:  LQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF
         + +  ISGF SY+ VL+ +GVI PL+RV+E G+ VG++ + RCLMK TENSENAWSVSAHGGV+ALLKICS SD   ELI  +CGVL NLVGVEEIKRF
Subjt:  LQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF

Query:  MIEEG-AISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVL-DPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLL
        MIEE   ++TFI+L  S+E+ VQ+NSI  L ++   DE    +LV+EGGI+ LV VL DP S SSSK+ E A++AI+N+CF S   +N L+   F+++LL
Subjt:  MIEEG-AISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVL-DPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLL

Query:  HFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLDTEE-----VNSG
        + LRNG++S+Q  ALKV  +L    EE K+ MG+ GFMPE VKFL AKS +VREMA+ AL  ++ +P+NRK+FAQD+ N+  +LQ+LD E+      +SG
Subjt:  HFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLDTEE-----VNSG

Query:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT
        N +FL SIL SLT  +S RRKI +SGY+K+IEKLAE+E  DAKKL++KLS N+FRS+L+GIWH+
Subjt:  NKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLNGIWHT

AT2G05810.1 ARM repeat superfamily protein1.3e-6029.45Show/hide
Query:  PDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFS-GKLLMQSDL
        P  A  +P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    + P +  L+  ++  +     L+ +C   SFS GKLLMQSDL
Subjt:  PDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFS-GKLLMQSDL

Query:  DVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSP
        D+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR+++G ++ K+++L +LL  +T++EK  ++I + G +  L+       
Subjt:  DVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSP

Query:  ETELQEAALQVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNN
           ++E AL  + ++  S  DS K V    G + PL+R++E GS+  K  A   +   T +   AW++SA+GGVT L++ C +   + +      G ++N
Subjt:  ETELQEAALQVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNN

Query:  LVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKE-GGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILI
        +  VEEI+  + EEGAI   I+L  S   SVQ  +  F+  I+   E    L+V+E GG++ L+ ++  +  S+  T+E  + A+  I  S++  V+ ++
Subjt:  LVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKE-GGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILI

Query:  NYG--FMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLD
        +    F+  L   +++G+V LQ I+  +   L+  S+  K+A+ D   +   ++ +   K   ++E A EA  +++ +  NRK   +D ++V  L+QMLD
Subjt:  NYG--FMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLD

Query:  TEEVNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLST-NKFRSL
               NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK +++L+  N+ +S+
Subjt:  TEEVNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLST-NKFRSL

AT2G05810.2 ARM repeat superfamily protein1.3e-6029.45Show/hide
Query:  PDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFS-GKLLMQSDL
        P  A  +P +  +  ++S L+  S +V+ F  +W+++R KL  LNS L + +++    + P +  L+  ++  +     L+ +C   SFS GKLLMQSDL
Subjt:  PDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIA-ADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFS-GKLLMQSDL

Query:  DVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSP
        D+  +    H   L  +  +G+L Q  AIV+S P   + KDD+ F++RD+ TR+++G ++ K+++L +LL  +T++EK  ++I + G +  L+       
Subjt:  DVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSP

Query:  ETELQEAALQVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNN
           ++E AL  + ++  S  DS K V    G + PL+R++E GS+  K  A   +   T +   AW++SA+GGVT L++ C +   + +      G ++N
Subjt:  ETELQEAALQVLHII--SGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNN

Query:  LVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKE-GGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILI
        +  VEEI+  + EEGAI   I+L  S   SVQ  +  F+  I+   E    L+V+E GG++ L+ ++  +  S+  T+E  + A+  I  S++  V+ ++
Subjt:  LVGVEEIKRFMIEEGAISTFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKE-GGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILI

Query:  NYG--FMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLD
        +    F+  L   +++G+V LQ I+  +   L+  S+  K+A+ D   +   ++ +   K   ++E A EA  +++ +  NRK   +D ++V  L+QMLD
Subjt:  NYG--FMENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFL-GAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLD

Query:  TEEVNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLST-NKFRSL
               NK     ++ ++   GS + R K++  G  + ++ L E EV  AKK +++L+  N+ +S+
Subjt:  TEEVNSGNKRFLFSILNSLT--GSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLST-NKFRSL

AT2G45720.1 ARM repeat superfamily protein2.1e-5829.39Show/hide
Query:  LRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFSGKLLMQSDLDVICAKFDR
        L Q   L+   +S + +VK F+S+W++I  +LE++ + L  +++  C S  T    + ++ ++ T+ E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFSGKLLMQSDLDVICAKFDR

Query:  HAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R+++G  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA

Query:  LQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K+ A   L + + +SE + S+  HGGV  L++IC   DS ++  S AC  L N+  V E+++ 
Subjt:  LQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF

Query:  MIEEGAISTFIR------LSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFM
        + EEG +   I       L  S+E + +      LQN+   +E++ + ++ E GI+ L+  LD          E+ + AI N+    V  V++   +  +
Subjt:  MIEEGAISTFIR------LSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFM

Query:  ENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN
         +L+H L++G +  Q  A     +++ TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++++V +P+N +   +D ++V +L+ +L+    NS  
Subjt:  ENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN

Query:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLN
        K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLN

AT2G45720.2 ARM repeat superfamily protein2.1e-5829.39Show/hide
Query:  LRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFSGKLLMQSDLDVICAKFDR
        L Q   L+   +S + +VK F+S+W++I  +LE++ + L  +++  C S  T    + ++ ++ T+ E  +LA  CV     GKL MQSDLD + AK D 
Subjt:  LRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGL--IAADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFSGKLLMQSDLDVICAKFDR

Query:  HAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA
          K    +   G+L +     V++P   + +D   F VR+++ R+++G  + KR+AL  L+  + EDEK   VI  +G   V  LV  L +    ++E A
Subjt:  HAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEI-VNLLVNFLGSPETELQEAA

Query:  LQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF
        + V+  ++     +  L+    +  LIR++E GS V K+ A   L + + +SE + S+  HGGV  L++IC   DS ++  S AC  L N+  V E+++ 
Subjt:  LQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRF

Query:  MIEEGAISTFIR------LSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFM
        + EEG +   I       L  S+E + +      LQN+   +E++ + ++ E GI+ L+  LD          E+ + AI N+    V  V++   +  +
Subjt:  MIEEGAISTFIR------LSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFM

Query:  ENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN
         +L+H L++G +  Q  A     +++ TS E K+ +G+ G +P  ++ L AK+   RE+AA+A++++V +P+N +   +D ++V +L+ +L+    NS  
Subjt:  ENLLHFLRNGDVSLQGIALKVAVKLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGN

Query:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLN
        K++  S L +L  S   ++ +V+ G +  ++KL+E EV  +KKL+ ++   K +S  +
Subjt:  KRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKLAESEVYDAKKLIRKLSTNKFRSLLN


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGAAAAGAACGGAATCCCAGACCTGCGGAAACGGACCCGACGAACTCACCGGATGTCGCACTCGACAAGCCCAGTCTCCGGCAAGTAATTTTACTTATTTCTTCCTT
GATATCTCTTTCTCATTCCGTTAAAGTATTTGCCTCCAAATGGAAATTAATCCGTGACAAGCTTGAAGAATTAAACTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAACTCCCGCAATCTCAGACTTAATCCGGAAGATTATTGGAACGGTTACGGAATGCGACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTATTG
ATGCAAAGTGATTTGGATGTAATCTGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGAAATATATACTGCAGGCATTTTGTCGCAAGGCTTCGCTATCGTCGTTTC
TAGGCCTGGCCTCGGAGCTTGTAAGGATGATATGCGGTTTTATGTGAGGGATATTGTAACGAGAATGAAGGTTGGTTGTTCAGATCTGAAGAGGCAAGCTCTCGTTAATC
TTCTTGCCGCTGTAACTGAAGACGAAAAGTATGTGAAAGTGATAATCGAAATCGGCGAGATAGTGAATCTCCTAGTTAATTTTCTTGGTTCTCCGGAGACGGAACTTCAA
GAAGCGGCGTTGCAAGTGCTTCATATAATTTCTGGATTTGATTCTTATAAAGCAGTTCTAGTCGGGAATGGAGTAATTGCGCCATTGATTAGGGTTATGGAATGTGGGAG
TGCGGTGGGGAAGAAAATAGCCACAAGGTGTTTGATGAAATTCACTGAGAATTCTGAAAATGCTTGGTCTGTGTCTGCTCATGGCGGAGTGACAGCTCTGTTAAAAATCT
GCTCCAATTCTGATTCTAAAACAGAATTGATCAGTCCTGCGTGTGGGGTTTTAAACAATCTTGTTGGTGTTGAAGAAATTAAGAGATTTATGATCGAAGAAGGAGCAATT
TCAACGTTCATCAGGCTCTCTCGATCTAGAGAGGACTCTGTACAGATAAACTCCATCGTTTTTCTCCAAAACATAGCTTATGGGGATGAATCAGTAAACAAATTGCTGGT
TAAAGAAGGTGGAATTCGGGGATTAGTTCGTGTTTTGGATCCAAAATCTTGTTCCTCATCCAAAACCCTAGAGGCAGCGATGCAAGCAATTGAAAACATCTGTTTCTCAT
CAGTTAATTATGTAAATATCTTGATAAACTACGGATTCATGGAGAACCTTCTTCATTTCTTACGAAATGGGGATGTTTCTCTTCAAGGAATAGCTCTGAAAGTTGCAGTA
AAGCTAAGCGAGACATCAGAGGAAGCCAAAAAAGCAATGGGGGATGGAGGTTTCATGCCAGAATTCGTCAAGTTTCTTGGTGCAAAGTCGTTTGAAGTTCGGGAAATGGC
AGCCGAGGCTCTATCAGCGATGGTCATGATCCCCAAGAACAGGAAGAGATTTGCTCAGGACAATCGAAATGTGGAGACGCTTCTTCAAATGCTCGACACAGAGGAGGTAA
ATTCAGGTAACAAAAGGTTCCTCTTCTCAATATTAAACTCATTAACAGGAAGTAGTAGTGGAAGAAGGAAGATTGTGAATTCTGGGTATATGAAAAACATCGAAAAACTT
GCAGAATCTGAAGTTTATGATGCCAAAAAGCTCATCAGGAAATTATCCACAAACAAATTTCGTAGTCTGTTAAATGGAATCTGGCATACTTGA
mRNA sequenceShow/hide mRNA sequence
ATGAGAAAAGAACGGAATCCCAGACCTGCGGAAACGGACCCGACGAACTCACCGGATGTCGCACTCGACAAGCCCAGTCTCCGGCAAGTAATTTTACTTATTTCTTCCTT
GATATCTCTTTCTCATTCCGTTAAAGTATTTGCCTCCAAATGGAAATTAATCCGTGACAAGCTTGAAGAATTAAACTCCGGCTTAATCGCGGCCGATAACTGTGATTCCG
ACGAAACTCCCGCAATCTCAGACTTAATCCGGAAGATTATTGGAACGGTTACGGAATGCGACGATCTCGCTCGCCGCTGTGTTGACCTCTCTTTCAGTGGGAAGCTATTG
ATGCAAAGTGATTTGGATGTAATCTGTGCGAAATTTGACCGCCATGCGAAGAAGCTTTCGGAAATATATACTGCAGGCATTTTGTCGCAAGGCTTCGCTATCGTCGTTTC
TAGGCCTGGCCTCGGAGCTTGTAAGGATGATATGCGGTTTTATGTGAGGGATATTGTAACGAGAATGAAGGTTGGTTGTTCAGATCTGAAGAGGCAAGCTCTCGTTAATC
TTCTTGCCGCTGTAACTGAAGACGAAAAGTATGTGAAAGTGATAATCGAAATCGGCGAGATAGTGAATCTCCTAGTTAATTTTCTTGGTTCTCCGGAGACGGAACTTCAA
GAAGCGGCGTTGCAAGTGCTTCATATAATTTCTGGATTTGATTCTTATAAAGCAGTTCTAGTCGGGAATGGAGTAATTGCGCCATTGATTAGGGTTATGGAATGTGGGAG
TGCGGTGGGGAAGAAAATAGCCACAAGGTGTTTGATGAAATTCACTGAGAATTCTGAAAATGCTTGGTCTGTGTCTGCTCATGGCGGAGTGACAGCTCTGTTAAAAATCT
GCTCCAATTCTGATTCTAAAACAGAATTGATCAGTCCTGCGTGTGGGGTTTTAAACAATCTTGTTGGTGTTGAAGAAATTAAGAGATTTATGATCGAAGAAGGAGCAATT
TCAACGTTCATCAGGCTCTCTCGATCTAGAGAGGACTCTGTACAGATAAACTCCATCGTTTTTCTCCAAAACATAGCTTATGGGGATGAATCAGTAAACAAATTGCTGGT
TAAAGAAGGTGGAATTCGGGGATTAGTTCGTGTTTTGGATCCAAAATCTTGTTCCTCATCCAAAACCCTAGAGGCAGCGATGCAAGCAATTGAAAACATCTGTTTCTCAT
CAGTTAATTATGTAAATATCTTGATAAACTACGGATTCATGGAGAACCTTCTTCATTTCTTACGAAATGGGGATGTTTCTCTTCAAGGAATAGCTCTGAAAGTTGCAGTA
AAGCTAAGCGAGACATCAGAGGAAGCCAAAAAAGCAATGGGGGATGGAGGTTTCATGCCAGAATTCGTCAAGTTTCTTGGTGCAAAGTCGTTTGAAGTTCGGGAAATGGC
AGCCGAGGCTCTATCAGCGATGGTCATGATCCCCAAGAACAGGAAGAGATTTGCTCAGGACAATCGAAATGTGGAGACGCTTCTTCAAATGCTCGACACAGAGGAGGTAA
ATTCAGGTAACAAAAGGTTCCTCTTCTCAATATTAAACTCATTAACAGGAAGTAGTAGTGGAAGAAGGAAGATTGTGAATTCTGGGTATATGAAAAACATCGAAAAACTT
GCAGAATCTGAAGTTTATGATGCCAAAAAGCTCATCAGGAAATTATCCACAAACAAATTTCGTAGTCTGTTAAATGGAATCTGGCATACTTGA
Protein sequenceShow/hide protein sequence
MRKERNPRPAETDPTNSPDVALDKPSLRQVILLISSLISLSHSVKVFASKWKLIRDKLEELNSGLIAADNCDSDETPAISDLIRKIIGTVTECDDLARRCVDLSFSGKLL
MQSDLDVICAKFDRHAKKLSEIYTAGILSQGFAIVVSRPGLGACKDDMRFYVRDIVTRMKVGCSDLKRQALVNLLAAVTEDEKYVKVIIEIGEIVNLLVNFLGSPETELQ
EAALQVLHIISGFDSYKAVLVGNGVIAPLIRVMECGSAVGKKIATRCLMKFTENSENAWSVSAHGGVTALLKICSNSDSKTELISPACGVLNNLVGVEEIKRFMIEEGAI
STFIRLSRSREDSVQINSIVFLQNIAYGDESVNKLLVKEGGIRGLVRVLDPKSCSSSKTLEAAMQAIENICFSSVNYVNILINYGFMENLLHFLRNGDVSLQGIALKVAV
KLSETSEEAKKAMGDGGFMPEFVKFLGAKSFEVREMAAEALSAMVMIPKNRKRFAQDNRNVETLLQMLDTEEVNSGNKRFLFSILNSLTGSSSGRRKIVNSGYMKNIEKL
AESEVYDAKKLIRKLSTNKFRSLLNGIWHT