; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Spg016364 (gene) of Sponge gourd (cylindrica) v1 genome

Gene IDSpg016364
OrganismLuffa cylindrica (Sponge gourd (cylindrica) v1)
DescriptionARM repeat superfamily protein
Genome locationscaffold9:37977905..37990866
RNA-Seq ExpressionSpg016364
SyntenySpg016364
Gene Ontology termsGO:0043248 - proteasome assembly (biological process)
InterPro domainsIPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold
IPR019538 - 26S proteasome non-ATPase regulatory subunit 5


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6607893.1 26S proteasome non-ATPase regulatory subunit 5, partial [Cucurbita argyrosperma subsp. sororia]5.5e-25882.62Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+IN                ALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+A+SQ +RSLACKTVTRLLEE+D T  LA QLI+DYNIYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFP NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMAL+VKLFSVSSSVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYE                              LVEIEHGT FLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILI+AIDEILGSSEGQDV+VCESAFEALGQIGSSKWGATLLLSS+PTCVK+VINAAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQ ASRS KM PSG  LAVLQQDSEIRLASYRMITGLV RPWCLMEICSKQDIINIV+
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCCLAIHK FMSSTRLTGDPALAGIASKLQEAV+NGPYLSRR LETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

KAG7037420.1 26S proteasome non-ATPase regulatory subunit 5 [Cucurbita argyrosperma subsp. argyrosperma]3.0e-26483.99Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+IN                ALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+A+SQ +RSLACKTVTRLLEE+D T  LA QLI+DYNIYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFP NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMAL+VKLFSVSSSVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYEVY+LL PD+    M    L+ ++       LVEIEHGT FLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILI+AIDEILGSSEGQDV+VCESAFEALGQIGSSKWGATLLLSS+PTCVK+VINAAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQ ASRS KM PSG  LAVLQQDSEIRLASYRMITGLV RPWCLMEICSKQDIINIV+
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCCLAIHK FMSSTRLTGDPALAGIASKLQEAV+NGPYLSRR LETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

XP_022940916.1 uncharacterized protein LOC111446360 [Cucurbita moschata]2.9e-25982.96Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+IN                ALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+ADSQ +RSLACKTVTRLLEE+D T  LA QLI+DYNIYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFP NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMAL+VKLFSVSSSVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYE                              LVEIEHGT FLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILI+AIDEILGSSEGQDV+VCESAFEALGQIGSSKWGATLLLSS+PTCVK+VINAAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQ ASRS KM PSG  LAVLQQDSEIRLASYRMITGLV+RPWCLMEICSKQDIINIV+
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAV+NGPYLSRR LETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

XP_022981236.1 uncharacterized protein LOC111480433 [Cucurbita maxima]8.0e-25782.11Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFANYPGVRTD SVKEF +RFPLPV+IN                ALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+ADSQ +RSLACKTVTRLLEE+D T  LA QLI+DYNIYPLL+ECLLNGNEQVANSSMDA+KKLAAFPKGMEIIFP NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMAL+VKLFSVSSSVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYE                              LVEIEHGT FLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILI++IDEILGSSEGQDV+VCESAFEALGQIGSSKWGATLLLSS+PTCVK+VINAAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENL DLIYQ ASRS K+ PSG  LAVLQQDSEIRLASYRMITGLV+RPWCLMEICSKQDIINIV+
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAV+NGPYLSRR LETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

XP_023525525.1 uncharacterized protein LOC111789113 [Cucurbita pepo subsp. pepo]1.2e-25782.11Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+IN                ALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+ADSQ +R LACKTVTRLLEE+D T  LA QLI+DYNIYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFP NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMAL+VKLFSVSSSVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYE                              LVEIEHGT FLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        QQLS IISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILI+AIDEILGSSEGQDV+VCESAFEALGQIGSSKWGATLLLSS+PTCVK+VINAAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGETRSEND++LNDNAEENLRDLIYQ ASRS KM PSG  LAVLQQDSEIRLASYRMITGLV+RPWCL+EICSKQDIINIV+
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCCLAIHK FMSSTRLTGDPALAGIASKLQEAV+NGPYLSRR LETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

TrEMBL top hitse value%identityAlignment
A0A0A0L246 Uncharacterized protein1.9e-24879.73Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEF+V+DPT+LL+AAA+FANYPGVRTDASVKEFL+RFPLP IIN                ALQTKAEFPGLE+TLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+ADSQT+R+LACKTVTRLL+ESDETA   +QLI+DY IYPLLL+CLLNGNEQVANSSMD+IK LAAFP+GMEII P+NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMALVVKLFSVSSSVASAV N+NLLSLLESEINNS DTLVTLSVLELLYE                              LVEIEHGTKFLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q L SIISN SAESILRSRAMVI GRLLSKENIFSLVDESC+R LI+A+D ILGSSEG+DV+V E+A EALGQIGSS WGATLLLSSFPTCVKHVI AAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGE RSENDIMLNDNAEENLRDLIYQIASRSSKM PSG FLAVLQQDSEIRLASYRMITGLV+RPWCL EICSKQDI+NIV 
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DAS+ETTKI                GMEARYNCCLAIHKAFMSS RLTGDPALAGIASKLQEAVRNGPYL+RRN+ETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

A0A1S3CKC0 uncharacterized protein LOC103501781 isoform X18.1e-24778.88Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        ME+F+V+DPTQLL+AAA+FANYPGVRTDASVKEFL+RFPLP IIN                ALQTKAEFPG+E+TLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+ADSQT+R+LACKTVTRLL+ESDET   A+QLI+DY IYPLLL+CLLNGNEQVANSSMD+IK LAAFP+GMEII P+NKTEATHLG VASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMALVVKLFSVSSSVASAV N+NLLSLLESEINNS DTLVTLSVLELLYE                              LVEIEHGTKFLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISN SAESILRSRAMVI GRLLSKENIFSLVDESCVR LI+A+D ILGSSEG+DV+V E+A EALGQIGSS WGATLLLSSFPTCVKH I  AF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGE+RSENDI+LNDNAEENLRDLIYQIASRSSKM PSG FLAVLQQDSEIRLASYRMITGLV+RPWCL EICSKQ+I+NIV 
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DAS+ETTKI                GMEARYNCCL+IHKAFMSS RLTGDPALAGIASKLQEAVRNGPYL+RRN+ETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

A0A6J1CFN3 uncharacterized protein LOC111010386 isoform X19.2e-25180.92Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFA+YPGVRTDASVKEFL+RFPLPVIIN                ALQTKAE PGLENTLVACLDRIFKTK+GAS IPHFMPF+
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGLRADSQT+R LACKTVT LLEESD  A LA+QLI+DY IYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGME+IFP N+TEATHLGT+ASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMALVVKLFSVS SVASA+ NSNLL+LLESEINNSNDTLVTLSVLELLYE                              LVEIEHGTKFLPRTS L
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISN S ESILRSRAMVISGRLLSKEN++ LVDESCVRILI+AIDE LGSSEGQDV+VCESAFEALGQIGS+  GATLLLSSF TCVK +I+AAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNI GETRSENDIMLND AEENLRDL+YQIASRSSK+MPSG FLAVLQQDSEIRLASYRMITGLV+RPWCLMEICSKQ+IINIVT
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCC+AIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYL+RRN ETQPAVMTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

A0A6J1FJQ7 uncharacterized protein LOC1114463601.4e-25982.96Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+IN                ALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+ADSQ +RSLACKTVTRLLEE+D T  LA QLI+DYNIYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFP NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMAL+VKLFSVSSSVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYE                              LVEIEHGT FLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILI+AIDEILGSSEGQDV+VCESAFEALGQIGSSKWGATLLLSS+PTCVK+VINAAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQ ASRS KM PSG  LAVLQQDSEIRLASYRMITGLV+RPWCLMEICSKQDIINIV+
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAV+NGPYLSRR LETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

A0A6J1IVZ7 uncharacterized protein LOC1114804333.9e-25782.11Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV
        MEEFAVDDPTQLLEAAADFANYPGVRTD SVKEF +RFPLPV+IN                ALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFV
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFV

Query:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG
        QVGL+ADSQ +RSLACKTVTRLLEE+D T  LA QLI+DYNIYPLL+ECLLNGNEQVANSSMDA+KKLAAFPKGMEIIFP NKTEATHLGTVASTCSSLG
Subjt:  QVGLRADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLG

Query:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL
        RVRVMAL+VKLFSVSSSVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYE                              LVEIEHGT FLPRTSFL
Subjt:  RVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFL

Query:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF
        Q LSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILI++IDEILGSSEGQDV+VCESAFEALGQIGSSKWGATLLLSS+PTCVK+VINAAF
Subjt:  QQLSSIISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAF

Query:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT
        DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENL DLIYQ ASRS K+ PSG  LAVLQQDSEIRLASYRMITGLV+RPWCLMEICSKQDIINIV+
Subjt:  DRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVT

Query:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        DASTETTKI                GMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAV+NGPYLSRR LETQPA+MTAERF
Subjt:  DASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT3G15180.1 ARM repeat superfamily protein3.3e-15250.69Show/hide
Query:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLR
        ++D  QL +AA +FA+YPG + + SVKEFL+RFPLPVI N                ALQT  + PG ENTLV CL+R+FKTK+GASLIP +MP +QVGL+
Subjt:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLR

Query:  ADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLGRVRVM
        ADS  ++SLACKTV  LLE+ D     +VQL+++  IYPLLL+ ++N +++VAN++ + IK LA FP  M +IFP+   + THL  +A+ CSSL RVRV+
Subjt:  ADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLGRVRVM

Query:  ALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFLQQLSS
        +L+VKLFS+S  VAS V  S LL LLE+E+  + DTLV L+VLEL YE                              L+E+EH ++F+P+TS +Q L S
Subjt:  ALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFLQQLSS

Query:  IISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAFDRHEH
        IIS  S     + RAM+ISGRLLSKENI+ +V+E+ V+ LI+AID  L S E  D D  E+A +ALGQ+GS+  GA L+LS+ P   +HV+ +AFDR+ H
Subjt:  IISNRSAESILRSRAMVISGRLLSKENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAFDRHEH

Query:  GKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVTDASTE
        GKQLAA+HAL NI GETR +++ +++  AEE+LR LIY  A++S+K+ PSG FL+VLQQ SEIRLA YR +T LV+RPWCL+EI +K++IINIVTDA+TE
Subjt:  GKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVTDASTE

Query:  TTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        T KI                 MEARYNCC AIH+AF+ S     DP       KLQEAVR+GPY+S+++   +P VMT E F
Subjt:  TTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF

AT3G15180.2 ARM repeat superfamily protein2.2e-14848.21Show/hide
Query:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLR
        ++D  QL +AA +FA+YPG + + SVKEFL+RFPLPVI N                ALQT  + PG ENTLV CL+R+FKTK+GASLIP +MP +QVGL+
Subjt:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLR

Query:  ADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLGRVRVM
        ADS  ++SLACKTV  LLE+ D     +VQL+++  IYPLLL+ ++N +++VAN++ + IK LA FP  M +IFP+   + THL  +A+ CSSL RVRV+
Subjt:  ADSQTIRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLGRVRVM

Query:  ALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFLQQLSS
        +L+VKLFS+S  VAS V  S LL LLE+E+  + DTLV L+VLEL YE                              L+E+EH ++F+P+TS +Q L S
Subjt:  ALVVKLFSVSSSVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFLQQLSS

Query:  IISNRSAESILRSRAMVISGRLLSKENIFSLVDES--------------------------------CVRILITAIDEILGSSEGQDVDVCESAFEALGQ
        IIS  S     + RAM+ISGRLLSKENI+ +V+E+                                CV+ LI+AID  L S E  D D  E+A +ALGQ
Subjt:  IISNRSAESILRSRAMVISGRLLSKENIFSLVDES--------------------------------CVRILITAIDEILGSSEGQDVDVCESAFEALGQ

Query:  IGSSKWGATLLLSSFPTCVKHVINAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASY
        +GS+  GA L+LS+ P   +HV+ +AFDR+ HGKQLAA+HAL NI GETR +++ +++  AEE+LR LIY  A++S+K+ PSG FL+VLQQ SEIRLA Y
Subjt:  IGSSKWGATLLLSSFPTCVKHVINAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGFFLAVLQQDSEIRLASY

Query:  RMITGLVSRPWCLMEICSKQDIINIVTDASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRR
        R +T LV+RPWCL+EI +K++IINIVTDA+TET KI                 MEARYNCC AIH+AF+ S     DP       KLQEAVR+GPY+S++
Subjt:  RMITGLVSRPWCLMEICSKQDIINIVTDASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLSRR

Query:  NLETQPAVMTAERF
        +   +P VMT E F
Subjt:  NLETQPAVMTAERF


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAGGAATTTGCTGTGGATGATCCGACTCAGCTCCTCGAAGCAGCTGCAGACTTCGCAAATTATCCCGGTGTTCGGACCGATGCGTCGGTGAAGGAATTTCTCAACCG
CTTCCCCCTTCCCGTCATCATCAATGGTTGTCAGTTTTCTTTTGTGACTTGGGCTATTTTTTCTTCTGCAAGTGCTTTACAAACGAAAGCAGAATTTCCTGGTTTGGAGA
ACACTTTGGTCGCATGTCTCGACAGGATATTCAAAACTAAGTTTGGTGCTTCTCTTATACCACATTTTATGCCTTTTGTACAGGTTGGACTACGAGCAGATTCTCAAACA
ATTAGAAGCTTAGCTTGTAAAACGGTCACTCGCCTTTTGGAGGAGTCCGATGAGACTGCTCATTTGGCCGTACAACTGATTCTTGACTATAACATCTATCCACTTTTGCT
CGAGTGCCTTCTTAATGGTAACGAACAAGTTGCTAACTCATCAATGGATGCAATAAAGAAATTGGCTGCATTTCCAAAGGGGATGGAAATCATCTTCCCAGCAAATAAAA
CGGAAGCAACACACCTTGGAACTGTAGCTTCAACATGTTCATCTCTGGGAAGAGTTCGAGTTATGGCTTTGGTAGTGAAACTGTTTTCGGTTTCTAGCTCTGTAGCATCG
GCAGTATGCAATTCAAATTTATTAAGCCTACTGGAAAGTGAAATCAACAACTCAAACGACACACTTGTAACTTTAAGCGTGCTGGAACTCTTGTATGAGGTTTACCATCT
CTTATTCCCTGACTACTTTGGTTTGATCATGCAAGAAAAATCATTATGGTCAGTCATTGTACATTACGTCAATGAAGTGTTAGTGGAGATTGAACATGGTACAAAGTTTT
TGCCAAGGACCAGCTTTCTCCAACAACTAAGCTCTATAATCAGCAACCGATCTGCTGAGTCTATTTTAAGATCAAGAGCAATGGTCATTAGTGGAAGACTTTTGTCCAAA
GAGAATATTTTCTCGCTCGTAGATGAATCTTGTGTACGAATTTTAATAACTGCTATAGATGAAATTCTTGGGTCATCGGAAGGTCAGGATGTAGATGTATGTGAATCTGC
ATTTGAAGCACTGGGTCAAATAGGGTCAAGCAAATGGGGAGCCACTTTACTGCTGTCAAGTTTTCCGACTTGTGTGAAGCATGTAATTAATGCAGCTTTTGATCGGCATG
AACATGGTAAACAGCTGGCAGCTATGCATGCTCTTGGTAACATCTTTGGAGAAACTCGATCTGAGAATGATATTATGCTGAATGATAATGCCGAAGAAAATTTACGGGAC
TTGATATATCAAATTGCATCCAGAAGTTCAAAAATGATGCCATCAGGCTTTTTTCTAGCTGTCCTTCAACAGGATTCTGAGATTCGCTTGGCGAGTTATAGAATGATTAC
TGGGTTGGTCTCTCGACCTTGGTGCCTTATGGAAATCTGCTCGAAACAAGACATAATAAATATAGTGACTGATGCAAGTACCGAGACTACAAAAATAGTCTCTTCCCGTT
TTGTTTGGTCTAGATTTTTTGTTTGTTTTCTTTTAGGAATGGAAGCTAGATATAACTGTTGTTTGGCTATCCACAAGGCCTTCATGTCTTCAACTAGACTTACTGGCGAT
CCTGCTCTTGCTGGAATAGCCTCGAAGTTGCAGGAAGCTGTAAGAAATGGTCCATATCTTAGTAGAAGGAATCTTGAAACTCAACCAGCAGTAATGACAGCTGAAAGATT
TTAG
mRNA sequenceShow/hide mRNA sequence
ATGGAGGAATTTGCTGTGGATGATCCGACTCAGCTCCTCGAAGCAGCTGCAGACTTCGCAAATTATCCCGGTGTTCGGACCGATGCGTCGGTGAAGGAATTTCTCAACCG
CTTCCCCCTTCCCGTCATCATCAATGGTTGTCAGTTTTCTTTTGTGACTTGGGCTATTTTTTCTTCTGCAAGTGCTTTACAAACGAAAGCAGAATTTCCTGGTTTGGAGA
ACACTTTGGTCGCATGTCTCGACAGGATATTCAAAACTAAGTTTGGTGCTTCTCTTATACCACATTTTATGCCTTTTGTACAGGTTGGACTACGAGCAGATTCTCAAACA
ATTAGAAGCTTAGCTTGTAAAACGGTCACTCGCCTTTTGGAGGAGTCCGATGAGACTGCTCATTTGGCCGTACAACTGATTCTTGACTATAACATCTATCCACTTTTGCT
CGAGTGCCTTCTTAATGGTAACGAACAAGTTGCTAACTCATCAATGGATGCAATAAAGAAATTGGCTGCATTTCCAAAGGGGATGGAAATCATCTTCCCAGCAAATAAAA
CGGAAGCAACACACCTTGGAACTGTAGCTTCAACATGTTCATCTCTGGGAAGAGTTCGAGTTATGGCTTTGGTAGTGAAACTGTTTTCGGTTTCTAGCTCTGTAGCATCG
GCAGTATGCAATTCAAATTTATTAAGCCTACTGGAAAGTGAAATCAACAACTCAAACGACACACTTGTAACTTTAAGCGTGCTGGAACTCTTGTATGAGGTTTACCATCT
CTTATTCCCTGACTACTTTGGTTTGATCATGCAAGAAAAATCATTATGGTCAGTCATTGTACATTACGTCAATGAAGTGTTAGTGGAGATTGAACATGGTACAAAGTTTT
TGCCAAGGACCAGCTTTCTCCAACAACTAAGCTCTATAATCAGCAACCGATCTGCTGAGTCTATTTTAAGATCAAGAGCAATGGTCATTAGTGGAAGACTTTTGTCCAAA
GAGAATATTTTCTCGCTCGTAGATGAATCTTGTGTACGAATTTTAATAACTGCTATAGATGAAATTCTTGGGTCATCGGAAGGTCAGGATGTAGATGTATGTGAATCTGC
ATTTGAAGCACTGGGTCAAATAGGGTCAAGCAAATGGGGAGCCACTTTACTGCTGTCAAGTTTTCCGACTTGTGTGAAGCATGTAATTAATGCAGCTTTTGATCGGCATG
AACATGGTAAACAGCTGGCAGCTATGCATGCTCTTGGTAACATCTTTGGAGAAACTCGATCTGAGAATGATATTATGCTGAATGATAATGCCGAAGAAAATTTACGGGAC
TTGATATATCAAATTGCATCCAGAAGTTCAAAAATGATGCCATCAGGCTTTTTTCTAGCTGTCCTTCAACAGGATTCTGAGATTCGCTTGGCGAGTTATAGAATGATTAC
TGGGTTGGTCTCTCGACCTTGGTGCCTTATGGAAATCTGCTCGAAACAAGACATAATAAATATAGTGACTGATGCAAGTACCGAGACTACAAAAATAGTCTCTTCCCGTT
TTGTTTGGTCTAGATTTTTTGTTTGTTTTCTTTTAGGAATGGAAGCTAGATATAACTGTTGTTTGGCTATCCACAAGGCCTTCATGTCTTCAACTAGACTTACTGGCGAT
CCTGCTCTTGCTGGAATAGCCTCGAAGTTGCAGGAAGCTGTAAGAAATGGTCCATATCTTAGTAGAAGGAATCTTGAAACTCAACCAGCAGTAATGACAGCTGAAAGATT
TTAG
Protein sequenceShow/hide protein sequence
MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINGCQFSFVTWAIFSSASALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQT
IRSLACKTVTRLLEESDETAHLAVQLILDYNIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPANKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSSSVAS
AVCNSNLLSLLESEINNSNDTLVTLSVLELLYEVYHLLFPDYFGLIMQEKSLWSVIVHYVNEVLVEIEHGTKFLPRTSFLQQLSSIISNRSAESILRSRAMVISGRLLSK
ENIFSLVDESCVRILITAIDEILGSSEGQDVDVCESAFEALGQIGSSKWGATLLLSSFPTCVKHVINAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRD
LIYQIASRSSKMMPSGFFLAVLQQDSEIRLASYRMITGLVSRPWCLMEICSKQDIINIVTDASTETTKIVSSRFVWSRFFVCFLLGMEARYNCCLAIHKAFMSSTRLTGD
PALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF