; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lag0037871 (gene) of Sponge gourd (AG-4) v1 genome

Gene IDLag0037871
OrganismLuffa acutangula AG-4 (Sponge gourd (AG-4) v1)
DescriptionARM repeat superfamily protein
Genome locationchr2:10032792..10046004
RNA-Seq ExpressionLag0037871
SyntenyLag0037871
Gene Ontology termsGO:0043248 - proteasome assembly (biological process)
InterPro domainsIPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold
IPR019538 - 26S proteasome non-ATPase regulatory subunit 5


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6607893.1 26S proteasome non-ATPase regulatory subunit 5, partial [Cucurbita argyrosperma subsp. sororia]2.2e-26691.62Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+INALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFVQVGL+A+SQ +RSLAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLLEE+D T QLA QLI+DYNIYPLL+ECL NGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMAL+VKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPR SFLQ L+SIISNRSAESILRSRAMVISGR LSKENIFSLVDESCVRILI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SAIDEILGSSEGQDV+VC SAFEALGQIGSSKWGATLLLSS+PTCVK+VI+AAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQ A
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRS KM PSGL LAVLQQDSEIRLASYRMITGLV RPWCL+EICSKQDIINIV DASTETTKIGMEARYNCCLAIHK FMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AV+NGPYLSRR LETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

XP_022940916.1 uncharacterized protein LOC111446360 [Cucurbita moschata]1.2e-26792Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+INALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFVQVGL+ADSQ +RSLAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLLEE+D T QLA QLI+DYNIYPLL+ECL NGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMAL+VKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPR SFLQ L+SIISNRSAESILRSRAMVISGR LSKENIFSLVDESCVRILI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SAIDEILGSSEGQDV+VC SAFEALGQIGSSKWGATLLLSS+PTCVK+VI+AAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQ A
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRS KM PSGL LAVLQQDSEIRLASYRMITGLV+RPWCL+EICSKQDIINIV DASTETTKIGMEARYNCCLAIHKAFMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AV+NGPYLSRR LETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

XP_022981236.1 uncharacterized protein LOC111480433 [Cucurbita maxima]3.2e-26591.05Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEFAVDDPTQLLEAAADFANYPGVRTD SVKEF +RFPLPV+INALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFVQVGL+ADSQ +RSLAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLLEE+D T QLA QLI+DYNIYPLL+ECL NGNEQVANSSMDA+KKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMAL+VKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPR SFLQ L+SIISNRSAESILRSRAMVISGR LSKENIFSLVDESCVRILI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        S+IDEILGSSEGQDV+VC SAFEALGQIGSSKWGATLLLSS+PTCVK+VI+AAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENL DLIYQ A
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRS K+ PSGL LAVLQQDSEIRLASYRMITGLV+RPWCL+EICSKQDIINIV DASTETTKIGMEARYNCCLAIHKAFMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AV+NGPYLSRR LETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

XP_023525525.1 uncharacterized protein LOC111789113 [Cucurbita pepo subsp. pepo]7.6e-26791.43Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+INALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFVQVGL+ADSQ +R LAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLLEE+D T QLA QLI+DYNIYPLL+ECL NGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMAL+VKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPR SFLQQL+ IISNRSAESILRSRAMVISGR LSKENIFSLVDESCVRILI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SAIDEILGSSEGQDV+VC SAFEALGQIGSSKWGATLLLSS+PTCVK+VI+AAFDRHEHGKQLAAMHALGNIFGETRSEND++LNDNAEENLRDLIYQ A
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRS KM PSGL LAVLQQDSEIRLASYRMITGLV+RPWCLVEICSKQDIINIV DASTETTKIGMEARYNCCLAIHK FMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AV+NGPYLSRR LETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

XP_038898234.1 uncharacterized protein LOC120085959 isoform X1 [Benincasa hispida]4.6e-26491.24Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEF+VDDPT+LLEAAADFANYPGVRTDASVKEFL+RFPLP IINALQTKAE P LENTLVACLDRIFKTK+GASLIPH+MPFVQVGLRADSQ +RSLAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLL+ESDET  LA+QLIIDY IYPLLL+CL NGNEQVANSSMDAIK LAAFP GMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV N+NLL LLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPR SF+  L+SIISN SAESILRSRAMVI GR LSK+NIFSLVDESCVR LI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SAID ILGSSEGQDV+VC +AFEALGQIGSS WGATLLLSSFPTCVKHVI AAFDRHEHGKQLAAMHALGNIFGETRSEND+MLNDNAEENLRDLIYQIA
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRSSKMMPSGLFLAVLQQDSEIRLASYRM+TGLV+RPWCL+EICSKQDIINIV DASTETTKIGMEARYNCCLAIHKAFMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AVRNGPYL+RRNLETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

TrEMBL top hitse value%identityAlignment
A0A0A0L246 Uncharacterized protein2.6e-25788.76Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEF+V+DPT+LL+AAA+FANYPGVRTDASVKEFL+RFPLP IINALQTKAEFPGLE+TLVACLDRIFKTK+GASLIPH+MPFVQVGL+ADSQT+R+LAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLL+ESDETA   +QLIIDY IYPLLL+CL NGNEQVANSSMD+IK LAAFP+GMEII P+NKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV N+NLLSLLESEINNS DTLVTLSVLELLYELVEIEHGTKFLPR SFLQ L SIISN SAESILRSRAMVI GR LSKENIFSLVDESC+R LI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SA+D ILGSSEG+DV+V  +A EALGQIGSS WGATLLLSSFPTCVKHVI AAFDRHEHGKQLAAMHALGNIFGE RSENDIMLNDNAEENLRDLIYQIA
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRSSKM PSGLFLAVLQQDSEIRLASYRMITGLV+RPWCL EICSKQDI+NIV DAS+ETTKIGMEARYNCCLAIHKAFMSS  LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AVRNGPYL+RRN+ETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

A0A1S3CKC0 uncharacterized protein LOC103501781 isoform X11.5e-25587.62Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        ME+F+V+DPTQLL+AAA+FANYPGVRTDASVKEFL+RFPLP IINALQTKAEFPG+E+TLVACLDRIFKTK+GASLIPH+MPFVQVGL+ADSQT+R+LAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLL+ESDET   A+QLIIDY IYPLLL+CL NGNEQVANSSMD+IK LAAFP+GMEII P+NKTEATHLG VASTCSSLGRVRVMALVVKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV N+NLLSLLESEINNS DTLVTLSVLELLYELVEIEHGTKFLPR SFLQ L+SIISN SAESILRSRAMVI GR LSKENIFSLVDESCVR LI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SA+D ILGSSEG+DV+V  +A EALGQIGSS WGATLLLSSFPTCVKH I  AFDRHEHGKQLAAMHALGNIFGE+RSENDI+LNDNAEENLRDLIYQIA
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRSSKM PSGLFLAVLQQDSEIRLASYRMITGLV+RPWCL EICSKQ+I+NIV DAS+ETTKIGMEARYNCCL+IHKAFMSS  LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AVRNGPYL+RRN+ETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

A0A6J1CFN3 uncharacterized protein LOC111010386 isoform X11.1e-25889.71Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEFAVDDPTQLLEAAADFA+YPGVRTDASVKEFL+RFPLPVIINALQTKAE PGLENTLVACLDRIFKTK+GAS IPHFMPF+QVGLRADSQT+R LAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVT LLEESD  A LA+QLIIDY IYPLLLECL NGNEQVANSSMDAIKKLAAFPKGME+IFPTN+TEATHLGT+ASTCSSLGRVRVMALVVKLFSVS 
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASA+ NSNLL+LLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPR S LQ L+SIISN S ESILRSRAMVISGR LSKEN++ LVDESCVRILI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SAIDE LGSSEGQDV+VC SAFEALGQIGS+  GATLLLSSF TCVK +I AAFDRHEHGKQLAAMHALGNI GETRSENDIMLND AEENLRDL+YQIA
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRSSK+MPSGLFLAVLQQDSEIRLASYRMITGLV+RPWCL+EICSKQ+IINIV DASTETTKIGMEARYNCC+AIHKAFMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AVRNGPYL+RRN ETQPAVMTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

A0A6J1FJQ7 uncharacterized protein LOC1114463605.7e-26892Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEF +RFPLPV+INALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFVQVGL+ADSQ +RSLAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLLEE+D T QLA QLI+DYNIYPLL+ECL NGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMAL+VKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPR SFLQ L+SIISNRSAESILRSRAMVISGR LSKENIFSLVDESCVRILI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        SAIDEILGSSEGQDV+VC SAFEALGQIGSSKWGATLLLSS+PTCVK+VI+AAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQ A
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRS KM PSGL LAVLQQDSEIRLASYRMITGLV+RPWCL+EICSKQDIINIV DASTETTKIGMEARYNCCLAIHKAFMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AV+NGPYLSRR LETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

A0A6J1IVZ7 uncharacterized protein LOC1114804331.5e-26591.05Show/hide
Query:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC
        MEEFAVDDPTQLLEAAADFANYPGVRTD SVKEF +RFPLPV+INALQ KAE PGLENTLVACLDRIFKTK+GASLIPH+MPFVQVGL+ADSQ +RSLAC
Subjt:  MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLAC

Query:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS
        KTVTRLLEE+D T QLA QLI+DYNIYPLL+ECL NGNEQVANSSMDA+KKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMAL+VKLFSVSS
Subjt:  KTVTRLLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSS

Query:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI
        SVASAV NSNLL+LLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPR SFLQ L+SIISNRSAESILRSRAMVISGR LSKENIFSLVDESCVRILI
Subjt:  SVASAVCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILI

Query:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA
        S+IDEILGSSEGQDV+VC SAFEALGQIGSSKWGATLLLSS+PTCVK+VI+AAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENL DLIYQ A
Subjt:  SAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIA

Query:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE
        SRS K+ PSGL LAVLQQDSEIRLASYRMITGLV+RPWCL+EICSKQDIINIV DASTETTKIGMEARYNCCLAIHKAFMSST LTGDPALAGIASKLQE
Subjt:  SRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQE

Query:  AVRNGPYLSRRNLETQPAVMTAERF
        AV+NGPYLSRR LETQPA+MTAERF
Subjt:  AVRNGPYLSRRNLETQPAVMTAERF

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT3G15180.1 ARM repeat superfamily protein9.2e-16256.54Show/hide
Query:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLACKTVTR
        ++D  QL +AA +FA+YPG + + SVKEFL+RFPLPVI NALQT  + PG ENTLV CL+R+FKTK+GASLIP +MP +QVGL+ADS  ++SLACKTV  
Subjt:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLACKTVTR

Query:  LLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSSSVASA
        LLE+ D     +VQL+++  IYPLLL+ + N +++VAN++ + IK LA FP  M +IFP+   + THL  +A+ CSSL RVRV++L+VKLFS+S  VAS 
Subjt:  LLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSSSVASA

Query:  VCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILISAIDE
        V  S LL LLE+E+  + DTLV L+VLEL YEL+E+EH ++F+P+ S +Q L SIIS  S     + RAM+ISGR LSKENI+ +V+E+ V+ LISAID 
Subjt:  VCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILISAIDE

Query:  ILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSK
         L S E  D D   +A +ALGQ+GS+  GA L+LS+ P   +HV+ +AFDR+ HGKQLAA+HAL NI GETR +++ +++  AEE+LR LIY  A++S+K
Subjt:  ILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSK

Query:  MMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQEAVRNG
        + PSGLFL+VLQQ SEIRLA YR +T LV+RPWCLVEI +K++IINIV DA+TET KI MEARYNCC AIH+AF+ S +   DP       KLQEAVR+G
Subjt:  MMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQEAVRNG

Query:  PYLSRRNLETQPAVMTAERF
        PY+S+++   +P VMT E F
Subjt:  PYLSRRNLETQPAVMTAERF

AT3G15180.2 ARM repeat superfamily protein6.2e-15853.44Show/hide
Query:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLACKTVTR
        ++D  QL +AA +FA+YPG + + SVKEFL+RFPLPVI NALQT  + PG ENTLV CL+R+FKTK+GASLIP +MP +QVGL+ADS  ++SLACKTV  
Subjt:  VDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLACKTVTR

Query:  LLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSSSVASA
        LLE+ D     +VQL+++  IYPLLL+ + N +++VAN++ + IK LA FP  M +IFP+   + THL  +A+ CSSL RVRV++L+VKLFS+S  VAS 
Subjt:  LLEESDETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSSSVASA

Query:  VCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDES-----------
        V  S LL LLE+E+  + DTLV L+VLEL YEL+E+EH ++F+P+ S +Q L SIIS  S     + RAM+ISGR LSKENI+ +V+E+           
Subjt:  VCNSNLLSLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDES-----------

Query:  ---------------------CVRILISAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIF
                             CV+ LISAID  L S E  D D   +A +ALGQ+GS+  GA L+LS+ P   +HV+ +AFDR+ HGKQLAA+HAL NI 
Subjt:  ---------------------CVRILISAIDEILGSSEGQDVDVCASAFEALGQIGSSKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIF

Query:  GETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCL
        GETR +++ +++  AEE+LR LIY  A++S+K+ PSGLFL+VLQQ SEIRLA YR +T LV+RPWCLVEI +K++IINIV DA+TET KI MEARYNCC 
Subjt:  GETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCLVEICSKQDIINIVIDASTETTKIGMEARYNCCL

Query:  AIHKAFMSSTSLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF
        AIH+AF+ S +   DP       KLQEAVR+GPY+S+++   +P VMT E F
Subjt:  AIHKAFMSSTSLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAGGAATTTGCTGTGGATGATCCGACTCAGCTCCTCGAAGCAGCTGCAGACTTCGCAAATTATCCCGGTGTTCGGACCGATGCGTCGGTGAAGGAATTTCTCAACCG
CTTCCCCCTTCCCGTCATCATCAATGCTTTACAAACGAAAGCAGAATTTCCTGGTTTGGAGAACACTTTGGTCGCATGTCTCGACAGGATATTCAAAACTAAGTTTGGTG
CTTCTCTTATACCACATTTTATGCCTTTTGTACAGGTTGGACTACGAGCAGATTCTCAAACAATTAGAAGCTTAGCTTGTAAAACGGTCACTCGCCTTTTGGAGGAGTCC
GATGAGACTGCTCAGTTGGCCGTACAACTGATTATTGACTATAACATCTATCCACTTTTGCTCGAGTGCCTTTTTAATGGTAACGAACAAGTTGCTAACTCATCAATGGA
TGCAATAAAGAAATTGGCTGCATTTCCAAAGGGGATGGAAATCATCTTCCCAACAAATAAAACGGAAGCAACACACCTCGGAACTGTAGCTTCAACATGTTCATCTCTGG
GAAGAGTTCGAGTTATGGCTTTGGTAGTGAAACTGTTTTCAGTTTCTAGCTCTGTAGCATCGGCAGTATGCAATTCAAATTTATTAAGCCTACTGGAAAGTGAAATCAAC
AACTCAAATGACACACTTGTAACTTTAAGCGTGCTGGAACTCTTGTATGAGTTAGTGGAGATCGAACATGGTACAAAGTTTTTGCCAAGGATCAGCTTTCTCCAACAACT
AAACTCTATAATCAGCAACCGATCTGCGGAGTCTATTTTAAGATCAAGAGCAATGGTCATTAGTGGAAGATTTTTGTCCAAAGAGAATATTTTCTCACTCGTAGATGAAT
CTTGTGTACGAATTTTAATATCTGCTATAGATGAAATTCTTGGGTCATCGGAAGGTCAGGATGTAGATGTATGTGCATCTGCATTTGAAGCACTGGGTCAAATAGGGTCA
AGCAAATGGGGAGCCACTTTACTGCTGTCAAGTTTTCCGACTTGTGTGAAGCATGTAATTGATGCAGCTTTTGATCGGCATGAACATGGTAAACAGCTGGCAGCTATGCA
TGCTCTTGGTAACATCTTTGGAGAAACTCGATCTGAGAATGATATTATGCTGAATGATAATGCAGAAGAAAATTTACGGGACTTGATATATCAAATTGCATCCAGAAGTT
CAAAAATGATGCCATCAGGCCTTTTTCTAGCTGTCCTTCAACAGGATTCTGAGATTCGCTTGGCGAGTTATAGAATGATTACTGGGTTGGTCTCTCGACCTTGGTGCCTT
GTGGAAATCTGCTCGAAACAAGACATAATAAATATAGTGATTGATGCAAGTACCGAGACTACAAAAATAGGAATGGAAGCAAGATATAACTGTTGTTTGGCTATCCACAA
GGCCTTCATGTCTTCAACTAGTCTTACTGGCGATCCTGCTCTTGCTGGAATAGCTTCGAAGTTGCAGGAAGCTGTAAGAAATGGTCCATATCTTAGTAGAAGGAATCTTG
AAACTCAACCAGCAGTAATGACAGCTGAAAGATTTTAG
mRNA sequenceShow/hide mRNA sequence
ATGGAGGAATTTGCTGTGGATGATCCGACTCAGCTCCTCGAAGCAGCTGCAGACTTCGCAAATTATCCCGGTGTTCGGACCGATGCGTCGGTGAAGGAATTTCTCAACCG
CTTCCCCCTTCCCGTCATCATCAATGCTTTACAAACGAAAGCAGAATTTCCTGGTTTGGAGAACACTTTGGTCGCATGTCTCGACAGGATATTCAAAACTAAGTTTGGTG
CTTCTCTTATACCACATTTTATGCCTTTTGTACAGGTTGGACTACGAGCAGATTCTCAAACAATTAGAAGCTTAGCTTGTAAAACGGTCACTCGCCTTTTGGAGGAGTCC
GATGAGACTGCTCAGTTGGCCGTACAACTGATTATTGACTATAACATCTATCCACTTTTGCTCGAGTGCCTTTTTAATGGTAACGAACAAGTTGCTAACTCATCAATGGA
TGCAATAAAGAAATTGGCTGCATTTCCAAAGGGGATGGAAATCATCTTCCCAACAAATAAAACGGAAGCAACACACCTCGGAACTGTAGCTTCAACATGTTCATCTCTGG
GAAGAGTTCGAGTTATGGCTTTGGTAGTGAAACTGTTTTCAGTTTCTAGCTCTGTAGCATCGGCAGTATGCAATTCAAATTTATTAAGCCTACTGGAAAGTGAAATCAAC
AACTCAAATGACACACTTGTAACTTTAAGCGTGCTGGAACTCTTGTATGAGTTAGTGGAGATCGAACATGGTACAAAGTTTTTGCCAAGGATCAGCTTTCTCCAACAACT
AAACTCTATAATCAGCAACCGATCTGCGGAGTCTATTTTAAGATCAAGAGCAATGGTCATTAGTGGAAGATTTTTGTCCAAAGAGAATATTTTCTCACTCGTAGATGAAT
CTTGTGTACGAATTTTAATATCTGCTATAGATGAAATTCTTGGGTCATCGGAAGGTCAGGATGTAGATGTATGTGCATCTGCATTTGAAGCACTGGGTCAAATAGGGTCA
AGCAAATGGGGAGCCACTTTACTGCTGTCAAGTTTTCCGACTTGTGTGAAGCATGTAATTGATGCAGCTTTTGATCGGCATGAACATGGTAAACAGCTGGCAGCTATGCA
TGCTCTTGGTAACATCTTTGGAGAAACTCGATCTGAGAATGATATTATGCTGAATGATAATGCAGAAGAAAATTTACGGGACTTGATATATCAAATTGCATCCAGAAGTT
CAAAAATGATGCCATCAGGCCTTTTTCTAGCTGTCCTTCAACAGGATTCTGAGATTCGCTTGGCGAGTTATAGAATGATTACTGGGTTGGTCTCTCGACCTTGGTGCCTT
GTGGAAATCTGCTCGAAACAAGACATAATAAATATAGTGATTGATGCAAGTACCGAGACTACAAAAATAGGAATGGAAGCAAGATATAACTGTTGTTTGGCTATCCACAA
GGCCTTCATGTCTTCAACTAGTCTTACTGGCGATCCTGCTCTTGCTGGAATAGCTTCGAAGTTGCAGGAAGCTGTAAGAAATGGTCCATATCTTAGTAGAAGGAATCTTG
AAACTCAACCAGCAGTAATGACAGCTGAAAGATTTTAG
Protein sequenceShow/hide protein sequence
MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFLNRFPLPVIINALQTKAEFPGLENTLVACLDRIFKTKFGASLIPHFMPFVQVGLRADSQTIRSLACKTVTRLLEES
DETAQLAVQLIIDYNIYPLLLECLFNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTCSSLGRVRVMALVVKLFSVSSSVASAVCNSNLLSLLESEIN
NSNDTLVTLSVLELLYELVEIEHGTKFLPRISFLQQLNSIISNRSAESILRSRAMVISGRFLSKENIFSLVDESCVRILISAIDEILGSSEGQDVDVCASAFEALGQIGS
SKWGATLLLSSFPTCVKHVIDAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQIASRSSKMMPSGLFLAVLQQDSEIRLASYRMITGLVSRPWCL
VEICSKQDIINIVIDASTETTKIGMEARYNCCLAIHKAFMSSTSLTGDPALAGIASKLQEAVRNGPYLSRRNLETQPAVMTAERF