CuGenDBv2

Gene ID	CmaCh09G001020
Organism	Cucurbita maxima Rimu (Cucurbita maxima (Rimu) v1.1)
Description	AP complex subunit sigma
Genome location	Cma_Chr09:452012..455376
RNA-Seq Expression	CmaCh09G001020
Synteny	CmaCh09G001020
Gene Ontology terms	GO:0005975 - carbohydrate metabolic process (biological process) GO:0006886 - intracellular protein transport (biological process) GO:0016310 - phosphorylation (biological process) GO:0072583 - clathrin-dependent endocytosis (biological process) GO:0030122 - AP-2 adaptor complex (cellular component) GO:0016301 - kinase activity (molecular function) GO:0016773 - phosphotransferase activity, alcohol group as acceptor (molecular function) GO:0035615 - clathrin adaptor activity (molecular function) GO:0036094 - small molecule binding (molecular function)
InterPro domains	IPR011012 - Longin-like domain superfamily IPR016635 - Adaptor protein complex, sigma subunit IPR022775 - AP complex, mu/sigma subunit

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6591267.1 AP-2 complex subunit sigma, partial [Cucurbita argyrosperma subsp. sororia]

1.6e-90

50.43

Show/hide

Query:  MIRFILLQNRQGKTRLAKYYVPLEESEKHKVEYEIGS--IAKPLPLPLLLLSRVCNSDLNSLFSVLLPPHRFASSDPPFSPLDFGFLAISSSPVFSVGIV
        MIRFILLQNRQGKTRLAKYYVPLEES+KHKVE++I    + +       +LS   NS L+S+  + L  + +  + P  SP  F                
Subjt:  MIRFILLQNRQGKTRLAKYYVPLEESEKHKVEYEIGS--IAKPLPLPLLLLSRVCNSDLNSLFSVLLPPHRFASSDPPFSPLDFGFLAISSSPVFSVGIV

Query:  HNIISSDANVLFVDSVWRFSLVPRFQVSIGIWDCLRSLSHESTTDALCLKRGSEGFFNTWRMVFEGGLESVLFFQLNRIGEMRLQTRPVNKK--TSLPAP
                         R  L P+F +                   LC+   S           +  L   +   LN            N K  ++L AP
Subjt:  HNIISSDANVLFVDSVWRFSLVPRFQVSIGIWDCLRSLSHESTTDALCLKRGSEGFFNTWRMVFEGGLESVLFFQLNRIGEMRLQTRPVNKK--TSLPAP

Query:  FCFGIVCSSAFTFISTQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEWSGGLFILVILKG--KTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIY
        +      S     + +    +F   V R              L HF +  G      +L         K+KVECEVHRLVVNSDPNF+  VEFRTHKVIY
Subjt:  FCFGIVCSSAFTFISTQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEWSGGLFILVILKG--KTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIY

Query:  RQYAGLFFSICVDKTDNYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAG
        RQYAGLFFS+CV +TDNYLESVRLFVE+LD FFS+VYLILDEFILAGKLQETSKKAPQN LEPSA DIRLYEDHV Q  V+SLIDMEM LRTSKTKLLAG
Subjt:  RQYAGLFFSICVDKTDNYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAG

Query:  IDLIRRLKVSALETENESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVI
        IDLIR+LKVSALETEN S+LKSKRSELEFRCQM EN+LGIL+KLKSS   SNEKWKDGV+
Subjt:  IDLIRRLKVSALETENESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVI

KAG7024150.1 AP-2 complex subunit sigma, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.4e-65

80.45

Show/hide

Query:  RTHKVIYRQYAGLFFSICVDKTDNYLESVRLFVEVLDQFFSN------------VYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVE
        RTHKVIYRQYAGLFFS+CV +TDNYLESVRLFVE+LD FFS+            VYLILDEFILAGKLQETSKKAPQN LEPSA DIRLYEDHV Q  V+
Subjt:  RTHKVIYRQYAGLFFSICVDKTDNYLESVRLFVEVLDQFFSN------------VYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVE

Query:  SLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETENESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVI
        SLIDMEM LRTSKTKLLAGIDLIR+ KVSALETEN S+LKSKRSELEFRCQM EN+LGILEKLKSS   SNEKWKDGV+
Subjt:  SLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETENESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVI

XP_015969838.1 AP-2 complex subunit sigma isoform X2 [Arachis duranensis]

7.5e-32

73.15

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNVYLILDEFILAGK
        +GKTRLAKY          KVE EVHRLVVN DP + N VEFRTHKVIYR+YAGLFFS+CVD TDN   YLE + LFVE+LD FFSNVYLILDEFILAG+
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNVYLILDEFILAGK

Query:  LQETSKKA
        LQETSKKA
Subjt:  LQETSKKA

XP_022937104.1 AP-2 complex subunit sigma isoform X1 [Cucurbita moschata]

2.0e-64

74.61

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V
        +GKTRLAKY          KVE EVHRLVVN DP F N VEFRTHKVIYR+YAGLFFS+CVD TDN   YLE + LFVE+LD FFSN            V
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V

Query:  YLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETENESKLKSKRSELEF
        YLILDEFILAGKLQETSKKAPQNQLEPSA DIRLYEDHV QVKV+SLIDMEM LRTSKTKLLAGIDLIRRLKVSALE ENE+KLKSKRS  ++
Subjt:  YLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETENESKLKSKRSELEF

XP_022975655.1 uncharacterized protein LOC111475461 [Cucurbita maxima]

1.6e-135

95.77

Show/hide

Query:  STQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEWSGGLFILVILKGKTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTD
        STQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEW          +GKTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTD
Subjt:  STQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEWSGGLFILVILKGKTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTD

Query:  NYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETEN
        NYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETEN
Subjt:  NYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETEN

Query:  ESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVIEAPVRRLSWTLIYYKP
        ESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVIEAPVRRLSWTLIYYKP
Subjt:  ESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVIEAPVRRLSWTLIYYKP

TrEMBL top hits

e value

%identity

Alignment

A0A1R3IXZ7 Phosphotransferase

5.3e-31

61.7

Show/hide

Query:  LRHFKEWSG-GLFILVIL---KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVE
        + H K+ SG G  +L      +GKTRLAKY          KVE EVHRLVVN DP F N VEFRTHKVIYR+YAGLFFS+CVD TDN   YLES+ LFVE
Subjt:  LRHFKEWSG-GLFILVIL---KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVE

Query:  VLDQFFSN------------VYLILDEFILAGKLQETSKKA
        +LD FFSN            VYLILDEFILAG+LQETSKKA
Subjt:  VLDQFFSN------------VYLILDEFILAGKLQETSKKA

A0A6J1FA77 AP-2 complex subunit sigma isoform X1

9.5e-65

74.61

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V
        +GKTRLAKY          KVE EVHRLVVN DP F N VEFRTHKVIYR+YAGLFFS+CVD TDN   YLE + LFVE+LD FFSN            V
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V

Query:  YLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETENESKLKSKRSELEF
        YLILDEFILAGKLQETSKKAPQNQLEPSA DIRLYEDHV QVKV+SLIDMEM LRTSKTKLLAGIDLIRRLKVSALE ENE+KLKSKRS  ++
Subjt:  YLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETENESKLKSKRSELEF

A0A6J1IHB5 uncharacterized protein LOC111475461

7.9e-136

95.77

Show/hide

Query:  STQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEWSGGLFILVILKGKTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTD
        STQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEW          +GKTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTD
Subjt:  STQTLKTFQHFVHRIQPPIINWIWIRRSLRHFKEWSGGLFILVILKGKTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTD

Query:  NYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETEN
        NYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETEN
Subjt:  NYLESVRLFVEVLDQFFSNVYLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETEN

Query:  ESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVIEAPVRRLSWTLIYYKP
        ESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVIEAPVRRLSWTLIYYKP
Subjt:  ESKLKSKRSELEFRCQMVENVLGILEKLKSSGNDSNEKWKDGVIEAPVRRLSWTLIYYKP

A0A6P4DRG5 AP complex subunit sigma

3.6e-32

73.15

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNVYLILDEFILAGK
        +GKTRLAKY          KVE EVHRLVVN DP + N VEFRTHKVIYR+YAGLFFS+CVD TDN   YLE + LFVE+LD FFSNVYLILDEFILAG+
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNVYLILDEFILAGK

Query:  LQETSKKA
        LQETSKKA
Subjt:  LQETSKKA

M8B540 AP complex subunit sigma

1.5e-30

66.13

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V
        +GKTRLAKY          KVE EVHRLVVN DP F N VEFRTHKVIYR+YAGLFFSICVD TDN   YLE + LFVE+LD FFSN            V
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V

Query:  YLILDEFILAGKLQETSKKAPQNQ
        YLILDEFILAG+LQETSKK  Q Q
Subjt:  YLILDEFILAGKLQETSKKAPQNQ

SwissProt top hits

e value

%identity

Alignment

O50016 AP-2 complex subunit sigma

1.3e-31

65.29

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNV------------
        +GKTRLAKY          KVE EVHRLVVN DP F N VEFRTHKVIYR+YAGLFFSICVD TDN   YLE + LFVE+LD FFSNV            
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNV------------

Query:  --YLILDEFILAGKLQETSKK
          YLILDEFILAG+LQETSK+
Subjt:  --YLILDEFILAGKLQETSKK

Q4WS49 AP-2 complex subunit sigma

6.2e-21

49.63

Show/hide

Query:  FILV-ILKGKTRLAKY----------KVECEVHRLVVNSDPNFR-NSVEF-RTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN----
        FILV   +GKTRLAK+          K++ EVHRLV   D  ++ N VEF R+ K++YR+YAGLFF +CVD TDN   YLE++  FVEVLDQFF N    
Subjt:  FILV-ILKGKTRLAKY----------KVECEVHRLVVNSDPNFR-NSVEF-RTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN----

Query:  --------VYLILDEFILAGKLQETSKKAPQNQLE
                VY ILDE  LAG+++ETSK+    +LE
Subjt:  --------VYLILDEFILAGKLQETSKKAPQNQLE

Q54H39 AP-2 complex subunit sigma

6.2e-21

45.24

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V
        +GKTRL+K+          K+  E+H++V + +  F N VEFRTH+++YR+YAGLFFS+CVD TDN    LE++ LFVEVLD +F N            V
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V

Query:  YLILDEFILAGKLQETSKKAPQNQLE
        Y I+DE  LAG+L E SK     ++E
Subjt:  YLILDEFILAGKLQETSKKAPQNQLE

Q7SAQ1 AP-2 complex subunit sigma

9.6e-22

48.82

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFR-NSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------
        +GKTRLAK+          K++ E+HRLV   D  ++ N VEFR HKV+YR+YAGLFF  CVD  DN   YLE++  FVEVLD FF N            
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFR-NSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------

Query:  VYLILDEFILAGKLQETSKKAPQNQLE
        VY ILDE  LAG+++ETSK+    +LE
Subjt:  VYLILDEFILAGKLQETSKKAPQNQLE

Q84WL9 AP-2 complex subunit sigma

7.8e-32

65.83

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V
        +GKTRLAKY          KVE EVHRLVVN D  F N VEFRTHKVIYR+YAGLFFS+CVD TDN   YLES+ LFVE+LD FFSN            V
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V

Query:  YLILDEFILAGKLQETSKKA
        YLILDEFILAG+LQETSK+A
Subjt:  YLILDEFILAGKLQETSKKA

Arabidopsis top hits

e value

%identity

Alignment

AT1G47830.1 SNARE-like superfamily protein

5.6e-33

65.83

Show/hide

Query:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V
        +GKTRLAKY          KVE EVHRLVVN D  F N VEFRTHKVIYR+YAGLFFS+CVD TDN   YLES+ LFVE+LD FFSN            V
Subjt:  KGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSN------------V

Query:  YLILDEFILAGKLQETSKKA
        YLILDEFILAG+LQETSK+A
Subjt:  YLILDEFILAGKLQETSKKA

AT2G17380.1 associated protein 19

2.8e-16

37.9

Show/hide

Query:  ILVILKGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDNYLESVRL---FVEVLDQFFSNV-------
        +LV  +GK RL K+          KV  E+  +++N  P   N +E+R +KV+Y++YA L+F +C+D+ DN LE + +   +VE+LD++F +V       
Subjt:  ILVILKGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDNYLESVRL---FVEVLDQFFSNV-------

Query:  -----YLILDEFILAGKLQETSKK
             Y ILDE ++AG+LQE+SKK
Subjt:  -----YLILDEFILAGKLQETSKK

AT2G19790.1 SNARE-like superfamily protein

1.5e-09

34.4

Show/hide

Query:  FILVILK-GKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNV-----
        FIL++ K G+TRLA+Y           +E E+ R  +  +    + VE R +K++YR+YA LFF + VD  +N    LE + L VE +D+ F NV     
Subjt:  FILVILK-GKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDN---YLESVRLFVEVLDQFFSNV-----

Query:  -------YLILDEFILAGKLQETSK
               + +L+E ++ G + ETSK
Subjt:  -------YLILDEFILAGKLQETSK

AT4G35410.1 Clathrin adaptor complex small chain family protein

6.0e-11

37.63

Show/hide

Query:  ILVILKGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDNYLESVRL---FVEVLDQFFSNV
        +LV  +GK RL K+          KV  E+  +++N  P   N VE+R +KV+Y++YA L+F +C+D+ DN LE + +   +VE+LD++F +V
Subjt:  ILVILKGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDNYLESVRL---FVEVLDQFFSNV

AT4G35410.2 Clathrin adaptor complex small chain family protein

2.8e-16

38.71

Show/hide

Query:  ILVILKGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDNYLESVRL---FVEVLDQFFSNV-------
        +LV  +GK RL K+          KV  E+  +++N  P   N VE+R +KV+Y++YA L+F +C+D+ DN LE + +   +VE+LD++F +V       
Subjt:  ILVILKGKTRLAKY----------KVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDNYLESVRL---FVEVLDQFFSNV-------

Query:  -----YLILDEFILAGKLQETSKK
             Y ILDE ++AG+LQE+SKK
Subjt:  -----YLILDEFILAGKLQETSKK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATCCGATTCATACTTTTGCAAAATAGGCAGGGCAAGACCCGTCTGGCTAAGTATTACGTTCCTCTCGAGGAATCCGAAAAGCACAAGGTCGAGTACGAGATTGGTAG
TATTGCCAAACCACTCCCTCTTCCTCTCCTACTTCTTTCTCGCGTCTGCAACTCAGACCTAAATTCCCTCTTCTCTGTATTGCTACCACCTCACAGGTTTGCTTCTTCAG
ATCCCCCTTTTTCCCCTCTCGATTTCGGGTTTCTTGCAATTTCTTCCTCCCCAGTTTTTAGTGTTGGGATTGTGCATAATATTATCAGTTCCGATGCGAATGTTTTGTTT
GTTGATTCAGTCTGGAGGTTTTCGTTGGTACCTCGATTCCAAGTGTCAATTGGGATTTGGGATTGTCTGAGATCTCTTAGTCATGAGTCCACGACCGATGCCCTGTGCTT
GAAGAGAGGATCGGAAGGGTTTTTCAACACATGGAGGATGGTTTTTGAAGGAGGTCTGGAGAGCGTCTTATTCTTCCAATTGAATAGGATTGGAGAAATGAGATTGCAAA
CACGCCCAGTCAACAAAAAGACAAGCTTGCCTGCCCCTTTTTGTTTTGGAATCGTTTGCTCATCTGCATTCACATTCATCTCAACACAAACTTTAAAGACATTTCAGCAC
TTTGTGCACCGAATTCAGCCTCCGATAATCAATTGGATTTGGATTCGTCGATCCCTTCGTCATTTTAAAGAATGGTCTGGCGGCCTTTTCATTTTGGTGATCTTAAAGGG
CAAGACCCGTCTGGCGAAGTATAAGGTCGAGTGCGAGGTTCATCGATTGGTGGTGAATAGTGATCCCAATTTCAGAAATTCTGTTGAGTTCCGAACACACAAGGTCATCT
ACAGACAATATGCAGGATTATTTTTCTCCATTTGTGTGGACAAAACAGACAACTATCTTGAGAGTGTTCGTCTGTTTGTGGAGGTTCTGGATCAATTTTTCAGCAATGTC
TATCTGATACTTGATGAATTTATTCTTGCTGGAAAACTCCAAGAAACGAGCAAAAAGGCGCCACAAAATCAGCTCGAACCAAGCGCCACAGATATTCGTTTATATGAAGA
TCATGTTTGTCAGGTAAAGGTTGAGTCGCTGATAGATATGGAGATGCCACTTCGAACCTCGAAAACAAAACTGCTAGCTGGAATAGATCTGATCCGCCGACTGAAGGTAT
CTGCACTGGAGACCGAGAATGAGAGTAAATTGAAGAGCAAGCGGTCGGAGCTTGAATTTAGGTGCCAAATGGTAGAGAATGTACTGGGCATATTGGAAAAATTAAAAAGC
TCCGGCAATGACAGCAATGAGAAGTGGAAGGATGGTGTCATTGAGGCCCCTGTGCGTAGACTTTCCTGGACTCTGATATATTATAAACCCTAA

mRNA sequence

Show/hide mRNA sequence

TAATCAACGCAACTTTTTGCACAGAATTCGGCCTCCGACAATCAACGCAACTCTGTGCACCAAAATTCGTCCTCCGATAATCAACGCAACTTTGTGCACCAAAATTCGGC
CTCCGACAATCAATTGGAGTTGGATTCGTCGATCTTCCTTCGTCATTTTCAAGAATGATCCGATTCATACTTTTGCAAAATAGGCAGGGCAAGACCCGTCTGGCTAAGTA
TTACGTTCCTCTCGAGGAATCCGAAAAGCACAAGGTCGAGTACGAGATTGGTAGTATTGCCAAACCACTCCCTCTTCCTCTCCTACTTCTTTCTCGCGTCTGCAACTCAG
ACCTAAATTCCCTCTTCTCTGTATTGCTACCACCTCACAGGTTTGCTTCTTCAGATCCCCCTTTTTCCCCTCTCGATTTCGGGTTTCTTGCAATTTCTTCCTCCCCAGTT
TTTAGTGTTGGGATTGTGCATAATATTATCAGTTCCGATGCGAATGTTTTGTTTGTTGATTCAGTCTGGAGGTTTTCGTTGGTACCTCGATTCCAAGTGTCAATTGGGAT
TTGGGATTGTCTGAGATCTCTTAGTCATGAGTCCACGACCGATGCCCTGTGCTTGAAGAGAGGATCGGAAGGGTTTTTCAACACATGGAGGATGGTTTTTGAAGGAGGTC
TGGAGAGCGTCTTATTCTTCCAATTGAATAGGATTGGAGAAATGAGATTGCAAACACGCCCAGTCAACAAAAAGACAAGCTTGCCTGCCCCTTTTTGTTTTGGAATCGTT
TGCTCATCTGCATTCACATTCATCTCAACACAAACTTTAAAGACATTTCAGCACTTTGTGCACCGAATTCAGCCTCCGATAATCAATTGGATTTGGATTCGTCGATCCCT
TCGTCATTTTAAAGAATGGTCTGGCGGCCTTTTCATTTTGGTGATCTTAAAGGGCAAGACCCGTCTGGCGAAGTATAAGGTCGAGTGCGAGGTTCATCGATTGGTGGTGA
ATAGTGATCCCAATTTCAGAAATTCTGTTGAGTTCCGAACACACAAGGTCATCTACAGACAATATGCAGGATTATTTTTCTCCATTTGTGTGGACAAAACAGACAACTAT
CTTGAGAGTGTTCGTCTGTTTGTGGAGGTTCTGGATCAATTTTTCAGCAATGTCTATCTGATACTTGATGAATTTATTCTTGCTGGAAAACTCCAAGAAACGAGCAAAAA
GGCGCCACAAAATCAGCTCGAACCAAGCGCCACAGATATTCGTTTATATGAAGATCATGTTTGTCAGGTAAAGGTTGAGTCGCTGATAGATATGGAGATGCCACTTCGAA
CCTCGAAAACAAAACTGCTAGCTGGAATAGATCTGATCCGCCGACTGAAGGTATCTGCACTGGAGACCGAGAATGAGAGTAAATTGAAGAGCAAGCGGTCGGAGCTTGAA
TTTAGGTGCCAAATGGTAGAGAATGTACTGGGCATATTGGAAAAATTAAAAAGCTCCGGCAATGACAGCAATGAGAAGTGGAAGGATGGTGTCATTGAGGCCCCTGTGCG
TAGACTTTCCTGGACTCTGATATATTATAAACCCTAA

Protein sequence

Show/hide protein sequence

MIRFILLQNRQGKTRLAKYYVPLEESEKHKVEYEIGSIAKPLPLPLLLLSRVCNSDLNSLFSVLLPPHRFASSDPPFSPLDFGFLAISSSPVFSVGIVHNIISSDANVLF
VDSVWRFSLVPRFQVSIGIWDCLRSLSHESTTDALCLKRGSEGFFNTWRMVFEGGLESVLFFQLNRIGEMRLQTRPVNKKTSLPAPFCFGIVCSSAFTFISTQTLKTFQH
FVHRIQPPIINWIWIRRSLRHFKEWSGGLFILVILKGKTRLAKYKVECEVHRLVVNSDPNFRNSVEFRTHKVIYRQYAGLFFSICVDKTDNYLESVRLFVEVLDQFFSNV
YLILDEFILAGKLQETSKKAPQNQLEPSATDIRLYEDHVCQVKVESLIDMEMPLRTSKTKLLAGIDLIRRLKVSALETENESKLKSKRSELEFRCQMVENVLGILEKLKS
SGNDSNEKWKDGVIEAPVRRLSWTLIYYKP

CmaCh09G001020 (gene) of Cucurbita maxima (Rimu) v1.1 genome