CuGenDBv2

Gene ID	Sed0012653
Organism	Sechium edule (Chayote v1)
Description	ULP_PROTEASE domain-containing protein
Genome location	LG03:17188932..17199713
RNA-Seq Expression	Sed0012653
Synteny	Sed0012653
Gene Ontology terms	GO:0110165 - cellular anatomical structure (cellular component)
InterPro domains	IPR038765 - Papain-like cysteine peptidase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8649224.1 hypothetical protein Csa_014966 [Cucumis sativus]

1.8e-30

34.77

Show/hide

Query:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK
        +PC LA+      V IG M+ES      +H   LG  N+RV+VD+I    EDV LPIP+  E++ L Q I +FV WPR L+     T++   P  A +  
Subjt:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK

Query:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE
           S  ++    T     +K+++ YA   +   D++ I +  ++ G +  +  Y+  ++I+QYC M EIGY+ IL YI  LW+ CD E    ++LVD + 
Subjt:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE

Query:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV
         ++ + S  +E+R   L +RL+ + +L Q V  P+N+G  HWI +V+   EN +YV
Subjt:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV

XP_008451868.1 PREDICTED: uncharacterized protein LOC103493028 isoform X1 [Cucumis melo]

2.1e-31

33.59

Show/hide

Query:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK
        +PC LA+      V +G M+ES      +H   LG  N+RV+VD+     EDV LPIP+  +++ L Q I +FV WPR L+     TK+   P    S  
Subjt:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK

Query:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE
           S  ++    T     +K+++ YA   +  +D++ I ++ ++ G +  +  Y+ +++I+QYC M EIGY+ IL YI  LW+ C+ E    ++LVD + 
Subjt:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE

Query:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV
         ++ + S  +E+R   L NRL+ + +L Q V  P+N+G  HWI +++   EN +YV
Subjt:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV

XP_031740251.1 uncharacterized protein LOC101213947 [Cucumis sativus]

1.8e-30

34.77

Show/hide

Query:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK
        +PC LA+      V IG M+ES      +H   LG  N+RV+VD+I    EDV LPIP+  E++ L Q I +FV WPR L+     T++   P  A +  
Subjt:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK

Query:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE
           S  ++    T     +K+++ YA   +   D++ I +  ++ G +  +  Y+  ++I+QYC M EIGY+ IL YI  LW+ CD E    ++LVD + 
Subjt:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE

Query:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV
         ++ + S  +E+R   L +RL+ + +L Q V  P+N+G  HWI +V+   EN +YV
Subjt:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV

XP_038895921.1 uncharacterized protein LOC120084092 isoform X1 [Benincasa hispida]

2.5e-32

35.16

Show/hide

Query:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK
        +PC LA+      V +GTM+ES      ++   LG  NVR  VD++    EDV LPIP  ++++ L Q I +FV WPR L+    TTK+   P   T+SK
Subjt:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK

Query:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE
         +   S    ++      +K+++ YA   +  DD++ I ++  +LG +  +  Y+ +++I+QYC M EIGY+ IL YI  LW+ CD E    +++VD  +
Subjt:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE

Query:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV
         T +     +E R   L NRL+ +  L Q V  P+N+G+ HWI +++   EN +YV
Subjt:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV

XP_038895930.1 uncharacterized protein LOC120084092 isoform X2 [Benincasa hispida]

2.9e-33

35.29

Show/hide

Query:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK
        +PC LA+      V +GTM+ES      ++   LG  NVR  VD++    EDV LPIP  ++++ L Q I +FV WPR L+    TTK+   P   T+SK
Subjt:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK

Query:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE
         +   S    ++      +K+++ YA   +  DD++ I ++  +LG +  +  Y+ +++I+QYC M EIGY+ IL YI  LW+ CD E    +++VD  +
Subjt:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE

Query:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV
         T +     +E R   L NRL+ +  L Q V  P+N+G HWI +++   EN +YV
Subjt:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BRX5 uncharacterized protein LOC103493028 isoform X1

1.0e-31

33.59

Show/hide

Query:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK
        +PC LA+      V +G M+ES      +H   LG  N+RV+VD+     EDV LPIP+  +++ L Q I +FV WPR L+     TK+   P    S  
Subjt:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK

Query:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE
           S  ++    T     +K+++ YA   +  +D++ I ++ ++ G +  +  Y+ +++I+QYC M EIGY+ IL YI  LW+ C+ E    ++LVD + 
Subjt:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE

Query:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV
         ++ + S  +E+R   L NRL+ + +L Q V  P+N+G  HWI +++   EN +YV
Subjt:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV

A0A5D3CYL9 ULP_PROTEASE domain-containing protein

1.0e-31

33.59

Show/hide

Query:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK
        +PC LA+      V +G M+ES      +H   LG  N+RV+VD+     EDV LPIP+  +++ L Q I +FV WPR L+     TK+   P    S  
Subjt:  MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSK

Query:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE
           S  ++    T     +K+++ YA   +  +D++ I ++ ++ G +  +  Y+ +++I+QYC M EIGY+ IL YI  LW+ C+ E    ++LVD + 
Subjt:  KVVSDSHSHQLNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSE

Query:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV
         ++ + S  +E+R   L NRL+ + +L Q V  P+N+G  HWI +++   EN +YV
Subjt:  FTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGN-HWIFLVLIPAENTLYV

A0A6J1C2H7 uncharacterized protein LOC111007859 isoform X1

1.6e-29

32.69

Show/hide

Query:  PCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSKK
        PC LAVE     V +GT+++++     VH   LG  NVRV VD++ +  E   +PIP+  E++ L Q I  FV WPR L+                S +K
Subjt:  PCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSKK

Query:  VVSDSHSHQLNTY------GPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLL
         +S S + Q  T           +K+++ Y    +  +D + I +++++ G +  +  Y+ + +I+QYC M EIGY+ IL YI YLW   + E    +L+
Subjt:  VVSDSHSHQLNTY------GPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLL

Query:  VDGSEFTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV
        VD +  +  + S  +E R   LANRL+ + +L+Q V  P+ SG HW+ +++   EN +YV
Subjt:  VDGSEFTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV

A0A6J1C2V2 uncharacterized protein LOC111007859 isoform X4

1.6e-29

32.69

Show/hide

Query:  PCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSKK
        PC LAVE     V +GT+++++     VH   LG  NVRV VD++ +  E   +PIP+  E++ L Q I  FV WPR L+                S +K
Subjt:  PCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSKK

Query:  VVSDSHSHQLNTY------GPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLL
         +S S + Q  T           +K+++ Y    +  +D + I +++++ G +  +  Y+ + +I+QYC M EIGY+ IL YI YLW   + E    +L+
Subjt:  VVSDSHSHQLNTY------GPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLL

Query:  VDGSEFTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV
        VD +  +  + S  +E R   LANRL+ + +L+Q V  P+ SG HW+ +++   EN +YV
Subjt:  VDGSEFTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV

A0A6J1C4J7 uncharacterized protein LOC111007859 isoform X2

1.6e-29

32.69

Show/hide

Query:  PCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSKK
        PC LAVE     V +GT+++++     VH   LG  NVRV VD++ +  E   +PIP+  E++ L Q I  FV WPR L+                S +K
Subjt:  PCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSKK

Query:  VVSDSHSHQLNTY------GPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLL
         +S S + Q  T           +K+++ Y    +  +D + I +++++ G +  +  Y+ + +I+QYC M EIGY+ IL YI YLW   + E    +L+
Subjt:  VVSDSHSHQLNTY------GPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLL

Query:  VDGSEFTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV
        VD +  +  + S  +E R   LANRL+ + +L+Q V  P+ SG HW+ +++   EN +YV
Subjt:  VDGSEFTTALDSTNEEDRVSCLANRLDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCATGTCAACTTGCCGTTGAGTATGAAGGTCAAACTGTTGTCATTGGTACCATGTATGAATCGAGTGGCTCATCTGTTAGGGTACATAGACACCTTTTAGGGAAACA
TAATGTGCGGGTCTCGGTCGATTTGATCTTCGAAGGCAATGAAGACGTAGATCTACCTATTCCCATAAACGAGGAACTTCAGTACCTTGGACAAGTTATAAAATCTTTTG
TGCCATGGCCAAGATCATTGATCAGAACACCTACAACAACCAAGAAGCACTATGGACCAATAAAAGCTACAAGCAGTAAGAAGGTGGTATCAGATTCACACTCTCATCAA
TTGAACACGTATGGTCCAACCATGGTCAAGGTTGTACATAATTATGCAAGAGATAAACTGGGTCCTGATGACTTACTAGGTATACCAATGGCAAGAAACATGTTAGGTGT
TGACGCGCCCGAATATTTTTATATTGCTCAAGAAGAGATTCTACAATATTGTAATATGGAAGAAATAGGCTACACTCCAATACTCTATTACATCTGTTACTTATGGTCTA
CTTGTGATCAAGAGACACTGGGCAATTACTTATTAGTGGACGGTAGCGAGTTCACAACGGCTTTGGATAGCACAAATGAAGAAGATCGAGTTTCATGTCTAGCTAATAGG
TTAGACAAGCTGACACATCTTAAACAACGAGTATTCTTTCCCTTCAATTCTGGGAACCACTGGATTTTTCTTGTCCTAATTCCAGCTGAAAACACATTGTATGTTTTCAC
TCACTCTGTCAAAATCCGTTGA

mRNA sequence

Show/hide mRNA sequence

CTCTCTCTCAATAGTCTTTCCCCTTTTCTCTCTACTTTTCTTTCTCCAACGATAAAACCCTCTTTGCTGCTCTATTTTACCACTAATTTCTCACCACCCTCTTCTATTTC
ACTTGACCTAAATACTTTAGAAACCTCATTGTCGAGAAAATAAAGAAAATCGTAGTTCGAATTGTCAACAATCGTTGTCATTATACTCGACGAAGTCCTTGGATTGTCAA
TTTCGTACCTCTTCTTCTTCTACGTCTATTCTCTCTTATGATTCTTGTTATTATTTCTTCTTTTTAATGCCTAAAATTTAATTGGAACACAATTTTGCCTAATTTACTCT
TTTGAGTTTCATATTTGAGAACGTCATGGACCTCAGATTTTGTTTCCCTTTTCATTTTTGTTGGACATAAGAAAAACATATTATTGTTGTATGTATTTTTTTACTTCTGT
GTTTCAGTAGTAGAATTACATGAATAAGTGGCGGGCTAGAATCGAGAATTTTAAAAAACGCGGAGGGAATTATTGATGGCGGGCCATGACCGCCATTGAAAAATGCGTGT
TTTGAGTTTTGGTGGCGGTCCGTGCCCGCTGTCCATTCATTTAGGTGGCGGGCCGTGCCCGCCTTTGTATATAGCGTGTTATTAATTTCGGTGGCGGGTCGTGCCCGCCA
TCAATAATTTGTGCATTTTCGTCTTCACAACTGGACAGTGTCCTCATTTCAACATTTCCTCATTTCCTCCGCCAAGTGACCAAACCCTTTCGACCCAAAACCCATCTCCA
TCGCCGGCGCCGCTAGTTCTTCGACAAAACTTCTCCATTGTCATTAGTGGGTCGAAAAACCATCTTCGCCGCCGCCATTAACCTCCGGTTTTCATTTCTTCCTCTCCGCC
GCCGCTAGGTTTTGGCATTTCTCCACCTTTTGGGCATTATTTCTTCACAAACTTGAACTTGTTGATGCAAAACTGTGTCCTACCTGTGGAACATCGAGATGGAAGTTCAG
AAGAATATGAAAGAAGGCGGGTAGCGATGATGATGATGATGTTCCCATGAGCGGATGTGCTCGAAGCAGAAATACTAGAGGCGTGATAGTCTTGCGTGAGCTTGCTCAAG
AAAGGATGGCTGGAGAACGACGCACTCTTAGTATAATTCCATGGGTCAAGATGTGGGTGAAGCTTAAAAAAAGTTTCGTAGTTTTATTGGTGTATGTGTTAGAACACATA
TACCTATTATGTACGATTCTTGGAAAACTGTCCCTGAGCAACTAAAAGAGAAGATTTGGGATTCTATAGAGATGTCGTTTGAGATGGATCCAATGTCGAAACATAATGTT
ATGTTATCTATGTCCACCGCATTTAGGACGTTTAGATACAATCTGAACAGAAAATACATCCAGCCATTTCTGGACCAACCTGAGATATTAAGATCTCCACCCGTTAAATA
CTCTTTCATCACACAAGAGCAATGAGATTATTTTGTGAATGTCCGATTTTCAGAAGAATTTATGAGAATTAGTGCAGAGAAAAAAGAGTTGCAAGCTAAACAAAAGTGTC
ATCATCATATGGCTAGAAAGGGATATGGTCAACTGGCTCATAAACTAGCCGATTAGAACTGTGGAAAGAAGGTCGAAAGAAGAAGTCTAACGATCCAAAGAGGAAGAGTA
AAAAGTTCGTCGACGAAGACACAATTCAAACAGCCAACCAAATTATAAGTTGTTGGTTCATTTCTTTTGCCAAAAGATAACTTGAATCTTAAAATCTTTGGTTGTGAATG
TAAAAATCTTTTACCACAAGATGAATTGCAACGTATAAAAGAAGGTGAAGATATTTTGGTCGATGCATTGGGAACGCCAGAACATTGTGGGCGTGTTAAGGGAGTAGGTC
GATTTGTATCTCCATCAATGTTCTTTAGGATGGCTCATCCGAAGTCTAAGATGGGCCAATAACCAACTGAATGAGAAAATCAAGTCCATTACTCTCAACAATTAGACTCC
CCATGTGAGGGGAGTAATAGAGATTCCATAAGGGAAGAAAGTTTTATATTATGATTTATTTTTTTAAAGGTTATGTCATATCAACTAATTATGATCTGTTTCTTTTAAGG
GTATGCCATGTCAACTTGCCGTTGAGTATGAAGGTCAAACTGTTGTCATTGGTACCATGTATGAATCGAGTGGCTCATCTGTTAGGGTACATAGACACCTTTTAGGGAAA
CATAATGTGCGGGTCTCGGTCGATTTGATCTTCGAAGGCAATGAAGACGTAGATCTACCTATTCCCATAAACGAGGAACTTCAGTACCTTGGACAAGTTATAAAATCTTT
TGTGCCATGGCCAAGATCATTGATCAGAACACCTACAACAACCAAGAAGCACTATGGACCAATAAAAGCTACAAGCAGTAAGAAGGTGGTATCAGATTCACACTCTCATC
AATTGAACACGTATGGTCCAACCATGGTCAAGGTTGTACATAATTATGCAAGAGATAAACTGGGTCCTGATGACTTACTAGGTATACCAATGGCAAGAAACATGTTAGGT
GTTGACGCGCCCGAATATTTTTATATTGCTCAAGAAGAGATTCTACAATATTGTAATATGGAAGAAATAGGCTACACTCCAATACTCTATTACATCTGTTACTTATGGTC
TACTTGTGATCAAGAGACACTGGGCAATTACTTATTAGTGGACGGTAGCGAGTTCACAACGGCTTTGGATAGCACAAATGAAGAAGATCGAGTTTCATGTCTAGCTAATA
GGTTAGACAAGCTGACACATCTTAAACAACGAGTATTCTTTCCCTTCAATTCTGGGAACCACTGGATTTTTCTTGTCCTAATTCCAGCTGAAAACACATTGTATGTTTTC
ACTCACTCTGTCAAAATCCGTTGAACCAGAGTTTAGCTCGTGTCATAAATACTGCCTACCGTGTATGACAATTAAGACACACGCCAAAGGCTTTAAAATTAAATTGCAAA
TGGGTGAAGTGCCCTCAACAAACTGGATCAATAGTATGTGGATTTTACGTCCAACTATTCATACGGAAGATGATGCACAACACATCCACGCACCAATTGAAACTTTTTAG
CGTTGGCCCGACCTCGTTCACTCAAGACCAGATTGATGAGAGGACTGAAGTCTTTAATTGATAGAGAAGTCTGTGGCTTTATGATATCCTACAAAAACTCCACCAATATC
GACACCCTTATTGACGGGCTCATAAAGCATTCAAAGTCGAAAAATTGAGCTACGTTGTCTACAATTTCAGCCATTCCAACCTTTGTCGAGCAATGTTTGTTTGACTTTTG
GGGGCACTTCTTAGAGAGATCCATCATGCCTGCTTTTCTAATGGTTGAGGTTTTGCAAGGTTTTGCATAAACTCAACCAAATGATAGATCTTCAGAGATGAGCATTAATA
TATTATTCTTTTTGTATAAGTTAGTG

Protein sequence

Show/hide protein sequence

MPCQLAVEYEGQTVVIGTMYESSGSSVRVHRHLLGKHNVRVSVDLIFEGNEDVDLPIPINEELQYLGQVIKSFVPWPRSLIRTPTTTKKHYGPIKATSSKKVVSDSHSHQ
LNTYGPTMVKVVHNYARDKLGPDDLLGIPMARNMLGVDAPEYFYIAQEEILQYCNMEEIGYTPILYYICYLWSTCDQETLGNYLLVDGSEFTTALDSTNEEDRVSCLANR
LDKLTHLKQRVFFPFNSGNHWIFLVLIPAENTLYVFTHSVKIR

Sed0012653 (gene) of Chayote v1 genome