CuGenDBv2

Gene ID	HG10020395
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	CBM20 domain-containing protein
Genome location	Chr04:31491847..31494845
RNA-Seq Expression	HG10020395
Synteny	HG10020395
Gene Ontology terms	GO:2001070 - starch binding (molecular function)
InterPro domains	IPR002044 - Carbohydrate binding module family 20 IPR013783 - Immunoglobulin-like fold IPR013784 - Carbohydrate-binding-like fold

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8650984.1 hypothetical protein Csa_001314 [Cucumis sativus]

1.5e-184

77.04

Show/hide

Query:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQADT-QNDAIENQETNQSKTVRVKFQ
        MKTL T NS IA  +PSSYF  S+SSLKERLLSGGPEFIS+RR WK A SGLQHLVPLRRGGID I SCF+SYQQADT QNDA+ENQET+QSKTVRVKFQ
Subjt:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQADT-QNDAIENQETNQSKTVRVKFQ

Query:  LQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE
        L KECTFGEHF+VVGDDPIFGSWDVTSAIPLNWADGHQW AEVDIP+GK IQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE
Subjt:  LQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE

Query:  QKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS
        +KIVNQEEDSP APE LM E+NLT+P+EELI N   DSIA KPSVE IDGSNI ALEENG NISASEEN +N SL E ++SSISDSN+NAKDLVAGNI  
Subjt:  QKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS

Query:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE
                 SN+AV EVY +           DTKITEE LEND K        D  VQES V+  VPILVPGLPPT T SN +APPHEVEDDGS+ G NE
Subjt:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE

Query:  SNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        SNDHKLPENIQKNQK DP+VVA QE EAKS Y     EDDTN IENQSDLQE NND+VQND+TWGHKTLKKFLSSLRLL
Subjt:  SNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

XP_011651865.1 uncharacterized protein LOC101213899 isoform X1 [Cucumis sativus]

1.2e-181

76.56

Show/hide

Query:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQ-ADT-QNDAIENQETNQSKTVRVKF
        MKTL T NS IA  +PSSYF  S+SSLKERLLSGGPEFIS+RR WK A SGLQHLVPLRRGGID I SCF+SYQQ ADT QNDA+ENQET+QSKTVRVKF
Subjt:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQ-ADT-QNDAIENQETNQSKTVRVKF

Query:  QLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE
        QL KECTFGEHF+VVGDDPIFGSWDVTSAIPLNWADGHQW AEVDIP+GK IQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE
Subjt:  QLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE

Query:  EQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNIS
        E+KIVNQEEDSP APE LM E+NLT+P+EELI N   DSIA KPSVE IDGSNI ALEENG NISASEEN +N SL E ++SSISDSN+NAKDLVAGNI 
Subjt:  EQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNIS

Query:  SPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFN
                  SN+AV EVY +           DTKITEE LEND K        D  VQES V+  VPILVPGLPPT T SN +APPHEVEDDGS+ G N
Subjt:  SPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFN

Query:  ESNDHKLPE--NIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        ESNDHKLPE  NIQKNQK DP+VVA QE EAKS Y     EDDTN IENQSDLQE NND+VQND+TWGHKTLKKFLSSLRLL
Subjt:  ESNDHKLPE--NIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

XP_011651866.1 phosphoglucan, water dikinase, chloroplastic isoform X2 [Cucumis sativus]

4.7e-183

76.72

Show/hide

Query:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQADT-QNDAIENQETNQSKTVRVKFQ
        MKTL T NS IA  +PSSYF  S+SSLKERLLSGGPEFIS+RR WK A SGLQHLVPLRRGGID I SCF+SYQQADT QNDA+ENQET+QSKTVRVKFQ
Subjt:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQADT-QNDAIENQETNQSKTVRVKFQ

Query:  LQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE
        L KECTFGEHF+VVGDDPIFGSWDVTSAIPLNWADGHQW AEVDIP+GK IQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE
Subjt:  LQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE

Query:  QKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS
        +KIVNQEEDSP APE LM E+NLT+P+EELI N   DSIA KPSVE IDGSNI ALEENG NISASEEN +N SL E ++SSISDSN+NAKDLVAGNI  
Subjt:  QKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS

Query:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE
                 SN+AV EVY +           DTKITEE LEND K        D  VQES V+  VPILVPGLPPT T SN +APPHEVEDDGS+ G NE
Subjt:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE

Query:  SNDHKLPE--NIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        SNDHKLPE  NIQKNQK DP+VVA QE EAKS Y     EDDTN IENQSDLQE NND+VQND+TWGHKTLKKFLSSLRLL
Subjt:  SNDHKLPE--NIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

XP_011651867.1 uncharacterized protein LOC101213899 isoform X3 [Cucumis sativus]

3.6e-183

76.88

Show/hide

Query:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQ-ADT-QNDAIENQETNQSKTVRVKF
        MKTL T NS IA  +PSSYF  S+SSLKERLLSGGPEFIS+RR WK A SGLQHLVPLRRGGID I SCF+SYQQ ADT QNDA+ENQET+QSKTVRVKF
Subjt:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQ-ADT-QNDAIENQETNQSKTVRVKF

Query:  QLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE
        QL KECTFGEHF+VVGDDPIFGSWDVTSAIPLNWADGHQW AEVDIP+GK IQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE
Subjt:  QLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE

Query:  EQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNIS
        E+KIVNQEEDSP APE LM E+NLT+P+EELI N   DSIA KPSVE IDGSNI ALEENG NISASEEN +N SL E ++SSISDSN+NAKDLVAGNI 
Subjt:  EQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNIS

Query:  SPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFN
                  SN+AV EVY +           DTKITEE LEND K        D  VQES V+  VPILVPGLPPT T SN +APPHEVEDDGS+ G N
Subjt:  SPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFN

Query:  ESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        ESNDHKLPENIQKNQK DP+VVA QE EAKS Y     EDDTN IENQSDLQE NND+VQND+TWGHKTLKKFLSSLRLL
Subjt:  ESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

XP_038906171.1 uncharacterized protein LOC120092050 [Benincasa hispida]

4.7e-207

83.58

Show/hide

Query:  MKTLATSNSTIAKRTPSSYFSASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKE
        MK LATS S IA  TPSSYF A SLKERLLSGGPEFIS+RR WK A  GL+HLVP RRGGIDLISCFSS  QADTQNDA+ENQETNQSKTVRVKFQLQKE
Subjt:  MKTLATSNSTIAKRTPSSYFSASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKE

Query:  CTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIV
        CTFGEHFFVVGDDPIFGSWDV+SAIPLNWADGHQW AEV+IP+GKTIQFKFILQG TGNVVWQPGPDRTF+PWETSNTIIVSEDWDSAESRI SEE KIV
Subjt:  CTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIV

Query:  NQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISSPKES
        NQEEDS  A EKL+I+ENLT+PNEELI NTN DSIAEKPSVESIDGSNI A EENGSNISASEEN SN SLSEDN SSIS S ENA+ LVA NISSPKES
Subjt:  NQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISSPKES

Query:  LILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNESNDH
         ILNTSN+AV EV+SNSNGETTITS+SDTKITEEILENDEKD       +  VQESFVN GVPILVPGLPPTPTTSN  APP+EV+DDGSI+G N++ND 
Subjt:  LILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNESNDH

Query:  KLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
         LPENIQKNQKPDPDV+A QE E KS YEEIRQEDDTN IEN+SDLQE N DIVQNDITWGHKTLKKFLSSLRLL
Subjt:  KLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LA83 CBM20 domain-containing protein

2.3e-183

76.72

Show/hide

Query:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQADT-QNDAIENQETNQSKTVRVKFQ
        MKTL T NS IA  +PSSYF  S+SSLKERLLSGGPEFIS+RR WK A SGLQHLVPLRRGGID I SCF+SYQQADT QNDA+ENQET+QSKTVRVKFQ
Subjt:  MKTLATSNSTIAKRTPSSYF--SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLI-SCFSSYQQADT-QNDAIENQETNQSKTVRVKFQ

Query:  LQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE
        L KECTFGEHF+VVGDDPIFGSWDVTSAIPLNWADGHQW AEVDIP+GK IQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE
Subjt:  LQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEE

Query:  QKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS
        +KIVNQEEDSP APE LM E+NLT+P+EELI N   DSIA KPSVE IDGSNI ALEENG NISASEEN +N SL E ++SSISDSN+NAKDLVAGNI  
Subjt:  QKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS

Query:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE
                 SN+AV EVY +           DTKITEE LEND K        D  VQES V+  VPILVPGLPPT T SN +APPHEVEDDGS+ G NE
Subjt:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE

Query:  SNDHKLPE--NIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        SNDHKLPE  NIQKNQK DP+VVA QE EAKS Y     EDDTN IENQSDLQE NND+VQND+TWGHKTLKKFLSSLRLL
Subjt:  SNDHKLPE--NIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

A0A1S3B6C3 uncharacterized protein LOC103486305 isoform X3

2.5e-166

71.31

Show/hide

Query:  MKTLATSNSTIAKRTPSSYF----SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQ-AD-TQNDAIENQETNQSKTVRVK
        MKTL TSNS IA  +PSSYF    S+SS+KERLLS GPEFIS+RR WK A SGLQH VPLRRGGID ISCFSSYQQ AD  Q+DA+ENQET+QSKTVRVK
Subjt:  MKTLATSNSTIAKRTPSSYF----SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQ-AD-TQNDAIENQETNQSKTVRVK

Query:  FQLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILS
        FQLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQW AEVDIP+GK IQFKFILQGITGNV WQPGPDRTFQPWETSNTIIVSEDWDSAESRILS
Subjt:  FQLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILS

Query:  EEQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNI
        EE+KIVNQEE SP APE LM+E NLT+PNEELI NTN DSIA K SVESIDGSNIPALEENG NISASEEN SN SL   N SSISDSNE          
Subjt:  EEQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNI

Query:  SSPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGF
                                            IT+EILEND         +D  VQES V+  VPILVPGLPP            +VE DGS++G 
Subjt:  SSPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGF

Query:  NESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        NESNDHKLPENIQK    DP+VVA QE E KS YEEIRQEDDTN  ENQSDLQE NNDIVQNDITWGHKTLKKFLSSLRLL
Subjt:  NESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

A0A5D3DMY0 Carbohydrate-binding-like fold, putative isoform 2

7.4e-166

70.83

Show/hide

Query:  MKTLATSNSTIAKRTPSSYF----SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQAD-TQNDAIENQETNQSKTVRVKF
        MKTL TSNS IA  +PSSYF    S+SS+KERLLS GPEFIS+RR WK A SGLQH VPLRRGGID ISCFSSYQQAD  Q+DA+ENQET+QSKTVRVKF
Subjt:  MKTLATSNSTIAKRTPSSYF----SASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQAD-TQNDAIENQETNQSKTVRVKF

Query:  QLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE
        QLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQW AEVDIP+GK IQFKFILQGITGNV WQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE
Subjt:  QLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSE

Query:  EQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNIS
        E+KIVNQEE SP APE LM+E NLT+PNEELI NTN DSIA K SVESIDGSNIPALEENG NISASEEN SN SL   N SSISDSNE           
Subjt:  EQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNIS

Query:  SPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFN
                                           IT+EILEND         +D  VQES V+  VPILVPGLPP            +VE DGS++G N
Subjt:  SPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFN

Query:  ESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        ESNDHKLPE+  +N + DP+VVA QE E KS YEEIRQEDDTN  ENQSDLQE NNDIVQNDITWGHKTLKKFLSSLRLL
Subjt:  ESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

A0A6J1F2P2 uncharacterized protein LOC111441639

3.5e-176

71.13

Show/hide

Query:  MKTLATSNSTIAKRTPSSYFSASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKE
        MKTLATSNS I      S FSASSLKERLL GGPEF+S+RR  K  +SGLQHLV LRRGGI+ +SCFSS+QQADTQN+ +ENQ TNQSKTVRVKFQLQKE
Subjt:  MKTLATSNSTIAKRTPSSYFSASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKE

Query:  CTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIV
        CTFGEHFFVVGDDP FGSWDVTSAIPLNWADGH W AEV+IP+GK IQFKF+LQG TGNVVWQPGPDR FQPWETSNTIIVSEDWDSA+SR+LSEE+ IV
Subjt:  CTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIV

Query:  NQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVES----IDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS
        NQ++ SP  PEKLMIE++     +         SI EK SVES    I G NI A EENGSN+SASEENT                    KD++A NI S
Subjt:  NQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVES----IDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS

Query:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE
         KES ILNTSN+ V EVY N NGETTI SQS+TK TEE+LEN EK+ TAKI R+ DVQESF+NYGVP+LVPGLPPTPTTSN DAP HEV+DDGSI+G NE
Subjt:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE

Query:  SNDHKLPENIQKNQKPDPDVVAEQETEAKSRYE------EIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        SNDHKLPENIQ     DPDVV E E EAKS YE      EIRQEDDTNKI N+SDLQE N+ IVQNDITWGHKTLKKF SSLRLL
Subjt:  SNDHKLPENIQKNQKPDPDVVAEQETEAKSRYE------EIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

A0A6J1J7C1 uncharacterized protein LOC111482035

9.3e-177

71.13

Show/hide

Query:  MKTLATSNSTIAKRTPSSYFSASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKE
        MKTLATSNS I      S FSAS LKERLL GGPEF+S+RR  K  +SGLQHLV LRRGGI+ + CFSS+QQADTQN+ +ENQ+TNQSKTVRVKFQLQKE
Subjt:  MKTLATSNSTIAKRTPSSYFSASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKE

Query:  CTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIV
        CTFGEHFFVVGDDP FGSWDVTSAIPLNWADGH W AEV+IP+GK IQFKF+LQG TGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRIL EE+ I+
Subjt:  CTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIV

Query:  NQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVES----IDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS
        NQ+E SP   EKLMIE++L    +         SI EK SVES    I G NI A EENGSN+SASEENT                    KD++  NI S
Subjt:  NQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSIAEKPSVES----IDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISS

Query:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE
        PKES ILNTSN+AV EVYSN NGETTI SQS+TK  EE+LEN EK+ TAKI R+ DVQESF+NYGVP+LVPGLPPTPTTSN DAP HEVEDDGSI+G NE
Subjt:  PKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNE

Query:  SNDHKLPENIQKNQKPDPDVVAEQETEAKSRYE------EIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL
        SNDHKLPENIQ     DPDVV E E E KS YE      EIRQEDDTNKI N+SDLQE N  IV+NDITWGHKTLKKF SSLRLL
Subjt:  SNDHKLPENIQKNQKPDPDVVAEQETEAKSRYE------EIRQEDDTNKIENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

SwissProt top hits

e value

%identity

Alignment

O30565 Cyclomaltodextrin glucanotransferase

1.8e-07

28.95

Show/hide

Query:  DTQNDAIENQETNQSKTVRVKFQLQKECT-FGEHFFVVGDDPIFGSWDVTSAI-PLNWADGHQ---WTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDR
        +T++ A E  E      V V+F +    T  G + ++VG+    G+WD   AI P+     ++   W  ++ +P GK +++K+I +   GNV WQ G +R
Subjt:  DTQNDAIENQETNQSKTVRVKFQLQKECT-FGEHFFVVGDDPIFGSWDVTSAI-PLNWADGHQ---WTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDR

Query:  TFQPWETSNTIIVS
        T+    T    ++S
Subjt:  TFQPWETSNTIIVS

P0DN29 Glucoamylase ARB_02327-1

2.9e-10

40.24

Show/hide

Query:  VKFQLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLN---WADG-HQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTF
        V+F+L      GE  F+VG  P  GSWDV  A+PLN   +AD  HQW  ++++P     ++KFI +   G VVW+  P+R +
Subjt:  VKFQLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLN---WADG-HQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTF

P30270 Alpha-amylase

4.0e-07

27.47

Show/hide

Query:  FQLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDW
        F +     +GE+ +V GD    G+WD   A+ L+ A    W  +V +  G   Q+K++ +   G  VW+ G +RT     T+  + +++ W
Subjt:  FQLQKECTFGEHFFVVGDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDW

P30921 Cyclomaltodextrin glucanotransferase

1.8e-07

32.61

Show/hide

Query:  VPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKECT-FGEHFFVVGDDPIFGSWDVTSAI-PLNWADGHQ---WTAEVDIPLGKTIQ
        +P   GG+  I   +S   A T ++  +N E      V V+F +    T  G++ ++ G     G+WD   AI PL     +Q   W  +V +P GKTI+
Subjt:  VPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKECT-FGEHFFVVGDDPIFGSWDVTSAI-PLNWADGHQ---WTAEVDIPLGKTIQ

Query:  FKFI-LQGITGNVVWQPGPDRTFQPWETSNTIIVSEDW
        FKF+  QG T  V W+ G + TF    TS T  ++ +W
Subjt:  FKFI-LQGITGNVVWQPGPDRTFQPWETSNTIIVSEDW

P31797 Cyclomaltodextrin glucanotransferase

1.6e-08

33.04

Show/hide

Query:  AIENQETNQSKTVRVKFQLQKECT-FGEHFFVVGDDPIFGSWDVTSAIPLNW----ADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTF-QP
        A +N E   +  V V+F +    T  G++ ++VG+    G+WD + AI   +         W  +V +P GKTI+FKFI +   GNV W+ G +  +  P
Subjt:  AIENQETNQSKTVRVKFQLQKECT-FGEHFFVVGDDPIFGSWDVTSAIPLNW----ADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTF-QP

Query:  WETSNTIIVSEDWDS
          T+  IIV  DW +
Subjt:  WETSNTIIVSEDWDS

Arabidopsis top hits

e value

%identity

Alignment

AT5G01260.1 Carbohydrate-binding-like fold

7.1e-36

34.67

Show/hide

Query:  ISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKECTFGEHFFVVGDDPIFGS-WDVTSAIPLNWADGHQW
        I F R     +S +   VPLR   I            D+Q +  + +    +KTVRV+FQL+KEC FGEHFF+VGDDP+FG  WD  +A+PLNW+DG+ W
Subjt:  ISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKECTFGEHFFVVGDDPIFGS-WDVTSAIPLNWADGHQW

Query:  TAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSI
        T ++D+P+G+ ++FK +L+  TG ++WQPGP+R  + WET+ TI + EDWD                     NA  ++MIE       E+ +  TN  SI
Subjt:  TAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSI

Query:  AEKPSVESI----DGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNE--NAKDLVAGNISSPKESLIL
          +   E +      S++ A+E  G     S+E+  N S S  +  ++  SN    A++++   + + +ES +L
Subjt:  AEKPSVESI----DGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNE--NAKDLVAGNISSPKESLIL

AT5G01260.2 Carbohydrate-binding-like fold

1.1e-36

28.67

Show/hide

Query:  ISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKECTFGEHFFVVGDDPIFGS-WDVTSAIPLNWADGHQW
        I F R     +S +   VPLR   I            D+Q +  + +    +KTVRV+FQL+KEC FGEHFF+VGDDP+FG  WD  +A+PLNW+DG+ W
Subjt:  ISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKECTFGEHFFVVGDDPIFGS-WDVTSAIPLNWADGHQW

Query:  TAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSI
        T ++D+P+G+ ++FK +L+  TG ++WQPGP+R  + WET+ TI + EDWD                     NA  ++MIE       E+ +  TN  SI
Subjt:  TAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIVNQEEDSPNAPEKLMIEENLTHPNEELIHNTNTDSI

Query:  AEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISSPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEI
          +   E +      ++++N S ++       +D  ++++S SI                                +    SNG  T       ++ +E 
Subjt:  AEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISSPKESLILNTSNRAVGEVYSNSNGETTITSQSDTKITEEI

Query:  LENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQED
        +  +E+                     P+LVPGL P     N      EV ++G    F E  D K     ++N+K     ++  E   +   + + Q  
Subjt:  LENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQED

Query:  DTNKIENQSDLQE----TNNDIVQNDITWGHKTLKKFLSSLRL
             E Q  L+     T + + +NDI WG +TL K LS+ RL
Subjt:  DTNKIENQSDLQE----TNNDIVQNDITWGHKTLKKFLSSLRL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAAACCCTAGCGACCTCCAACTCAACCATCGCCAAAAGAACACCTTCTTCTTACTTCTCTGCTTCTTCTCTGAAAGAGCGTCTTCTTTCCGGAGGACCTGAATTCAT
TTCTTTTCGGAGGTCTTGGAAATTTGCTACTTCTGGACTTCAGCATTTGGTACCTTTGCGTCGGGGAGGCATCGATTTGATTTCTTGCTTCTCTTCATATCAGCAGGCAG
ATACTCAGAATGATGCAATTGAGAATCAAGAAACAAATCAATCAAAGACCGTTCGTGTCAAATTCCAGCTACAGAAAGAGTGCACATTTGGGGAGCATTTCTTTGTAGTA
GGTGATGATCCAATTTTTGGTTCCTGGGACGTTACAAGTGCAATACCTTTAAACTGGGCCGATGGGCATCAATGGACAGCAGAAGTGGATATTCCTCTTGGGAAAACAAT
CCAGTTCAAATTCATACTTCAAGGAATAACTGGAAATGTTGTGTGGCAACCTGGTCCTGATCGAACATTTCAACCCTGGGAAACATCGAATACAATCATCGTTTCTGAAG
ATTGGGATAGTGCTGAATCACGAATACTAAGTGAAGAACAAAAAATTGTTAACCAGGAGGAGGATTCTCCCAATGCCCCAGAAAAGTTAATGATTGAGGAGAACCTCACT
CATCCAAATGAAGAACTGATCCACAATACAAATACGGATTCAATAGCAGAAAAACCGTCAGTGGAATCGATTGATGGCAGTAACATCCCAGCTTTAGAAGAAAATGGCAG
TAATATCTCTGCTTCTGAAGAGAATACCAGTAACGACTCTCTTTCAGAGGATAACAGTAGCAGCATTTCTGATTCAAATGAGAATGCCAAAGATCTCGTAGCAGGGAATA
TTAGCTCCCCAAAGGAGAGCCTCATTCTCAATACAAGTAACAGGGCCGTCGGTGAGGTATACAGCAATTCAAATGGGGAGACAACAATAACATCCCAGAGTGATACAAAG
ATAACAGAGGAAATTTTGGAGAATGATGAGAAAGATGCAACAGCGAAGATCCTTAGGGACACGGATGTTCAAGAAAGCTTTGTTAACTATGGAGTTCCCATTCTAGTTCC
TGGTTTACCTCCAACACCAACAACATCAAATCATGATGCACCTCCACATGAAGTTGAAGATGATGGTTCCATCAATGGATTCAATGAATCTAACGATCATAAACTACCTG
AGAACATTCAAAAGAATCAGAAACCGGATCCTGATGTTGTGGCTGAACAAGAGACGGAAGCAAAGTCAAGATATGAAGAAATTAGACAAGAGGACGACACAAATAAAATT
GAGAATCAGTCCGATTTGCAGGAAACCAACAATGATATCGTTCAAAATGACATAACATGGGGTCATAAAACCCTGAAGAAGTTCCTCTCCAGTTTGAGACTGCTTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKTLATSNSTIAKRTPSSYFSASSLKERLLSGGPEFISFRRSWKFATSGLQHLVPLRRGGIDLISCFSSYQQADTQNDAIENQETNQSKTVRVKFQLQKECTFGEHFFVV
GDDPIFGSWDVTSAIPLNWADGHQWTAEVDIPLGKTIQFKFILQGITGNVVWQPGPDRTFQPWETSNTIIVSEDWDSAESRILSEEQKIVNQEEDSPNAPEKLMIEENLT
HPNEELIHNTNTDSIAEKPSVESIDGSNIPALEENGSNISASEENTSNDSLSEDNSSSISDSNENAKDLVAGNISSPKESLILNTSNRAVGEVYSNSNGETTITSQSDTK
ITEEILENDEKDATAKILRDTDVQESFVNYGVPILVPGLPPTPTTSNHDAPPHEVEDDGSINGFNESNDHKLPENIQKNQKPDPDVVAEQETEAKSRYEEIRQEDDTNKI
ENQSDLQETNNDIVQNDITWGHKTLKKFLSSLRLL

HG10020395 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome