CuGenDBv2

Gene ID	HG10003599
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	keratin, type II cytoskeletal 3 isoform X1
Genome location	Chr08:3921793..3924682
RNA-Seq Expression	HG10003599
Synteny	HG10003599
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6592270.1 hypothetical protein SDJN03_14616, partial [Cucurbita argyrosperma subsp. sororia]

4.4e-65

89.93

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNG+RH+GGEDE+G+LW LPVLKSSRIG+LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNVGDLL
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR
        NGHQSIFPQD+IG LVDE+ LNTK+LIR T+REIDKWKR
Subjt:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR

XP_016902400.1 PREDICTED: glycine-rich cell wall structural protein 1 [Cucumis melo]

8.4e-64

91.43

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNGNR++ GEDE GLLWNLPVLKSSR G LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGD+L
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR
         GHQSIFP QDDIG LVD++VLNTKRLIRATSREIDKWKR
Subjt:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR

XP_022932820.1 keratin, type II cytoskeletal 2 epidermal isoform X2 [Cucurbita moschata]

1.1e-63

88.49

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNG+RH+GGEDE+G+LW LPVLKSSRIG+LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNVGDLL
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR
        NG QSIFPQD+IG LVDE+ LNTK+LIR T++EIDKWKR
Subjt:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR

XP_023521209.1 fibroin heavy chain isoform X2 [Cucurbita pepo subsp. pepo]

3.8e-64

89.21

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNG+RH+G EDE+G+LW LPVLKSSRIG+LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNVGDLL
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR
        NGHQSIFPQD+IG LVDE+ LNTK+LIR T+REIDKWKR
Subjt:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR

XP_038889093.1 ctenidin-1 isoform X1 [Benincasa hispida]

4.4e-65

94.24

Show/hide

Query:  NGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLN
        NGNRHQGGEDE GLLWNLPVLKSSR GKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL+
Subjt:  NGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLN

Query:  GHQSIFPQ-DDIGTLVDEVVLNTKRLIRATSREIDKWKR
        GHQSIFPQ DDI  LVDE+VLN+KRLIRATSREIDKWKR
Subjt:  GHQSIFPQ-DDIGTLVDEVVLNTKRLIRATSREIDKWKR

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KSM8 Uncharacterized protein

2.6e-63

90.71

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNGNR+Q GEDE GLLWNLPVLKSSR G LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGD+L
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR
         G QSIFP QDDIG LVD++VLNTKRLIRATS+EIDKWKR
Subjt:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR

A0A1S4E347 glycine-rich cell wall structural protein 1

4.1e-64

91.43

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNGNR++ GEDE GLLWNLPVLKSSR G LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGD+L
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR
         GHQSIFP QDDIG LVD++VLNTKRLIRATSREIDKWKR
Subjt:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR

A0A6J1EY31 keratin, type II cytoskeletal 2 epidermal isoform X1

3.8e-62

87.14

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNG+RH+GGEDE+G+LW LPVLKSSRIG+LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNVGDLL
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR
        NG QSIFP +D+IG LVDE+ LNTK+LIR T++EIDKWKR
Subjt:  NGHQSIFP-QDDIGTLVDEVVLNTKRLIRATSREIDKWKR

A0A6J1F360 keratin, type II cytoskeletal 2 epidermal isoform X2

5.3e-64

88.49

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNG+RH+GGEDE+G+LW LPVLKSSRIG+LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNVGDLL
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR
        NG QSIFPQD+IG LVDE+ LNTK+LIR T++EIDKWKR
Subjt:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR

A0A6J1IA95 keratin, type II cytoskeletal 3 isoform X2

2.2e-62

86.33

Show/hide

Query:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL
        MNG+R +GGEDE+G+LW LPVLKSSRIG+LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNVGDLL
Subjt:  MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLL

Query:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR
        NG QSIFPQD+IG +VDE+ LNTK+LI+ T++EIDKWKR
Subjt:  NGHQSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKWKR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G66820.1 glycine-rich protein

5.3e-08

51.43

Show/hide

Query:  LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQ-----LGFGLGAGCGVGLGFGYGVGRGIAQDD-KRRY
        +GP  G G+GCG G GIGL GG G G    GL      LGFG+G G G G G+G+GVG G + DD K R+
Subjt:  LGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQ-----LGFGLGAGCGVGLGFGYGVGRGIAQDD-KRRY

AT4G10330.1 glycine-rich protein

6.9e-40

58.21

Show/hide

Query:  NRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLNGH
        NR + G+D+ GLLW LP ++   IGK+GPAFGLGVGCG GFG GL+GG GFGPG+PGLQ G G GAGCG+G+GFGYGVGRG A D  R Y NVG      
Subjt:  NRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLNGH

Query:  QSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKW
              +++ +L+DE+V++TK+L++AT+ EIDKW
Subjt:  QSIFPQDDIGTLVDEVVLNTKRLIRATSREIDKW

AT4G14301.1 unknown protein

6.1e-04

55.17

Show/hide

Query:  IGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRG
        IGK G  FG G+G G GFG G+  G GFG GI G   G G G G G G GFG G+G+G
Subjt:  IGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAACGGAAACAGACACCAAGGCGGAGAAGATGAGAACGGATTACTCTGGAATCTTCCAGTTCTTAAATCTTCCAGAATCGGAAAGTTAGGTCCCGCCTTCGGTCTGGG
CGTTGGTTGTGGCGTCGGCTTTGGCATCGGCCTTGTCGGAGGTGCTGGATTTGGTCCAGGAATTCCTGGCTTACAACTTGGCTTTGGTCTTGGTGCTGGATGTGGAGTTG
GCTTAGGATTTGGATATGGTGTTGGCAGGGGCATTGCTCAAGATGACAAACGGAGATACTCTAACGTTGGAGATCTATTAAATGGTCATCAAAGTATTTTTCCTCAGGAC
GATATTGGCACGCTTGTTGACGAGGTTGTCCTAAATACAAAGAGGCTTATACGAGCTACTTCAAGGGAGATTGACAAGTGGAAAAGATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNGNRHQGGEDENGLLWNLPVLKSSRIGKLGPAFGLGVGCGVGFGIGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLNGHQSIFPQD
DIGTLVDEVVLNTKRLIRATSREIDKWKR

HG10003599 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome