CuGenDBv2

Gene ID	Tan0015920
Organism	Trichosanthes anguina (Snake gourd v1)
Description	keratin, type II cytoskeletal 3 isoform X2
Genome location	LG10:56877051..56889407
RNA-Seq Expression	Tan0015920
Synteny	Tan0015920
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022932819.1 keratin, type II cytoskeletal 2 epidermal isoform X1 [Cucurbita moschata]

1.4e-61

85.42

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNGSR E GED++G+LWKLPVLKSS IG+LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR
        GDLL+G++SIFP +DEI ALVDEL LNT+KLIR T++EI+KWKR
Subjt:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR

XP_022932820.1 keratin, type II cytoskeletal 2 epidermal isoform X2 [Cucurbita moschata]

1.9e-63

86.71

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNGSR E GED++G+LWKLPVLKSS IG+LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR
        GDLL+G++SIFPQDEI ALVDEL LNT+KLIR T++EI+KWKR
Subjt:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR

XP_022974026.1 keratin, type II cytoskeletal 3 isoform X2 [Cucurbita maxima]

7.3e-63

85.31

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNGSR+E GED++G+LWKLPVLKSS IG+LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR
        GDLL+G++SIFPQDEI A+VDEL LNT+KLI+ T++EI+KWKR
Subjt:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR

XP_023521209.1 fibroin heavy chain isoform X2 [Cucurbita pepo subsp. pepo]

7.3e-63

86.71

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNGSR E  ED++G+LWKLPVLKSS IG+LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR
        GDLL+G +SIFPQDEI ALVDEL LNT+KLIR T+REI+KWKR
Subjt:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR

XP_038889093.1 ctenidin-1 isoform X1 [Benincasa hispida]

1.4e-61

86.11

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRN NG+R + GED+ GLLW LPVLKSS  GKLGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFPQ-DEISALVDELVLNTRKLIRATSREIEKWKR
        GDLLHG +SIFPQ D+I ALVDELVLN+++LIRATSREI+KWKR
Subjt:  GDLLHGQKSIFPQ-DEISALVDELVLNTRKLIRATSREIEKWKR

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KSM8 Uncharacterized protein

1.1e-61

84.72

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNG+R +DGED+ GLLW LPVLKSS  G LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR
        GD+L G++SIFP QD+I ALVD+LVLNT++LIRATS+EI+KWKR
Subjt:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR

A0A1S4E347 glycine-rich cell wall structural protein 1

1.1e-61

85.42

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNG+R  DGED+ GLLW LPVLKSS  G LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR
        GD+L G +SIFP QD+I ALVD+LVLNT++LIRATSREI+KWKR
Subjt:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR

A0A6J1EY31 keratin, type II cytoskeletal 2 epidermal isoform X1

6.7e-62

85.42

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNGSR E GED++G+LWKLPVLKSS IG+LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR
        GDLL+G++SIFP +DEI ALVDEL LNT+KLIR T++EI+KWKR
Subjt:  GDLLHGQKSIFP-QDEISALVDELVLNTRKLIRATSREIEKWKR

A0A6J1F360 keratin, type II cytoskeletal 2 epidermal isoform X2

9.3e-64

86.71

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNGSR E GED++G+LWKLPVLKSS IG+LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR
        GDLL+G++SIFPQDEI ALVDEL LNT+KLIR T++EI+KWKR
Subjt:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR

A0A6J1IA95 keratin, type II cytoskeletal 3 isoform X2

3.5e-63

85.31

Show/hide

Query:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV
        MPRNMNGSR+E GED++G+LWKLPVLKSS IG+LGPAFGLGVGCGVGFG+GLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYG GRGIAQDDKRRYSNV
Subjt:  MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNV

Query:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR
        GDLL+G++SIFPQDEI A+VDEL LNT+KLI+ T++EI+KWKR
Subjt:  GDLLHGQKSIFPQDEISALVDELVLNTRKLIRATSREIEKWKR

SwissProt top hits

e value

%identity

Alignment

Q9JL61 DNA-binding protein Rfx5

8.0e-04

49.33

Show/hide

Query:  NGLLWKLPVLKSSTIGK---LGPAFGLGVGCGVGFGVGLVGGAGFGPGI-PGLQLGFGLGAGCGVGLGFGYGVGR
        N +L  +P L  +  G    LGP FG G G G G G GL  GAG GPG+ PGL  G G G G G+G G G G GR
Subjt:  NGLLWKLPVLKSSTIGK---LGPAFGLGVGCGVGFGVGLVGGAGFGPGI-PGLQLGFGLGAGCGVGLGFGYGVGR

Arabidopsis top hits

e value

%identity

Alignment

AT1G66820.1 glycine-rich protein

3.2e-08

47.44

Show/hide

Query:  LKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQ-----LGFGLGAGCGVGLGFGYGVGRGIAQDD-KRRY
        +K++T+   GP  G G+GCG G G+GL GG G G    GL      LGFG+G G G G G+G+GVG G + DD K R+
Subjt:  LKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQ-----LGFGLGAGCGVGLGFGYGVGRGIAQDD-KRRY

AT4G10330.1 glycine-rich protein

4.9e-41

60.45

Show/hide

Query:  SRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLHGQ
        +R+  G+DD GLLWKLP ++   IGK+GPAFGLGVGCG GFG GL+GG GFGPG+PGLQ G G GAGCG+G+GFGYGVGRG A D  R Y NV     G+
Subjt:  SRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLHGQ

Query:  KSIFPQDEISALVDELVLNTRKLIRATSREIEKW
         S+   +E+ +L+DELV++T+KL++AT+ EI+KW
Subjt:  KSIFPQDEISALVDELVLNTRKLIRATSREIEKW

AT4G14301.1 unknown protein

6.3e-04

55.17

Show/hide

Query:  IGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRG
        IGK G  FG G+G G GFG G+  G GFG GI G   G G G G G G GFG G+G+G
Subjt:  IGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCTCGAAATATGAACGGAAGCAGACAGGAAGACGGAGAAGATGACAACGGATTACTGTGGAAGCTTCCAGTTCTGAAATCTTCCACAATCGGAAAGTTAGGTCCCGC
CTTCGGTCTCGGCGTCGGTTGTGGCGTCGGCTTTGGCGTCGGCCTCGTCGGAGGTGCTGGATTTGGTCCGGGAATTCCTGGTTTACAACTTGGCTTTGGTCTTGGTGCTG
GGTGTGGAGTTGGCTTGGGATTTGGCTATGGTGTTGGCAGGGGCATTGCCCAAGATGACAAACGGAGATACTCTAACGTTGGGGATCTATTACATGGCCAAAAAAGTATT
TTTCCTCAGGATGAGATTAGCGCGCTTGTTGACGAGCTTGTCCTCAATACAAGGAAGCTTATCCGAGCTACGTCAAGGGAGATTGAGAAGTGGAAAAGATGA

mRNA sequence

Show/hide mRNA sequence

CACACGGGAGCTCCTCAGAAAACTCTCAACGAAGAATGTATAATGTTAGGGCTTTGTATTGTTGTTGATAAAGTTTAGATGTGGAATTAGTTTGGAAACTTCACATCTAT
TCTTCCGTTGCTTATTCGTCCCGAAACCCCAAGGAAGAGATGCCTCGAAATATGAACGGAAGCAGACAGGAAGACGGAGAAGATGACAACGGATTACTGTGGAAGCTTCC
AGTTCTGAAATCTTCCACAATCGGAAAGTTAGGTCCCGCCTTCGGTCTCGGCGTCGGTTGTGGCGTCGGCTTTGGCGTCGGCCTCGTCGGAGGTGCTGGATTTGGTCCGG
GAATTCCTGGTTTACAACTTGGCTTTGGTCTTGGTGCTGGGTGTGGAGTTGGCTTGGGATTTGGCTATGGTGTTGGCAGGGGCATTGCCCAAGATGACAAACGGAGATAC
TCTAACGTTGGGGATCTATTACATGGCCAAAAAAGTATTTTTCCTCAGGATGAGATTAGCGCGCTTGTTGACGAGCTTGTCCTCAATACAAGGAAGCTTATCCGAGCTAC
GTCAAGGGAGATTGAGAAGTGGAAAAGATGAGATGACTTTTATGTTTTTACATTGCACAAGTCCAACCCCCTCCCCTATCATTAGAAAGAAACCACAATCAAAATCATAG
AAGAAAGAAACATGCTGGCTGTCTATACGGTTTTATTTGTCTATGGCTTTGTATAGGCAAACTTCATGTTCAATTGTTCTGAGAGATGTATTTGGTTGCTCTAAATCATC
ATGTGCAGTGGGTTTTGAGTAGTTACAAAATGTCGAATACTTAAATTAGTTTAGGTGGTCTTTAAAAGGCTGATTGATAATGTTCATACTACAGAAATAGCCGTTTCATT
AGAGGTTTTATTATGTTTTAATTTAAGCCTTTTCTGGCTCGTGATAATGTTCAATTGTTACGTTGAGTTGCATCAAACTAAATATTCAAGCAATGGAGATAATTTGATTT
CCTTCACAAA

Protein sequence

Show/hide protein sequence

MPRNMNGSRQEDGEDDNGLLWKLPVLKSSTIGKLGPAFGLGVGCGVGFGVGLVGGAGFGPGIPGLQLGFGLGAGCGVGLGFGYGVGRGIAQDDKRRYSNVGDLLHGQKSI
FPQDEISALVDELVLNTRKLIRATSREIEKWKR

Tan0015920 (gene) of Snake gourd v1 genome