CuGenDBv2

Gene ID	Tan0001232
Organism	Trichosanthes anguina (Snake gourd v1)
Description	glycine-rich protein 23-like
Genome location	LG04:5021412..5022080
RNA-Seq Expression	Tan0001232
Synteny	Tan0001232
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6601160.1 hypothetical protein SDJN03_06393, partial [Cucurbita argyrosperma subsp. sororia]

3.4e-35

65.09

Show/hide

Query:  MPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLD-GGGGGLSV
        MPAFCPPLSP E  PPFSFNA F  GAGGGDE+TSG GAGGEM   G                       GGGGL+VVF+GGGGGL V+LD GGGGGL V
Subjt:  MPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLD-GGGGGLSV

Query:  VLDIGGGGGPLVVLDGSGGGGLTVVFNG-GGGGLLVMLDG-GGGGLSVVLDIGGGGGPLVVLDGSGGGG
        VLD  GGGG  VVLDG+GGGGL VV +G GGGGL V+LDG GGGGL VVLD GGGG P VV +G GGGG
Subjt:  VLDIGGGGGPLVVLDGSGGGGLTVVFNG-GGGGLLVMLDG-GGGGLSVVLDIGGGGGPLVVLDGSGGGG

XP_022957272.1 loricrin-like [Cucurbita moschata]

7.4e-38

73.2

Show/hide

Query:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSAL-GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN
        MQ+NP NPNKPAP ITP AMPAFCPPLSP E  PPFSFNA F  GAGGGDE+TSG GAGGEM    GGGGL VVFDG GGGGL VVLDG GGGGL VV +
Subjt:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSAL-GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN

Query:  G-GGGGLLVMLDG-GGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGG
        G GGGGL V+LDG GGGGL VVLD GGGG         GGG  +VVFNGGGGG
Subjt:  G-GGGGLLVMLDG-GGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGG

XP_022990509.1 glycine-rich cell wall structural protein 1.0-like [Cucurbita maxima]

1.3e-34

69.33

Show/hide

Query:  INPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFD-GSGGGGLLVVLDGNGGGGLTVVFNGG
        +NP NPNKPAP ITPK MPAFCPPLSP E  PPFSFNA F VGAGGGDE TSG GAG      GGGG+ VVFD G GGGGL  VLDG GGGGL VV +G 
Subjt:  INPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFD-GSGGGGLLVVLDGNGGGGLTVVFNGG

Query:  GGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGL-TVVFNGGGGG
                 GGGGGL VVLD  GGGG  VVLDG GGGG  +VVFNGGGGG
Subjt:  GGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGL-TVVFNGGGGG

XP_023549817.1 glycine-rich cell wall structural protein-like [Cucurbita pepo subsp. pepo]

4.5e-35

69.93

Show/hide

Query:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN-
        MQ+NP NPNKPAP ITP AMPAFCPPLSP E  PPFSFNA F  GAG GDE+TSG GAGGEM   G           GGGGL VV DG GGGG +VVFN 
Subjt:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN-

Query:  GGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGL-TVVFNGGGGG
        GGGGGL V+LD  GGGGL VVLD  GGGG  VVLDG GGGG  +VVFNGGGGG
Subjt:  GGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGL-TVVFNGGGGG

XP_031741791.1 glycine-rich protein 23-like [Cucumis sativus]

3.5e-56

67.25

Show/hide

Query:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSAL--GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVF
        MQINP NPNKP P ITP A+PAFCPPL+P EPPPPFSFNA   VG GGGDE   GGGAGG+++    GGGG LVV D  GGGG+ V LDG+GGGG +VV 
Subjt:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSAL--GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVF

Query:  -NGGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFN-GGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFN-GG
          GGGGG  V LD GGGGG SV LD GGGGG  V LDG GGGG +V  + GGGGG+ V LD GGGGG SV LD GGGGG  V LDG GGGG +V  + GG
Subjt:  -NGGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFN-GGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFN-GG

Query:  GGGLLVMLDGGGGGGLSVVLDIGGGGDAS
        GGG  V LDGGGGGG SV LD GGGG AS
Subjt:  GGGLLVMLDGGGGGGLSVVLDIGGGGDAS

TrEMBL top hits

e value

%identity

Alignment

A0A1S4DW63 loricrin-like

9.1e-34

67.11

Show/hide

Query:  EMTSGGGAGGEMSAL-GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN-GGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGG
        E   GGG G E+  L GGGG+ VV DG GGGG+ VV DG GGGG++VVF+ GGGGG+ V+ D GGGGG+SVV D GGGGG LVVLDG GGGG++VVF+GG
Subjt:  EMTSGGGAGGEMSAL-GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN-GGGGGLLVMLD-GGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGG

Query:  GGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGG
        GGG+ V+ DGGGGG+SV+LD GGGGG  VVLDG GGGG++V  +GGGGG
Subjt:  GGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGG

A0A6I8T397 Cysteine-rich venom protein, putative

1.7e-16

47.78

Show/hide

Query:  AGGGDEMTSGGGAGG---EMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTV
        A G    + GGG GG   +    GGGG++    G GGGG++V   G GGGG+ V   GGGG       GGGGG+ V    GGGGG +V   G GGGG+ V
Subjt:  AGGGDEMTSGGGAGG---EMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTV

Query:  VFNGGGG-GLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTV--VFNGGGGGLLVMLDGGGGGGLSVVLDIGGGG
          +GGGG G+++   GGGGG  VV   GGGGG +VV    GGGG  V     GGGGG++V   GGGGGG+ V    GGGG
Subjt:  VFNGGGG-GLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTV--VFNGGGGGLLVMLDGGGGGGLSVVLDIGGGG

A0A6I8U367 Uncharacterized protein

1.8e-18

48.37

Show/hide

Query:  GAGGG--DEMTSGGGAGGEMSAL---GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDI--GGGGGPLVVLDGSGG
        G GGG     + GGG GG +S     GGGG++V   G GGGG++V   G GGGG+    +GGGGG +V+   GGGG  VV+    GGGGG +    G GG
Subjt:  GAGGG--DEMTSGGGAGGEMSAL---GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDI--GGGGGPLVVLDGSGG

Query:  GGLTVVFNGGGGGLLVMLDGGGGGLSVVLDI--GGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGGG
        GG+ V  +GGGGG +V    GGGG  VV+    GGGGG +V   G GGGG+ V  +GGGGG +V+   GGGGG+ V    GGGG
Subjt:  GGLTVVFNGGGGGLLVMLDGGGGGLSVVLDI--GGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGGG

A0A6J1GYP3 loricrin-like

3.6e-38

73.2

Show/hide

Query:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSAL-GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN
        MQ+NP NPNKPAP ITP AMPAFCPPLSP E  PPFSFNA F  GAGGGDE+TSG GAGGEM    GGGGL VVFDG GGGGL VVLDG GGGGL VV +
Subjt:  MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSAL-GGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFN

Query:  G-GGGGLLVMLDG-GGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGG
        G GGGGL V+LDG GGGGL VVLD GGGG         GGG  +VVFNGGGGG
Subjt:  G-GGGGLLVMLDG-GGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGG

A0A6J1JS83 glycine-rich cell wall structural protein 1.0-like

6.3e-35

69.33

Show/hide

Query:  INPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFD-GSGGGGLLVVLDGNGGGGLTVVFNGG
        +NP NPNKPAP ITPK MPAFCPPLSP E  PPFSFNA F VGAGGGDE TSG GAG      GGGG+ VVFD G GGGGL  VLDG GGGGL VV +G 
Subjt:  INPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFD-GSGGGGLLVVLDGNGGGGLTVVFNGG

Query:  GGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGL-TVVFNGGGGG
                 GGGGGL VVLD  GGGG  VVLDG GGGG  +VVFNGGGGG
Subjt:  GGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGL-TVVFNGGGGG

SwissProt top hits

e value

%identity

Alignment

O48848 Glycine-rich protein 23

2.3e-05

46.15

Show/hide

Query:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT
        F  G GGG  +  GGG GG     GGGGL       GGGGL       GGGGL     GGG GL     GGGGGL     +GGGGG    L G GGGGL 
Subjt:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT

Query:  VVFNGGGGGLLVMLDGG-----GGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGG
            GGGGGL     GG     GGGL     IGGGGG      G GGGG    F GG GG      GGGGG       +GGG
Subjt:  VVFNGGGGGLLVMLDGG-----GGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGG

Arabidopsis top hits

e value

%identity

Alignment

AT2G32690.1 glycine-rich protein 23

1.6e-06

46.15

Show/hide

Query:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT
        F  G GGG  +  GGG GG     GGGGL       GGGGL       GGGGL     GGG GL     GGGGGL     +GGGGG    L G GGGGL 
Subjt:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT

Query:  VVFNGGGGGLLVMLDGG-----GGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGG
            GGGGGL     GG     GGGL     IGGGGG      G GGGG    F GG GG      GGGGG       +GGG
Subjt:  VVFNGGGGGLLVMLDGG-----GGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGG

AT2G32690.2 glycine-rich protein 23

1.8e-05

46.39

Show/hide

Query:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT
        F  G GGG  +  GGG GG     GGGGL       GGGGL       GGGGL     GGG GL     GGGGGL     +GGGGG    L G  GGG  
Subjt:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT

Query:  VVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGG
          + GG GG L    GGGGG      IGGGGG      G GGGG    F GG GG      GGGGG
Subjt:  VVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGG

AT2G32690.3 glycine-rich protein 23

3.6e-06

46.33

Show/hide

Query:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT
        F  G GGG  +  GGG GG     GGGGL       GGGGL       GGGGL     GGG GL     GGGGGL     +GGGGG    L G GGGGL 
Subjt:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT

Query:  VVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGG
            GGGGG      G GGGL     IGGGGG      G GGGG    F GG GG      GGGGG       +GGG
Subjt:  VVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGG

AT2G32690.4 glycine-rich protein 23

4.4e-04

45.1

Show/hide

Query:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT
        F  G GGG  +  GGG GG     GGGGL       GGGGL       GGGGL     GGG GL     GGGGGL     +GGGGG    L G GGGGL 
Subjt:  FFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLT

Query:  VVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGG
             GGGG      GGGGG       GGG G        GGGGL   + GGG
Subjt:  VVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCAAATCAATCCTATAAATCCCAACAAACCTGCTCCTACAATCACTCCAAAGGCAATGCCGGCCTTTTGTCCACCACTCAGTCCTTCTGAACCTCCTCCTCCCTTTTC
ATTCAATGCTAGATTCTTCGTCGGTGCCGGCGGCGGAGATGAAATGACGTCAGGTGGAGGTGCGGGGGGTGAGATGTCCGCATTGGGTGGCGGTGGACTGCTAGTTGTAT
TTGATGGTAGCGGCGGAGGTGGACTGTTAGTTGTGTTGGATGGCAATGGCGGCGGTGGACTGACAGTCGTATTCAACGGTGGCGGAGGTGGACTGTTAGTTATGTTGGAT
GGCGGCGGCGGTGGACTTTCAGTTGTGTTGGATATCGGAGGTGGAGGTGGACCATTAGTTGTGTTAGATGGCAGTGGCGGCGGTGGACTAACAGTCGTATTCAACGGTGG
TGGAGGTGGACTGTTAGTTATGTTGGATGGCGGCGGCGGTGGACTTTCAGTTGTGTTGGATATCGGAGGCGGAGGTGGACCGTTAGTTGTGTTGGATGGCAGTGGCGGCG
GTGGACTGACAGTCGTATTCAACGGTGGCGGAGGTGGACTATTAGTTATGTTGGATGGCGGCGGCGGCGGCGGACTTTCAGTTGTGTTGGATATCGGAGGTGGAGGTGAT
GCATCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MQINPINPNKPAPTITPKAMPAFCPPLSPSEPPPPFSFNARFFVGAGGGDEMTSGGGAGGEMSALGGGGLLVVFDGSGGGGLLVVLDGNGGGGLTVVFNGGGGGLLVMLD
GGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGLSVVLDIGGGGGPLVVLDGSGGGGLTVVFNGGGGGLLVMLDGGGGGGLSVVLDIGGGGD
AS

Tan0001232 (gene) of Snake gourd v1 genome