CuGenDBv2

Gene ID	Tan0015887
Organism	Trichosanthes anguina (Snake gourd v1)
Description	glycine-rich cell wall structural protein 2-like
Genome location	LG09:67850809..67851926
RNA-Seq Expression	Tan0015887
Synteny	Tan0015887
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6589746.1 hypothetical protein SDJN03_15169, partial [Cucurbita argyrosperma subsp. sororia]

2.1e-35

72.83

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---
        M SIR +AVLC V+CMSAIESQGR+ RKDLGL+LGGLGVG+GVG+GLGLG G GSGSGSGSGSGSGSGS SSS SSS S   S  GSEAGSYAGSYA   
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---

Query:  -RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGG--GEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYREGGNN
          S SGRN RNGGSG    YGEGS RG G G GG  GEGYGEGRGYGEGSGR           EGYGEGRGYGEGR Y EGGNN
Subjt:  -RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGG--GEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYREGGNN

XP_022135257.1 glycine-rich cell wall structural protein 2-like [Momordica charantia]

3.6e-27

70.89

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---
        MASIR +A +C V+C  AIESQ R+ RKDLGL+LGGLG+G+G GI  GLG+GGGSGSG+G+GSGSGSGSGS SSSSSHSSSSSYGGS AGS AGSYA   
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---

Query:  ---RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD
            SGSGRN RNGGSGSGS YGEGS RG+G G G G GYGEGRGYG     G GG +
Subjt:  ---RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD

XP_022988596.1 glycine-rich cell wall structural protein 2-like isoform X3 [Cucurbita maxima]

2.1e-27

61.46

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---------------
        MASIR +++L L+L +S I S+ R+ R DLGL+LGG+GVG+G G+GLGLG  GGSGSGSGSGSGSGSGS SSSSS S SSSS  G               
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---------------

Query:  ------GSEAGSYAGSYA----RSGSGRNDRNGGSGSGSEYGEGSDRGSGSG--DGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYR
              GSEAGSYAGSYA     S SGRN RNGGSG    YGEGS RG G G   GGGEGYGEGRGYGEGSGR           EGYG GRGYGEGR Y 
Subjt:  ------GSEAGSYAGSYA----RSGSGRNDRNGGSGSGSEYGEGSDRGSGSG--DGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYR

Query:  EGGNN
        EGGNN
Subjt:  EGGNN

XP_023515819.1 putative glycine-rich cell wall structural protein 1 isoform X3 [Cucurbita pepo subsp. pepo]

1.3e-24

74.84

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---GSEAGSYAGSYA
        MASI  L V+C +L  SAI SQ R+ RKDLGL+LGGLGVG+G GIGLGLG G GSGSGSGSGSGSGSGS SSSSSSS+SSSS  G   GSEAGSYAGS A
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---GSEAGSYAGSYA

Query:  RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD
         S SGRN RNGGSGSGS YG GS  G GSG+GGGEGYGEG GYGE  GRG GGG+
Subjt:  RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD

XP_023515820.1 putative glycine-rich cell wall structural protein 1 [Cucurbita pepo subsp. pepo]

3.7e-32

69.78

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---
        M SIR +AVLC V+CMSAIESQGR+ RKDLGL+LGGLGVG+GVG+GLGLG G GSGSGSGSGSGSGSGS SSS SSS S   S  GSEAGSYAGSYA   
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---

Query:  -RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYREGGNN
          S SGRN RNGGSG           G G G G GEGYGEGRGYGEGSGR           EGYGEGRGYGEGR Y EGGNN
Subjt:  -RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYREGGNN

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LTK9 Uncharacterized protein

2.6e-23

71.7

Show/hide

Query:  MASIRVLA-VLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---GSEAGSYAGSY
        MASI+ LA V+CL+L  SAI S+GR+ RKDLG++LGG+GVG+G GIGLG+   GGSGSGSGSGSGSGSGSGSSSSSSS+SSSSS G   GSEAGSYAGSY
Subjt:  MASIRVLA-VLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---GSEAGSYAGSY

Query:  A--RSGSGR-NDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD
        A  R+GSG   +RNGGSG GS YG GS RG GS D  GEGYGEG GYGE  GRG GGG+
Subjt:  A--RSGSGR-NDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD

A0A6J1C269 glycine-rich cell wall structural protein 2-like

1.7e-27

70.89

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---
        MASIR +A +C V+C  AIESQ R+ RKDLGL+LGGLG+G+G GI  GLG+GGGSGSG+G+GSGSGSGSGS SSSSSHSSSSSYGGS AGS AGSYA   
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYA---

Query:  ---RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD
            SGSGRN RNGGSGSGS YGEGS RG+G G G G GYGEGRGYG     G GG +
Subjt:  ---RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD

A0A6J1E521 putative glycine-rich cell wall structural protein 1 isoform X3

3.1e-24

74.19

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---GSEAGSYAGSYA
        MASI  L V+C +L  S I SQ R+ RKDLGL+LGGLGVG+G GIGLGLG G GSGSGSGSGSGSGSGS SSSSSSS+SSSS  G   GSEAGSYAGS A
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---GSEAGSYAGSYA

Query:  RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD
         SGSG N RNGGSGSGS YG GS  G GSG+GGGEGYGEG GYGE  GRG GGG+
Subjt:  RSGSGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGD

A0A6J1E720 glycine-rich protein DOT1-like

8.1e-25

73.43

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYARSG
        M SIR +AVLC V+CMSAIESQGR+ RKDLGL+LGGLGVG+GVG+GLGLG G GSGSGSGSGSGSGSGSGS S SSS SSSSSYGGS AGS AGSYA S 
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYARSG

Query:  SGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEG
        +G     GGS SG  Y     R  GSG G G GYGEGRGYGEG
Subjt:  SGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEG

A0A6J1JHN1 glycine-rich cell wall structural protein 2-like isoform X3

1.0e-27

61.46

Show/hide

Query:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---------------
        MASIR +++L L+L +S I S+ R+ R DLGL+LGG+GVG+G G+GLGLG  GGSGSGSGSGSGSGSGS SSSSS S SSSS  G               
Subjt:  MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG---------------

Query:  ------GSEAGSYAGSYA----RSGSGRNDRNGGSGSGSEYGEGSDRGSGSG--DGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYR
              GSEAGSYAGSYA     S SGRN RNGGSG    YGEGS RG G G   GGGEGYGEGRGYGEGSGR           EGYG GRGYGEGR Y 
Subjt:  ------GSEAGSYAGSYA----RSGSGRNDRNGGSGSGSEYGEGSDRGSGSG--DGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYR

Query:  EGGNN
        EGGNN
Subjt:  EGGNN

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G30450.1 glycine-rich protein

2.3e-11

61.11

Show/hide

Query:  MASIRVLAVLCLVLCMSAIE-SQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG-----GSEAGSYAG
        MA    L +L LV+  S +  ++ R+ RKDLG++LG  G+G+G+G+GLG+GLGGGSGSG+G+GSGSGSGS SSSSSSS SSSSS G     GS AGS+AG
Subjt:  MASIRVLAVLCLVLCMSAIE-SQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG-----GSEAGSYAG

Query:  SYARSGSG
        S A SGSG
Subjt:  SYARSGSG

AT4G30460.1 glycine-rich protein

9.5e-18

57.99

Show/hide

Query:  LAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG------GSEAGSYAGSYARSG
        L ++ L+L  S + S+ R+ RKDLGL+LGG+G G+G+GIG+G   GGGSGSG+G+GSGSG G  SSSSSSS SSSSS G      GSEAGSYAGS+A SG
Subjt:  LAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYG------GSEAGSYAGSYARSG

Query:  SGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEG
        SG     G SGSG        RG GSG GG      G G G G G GRGGG G   GEGYGEG GYG G
Subjt:  SGRNDRNGGSGSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCTCCATCAGGGTTCTTGCTGTCCTTTGTTTAGTACTCTGTATGTCTGCGATTGAATCACAAGGCCGAATCATGAGGAAGGACTTGGGCCTTAATCTTGGTGGTTT
AGGAGTTGGAGTTGGAGTTGGTATAGGCTTGGGGTTAGGCTTAGGTGGTGGAAGTGGGTCGGGCTCTGGATCCGGGTCCGGATCTGGCTCCGGCTCCGGCTCGAGTTCAT
CTTCATCATCACACTCGTCAAGCTCTAGCTATGGCGGCTCCGAAGCTGGTTCCTATGCTGGTTCTTATGCAAGGTCAGGTTCAGGAAGGAATGATAGGAACGGTGGTTCG
GGGTCAGGCTCGGAATATGGCGAGGGCTCCGACAGAGGAAGCGGTAGTGGTGATGGCGGAGGAGAAGGTTACGGGGAGGGTCGTGGCTACGGCGAGGGTTCTGGCAGAGG
AAGAGGTGGCGGTGACGGTGACAGTAGAGGAGAAGGTTATGGGGAGGGTCGTGGATATGGGGAGGGACGTTGTTACCGAGAAGGCGGTAACAATTGA

mRNA sequence

Show/hide mRNA sequence

TCTCAATCGGCCTATAAATAGCTTCTCCAATCTTTCAACCGCTATAATACATTACCAAGTCAAGTTCACAATCCCATTCGATCGAGTCCATATCAGAAAATGGCCTCCAT
CAGGGTTCTTGCTGTCCTTTGTTTAGTACTCTGTATGTCTGCGATTGAATCACAAGGCCGAATCATGAGGAAGGACTTGGGCCTTAATCTTGGTGGTTTAGGAGTTGGAG
TTGGAGTTGGTATAGGCTTGGGGTTAGGCTTAGGTGGTGGAAGTGGGTCGGGCTCTGGATCCGGGTCCGGATCTGGCTCCGGCTCCGGCTCGAGTTCATCTTCATCATCA
CACTCGTCAAGCTCTAGCTATGGCGGCTCCGAAGCTGGTTCCTATGCTGGTTCTTATGCAAGGTCAGGTTCAGGAAGGAATGATAGGAACGGTGGTTCGGGGTCAGGCTC
GGAATATGGCGAGGGCTCCGACAGAGGAAGCGGTAGTGGTGATGGCGGAGGAGAAGGTTACGGGGAGGGTCGTGGCTACGGCGAGGGTTCTGGCAGAGGAAGAGGTGGCG
GTGACGGTGACAGTAGAGGAGAAGGTTATGGGGAGGGTCGTGGATATGGGGAGGGACGTTGTTACCGAGAAGGCGGTAACAATTGAAATCAAAAGTAAATAAGTGTGAGA
TATTTTGAATAGAACAATACCTAGTTGCACACCAAAGTATGGAAATCTTTCTACTCCATCATTCAATTGTTGACAATAAGAAAAGAGAAAATATTTTTTACCTTTTTTTT
TTAGTTGTGCTCCTCTCTCTTCGTTGTCAATTGAATGGTGGAGATATGAAGATTTCTGCAAACGAAAGTGTAGCTAAGTCTTTATCTTTCAAATGAAATCTCAATGCTAA
CTATAAATAGTTTTGTGTCATTGTGTGTGCTTATGATTTTCCTATAGTTTGAGGCAGCTTCAGATAAGTAAAATAAAAGTTGGTGTGTATTTTTACTGTACTGTTATGTG
TATACCTAAATATTGCTTTTGACTTGGGGCTTTTACTTCCACGGGGCTTGGACTGAGCTTTTAGGTAATAAAATAGGAAGATAATTAAGTGGCATGTTCCATTGTAATGA
AATCAAACCATTTGTGGC

Protein sequence

Show/hide protein sequence

MASIRVLAVLCLVLCMSAIESQGRIMRKDLGLNLGGLGVGVGVGIGLGLGLGGGSGSGSGSGSGSGSGSGSSSSSSSHSSSSSYGGSEAGSYAGSYARSGSGRNDRNGGS
GSGSEYGEGSDRGSGSGDGGGEGYGEGRGYGEGSGRGRGGGDGDSRGEGYGEGRGYGEGRCYREGGNN

Tan0015887 (gene) of Snake gourd v1 genome