CuGenDBv2

Gene ID	Tan0022373
Organism	Trichosanthes anguina (Snake gourd v1)
Description	glycine-rich cell wall structural protein 1-like
Genome location	LG07:66803066..66804173
RNA-Seq Expression	Tan0022373
Synteny	Tan0022373
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0042689.1 uncharacterized protein E6C27_scaffold44G001870 [Cucumis melo var. makuwa]

2.3e-05

48.35

Show/hide

Query:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEG
        M+  QC+KP + +  Q QQKH Q    HCF  HV+DKIKGVF  GHHH Q   A+    H      +AN  HCK +   KKKEH  K KEG
Subjt:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEG

XP_008437383.1 PREDICTED: uncharacterized protein LOC103482815 [Cucumis melo]

4.2e-20

56.8

Show/hide

Query:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDA
        M+  QC+KP + +  Q QQKH Q    HCF  HV+DKIKGVF  GHHH Q   A+    H      +AN  HCK +   KKKEH  K KEGGLLHKIK+A
Subjt:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDA

Query:  FSDHSSDSSDSDSDKECHKAHHKKK
        FSDHSSDSSDS++  ECHK HH KK
Subjt:  FSDHSSDSSDSDSDKECHKAHHKKK

XP_022146004.1 uncharacterized protein LOC111015315 [Momordica charantia]

1.2e-19

57.38

Show/hide

Query:  MSSLQCSKPGEQSQQQQKHVQHQQDHCFSHVTDKIKGVF-GH-HHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDAFSD
        M+SLQCSKP +Q   Q +  +H Q HCF HV+DKIKGVF GH HHGQ P AA  H      + NA+  H        K++  HKNK+G LLHKIKDAFSD
Subjt:  MSSLQCSKPGEQSQQQQKHVQHQQDHCFSHVTDKIKGVF-GH-HHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDAFSD

Query:  HSSDSSDSDSDKECHKAHHKKK
        HSSDSSDSD+  E HKAH K K
Subjt:  HSSDSSDSDSDKECHKAHHKKK

XP_022958513.1 glycine-rich cell wall structural protein 1-like [Cucurbita moschata]

1.8e-07

45.92

Show/hide

Query:  GHHHGQPPVAAHGHEHGHGH------------SGNANAGHCKPA--------AGLKKKEHGHKNKEGGLLHKIKDAFSDHSSDSSDSDSDKECHKAHH
        GH HGQ     HG   GHGH              N N GHC+PA        AG  +K+  HKNKEGG L+KIKDAFSDH   S +SDSD +C +  H
Subjt:  GHHHGQPPVAAHGHEHGHGH------------SGNANAGHCKPA--------AGLKKKEHGHKNKEGGLLHKIKDAFSDHSSDSSDSDSDKECHKAHH

XP_038875375.1 uncharacterized protein LOC120067846 [Benincasa hispida]

1.1e-25

64.75

Show/hide

Query:  MSSLQCSKPGEQSQQQQKHVQHQQDHCF-SHVTDKIKGVF-GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDAFSD
        M+SLQC+KP +    QQKH Q Q  HCF  HV+DKIKGVF GHHHGQ P+A+    H      +ANA HCKP    KKKEH HKNKEGGLLHKIKDAFSD
Subjt:  MSSLQCSKPGEQSQQQQKHVQHQQDHCF-SHVTDKIKGVF-GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDAFSD

Query:  HSSDSSDSDSDKECHKAHHKKK
        HSSDSSDS++  EC K HH KK
Subjt:  HSSDSSDSDSDKECHKAHHKKK

TrEMBL top hits

e value

%identity

Alignment

A0A1S3AUH3 uncharacterized protein LOC103482815

2.0e-20

56.8

Show/hide

Query:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDA
        M+  QC+KP + +  Q QQKH Q    HCF  HV+DKIKGVF  GHHH Q   A+    H      +AN  HCK +   KKKEH  K KEGGLLHKIK+A
Subjt:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDA

Query:  FSDHSSDSSDSDSDKECHKAHHKKK
        FSDHSSDSSDS++  ECHK HH KK
Subjt:  FSDHSSDSSDSDSDKECHKAHHKKK

A0A5A7TMV4 Uncharacterized protein

1.1e-05

48.35

Show/hide

Query:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEG
        M+  QC+KP + +  Q QQKH Q    HCF  HV+DKIKGVF  GHHH Q   A+    H      +AN  HCK +   KKKEH  K KEG
Subjt:  MSSLQCSKPGEQS--QQQQKHVQHQQDHCF-SHVTDKIKGVF--GHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEG

A0A6J1CWW2 uncharacterized protein LOC111015315

6.0e-20

57.38

Show/hide

Query:  MSSLQCSKPGEQSQQQQKHVQHQQDHCFSHVTDKIKGVF-GH-HHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDAFSD
        M+SLQCSKP +Q   Q +  +H Q HCF HV+DKIKGVF GH HHGQ P AA  H      + NA+  H        K++  HKNK+G LLHKIKDAFSD
Subjt:  MSSLQCSKPGEQSQQQQKHVQHQQDHCFSHVTDKIKGVF-GH-HHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDAFSD

Query:  HSSDSSDSDSDKECHKAHHKKK
        HSSDSSDSD+  E HKAH K K
Subjt:  HSSDSSDSDSDKECHKAHHKKK

A0A6J1H399 glycine-rich cell wall structural protein 1-like

8.9e-08

45.92

Show/hide

Query:  GHHHGQPPVAAHGHEHGHGH------------SGNANAGHCKPA--------AGLKKKEHGHKNKEGGLLHKIKDAFSDHSSDSSDSDSDKECHKAHH
        GH HGQ     HG   GHGH              N N GHC+PA        AG  +K+  HKNKEGG L+KIKDAFSDH   S +SDSD +C +  H
Subjt:  GHHHGQPPVAAHGHEHGHGH------------SGNANAGHCKPA--------AGLKKKEHGHKNKEGGLLHKIKDAFSDHSSDSSDSDSDKECHKAHH

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

mRNA sequence

Show/hide mRNA sequence

ATGTCGTCTCTGCAATGCAGCAAACCAGGTGAGCAGAGCCAGCAGCAACAGAAGCACGTCCAACACCAACAAGACCATTGCTTCAGCCATGTCACCGACAAGATCAAAGG
CGTGTTTGGCCACCATCATGGACAGCCTCCGGTGGCGGCGCACGGACACGAACACGGACACGGCCACTCGGGCAATGCCAATGCAGGTCATTGCAAGCCTGCAGCAGGGT
TGAAGAAGAAGGAACATGGTCACAAAAACAAAGAAGGAGGTTTGTTGCACAAGATCAAGGATGCCTTTTCTGACCACAGCAGCGATAGCAGCGACAGTGACAGTGACAAA
GAGTGTCACAAAGCCCACCACAAAAAGAAGGCAAGTTTTCTATCTCTCCCTCTCAAGATCATTAGTGCAAACATTTAGTTTTTAGAGGGTTCTTACAACAAATGGTTCGA
TGTTCTCATTTTGATTTTGATTTGAGAATTAACTATAGTTTTTCAAATTTGTTAAACATATTGATATAATTAAATTTAGCGGTCTGATTGGTGATTTAAGATGGTATCAG
AGCAGGTGATCCAGAGAGGTCCTTCGTTCGAACCTCTCTGTAAAATCGTTTGCTCCTCAATTAATATTGATGTCCATTTCAAGTTTTTGATGTCGGGTTGAAATAGAATT
TACCAAGTGTATTTATTGGATTGTTTACTCACAAACCGTGAACATCAAGATGGGATTTTTTTTTTTTCTTTTTTTCTTTAGAATAACTAAAGGGGTGCAATAATATAAGA
ATTTTCAAAATGGATACTCTTGTATAGGTACGCTCAACTACAGAGTTTTGATACGATCTAGTACATTAGATCGTTAGTATGATTGCACCCAAGTTAGCGATCTTTTTGTT
AAAGATAATTTTAAGGGTAGTGGTCTAAGCTAGTGGTCAGAAGCTAATTATTTATTTGCCTATAAATACTCTTGTAATGTTTTCATTTTAATAAATAGGAAGATTTATCA
TTTCAAACGATTTGTATTTGTATTTTGATTTTGTATTTTCTCTTTGTTTTTGTTACATGTATGATGTATGACCTAATTCTTTTGATTGTATTTGCAGAACTTAAAGGGGA
AGAAATGT

Protein sequence

Show/hide protein sequence

MSSLQCSKPGEQSQQQQKHVQHQQDHCFSHVTDKIKGVFGHHHGQPPVAAHGHEHGHGHSGNANAGHCKPAAGLKKKEHGHKNKEGGLLHKIKDAFSDHSSDSSDSDSDK
ECHKAHHKKKASFLSLPLKIISANI

Tan0022373 (gene) of Snake gourd v1 genome