CuGenDBv2

Gene ID	Tan0005608
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Unknown protein
Genome location	LG02:92754231..92755043
RNA-Seq Expression	Tan0005608
Synteny	Tan0005608
Gene Ontology terms	NA
InterPro domains	IPR008004 - Protein OCTOPUS-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6598702.1 hypothetical protein SDJN03_08480, partial [Cucurbita argyrosperma subsp. sororia]

5.2e-26

56.47

Show/hide

Query:  MPKNLIKLKNHAPVAAAAAAMGRNSN-----QSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS
        MPKNL KLK H   AA AAA GRN N      +  RCRKHPKHKQSPGVCS+CLREKL NL+IT      +T     A+  SSSSLSSLSSYY SSS PS
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSN-----QSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS

Query:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS
        SS+SP+FPR K  SS+S LFKRRST                 + ++ GFWSKLMMNRR K++V  +  RS
Subjt:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS

KAG7029644.1 hypothetical protein SDJN02_07984, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.5e-25

56.47

Show/hide

Query:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGG-----RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS
        MPKNL KLK H   AA AAA GR  N   G     RCRKHPKHKQSPGVCS+CLREKL NL+IT      +T     A+  SSSSLSSLSSYY SSS PS
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGG-----RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS

Query:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS
        SS+SP+FPR K  SS+S LFKRRST                 + ++ GFWSKLMMNRR K++V     RS
Subjt:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS

XP_008444863.1 PREDICTED: uncharacterized serine-rich protein C215.13-like [Cucumis melo]

9.8e-33

58.95

Show/hide

Query:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS
        MPKN +    KLK H     AAA M R+SN  G R      CRKHPKHKQSPGVCSVCLREKLCNL+IT +  ++ ++S+K     SSSSLSSLSSYY S
Subjt:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS

Query:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        SSSPSSSSSP+F   KP ISSM SLLFKRR +++  ++S +  +    G HR  NK  H GFWSKLMMNRRGKEIVEE   R +ST+  T
Subjt:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

XP_022131967.1 uncharacterized protein LOC111004952 [Momordica charantia]

5.8e-25

56.98

Show/hide

Query:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP
        M KNL KLK+HA  AAA A   ++S   GGRCRKHPKH+QSPGVCS+CLREKL  L  T       +T+ K A   SSSSLSS+SS YSS+SS SS SSP
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP

Query:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT
             R + IS MS LFKRRS+  N L++SRSLAD          G WSKL++NRRGK   E+T RRS STT
Subjt:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT

XP_031736533.1 uncharacterized serine-rich protein C215.13-like [Cucumis sativus]

1.9e-28

54.87

Show/hide

Query:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS
        MPKN +K    AP+A ++      A +G     +G   CRKHPKHKQSPGVCSVCLREKLCNL+IT + S+  ++S+K     SSSSLSSLSSYY SSSS
Subjt:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS

Query:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        PSSSSSP+    KP +SSM SLLFKRR            + TNF T     AD  H   N KSHHGFWSKLMMNRRGKEI+ E      S+T  T
Subjt:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LPJ0 Uncharacterized protein

9.3e-29

54.87

Show/hide

Query:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS
        MPKN +K    AP+A ++      A +G     +G   CRKHPKHKQSPGVCSVCLREKLCNL+IT + S+  ++S+K     SSSSLSSLSSYY SSSS
Subjt:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS

Query:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        PSSSSSP+    KP +SSM SLLFKRR            + TNF T     AD  H   N KSHHGFWSKLMMNRRGKEI+ E      S+T  T
Subjt:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

A0A1S3BC83 uncharacterized serine-rich protein C215.13-like

4.7e-33

58.95

Show/hide

Query:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS
        MPKN +    KLK H     AAA M R+SN  G R      CRKHPKHKQSPGVCSVCLREKLCNL+IT +  ++ ++S+K     SSSSLSSLSSYY S
Subjt:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS

Query:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        SSSPSSSSSP+F   KP ISSM SLLFKRR +++  ++S +  +    G HR  NK  H GFWSKLMMNRRGKEIVEE   R +ST+  T
Subjt:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

A0A4S4DSP3 Uncharacterized protein

2.7e-12

45.73

Show/hide

Query:  RNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTN
        R S + G  C+KHPKH+QSPGVCSVCLREKL  LS T   +TT    TK +S SS SSLSSLSS+YS     SS SSP   R       SL  + +   N
Subjt:  RNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTN

Query:  FLTTSRSLA------DGDHRNK-KSHHGFWSKLMMNRR----GKEIVEETFRRSTSTTMATLVN
         L  SRS+A      DG+ R+  K   GFWSK +  RR    G  +   T R    TT +T V+
Subjt:  FLTTSRSLA------DGDHRNK-KSHHGFWSKLMMNRR----GKEIVEETFRRSTSTTMATLVN

A0A6J1BSJ2 uncharacterized protein LOC111004952

2.8e-25

56.98

Show/hide

Query:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP
        M KNL KLK+HA  AAA A   ++S   GGRCRKHPKH+QSPGVCS+CLREKL  L  T       +T+ K A   SSSSLSS+SS YSS+SS SS SSP
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP

Query:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT
             R + IS MS LFKRRS+  N L++SRSLAD          G WSKL++NRRGK   E+T RRS STT
Subjt:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT

F6H0X5 Uncharacterized protein

1.3e-11

48.61

Show/hide

Query:  RNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFK
        R+ +Q GGR      CRKHPKH+QSPGVCS+CLRE+L  L     S+++++ ST  AS SSSSSLSS SS+YSSS + SS SSP         +      
Subjt:  RNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFK

Query:  RRSTTNFLTTSRSLA--------DGDHRNKKSHHGFWSKLMMNR
          S  N LT SRS+A        D   RNKKS  GFWSKL+  R
Subjt:  RRSTTNFLTTSRSLA--------DGDHRNKKSHHGFWSKLMMNR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G22470.1 unknown protein

4.1e-05

52.05

Show/hide

Query:  CRKHPKHKQSPGVCSVCLREKLCNL--------SITGSSSTTKT-TSTKKASFSSSSSLSS--LSSYYSSSSS
        C+KHPKH+QSPG+CS+CL E L  L        S   SSS  KT +S   AS  S S  SS  +SSYYSS SS
Subjt:  CRKHPKHKQSPGVCSVCLREKLCNL--------SITGSSSTTKT-TSTKKASFSSSSSLSS--LSSYYSSSSS

AT1G35210.1 unknown protein

1.1e-05

35.88

Show/hide

Query:  CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLA
        C+KHPKH+QSPGVCS+CL E+   LS+   +++++   +++   +SSS+ SSLSS    SSS SS  SP   R + +       +     +++T SRS+A
Subjt:  CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLA

Query:  ---DGDHRNK---KSHHGFWSKLMMNRRGKE
           D + R K   K++ GF+  L+M  + ++
Subjt:  ---DGDHRNK---KSHHGFWSKLMMNRRGKE

AT1G72240.1 unknown protein

2.1e-04

42.86

Show/hide

Query:  NSNQSGG-RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP----FFPRNKPISSMSLLFK
        NSN      C+KH KH+QSPG+CS+CL E+L  LS+     T K   T     S+S+S SS  S   SSSS SS SSP    +  + K     S LF+
Subjt:  NSNQSGG-RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP----FFPRNKPISSMSLLFK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCAAAGAACTTGATCAAACTAAAGAATCATGCTCCGGTGGCGGCGGCGGCGGCGGCAATGGGAAGAAATTCCAACCAAAGTGGCGGCCGGTGTCGAAAGCACCCAAA
ACACAAGCAATCACCAGGCGTTTGCTCTGTTTGTCTAAGAGAAAAGCTCTGTAATTTGTCCATTACAGGCTCCTCCTCCACCACCAAAACAACCTCTACAAAAAAGGCCT
CTTTTTCATCTTCTTCTTCATTGTCATCTCTTTCCTCTTATTACTCTTCTTCTTCTTCCCCTTCTTCTTCCTCTTCCCCATTTTTTCCAAGAAACAAACCAATTTCTTCC
ATGTCTTTGCTCTTCAAACGAAGATCAACCACTAATTTCTTGACCACAAGTAGATCTCTAGCTGATGGAGATCATCGAAACAAGAAATCCCATCATGGGTTTTGGTCCAA
GTTGATGATGAATCGAAGAGGAAAAGAGATCGTTGAAGAAACTTTCAGACGTTCAACTTCTACAACAATGGCTACCTTAGTGAACAATTTGGATTAA

mRNA sequence

Show/hide mRNA sequence

CTTCCACAATTTTAAAATGATACAACAACAACAATGCCAAAGAACTTGATCAAACTAAAGAATCATGCTCCGGTGGCGGCGGCGGCGGCGGCAATGGGAAGAAATTCCAA
CCAAAGTGGCGGCCGGTGTCGAAAGCACCCAAAACACAAGCAATCACCAGGCGTTTGCTCTGTTTGTCTAAGAGAAAAGCTCTGTAATTTGTCCATTACAGGCTCCTCCT
CCACCACCAAAACAACCTCTACAAAAAAGGCCTCTTTTTCATCTTCTTCTTCATTGTCATCTCTTTCCTCTTATTACTCTTCTTCTTCTTCCCCTTCTTCTTCCTCTTCC
CCATTTTTTCCAAGAAACAAACCAATTTCTTCCATGTCTTTGCTCTTCAAACGAAGATCAACCACTAATTTCTTGACCACAAGTAGATCTCTAGCTGATGGAGATCATCG
AAACAAGAAATCCCATCATGGGTTTTGGTCCAAGTTGATGATGAATCGAAGAGGAAAAGAGATCGTTGAAGAAACTTTCAGACGTTCAACTTCTACAACAATGGCTACCT
TAGTGAACAATTTGGATTAATTGATTAATTAATCTCTTTTTATGAATTCTTATTATATTTTTCTCATATATTAGATAGATCTAGCTCTTATGTAACTTTTTCTAGTTTAA
AAAAAAAAAACAATGAAATACGCAAAGAGTTTCTTTTTATCTGTGGGATCCAAGAACTTCCAAACAAAAACAGGTCCCATTTTTTGGTTCTTGTTTTTTGTTCAATGCTT
GTGTAAATGTTCGAGTTGATCATGTAGTTGTTTGAATTATTAA

Protein sequence

Show/hide protein sequence

MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISS
MSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMATLVNNLD

Tan0005608 (gene) of Snake gourd v1 genome