; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0005608 (gene) of Snake gourd v1 genome

Gene IDTan0005608
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionUnknown protein
Genome locationLG02:92754231..92755043
RNA-Seq ExpressionTan0005608
SyntenyTan0005608
Gene Ontology termsNA
InterPro domainsIPR008004 - Protein OCTOPUS-like


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6598702.1 hypothetical protein SDJN03_08480, partial [Cucurbita argyrosperma subsp. sororia]5.2e-2656.47Show/hide
Query:  MPKNLIKLKNHAPVAAAAAAMGRNSN-----QSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS
        MPKNL KLK H   AA AAA GRN N      +  RCRKHPKHKQSPGVCS+CLREKL NL+IT      +T     A+  SSSSLSSLSSYY SSS PS
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSN-----QSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS

Query:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS
        SS+SP+FPR K  SS+S LFKRRST                 + ++ GFWSKLMMNRR K++V  +  RS
Subjt:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS

KAG7029644.1 hypothetical protein SDJN02_07984, partial [Cucurbita argyrosperma subsp. argyrosperma]1.5e-2556.47Show/hide
Query:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGG-----RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS
        MPKNL KLK H   AA AAA GR  N   G     RCRKHPKHKQSPGVCS+CLREKL NL+IT      +T     A+  SSSSLSSLSSYY SSS PS
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGG-----RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPS

Query:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS
        SS+SP+FPR K  SS+S LFKRRST                 + ++ GFWSKLMMNRR K++V     RS
Subjt:  SSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRS

XP_008444863.1 PREDICTED: uncharacterized serine-rich protein C215.13-like [Cucumis melo]9.8e-3358.95Show/hide
Query:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS
        MPKN +    KLK H     AAA M R+SN  G R      CRKHPKHKQSPGVCSVCLREKLCNL+IT +  ++ ++S+K     SSSSLSSLSSYY S
Subjt:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS

Query:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        SSSPSSSSSP+F   KP ISSM SLLFKRR +++  ++S +  +    G HR  NK  H GFWSKLMMNRRGKEIVEE   R +ST+  T
Subjt:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

XP_022131967.1 uncharacterized protein LOC111004952 [Momordica charantia]5.8e-2556.98Show/hide
Query:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP
        M KNL KLK+HA  AAA A   ++S   GGRCRKHPKH+QSPGVCS+CLREKL  L  T       +T+ K A   SSSSLSS+SS YSS+SS SS SSP
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP

Query:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT
             R + IS MS LFKRRS+  N L++SRSLAD          G WSKL++NRRGK   E+T RRS STT
Subjt:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT

XP_031736533.1 uncharacterized serine-rich protein C215.13-like [Cucumis sativus]1.9e-2854.87Show/hide
Query:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS
        MPKN +K    AP+A ++      A +G     +G   CRKHPKHKQSPGVCSVCLREKLCNL+IT + S+  ++S+K     SSSSLSSLSSYY SSSS
Subjt:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS

Query:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        PSSSSSP+    KP +SSM SLLFKRR            + TNF T     AD  H   N KSHHGFWSKLMMNRRGKEI+ E      S+T  T
Subjt:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

TrEMBL top hitse value%identityAlignment
A0A0A0LPJ0 Uncharacterized protein9.3e-2954.87Show/hide
Query:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS
        MPKN +K    AP+A ++      A +G     +G   CRKHPKHKQSPGVCSVCLREKLCNL+IT + S+  ++S+K     SSSSLSSLSSYY SSSS
Subjt:  MPKNLIKLKNHAPVAAAA------AAMGRNSNQSG-GRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSS

Query:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        PSSSSSP+    KP +SSM SLLFKRR            + TNF T     AD  H   N KSHHGFWSKLMMNRRGKEI+ E      S+T  T
Subjt:  PSSSSSPFFPRNKP-ISSM-SLLFKRR------------STTNFLTTSRSLADGDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

A0A1S3BC83 uncharacterized serine-rich protein C215.13-like4.7e-3358.95Show/hide
Query:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS
        MPKN +    KLK H     AAA M R+SN  G R      CRKHPKHKQSPGVCSVCLREKLCNL+IT +  ++ ++S+K     SSSSLSSLSSYY S
Subjt:  MPKNLI----KLKNHAPVAAAAAAMGRNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSS

Query:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT
        SSSPSSSSSP+F   KP ISSM SLLFKRR +++  ++S +  +    G HR  NK  H GFWSKLMMNRRGKEIVEE   R +ST+  T
Subjt:  SSSPSSSSSPFFPRNKP-ISSM-SLLFKRRSTTNFLTTSRSLAD----GDHR--NKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMAT

A0A4S4DSP3 Uncharacterized protein2.7e-1245.73Show/hide
Query:  RNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTN
        R S + G  C+KHPKH+QSPGVCSVCLREKL  LS T   +TT    TK +S SS SSLSSLSS+YS     SS SSP   R       SL  + +   N
Subjt:  RNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTN

Query:  FLTTSRSLA------DGDHRNK-KSHHGFWSKLMMNRR----GKEIVEETFRRSTSTTMATLVN
         L  SRS+A      DG+ R+  K   GFWSK +  RR    G  +   T R    TT +T V+
Subjt:  FLTTSRSLA------DGDHRNK-KSHHGFWSKLMMNRR----GKEIVEETFRRSTSTTMATLVN

A0A6J1BSJ2 uncharacterized protein LOC1110049522.8e-2556.98Show/hide
Query:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP
        M KNL KLK+HA  AAA A   ++S   GGRCRKHPKH+QSPGVCS+CLREKL  L  T       +T+ K A   SSSSLSS+SS YSS+SS SS SSP
Subjt:  MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP

Query:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT
             R + IS MS LFKRRS+  N L++SRSLAD          G WSKL++NRRGK   E+T RRS STT
Subjt:  --FFPRNKPISSMSLLFKRRST-TNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTT

F6H0X5 Uncharacterized protein1.3e-1148.61Show/hide
Query:  RNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFK
        R+ +Q GGR      CRKHPKH+QSPGVCS+CLRE+L  L     S+++++ ST  AS SSSSSLSS SS+YSSS + SS SSP         +      
Subjt:  RNSNQSGGR------CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFK

Query:  RRSTTNFLTTSRSLA--------DGDHRNKKSHHGFWSKLMMNR
          S  N LT SRS+A        D   RNKKS  GFWSKL+  R
Subjt:  RRSTTNFLTTSRSLA--------DGDHRNKKSHHGFWSKLMMNR

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G22470.1 unknown protein4.1e-0552.05Show/hide
Query:  CRKHPKHKQSPGVCSVCLREKLCNL--------SITGSSSTTKT-TSTKKASFSSSSSLSS--LSSYYSSSSS
        C+KHPKH+QSPG+CS+CL E L  L        S   SSS  KT +S   AS  S S  SS  +SSYYSS SS
Subjt:  CRKHPKHKQSPGVCSVCLREKLCNL--------SITGSSSTTKT-TSTKKASFSSSSSLSS--LSSYYSSSSS

AT1G35210.1 unknown protein1.1e-0535.88Show/hide
Query:  CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLA
        C+KHPKH+QSPGVCS+CL E+   LS+   +++++   +++   +SSS+ SSLSS    SSS SS  SP   R + +       +     +++T SRS+A
Subjt:  CRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISSMSLLFKRRSTTNFLTTSRSLA

Query:  ---DGDHRNK---KSHHGFWSKLMMNRRGKE
           D + R K   K++ GF+  L+M  + ++
Subjt:  ---DGDHRNK---KSHHGFWSKLMMNRRGKE

AT1G72240.1 unknown protein2.1e-0442.86Show/hide
Query:  NSNQSGG-RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP----FFPRNKPISSMSLLFK
        NSN      C+KH KH+QSPG+CS+CL E+L  LS+     T K   T     S+S+S SS  S   SSSS SS SSP    +  + K     S LF+
Subjt:  NSNQSGG-RCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSP----FFPRNKPISSMSLLFK


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCCAAAGAACTTGATCAAACTAAAGAATCATGCTCCGGTGGCGGCGGCGGCGGCGGCAATGGGAAGAAATTCCAACCAAAGTGGCGGCCGGTGTCGAAAGCACCCAAA
ACACAAGCAATCACCAGGCGTTTGCTCTGTTTGTCTAAGAGAAAAGCTCTGTAATTTGTCCATTACAGGCTCCTCCTCCACCACCAAAACAACCTCTACAAAAAAGGCCT
CTTTTTCATCTTCTTCTTCATTGTCATCTCTTTCCTCTTATTACTCTTCTTCTTCTTCCCCTTCTTCTTCCTCTTCCCCATTTTTTCCAAGAAACAAACCAATTTCTTCC
ATGTCTTTGCTCTTCAAACGAAGATCAACCACTAATTTCTTGACCACAAGTAGATCTCTAGCTGATGGAGATCATCGAAACAAGAAATCCCATCATGGGTTTTGGTCCAA
GTTGATGATGAATCGAAGAGGAAAAGAGATCGTTGAAGAAACTTTCAGACGTTCAACTTCTACAACAATGGCTACCTTAGTGAACAATTTGGATTAA
mRNA sequenceShow/hide mRNA sequence
CTTCCACAATTTTAAAATGATACAACAACAACAATGCCAAAGAACTTGATCAAACTAAAGAATCATGCTCCGGTGGCGGCGGCGGCGGCGGCAATGGGAAGAAATTCCAA
CCAAAGTGGCGGCCGGTGTCGAAAGCACCCAAAACACAAGCAATCACCAGGCGTTTGCTCTGTTTGTCTAAGAGAAAAGCTCTGTAATTTGTCCATTACAGGCTCCTCCT
CCACCACCAAAACAACCTCTACAAAAAAGGCCTCTTTTTCATCTTCTTCTTCATTGTCATCTCTTTCCTCTTATTACTCTTCTTCTTCTTCCCCTTCTTCTTCCTCTTCC
CCATTTTTTCCAAGAAACAAACCAATTTCTTCCATGTCTTTGCTCTTCAAACGAAGATCAACCACTAATTTCTTGACCACAAGTAGATCTCTAGCTGATGGAGATCATCG
AAACAAGAAATCCCATCATGGGTTTTGGTCCAAGTTGATGATGAATCGAAGAGGAAAAGAGATCGTTGAAGAAACTTTCAGACGTTCAACTTCTACAACAATGGCTACCT
TAGTGAACAATTTGGATTAATTGATTAATTAATCTCTTTTTATGAATTCTTATTATATTTTTCTCATATATTAGATAGATCTAGCTCTTATGTAACTTTTTCTAGTTTAA
AAAAAAAAAACAATGAAATACGCAAAGAGTTTCTTTTTATCTGTGGGATCCAAGAACTTCCAAACAAAAACAGGTCCCATTTTTTGGTTCTTGTTTTTTGTTCAATGCTT
GTGTAAATGTTCGAGTTGATCATGTAGTTGTTTGAATTATTAA
Protein sequenceShow/hide protein sequence
MPKNLIKLKNHAPVAAAAAAMGRNSNQSGGRCRKHPKHKQSPGVCSVCLREKLCNLSITGSSSTTKTTSTKKASFSSSSSLSSLSSYYSSSSSPSSSSSPFFPRNKPISS
MSLLFKRRSTTNFLTTSRSLADGDHRNKKSHHGFWSKLMMNRRGKEIVEETFRRSTSTTMATLVNNLD