; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sed0018093 (gene) of Chayote v1 genome

Gene IDSed0018093
OrganismSechium edule (Chayote v1)
Descriptionhistone-lysine N-methyltransferase SETD1B-like
Genome locationLG01:9116008..9116703
RNA-Seq ExpressionSed0018093
SyntenySed0018093
Gene Ontology termsNA
InterPro domainsIPR007789 - Protein of unknown function DUF688


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6607361.1 hypothetical protein SDJN03_00703, partial [Cucurbita argyrosperma subsp. sororia]3.4e-4457.92Show/hide
Query:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF
        M+ NSG DFGG F  GK +RLKSL+TR D+ T  +DYHTG+ ATVPF+WESEPGTPKANF  +G+  SPLTPPPSYFS+P  TP  H  N+ P  S  NF
Subjt:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF

Query:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF
        + SVF+KLS+NKA  L P SPGSSSSS SS   TS+          +SFDSRV      DE+E+ E+ +SPVSTLFF    G G+ D+G  CYPKLVKVF
Subjt:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF

Query:  TR
        ++
Subjt:  TR

KAG7037033.1 hypothetical protein SDJN02_00654, partial [Cucurbita argyrosperma subsp. argyrosperma]5.9e-4458Show/hide
Query:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF
        M+ NSG DFGG F  GK +RLKSL+TR D+ T  +DYHTG+ ATVPF+WESEPGTPKANF  +G+  SPLTPPPSYFS+P  TP  H  N+ P  S  NF
Subjt:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF

Query:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPT------SASAMSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVFTR
        + SVF+KLS+NKA  L P SPGSSSSS S+ T +      S   +SFDSRV      DE+E+ E+ +SPVSTLFF    G G+ D+G  CYPKLVKVF++
Subjt:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPT------SASAMSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVFTR

XP_022949317.1 uncharacterized protein LOC111452704 [Cucurbita moschata]6.9e-4558.42Show/hide
Query:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF
        M+ NSG DFGG F  GK +RLKSL+TR D+ T  +DYHTG+ ATVPF+WESEPGTPKANF  +G+  SPLTPPPSYFS+P  TP  H  N+ P  S  NF
Subjt:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF

Query:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF
        + SVF+KLS+NKA  L P SPGSSSSS SS T TS+          +SFDSRV      DE+E+ E+ +SPVSTLFF    G G+ D+G  CYPKLVKVF
Subjt:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF

Query:  TR
        ++
Subjt:  TR

XP_022997732.1 uncharacterized protein LOC111492604 [Cucurbita maxima]5.9e-4457.92Show/hide
Query:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF
        M+ NSG +FGG F  GK +RLKSL+TR D+ T  +DYHTG+ ATVPF+WESEPGTPKANF  +G+  SPLTPPPSYFS+P  TP  H  N+ P  S  NF
Subjt:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF

Query:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF
        + SVF+KLS+NKA  L P SPGSSSSS SS T TS+          +SFDSRV      DE+E+ E+ +SPVSTLFF    G G+ D+G  CYPKLVKVF
Subjt:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF

Query:  TR
        ++
Subjt:  TR

XP_038894794.1 uncharacterized protein LOC120083212 [Benincasa hispida]5.0e-4358.05Show/hide
Query:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMS-TTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFS-------APLTPQHHNVNSKP
        + RNS  D GG     + +RLK LRTR DMS    +DYHTG+ A+VPF WESEPGTPKANF  NGA  SPLTPPPSYFS       +PLT    + +SKP
Subjt:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMS-TTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFS-------APLTPQHHNVNSKP

Query:  CSSATNFINSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPT-------SASAMSFDSRVDEDEDRED--VESPVSTLFFETRSGRGARDEGCYPKLVKVF
         SS +NF+NSVFRKLS+     LQPPSP  S SS SS+T +       S   +SFDSRVD+D++ +D  VESPVSTLFF    G G+ D+GCYPKLVKVF
Subjt:  CSSATNFINSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPT-------SASAMSFDSRVDEDEDRED--VESPVSTLFFETRSGRGARDEGCYPKLVKVF

Query:  TRDSK
        TRDSK
Subjt:  TRDSK

TrEMBL top hitse value%identityAlignment
A0A0A0LYC9 Uncharacterized protein3.0e-3856.93Show/hide
Query:  RNSGSDFGGNFKHGKSLRLKSLRTRVDMST---TGDDYHTGLPATVPFLWESEPGTPKANFSPNGAR--FSPLTPPPSYFSAPL----TPQHHNVNSKPC
        RNSG    G+ K GK +RLK LR R DMST     +DYHTGL A+VPF WESEPGTPKAN +   +R   SPLTPPPSYFS  L    +P  H ++SKP 
Subjt:  RNSGSDFGGNFKHGKSLRLKSLRTRVDMST---TGDDYHTGLPATVPFLWESEPGTPKANFSPNGAR--FSPLTPPPSYFSAPL----TPQHHNVNSKPC

Query:  SSATNFINSVFRKLSMNKAGFLQPPSPGSSSSSYSSATP---TSASAMSFDSRVDEDEDRE----DVESPVSTLFFETRSGRGARDEGCYPKLVKVFTRD
         +  +F+N+VFRKLS+ K   LQPPSP SSSSS S+       S   +SFDSRVD+D+D E    ++ESPVSTLFF  RS     D+GCYPKLVKVFTR 
Subjt:  SSATNFINSVFRKLSMNKAGFLQPPSPGSSSSSYSSATP---TSASAMSFDSRVDEDEDRE----DVESPVSTLFFETRSGRGARDEGCYPKLVKVFTRD

Query:  SK
        SK
Subjt:  SK

A0A6J1GBP3 uncharacterized protein LOC1114527043.3e-4558.42Show/hide
Query:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF
        M+ NSG DFGG F  GK +RLKSL+TR D+ T  +DYHTG+ ATVPF+WESEPGTPKANF  +G+  SPLTPPPSYFS+P  TP  H  N+ P  S  NF
Subjt:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF

Query:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF
        + SVF+KLS+NKA  L P SPGSSSSS SS T TS+          +SFDSRV      DE+E+ E+ +SPVSTLFF    G G+ D+G  CYPKLVKVF
Subjt:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF

Query:  TR
        ++
Subjt:  TR

A0A6J1HLP7 uncharacterized protein LOC1114647333.4e-3757.87Show/hide
Query:  RLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSA-PLTPQHHNVNSKPCSSATNFINSVFRKLSMNKAGFLQPP
        +LK +RTR DM    +DYHTG+ A+VPF WESEPGTPKANF  NGA  SPLTPPPSYFS  P +P    +NS       +F+N+VFRKLSM  +  LQP 
Subjt:  RLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSA-PLTPQHHNVNSKPCSSATNFINSVFRKLSMNKAGFLQPP

Query:  SPG------SSSSSYSSATPTSASAMSFDSRVDED--EDREDVESPVSTLFFETRSGRGARDEGCYPKLVKVFTRDSK
        SPG      SSSSS    TP S   +SFDSRVD+D     E+VESPVSTL F    G G  D+GCYP LVKVF RDSK
Subjt:  SPG------SSSSSYSSATPTSASAMSFDSRVDED--EDREDVESPVSTLFFETRSGRGARDEGCYPKLVKVFTRDSK

A0A6J1I3P2 uncharacterized protein LOC1114693814.7e-3960.89Show/hide
Query:  RLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSA-PLTPQHHNVNSKPCSSATNFINSVFRKLSMNKAGFLQPP
        +LK +RTR DM    +DYHTG+ A+VPF WESEPGTPKANF  NGA  SPLTPPPSYFS  P +P   N +SKP   A +F+N+VFRKLSM  +  LQP 
Subjt:  RLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSA-PLTPQHHNVNSKPCSSATNFINSVFRKLSMNKAGFLQPP

Query:  SPG-------SSSSSYSSATPTSASAMSFDSRVDED--EDREDVESPVSTLFFETRSGRGARDEGCYPKLVKVFTRDSK
        SPG       SSSSS    TP S   +SFDSRVD+D   + E+VESPVSTL F    G G  DEGCYPKLVKVFTRDSK
Subjt:  SPG-------SSSSSYSSATPTSASAMSFDSRVDED--EDREDVESPVSTLFFETRSGRGARDEGCYPKLVKVFTRDSK

A0A6J1K5W9 uncharacterized protein LOC1114926042.8e-4457.92Show/hide
Query:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF
        M+ NSG +FGG F  GK +RLKSL+TR D+ T  +DYHTG+ ATVPF+WESEPGTPKANF  +G+  SPLTPPPSYFS+P  TP  H  N+ P  S  NF
Subjt:  MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL-TPQHHNVNSKPCSSATNF

Query:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF
        + SVF+KLS+NKA  L P SPGSSSSS SS T TS+          +SFDSRV      DE+E+ E+ +SPVSTLFF    G G+ D+G  CYPKLVKVF
Subjt:  INSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTSASA--------MSFDSRV------DEDEDREDVESPVSTLFFETRSGRGARDEG--CYPKLVKVF

Query:  TR
        ++
Subjt:  TR

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G06930.1 unknown protein5.3e-1134.52Show/hide
Query:  DYHTGLPATVPFLWESEPGTPK------------ANFSPNGARFSPLTPPPSYFSAPLTPQHHNVNSKPCSSATNFINSVFRK-LSMNKAGFLQPPSPGS
        DY+ G  A VPF WES+PGTP+            ++   N    +PLTPPPSYF A  +   H    K         N++F   LS N++    P SP S
Subjt:  DYHTGLPATVPFLWESEPGTPK------------ANFSPNGARFSPLTPPPSYFSAPLTPQHHNVNSKPCSSATNFINSVFRK-LSMNKAGFLQPPSPGS

Query:  SSSSYSSATPTSASAMSFDSRVDEDEDREDVESPVSTLFFETRS-----GRGARDEGCYPKLVKVFTR
        SSSS SS+ P+S    S            D+ +   +++FE+ S        A+  GCY  LVKV  R
Subjt:  SSSSYSSATPTSASAMSFDSRVDEDEDREDVESPVSTLFFETRS-----GRGARDEGCYPKLVKVFTR

AT2G40475.1 unknown protein2.9e-0935.66Show/hide
Query:  ATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPLTPQHHNVNSKPCSSATNFINSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTS-------A
        A+VPFLWE+ PGTPK        R  PLTPPPSY+S+  +   + ++       T F+ ++  +  +++  F    +  SSSSSYSS++P S        
Subjt:  ATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPLTPQHHNVNSKPCSSATNFINSVFRKLSMNKAGFLQPPSPGSSSSSYSSATPTS-------A

Query:  SAMSFDSRVDEDEDREDV-ESPVSTLFFE
              S V ED++ E V  SP STL ++
Subjt:  SAMSFDSRVDEDEDREDV-ESPVSTLFFE

AT3G56260.2 unknown protein4.2e-0838.52Show/hide
Query:  ATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL--TPQHHNVNSKPCSSATNFIN-SVFRKLSMNKAGFLQPPSPG------SSSSSYSSATPT
        A++PF+WES PGTPK +   + +   PLTPPPSY+S+ +  TP+     SK  S  + F++ S+F  L  +  G  +  S        SSSSS+SS+ P 
Subjt:  ATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPL--TPQHHNVNSKPCSSATNFIN-SVFRKLSMNKAGFLQPPSPG------SSSSSYSSATPT

Query:  S-ASAMSFDSR-------VDEDEDREDVESPVSTL
        S    MS D +        +EDE R    SP STL
Subjt:  S-ASAMSFDSR-------VDEDEDREDVESPVSTL

AT5G01790.1 unknown protein7.5e-0554.76Show/hide
Query:  YHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFS
        Y+ G    VPF WES PGTPK + S       PLTPPPS+FS
Subjt:  YHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFS

AT5G51680.1 hydroxyproline-rich glycoprotein family protein8.2e-0453.12Show/hide
Query:  PATVPFLWESEPGTPKANFSPNGARFSPLTPP
        P +VPF+WE  PG PK N+ P+ A F P  PP
Subjt:  PATVPFLWESEPGTPKANFSPNGARFSPLTPP


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCAAGAAATTCAGGATCAGATTTTGGAGGAAATTTCAAACATGGGAAGAGTTTAAGGCTGAAAAGCTTGAGAACCCGAGTCGACATGTCGACCACAGGGGACGATTA
CCACACAGGATTACCAGCGACAGTACCATTCCTGTGGGAGTCCGAGCCAGGGACTCCCAAGGCCAATTTCAGCCCGAACGGGGCGCGGTTCTCGCCACTCACGCCCCCGC
CTTCGTATTTCTCCGCACCACTCACGCCCCAGCATCATAATGTTAACTCCAAGCCATGTTCCTCTGCAACCAATTTCATCAACTCGGTTTTTCGAAAGCTTTCTATGAAT
AAGGCCGGTTTTTTGCAACCTCCCTCCCCCGGTTCATCGTCGTCCTCGTATTCGTCTGCGACACCGACGAGCGCCTCTGCAATGTCGTTCGATTCGAGGGTGGACGAGGA
CGAGGATCGGGAGGATGTGGAATCTCCTGTTTCGACTTTGTTCTTTGAAACTCGAAGTGGAAGAGGAGCAAGGGATGAAGGATGCTATCCAAAGTTGGTCAAGGTATTCA
CCAGAGATTCTAAATGA
mRNA sequenceShow/hide mRNA sequence
ATGGATATTCATATCAGAATTGGTGGATCATATCAACCTTGAGAGCAAGAACAACATATCCAATATGGCAAGAAATTCAGGATCAGATTTTGGAGGAAATTTCAAACATG
GGAAGAGTTTAAGGCTGAAAAGCTTGAGAACCCGAGTCGACATGTCGACCACAGGGGACGATTACCACACAGGATTACCAGCGACAGTACCATTCCTGTGGGAGTCCGAG
CCAGGGACTCCCAAGGCCAATTTCAGCCCGAACGGGGCGCGGTTCTCGCCACTCACGCCCCCGCCTTCGTATTTCTCCGCACCACTCACGCCCCAGCATCATAATGTTAA
CTCCAAGCCATGTTCCTCTGCAACCAATTTCATCAACTCGGTTTTTCGAAAGCTTTCTATGAATAAGGCCGGTTTTTTGCAACCTCCCTCCCCCGGTTCATCGTCGTCCT
CGTATTCGTCTGCGACACCGACGAGCGCCTCTGCAATGTCGTTCGATTCGAGGGTGGACGAGGACGAGGATCGGGAGGATGTGGAATCTCCTGTTTCGACTTTGTTCTTT
GAAACTCGAAGTGGAAGAGGAGCAAGGGATGAAGGATGCTATCCAAAGTTGGTCAAGGTATTCACCAGAGATTCTAAATGAGAGATCTTTTGATCATAATTTTATATATA
TATATAAAAATAAAGAGAATTAATAATATATGAGAG
Protein sequenceShow/hide protein sequence
MARNSGSDFGGNFKHGKSLRLKSLRTRVDMSTTGDDYHTGLPATVPFLWESEPGTPKANFSPNGARFSPLTPPPSYFSAPLTPQHHNVNSKPCSSATNFINSVFRKLSMN
KAGFLQPPSPGSSSSSYSSATPTSASAMSFDSRVDEDEDREDVESPVSTLFFETRSGRGARDEGCYPKLVKVFTRDSK