; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CSPI01G09860 (gene) of Cucumber (PI 183967) v1 genome

Gene IDCSPI01G09860
OrganismCucumis sativus L. var. sativus cv. PI 183967 (Cucumber (PI 183967) v1)
DescriptionCentromere protein S-like
Genome locationChr1:6170972..6173895
RNA-Seq ExpressionCSPI01G09860
SyntenyCSPI01G09860
Gene Ontology termsGO:0000712 - resolution of meiotic recombination intermediates (biological process)
GO:0006312 - mitotic recombination (biological process)
GO:0007129 - synapsis (biological process)
GO:0031297 - replication fork processing (biological process)
GO:0036297 - interstrand cross-link repair (biological process)
GO:0043240 - Fanconi anaemia nuclear complex (cellular component)
GO:0071821 - FANCM-MHF complex (cellular component)
GO:0003682 - chromatin binding (molecular function)
GO:0046982 - protein heterodimerization activity (molecular function)
InterPro domainsIPR009072 - Histone-fold
IPR029003 - CENP-S/Mhf1


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004154006.1 protein MHF1 homolog isoform X2 [Cucumis sativus]5.6e-62100Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
        METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK

Query:  TKEPQSERKRKKAPKKDDRDRGAVHIADA
        TKEPQSERKRKKAPKKDDRDRGAVHIADA
Subjt:  TKEPQSERKRKKAPKKDDRDRGAVHIADA

XP_008440142.1 PREDICTED: centromere protein S isoform X1 [Cucumis melo]2.4e-5794.62Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
        MET MEEDDSASELLRDRFRLS+ISIAEAEANKSGMEISEPVMTCVADLAFK+ T+QLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL

Query:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA
        K KEPQSERKRKKAPKKDDRDRGAVHIA+A
Subjt:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA

XP_008440159.1 PREDICTED: centromere protein S isoform X2 [Cucumis melo]3.4e-5996.12Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
        MET MEEDDSASELLRDRFRLS+ISIAEAEANKSGMEISEPVMTCVADLAFK+TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK

Query:  TKEPQSERKRKKAPKKDDRDRGAVHIADA
         KEPQSERKRKKAPKKDDRDRGAVHIA+A
Subjt:  TKEPQSERKRKKAPKKDDRDRGAVHIADA

XP_011652290.1 protein MHF1 homolog isoform X1 [Cucumis sativus]4.0e-6098.46Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
        METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY T+QLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL

Query:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA
        KTKEPQSERKRKKAPKKDDRDRGAVHIADA
Subjt:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA

XP_038894699.1 protein MHF1 homolog isoform X2 [Benincasa hispida]3.2e-5792.25Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
        M+TG+EED SASELLRDRFRLS+ISIAEAEAN+SGMEISEPVMTCVADLAFKYTKQLAKDLELF QHAGRKSVNTEDVIL+AHRNEHL+AILTSICNDLK
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK

Query:  TKEPQSERKRKKAPKKDDRDRGAVHIADA
        TKEPQSERKRKKAPKK+DRDRGAVHI DA
Subjt:  TKEPQSERKRKKAPKKDDRDRGAVHIADA

TrEMBL top hitse value%identityAlignment
A0A0A0LR97 Uncharacterized protein2.7e-62100Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
        METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK

Query:  TKEPQSERKRKKAPKKDDRDRGAVHIADA
        TKEPQSERKRKKAPKKDDRDRGAVHIADA
Subjt:  TKEPQSERKRKKAPKKDDRDRGAVHIADA

A0A1S3B159 centromere protein S isoform X11.2e-5794.62Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
        MET MEEDDSASELLRDRFRLS+ISIAEAEANKSGMEISEPVMTCVADLAFK+ T+QLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL

Query:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA
        K KEPQSERKRKKAPKKDDRDRGAVHIA+A
Subjt:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA

A0A1S3B173 centromere protein S isoform X21.7e-5996.12Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
        MET MEEDDSASELLRDRFRLS+ISIAEAEANKSGMEISEPVMTCVADLAFK+TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK

Query:  TKEPQSERKRKKAPKKDDRDRGAVHIADA
         KEPQSERKRKKAPKKDDRDRGAVHIA+A
Subjt:  TKEPQSERKRKKAPKKDDRDRGAVHIADA

A0A5A7UM53 Centromere protein S isoform X11.2e-5794.62Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
        MET MEEDDSASELLRDRFRLS+ISIAEAEANKSGMEISEPVMTCVADLAFK+ T+QLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKY-TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDL

Query:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA
        K KEPQSERKRKKAPKKDDRDRGAVHIA+A
Subjt:  KTKEPQSERKRKKAPKKDDRDRGAVHIADA

A0A5D3BHQ8 Centromere protein S isoform X21.7e-5996.12Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
        MET MEEDDSASELLRDRFRLS+ISIAEAEANKSGMEISEPVMTCVADLAFK+TKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK

Query:  TKEPQSERKRKKAPKKDDRDRGAVHIADA
         KEPQSERKRKKAPKKDDRDRGAVHIA+A
Subjt:  TKEPQSERKRKKAPKKDDRDRGAVHIADA

SwissProt top hitse value%identityAlignment
E1BSW7 Centromere protein S1.6e-0626.61Show/hide
Query:  GMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKE
        G E+ +   + LR     ++  + +  A   G+  S+  +  ++++ F+  +  A+DLE+FA+HA R ++ +EDV L A R+  L   +T   ++L +  
Subjt:  GMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKE

Query:  PQSERKRKK
         + + K+KK
Subjt:  PQSERKRKK

Q2TBR7 Centromere protein S2.6e-0934.62Show/hide
Query:  IAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKEPQSERKRKKAPKKDDRDRGAVH
        + E  A+   M+ S+  +  ++++ F   +  AKDLE+FA+HA R ++NTEDV L A R+  L   +T    D+   +   E+K KK  K +D +R +V 
Subjt:  IAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKEPQSERKRKKAPKKDDRDRGAVH

Query:  IADA
         A+A
Subjt:  IADA

Q6NRI8 Centromere protein S1.8e-0727.68Show/hide
Query:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK
        M  G EE  S ++ L+        S+ +  A+   ++ S+  +  ++++ F+  +  AKDLE+FA+HA R ++N +DV L A R+  L A ++   +++ 
Subjt:  METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLK

Query:  TKEPQSERKRKK
            + + K+KK
Subjt:  TKEPQSERKRKK

Q8N2Z9 Centromere protein S2.4e-0729.69Show/hide
Query:  ETGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKT
        ET  ++  S  + L+     +   + E  A    M+ S+  +  +++L F+  +  AKDLE+FA+HA R ++NTEDV L A R+  L   +T    ++  
Subjt:  ETGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKT

Query:  KEPQSERKRKKAPKKDDRDRGAVHIADA
         +   ERK +K  K +D  + +   A+A
Subjt:  KEPQSERKRKKAPKKDDRDRGAVHIADA

Q9FI55 Protein MHF1 homolog3.2e-3669.3Show/hide
Query:  EDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKEPQS
        E+ S  +L+RDRFRLS+ISIAEAEA K+GMEI  PV+ CVADLAFKY + +AKDLELFA HAGRK VN +DV+L+AHRN++LAA L S+CN+LK KEPQS
Subjt:  EDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKEPQS

Query:  ERKRKK-APKKDDR
        ERKRKK + KK+D+
Subjt:  ERKRKK-APKKDDR

Arabidopsis top hitse value%identityAlignment
AT5G50930.1 Histone superfamily protein2.3e-3769.3Show/hide
Query:  EDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKEPQS
        E+ S  +L+RDRFRLS+ISIAEAEA K+GMEI  PV+ CVADLAFKY + +AKDLELFA HAGRK VN +DV+L+AHRN++LAA L S+CN+LK KEPQS
Subjt:  EDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKEPQS

Query:  ERKRKK-APKKDDR
        ERKRKK + KK+D+
Subjt:  ERKRKK-APKKDDR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAAACTGGAATGGAAGAAGACGACTCCGCTTCCGAACTCTTGAGGGACAGGTTCCGGCTCTCCTCTATTTCTATCGCTGAAGCTGAAGCGAATAAAAGCGGCATGGA
AATTTCTGAACCTGTGATGACTTGTGTTGCTGATTTAGCATTCAAATATACAAAACAGTTGGCGAAGGACCTTGAGTTATTTGCTCAGCATGCTGGTCGGAAGTCGGTAA
ATACAGAAGATGTAATACTAACAGCCCATAGAAACGAGCATTTAGCTGCCATATTAACATCCATCTGCAATGATCTAAAGACAAAAGAGCCACAAAGTGAAAGAAAGCGT
AAAAAGGCACCAAAAAAGGATGATAGAGATAGAGGTGCCGTGCATATTGCTGACGCCTAA
mRNA sequenceShow/hide mRNA sequence
GGAAAATAAATGCGAAATGGCAAAAGGTAAATTGTAAGCAATGGAAACTGGAATGGAAGAAGACGACTCCGCTTCCGAACTCTTGAGGGACAGGTTCCGGCTCTCCTCTA
TTTCTATCGCTGAAGCTGAAGCGAATAAAAGCGGCATGGAAATTTCTGAACCTGTGATGACTTGTGTTGCTGATTTAGCATTCAAATATACAAAACAGTTGGCGAAGGAC
CTTGAGTTATTTGCTCAGCATGCTGGTCGGAAGTCGGTAAATACAGAAGATGTAATACTAACAGCCCATAGAAACGAGCATTTAGCTGCCATATTAACATCCATCTGCAA
TGATCTAAAGACAAAAGAGCCACAAAGTGAAAGAAAGCGTAAAAAGGCACCAAAAAAGGATGATAGAGATAGAGGTGCCGTGCATATTGCTGACGCCTAATCACATCTCC
AATCAGGCAGATCTCTAGTTAACAAATGGCATATGGAGTTCTTCTGATTCAAAGGAAAAGCTTCTGTATCATGCAATTCATTGAAGTGTCCCAAATGCAGAAACATGCAT
TTTGGTTTGCTTTAGGCATTTGAGATTGTCAAAAAGCGTTTGGTTTAGTGTTTCTTAGCAGTTTTAGTTGCAAACAGGAAATTGCTCTTTGTACATCGACAGCACACTTT
TATAGTTAAAACTAGTTAGTGCTAAGGAGTTTGATATTGTGAGATCATAAATCATGTCCATCGTGCAAATTTAATCCTAGTTCTGCATTGAGTAGAATGGTTCAGCCCTC
TCTTTCTCTCTTGCTTTTCTCTTGAAAAAAAGAACCAATTCATCTTATTAATATATATTTCGAGC
Protein sequenceShow/hide protein sequence
METGMEEDDSASELLRDRFRLSSISIAEAEANKSGMEISEPVMTCVADLAFKYTKQLAKDLELFAQHAGRKSVNTEDVILTAHRNEHLAAILTSICNDLKTKEPQSERKR
KKAPKKDDRDRGAVHIADA