CuGenDBv2

Gene ID	Sed0027172
Organism	Sechium edule (Chayote v1)
Description	centromere protein C-like isoform X1
Genome location	LG07:11816048..11822916
RNA-Seq Expression	Sed0027172
Synteny	Sed0027172
Gene Ontology terms	GO:0051382 - kinetochore assembly (biological process) GO:0000776 - kinetochore (cellular component) GO:0005634 - nucleus (cellular component) GO:0019237 - centromeric DNA binding (molecular function)
InterPro domains	IPR028386 - Centromere protein C/Mif2/cnp3

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7025745.1 hypothetical protein SDJN02_12243, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.0e-255

75.22

Show/hide

Query:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M  EEA+ S  IDPLA Y GI LFPSAFG+ PD SKP  +GTD+D IH HLKSMVSR+PSKL EQARSILDGNSNL QSEAATF+ NNEKKEE     E+
Subjt:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSLK D RQP V+LEP  DIKQLKDPE+FF AYER ENAK+EI++QTGAVLKDLN QN STN  R RRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNI--SPLGVEKGPSPPLIGSEKKTDEDVSFEEE--GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKP
         SENDQNVEPSQVT ESGNI  S  G EK  S P+I SE KTDEDVSFE+E  GEEF ASI K ENKV+KILDELLS NCEDLEGD+AI MLQE LQIKP
Subjt:  PSENDQNVEPSQVTFESGNI--SPLGVEKGPSPPLIGSEKKTDEDVSFEEE--GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKP

Query:  INLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNSS
        INLEKL LPDLEAT+TVNLKSS GNLPKRS  SVD+QLQ L+TLKSK+DD+N V+ TP S+ SPLASLSALN Q   SK S  PFSA  DIDQSPARN S
Subjt:  INLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNSS

Query:  PLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCLE
          ELSNHLSDA G++EQ S+S  KSLLT+ G  VAN   SPK+LIGDADS CKISSSNV  + QV   A  SG     EAKDISGS  EVEANEKLSC E
Subjt:  PLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCLE

Query:  AQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAGT
        AQ D VANAT+  DDEMEDH GSASEQPSTSK+D IK   VG+QSQLDQSTA CPEN VDG  RSS  D HDK KPKSRA K+RKGK+I GR SLAGAGT
Subjt:  AQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAGT

Query:  TWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        TWQCG+R+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVSD+YKDLVELAALH
Subjt:  TWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

XP_022953572.1 centromere protein C isoform X1 [Cucurbita moschata]

2.2e-258

75.37

Show/hide

Query:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M +EEA+ S  IDPLA Y GI+LFPSAFG LP  SKP D+GTD+DGIHKHLKSMVSR+PSKLIEQARSIL+GNSNL QS+AATF+V NEKKEE  AN E+
Subjt:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSLKPD RQP VNLEPTFDIKQLKDPEEFF AYER ENAKKEIQ+QTGA+LKDLNQQN STNT RQRRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPIN
         SE+DQNVEPSQVTFESG+ISP  LG EK  SPP+I SE KT+E+V  EEE E FVASIT +ENKVNKILDELLS NCEDLEGD+AI  LQE LQIKPIN
Subjt:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPIN

Query:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNSS
        LEKLCLPDLEA QT NL+SSRGNLP+RSLISVDSQLQR++ LKSK+DD+N V  ISTP S+ SPLASLSAL R+ S S   GDPFSAH D+DQS ARN S
Subjt:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNSS

Query:  PLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCLE
          ELSNHLSDA G++E+  +S   SLLT+   TVA    SPKIL+GD DS  KISSSNVLN+ Q  + A  S      EAKDISGSS EVE NEKLS LE
Subjt:  PLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCLE

Query:  AQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVD-GSRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAGT
        AQAD VA AT+ LDDEMEDHEGS SEQP+TSK+DAIKE  +G+Q+QLDQS A C EN VD  SRSS  D HDK K KSRA  QR+GKR++GR SLAGAGT
Subjt:  AQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVD-GSRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAGT

Query:  TWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        TWQ GVR+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVS EY +LVELAALH
Subjt:  TWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

XP_022960280.1 centromere protein C-like isoform X1 [Cucurbita moschata]

7.2e-254

74.74

Show/hide

Query:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M  EEA+ S  IDPLA Y GI LFPSAFG  PD SKP  +GTD+D IH HLKSMVSR+PSKL EQARSILDGNSNL QSEAATF+ NNEKKEE     E+
Subjt:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSL+ D RQP V+LEP  DIKQLKDPEEFF AYER ENA +EI++QTGAVLKDLN QN STN  R RRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISPL--GVEKGPSPPLIGSEKKTDEDVSFEEE-----GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQ
         SENDQNVEPSQVTFESGNIS    G EK  S P+I SE KTDEDVSFE+E     GEEF ASI K ENKV+KILDELLS NCEDLEGD+AI MLQE LQ
Subjt:  PSENDQNVEPSQVTFESGNISPL--GVEKGPSPPLIGSEKKTDEDVSFEEE-----GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQ

Query:  IKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPAR
        IKPINLEKL LPDLEAT+TVNLKSS GNLPKRS  SVD+QLQ L+TLKSK+DD+N V+ TP S+ SPLASLSALN Q   SK S  PFSA  DIDQSPAR
Subjt:  IKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPAR

Query:  NSSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLS
        N S  ELSNHLSDA G++EQ S+S  KSLLT+ G  VAN   SPK+LIGDADS CKISSSNV  + QV   A  SG     EAKDISGS  EVEANEKLS
Subjt:  NSSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLS

Query:  CLEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAG
        C EAQ D VANAT+  DDEMEDH GSASEQPSTSK+D IK   VG+QSQLDQSTA CPEN VDG  RSS  D  DK KPKSRA K+RKGK+I GR SLAG
Subjt:  CLEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAG

Query:  AGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        AGTTWQCG+R+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVSD+YKDLVELAALH
Subjt:  AGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

XP_022992183.1 centromere protein C-like isoform X1 [Cucurbita maxima]

5.7e-259

75.7

Show/hide

Query:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M +EEA+ S  IDPLA Y GI+LFPSAFG LP  SKP D+GTD+DGIHKHLKSMVSR+PSKLIEQARSIL+GNSNL QS+AATF+V NEKKEE  AN E+
Subjt:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSLKPD RQP VNLEPTFDIKQLKDPEEFF AYER ENAKKEIQ+QTGA+LKDLNQQN STNT RQRRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEE-FVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPI
         SE+DQ VEPSQVTFESG+ISP  LG EK  SPP+I SE KT+E+V FEEE EE FVASIT +ENKVNKILDELLS NCEDLEGDQAI  LQE LQIKPI
Subjt:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEE-FVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPI

Query:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNS
        NLEKLCLPDLEA QT+NL+SSRGNLP+RSLISVDSQLQR++ LKSK+DD+N V  ISTP S+ SPLASLSAL R+ S S   GDPFSAH D+DQS ARN 
Subjt:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNS

Query:  SPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL
        S  ELSNHLSDA G++E+  +S   SLLT+   TVA    SPKIL+GD +S  KISSSNVLN+ Q  + A  S  H   EAKDISGSS EVE NEKLS L
Subjt:  SPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL

Query:  EAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAG
        EAQAD VA AT+ LDDEMEDHEGS SEQP+TSK+DAIKE  +G+Q+ LDQSTA C EN VDG SRSS  D HDK K KSRA  QR+GKR++GR SLAGAG
Subjt:  EAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAG

Query:  TTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        TTWQ GVR+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVS EY +LVELAALH
Subjt:  TTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

XP_023548004.1 centromere protein C-like isoform X1 [Cucurbita pepo subsp. pepo]

2.8e-258

75.56

Show/hide

Query:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M +EEA+ S  IDPLA Y GI+LFPSAFG LP  SKP D GTD+DGIHKHLKSMVSR+PSKLIEQARSIL+ NSNL QS+AAT +V NEKKEE  AN E+
Subjt:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSLKPD RQP VNLEPTFDIKQLKDPEEFF AYER ENAKKEIQ+QTGA+LKDLNQQN STNT RQRRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEE-FVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPI
         SE+DQNVEPSQVTFESG+ISP  LG EK  SPP+I SE KT+E+V  EEE EE FVASIT +ENKVNKILDELLS NCEDLEGD+AI  LQE LQIKPI
Subjt:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEE-FVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPI

Query:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNS
        NLEKLCLPDLEA QT+NL+SSRGNLP+RSLISVDSQLQR++ LKSK+DD+N V  ISTP S+ SPLASLSAL R+ S S   GDPFSAH D+DQS ARN 
Subjt:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNS

Query:  SPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL
        S  ELSNHLSDA G++E+  +S   SLLT+   TVA    SPKIL+GD DS  KISSSNVLN+ Q  + A  S  H   EAKDISGSS EVE NEKLS L
Subjt:  SPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL

Query:  EAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAG
        EAQAD VA AT+ LDDEMEDHEGS SEQP+TSK+DAIKE  +G+Q+QLDQSTA C EN VDG SRSS  D HDK K KSRA  QR+GKR++GR SLAGAG
Subjt:  EAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAG

Query:  TTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        TTWQ GVR+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVS EY +LVELAALH
Subjt:  TTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DKM1 centromere protein C isoform X1

4.3e-244

71.15

Show/hide

Query:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M +EEA+ S  IDPLA Y GINLFPS FG+LPD SKP DLGT +D IHKHLKSMVSRSPSKLIEQAR+ILDGNSN+  SE ATF+V++++ +E  A  E+
Subjt:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSLKPDTRQP VNLE TF+IKQLKDPEEFF A+ER ENAK EIQ+QT  VLKDLNQQN STNT R RRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSF--EEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKP
         SE+DQNVEPSQVTFESGNISP  +G EK PSPP+IGSEK+T E V F  EEE EE V SITKSENKVN+ILDELLS NCEDLEGD+AI  LQE LQIKP
Subjt:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSF--EEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKP

Query:  INLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARN
        INLEKLCLPDL+A QTVNLKSSRGN PKRSLISVD+QLQR++T K K+DD++ V  +STPSS+ SPLAS+ ALNRQ   S  S DPFSAH DID+SPARN
Subjt:  INLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARN

Query:  SSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSC
         S  E  NHLSD   +++Q S+S  KS LT+ G  V N   SPK  IGD DS  KIS +NVLN+ +V   A  +G H   EAK+ISGS  EVE N+KLSC
Subjt:  SSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSC

Query:  LEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGA
        L A+AD +ANA++ LDDEMEDH+  ASEQ +TSK+DA KE   G+QSQLDQSTA   +NNVDG SRSS  D HDK KPKS A KQRK K I+ R SLAGA
Subjt:  LEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGA

Query:  GTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        GT W+ GVR+STRF+TRPLEYWKGERLLYGRVH SLATVIG+KYVSPAKGN QPT++VKSLVS++YK+LVE AALH
Subjt:  GTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

A0A6J1GNL2 centromere protein C isoform X1

1.0e-258

75.37

Show/hide

Query:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M +EEA+ S  IDPLA Y GI+LFPSAFG LP  SKP D+GTD+DGIHKHLKSMVSR+PSKLIEQARSIL+GNSNL QS+AATF+V NEKKEE  AN E+
Subjt:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSLKPD RQP VNLEPTFDIKQLKDPEEFF AYER ENAKKEIQ+QTGA+LKDLNQQN STNT RQRRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPIN
         SE+DQNVEPSQVTFESG+ISP  LG EK  SPP+I SE KT+E+V  EEE E FVASIT +ENKVNKILDELLS NCEDLEGD+AI  LQE LQIKPIN
Subjt:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPIN

Query:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNSS
        LEKLCLPDLEA QT NL+SSRGNLP+RSLISVDSQLQR++ LKSK+DD+N V  ISTP S+ SPLASLSAL R+ S S   GDPFSAH D+DQS ARN S
Subjt:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNSS

Query:  PLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCLE
          ELSNHLSDA G++E+  +S   SLLT+   TVA    SPKIL+GD DS  KISSSNVLN+ Q  + A  S      EAKDISGSS EVE NEKLS LE
Subjt:  PLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCLE

Query:  AQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVD-GSRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAGT
        AQAD VA AT+ LDDEMEDHEGS SEQP+TSK+DAIKE  +G+Q+QLDQS A C EN VD  SRSS  D HDK K KSRA  QR+GKR++GR SLAGAGT
Subjt:  AQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVD-GSRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAGT

Query:  TWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        TWQ GVR+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVS EY +LVELAALH
Subjt:  TWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

A0A6J1H774 centromere protein C-like isoform X2

1.0e-245

73.26

Show/hide

Query:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M  EEA+ S  IDPLA Y GI LFPSAFG  PD SKP  +GTD+D IH HLKSMVSR+PSKL EQARSILDGNSNL QSEAATF+ NNEKKEE     E+
Subjt:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSL+ D RQP V+LEP  DIKQLKDPEEFF AYER ENA +EI++QTGAVLKDLN QN STN  R RRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISPL--GVEKGPSPPLIGSEKKTDEDVSFEEE-----GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQ
         SENDQNVEPSQVTFESGNIS    G EK  S P+I SE KTDEDVSFE+E     GEEF ASI K ENKV+KILDELLS NCEDLEGD+AI MLQE LQ
Subjt:  PSENDQNVEPSQVTFESGNISPL--GVEKGPSPPLIGSEKKTDEDVSFEEE-----GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQ

Query:  IKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPAR
        IKPINLEKL LPDLEAT+TVNLKSS GNLPKRS  SVD+QLQ L+TLKSK+DD+N V+ TP S+ SPLASLSALN Q   SK S  PFSA  DIDQSPAR
Subjt:  IKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPAR

Query:  NSSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLS
        N S  ELSNHLSDA G++EQ S+S  KSLLT+ G  VAN   SPK+LIGDADS CKISSSNV  + QV   A  SG     EAKDISGS  EVEANEKLS
Subjt:  NSSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLS

Query:  CLEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAG
        C EAQ D VANAT+  DDEMEDH GSASEQPSTSK+D IK   VG+QSQLDQSTA CPEN VDG  RSS  D  DK KPKSRA K+RKGK+I GR SLAG
Subjt:  CLEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAG

Query:  AGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        AGTTWQCG+R+STRF+TRPLEYWKG           LATVIGLKYVSPAKGN QPT++VKSLVSD+YKDLVELAALH
Subjt:  AGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

A0A6J1H8M3 centromere protein C-like isoform X1

3.5e-254

74.74

Show/hide

Query:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M  EEA+ S  IDPLA Y GI LFPSAFG  PD SKP  +GTD+D IH HLKSMVSR+PSKL EQARSILDGNSNL QSEAATF+ NNEKKEE     E+
Subjt:  MASEEAQPS-QIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSL+ D RQP V+LEP  DIKQLKDPEEFF AYER ENA +EI++QTGAVLKDLN QN STN  R RRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISPL--GVEKGPSPPLIGSEKKTDEDVSFEEE-----GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQ
         SENDQNVEPSQVTFESGNIS    G EK  S P+I SE KTDEDVSFE+E     GEEF ASI K ENKV+KILDELLS NCEDLEGD+AI MLQE LQ
Subjt:  PSENDQNVEPSQVTFESGNISPL--GVEKGPSPPLIGSEKKTDEDVSFEEE-----GEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQ

Query:  IKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPAR
        IKPINLEKL LPDLEAT+TVNLKSS GNLPKRS  SVD+QLQ L+TLKSK+DD+N V+ TP S+ SPLASLSALN Q   SK S  PFSA  DIDQSPAR
Subjt:  IKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPAR

Query:  NSSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLS
        N S  ELSNHLSDA G++EQ S+S  KSLLT+ G  VAN   SPK+LIGDADS CKISSSNV  + QV   A  SG     EAKDISGS  EVEANEKLS
Subjt:  NSSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLS

Query:  CLEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAG
        C EAQ D VANAT+  DDEMEDH GSASEQPSTSK+D IK   VG+QSQLDQSTA CPEN VDG  RSS  D  DK KPKSRA K+RKGK+I GR SLAG
Subjt:  CLEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDGS-RSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAG

Query:  AGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        AGTTWQCG+R+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVSD+YKDLVELAALH
Subjt:  AGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

A0A6J1JYG6 centromere protein C-like isoform X1

2.8e-259

75.7

Show/hide

Query:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK
        M +EEA+ S  IDPLA Y GI+LFPSAFG LP  SKP D+GTD+DGIHKHLKSMVSR+PSKLIEQARSIL+GNSNL QS+AATF+V NEKKEE  AN E+
Subjt:  MASEEAQPSQ-IDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEK

Query:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI
        N QERRPALNRKRARFSLKPD RQP VNLEPTFDIKQLKDPEEFF AYER ENAKKEIQ+QTGA+LKDLNQQN STNT RQRRPGILGRSVRY+HQYS I
Subjt:  NLQERRPALNRKRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPI

Query:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEE-FVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPI
         SE+DQ VEPSQVTFESG+ISP  LG EK  SPP+I SE KT+E+V FEEE EE FVASIT +ENKVNKILDELLS NCEDLEGDQAI  LQE LQIKPI
Subjt:  PSENDQNVEPSQVTFESGNISP--LGVEKGPSPPLIGSEKKTDEDVSFEEEGEE-FVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPI

Query:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNS
        NLEKLCLPDLEA QT+NL+SSRGNLP+RSLISVDSQLQR++ LKSK+DD+N V  ISTP S+ SPLASLSAL R+ S S   GDPFSAH D+DQS ARN 
Subjt:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVDSQLQRLQTLKSKEDDKNLV--ISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNS

Query:  SPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL
        S  ELSNHLSDA G++E+  +S   SLLT+   TVA    SPKIL+GD +S  KISSSNVLN+ Q  + A  S  H   EAKDISGSS EVE NEKLS L
Subjt:  SPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL

Query:  EAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAG
        EAQAD VA AT+ LDDEMEDHEGS SEQP+TSK+DAIKE  +G+Q+ LDQSTA C EN VDG SRSS  D HDK K KSRA  QR+GKR++GR SLAGAG
Subjt:  EAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCPENNVDG-SRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAG

Query:  TTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH
        TTWQ GVR+STRF+TRPLEYWKGERLLYGRVH SLATVIGLKYVSPAKGN QPT++VKSLVS EY +LVELAALH
Subjt:  TTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKDLVELAALH

SwissProt top hits

e value

%identity

Alignment

Q66LG9 Centromere protein C

5.9e-49

29.27

Show/hide

Query:  DPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEKNLQERRPALNRK
        DPL  Y G++LFP     L +   P     D+   H  L+SM     S+  EQA++IL+                 +   +V  N   N +ERRP L+RK
Subjt:  DPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEKNLQERRPALNRK

Query:  RARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVR-YRHQYSPIPSENDQNVEPS
        R  FSL   T QP   + P+FD  +    E+FF AY++FE A +E Q+QTG+ + D+ +   S   RR RRPGI GR  R ++  ++     +  N+E S
Subjt:  RARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVR-YRHQYSPIPSENDQNVEPS

Query:  QVTFESGNISPLGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPINLEKLCLPDLEATQ
        +         P+  E+             D +V           S   ++  +N +L +LL+ + E+LEGD AI +L+E LQIK  N+EK  +P+ +  +
Subjt:  QVTFESGNISPLGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPINLEKLCLPDLEATQ

Query:  TVNLKSSRGNLPKR-SLISVDSQLQ---RLQTLKSKEDDKNLVISTPSSISSPLASLS------ALNRQFSPSKLSGDPFSAHDDIDQSPARNSSPLELS
         +NLK+S  N P R SL  + + L+   R+   K+        I   SS + P+   S       L     PS+++  P +   DI  +   N   ++++
Subjt:  TVNLKSSRGNLPKR-SLISVDSQLQ---RLQTLKSKEDDKNLVISTPSSISSPLASLS------ALNRQFSPSKLSGDPFSAHDDIDQSPARNSSPLELS

Query:  NHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNI------SQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL
        +  +D+     + S  D   + +    +  +   +P I + D+ S  + S+    N+       +VD   + SG +     ++      + E NE+   L
Subjt:  NHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNI------SQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL

Query:  EAQADVVA-NATDPL---DDEMEDHEGSASEQPSTSKLD--------AIKECSVGLQSQLDQSTA--------NCPE---------NNVDGSRSSEADLH
        E  A+  +   T P    +D +   +G++S+ P+ +              E + GL  + + +T         N PE         N      SS++++ 
Subjt:  EAQADVVA-NATDPL---DDEMEDHEGSASEQPSTSKLD--------AIKECSVGLQSQLDQSTA--------NCPE---------NNVDGSRSSEADLH

Query:  DKAKP----------------KSRAIKQRKGKR------------------ITGRHSLAGAGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATV
         ++K                 +SRA KQ KGK                    + R SLA AGT  + GVR+STR ++RPLEYW+GER LYGR+H SL TV
Subjt:  DKAKP----------------KSRAIKQRKGKR------------------ITGRHSLAGAGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATV

Query:  IGLKYVSPAKGNAQP-TMRVKSLVSDEYKDLVELAALH
        IG+KY SP +G       +VKS VSDEYK LV+ AALH
Subjt:  IGLKYVSPAKGNAQP-TMRVKSLVSDEYKDLVELAALH

Arabidopsis top hits

e value

%identity

Alignment

AT1G15660.1 centromere protein C

4.2e-50

29.27

Show/hide

Query:  DPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEKNLQERRPALNRK
        DPL  Y G++LFP     L +   P     D+   H  L+SM     S+  EQA++IL+                 +   +V  N   N +ERRP L+RK
Subjt:  DPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEKNLQERRPALNRK

Query:  RARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVR-YRHQYSPIPSENDQNVEPS
        R  FSL   T QP   + P+FD  +    E+FF AY++FE A +E Q+QTG+ + D+ +   S   RR RRPGI GR  R ++  ++     +  N+E S
Subjt:  RARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVR-YRHQYSPIPSENDQNVEPS

Query:  QVTFESGNISPLGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPINLEKLCLPDLEATQ
        +         P+  E+             D +V           S   ++  +N +L +LL+ + E+LEGD AI +L+E LQIK  N+EK  +P+ +  +
Subjt:  QVTFESGNISPLGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPINLEKLCLPDLEATQ

Query:  TVNLKSSRGNLPKR-SLISVDSQLQ---RLQTLKSKEDDKNLVISTPSSISSPLASLS------ALNRQFSPSKLSGDPFSAHDDIDQSPARNSSPLELS
         +NLK+S  N P R SL  + + L+   R+   K+        I   SS + P+   S       L     PS+++  P +   DI  +   N   ++++
Subjt:  TVNLKSSRGNLPKR-SLISVDSQLQ---RLQTLKSKEDDKNLVISTPSSISSPLASLS------ALNRQFSPSKLSGDPFSAHDDIDQSPARNSSPLELS

Query:  NHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNI------SQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL
        +  +D+     + S  D   + +    +  +   +P I + D+ S  + S+    N+       +VD   + SG +     ++      + E NE+   L
Subjt:  NHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILIGDADSTCKISSSNVLNI------SQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCL

Query:  EAQADVVA-NATDPL---DDEMEDHEGSASEQPSTSKLD--------AIKECSVGLQSQLDQSTA--------NCPE---------NNVDGSRSSEADLH
        E  A+  +   T P    +D +   +G++S+ P+ +              E + GL  + + +T         N PE         N      SS++++ 
Subjt:  EAQADVVA-NATDPL---DDEMEDHEGSASEQPSTSKLD--------AIKECSVGLQSQLDQSTA--------NCPE---------NNVDGSRSSEADLH

Query:  DKAKP----------------KSRAIKQRKGKR------------------ITGRHSLAGAGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATV
         ++K                 +SRA KQ KGK                    + R SLA AGT  + GVR+STR ++RPLEYW+GER LYGR+H SL TV
Subjt:  DKAKP----------------KSRAIKQRKGKR------------------ITGRHSLAGAGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATV

Query:  IGLKYVSPAKGNAQP-TMRVKSLVSDEYKDLVELAALH
        IG+KY SP +G       +VKS VSDEYK LV+ AALH
Subjt:  IGLKYVSPAKGNAQP-TMRVKSLVSDEYKDLVELAALH

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGAGCGAAGAAGCTCAACCCTCCCAGATCGATCCTCTTGCTTGTTATTTCGGCATCAATCTCTTCCCAAGTGCGTTTGGCGTCTTGCCGGATTCGTCAAAGCCACA
AGATCTCGGAACCGACATTGATGGCATCCACAAGCACCTCAAATCCATGGTCTCAAGAAGTCCTAGTAAACTTATAGAGCAAGCCAGATCAATTTTAGACGGTAACTCCA
ATTTGACACAATCTGAAGCTGCCACATTTATTGTAAACAATGAGAAAAAAGAGGAAGTTCCAGCGAATGGGGAGAAAAATCTACAAGAAAGAAGACCGGCCTTAAACCGA
AAGCGAGCTAGGTTTTCTTTAAAACCTGATACGAGACAACCTCGTGTGAACTTGGAGCCTACATTTGACATTAAACAACTGAAAGACCCCGAGGAGTTCTTTAAGGCCTA
CGAAAGGTTTGAAAATGCCAAAAAAGAAATTCAAAGACAGACGGGAGCAGTTTTGAAGGACTTGAACCAACAAAATTCATCTACAAATACACGCCGCCAACGTAGACCAG
GGATTCTTGGGAGGTCTGTTAGATACAGACATCAATATTCACCAATACCATCTGAAAATGATCAGAATGTAGAACCCTCTCAAGTGACATTTGAATCAGGTAATATCAGT
CCACTGGGAGTAGAAAAAGGGCCAAGTCCACCTTTAATTGGCTCAGAAAAGAAAACTGATGAAGATGTATCCTTTGAGGAGGAGGGGGAGGAGTTCGTTGCTTCAATAAC
CAAGTCAGAGAACAAAGTGAATAAAATTTTGGATGAATTACTCTCTGTTAATTGTGAAGATCTAGAAGGTGATCAAGCCATCGGCATGTTACAGGAGTACTTGCAGATTA
AACCCATTAACTTAGAAAAATTATGCCTTCCAGATTTAGAAGCCACCCAAACAGTGAATTTGAAATCGTCAAGAGGCAATCTGCCAAAGCGTAGTTTGATCAGTGTGGAC
AGTCAGTTACAAAGGTTACAAACTTTGAAATCGAAGGAGGATGATAAAAATTTGGTTATTTCGACACCATCTTCAATAAGTAGTCCATTGGCATCATTATCAGCCCTAAA
TAGGCAATTTTCACCTTCAAAGTTATCAGGTGATCCATTTTCAGCTCATGATGACATTGACCAATCACCAGCAAGAAATTCCTCCCCTCTTGAACTCAGTAATCACTTAT
CTGATGCACATGGTATGTCAGAGCAGCCAAGTCTTTCTGATTCGAAGTCACTTTTAACGGAAGGTGGCAGTACTGTAGCTAATGAAACTAATTCGCCCAAAATCCTAATT
GGAGATGCTGATTCCACATGTAAAATATCTTCGAGTAATGTGTTGAATATATCCCAAGTTGACAGTGTTGCCAACTCAAGTGGAATTCACACTATCGAGGAAGCTAAGGA
TATTAGTGGCAGCAGCATAGAAGTGGAAGCAAACGAGAAATTGAGTTGTCTTGAAGCTCAAGCTGATGTTGTGGCTAATGCAACTGACCCATTGGACGATGAGATGGAAG
ATCACGAAGGATCAGCTTCTGAGCAACCGAGCACATCCAAGCTGGATGCAATCAAAGAGTGTTCGGTTGGCCTTCAGAGTCAGTTGGACCAATCAACTGCTAATTGCCCA
GAAAATAATGTGGATGGGTCTAGGAGCAGTGAAGCAGATCTCCACGATAAGGCCAAGCCAAAATCTCGCGCAATCAAACAACGGAAAGGCAAAAGAATTACTGGAAGGCA
TAGCCTTGCAGGGGCTGGCACAACGTGGCAATGTGGGGTGAGAAAAAGTACCAGGTTCAGAACACGACCTTTGGAGTACTGGAAAGGTGAAAGGCTGTTGTATGGACGCG
TACATGCGAGCCTAGCAACAGTGATTGGGTTGAAGTATGTGTCTCCTGCAAAAGGTAATGCCCAACCAACCATGAGGGTGAAGTCTTTAGTCTCCGATGAGTACAAAGAT
CTTGTTGAATTAGCAGCTCTGCATTGA

mRNA sequence

Show/hide mRNA sequence

CTAAACTTCATCCAAACATCTAAGGACCATGTAAGCAAAACGACAAAATTTCAAACGGAGAAAGAATACGAAGATTTGGCGCGTTGGTTCGAATTAGGGTTTGGTTCAGA
GCAGGGCAACAATGGCGAGCGAAGAAGCTCAACCCTCCCAGATCGATCCTCTTGCTTGTTATTTCGGCATCAATCTCTTCCCAAGTGCGTTTGGCGTCTTGCCGGATTCG
TCAAAGCCACAAGATCTCGGAACCGACATTGATGGCATCCACAAGCACCTCAAATCCATGGTCTCAAGAAGTCCTAGTAAACTTATAGAGCAAGCCAGATCAATTTTAGA
CGGTAACTCCAATTTGACACAATCTGAAGCTGCCACATTTATTGTAAACAATGAGAAAAAAGAGGAAGTTCCAGCGAATGGGGAGAAAAATCTACAAGAAAGAAGACCGG
CCTTAAACCGAAAGCGAGCTAGGTTTTCTTTAAAACCTGATACGAGACAACCTCGTGTGAACTTGGAGCCTACATTTGACATTAAACAACTGAAAGACCCCGAGGAGTTC
TTTAAGGCCTACGAAAGGTTTGAAAATGCCAAAAAAGAAATTCAAAGACAGACGGGAGCAGTTTTGAAGGACTTGAACCAACAAAATTCATCTACAAATACACGCCGCCA
ACGTAGACCAGGGATTCTTGGGAGGTCTGTTAGATACAGACATCAATATTCACCAATACCATCTGAAAATGATCAGAATGTAGAACCCTCTCAAGTGACATTTGAATCAG
GTAATATCAGTCCACTGGGAGTAGAAAAAGGGCCAAGTCCACCTTTAATTGGCTCAGAAAAGAAAACTGATGAAGATGTATCCTTTGAGGAGGAGGGGGAGGAGTTCGTT
GCTTCAATAACCAAGTCAGAGAACAAAGTGAATAAAATTTTGGATGAATTACTCTCTGTTAATTGTGAAGATCTAGAAGGTGATCAAGCCATCGGCATGTTACAGGAGTA
CTTGCAGATTAAACCCATTAACTTAGAAAAATTATGCCTTCCAGATTTAGAAGCCACCCAAACAGTGAATTTGAAATCGTCAAGAGGCAATCTGCCAAAGCGTAGTTTGA
TCAGTGTGGACAGTCAGTTACAAAGGTTACAAACTTTGAAATCGAAGGAGGATGATAAAAATTTGGTTATTTCGACACCATCTTCAATAAGTAGTCCATTGGCATCATTA
TCAGCCCTAAATAGGCAATTTTCACCTTCAAAGTTATCAGGTGATCCATTTTCAGCTCATGATGACATTGACCAATCACCAGCAAGAAATTCCTCCCCTCTTGAACTCAG
TAATCACTTATCTGATGCACATGGTATGTCAGAGCAGCCAAGTCTTTCTGATTCGAAGTCACTTTTAACGGAAGGTGGCAGTACTGTAGCTAATGAAACTAATTCGCCCA
AAATCCTAATTGGAGATGCTGATTCCACATGTAAAATATCTTCGAGTAATGTGTTGAATATATCCCAAGTTGACAGTGTTGCCAACTCAAGTGGAATTCACACTATCGAG
GAAGCTAAGGATATTAGTGGCAGCAGCATAGAAGTGGAAGCAAACGAGAAATTGAGTTGTCTTGAAGCTCAAGCTGATGTTGTGGCTAATGCAACTGACCCATTGGACGA
TGAGATGGAAGATCACGAAGGATCAGCTTCTGAGCAACCGAGCACATCCAAGCTGGATGCAATCAAAGAGTGTTCGGTTGGCCTTCAGAGTCAGTTGGACCAATCAACTG
CTAATTGCCCAGAAAATAATGTGGATGGGTCTAGGAGCAGTGAAGCAGATCTCCACGATAAGGCCAAGCCAAAATCTCGCGCAATCAAACAACGGAAAGGCAAAAGAATT
ACTGGAAGGCATAGCCTTGCAGGGGCTGGCACAACGTGGCAATGTGGGGTGAGAAAAAGTACCAGGTTCAGAACACGACCTTTGGAGTACTGGAAAGGTGAAAGGCTGTT
GTATGGACGCGTACATGCGAGCCTAGCAACAGTGATTGGGTTGAAGTATGTGTCTCCTGCAAAAGGTAATGCCCAACCAACCATGAGGGTGAAGTCTTTAGTCTCCGATG
AGTACAAAGATCTTGTTGAATTAGCAGCTCTGCATTGATTTTCTGGATTTTGCATGCATAACCAAGTTTTGGTGTATTACATTGTATATTTTCTCAGCCATTTCTTCTAA
TATCATATGCATCTATCACAAGATGTCATTTTATTGTAAACATATGAAAGTTACTTTATCGCTCGTGTCATACGACTTGTTCTCGAATGACTCATTATTCTTAGGAAGTC
CTAGATATGCTATAACTATGTCTTGTATGATGTTGGCAACCTGAAAAACAAACTTGAAATTGATGAAGTCAGTTGGTATAGTTAGGTAGTACTGAACTGAAAATATTGTT
CATCGACTTGGCTCGAATAGATTTGATCCTTTATTTTGGTAAACTGTTTTGTTGGAGTTTTTTTACATGTTGGAGAG

Protein sequence

Show/hide protein sequence

MASEEAQPSQIDPLACYFGINLFPSAFGVLPDSSKPQDLGTDIDGIHKHLKSMVSRSPSKLIEQARSILDGNSNLTQSEAATFIVNNEKKEEVPANGEKNLQERRPALNR
KRARFSLKPDTRQPRVNLEPTFDIKQLKDPEEFFKAYERFENAKKEIQRQTGAVLKDLNQQNSSTNTRRQRRPGILGRSVRYRHQYSPIPSENDQNVEPSQVTFESGNIS
PLGVEKGPSPPLIGSEKKTDEDVSFEEEGEEFVASITKSENKVNKILDELLSVNCEDLEGDQAIGMLQEYLQIKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLISVD
SQLQRLQTLKSKEDDKNLVISTPSSISSPLASLSALNRQFSPSKLSGDPFSAHDDIDQSPARNSSPLELSNHLSDAHGMSEQPSLSDSKSLLTEGGSTVANETNSPKILI
GDADSTCKISSSNVLNISQVDSVANSSGIHTIEEAKDISGSSIEVEANEKLSCLEAQADVVANATDPLDDEMEDHEGSASEQPSTSKLDAIKECSVGLQSQLDQSTANCP
ENNVDGSRSSEADLHDKAKPKSRAIKQRKGKRITGRHSLAGAGTTWQCGVRKSTRFRTRPLEYWKGERLLYGRVHASLATVIGLKYVSPAKGNAQPTMRVKSLVSDEYKD
LVELAALH

Sed0027172 (gene) of Chayote v1 genome