CuGenDBv2

Gene ID	Tan0003753
Organism	Trichosanthes anguina (Snake gourd v1)
Description	centromere protein C-like isoform X1
Genome location	LG06:2607655..2613147
RNA-Seq Expression	Tan0003753
Synteny	Tan0003753
Gene Ontology terms	GO:0051315 - attachment of mitotic spindle microtubules to kinetochore (biological process) GO:0051382 - kinetochore assembly (biological process) GO:0051455 - attachment of spindle microtubules to kinetochore involved in homologous chromosome segregation (biological process) GO:0000776 - kinetochore (cellular component) GO:0005634 - nucleus (cellular component) GO:0019237 - centromeric DNA binding (molecular function)
InterPro domains	IPR028386 - Centromere protein C/Mif2/cnp3

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7025745.1 hypothetical protein SDJN02_12243, partial [Cucurbita argyrosperma subsp. argyrosperma]

4.8e-298

83.63

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MV+EEAR S VIDPLAAYSG+ LFPSAFGIFPDPS+PH +GTDLD IH HL+SMVSR+PSKL EQARSILDGNSNL+QSE ATFL NNEKKEEAT KA+E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLK DARQPPV+LE   DIKQLKDPE+FFLAYERLENAKREI+KQTGAVLKDLN  NPSTN R RRPGILGRSVRYKHQYSSI 
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFF--EEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPI
        SENDQNVEPSQVT ESGNIN SI GTEKD R PII SE KTDEDV F  EEG EEF ASI K ENKV+KILDELLSANCEDLEGD+AIN+LQE LQIKPI
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFF--EEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPI

Query:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSVISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSPS
        NLEKL LPDLEAT+TVNLKSS GNLPKRS   VDNQLQ +ETLKSKQDDENSV+ +P SMRSPLASLSALN QI LSKSS  PFSA DI QSPA NPS  
Subjt:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSVISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSPS

Query:  ELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEAQ
        EL NHLSDAVGIAEQSSVSKL SLLTKDG  VANGIKSPK+L+GD DSICKI SSNV  V QVG  AALS   A ME K+ISGS AEVEANEKLSC EAQ
Subjt:  ELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEAQ

Query:  AAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTTW
          AVANATN  DDEMEDH GSASEQPSTSKVD IK YPVGIQSQLDQ+TATCPENIVDGP RSSGTDHHDK+KPKSRA+K+RK K+I GRQSLAGAGTTW
Subjt:  AAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTTW

Query:  ECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        +CG+RRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+++KDLVELAALH
Subjt:  ECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

XP_022953572.1 centromere protein C isoform X1 [Cucurbita moschata]

3.2e-302

83.63

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MVNEEARHSDVIDPLAAYSG++LFPSAFG  P PS+PHD+GTDLDGIHKHL+SMVSR+PSKLIEQARSIL+GNSNL+QS+ ATFLV NEKKEEA A  +E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDARQP VNLE TFDIKQLKDPEEFFLAYERLENAK+EIQKQTGA+LKDLNQ NPSTNTRQRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINL
        SE+DQNVEPSQVTFESG+I+PSILGTEKD  PPII SE KT+E+V  EE EE FVASIT AENKVNKILDELLSANCEDLEGD+AIN LQECLQIKPINL
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINL

Query:  EKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSPS
        EKLCLPDLEA QT NL+SSRGNLP+RSLI VD+QLQRIE LKSKQDDENSV  IS+P SMRSPLASLSAL R+ISLS S GDPFSAHD+ QS A NPS  
Subjt:  EKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSPS

Query:  ELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEAQ
        EL NHLSDAVGIAE+  VS+L SLLTKD   VA GIKSPKIL+GDVDSI KI SSNVLNVPQ G+ AALSE  A+ME K+ISGSS EVE NEKLS LEAQ
Subjt:  ELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEAQ

Query:  AAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTTW
        A AVA ATN LDDEMEDHEGS SEQP+TSKVDAIKEYP+GIQ+QLDQ+ ATC ENIVD PSRSSGTD+HDK+K KSRA  QR+ KR+SGR+SLAGAGTTW
Subjt:  AAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTTW

Query:  ECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        + GVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+E+ +LVELAALH
Subjt:  ECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

XP_022960280.1 centromere protein C-like isoform X1 [Cucurbita moschata]

8.4e-295

82.67

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MV+EEAR S VIDPLAAYSG+ LFPSAFG FPDPS+PH +GTDLD IH HL+SMVSR+PSKL EQARSILDGNSNL+QSE ATFL NNEKKEEAT KA+E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSL+ DARQPPV+LE   DIKQLKDPEEFFLAYERLENA REI+KQTGAVLKDLN  NPSTN R RRPGILGRSVRYKHQYSSI 
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEE-----GEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQI
        SENDQNVEPSQVTFESGNI+ SI GTEKD R PII SE KTDEDV FE+     G EEF ASI K ENKV+KILDELLSANCEDLEGD+AIN+LQE LQI
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEE-----GEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQI

Query:  KPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSVISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNP
        KPINLEKL LPDLEAT+TVNLKSS GNLPKRS   VDNQLQ +ETLKSKQDDENSV+ +P SMRSPLASLSALN QI LSKSS  PFSA DI QSPA NP
Subjt:  KPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSVISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNP

Query:  SPSELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCL
        S  EL NHLSDAVGIAEQSSVSKL SLLTKDG  VANGIKSPK+L+GD DSICKI SSNV  V QVG  AALS   A ME K+ISGS AEVEANEKLSC 
Subjt:  SPSELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCL

Query:  EAQAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAG
        EAQ  AVANATN  DDEMEDH GSASEQPSTSKVD IK YPVGIQSQLDQ+TATCPENIVDGP RSSGTDH DK+KPKSRA+K+RK K+I GRQSLAGAG
Subjt:  EAQAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAG

Query:  TTWECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        TTW+CG+RRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+++KDLVELAALH
Subjt:  TTWECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

XP_022992183.1 centromere protein C-like isoform X1 [Cucurbita maxima]

1.4e-302

83.8

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MVNEEARHSDVIDPLAAYSG++LFPSAFG  P PS+PHD+GTDLDGIHKHL+SMVSR+PSKLIEQARSIL+GNSNL+QS+ ATFLV NEKKEEA A  +E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDARQPPVNLE TFDIKQLKDPEEFFLAYERLENAK+EIQKQTGA+LKDLNQ NPSTNTRQRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN
        SE+DQ VEPSQVTFESG+I+PS LGTEKD  PPII SE KT+E+V FEE EEE FVASIT AENKVNKILDELLSANCEDLEGDQAIN LQECLQIKPIN
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN

Query:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP
        LEKLCLPDLEA QT+NL+SSRGNLP+RSLI VD+QLQRIE LKSKQDDENSV  IS+P SMRSPLASLSAL R+ISLS S GDPFSAHD+ QS A NPS 
Subjt:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP

Query:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA
         EL NHLSDAVGIAE+  VS+L SLLTKD   VA GIKSPKIL+GDV+SI KI SSNVLNVPQ G+ AALSE +A+ME K+ISGSS EVE NEKLS LEA
Subjt:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA

Query:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT
        QA AVA ATN LDDEMEDHEGS SEQP+TSKVDAIKEYP+GIQ+ LDQ+TATC ENIVDGPSRSSGTD+HDK+K KSRA  QR+ KR+SGR+SLAGAGTT
Subjt:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT

Query:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        W+ GVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+E+ +LVELAALH
Subjt:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

XP_023548004.1 centromere protein C-like isoform X1 [Cucurbita pepo subsp. pepo]

2.4e-302

83.66

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MVNEEARHSDVIDPLAAYSG++LFPSAFG  P PS+PHD GTDLDGIHKHL+SMVSR+PSKLIEQARSIL+ NSNL+QS+ AT LV NEKKEEA A  +E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDARQPPVNLE TFDIKQLKDPEEFFLAYERLENAK+EIQKQTGA+LKDLNQ NPSTNTRQRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN
        SE+DQNVEPSQVTFESG+I+PSILGTEKD  PPII SE KT+E+V  EE EEE FVASIT AENKVNKILDELLSANCEDLEGD+AIN LQECLQIKPIN
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN

Query:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP
        LEKLCLPDLEA QT+NL+SSRGNLP+RSLI VD+QLQRIE LKSKQDDENSV  IS+P SMRSPLASLSAL R+ISLS S GDPFSAHD+ QS A NPS 
Subjt:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP

Query:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA
         EL NHLSDAVGIAE+  VS+L SLLTKD   VA GIKSPKIL+GDVDSI KI SSNVLNVPQ G+ AALSE +A+ME K+ISGSS EVE NEKLS LEA
Subjt:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA

Query:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT
        QA AVA ATN LDDEMEDHEGS SEQP+TSKVDAIKEYP+G+Q+QLDQ+TATC ENIVDGPSRSSGTD+HDK+K KSRA  QR+ KR+SGR+SLAGAGTT
Subjt:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT

Query:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        W+ GVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+E+ +LVELAALH
Subjt:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DKM1 centromere protein C isoform X1

2.0e-289

79.97

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MVNEEAR SDVIDPLAAYSG+NLFPS FGI PD S+PHDLGT LD IHKHL+SMVSRSPSKLIEQAR+ILDGNSN++ SE+ATFLV++++ +E TAK +E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPD RQP VNLE TF+IKQLKDPEEFFLA+ERLENAK EIQKQT  VLKDLNQ NPSTNTR RRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFF--EEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPI
        SE+DQNVEPSQVTFESGNI+PSI+GTEK P PPIIGSEK+T E V F  EE EEE V SITK+ENKVN+ILDELLSANCEDLEGD+AIN LQECLQIKPI
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFF--EEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPI

Query:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPS
        NLEKLCLPDL+A QTVNLKSSRGN PKRSLI VDNQLQRIET K KQDDE+SV  +S+PSSM+SPLAS+ ALNRQI LS SS DPFSAHDI +SPA NPS
Subjt:  NLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPS

Query:  PSELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLE
         SE INHLSD V IA+QSSVSKL S LTKDG  V NGI+SPK  +GDVDS+ KI  +NVLNVP+VG  AAL+ ++ASME K ISGS  EVE N+KLSCL 
Subjt:  PSELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLE

Query:  AQAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGT
        A+A  +ANA+N LDDEMEDH+  ASEQ +TSKVDA KEYP GIQSQLDQ+TAT  +N VDG SRSSGTDHHDK+KPKS ANKQRKDK IS RQSLAGAGT
Subjt:  AQAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGT

Query:  TWECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
         WE GVRRSTRFKTRPLEYWKGERLLYGRVH+SLATVIG+KYVSPAKGNGQPTLKVKSLVSN++K+LVE AALH
Subjt:  TWECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

A0A6J1GNL2 centromere protein C isoform X1

1.5e-302

83.63

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MVNEEARHSDVIDPLAAYSG++LFPSAFG  P PS+PHD+GTDLDGIHKHL+SMVSR+PSKLIEQARSIL+GNSNL+QS+ ATFLV NEKKEEA A  +E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDARQP VNLE TFDIKQLKDPEEFFLAYERLENAK+EIQKQTGA+LKDLNQ NPSTNTRQRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINL
        SE+DQNVEPSQVTFESG+I+PSILGTEKD  PPII SE KT+E+V  EE EE FVASIT AENKVNKILDELLSANCEDLEGD+AIN LQECLQIKPINL
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINL

Query:  EKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSPS
        EKLCLPDLEA QT NL+SSRGNLP+RSLI VD+QLQRIE LKSKQDDENSV  IS+P SMRSPLASLSAL R+ISLS S GDPFSAHD+ QS A NPS  
Subjt:  EKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSPS

Query:  ELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEAQ
        EL NHLSDAVGIAE+  VS+L SLLTKD   VA GIKSPKIL+GDVDSI KI SSNVLNVPQ G+ AALSE  A+ME K+ISGSS EVE NEKLS LEAQ
Subjt:  ELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEAQ

Query:  AAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTTW
        A AVA ATN LDDEMEDHEGS SEQP+TSKVDAIKEYP+GIQ+QLDQ+ ATC ENIVD PSRSSGTD+HDK+K KSRA  QR+ KR+SGR+SLAGAGTTW
Subjt:  AAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTTW

Query:  ECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        + GVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+E+ +LVELAALH
Subjt:  ECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

A0A6J1H8M3 centromere protein C-like isoform X1

4.1e-295

82.67

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MV+EEAR S VIDPLAAYSG+ LFPSAFG FPDPS+PH +GTDLD IH HL+SMVSR+PSKL EQARSILDGNSNL+QSE ATFL NNEKKEEAT KA+E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSL+ DARQPPV+LE   DIKQLKDPEEFFLAYERLENA REI+KQTGAVLKDLN  NPSTN R RRPGILGRSVRYKHQYSSI 
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEE-----GEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQI
        SENDQNVEPSQVTFESGNI+ SI GTEKD R PII SE KTDEDV FE+     G EEF ASI K ENKV+KILDELLSANCEDLEGD+AIN+LQE LQI
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEE-----GEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQI

Query:  KPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSVISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNP
        KPINLEKL LPDLEAT+TVNLKSS GNLPKRS   VDNQLQ +ETLKSKQDDENSV+ +P SMRSPLASLSALN QI LSKSS  PFSA DI QSPA NP
Subjt:  KPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSVISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNP

Query:  SPSELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCL
        S  EL NHLSDAVGIAEQSSVSKL SLLTKDG  VANGIKSPK+L+GD DSICKI SSNV  V QVG  AALS   A ME K+ISGS AEVEANEKLSC 
Subjt:  SPSELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCL

Query:  EAQAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAG
        EAQ  AVANATN  DDEMEDH GSASEQPSTSKVD IK YPVGIQSQLDQ+TATCPENIVDGP RSSGTDH DK+KPKSRA+K+RK K+I GRQSLAGAG
Subjt:  EAQAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAG

Query:  TTWECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        TTW+CG+RRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+++KDLVELAALH
Subjt:  TTWECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

A0A6J1JWV5 centromere protein C-like isoform X2

3.5e-286

80.53

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MVNEEARHSDVIDPLAAYSG++LFPSAFG  P PS+PHD+GTDLDGIHKHL+SMVSR+PSKLIEQARSIL+GNSNL+QS+ ATFLV NEKKEEA A  +E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDARQPPVNLE TFDIKQLKDPEEFFLAYERLENAK+EIQKQTGA+LKDLNQ NPSTNTRQRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN
        SE+DQ VEPSQVTFESG+I+PS LGTEKD  PPII SE KT+E+V FEE EEE FVASIT AENKVNKILDELLSANCEDLEGDQAIN LQECLQIKPIN
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN

Query:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP
        LEKLCLPDLEA QT+NL+SSRGNLP+RSLI VD+QLQRIE LKSKQDDENSV  IS+P SMRSPLASLSAL R+ISLS S                    
Subjt:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP

Query:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA
                  VGIAE+  VS+L SLLTKD   VA GIKSPKIL+GDV+SI KI SSNVLNVPQ G+ AALSE +A+ME K+ISGSS EVE NEKLS LEA
Subjt:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA

Query:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT
        QA AVA ATN LDDEMEDHEGS SEQP+TSKVDAIKEYP+GIQ+ LDQ+TATC ENIVDGPSRSSGTD+HDK+K KSRA  QR+ KR+SGR+SLAGAGTT
Subjt:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT

Query:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        W+ GVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+E+ +LVELAALH
Subjt:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

A0A6J1JYG6 centromere protein C-like isoform X1

6.9e-303

83.8

Show/hide

Query:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE
        MVNEEARHSDVIDPLAAYSG++LFPSAFG  P PS+PHD+GTDLDGIHKHL+SMVSR+PSKLIEQARSIL+GNSNL+QS+ ATFLV NEKKEEA A  +E
Subjt:  MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADE

Query:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDARQPPVNLE TFDIKQLKDPEEFFLAYERLENAK+EIQKQTGA+LKDLNQ NPSTNTRQRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSIT

Query:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN
        SE+DQ VEPSQVTFESG+I+PS LGTEKD  PPII SE KT+E+V FEE EEE FVASIT AENKVNKILDELLSANCEDLEGDQAIN LQECLQIKPIN
Subjt:  SENDQNVEPSQVTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEE-FVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPIN

Query:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP
        LEKLCLPDLEA QT+NL+SSRGNLP+RSLI VD+QLQRIE LKSKQDDENSV  IS+P SMRSPLASLSAL R+ISLS S GDPFSAHD+ QS A NPS 
Subjt:  LEKLCLPDLEATQTVNLKSSRGNLPKRSLIRVDNQLQRIETLKSKQDDENSV--ISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSP

Query:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA
         EL NHLSDAVGIAE+  VS+L SLLTKD   VA GIKSPKIL+GDV+SI KI SSNVLNVPQ G+ AALSE +A+ME K+ISGSS EVE NEKLS LEA
Subjt:  SELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEA

Query:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT
        QA AVA ATN LDDEMEDHEGS SEQP+TSKVDAIKEYP+GIQ+ LDQ+TATC ENIVDGPSRSSGTD+HDK+K KSRA  QR+ KR+SGR+SLAGAGTT
Subjt:  QAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATCPENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTT

Query:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH
        W+ GVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVS+E+ +LVELAALH
Subjt:  WECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEFKDLVELAALH

SwissProt top hits

e value

%identity

Alignment

Q66LG9 Centromere protein C

1.5e-52

31.13

Show/hide

Query:  DPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADENPQERRPALNRK
        DPL AYSG++LFP       +P  P     DL   H  LQSM     S+  EQA++IL+                 +   +       N +ERRP L+RK
Subjt:  DPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADENPQERRPALNRK

Query:  RARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVR-YKHQYSSITSENDQNVEPSQ
        R  FSL     QPP  +  +FD  +    E+FF AY++ E A RE QKQTG+ + D+ ++ PS   R RRPGI GR  R +K  ++     +  N+E S+
Subjt:  RARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVR-YKHQYSSITSENDQNVEPSQ

Query:  VTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINLEKLCLPDLEAT
                  S    E      +   +++ D+             S    +  +N +L +LL+ + E+LEGD AI +L+E LQIK  N+EK  +P+ +  
Subjt:  VTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINLEKLCLPDLEAT

Query:  QTVNLKSSRGNLPKR-SLIRVDNQLQ---RIETLKSKQDDENSVISSPSSMRSPLASLS------ALNRQISLSKSSGDPFSAHDIGQSPATNPSPSELI
        + +NLK+S  N P R SL  + N L+   R+   K+        I   SS   P+   S       L      S+ +  P  A DI  +  TN    ++ 
Subjt:  QTVNLKSSRGNLPKR-SLIRVDNQLQ---RIETLKSKQDDENSVISSPSSMRSPLASLS------ALNRQISLSKSSGDPFSAHDIGQSPATNPSPSELI

Query:  NHLSDAVGIAEQSSVSKLN-----SLLTKDGR---VVANGI--KSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEK
        +  +D+V        S ++     S L++DG     V + I  +S  +L  +VD   K      ++VP       +SE+ A   ++N      + E NE+
Subjt:  NHLSDAVGIAEQSSVSKLN-----SLLTKDGR---VVANGI--KSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEK

Query:  LSCLE--AQAAA--VANATNTLDDEMEDHEGSASEQPSTSKVD--------AIKEYPVGIQSQLDQATATCP----ENIVD---------------GPSR
           LE  A+ A+  V       +D +   +G++S+ P+ +              E+  G+  + +  T +      EN  +               G S 
Subjt:  LSCLE--AQAAA--VANATNTLDDEMEDHEGSASEQPSTSKVD--------AIKEYPVGIQSQLDQATATCP----ENIVD---------------GPSR

Query:  S------------SGTDHHDKIKP-KSRANKQRKDKR------------------ISGRQSLAGAGTTWECGVRRSTRFKTRPLEYWKGERLLYGRVHES
        S            +G D   K  P +SRA KQ K K                    S R+SLA AGT  E GVRRSTR K+RPLEYW+GER LYGR+HES
Subjt:  S------------SGTDHHDKIKP-KSRANKQRKDKR------------------ISGRQSLAGAGTTWECGVRRSTRFKTRPLEYWKGERLLYGRVHES

Query:  LATVIGLKYVSPAKG-NGQPTLKVKSLVSNEFKDLVELAALH
        L TVIG+KY SP +G       KVKS VS+E+K LV+ AALH
Subjt:  LATVIGLKYVSPAKG-NGQPTLKVKSLVSNEFKDLVELAALH

Arabidopsis top hits

e value

%identity

Alignment

AT1G15660.1 centromere protein C

1.1e-53

31.13

Show/hide

Query:  DPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADENPQERRPALNRK
        DPL AYSG++LFP       +P  P     DL   H  LQSM     S+  EQA++IL+                 +   +       N +ERRP L+RK
Subjt:  DPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADENPQERRPALNRK

Query:  RARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVR-YKHQYSSITSENDQNVEPSQ
        R  FSL     QPP  +  +FD  +    E+FF AY++ E A RE QKQTG+ + D+ ++ PS   R RRPGI GR  R +K  ++     +  N+E S+
Subjt:  RARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVR-YKHQYSSITSENDQNVEPSQ

Query:  VTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINLEKLCLPDLEAT
                  S    E      +   +++ D+             S    +  +N +L +LL+ + E+LEGD AI +L+E LQIK  N+EK  +P+ +  
Subjt:  VTFESGNINPSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINLEKLCLPDLEAT

Query:  QTVNLKSSRGNLPKR-SLIRVDNQLQ---RIETLKSKQDDENSVISSPSSMRSPLASLS------ALNRQISLSKSSGDPFSAHDIGQSPATNPSPSELI
        + +NLK+S  N P R SL  + N L+   R+   K+        I   SS   P+   S       L      S+ +  P  A DI  +  TN    ++ 
Subjt:  QTVNLKSSRGNLPKR-SLIRVDNQLQ---RIETLKSKQDDENSVISSPSSMRSPLASLS------ALNRQISLSKSSGDPFSAHDIGQSPATNPSPSELI

Query:  NHLSDAVGIAEQSSVSKLN-----SLLTKDGR---VVANGI--KSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEK
        +  +D+V        S ++     S L++DG     V + I  +S  +L  +VD   K      ++VP       +SE+ A   ++N      + E NE+
Subjt:  NHLSDAVGIAEQSSVSKLN-----SLLTKDGR---VVANGI--KSPKILVGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEK

Query:  LSCLE--AQAAA--VANATNTLDDEMEDHEGSASEQPSTSKVD--------AIKEYPVGIQSQLDQATATCP----ENIVD---------------GPSR
           LE  A+ A+  V       +D +   +G++S+ P+ +              E+  G+  + +  T +      EN  +               G S 
Subjt:  LSCLE--AQAAA--VANATNTLDDEMEDHEGSASEQPSTSKVD--------AIKEYPVGIQSQLDQATATCP----ENIVD---------------GPSR

Query:  S------------SGTDHHDKIKP-KSRANKQRKDKR------------------ISGRQSLAGAGTTWECGVRRSTRFKTRPLEYWKGERLLYGRVHES
        S            +G D   K  P +SRA KQ K K                    S R+SLA AGT  E GVRRSTR K+RPLEYW+GER LYGR+HES
Subjt:  S------------SGTDHHDKIKP-KSRANKQRKDKR------------------ISGRQSLAGAGTTWECGVRRSTRFKTRPLEYWKGERLLYGRVHES

Query:  LATVIGLKYVSPAKG-NGQPTLKVKSLVSNEFKDLVELAALH
        L TVIG+KY SP +G       KVKS VS+E+K LV+ AALH
Subjt:  LATVIGLKYVSPAKG-NGQPTLKVKSLVSNEFKDLVELAALH

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTGAACGAAGAAGCTCGACACTCCGATGTGATCGATCCTCTTGCTGCTTATTCTGGTATGAATCTCTTTCCGAGCGCATTCGGTATTTTTCCGGATCCCTCAAGGCC
TCATGATCTTGGAACCGACCTTGACGGCATCCACAAGCACCTCCAATCCATGGTCTCAAGAAGTCCTAGTAAACTTATAGAGCAGGCCAGATCAATTTTAGACGGTAACT
CAAATTTGGTGCAATCTGAAGTTGCCACATTTCTTGTAAACAATGAGAAAAAGGAGGAAGCTACAGCAAAGGCGGACGAAAATCCACAAGAAAGAAGGCCGGCCTTAAAC
CGAAAGCGGGCTAGGTTTTCTTTAAAACCTGATGCTAGACAACCTCCTGTGAACTTGGAACAAACATTTGACATTAAACAATTGAAAGACCCCGAGGAGTTCTTTTTGGC
CTACGAAAGGCTTGAAAATGCCAAAAGAGAAATCCAAAAACAGACGGGGGCAGTTTTGAAGGACTTGAACCAACATAATCCATCCACAAATACACGCCAACGTAGACCAG
GGATTCTTGGGAGGTCTGTTAGATACAAGCATCAATATTCATCAATAACATCTGAAAATGATCAAAATGTAGAACCCTCTCAAGTGACATTTGAATCAGGTAATATCAAT
CCATCAATACTGGGAACAGAAAAAGATCCAAGACCACCTATAATTGGCTCAGAAAAGAAAACTGATGAAGATGTATTCTTTGAGGAGGGGGAGGAGGAGTTCGTTGCTTC
AATAACCAAGGCAGAGAACAAAGTGAATAAAATTTTGGATGAATTACTCTCTGCTAATTGTGAAGATCTAGAAGGCGATCAAGCCATCAACATATTACAGGAGTGCTTGC
AGATTAAACCCATTAATTTAGAAAAATTATGTCTTCCAGATTTAGAAGCCACTCAAACAGTGAATTTGAAATCCTCAAGAGGTAATCTGCCAAAGCGGAGTTTGATCAGA
GTGGACAATCAGTTACAAAGGATAGAAACTTTGAAATCTAAGCAGGATGATGAAAATTCGGTTATTTCTTCACCATCCTCGATGAGAAGTCCATTGGCATCATTATCAGC
CCTAAATAGACAAATTTCACTTTCAAAGTCATCAGGTGATCCATTTTCGGCTCATGACATTGGCCAATCACCGGCAACAAATCCTTCCCCTTCTGAACTCATTAATCACT
TGTCTGATGCAGTTGGTATTGCAGAGCAGTCGAGTGTTTCTAAATTGAATTCACTTTTAACCAAAGATGGCAGGGTTGTTGCTAATGGAATTAAGTCGCCCAAAATCCTT
GTTGGAGATGTCGATTCCATATGTAAAATATATTCGAGTAATGTTTTAAATGTACCCCAAGTTGGCAGCGTTGCTGCCTTAAGTGAAGCTAACGCTAGCATGGAAGATAA
GAATATTAGTGGCAGCAGCGCAGAAGTGGAAGCAAATGAGAAATTGAGTTGTCTTGAAGCTCAAGCAGCTGCTGTGGCTAATGCAACTAATACATTGGATGATGAGATGG
AAGATCACGAAGGATCAGCTTCTGAGCAACCAAGCACATCCAAGGTGGATGCAATCAAAGAGTACCCGGTTGGCATACAGAGTCAGTTGGATCAAGCAACTGCTACTTGT
CCTGAAAATATTGTGGATGGGCCATCTAGGAGCAGTGGAACAGATCACCACGATAAGATCAAGCCAAAATCTCGTGCAAACAAGCAACGCAAAGACAAAAGGATTTCTGG
GAGGCAAAGCCTTGCAGGGGCTGGTACAACGTGGGAATGTGGGGTGAGAAGAAGTACCAGGTTCAAAACACGACCGTTGGAGTACTGGAAAGGTGAAAGGCTGTTGTATG
GACGCGTACATGAGAGCCTGGCAACAGTAATCGGGTTGAAGTATGTGTCTCCAGCAAAAGGTAATGGCCAACCAACTCTGAAGGTGAAATCATTAGTCTCCAATGAGTTC
AAAGATCTTGTTGAGTTAGCAGCTCTGCACTGA

mRNA sequence

Show/hide mRNA sequence

TTCGAATGCTGCAATCGCTCTAGGGTTCGGTTCAGAGATTGGAGAGTGCAACAATGGTGAACGAAGAAGCTCGACACTCCGATGTGATCGATCCTCTTGCTGCTTATTCT
GGTATGAATCTCTTTCCGAGCGCATTCGGTATTTTTCCGGATCCCTCAAGGCCTCATGATCTTGGAACCGACCTTGACGGCATCCACAAGCACCTCCAATCCATGGTCTC
AAGAAGTCCTAGTAAACTTATAGAGCAGGCCAGATCAATTTTAGACGGTAACTCAAATTTGGTGCAATCTGAAGTTGCCACATTTCTTGTAAACAATGAGAAAAAGGAGG
AAGCTACAGCAAAGGCGGACGAAAATCCACAAGAAAGAAGGCCGGCCTTAAACCGAAAGCGGGCTAGGTTTTCTTTAAAACCTGATGCTAGACAACCTCCTGTGAACTTG
GAACAAACATTTGACATTAAACAATTGAAAGACCCCGAGGAGTTCTTTTTGGCCTACGAAAGGCTTGAAAATGCCAAAAGAGAAATCCAAAAACAGACGGGGGCAGTTTT
GAAGGACTTGAACCAACATAATCCATCCACAAATACACGCCAACGTAGACCAGGGATTCTTGGGAGGTCTGTTAGATACAAGCATCAATATTCATCAATAACATCTGAAA
ATGATCAAAATGTAGAACCCTCTCAAGTGACATTTGAATCAGGTAATATCAATCCATCAATACTGGGAACAGAAAAAGATCCAAGACCACCTATAATTGGCTCAGAAAAG
AAAACTGATGAAGATGTATTCTTTGAGGAGGGGGAGGAGGAGTTCGTTGCTTCAATAACCAAGGCAGAGAACAAAGTGAATAAAATTTTGGATGAATTACTCTCTGCTAA
TTGTGAAGATCTAGAAGGCGATCAAGCCATCAACATATTACAGGAGTGCTTGCAGATTAAACCCATTAATTTAGAAAAATTATGTCTTCCAGATTTAGAAGCCACTCAAA
CAGTGAATTTGAAATCCTCAAGAGGTAATCTGCCAAAGCGGAGTTTGATCAGAGTGGACAATCAGTTACAAAGGATAGAAACTTTGAAATCTAAGCAGGATGATGAAAAT
TCGGTTATTTCTTCACCATCCTCGATGAGAAGTCCATTGGCATCATTATCAGCCCTAAATAGACAAATTTCACTTTCAAAGTCATCAGGTGATCCATTTTCGGCTCATGA
CATTGGCCAATCACCGGCAACAAATCCTTCCCCTTCTGAACTCATTAATCACTTGTCTGATGCAGTTGGTATTGCAGAGCAGTCGAGTGTTTCTAAATTGAATTCACTTT
TAACCAAAGATGGCAGGGTTGTTGCTAATGGAATTAAGTCGCCCAAAATCCTTGTTGGAGATGTCGATTCCATATGTAAAATATATTCGAGTAATGTTTTAAATGTACCC
CAAGTTGGCAGCGTTGCTGCCTTAAGTGAAGCTAACGCTAGCATGGAAGATAAGAATATTAGTGGCAGCAGCGCAGAAGTGGAAGCAAATGAGAAATTGAGTTGTCTTGA
AGCTCAAGCAGCTGCTGTGGCTAATGCAACTAATACATTGGATGATGAGATGGAAGATCACGAAGGATCAGCTTCTGAGCAACCAAGCACATCCAAGGTGGATGCAATCA
AAGAGTACCCGGTTGGCATACAGAGTCAGTTGGATCAAGCAACTGCTACTTGTCCTGAAAATATTGTGGATGGGCCATCTAGGAGCAGTGGAACAGATCACCACGATAAG
ATCAAGCCAAAATCTCGTGCAAACAAGCAACGCAAAGACAAAAGGATTTCTGGGAGGCAAAGCCTTGCAGGGGCTGGTACAACGTGGGAATGTGGGGTGAGAAGAAGTAC
CAGGTTCAAAACACGACCGTTGGAGTACTGGAAAGGTGAAAGGCTGTTGTATGGACGCGTACATGAGAGCCTGGCAACAGTAATCGGGTTGAAGTATGTGTCTCCAGCAA
AAGGTAATGGCCAACCAACTCTGAAGGTGAAATCATTAGTCTCCAATGAGTTCAAAGATCTTGTTGAGTTAGCAGCTCTGCACTGAGGGCCGTGTACAAAAAGGAGCAAA
CAAATAGCCTTTGAAGCTTTTTGGATTTTGCATGTATAACAAACAATTCTCTTCTTGAATATAAATAGCATCTAGTGAAGTCTCGCCTTTGTGGAAAGACTGTAGAAGAG
AATTATGGTTAATGTCACTGCATTGTACATTTCTGTGTCATTTCTTCTAATATCTCATATGTAGCCATCACAACTCACAGGCTGTCTCGCTTGTGTGTAAAACATATCAA
CTT

Protein sequence

Show/hide protein sequence

MVNEEARHSDVIDPLAAYSGMNLFPSAFGIFPDPSRPHDLGTDLDGIHKHLQSMVSRSPSKLIEQARSILDGNSNLVQSEVATFLVNNEKKEEATAKADENPQERRPALN
RKRARFSLKPDARQPPVNLEQTFDIKQLKDPEEFFLAYERLENAKREIQKQTGAVLKDLNQHNPSTNTRQRRPGILGRSVRYKHQYSSITSENDQNVEPSQVTFESGNIN
PSILGTEKDPRPPIIGSEKKTDEDVFFEEGEEEFVASITKAENKVNKILDELLSANCEDLEGDQAINILQECLQIKPINLEKLCLPDLEATQTVNLKSSRGNLPKRSLIR
VDNQLQRIETLKSKQDDENSVISSPSSMRSPLASLSALNRQISLSKSSGDPFSAHDIGQSPATNPSPSELINHLSDAVGIAEQSSVSKLNSLLTKDGRVVANGIKSPKIL
VGDVDSICKIYSSNVLNVPQVGSVAALSEANASMEDKNISGSSAEVEANEKLSCLEAQAAAVANATNTLDDEMEDHEGSASEQPSTSKVDAIKEYPVGIQSQLDQATATC
PENIVDGPSRSSGTDHHDKIKPKSRANKQRKDKRISGRQSLAGAGTTWECGVRRSTRFKTRPLEYWKGERLLYGRVHESLATVIGLKYVSPAKGNGQPTLKVKSLVSNEF
KDLVELAALH

Tan0003753 (gene) of Snake gourd v1 genome