CuGenDBv2

Gene ID	MC09g0310
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	centromere protein C isoform X1
Genome location	MC09:2755704..2761416
RNA-Seq Expression	MC09g0310
Synteny	MC09g0310
Gene Ontology terms	GO:0051315 - attachment of mitotic spindle microtubules to kinetochore (biological process) GO:0051382 - kinetochore assembly (biological process) GO:0051455 - attachment of spindle microtubules to kinetochore involved in homologous chromosome segregation (biological process) GO:0000776 - kinetochore (cellular component) GO:0005634 - nucleus (cellular component) GO:0019237 - centromeric DNA binding (molecular function)
InterPro domains	IPR028386 - Centromere protein C/Mif2/cnp3

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022154052.1 centromere protein C isoform X1 [Momordica charantia]

0.0

95.6

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
        FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        AKADGLANASNALDDE                               MEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
        FAALH
Subjt:  FAALH

XP_022154071.1 centromere protein C isoform X3 [Momordica charantia]

0.0

89.65

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQNVEPSQVTFES                                          SITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
        FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        AKADGLANASNALDDE                               MEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
        FAALH
Subjt:  FAALH

XP_022953572.1 centromere protein C isoform X1 [Cucurbita moschata]

0.0

73.33

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEAR SDVIDPLAAYSGI+LFPS FG LP  SKPHD+GT LD IHKHLKSMVSR+PSKLIEQAR+IL+GNSN+M S+ ATFLV +++ +E  A VEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPD RQP+VNLE TF+IKQLKDPEEFFLA+ERLENAK EIQKQT  +LKDLNQQNPSTNTR RRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQNVEPSQVTFESG+ISPSI+GTEK  SPPII SE +T E VP EEEEE    V SIT +ENKVN+ILDELLSANCEDLEGDRAINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDL+AIQT NL+SSRGN P+RSLISVD+QLQRIE  K KQDDE+SV+ +STP SM+SPLAS+ AL R+I LSNS  DPFSAHD+D+S ARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
          E  NHLSD V IA++  VS+L S LTKD   V  GI+SPK  +GDVDS+SKIS +NVLNVP+ G  AAL+ + A+MEAK+ISGS TEVEVN+KLS L 
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        A+AD +A                                A+N LDDEMEDH+   SEQ NTSKVDA KEYP GIQ+QLDQS AT T+N VD  SRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        +HDKVK KS A  QR+ K +S R+SLAGAGT W+ GVRRSTRFKTRPLEYWKGERLLYGRVH+SLATVIG+KYVSPAKGNGQPTLKVKSLVS++Y ELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
         AALH
Subjt:  FAALH

XP_022992183.1 centromere protein C-like isoform X1 [Cucurbita maxima]

0.0

73.19

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEAR SDVIDPLAAYSGI+LFPS FG LP  SKPHD+GT LD IHKHLKSMVSR+PSKLIEQAR+IL+GNSN+M S+ ATFLV +++ +E  A VEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPD RQP VNLE TF+IKQLKDPEEFFLA+ERLENAK EIQKQT  +LKDLNQQNPSTNTR RRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQ VEPSQVTFESG+ISPS +GTEK  SPPII SE +T E VPFEEEEEE   V SIT +ENKVN+ILDELLSANCEDLEGD+AINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDL+AIQT+NL+SSRGN P+RSLISVD+QLQRIE  K KQDDE+SV+ +STP SM+SPLAS+ AL R+I LSNS  DPFSAHD+D+S ARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
          E  NHLSD V IA++  VS+L S LTKD   V  GI+SPK  +GDV+S+SKIS +NVLNVP+ G +AAL+ +HA+MEAK+ISGS  EVEVN+KLS L 
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        A+AD +A                                A+N LDDEMEDH+   SEQ NTSKVDA KEYP GIQ+ LDQSTAT T+N VDG SRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        +HDKVK KS A  QR+ K +S R+SLAGAGT W+ GVRRSTRFKTRPLEYWKGERLLYGRVH+SLATVIG+KYVSPAKGNGQPTLKVKSLVS++Y ELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
         AALH
Subjt:  FAALH

XP_023548004.1 centromere protein C-like isoform X1 [Cucurbita pepo subsp. pepo]

0.0

73.48

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEAR SDVIDPLAAYSGI+LFPS FG LP  SKPHD GT LD IHKHLKSMVSR+PSKLIEQAR+IL+ NSN+M S+ AT LV +++ +E  A VEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPD RQP VNLE TF+IKQLKDPEEFFLA+ERLENAK EIQKQT  +LKDLNQQNPSTNTR RRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQNVEPSQVTFESG+ISPSI+GTEK  SPPII SE +T E VP EEEEEE   V SIT +ENKVN+ILDELLSANCEDLEGDRAINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDL+AIQT+NL+SSRGN P+RSLISVD+QLQRIE  K KQDDE+SV+ +STP SM+SPLAS+ AL R+I LSNS  DPFSAHD+D+S ARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
          E  NHLSD V IA++  VS+L S LTKD   V  GI+SPK  +GDVDS+SKIS +NVLNVP+ G  AAL+ +HA+MEAK+ISGS TEVEVN+KLS L 
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        A+AD +A                                A+N LDDEMEDH+   SEQ NTSKVDA KEYP G+Q+QLDQSTAT T+N VDG SRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        +HDKVK KS A  QR+ K +S R+SLAGAGT W+ GVRRSTRFKTRPLEYWKGERLLYGRVH+SLATVIG+KYVSPAKGNGQPTLKVKSLVS++Y ELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
         AALH
Subjt:  FAALH

TrEMBL top hits

e value

%identity

Alignment

A0A1S3CDU5 uncharacterized protein LOC103499749 isoform X2

0.0

69.28

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEE R SDVIDPLAAYSGINLFP+ FG L D SKPHDLGT LD IHK LKSMV RSPSKL+EQAR+ILDGNS  M SE ATFLV +++N+  + K EE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPD  QP VNLE TF+IKQLKDPEEFFLA+E+ ENAK EIQKQ   VLKDLNQQNPSTNTR RRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        +EDDQNV+PSQVTF+SG  SP  +GTE  PSP II SEK+T E V FEEEEEEEELV S TK+EN+VN ILDE LS NCEDLEGDRAIN LQE LQIKP+
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
         LEKLCLPDL+AI T+NLKS+RGN  KRSLISVDNQLQ+ ET K K+D+E+ V+L+STPSSM+SPLAS+ ALNR+I LSNSS D FSAH ID+SPAR+P 
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
          E  NHLSD V I + SSVSKLK  LT+DG  + NGI+  K   GD DSMSKIS +N+LNV +VG N AL+G++AS +AK +SGS T+VE+N+KLSCL 
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANAS-------------NALDDEVHFVVLVNKKL-----SCLGAKADGLANASNALD-DEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQS
        A+AD +AN               + +D    + V +  +L     +C     DG + +S     DEMEDH+  ASEQ N+SKVD  KEYP GIQ QLDQS
Subjt:  AKADGLANAS-------------NALDDEVHFVVLVNKKL-----SCLGAKADGLANASNALD-DEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQS

Query:  TATST--DNNVDGVSRSSGTDHHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKG
        T T+T  +  VDG SRSSGTDHHD+VKPKS ANKQRK K IS RQSLAGAGT W+SGVRRSTRFK RPLEYWKGER+LYGRVH+SLATVIG+KYVSP KG
Subjt:  TATST--DNNVDGVSRSSGTDHHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKG

Query:  NGQPTLKVKSLVSNKYKELVEFAALH
        NG+PT+KVKSLVSN+YK+LV+ AALH
Subjt:  NGQPTLKVKSLVSNKYKELVEFAALH

A0A6J1DKM1 centromere protein C isoform X1

0.0

95.6

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
        FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        AKADGLANASNALDDE                               MEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
        FAALH
Subjt:  FAALH

A0A6J1DML8 centromere protein C isoform X3

0.0

89.65

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQNVEPSQVTFES                                          SITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
        FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        AKADGLANASNALDDE                               MEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
        FAALH
Subjt:  FAALH

A0A6J1GNL2 centromere protein C isoform X1

0.0

73.33

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEAR SDVIDPLAAYSGI+LFPS FG LP  SKPHD+GT LD IHKHLKSMVSR+PSKLIEQAR+IL+GNSN+M S+ ATFLV +++ +E  A VEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPD RQP+VNLE TF+IKQLKDPEEFFLA+ERLENAK EIQKQT  +LKDLNQQNPSTNTR RRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQNVEPSQVTFESG+ISPSI+GTEK  SPPII SE +T E VP EEEEE    V SIT +ENKVN+ILDELLSANCEDLEGDRAINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDL+AIQT NL+SSRGN P+RSLISVD+QLQRIE  K KQDDE+SV+ +STP SM+SPLAS+ AL R+I LSNS  DPFSAHD+D+S ARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
          E  NHLSD V IA++  VS+L S LTKD   V  GI+SPK  +GDVDS+SKIS +NVLNVP+ G  AAL+ + A+MEAK+ISGS TEVEVN+KLS L 
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        A+AD +A                                A+N LDDEMEDH+   SEQ NTSKVDA KEYP GIQ+QLDQS AT T+N VD  SRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        +HDKVK KS A  QR+ K +S R+SLAGAGT W+ GVRRSTRFKTRPLEYWKGERLLYGRVH+SLATVIG+KYVSPAKGNGQPTLKVKSLVS++Y ELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
         AALH
Subjt:  FAALH

A0A6J1JYG6 centromere protein C-like isoform X1

0.0

73.19

Show/hide

Query:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE
        MVNEEAR SDVIDPLAAYSGI+LFPS FG LP  SKPHD+GT LD IHKHLKSMVSR+PSKLIEQAR+IL+GNSN+M S+ ATFLV +++ +E  A VEE
Subjt:  MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEE

Query:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT
        NPQERRPALNRKRARFSLKPD RQP VNLE TF+IKQLKDPEEFFLA+ERLENAK EIQKQT  +LKDLNQQNPSTNTR RRPGILGRSVRYKHQYSSIT
Subjt:  NPQERRPALNRKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSIT

Query:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI
        SEDDQ VEPSQVTFESG+ISPS +GTEK  SPPII SE +T E VPFEEEEEE   V SIT +ENKVN+ILDELLSANCEDLEGD+AINKLQECLQIKPI
Subjt:  SEDDQNVEPSQVTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPI

Query:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS
        NLEKLCLPDL+AIQT+NL+SSRGN P+RSLISVD+QLQRIE  K KQDDE+SV+ +STP SM+SPLAS+ AL R+I LSNS  DPFSAHD+D+S ARNPS
Subjt:  NLEKLCLPDLQAIQTVNLKSSRGNAPKRSLISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPS

Query:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG
          E  NHLSD V IA++  VS+L S LTKD   V  GI+SPK  +GDV+S+SKIS +NVLNVP+ G +AAL+ +HA+MEAK+ISGS  EVEVN+KLS L 
Subjt:  FSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLG

Query:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD
        A+AD +A                                A+N LDDEMEDH+   SEQ NTSKVDA KEYP GIQ+ LDQSTAT T+N VDG SRSSGTD
Subjt:  AKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMEDHDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTD

Query:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE
        +HDKVK KS A  QR+ K +S R+SLAGAGT W+ GVRRSTRFKTRPLEYWKGERLLYGRVH+SLATVIG+KYVSPAKGNGQPTLKVKSLVS++Y ELVE
Subjt:  HHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGRVHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVE

Query:  FAALH
         AALH
Subjt:  FAALH

SwissProt top hits

e value

%identity

Alignment

Q66LG9 Centromere protein C

7.8e-52

30.16

Show/hide

Query:  DPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEENPQERRPALNRK
        DPL AYSG++LFP T   L +   P      L   H  L+SM     S+  EQA+AIL                 +D + +       N +ERRP L+RK
Subjt:  DPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEENPQERRPALNRK

Query:  RARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVR-YKHQYSSITSEDDQNVEPSQ
        R  FSL   T QP   +  +F+  +    E+FF A+++ E A  E QKQT   + D+ +  PS   R RRPGI GR  R +K  ++     D  N+E S+
Subjt:  RARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVR-YKHQYSSITSEDDQNVEPSQ

Query:  VTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPINLEKLCLPDLQ
                       ++ P       E  T  HV   + E ++    S   ++  +N +L +LL+ + E+LEGD AI  L+E LQIK  N+EK  +P+ Q
Subjt:  VTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPINLEKLCLPDLQ

Query:  AIQTVNLKSSRGNAPKR-SLISVDNQLQRIETSKFKQDDES-SVHLLSTPSSMKSPLASVLALNRQILL------SNSSSDPFSAHDIDKSPARNPSFSE
         ++ +NLK+S  N P R SL  + N L+       +++  S S   +   SS   P+      +   LL      S  +  P  A DI  +   N    +
Subjt:  AIQTVNLKSSRGNAPKR-SLISVDNQLQRIETSKFKQDDES-SVHLLSTPSSMKSPLASVLALNRQILL------SNSSSDPFSAHDIDKSPARNPSFSE

Query:  HINHLSDIVDIAKQSSVSKL-----KSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSC
          +  +D V        S +     +S L++DG           C +  + + S   L   +++   G    +  S +    +     + + E+N+    
Subjt:  HINHLSDIVDIAKQSSVSKL-----KSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSC

Query:  LGAKADGLANASNALDDEV--HFVVLVNKKLSCLGAKADGLANAS---NALDDEME--DHDELASEQLNTSK--------VDATKEYPFGIQSQLDQSTA
           + D L   +     EV   F V  +      GA +     A    N +   +E  +H++   E+ N +          +A + + +  +    +   
Subjt:  LGAKADGLANASNALDDEV--HFVVLVNKKLSCLGAKADGLANAS---NALDDEME--DHDELASEQLNTSK--------VDATKEYPFGIQSQLDQSTA

Query:  TSTDNNVDGVSRS----SGTDHHDKVKP-KSHANKQRKDKNISR------------------RQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGR
         S+D+NV   S++    +G D   K  P +S A KQ K K+  R                  R+SLA AGTK E GVRRSTR K+RPLEYW+GER LYGR
Subjt:  TSTDNNVDGVSRS----SGTDHHDKVKP-KSHANKQRKDKNISR------------------RQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGR

Query:  VHQSLATVIGMKYVSPAKG-NGQPTLKVKSLVSNKYKELVEFAALH
        +H+SL TVIG+KY SP +G       KVKS VS++YK+LV+FAALH
Subjt:  VHQSLATVIGMKYVSPAKG-NGQPTLKVKSLVSNKYKELVEFAALH

Arabidopsis top hits

e value

%identity

Alignment

AT1G15660.1 centromere protein C

5.6e-53

30.16

Show/hide

Query:  DPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEENPQERRPALNRK
        DPL AYSG++LFP T   L +   P      L   H  L+SM     S+  EQA+AIL                 +D + +       N +ERRP L+RK
Subjt:  DPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEENPQERRPALNRK

Query:  RARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVR-YKHQYSSITSEDDQNVEPSQ
        R  FSL   T QP   +  +F+  +    E+FF A+++ E A  E QKQT   + D+ +  PS   R RRPGI GR  R +K  ++     D  N+E S+
Subjt:  RARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVR-YKHQYSSITSEDDQNVEPSQ

Query:  VTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPINLEKLCLPDLQ
                       ++ P       E  T  HV   + E ++    S   ++  +N +L +LL+ + E+LEGD AI  L+E LQIK  N+EK  +P+ Q
Subjt:  VTFESGNISPSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPINLEKLCLPDLQ

Query:  AIQTVNLKSSRGNAPKR-SLISVDNQLQRIETSKFKQDDES-SVHLLSTPSSMKSPLASVLALNRQILL------SNSSSDPFSAHDIDKSPARNPSFSE
         ++ +NLK+S  N P R SL  + N L+       +++  S S   +   SS   P+      +   LL      S  +  P  A DI  +   N    +
Subjt:  AIQTVNLKSSRGNAPKR-SLISVDNQLQRIETSKFKQDDES-SVHLLSTPSSMKSPLASVLALNRQILL------SNSSSDPFSAHDIDKSPARNPSFSE

Query:  HINHLSDIVDIAKQSSVSKL-----KSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSC
          +  +D V        S +     +S L++DG           C +  + + S   L   +++   G    +  S +    +     + + E+N+    
Subjt:  HINHLSDIVDIAKQSSVSKL-----KSPLTKDGEAVPNGIRSPKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSC

Query:  LGAKADGLANASNALDDEV--HFVVLVNKKLSCLGAKADGLANAS---NALDDEME--DHDELASEQLNTSK--------VDATKEYPFGIQSQLDQSTA
           + D L   +     EV   F V  +      GA +     A    N +   +E  +H++   E+ N +          +A + + +  +    +   
Subjt:  LGAKADGLANASNALDDEV--HFVVLVNKKLSCLGAKADGLANAS---NALDDEME--DHDELASEQLNTSK--------VDATKEYPFGIQSQLDQSTA

Query:  TSTDNNVDGVSRS----SGTDHHDKVKP-KSHANKQRKDKNISR------------------RQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGR
         S+D+NV   S++    +G D   K  P +S A KQ K K+  R                  R+SLA AGTK E GVRRSTR K+RPLEYW+GER LYGR
Subjt:  TSTDNNVDGVSRS----SGTDHHDKVKP-KSHANKQRKDKNISR------------------RQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGR

Query:  VHQSLATVIGMKYVSPAKG-NGQPTLKVKSLVSNKYKELVEFAALH
        +H+SL TVIG+KY SP +G       KVKS VS++YK+LV+FAALH
Subjt:  VHQSLATVIGMKYVSPAKG-NGQPTLKVKSLVSNKYKELVEFAALH

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTGAACGAAGAAGCTCGAGACTCCGATGTAATTGATCCTCTTGCTGCTTATTCTGGCATCAACCTCTTCCCCAGCACATTTGGCATTTTACCTGATCATTCAAAGCC
ACATGATCTTGGAACTGGCCTCGACGACATCCACAAGCACCTCAAGTCGATGGTCTCAAGAAGTCCTAGTAAACTTATAGAGCAGGCCAGAGCCATTTTAGACGGTAACT
CAAATGTGATGCACTCTGAAATTGCAACATTTCTTGTACATGATGATGAAAACAAAGAAACTACAGCAAAGGTGGAGGAAAATCCACAAGAAAGAAGGCCAGCATTAAAC
CGTAAGCGGGCAAGGTTTTCTTTAAAACCTGATACTAGACAACCTGCTGTTAACTTGGAGGCAACATTCAACATTAAACAATTGAAAGACCCCGAGGAGTTCTTTTTGGC
CTTTGAAAGGCTTGAAAATGCCAAAATAGAAATACAGAAACAAACGAGAGGAGTTTTGAAGGACTTGAACCAACAGAATCCATCCACGAATACACGTCACCGTAGACCAG
GGATTCTTGGGAGGTCTGTTAGATACAAGCATCAATATTCATCAATAACATCTGAAGATGATCAGAACGTAGAACCCTCTCAAGTTACATTTGAATCAGGTAATATTAGT
CCATCAATAATGGGCACAGAAAAATGTCCCAGTCCACCTATAATTGGCTCAGAAAAGAGAACTGGTGAACATGTCCCATTTGAGGAGGAGGAGGAGGAGGAGGAGTTAGT
TACCTCAATCACCAAGTCAGAGAACAAAGTGAATAGAATTTTGGATGAGTTACTGTCGGCTAACTGTGAAGATTTAGAAGGTGATCGAGCCATCAACAAATTACAGGAAT
GCTTACAGATTAAACCCATCAATTTAGAGAAATTATGCCTTCCAGATTTGCAAGCTATTCAGACAGTGAATTTGAAATCTTCAAGAGGCAATGCGCCAAAGCGTAGTTTG
ATCAGTGTGGACAATCAATTACAAAGGATAGAGACTTCGAAGTTTAAGCAGGATGATGAAAGTTCTGTTCATCTGCTTTCTACGCCATCCTCAATGAAAAGTCCATTGGC
ATCAGTATTAGCCCTAAATAGGCAAATTTTGCTTTCAAATTCATCAAGTGATCCATTTTCAGCTCATGACATTGACAAGTCCCCAGCAAGAAATCCTTCCTTTTCTGAAC
ACATTAATCACTTGTCTGACATAGTTGATATTGCAAAGCAGTCGAGTGTTTCTAAACTGAAGTCACCTTTAACCAAAGATGGTGAGGCTGTACCTAATGGAATTAGGTCA
CCCAAATGCCCTATTGGAGATGTTGATTCTATGTCTAAAATATCTTTGGCTAATGTTTTAAATGTACCCGAAGTTGGTGGCAATGCTGCCTTAAATGGAAGTCACGCCAG
CATGGAAGCTAAGGAAATTAGTGGTAGCGACACAGAAGTGGAAGTAAATAAGAAATTGAGTTGTCTTGGAGCCAAAGCAGATGGTTTGGCTAATGCATCAAATGCATTGG
ATGATGAGGTGCATTTTGTTGTGCTAGTAAATAAGAAATTGAGTTGTCTTGGAGCCAAAGCAGATGGTTTGGCTAATGCATCAAATGCATTGGATGATGAGATGGAAGAT
CATGATGAATTAGCTTCAGAGCAACTGAACACATCCAAGGTGGATGCGACTAAAGAGTATCCGTTTGGTATTCAGAGTCAGTTGGATCAATCAACTGCTACTTCTACTGA
TAATAATGTAGACGGGGTGTCCAGGAGCAGTGGAACGGATCACCATGATAAGGTCAAGCCAAAATCTCATGCAAACAAACAACGCAAAGACAAAAACATTTCTCGGAGGC
AAAGCCTTGCAGGGGCTGGTACAAAGTGGGAAAGTGGGGTAAGAAGAAGTACGAGGTTCAAAACACGACCTTTGGAGTATTGGAAAGGTGAAAGGCTGTTGTATGGACGT
GTACATCAGAGCCTGGCAACAGTAATCGGGATGAAGTATGTGTCTCCAGCAAAAGGTAATGGCCAACCAACTCTGAAGGTGAAGTCTCTGGTCTCTAACAAGTACAAAGA
ACTAGTTGAGTTTGCAGCTCTGCACTAA

mRNA sequence

Show/hide mRNA sequence

GGACCTCATCTGCAAAACAATAAAAATTTAAACGGAAGAATACGAAGATTTCGCGCTCTGGTTCTTACTTTCGAATTACGCAGTCGCTCTAGGGTTCGGTTCGAATATTA
GAGAGTGCAACAATGGTGAACGAAGAAGCTCGAGACTCCGATGTAATTGATCCTCTTGCTGCTTATTCTGGCATCAACCTCTTCCCCAGCACATTTGGCATTTTACCTGA
TCATTCAAAGCCACATGATCTTGGAACTGGCCTCGACGACATCCACAAGCACCTCAAGTCGATGGTCTCAAGAAGTCCTAGTAAACTTATAGAGCAGGCCAGAGCCATTT
TAGACGGTAACTCAAATGTGATGCACTCTGAAATTGCAACATTTCTTGTACATGATGATGAAAACAAAGAAACTACAGCAAAGGTGGAGGAAAATCCACAAGAAAGAAGG
CCAGCATTAAACCGTAAGCGGGCAAGGTTTTCTTTAAAACCTGATACTAGACAACCTGCTGTTAACTTGGAGGCAACATTCAACATTAAACAATTGAAAGACCCCGAGGA
GTTCTTTTTGGCCTTTGAAAGGCTTGAAAATGCCAAAATAGAAATACAGAAACAAACGAGAGGAGTTTTGAAGGACTTGAACCAACAGAATCCATCCACGAATACACGTC
ACCGTAGACCAGGGATTCTTGGGAGGTCTGTTAGATACAAGCATCAATATTCATCAATAACATCTGAAGATGATCAGAACGTAGAACCCTCTCAAGTTACATTTGAATCA
GGTAATATTAGTCCATCAATAATGGGCACAGAAAAATGTCCCAGTCCACCTATAATTGGCTCAGAAAAGAGAACTGGTGAACATGTCCCATTTGAGGAGGAGGAGGAGGA
GGAGGAGTTAGTTACCTCAATCACCAAGTCAGAGAACAAAGTGAATAGAATTTTGGATGAGTTACTGTCGGCTAACTGTGAAGATTTAGAAGGTGATCGAGCCATCAACA
AATTACAGGAATGCTTACAGATTAAACCCATCAATTTAGAGAAATTATGCCTTCCAGATTTGCAAGCTATTCAGACAGTGAATTTGAAATCTTCAAGAGGCAATGCGCCA
AAGCGTAGTTTGATCAGTGTGGACAATCAATTACAAAGGATAGAGACTTCGAAGTTTAAGCAGGATGATGAAAGTTCTGTTCATCTGCTTTCTACGCCATCCTCAATGAA
AAGTCCATTGGCATCAGTATTAGCCCTAAATAGGCAAATTTTGCTTTCAAATTCATCAAGTGATCCATTTTCAGCTCATGACATTGACAAGTCCCCAGCAAGAAATCCTT
CCTTTTCTGAACACATTAATCACTTGTCTGACATAGTTGATATTGCAAAGCAGTCGAGTGTTTCTAAACTGAAGTCACCTTTAACCAAAGATGGTGAGGCTGTACCTAAT
GGAATTAGGTCACCCAAATGCCCTATTGGAGATGTTGATTCTATGTCTAAAATATCTTTGGCTAATGTTTTAAATGTACCCGAAGTTGGTGGCAATGCTGCCTTAAATGG
AAGTCACGCCAGCATGGAAGCTAAGGAAATTAGTGGTAGCGACACAGAAGTGGAAGTAAATAAGAAATTGAGTTGTCTTGGAGCCAAAGCAGATGGTTTGGCTAATGCAT
CAAATGCATTGGATGATGAGGTGCATTTTGTTGTGCTAGTAAATAAGAAATTGAGTTGTCTTGGAGCCAAAGCAGATGGTTTGGCTAATGCATCAAATGCATTGGATGAT
GAGATGGAAGATCATGATGAATTAGCTTCAGAGCAACTGAACACATCCAAGGTGGATGCGACTAAAGAGTATCCGTTTGGTATTCAGAGTCAGTTGGATCAATCAACTGC
TACTTCTACTGATAATAATGTAGACGGGGTGTCCAGGAGCAGTGGAACGGATCACCATGATAAGGTCAAGCCAAAATCTCATGCAAACAAACAACGCAAAGACAAAAACA
TTTCTCGGAGGCAAAGCCTTGCAGGGGCTGGTACAAAGTGGGAAAGTGGGGTAAGAAGAAGTACGAGGTTCAAAACACGACCTTTGGAGTATTGGAAAGGTGAAAGGCTG
TTGTATGGACGTGTACATCAGAGCCTGGCAACAGTAATCGGGATGAAGTATGTGTCTCCAGCAAAAGGTAATGGCCAACCAACTCTGAAGGTGAAGTCTCTGGTCTCTAA
CAAGTACAAAGAACTAGTTGAGTTTGCAGCTCTGCACTAAGGGTCAGTACACAAAGGAGGAGCAAAGAGCTCTGCAGCTTTTTGGACTTTTCAAGTGCGGTAAGTAATTC
TCTTCTTGAATATAAGTAGGAGAGTTATGCTTATGCCATAGTATTGTATATTTCTGCGCCATTATTCTATATCATCATATATATATATATCCATCACAAGCTGTCTCACT
TGTGTGTAAACAGATGAACATTATGTTATCGCTCATGTACTCGTGTCATGTGTTCCAGAAAGAATTGTAATCCTTTGGCCAACTTGTATTTGCCTCACTGTTTTTTTTCC
TCTCTTTTTCTTTTTTGAGGGTGGCCAAATTGTAAACCTTTGGTAGCCTTGAGAATTGCTAGCTACAGGATCTTGTATAGGATTGGTTGTAGTGTAGTATAGTAGAGCAA
AATGTAAGGGACAGCTGAAATAGAAAAAATTGACAATATCGATGGAAGTGAGGTGGTTTTGTATTTTGAACTATCCTTTAACAGTTAGCGTAGCATTATTTGTCTGTTTG
GTCTAGGGTCGGTGCTATCCTTCGTTGTGAGGAGACATCAAGAATTTTTGGTATTAAACTCACTCACTCGAAGGTTCGAAGATAAAGACAAGATTACAAGTGTTACCACA
AGGCTCCATGACCTTACCAATGGAACCGGTAGCAGATTTGAAAATTGAATATCAATTTTAAAAAAATTATTTAATGTGTTTAGTAATATATTTGAAAACTAG

Protein sequence

Show/hide protein sequence

MVNEEARDSDVIDPLAAYSGINLFPSTFGILPDHSKPHDLGTGLDDIHKHLKSMVSRSPSKLIEQARAILDGNSNVMHSEIATFLVHDDENKETTAKVEENPQERRPALN
RKRARFSLKPDTRQPAVNLEATFNIKQLKDPEEFFLAFERLENAKIEIQKQTRGVLKDLNQQNPSTNTRHRRPGILGRSVRYKHQYSSITSEDDQNVEPSQVTFESGNIS
PSIMGTEKCPSPPIIGSEKRTGEHVPFEEEEEEEELVTSITKSENKVNRILDELLSANCEDLEGDRAINKLQECLQIKPINLEKLCLPDLQAIQTVNLKSSRGNAPKRSL
ISVDNQLQRIETSKFKQDDESSVHLLSTPSSMKSPLASVLALNRQILLSNSSSDPFSAHDIDKSPARNPSFSEHINHLSDIVDIAKQSSVSKLKSPLTKDGEAVPNGIRS
PKCPIGDVDSMSKISLANVLNVPEVGGNAALNGSHASMEAKEISGSDTEVEVNKKLSCLGAKADGLANASNALDDEVHFVVLVNKKLSCLGAKADGLANASNALDDEMED
HDELASEQLNTSKVDATKEYPFGIQSQLDQSTATSTDNNVDGVSRSSGTDHHDKVKPKSHANKQRKDKNISRRQSLAGAGTKWESGVRRSTRFKTRPLEYWKGERLLYGR
VHQSLATVIGMKYVSPAKGNGQPTLKVKSLVSNKYKELVEFAALH

MC09g0310 (gene) of Bitter gourd (Dali-11) v1 genome