CuGenDBv2

Gene ID	Clc03G08060
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	SAP30-binding protein-like
Genome location	ClcChr03:8253039..8258013
RNA-Seq Expression	Clc03G08060
Synteny	Clc03G08060
Gene Ontology terms	GO:0006355 - regulation of transcription, DNA-templated (biological process) GO:0016874 - ligase activity (molecular function)
InterPro domains	IPR012479 - SAP30-binding protein

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8653213.1 hypothetical protein Csa_019629 [Cucumis sativus]

1.1e-221

93.88

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED  EEEED E+HPQQM+EEGG+EDYAGVRV EEELVANSDRMII+DSANDSTPPVAGEN TPDKLK+GSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPPQVVVSSSPM+LQ GQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDR+SPGTV +STSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        NV+ ESETEKVE+T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK+VFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEI E DMKREMERKELERKKSPKMEFV+GGTQPGGTVVTAPKINIPFSGVSAIT SGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSER
        GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRS ++
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSER

XP_004150215.1 uncharacterized protein LOC101206323 [Cucumis sativus]

2.8e-225

94.41

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED  EEEED E+HPQQM+EEGG+EDYAGVRV EEELVANSDRMII+DSANDSTPPVAGEN TPDKLK+GSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPPQVVVSSSPM+LQ GQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDR+SPGTV +STSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        NV+ ESETEKVE+T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK+VFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEI E DMKREMERKELERKKSPKMEFV+GGTQPGGTVVTAPKINIPFSGVSAIT SGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRS ERKLDRRS
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

XP_008443368.1 PREDICTED: uncharacterized protein LOC103486971 [Cucumis melo]

5.0e-227

95.08

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED EEEEED E+HPQQMQE GG+EDYAGVRV EEELVANSDRMII+DSANDSTPPVAGEN TPDKLKYGSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPP VVVSSSPM+LQ GQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVT+STSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        N + ESETEKVE+T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK+VFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEI E DMKREMERKELERKKSPKMEFVSGGTQ GGTVVTAPKINIPFSGVSAIT SGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

XP_038894985.1 uncharacterized protein LOC120083338 isoform X1 [Benincasa hispida]

3.5e-228

95.08

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED+  EEEDSE+HPQQMQEEGG+EDYAGVRV EEELV NSDRMII+DSAN STPPVA ENSTPDKLK+GSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPPQVVVSSSPM LQAGQ DNSGRRRGT+ IVDYGHDE AMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        NVILESETEKVE T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEIVE DMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPK+NIPFSGVSAITGSGLHSAAPASD IPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        GG DAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

XP_038894986.1 uncharacterized protein LOC120083338 isoform X2 [Benincasa hispida]

3.2e-226

94.85

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED+  EEEDSE+HPQQMQEEGG+EDYAGVRV EEELV NSDRMII+DSAN STPPVA ENSTPDKLK+GSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPPQVVVSSSPM LQAGQ DNSGRRRGT+ IVDYGHDE AMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        NVILESETEKVE T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEI E DMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPK+NIPFSGVSAITGSGLHSAAPASD IPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        GG DAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LX73 Uncharacterized protein

5.2e-222

93.88

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED  EEEED E+HPQQM+EEGG+EDYAGVRV EEELVANSDRMII+DSANDSTPPVAGEN TPDKLK+GSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPPQVVVSSSPM+LQ GQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDR+SPGTV +STSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        NV+ ESETEKVE+T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK+VFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEI E DMKREMERKELERKKSPKMEFV+GGTQPGGTVVTAPKINIPFSGVSAIT SGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSER
        GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRS ++
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSER

A0A1S3B7X1 uncharacterized protein LOC103486971

2.4e-227

95.08

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED EEEEED E+HPQQMQE GG+EDYAGVRV EEELVANSDRMII+DSANDSTPPVAGEN TPDKLKYGSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPP VVVSSSPM+LQ GQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVT+STSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        N + ESETEKVE+T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK+VFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEI E DMKREMERKELERKKSPKMEFVSGGTQ GGTVVTAPKINIPFSGVSAIT SGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

A0A5A7UPK6 SAP30-binding protein-like

2.4e-227

95.08

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKKQSEGIALLSMYNDEDDEMEDVED EEEEED E+HPQQMQE GG+EDYAGVRV EEELVANSDRMII+DSANDSTPPVAGEN TPDKLKYGSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPP VVVSSSPM+LQ GQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVT+STSNNLSTPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        N + ESETEKVE+T+EEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK+VFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYYTEI E DMKREMERKELERKKSPKMEFVSGGTQ GGTVVTAPKINIPFSGVSAIT SGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

A0A6J1GT35 DNA ligase 1-like isoform X1

1.4e-211

90.16

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP
        MASKKK+SEGIALLSMYNDEDDEMEDVED EEEEEDSE+  QQ QEEGG +DY GVRV EEE   NSDRMI+++SANDSTPPV  EN TPDKLK+GSSTP
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTP

Query:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN
        QPPQ VVS+SPMLLQ    DNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTV V T NNL+TPQISESPHSGSMN
Subjt:  QPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMN

Query:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
        N+ILESETEKVE+T+EEEKKDIDPLDKFLPPPPK+KCSE+LQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY
Subjt:  NVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGY

Query:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
        DKSDYY EI E DMKREMERKELERKKSPKMEFVSGGTQPGGTVV APK+NIPFSGVSAI GSGLHSAA ASDAIPRDGRQNKKSKWDKVDGDRRNPVIS
Subjt:  DKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVIS

Query:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        GGSDAASAH ALLS+ANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
Subjt:  GGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

A0A6J1K652 DNA ligase 1 isoform X1

3.0e-209

87.91

Show/hide

Query:  MASKKKQSEGIALLSMYNDEDDEMEDVED--------QEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDK
        MASKKK+SEGIALLSMYNDEDD+MEDVED        +EEEEEDSE+H QQ Q+EGG++DY GVRV EEE   NSDRMI+++SANDSTPPV  EN TP+K
Subjt:  MASKKKQSEGIALLSMYNDEDDEMEDVED--------QEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDK

Query:  LKYGSSTPQPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISE
        LK+GSSTPQPPQ VVS SPMLLQ    DNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTV V T NNL+TPQISE
Subjt:  LKYGSSTPQPPQVVVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISE

Query:  SPHSGSMNNVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK
        SPHSGSMNN+ILESETEKVE+T+EEEKKDI+PLDKFLPPPPK+KCSE+LQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK
Subjt:  SPHSGSMNNVILESETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSK

Query:  DVFDPHGYDKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDG
        DVFDPHGYDKSDYY EI E DMKREMERKELERKKSPKMEFVSGGTQPGGTVV APK+NIPFSGVSAI GSGLHSAA ASDAIPRDGRQNKKSKWDKVDG
Subjt:  DVFDPHGYDKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDG

Query:  DRRNPVISGGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
        DRRNPVISGGSDAASAH ALLS+ANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
Subjt:  DRRNPVISGGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

SwissProt top hits

e value

%identity

Alignment

Q02614 SAP30-binding protein

3.7e-15

31.15

Show/hide

Query:  ETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYK-KAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGYDKSDY
        + +++  +  E  +++ P +  +PP P  +CS  LQ KI K  E K K G   N  ++ +K++RNP      +++  ID++G+ + KD+FDPHG+ +  Y
Subjt:  ETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYK-KAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGYDKSDY

Query:  YTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWD
        Y  + +   K EM++ E  +K+  K+EFV+ GT+ G T                 T +   S + AS A+     Q +KSKWD
Subjt:  YTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWD

Q9UHR5 SAP30-binding protein

4.1e-14

32.64

Show/hide

Query:  ETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYK-KAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGYDKSDY
        + +++  +  E  +++ P +  +PP P  +CS  LQ KI K  E K K G   N  ++ +K++RNP      +++  ID++G+ + KD+FDPHG+ +  Y
Subjt:  ETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYK-KAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGYDKSDY

Query:  YTEIVEVDMKREMERKELERKKSPKMEFVSG---GTQPGGTVVT
        Y  + +   K EM++ E  +K+  K+EFV+G   GT    T  T
Subjt:  YTEIVEVDMKREMERKELERKKSPKMEFVSG---GTQPGGTVVT

Arabidopsis top hits

e value

%identity

Alignment

AT1G29220.1 transcriptional regulator family protein

2.2e-71

43.95

Show/hide

Query:  KQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTPQPPQV
        K+SEGIALLS+Y+DEDD  E++ED EEEEE+ E    Q + E         ++ EE+ V  ++ M      ++      GE+S   +L  G        V
Subjt:  KQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTPQPPQV

Query:  VVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMNNVILE
          SSS                            A  +P + D   +ES R  + + ++G +G  D       +  +S+ L                    
Subjt:  VVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMNNVILE

Query:  SETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGYDKSDY
                           LD+FLPP P+E+CSE+LQRKI+KFL  KK GKSFN+EVRNRK+YRNPDFLLHAV YQDIDQIGSCFSKDVFDP GYD SD 
Subjt:  SETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGYDKSDY

Query:  YTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVISGGS--
        + + +E+DMK E ERKE E KK+ K++FVS GTQP G V  A K NIP  G+ A+  SGL S    ++   RDGR NKKSKWDKVDGD +NP ++ G+  
Subjt:  YTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVISGGS--

Query:  --DAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
           +  ++AAL+SA + GSGY AFAQQRRRE E +RSSERKL+RRS
Subjt:  --DAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

AT1G29220.2 transcriptional regulator family protein

1.0e-68

42.79

Show/hide

Query:  KQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTPQPPQV
        K+SEGIALLS+Y+DEDD  E++ED EEEEE+ E    Q + E         ++ EE+ V  ++ M      ++      GE+S   +L  G        V
Subjt:  KQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTPQPPQV

Query:  VVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMNNVILE
          SSS                            A  +P + D   +ES R  + + ++G +G  D       +  +S+ L                    
Subjt:  VVSSSPMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMNNVILE

Query:  SETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQ------------RKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKD
                           LD+FLPP P+E+CSE+LQ            RKI+KFL  KK GKSFN+EVRNRK+YRNPDFLLHAV YQDIDQIGSCFSKD
Subjt:  SETEKVEKTLEEEKKDIDPLDKFLPPPPKEKCSEDLQ------------RKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKD

Query:  VFDPHGYDKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGD
        VFDP GYD SD + + +E+DMK E ERKE E KK+ K++FVS GTQP G V  A K NIP  G+ A+  SGL S    ++   RDGR NKKSKWDKVDGD
Subjt:  VFDPHGYDKSDYYTEIVEVDMKREMERKELERKKSPKMEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGD

Query:  RRNPVISGGS----DAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS
         +NP ++ G+     +  ++AAL+SA + GSGY AFAQQRRRE E +RSSERKL+RRS
Subjt:  RRNPVISGGS----DAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSERKLDRRS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCATCGAAGAAGAAACAATCTGAAGGTATAGCTTTACTCTCGATGTACAATGACGAGGACGATGAGATGGAAGACGTTGAAGACCAAGAAGAAGAAGAAGAAGACAG
TGAAATGCATCCGCAGCAGATGCAAGAAGAGGGAGGACAGGAAGATTATGCTGGAGTTAGGGTTGATGAAGAAGAGTTGGTTGCGAACAGTGATAGAATGATTATCACTG
ATTCTGCCAATGATTCGACGCCGCCGGTTGCTGGTGAAAATTCGACTCCAGATAAGCTCAAATACGGTTCATCCACACCACAGCCGCCCCAGGTTGTGGTTTCATCGTCG
CCAATGCTATTACAAGCTGGGCAATTAGATAATTCTGGTAGGAGAAGGGGGACACTTGCGATAGTTGATTACGGTCATGATGAAGCCGCAATGTCTCCTGAGGCTGAGGA
TGGAGAAATTGAAGAATCTGGTCGTGTCACATTTGGCGATGAGCTTTTAGGCACTAATGGTGATTTTGATAGAACATCTCCAGGAACTGTAACGGTCTCAACATCAAACA
ATCTATCCACTCCTCAAATTTCTGAATCGCCACATTCTGGTTCAATGAACAATGTGATACTGGAATCTGAAACTGAAAAAGTTGAGAAAACTCTTGAAGAAGAGAAAAAA
GACATTGACCCCTTGGACAAGTTTCTTCCTCCTCCACCAAAAGAAAAATGCTCAGAGGACCTGCAAAGGAAAATCAATAAGTTTCTTGAGTACAAAAAAGCCGGAAAGAG
CTTCAATGCAGAAGTACGCAATAGGAAAGATTACCGAAATCCAGATTTCTTGTTACATGCTGTGAGGTATCAAGATATTGACCAGATTGGGTCTTGCTTCAGTAAGGATG
TGTTTGATCCTCATGGATATGATAAAAGTGACTACTATACTGAAATAGTAGAGGTTGACATGAAACGTGAGATGGAGAGGAAGGAGCTGGAAAGGAAGAAAAGTCCGAAG
ATGGAGTTTGTTTCAGGAGGAACACAACCCGGTGGTACAGTTGTGACTGCTCCTAAAATAAATATACCTTTTTCAGGTGTTTCAGCCATCACTGGTAGTGGATTACATTC
AGCAGCTCCTGCATCTGATGCCATTCCTAGGGATGGAAGACAAAACAAAAAATCAAAATGGGATAAGGTAGATGGAGATAGAAGAAATCCAGTAATTTCCGGTGGGTCAG
ATGCAGCTAGTGCCCATGCAGCTTTACTATCTGCTGCTAATGTTGGCTCTGGATACATGGCTTTTGCGCAACAGAGGCGGCGAGAGGCTGAAGAAAAAAGATCAAGTGAG
AGGAAATTGGATAGAAGATCCTAA

mRNA sequence

Show/hide mRNA sequence

CACTTTTCTTCCTTTTCATTCACTGGCTCCGACCGCCCGGGAAACTGAAAACCCTTCTCCCAGTACGCCATTGAGTCAAAATTCCCAAGCTTTCTGCATCCAATTGAAAT
CCAACTTTCTATATCTAAAGTCCTGTTTCTTTTTTGTTGAACTATTTCCTTCCGGGTGCCGAGGATCGAAGCTCTCATGGCATCGAAGAAGAAACAATCTGAAGGTATAG
CTTTACTCTCGATGTACAATGACGAGGACGATGAGATGGAAGACGTTGAAGACCAAGAAGAAGAAGAAGAAGACAGTGAAATGCATCCGCAGCAGATGCAAGAAGAGGGA
GGACAGGAAGATTATGCTGGAGTTAGGGTTGATGAAGAAGAGTTGGTTGCGAACAGTGATAGAATGATTATCACTGATTCTGCCAATGATTCGACGCCGCCGGTTGCTGG
TGAAAATTCGACTCCAGATAAGCTCAAATACGGTTCATCCACACCACAGCCGCCCCAGGTTGTGGTTTCATCGTCGCCAATGCTATTACAAGCTGGGCAATTAGATAATT
CTGGTAGGAGAAGGGGGACACTTGCGATAGTTGATTACGGTCATGATGAAGCCGCAATGTCTCCTGAGGCTGAGGATGGAGAAATTGAAGAATCTGGTCGTGTCACATTT
GGCGATGAGCTTTTAGGCACTAATGGTGATTTTGATAGAACATCTCCAGGAACTGTAACGGTCTCAACATCAAACAATCTATCCACTCCTCAAATTTCTGAATCGCCACA
TTCTGGTTCAATGAACAATGTGATACTGGAATCTGAAACTGAAAAAGTTGAGAAAACTCTTGAAGAAGAGAAAAAAGACATTGACCCCTTGGACAAGTTTCTTCCTCCTC
CACCAAAAGAAAAATGCTCAGAGGACCTGCAAAGGAAAATCAATAAGTTTCTTGAGTACAAAAAAGCCGGAAAGAGCTTCAATGCAGAAGTACGCAATAGGAAAGATTAC
CGAAATCCAGATTTCTTGTTACATGCTGTGAGGTATCAAGATATTGACCAGATTGGGTCTTGCTTCAGTAAGGATGTGTTTGATCCTCATGGATATGATAAAAGTGACTA
CTATACTGAAATAGTAGAGGTTGACATGAAACGTGAGATGGAGAGGAAGGAGCTGGAAAGGAAGAAAAGTCCGAAGATGGAGTTTGTTTCAGGAGGAACACAACCCGGTG
GTACAGTTGTGACTGCTCCTAAAATAAATATACCTTTTTCAGGTGTTTCAGCCATCACTGGTAGTGGATTACATTCAGCAGCTCCTGCATCTGATGCCATTCCTAGGGAT
GGAAGACAAAACAAAAAATCAAAATGGGATAAGGTAGATGGAGATAGAAGAAATCCAGTAATTTCCGGTGGGTCAGATGCAGCTAGTGCCCATGCAGCTTTACTATCTGC
TGCTAATGTTGGCTCTGGATACATGGCTTTTGCGCAACAGAGGCGGCGAGAGGCTGAAGAAAAAAGATCAAGTGAGAGGAAATTGGATAGAAGATCCTAAGAGCAATGAA
TTCTGTTCCATAGTATTAAGTATTGAACCATTTTGAAAAGCAATGAAAATGGCTTGTAGCTTCGTATCTGTGACTAACCATGTATACGGTCAGAATGAAAATGTAATTCT
TCAGTATTAGTTCCCTCTTGAAAGTGTATTATTTATTGCCCATAAACTCATTTTTTTTTCCCATTAAATTTCTTGACTTGTAAAGATGATCCAGGGGGATAACAAATTAC
AGCAGAGCGAAGGAGGAGGCTCCTTTTTCTGTAAGTTTCATGAGAGTAAGAAAATTGACTAC

Protein sequence

Show/hide protein sequence

MASKKKQSEGIALLSMYNDEDDEMEDVEDQEEEEEDSEMHPQQMQEEGGQEDYAGVRVDEEELVANSDRMIITDSANDSTPPVAGENSTPDKLKYGSSTPQPPQVVVSSS
PMLLQAGQLDNSGRRRGTLAIVDYGHDEAAMSPEAEDGEIEESGRVTFGDELLGTNGDFDRTSPGTVTVSTSNNLSTPQISESPHSGSMNNVILESETEKVEKTLEEEKK
DIDPLDKFLPPPPKEKCSEDLQRKINKFLEYKKAGKSFNAEVRNRKDYRNPDFLLHAVRYQDIDQIGSCFSKDVFDPHGYDKSDYYTEIVEVDMKREMERKELERKKSPK
MEFVSGGTQPGGTVVTAPKINIPFSGVSAITGSGLHSAAPASDAIPRDGRQNKKSKWDKVDGDRRNPVISGGSDAASAHAALLSAANVGSGYMAFAQQRRREAEEKRSSE
RKLDRRS

Clc03G08060 (gene) of Watermelon (cordophanus) v2 genome