; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lsi07G003340 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome

Gene IDLsi07G003340
OrganismLagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
DescriptionDNA-binding protein BIN4
Genome locationchr07:3529304..3535648
RNA-Seq ExpressionLsi07G003340
SyntenyLsi07G003340
Gene Ontology termsGO:0042023 - DNA endoreduplication (biological process)
GO:0009330 - DNA topoisomerase complex (ATP-hydrolyzing) (cellular component)
GO:0003690 - double-stranded DNA binding (molecular function)
InterPro domainsIPR033246 - DNA-binding protein BIN4


Homology Show/hide homology
GenBank top hitse value%identityAlignment
TYK02024.1 DNA-binding protein BIN4 isoform X2 [Cucumis melo var. makuwa]5.2e-15669.89Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        APTGVALSSNS SSKNGSSSMDNAID++ PSSHKTTQDLDGDQIQGDCGNHNLAKE  L+  TG+ENS+HSVWMLSSDSESC DNNFIKE+ +HHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
        LATS+ QGR KDENAGRRFTEGKSKSRKVS + SPKK++KSQVCTS KEK INS+TNKGGL LEGSE +VRN G+ EI+EKDALDDC  PPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLK               GT+YRA IVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVE                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        GFSFDSEDEAEKI+KVASSP DQNEPVEGL TKSKNK EKSSGRKRVK+GG+LQAPKKTRKKVQ SKTKN KSKK
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

XP_008460814.1 PREDICTED: DNA-binding protein BIN4 isoform X1 [Cucumis melo]5.0e-16772.21Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        APTGVALSSNS SSKNGSSSMDNAID++ PSSHKTTQDLDGDQIQGDCGNHNLAKE  L+  TG+ENS+HSVWMLSSDSESC DNNFIKE+ +HHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
        LATS+ QGR KDENAGRRFTEGKSKSRKVS + SPKK++KSQVCTS KEK INS+TNKGGL LEGSE +VRN G+ EI+EKDALDDC  PPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLKGKFHP++LCFGSK  GT+YRA IVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVE                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        GFSFDSEDEAEKI+KVASSP DQNEPVEGL TKSKNK EKSSGRKRVK+GG+LQAPKKTRKKVQ SKTKN KSKK
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

XP_008460815.1 PREDICTED: DNA-binding protein BIN4 isoform X2 [Cucumis melo]5.2e-15669.89Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        APTGVALSSNS SSKNGSSSMDNAID++ PSSHKTTQDLDGDQIQGDCGNHNLAKE  L+  TG+ENS+HSVWMLSSDSESC DNNFIKE+ +HHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
        LATS+ QGR KDENAGRRFTEGKSKSRKVS + SPKK++KSQVCTS KEK INS+TNKGGL LEGSE +VRN G+ EI+EKDALDDC  PPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLK               GT+YRA IVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVE                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        GFSFDSEDEAEKI+KVASSP DQNEPVEGL TKSKNK EKSSGRKRVK+GG+LQAPKKTRKKVQ SKTKN KSKK
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

XP_038894608.1 DNA-binding protein BIN4 isoform X1 [Benincasa hispida]9.8e-16371.08Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        AP GVALSSNSESSKN SSSMDNA+D+KGPSS+KTTQDLDGDQIQGDCGNHNLAKEV  EEHT +ENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
         ATSQFQGRG+DENAG RFTEGKSKS KVSNKKSPKKQVKSQVCTSVKEK INSETNKGGLMLEGSE YVRNG DV+IIEKDALD CNGPPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSS KNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAK----------------IESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNL
        LCLDLK               GTIYRAAIVPSRTFCIV+FGQSEAK                IESIMNDFIQLKALSKVDEAETM+E             
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAK----------------IESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNL

Query:  LISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
                    GTLDGFSFDSEDEAEKI KV SSPTDQNEPVEGL TKSKNK EKSSGRKRVK GGKLQAPKKTRKKVQ SKTK+TKSKK
Subjt:  LISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

XP_038894663.1 DNA-binding protein BIN4 isoform X2 [Benincasa hispida]7.3e-16673.47Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        AP GVALSSNSESSKN SSSMDNA+D+KGPSS+KTTQDLDGDQIQGDCGNHNLAKEV  EEHT +ENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
         ATSQFQGRG+DENAG RFTEGKSKS KVSNKKSPKKQVKSQVCTSVKEK INSETNKGGLMLEGSE YVRNG DV+IIEKDALD CNGPPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSS KNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLK               GTIYRAAIVPSRTFCIV+FGQSEAKIESIMNDFIQLKALSKVDEAETM+E                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        GFSFDSEDEAEKI KV SSPTDQNEPVEGL TKSKNK EKSSGRKRVK GGKLQAPKKTRKKVQ SKTK+TKSKK
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

TrEMBL top hitse value%identityAlignment
A0A0A0LJZ5 Uncharacterized protein2.9e-15269.4Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        APTGVALSSNS SSKNGSSSMDNAID++ PSSHKTTQDLDGDQIQGDCGNHNLAKEV L+ HTG+ENSKHSVWMLS DSESC DNNFIKE+YS+HEEL+E
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
        LATS+ QGR KDENAGRRFTEGKSKSRKVSN+ SPKK+VKS+VCTS KE  +NS TNKGG  +EGSE +VRN GDVEI+EKDALDDC GPPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDK HRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLK               GT+YRA IVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVE                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQ
        GFSFDSED+AEKI+K A+SP DQNEPVEGL TKSKNK EKSSGRKRVKTGG+LQAPKKTRKKVQ
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQ

A0A1S3CDA8 DNA-binding protein BIN4 isoform X22.5e-15669.89Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        APTGVALSSNS SSKNGSSSMDNAID++ PSSHKTTQDLDGDQIQGDCGNHNLAKE  L+  TG+ENS+HSVWMLSSDSESC DNNFIKE+ +HHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
        LATS+ QGR KDENAGRRFTEGKSKSRKVS + SPKK++KSQVCTS KEK INS+TNKGGL LEGSE +VRN G+ EI+EKDALDDC  PPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLK               GT+YRA IVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVE                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        GFSFDSEDEAEKI+KVASSP DQNEPVEGL TKSKNK EKSSGRKRVK+GG+LQAPKKTRKKVQ SKTKN KSKK
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

A0A1S3CDB0 DNA-binding protein BIN4 isoform X12.4e-16772.21Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        APTGVALSSNS SSKNGSSSMDNAID++ PSSHKTTQDLDGDQIQGDCGNHNLAKE  L+  TG+ENS+HSVWMLSSDSESC DNNFIKE+ +HHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
        LATS+ QGR KDENAGRRFTEGKSKSRKVS + SPKK++KSQVCTS KEK INS+TNKGGL LEGSE +VRN G+ EI+EKDALDDC  PPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLKGKFHP++LCFGSK  GT+YRA IVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVE                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        GFSFDSEDEAEKI+KVASSP DQNEPVEGL TKSKNK EKSSGRKRVK+GG+LQAPKKTRKKVQ SKTKN KSKK
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

A0A5D3BS94 DNA-binding protein BIN4 isoform X22.5e-15669.89Show/hide
Query:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE
        APTGVALSSNS SSKNGSSSMDNAID++ PSSHKTTQDLDGDQIQGDCGNHNLAKE  L+  TG+ENS+HSVWMLSSDSESC DNNFIKE+ +HHEELSE
Subjt:  APTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSE

Query:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV
        LATS+ QGR KDENAGRRFTEGKSKSRKVS + SPKK++KSQVCTS KEK INS+TNKGGL LEGSE +VRN G+ EI+EKDALDDC  PPVSSSRLPLV
Subjt:  LATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLV

Query:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
        LSDKVHRLK                                                          ALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
Subjt:  LSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE

Query:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD
        LCLDLK               GT+YRA IVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVE                         GTLD
Subjt:  LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLD

Query:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        GFSFDSEDEAEKI+KVASSP DQNEPVEGL TKSKNK EKSSGRKRVK+GG+LQAPKKTRKKVQ SKTKN KSKK
Subjt:  GFSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

A0A6J1CI66 DNA-binding protein BIN4 isoform X15.9e-14566.67Show/hide
Query:  PTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSEL
        PTGVALSSNSESS N SS MDNAID+K  SSHKTTQDLDGDQIQGD G+HNL KE+ LEEH G+ +SKHSVWMLSSDSE C DN+ IKE+YSHHEEL E 
Subjt:  PTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSEL

Query:  ATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVL
         TSQF GR KDEN  R FT+GKSKSRKVS+KKSPKK+VKSQV T  KEK IN  TNK G +LEGSEC VRNGGDVEII KDALDDCNGPPVSSSRLPLVL
Subjt:  ATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVL

Query:  SDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNEL
        SDKVHRLK                                                          ALVECEGTSIDLSGD+GAVGRVVVSDSS AKNEL
Subjt:  SDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNEL

Query:  CLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDG
        CLDLK               GTIYRAAIVPSRTFCIVSFGQSEAK+E IMNDFIQLKA S +DEAETMVE                         GTLDG
Subjt:  CLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDG

Query:  FSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        FSFDSEDEAEKI+KV+SSPTDQNE VEGL  KSKNK EKSSGRKRV+TGGKLQAPKK RKKVQ  KTKN KSKK
Subjt:  FSFDSEDEAEKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

SwissProt top hitse value%identityAlignment
Q9FLU1 DNA-binding protein BIN42.6e-2531.44Show/hide
Query:  DQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSELATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKS
        D   G    +N+  E    +H   +    SVW++SSDSE    ++ IK+  +   E             KD +     TE +   + V  +KSPK + KS
Subjt:  DQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSELATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKS

Query:  QVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVLSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNS
                +    E N    +L+  +       D  I E+         P  S +     S K  + + N     +K ++  K+    + +    +   +
Subjt:  QVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVLSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNS

Query:  MQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFG
         Q  K +     +    +  ++ +   LVECEG SIDLSGDMGAVGRVVVSD++    ++ LDLK               GTIY++ I+PSRTFC+V+ G
Subjt:  MQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFG

Query:  QSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKN
        Q+EAKIE+IMNDFIQL   S V EAETMVE                         GTL+GF+F+S+DE+ K +K A  P DQ+   E         K+K 
Subjt:  QSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKN

Query:  KTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        K E   G+KR +   + Q P    KK + S  K  K+KK
Subjt:  KTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

Arabidopsis top hitse value%identityAlignment
AT5G24630.1 double-stranded DNA binding3.6e-3045.28Show/hide
Query:  LVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAET
        LVECEG SIDLSGDMGAVGRVVVSD++    ++ LDLK               GTIY++ I+PSRTFC+V+ GQ+EAKIE+IMNDFIQL   S V EAET
Subjt:  LVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAET

Query:  MVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKV
        MVE                         GTL+GF+F+S+DE+ K +K A  P DQ+   E         K+K K E   G+KR +   + Q P    KK 
Subjt:  MVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKV

Query:  QASKTKNTKSKK
        + S  K  K+KK
Subjt:  QASKTKNTKSKK

AT5G24630.2 double-stranded DNA binding3.6e-3045.28Show/hide
Query:  LVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAET
        LVECEG SIDLSGDMGAVGRVVVSD++    ++ LDLK               GTIY++ I+PSRTFC+V+ GQ+EAKIE+IMNDFIQL   S V EAET
Subjt:  LVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAET

Query:  MVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKV
        MVE                         GTL+GF+F+S+DE+ K +K A  P DQ+   E         K+K K E   G+KR +   + Q P    KK 
Subjt:  MVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKV

Query:  QASKTKNTKSKK
        + S  K  K+KK
Subjt:  QASKTKNTKSKK

AT5G24630.3 double-stranded DNA binding1.4e-2631.35Show/hide
Query:  IQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSELATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQV
        ++G    +N+  E    +H   +    SVW++SSDSE    ++ IK+  +   E             KD +     TE +   + V  +KSPK + KS  
Subjt:  IQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSELATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQV

Query:  CTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVLSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQ
              +    E N    +L+  +       D  I E+         P  S +     S K  + + N     +K ++  K+    + +    +   + Q
Subjt:  CTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVLSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQ

Query:  HSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQS
          K +     +    +  ++ +   LVECEG SIDLSGDMGAVGRVVVSD++    ++ LDLK               GTIY++ I+PSRTFC+V+ GQ+
Subjt:  HSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQS

Query:  EAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKT
        EAKIE+IMNDFIQL   S V EAETMVE                         GTL+GF+F+S+DE+ K +K A  P DQ+   E         K+K K 
Subjt:  EAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKT

Query:  EKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        E   G+KR +   + Q P    KK + S  K  K+KK
Subjt:  EKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

AT5G24630.4 double-stranded DNA binding1.4e-2631.35Show/hide
Query:  IQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSELATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQV
        ++G    +N+  E    +H   +    SVW++SSDSE    ++ IK+  +   E             KD +     TE +   + V  +KSPK + KS  
Subjt:  IQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSESCPDNNFIKENYSHHEELSELATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQV

Query:  CTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVLSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQ
              +    E N    +L+  +       D  I E+         P  S +     S K  + + N     +K ++  K+    + +    +   + Q
Subjt:  CTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGPPVSSSRLPLVLSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQ

Query:  HSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQS
          K +     +    +  ++ +   LVECEG SIDLSGDMGAVGRVVVSD++    ++ LDLK               GTIY++ I+PSRTFC+V+ GQ+
Subjt:  HSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQS

Query:  EAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKT
        EAKIE+IMNDFIQL   S V EAETMVE                         GTL+GF+F+S+DE+ K +K A  P DQ+   E         K+K K 
Subjt:  EAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKT

Query:  EKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK
        E   G+KR +   + Q P    KK + S  K  K+KK
Subjt:  EKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK

AT5G24630.5 double-stranded DNA binding3.6e-3045.28Show/hide
Query:  LVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAET
        LVECEG SIDLSGDMGAVGRVVVSD++    ++ LDLK               GTIY++ I+PSRTFC+V+ GQ+EAKIE+IMNDFIQL   S V EAET
Subjt:  LVECEGTSIDLSGDMGAVGRVVVSDSSSAKNELCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAET

Query:  MVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKV
        MVE                         GTL+GF+F+S+DE+ K +K A  P DQ+   E         K+K K E   G+KR +   + Q P    KK 
Subjt:  MVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEAEKISKVASSPTDQNEPVE-----GLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKV

Query:  QASKTKNTKSKK
        + S  K  K+KK
Subjt:  QASKTKNTKSKK


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCCGGGCCCAAATGGGCAGTTCGAGAGAACAGTCTCCAGATTGGATGCGATCTTTCCAAGTTTGAGATTGCGAGGAAATGACTGCAGCGCACCAACTGGTGTTGCTCT
ATCCTCTAATTCTGAATCTTCAAAGAATGGTAGCTCATCAATGGACAATGCAATTGATGAAAAGGGTCCATCATCACATAAAACCACACAGGATTTAGATGGAGATCAGA
TTCAAGGGGATTGTGGCAACCATAATTTGGCGAAGGAAGTGACACTTGAGGAACATACAGGCAATGAAAACTCAAAGCACTCTGTTTGGATGCTATCATCGGATTCAGAG
TCATGTCCTGATAATAATTTTATAAAGGAGAATTACAGTCATCATGAAGAATTATCTGAACTTGCAACATCTCAGTTCCAAGGGAGAGGGAAGGATGAAAATGCAGGTCG
CAGATTCACTGAGGGAAAATCTAAATCAAGGAAAGTATCAAATAAAAAGTCTCCAAAAAAACAGGTCAAATCACAAGTTTGCACTTCAGTAAAAGAGAAGACAATCAATT
CTGAAACAAATAAAGGTGGTCTTATGTTGGAAGGATCTGAATGCTATGTAAGAAATGGTGGAGATGTGGAGATTATAGAAAAAGATGCATTGGATGACTGCAACGGACCT
CCTGTTTCCTCCTCAAGGTTGCCATTGGTGTTGTCTGACAAAGTCCACCGGTTGAAGAGAAATAGGTTGCTTCCAAGAGTGAAACGAGATGAGAGTTCAAAGAATTGTCA
TGGAGCTAGTTTTCTTAAATTCTTTAATCAAAGTAATAACAGCATGCAGCATTCTAAGTCCAATTGTCGAGGGAAGGTGAAGCGGAGAAAGAATATTGAATATGAGATTT
GGAAGGCTATTGCACTTGTTGAGTGTGAAGGAACTTCAATAGATTTGAGCGGTGACATGGGTGCTGTAGGGCGGGTTGTAGTTTCAGATTCCTCATCTGCAAAAAATGAA
CTTTGCCTAGATCTGAAAGGTAAGTTTCATCCACATGTGCTATGTTTTGGCAGTAAAAGTCCAGGTACAATTTACAGAGCGGCAATAGTTCCTTCAAGGACATTTTGCAT
CGTTAGCTTTGGTCAGTCGGAGGCAAAGATAGAATCTATCATGAACGACTTCATACAGTTGAAGGCACTGTCCAAAGTTGATGAGGCTGAAACTATGGTTGAAGGTGACC
TGCTTTCAATTTCTCTAAATTGTTCAAATTTGCTTATTTCTATTCTCATTCTATGTTTTGCATCTGTAGGAACATTAGATGGCTTCTCATTTGATTCTGAAGACGAGGCT
GAGAAAATATCTAAAGTTGCTTCTTCTCCAACTGACCAAAATGAGCCTGTAGAAGGGCTCTACACAAAATCCAAAAACAAAACCGAGAAATCATCAGGGCGGAAGCGTGT
TAAAACTGGAGGAAAGCTGCAGGCACCGAAGAAAACAAGGAAGAAAGTTCAAGCTTCTAAGACTAAAAATACAAAGAGCAAGAAATGA
mRNA sequenceShow/hide mRNA sequence
ATGCCGGGCCCAAATGGGCAGTTCGAGAGAACAGTCTCCAGATTGGATGCGATCTTTCCAAGTTTGAGATTGCGAGGAAATGACTGCAGCGCACCAACTGGTGTTGCTCT
ATCCTCTAATTCTGAATCTTCAAAGAATGGTAGCTCATCAATGGACAATGCAATTGATGAAAAGGGTCCATCATCACATAAAACCACACAGGATTTAGATGGAGATCAGA
TTCAAGGGGATTGTGGCAACCATAATTTGGCGAAGGAAGTGACACTTGAGGAACATACAGGCAATGAAAACTCAAAGCACTCTGTTTGGATGCTATCATCGGATTCAGAG
TCATGTCCTGATAATAATTTTATAAAGGAGAATTACAGTCATCATGAAGAATTATCTGAACTTGCAACATCTCAGTTCCAAGGGAGAGGGAAGGATGAAAATGCAGGTCG
CAGATTCACTGAGGGAAAATCTAAATCAAGGAAAGTATCAAATAAAAAGTCTCCAAAAAAACAGGTCAAATCACAAGTTTGCACTTCAGTAAAAGAGAAGACAATCAATT
CTGAAACAAATAAAGGTGGTCTTATGTTGGAAGGATCTGAATGCTATGTAAGAAATGGTGGAGATGTGGAGATTATAGAAAAAGATGCATTGGATGACTGCAACGGACCT
CCTGTTTCCTCCTCAAGGTTGCCATTGGTGTTGTCTGACAAAGTCCACCGGTTGAAGAGAAATAGGTTGCTTCCAAGAGTGAAACGAGATGAGAGTTCAAAGAATTGTCA
TGGAGCTAGTTTTCTTAAATTCTTTAATCAAAGTAATAACAGCATGCAGCATTCTAAGTCCAATTGTCGAGGGAAGGTGAAGCGGAGAAAGAATATTGAATATGAGATTT
GGAAGGCTATTGCACTTGTTGAGTGTGAAGGAACTTCAATAGATTTGAGCGGTGACATGGGTGCTGTAGGGCGGGTTGTAGTTTCAGATTCCTCATCTGCAAAAAATGAA
CTTTGCCTAGATCTGAAAGGTAAGTTTCATCCACATGTGCTATGTTTTGGCAGTAAAAGTCCAGGTACAATTTACAGAGCGGCAATAGTTCCTTCAAGGACATTTTGCAT
CGTTAGCTTTGGTCAGTCGGAGGCAAAGATAGAATCTATCATGAACGACTTCATACAGTTGAAGGCACTGTCCAAAGTTGATGAGGCTGAAACTATGGTTGAAGGTGACC
TGCTTTCAATTTCTCTAAATTGTTCAAATTTGCTTATTTCTATTCTCATTCTATGTTTTGCATCTGTAGGAACATTAGATGGCTTCTCATTTGATTCTGAAGACGAGGCT
GAGAAAATATCTAAAGTTGCTTCTTCTCCAACTGACCAAAATGAGCCTGTAGAAGGGCTCTACACAAAATCCAAAAACAAAACCGAGAAATCATCAGGGCGGAAGCGTGT
TAAAACTGGAGGAAAGCTGCAGGCACCGAAGAAAACAAGGAAGAAAGTTCAAGCTTCTAAGACTAAAAATACAAAGAGCAAGAAATGAAGTTCGAAATCTTTGCTTGCCC
TTAAAAGGCAAATAGTCGTTTCGTCCGAAATACAATATTTTCTCTCCCTTCCGTCTCCTTGACAAGAAGTTTAGCGGTTTAATGAATGATCAGACTGTGAATTTCTAAAT
TTTATTAGTCACTGGCTTCGGTTATCTGTTTCTCTTGCAAGTCAAGGACTCGAATCCGTTGATCTCCTGTGTCCTAATTTTGAGGTAATTAGATTCATGAATACTCTTTA
GATGGAACATTCAAGGACATTAGATACCATTAAACTTGGCCGTTTGTTTCAATTAAATAAAATTAAACTAATAGTTGAATCAAAACTC
Protein sequenceShow/hide protein sequence
MPGPNGQFERTVSRLDAIFPSLRLRGNDCSAPTGVALSSNSESSKNGSSSMDNAIDEKGPSSHKTTQDLDGDQIQGDCGNHNLAKEVTLEEHTGNENSKHSVWMLSSDSE
SCPDNNFIKENYSHHEELSELATSQFQGRGKDENAGRRFTEGKSKSRKVSNKKSPKKQVKSQVCTSVKEKTINSETNKGGLMLEGSECYVRNGGDVEIIEKDALDDCNGP
PVSSSRLPLVLSDKVHRLKRNRLLPRVKRDESSKNCHGASFLKFFNQSNNSMQHSKSNCRGKVKRRKNIEYEIWKAIALVECEGTSIDLSGDMGAVGRVVVSDSSSAKNE
LCLDLKGKFHPHVLCFGSKSPGTIYRAAIVPSRTFCIVSFGQSEAKIESIMNDFIQLKALSKVDEAETMVEGDLLSISLNCSNLLISILILCFASVGTLDGFSFDSEDEA
EKISKVASSPTDQNEPVEGLYTKSKNKTEKSSGRKRVKTGGKLQAPKKTRKKVQASKTKNTKSKK