CuGenDBv2

Gene ID	IVF0024030
Organism	Cucumis melo ssp. agrestis cv. IVF77 (Melon (IVF77) v1)
Description	WD_REPEATS_REGION domain-containing protein
Genome location	chr02:23120744..23126043
RNA-Seq Expression	IVF0024030
Synteny	IVF0024030
Gene Ontology terms	GO:0005515 - protein binding (molecular function)
InterPro domains	IPR001680 - WD40 repeat IPR015943 - WD40/YVTN repeat-like-containing domain superfamily IPR036322 - WD40-repeat-containing domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

ADN33856.1 nucleotide binding protein [Cucumis melo subsp. melo]

4.91e-248

85.75

Show/hide

Query:  MVTIGRVVDDQSDRKRRKF-------------------------------------------EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLR
        MVTIGRVVDDQSDRKRRKF                                           EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLR
Subjt:  MVTIGRVVDDQSDRKRRKF-------------------------------------------EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLR

Query:  SLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKG
        SLAPGPVNDQLFVT                SFASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKG
Subjt:  SLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKG

Query:  IINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCD
        IINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCD
Subjt:  IINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCD

Query:  FNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLV
        FNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLV
Subjt:  FNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLV

Query:  SISSDLNIGLHKMV
        SISSDLNIGLHKMV
Subjt:  SISSDLNIGLHKMV

TYJ98411.1 nucleotide binding protein [Cucumis melo var. makuwa]

1.97e-246

72.32

Show/hide

Query:  MVTIGRVVDDQSDRKRRKF---------------EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQS
        MVTIGRVVDDQSDRKRRKF               EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQS
Subjt:  MVTIGRVVDDQSDRKRRKF---------------EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQS

Query:  KGS-------------------------------------------------------------------------------------------------
        KGS                                                                                                 
Subjt:  KGS-------------------------------------------------------------------------------------------------

Query:  ------------------------------FASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGI
                                      FASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGI
Subjt:  ------------------------------FASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGI

Query:  INDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDF
        INDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDF
Subjt:  INDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDF

Query:  NLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVS
        NLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVS
Subjt:  NLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVS

Query:  ISSDLNIGLHKMV
        ISSDLNIGLHKMV
Subjt:  ISSDLNIGLHKMV

XP_008464363.1 PREDICTED: uncharacterized protein LOC103502273 isoform X1 [Cucumis melo]

1.35e-273

100

Show/hide

Query:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
        MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
Subjt:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS

Query:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
        QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
Subjt:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR

Query:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
        NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
Subjt:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL

Query:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
        IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
Subjt:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

XP_011648713.1 uncharacterized protein LOC101206361 [Cucumis sativus]

1.98e-261

96.23

Show/hide

Query:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
        MVTIGRV DDQSD KRRKFEQKDHKELISLVRSSSSSLTAQ DASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNC+S
Subjt:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS

Query:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
        QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQIS+LNFNRTKEKA+VTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNM+DKYNTWKPELLHR
Subjt:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR

Query:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
        NLHSSAVMGVSGMQMKQIVLSAG+DKR LGFDVQVGS LFKHQLESKCMSVLPNPCDFNLF VQTGSP NQLRLFDIRLEQKEVHSFGWKQENS+SQSAL
Subjt:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL

Query:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
        IKQSWSPNGL+LTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
Subjt:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

XP_016903192.1 PREDICTED: uncharacterized protein LOC103502273 isoform X2 [Cucumis melo]

2.42e-275

100

Show/hide

Query:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
        MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
Subjt:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS

Query:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
        QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
Subjt:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR

Query:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
        NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
Subjt:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL

Query:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
        IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
Subjt:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LRK6 WD_REPEATS_REGION domain-containing protein

3.9e-207

96.23

Show/hide

Query:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
        MVTIGR VDDQSD KRRKFEQKDHKELISLVRSSSSSLTAQ DASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNC+S
Subjt:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS

Query:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
        QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQIS+LNFNRTKEKA+VTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNM+DKYNTWKPELLHR
Subjt:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR

Query:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
        NLHSSAVMGVSGMQMKQIVLSAG+DKR LGFDVQVGS LFKHQLESKCMSVLPNPCDFNLF VQTGSP NQLRLFDIRLEQKEVHSFGWKQENS+SQSAL
Subjt:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL

Query:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
        IKQSWSPNGL+LTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
Subjt:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

A0A1S3CLR0 uncharacterized protein LOC103502273 isoform X1

2.1e-216

100

Show/hide

Query:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
        MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
Subjt:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS

Query:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
        QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
Subjt:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR

Query:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
        NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
Subjt:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL

Query:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
        IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
Subjt:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

A0A1S4E4P3 uncharacterized protein LOC103502273 isoform X2

2.1e-216

100

Show/hide

Query:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
        MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
Subjt:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS

Query:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
        QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
Subjt:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR

Query:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
        NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
Subjt:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL

Query:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
        IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
Subjt:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

A0A5A7UU99 Nucleotide binding protein

2.1e-216

100

Show/hide

Query:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
        MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS
Subjt:  MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMS

Query:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
        QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR
Subjt:  QKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHR

Query:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
        NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL
Subjt:  NLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSAL

Query:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
        IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV
Subjt:  IKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

A0A5D3BIA6 Nucleotide binding protein

2.2e-197

72.32

Show/hide

Query:  MVTIGRVVDDQSDRKRRKF---------------EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQS
        MVTIGRVVDDQSDRKRRKF               EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQS
Subjt:  MVTIGRVVDDQSDRKRRKF---------------EQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQS

Query:  KG--------------------------------------------------------------------------------------------------
        KG                                                                                                  
Subjt:  KG--------------------------------------------------------------------------------------------------

Query:  -----------------------------SFASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGI
                                     SFASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGI
Subjt:  -----------------------------SFASLLCATNCMSQKQRRWPEGIAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGI

Query:  INDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDF
        INDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDF
Subjt:  INDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDF

Query:  NLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVS
        NLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVS
Subjt:  NLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVS

Query:  ISSDLNIGLHKMV
        ISSDLNIGLHKMV
Subjt:  ISSDLNIGLHKMV

SwissProt top hits

e value

%identity

Alignment

O15736 Protein tipD

8.4e-05

21.86

Show/hide

Query:  GGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPW------------------------DSVPFITGGSDHAVVLWNMKDKY
        GG+    V++   G  + ++L    ++   +V+F  +   + G  ND S   W                        +S   +TG  D  + LW+++  Y
Subjt:  GGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPW------------------------DSVPFITGGSDHAVVLWNMKDKY

Query:  NTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVG--SILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFG
         T +      + +   ++G SG  +     S   D     +D   G  + +     E +  S+  +P + N   + T S  + L++ DIR     + +F 
Subjt:  NTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVG--SILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFG

Query:  WKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQ--KRVFKAVWLRSLPFLVSISSDLNI
         K     +     K SWSP+G Y+ SGS D  I ++D   N        K H     V    W       +S   D NI
Subjt:  WKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQ--KRVFKAVWLRSLPFLVSISSDLNI

P20053 U4/U6 small nuclear ribonucleoprotein PRP4

1.7e-05

25.87

Show/hide

Query:  IAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMG
        I WHP  NN       DG      I NF  + E+  +  L D    +  I+D+ + P  S  FI G + H +  W + D   +   ELL +  H   V  
Subjt:  IAWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMG

Query:  VSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESK-CMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPN
        +S      +V S G D   + +D++ GS +      SK   +V  +P   N + V TG     + ++DIR   +   +      N  +Q   ++ S    
Subjt:  VSGMQMKQIVLSAGADKRFLGFDVQVGSILFKHQLESK-CMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPN

Query:  GLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGL
        G  L S   D +I+V+    ++ +   SL  H  ++       +  FLVS   D +I L
Subjt:  GLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGL

Q2HJH6 U5 small nuclear ribonucleoprotein 40 kDa protein

6.4e-05

22.87

Show/hide

Query:  YNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFL----PWDSVPFI--TGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMK
        YN DG     S+L    T +   V   E    VK +    SF+    P    P +  TG  D  V LW+++      K   +    ++  V+ V+     
Subjt:  YNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFL----PWDSVPFI--TGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMK

Query:  QIVLSAGADKRFLGFDVQVGSILFKHQ----------LESKCMSVLPNPCD--FNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQS
          ++S G D     +D++   + +  +          L S+   +L N  D    ++ V+  +P  +     +R+ Q  VH+F         +  L++ S
Subjt:  QIVLSAGADKRFLGFDVQVGSILFKHQ----------LESKCMSVLPNPCD--FNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQS

Query:  WSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSD
        WSP+G  + +GS+D  ++V+D    S      L  H   + +  +    P ++S SSD
Subjt:  WSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSD

Q6PE01 U5 small nuclear ribonucleoprotein 40 kDa protein

6.4e-05

21.88

Show/hide

Query:  YNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFL----PWDSVPFI--TGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMK
        YN DG     S+L    T +   V   E    VK +    SF+    P    P +  TG  D  V LW+++      K   +    ++  V+ V+     
Subjt:  YNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFL----PWDSVPFI--TGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMK

Query:  QIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIR----------LEQKEVHSFGWKQENSDSQSALIKQSWS
          ++S G D     +D++   + +  +  +  ++ L    + +   + + +  N +R++D+R          + Q  VH+F         +  L++ SWS
Subjt:  QIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIR----------LEQKEVHSFGWKQENSDSQSALIKQSWS

Query:  PNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSD
        P+G  + +GS+D  ++V+D    S      L  H   + +  +    P ++S SSD
Subjt:  PNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSD

Q96DI7 U5 small nuclear ribonucleoprotein 40 kDa protein

3.8e-05

21.88

Show/hide

Query:  YNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFL----PWDSVPFI--TGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMK
        YN DG     S+L    T +   V   E    VK +    SF+    P    P +  TG  D  V LW+++      K   +    ++  V+ V+     
Subjt:  YNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFL----PWDSVPFI--TGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMK

Query:  QIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIR----------LEQKEVHSFGWKQENSDSQSALIKQSWS
          ++S G D     +D++   + +  +  +  ++ L    + +   + + +  N +R++D+R          + Q  VH+F         +  L++ SWS
Subjt:  QIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIR----------LEQKEVHSFGWKQENSDSQSALIKQSWS

Query:  PNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSD
        P+G  + +GS+D  ++V+D    S      L  H   + +  +    P ++S SSD
Subjt:  PNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSD

Arabidopsis top hits

e value

%identity

Alignment

AT2G43770.1 Transducin/WD40 repeat-like superfamily protein

2.2e-08

26.87

Show/hide

Query:  ITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGS---ILFKHQLESKCMSVLPNPCDFNLFAVQTGSPG
        I+G  D    LW+M+ +        +        +  VS       + + G D     +D++ G     L  HQ     MS+ P+        + T    
Subjt:  ITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVLSAGADKRFLGFDVQVGS---ILFKHQLESKCMSVLPNPCDFNLFAVQTGSPG

Query:  NQLRLFDIR---LEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIG
        N+L ++D+R    + + V  F   Q N +    L+K SWSP+G  +T+GSSD ++H++D    S      L  H   V + V+  + P + S SSD NI 
Subjt:  NQLRLFDIR---LEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIG

Query:  L
        L
Subjt:  L

AT5G19920.1 Transducin/WD40 repeat-like superfamily protein

2.1e-112

54.78

Show/hide

Query:  KRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMSQKQRRWPEGIAWHP
        ++ K E + H ELI+L+  SS   T +   +    S H +++RSLA  P N +LF TSALDG ++ W++QS  S A+L    N ++  Q++W E IAWHP
Subjt:  KRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMSQKQRRWPEGIAWHP

Query:  GGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQ
          N LFSVY AD G  QIS +  N   E+    F+ED+PH KG+IN I F PWD   FITGGSDHAVVLW  + + N WKP LLHR+LHSSAVMGV+GM+
Subjt:  GGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQ

Query:  MKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTS
            VLS G D+RF+GFD +   + FKH+L+++C +++PNP D NL  V T     QLRL+D+RL Q E+ SFGWKQE+S+SQSALI QSWSP+GL+++S
Subjt:  MKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTS

Query:  GSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKM
        GS+DPVIH+FDIRYN+  PS S+KAH+KRVFKA W  S P LVSISSDL IG+HK+
Subjt:  GSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKM

AT5G50970.1 transducin family protein / WD-40 repeat family protein

2.6e-142

67.98

Show/hide

Query:  RRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMSQKQRRWPEGIAWHPG
        +RKFEQK+HKELI L+  +SS  T +   S   +SQHKRKLRSL   PVN+QLF TS+LDGM++LWQ+Q     ASLL  T+C+S+KQRRW E +AWHP 
Subjt:  RRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMSQKQRRWPEGIAWHPG

Query:  GNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWN-MKDKYNTWKPELLHRNLHSSAVMGVSGMQ
        GN LFSVY AD GDSQISILN N+T+E   VTFLE+KPHVKGIIN+I F+PW++  F+TGGSDHAVVLWN   D+ N WK + LHRNLHS+AVMGV GM+
Subjt:  GNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWN-MKDKYNTWKPELLHRNLHSSAVMGVSGMQ

Query:  MKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTS
         K ++LS GADKR  GFDVQVG   +KHQ++ KCMSVL NPCDFNLF VQ+G P  QLRLFDIRL + E+HSFGWKQ++S+SQSALI QSWSP+GLY+TS
Subjt:  MKQIVLSAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTS

Query:  GSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKM
        GS DPVIHVFDIRYN+  P+QS+KAHQKRVFKA W  S P L+SISSDLNIGLHK+
Subjt:  GSSDPVIHVFDIRYNSHMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKM

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTCACTATTGGGAGAGTTGTTGATGATCAGAGTGATAGGAAAAGAAGAAAGTTTGAACAAAAAGATCACAAGGAACTGATTTCATTAGTACGCAGTAGCTCTTCCTC
ATTGACTGCCCAACCAGATGCTAGTTATTATTTTACTAGTCAGCACAAGAGAAAACTGAGAAGCCTTGCTCCAGGTCCAGTCAATGACCAACTTTTTGTTACTAGTGCTT
TGGATGGAATGATCAACCTGTGGCAAATTCAGTCAAAGGGGTCTTTTGCTTCTCTTCTTTGTGCTACAAACTGTATGTCTCAAAAGCAGAGGAGATGGCCTGAAGGTATA
GCTTGGCACCCGGGTGGAAACAACCTATTTTCTGTGTACAACGCTGATGGTGGAGATTCTCAAATATCAATCCTGAACTTCAATAGGACTAAAGAGAAGGCCAATGTTAC
TTTCTTAGAGGATAAGCCTCATGTTAAAGGCATTATCAACGACATTAGTTTCTTGCCTTGGGATTCTGTTCCGTTCATTACTGGTGGCAGTGATCACGCTGTCGTTCTAT
GGAATATGAAAGATAAATATAACACATGGAAACCAGAGCTGTTGCACAGGAATCTGCACTCTTCTGCTGTCATGGGTGTCTCTGGGATGCAGATGAAGCAAATCGTACTT
TCTGCAGGTGCAGACAAGAGATTCCTTGGTTTTGATGTTCAAGTAGGAAGTATACTCTTCAAGCATCAACTAGAGAGTAAATGTATGAGTGTGTTGCCTAATCCATGTGA
CTTTAACCTGTTCGCGGTCCAAACAGGGAGTCCAGGAAATCAACTTAGATTATTTGACATTAGATTGGAACAGAAAGAAGTCCATAGTTTTGGGTGGAAGCAAGAAAACA
GTGATTCTCAATCAGCTTTGATAAAGCAGTCATGGTCACCAAATGGATTATACTTAACGTCTGGTTCATCCGATCCTGTAATTCATGTTTTTGACATCAGGTATAATTCT
CACATGCCATCTCAATCACTTAAAGCTCATCAGAAGCGCGTTTTCAAAGCTGTTTGGCTCCGTTCTCTTCCTTTTCTTGTTTCCATTTCATCTGATTTGAACATTGGACT
GCACAAAATGGTCTAG

mRNA sequence

Show/hide mRNA sequence

CGGGAAACGAGTAGGGCTAACAGACAGAGGAATAGTGATGACCCAGCCGGTGAGGAAACCCAAGCGGAGGAACTTTGCTTTGCCCATTCGCCTGAAATCATTACGGAAGA
ACTAACTCCAGATGAATGCAATAGCACCGTCGAAGACCAAGAGGCGGCACTCATTGCTCTAGTCGAGCATCGTACTCGTGAAGTCCACCATCTCCAGCAGCGTATTTCCT
ACTACACTCGTCAGCTAGAGGAAGCAGAGAAGCGGTTACAGGAATCTCAATCTTTGTTGGCCCGCTCTCACGGTCCGCGTTATACTTTGCCATCAAGAAGTTCTCAGGAT
TGTGGATTCGAATGTGTGGAGGCTGAGCCTAGATCAACGACTCCTATTCATGGCAATGGGGGTTTGGAAGCAAAACCACTTCTTGGTTCTAGTCACAACCCTTCAATTCC
CAATCGCTCTAATCTTGCCACAACAGGTGAACAAGAAAAACCTCGTATGGTCACTATTGGGAGAGTTGTTGATGATCAGAGTGATAGGAAAAGAAGAAAGTTTGAACAAA
AAGATCACAAGGAACTGATTTCATTAGTACGCAGTAGCTCTTCCTCATTGACTGCCCAACCAGATGCTAGTTATTATTTTACTAGTCAGCACAAGAGAAAACTGAGAAGC
CTTGCTCCAGGTCCAGTCAATGACCAACTTTTTGTTACTAGTGCTTTGGATGGAATGATCAACCTGTGGCAAATTCAGTCAAAGGGGTCTTTTGCTTCTCTTCTTTGTGC
TACAAACTGTATGTCTCAAAAGCAGAGGAGATGGCCTGAAGGTATAGCTTGGCACCCGGGTGGAAACAACCTATTTTCTGTGTACAACGCTGATGGTGGAGATTCTCAAA
TATCAATCCTGAACTTCAATAGGACTAAAGAGAAGGCCAATGTTACTTTCTTAGAGGATAAGCCTCATGTTAAAGGCATTATCAACGACATTAGTTTCTTGCCTTGGGAT
TCTGTTCCGTTCATTACTGGTGGCAGTGATCACGCTGTCGTTCTATGGAATATGAAAGATAAATATAACACATGGAAACCAGAGCTGTTGCACAGGAATCTGCACTCTTC
TGCTGTCATGGGTGTCTCTGGGATGCAGATGAAGCAAATCGTACTTTCTGCAGGTGCAGACAAGAGATTCCTTGGTTTTGATGTTCAAGTAGGAAGTATACTCTTCAAGC
ATCAACTAGAGAGTAAATGTATGAGTGTGTTGCCTAATCCATGTGACTTTAACCTGTTCGCGGTCCAAACAGGGAGTCCAGGAAATCAACTTAGATTATTTGACATTAGA
TTGGAACAGAAAGAAGTCCATAGTTTTGGGTGGAAGCAAGAAAACAGTGATTCTCAATCAGCTTTGATAAAGCAGTCATGGTCACCAAATGGATTATACTTAACGTCTGG
TTCATCCGATCCTGTAATTCATGTTTTTGACATCAGGTATAATTCTCACATGCCATCTCAATCACTTAAAGCTCATCAGAAGCGCGTTTTCAAAGCTGTTTGGCTCCGTT
CTCTTCCTTTTCTTGTTTCCATTTCATCTGATTTGAACATTGGACTGCACAAAATGGTCTAGATATTCCATGTGCAAGTTATTAATGCTGCATGCTAACTGCTATAAGAG
GGTCATATCACGTTGATTGCCGTTTTTGCACGTTCCCTAAACAAATTATCAAGAGGTGATTTAGATACAGTGTAGCAAAGAATAGAAGCAATAAATGGGCTTGAGTTAGT
TGTCTGAAGGAGTGCAGTGCATAGCAACGTGGTTGTGAAGACTTGATGAAGCTTTGGCTTGTGACTTGGTAAGTTTGTGGGAATATATGTAGAAAATTTGTTGATTTTGT
TGCCCTACATGTATTTCAAATGAATTGCAAACGGATATAGATGTTTCACTTTCTTAGAGGGCTGGGGTGCCTTCCTGCTATTTAAAACTTTTGTAGCACGATCTGACTAG
TTGCTAGTGAAGGAGAAAATTTCCAAATTCTAAGAGGGATCCAATCACTTATTTGTGCTGTCTTCGCCATTCCAGTTAAGTGAAAAGAATGAGCAGTTGTCCGA

Protein sequence

Show/hide protein sequence

MVTIGRVVDDQSDRKRRKFEQKDHKELISLVRSSSSSLTAQPDASYYFTSQHKRKLRSLAPGPVNDQLFVTSALDGMINLWQIQSKGSFASLLCATNCMSQKQRRWPEGI
AWHPGGNNLFSVYNADGGDSQISILNFNRTKEKANVTFLEDKPHVKGIINDISFLPWDSVPFITGGSDHAVVLWNMKDKYNTWKPELLHRNLHSSAVMGVSGMQMKQIVL
SAGADKRFLGFDVQVGSILFKHQLESKCMSVLPNPCDFNLFAVQTGSPGNQLRLFDIRLEQKEVHSFGWKQENSDSQSALIKQSWSPNGLYLTSGSSDPVIHVFDIRYNS
HMPSQSLKAHQKRVFKAVWLRSLPFLVSISSDLNIGLHKMV

IVF0024030 (gene) of Melon (IVF77) v1 genome