CuGenDBv2

Gene ID	CmoCh06G004850
Organism	Cucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Description	GATA zinc finger domain-containing protein isoform 1
Genome location	Cmo_Chr06:2340106..2348216
RNA-Seq Expression	CmoCh06G004850
Synteny	CmoCh06G004850
Gene Ontology terms	NA
InterPro domains	IPR023213 - Chloramphenicol acetyltransferase-like domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6596578.1 hypothetical protein SDJN03_09758, partial [Cucurbita argyrosperma subsp. sororia]

2.3e-306

99.43

Show/hide

Query:  MRTSLMTVFEDTVIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPA
        MRTSLMTVFEDTVIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPA
Subjt:  MRTSLMTVFEDTVIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPA

Query:  GESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADD
        GESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADD
Subjt:  GESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADD

Query:  PSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGEFEIRDHGEIGLGIEDLIPNG
        PSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLA ASGENEGGEFEI DHGEIGLGIEDLIPNG
Subjt:  PSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGEFEIRDHGEIGLGIEDLIPNG

Query:  KANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSL
        KANKPLWARGLDMLGYSLNSFRLANLEFKDANS RFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSL
Subjt:  KANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSL

Query:  LNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGL
        LNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGL
Subjt:  LNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGL

Query:  HDYIGCASAHGVGPSIAFFDMIRD
        HDYIGCASAHGVGPSIAFFDMIRD
Subjt:  HDYIGCASAHGVGPSIAFFDMIRD

KAG7017467.1 hypothetical protein SDJN02_19332, partial [Cucurbita argyrosperma subsp. argyrosperma]

0.0e+00

76.64

Show/hide

Query:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
        ME S SRRRVA  TETAWCRAVPGGTGTAV+ALSSS +     PNLQLLQNAL +LQN+HP+LKSKLH++PISS  SF+TSPTP VQ+KT++ PETSKI+
Subjt:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII

Query:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDT----AADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKD
        NDQN L  +   H ISISPLQI+LEHELNEN+ W+ LH SDT    AADM FV+LYEVGS KW+ VFRLHVAACDRTTAVSLLEELL+LMN GG  DK  
Subjt:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDT----AADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKD

Query:  EMELGMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQ
        E+ELGME+LVPRKLAKK +L+RGL++ISYS+NSLRLTNLKFKDVKS RRSQVARLQMN  +T KIL ECK RGIKLSSAMVAAGLVA HSSG H + RHQ
Subjt:  EMELGMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQ

Query:  RKYGVITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDT
        RKYG+ITLIDCRR LEPPL +HHFGFYHAAILNSYT+RGGE+LWELA KIS+TLEASKN NKHFTDMSDLNFLLCRA+ENPSLT SGAMRTSLMTVFEDT
Subjt:  RKYGVITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDT

Query:  VIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAV----------------------------
        V+DNSG MQ EIG+ DYMGCAS HGIGPS+AVFDT+RDG+LDC CVYPAPLHSREQMEALV+NMK  L   V                            
Subjt:  VIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAV----------------------------

Query:  ----LCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL
            LCT T  AS+MSD    E K RPVGGTE+SWCRA PGGTGTTVLGLLLSKPPD+ +LQ++LH+LQNLHPILRSKI +DPSRRDFS L PPSP +HL
Subjt:  ----LCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL

Query:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLREL--LAAASGENEG
        QILDL AAARAIASHPDAD+PS+SDFHKILEHEIN   WL+P+HPSYSDTDVMFA+VY ++DGQWAVFL LHTA CDR AA +LLREL  L AA G+ EG
Subjt:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLREL--LAAASGENEG

Query:  GEFEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCS
        G FEI D+GEIG GIEDLIP+GKA KPLWARGLDMLGYSLNSFR ANLEFKDA+S RFSQMIRLK+NSD T+KLLAGCK RGIK+CGAL AAGLIATRCS
Subjt:  GEFEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCS

Query:  KDLPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTA
        KDLPPY  EKY VVTL DCRSLL+PPLTTHHLGFYHSAILNTHDISAEDTLW+VA+RCYF+FSN K+NNKHF+DMSDLNFLM KAIENP LTPSSSMRTA
Subjt:  KDLPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTA

Query:  LISVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD
        LIS FEDPI     PAQ++LG+ DYIGCASAHGVGPSIA FDMIRD
Subjt:  LISVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD

KAG7028117.1 hypothetical protein SDJN02_09297, partial [Cucurbita argyrosperma subsp. argyrosperma]

0.0e+00

81.39

Show/hide

Query:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
        MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSS SAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
Subjt:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII

Query:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL
        NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNL+RSDTAADM FVTLYEVGSS WVAVFRLHVAACDRTTAVSLLEELLVLMNDGG GDKKDEMEL
Subjt:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL

Query:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG
        GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQV RLQ+NHNQTQKIL+                                     
Subjt:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG

Query:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN
                            GFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTD+                                     
Subjt:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN

Query:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWC
                                                                      FLMAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWC
Subjt:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWC

Query:  RAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADDPSVSDFHKILEHEINI
        RAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADDPSVSDFHKILEHEINI
Subjt:  RAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADDPSVSDFHKILEHEINI

Query:  TTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGEFEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGY
        TTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLA ASGENEGGEFEI DHGEIGLGIEDLIPNGKANKPLWARGLDMLGY
Subjt:  TTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGEFEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGY

Query:  SLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSA
        SLNSFRLANLEFKDANS RFSQMIRLKMNSDTTEKLLAGCKLRGIK+CGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSA
Subjt:  SLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSA

Query:  ILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSI
        ILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSI
Subjt:  ILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSI

Query:  AFFDMIRD
        AFFDMIRD
Subjt:  AFFDMIRD

XP_022944929.1 uncharacterized protein LOC111449315 [Cucurbita moschata]

5.1e-261

99.57

Show/hide

Query:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
        MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
Subjt:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII

Query:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL
        NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL
Subjt:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL

Query:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG
        GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG
Subjt:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG

Query:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN
        VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN
Subjt:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN

Query:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLM
        SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKR L+
Subjt:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLM

XP_022947306.1 uncharacterized protein LOC111451204 [Cucurbita moschata]

1.6e-259

100

Show/hide

Query:  MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL
        MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL
Subjt:  MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL

Query:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE
        QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE
Subjt:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE

Query:  FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD
        FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD
Subjt:  FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD

Query:  LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI
        LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI
Subjt:  LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI

Query:  SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD
        SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD
Subjt:  SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD

TrEMBL top hits

e value

%identity

Alignment

A0A4D8YPF4 Uncharacterized protein

2.3e-235

49.62

Show/hide

Query:  EDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQL-LQNALNKLQNAHPVLKSKLHYSPISSTVSFV-TSPTPSVQVKTFKAPETSKI
        E   S  R    TE  WCRAV  GTG  VLAL  +      PP +   L   L KLQ  HP+L +KLHY+  S   SF+ T+  P   V+   AP T+KI
Subjt:  EDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQL-LQNALNKLQNAHPVLKSKLHYSPISSTVSFV-TSPTPSVQVKTFKAPETSKI

Query:  INDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSG-----DK
        +             A + SPLQ +LEHELN N+         +  ++  V +Y       V   R H + CDR TAVSLL EL+ ++  GGSG       
Subjt:  INDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSG-----DK

Query:  KDEMELGMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHR
        + E ++G+E+L+   +AKK L    LD + YS+NSLRLTNL F++ K PRRS+V RLQ+    T  IL  CK RGIK+   + AA ++AA+S+  H+   
Subjt:  KDEMELGMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHR

Query:  HQRKYGVITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFE
          +KYGV+TL DCR + +PPLS HH+GFYH+AILN + V+G E LW+LA          K  NKH +DM+DLNFL+ +AI+NP+LT+S ++RTSL+TVFE
Subjt:  HQRKYGVITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFE

Query:  DTVIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPAGESKSRPVGG
        D V+D+S  MQ  IG  D++GCAS+HG+GPSIA+FDTVR+G+LDC CVYPAPLHSREQM  LVE M +                     +G  KSR V  
Subjt:  DTVIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPAGESKSRPVGG

Query:  TEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADDPSVSDFHKIL
        TE SWCRA PGGTG TVL LL SKPPDL  LQS L   Q+ HPIL SK+R+D S   FS++T  SP L ++  D  + A+ + SH  +   S+     IL
Subjt:  TEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQILDLTAAARAIASHPDADDPSVSDFHKIL

Query:  EHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGEFEIRDHG---EIGLGIEDLIPNGKANKPLW
        EHE+N  +W +P+ PS SD D+  AS+Y +    W + LR+HT+VCDR AA AL+ EL+A    E EG   E  +     E+ LGIED IP G  +K  W
Subjt:  EHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGEFEIRDHG---EIGLGIEDLIPNGKANKPLW

Query:  ARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSLLNPPLTT
        ARG+DMLGYSLNSFRLANL F D  S R S ++R++MN++ T ++L+ C    IK+  ALAAA LIA   SK  P    EKY  VTL DCRS L+P L++
Subjt:  ARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHKEKYGVVTLNDCRSLLNPPLTT

Query:  HHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGLHDYIGCA
        HH+GFYHSAIL+THDI   + LW++AKR + +F N+K+ NKHF+DM+DLNFLMCKAIENPGLTPSSS+RT+L+SVFEDPIF+  +  +E LG  D+IGCA
Subjt:  HHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQEYLGLHDYIGCA

Query:  SAHGVGPSIAFFDMIRD
        S HGVGPS+A FD IR+
Subjt:  SAHGVGPSIAFFDMIRD

A0A6J1FZI6 uncharacterized protein LOC111449315

2.5e-261

99.57

Show/hide

Query:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
        MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
Subjt:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII

Query:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL
        NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL
Subjt:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL

Query:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG
        GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG
Subjt:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG

Query:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN
        VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN
Subjt:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN

Query:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLM
        SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKR L+
Subjt:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLM

A0A6J1G619 uncharacterized protein LOC111451204

7.9e-260

100

Show/hide

Query:  MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL
        MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL
Subjt:  MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL

Query:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE
        QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE
Subjt:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE

Query:  FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD
        FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD
Subjt:  FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD

Query:  LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI
        LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI
Subjt:  LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI

Query:  SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD
        SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD
Subjt:  SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD

A0A6J1KVW7 uncharacterized protein LOC111498664

1.0e-246

94.84

Show/hide

Query:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII
        MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSS    +APPNLQLLQNALNKLQNAHPVLKSKL +SPISSTVSFVTSPTPSVQV TFKAPETSKII
Subjt:  MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKII

Query:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL
        N QNTLLNNNHHHAISISPLQILLEHELNENT W NLH SD AADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLL+ELL LMNDGG  DKK+EMEL
Subjt:  NDQNTLLNNNHHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMEL

Query:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG
        GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKD KSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG
Subjt:  GMENLVPRKLAKKPLLTRGLDMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYG

Query:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN
        VITLIDCRR LEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKN NKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN
Subjt:  VITLIDCRRSLEPPLSTHHFGFYHAAILNSYTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDN

Query:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLM
        SGRMQEEIGVNDYMGCASIHGIGPSIAVFDT+RDGQLDCVCVYPAPLHSREQMEALVENMKR L+
Subjt:  SGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCVCVYPAPLHSREQMEALVENMKRFLM

A0A6J1KZY5 uncharacterized protein LOC111498610

1.4e-251

97.07

Show/hide

Query:  MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL
        MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDL NLQSTLHSLQNLHPIL SKI YDP RRDFSFL PPSP LHL
Subjt:  MAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHL

Query:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE
        QILDLTA ARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTI+DGQW VFLRLHTAVCDRTAATALLRELLAAASGENEGGE
Subjt:  QILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGENEGGE

Query:  FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD
        FEI DHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANS RFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD
Subjt:  FEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKD

Query:  LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI
        LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHD+SAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI
Subjt:  LPPYHKEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALI

Query:  SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD
        SVFEDPIFEAFSPAQE+LGLHDYIGCASAHGVGPSIAFFDMIRD
Subjt:  SVFEDPIFEAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G52610.1 unknown protein

2.1e-127

54.32

Show/hide

Query:  MSDP-PAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQI--LDLTAAARA
        MS+P    +S +RPVGGTEYSWCRA  GGTG  V+ LLLS+ P L NLQ+TL  LQ  HP LRS IR+D S   FSF+   +   H++I   D  + A+ 
Subjt:  MSDP-PAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRRDFSFLTPPSPLLHLQI--LDLTAAARA

Query:  IASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDG--QWAVFLRLHTAVCDRTAATALLRELLAAASGENEG-GEFEIRDHGE
        I    D+DDP       ILEHE+N  TW++P+    S++ V   S+Y + D   Q  +  RL+TA  DRTAA  LLRE +   + +  G G         
Subjt:  IASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDG--QWAVFLRLHTAVCDRTAATALLRELLAAASGENEG-GEFEIRDHGE

Query:  IGLG--IEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDA-NSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYH
        +GLG  IE+LIP+GK +KP WARG+D+LGYSLN+FR +NL F DA NS R SQ++RLK++ D T KL+AGCK RG+K+  ALA++ LIA   SK+LPPY 
Subjt:  IGLG--IEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDA-NSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYH

Query:  KEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFED
         EKY VVTL+DCRS+L PPLT++  GFYH+ IL+THD++ E+ LWD+AKRCY +F+++K++NK F+DMSDLNFLMCKAIENP LTPSSS+RTA IS+FED
Subjt:  KEKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFED

Query:  PIF-EAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD
        P+  E+  P    LG+ DYIGCAS HGVGPS+A FD +RD
Subjt:  PIF-EAFSPAQEYLGLHDYIGCASAHGVGPSIAFFDMIRD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGATTCCAGAAGCCGCCGGCGAGTAGCCACCGGCACCGAAACCGCCTGGTGCCGCGCTGTCCCAGGCGGCACCGGCACGGCGGTGCTAGCTCTATCCTCCTCCTC
CTCCTCCTTCTCCGCCCCTCCAAATCTCCAACTTCTCCAAAATGCCCTCAACAAACTTCAGAATGCCCATCCTGTCCTCAAATCCAAACTCCATTACAGCCCAATTTCTT
CCACTGTTTCCTTCGTCACTTCTCCAACTCCTTCCGTCCAAGTCAAGACGTTTAAAGCTCCAGAAACTTCCAAAATTATAAATGACCAAAACACCCTTCTCAACAATAAT
CACCATCACGCCATTTCCATTTCCCCTCTCCAGATTCTCCTCGAACACGAACTCAACGAGAACACCACCTGGCGTAACCTTCACCGCTCCGACACGGCGGCGGACATGTT
CTTCGTTACATTGTACGAGGTAGGCTCCAGCAAATGGGTGGCTGTGTTCCGACTACATGTCGCGGCGTGTGACCGGACCACGGCAGTGTCGCTTCTGGAGGAGCTACTCG
TTCTAATGAACGACGGAGGCAGCGGAGATAAAAAAGATGAAATGGAGTTGGGAATGGAGAACCTTGTTCCTAGAAAGTTGGCGAAGAAGCCATTGTTGACTCGAGGATTG
GATATGATCAGCTACTCGATGAACTCGTTGAGATTAACGAATCTTAAATTTAAAGACGTTAAATCTCCGAGACGATCCCAAGTGGCGAGGCTTCAGATGAACCACAACCA
AACCCAGAAAATTCTCTATGAGTGTAAGAGGAGAGGTATAAAATTGAGTTCGGCAATGGTGGCGGCGGGGTTGGTGGCGGCGCACAGCTCCGGTGGGCACAGCATCCACC
GCCATCAACGGAAGTATGGAGTGATAACGCTTATAGATTGCCGGCGGTCTCTGGAGCCACCACTGTCAACCCACCATTTCGGGTTTTACCATGCTGCCATTCTGAACTCC
TACACGGTGAGAGGAGGAGAAGATCTGTGGGAGCTTGCAGGGAAAATCTCATCGACATTGGAGGCTTCCAAGAACTTAAACAAGCACTTCACCGACATGTCGGACCTGAA
TTTTCTGTTGTGTCGTGCCATCGAGAATCCAAGTCTCACTTCGTCGGGGGCGATGAGGACGTCGTTGATGACGGTGTTTGAGGACACGGTGATTGATAACTCGGGTAGAA
TGCAGGAGGAGATTGGTGTTAATGACTACATGGGATGCGCCTCCATCCATGGAATCGGCCCCTCCATCGCCGTGTTCGATACTGTCCGAGATGGGCAGCTGGACTGTGTG
TGTGTTTATCCAGCTCCATTGCACTCTAGGGAGCAAATGGAAGCTTTGGTTGAGAACATGAAAAGATTTCTCATGGCGGCAGTGCTCTGTACTCACACTGACGCCGCCTC
CGAAATGTCGGATCCTCCTGCCGGTGAGTCCAAGTCCCGCCCCGTCGGCGGTACCGAGTACAGCTGGTGCCGCGCCGCCCCCGGCGGCACTGGCACCACTGTCCTCGGCC
TCCTCCTCTCAAAACCTCCCGATCTTCTCAATCTCCAATCCACTCTCCACTCTCTCCAAAACCTCCACCCGATTCTCCGCTCCAAAATCCGCTACGATCCTTCCCGACGA
GACTTCTCTTTCCTCACTCCTCCTTCTCCGCTACTCCACCTCCAGATCCTAGACCTCACAGCCGCCGCACGCGCCATCGCTTCTCATCCCGATGCCGACGATCCTTCCGT
TTCCGATTTCCACAAGATCCTCGAGCATGAGATCAACATCACCACGTGGCTCGATCCGAACCATCCATCGTACTCTGACACCGACGTGATGTTCGCCTCTGTTTACACCA
TCAACGACGGCCAATGGGCGGTTTTCCTCCGCCTCCACACGGCAGTCTGTGACCGGACGGCCGCCACAGCCCTGTTACGAGAGCTGCTTGCGGCGGCGAGCGGAGAAAAC
GAGGGCGGAGAATTCGAAATTAGGGATCATGGAGAGATTGGATTAGGGATTGAGGATTTAATCCCCAACGGAAAAGCGAATAAGCCTCTTTGGGCGCGTGGATTAGACAT
GCTTGGTTACTCATTGAATTCGTTTCGGCTGGCGAATTTGGAGTTCAAAGATGCGAATTCTCGGAGATTTTCTCAGATGATTCGGTTGAAGATGAACTCCGATACCACCG
AGAAACTTCTTGCTGGATGCAAATTGAGAGGCATTAAGGTGTGTGGAGCTCTGGCAGCTGCTGGATTGATTGCCACTCGTTGTTCTAAAGACCTTCCCCCTTACCACAAG
GAGAAATATGGAGTTGTTACCTTAAACGACTGTCGTTCTCTCCTTAATCCTCCCCTCACGACCCACCATCTAGGATTCTATCACTCGGCCATTTTAAACACGCATGACAT
ATCAGCTGAAGACACTCTATGGGATGTGGCAAAGCGATGCTATTTTGCCTTCTCAAACGCTAAAGACAACAACAAGCATTTCTCAGACATGTCTGACTTGAACTTCCTCA
TGTGTAAAGCCATTGAAAATCCTGGCCTCACTCCATCCTCGTCCATGAGAACGGCCTTGATCTCGGTGTTTGAGGATCCCATCTTTGAAGCTTTCAGTCCTGCACAGGAA
TACCTCGGCTTACATGACTATATTGGTTGTGCCTCTGCGCACGGCGTTGGGCCATCGATCGCCTTTTTCGACATGATTCGCGATGTTTGCTTGAATTTTAGTGTAATCAG
ACGAATAAGACGTCGCTGTAAGACAGGTTGTAGGACCTGGTGGCCACGTCGGATTGGCCCGGTTTTTTTTTTATTGCTTTCATCTCCTTCTGTCACCACCTGGCATTTTA
CCTCTCTATAA

mRNA sequence

Show/hide mRNA sequence

AAGGCCGCAGCTCCTCAAATTTTCCGGCTGATTTATCCACATGGAAGATTCCAGAAGCCGCCGGCGAGTAGCCACCGGCACCGAAACCGCCTGGTGCCGCGCTGTCCCAG
GCGGCACCGGCACGGCGGTGCTAGCTCTATCCTCCTCCTCCTCCTCCTTCTCCGCCCCTCCAAATCTCCAACTTCTCCAAAATGCCCTCAACAAACTTCAGAATGCCCAT
CCTGTCCTCAAATCCAAACTCCATTACAGCCCAATTTCTTCCACTGTTTCCTTCGTCACTTCTCCAACTCCTTCCGTCCAAGTCAAGACGTTTAAAGCTCCAGAAACTTC
CAAAATTATAAATGACCAAAACACCCTTCTCAACAATAATCACCATCACGCCATTTCCATTTCCCCTCTCCAGATTCTCCTCGAACACGAACTCAACGAGAACACCACCT
GGCGTAACCTTCACCGCTCCGACACGGCGGCGGACATGTTCTTCGTTACATTGTACGAGGTAGGCTCCAGCAAATGGGTGGCTGTGTTCCGACTACATGTCGCGGCGTGT
GACCGGACCACGGCAGTGTCGCTTCTGGAGGAGCTACTCGTTCTAATGAACGACGGAGGCAGCGGAGATAAAAAAGATGAAATGGAGTTGGGAATGGAGAACCTTGTTCC
TAGAAAGTTGGCGAAGAAGCCATTGTTGACTCGAGGATTGGATATGATCAGCTACTCGATGAACTCGTTGAGATTAACGAATCTTAAATTTAAAGACGTTAAATCTCCGA
GACGATCCCAAGTGGCGAGGCTTCAGATGAACCACAACCAAACCCAGAAAATTCTCTATGAGTGTAAGAGGAGAGGTATAAAATTGAGTTCGGCAATGGTGGCGGCGGGG
TTGGTGGCGGCGCACAGCTCCGGTGGGCACAGCATCCACCGCCATCAACGGAAGTATGGAGTGATAACGCTTATAGATTGCCGGCGGTCTCTGGAGCCACCACTGTCAAC
CCACCATTTCGGGTTTTACCATGCTGCCATTCTGAACTCCTACACGGTGAGAGGAGGAGAAGATCTGTGGGAGCTTGCAGGGAAAATCTCATCGACATTGGAGGCTTCCA
AGAACTTAAACAAGCACTTCACCGACATGTCGGACCTGAATTTTCTGTTGTGTCGTGCCATCGAGAATCCAAGTCTCACTTCGTCGGGGGCGATGAGGACGTCGTTGATG
ACGGTGTTTGAGGACACGGTGATTGATAACTCGGGTAGAATGCAGGAGGAGATTGGTGTTAATGACTACATGGGATGCGCCTCCATCCATGGAATCGGCCCCTCCATCGC
CGTGTTCGATACTGTCCGAGATGGGCAGCTGGACTGTGTGTGTGTTTATCCAGCTCCATTGCACTCTAGGGAGCAAATGGAAGCTTTGGTTGAGAACATGAAAAGATTTC
TCATGGCGGCAGTGCTCTGTACTCACACTGACGCCGCCTCCGAAATGTCGGATCCTCCTGCCGGTGAGTCCAAGTCCCGCCCCGTCGGCGGTACCGAGTACAGCTGGTGC
CGCGCCGCCCCCGGCGGCACTGGCACCACTGTCCTCGGCCTCCTCCTCTCAAAACCTCCCGATCTTCTCAATCTCCAATCCACTCTCCACTCTCTCCAAAACCTCCACCC
GATTCTCCGCTCCAAAATCCGCTACGATCCTTCCCGACGAGACTTCTCTTTCCTCACTCCTCCTTCTCCGCTACTCCACCTCCAGATCCTAGACCTCACAGCCGCCGCAC
GCGCCATCGCTTCTCATCCCGATGCCGACGATCCTTCCGTTTCCGATTTCCACAAGATCCTCGAGCATGAGATCAACATCACCACGTGGCTCGATCCGAACCATCCATCG
TACTCTGACACCGACGTGATGTTCGCCTCTGTTTACACCATCAACGACGGCCAATGGGCGGTTTTCCTCCGCCTCCACACGGCAGTCTGTGACCGGACGGCCGCCACAGC
CCTGTTACGAGAGCTGCTTGCGGCGGCGAGCGGAGAAAACGAGGGCGGAGAATTCGAAATTAGGGATCATGGAGAGATTGGATTAGGGATTGAGGATTTAATCCCCAACG
GAAAAGCGAATAAGCCTCTTTGGGCGCGTGGATTAGACATGCTTGGTTACTCATTGAATTCGTTTCGGCTGGCGAATTTGGAGTTCAAAGATGCGAATTCTCGGAGATTT
TCTCAGATGATTCGGTTGAAGATGAACTCCGATACCACCGAGAAACTTCTTGCTGGATGCAAATTGAGAGGCATTAAGGTGTGTGGAGCTCTGGCAGCTGCTGGATTGAT
TGCCACTCGTTGTTCTAAAGACCTTCCCCCTTACCACAAGGAGAAATATGGAGTTGTTACCTTAAACGACTGTCGTTCTCTCCTTAATCCTCCCCTCACGACCCACCATC
TAGGATTCTATCACTCGGCCATTTTAAACACGCATGACATATCAGCTGAAGACACTCTATGGGATGTGGCAAAGCGATGCTATTTTGCCTTCTCAAACGCTAAAGACAAC
AACAAGCATTTCTCAGACATGTCTGACTTGAACTTCCTCATGTGTAAAGCCATTGAAAATCCTGGCCTCACTCCATCCTCGTCCATGAGAACGGCCTTGATCTCGGTGTT
TGAGGATCCCATCTTTGAAGCTTTCAGTCCTGCACAGGAATACCTCGGCTTACATGACTATATTGGTTGTGCCTCTGCGCACGGCGTTGGGCCATCGATCGCCTTTTTCG
ACATGATTCGCGATGTTTGCTTGAATTTTAGTGTAATCAGACGAATAAGACGTCGCTGTAAGACAGGTTGTAGGACCTGGTGGCCACGTCGGATTGGCCCGGTTTTTTTT
TTATTGCTTTCATCTCCTTCTGTCACCACCTGGCATTTTACCTCTCTATAA

Protein sequence

Show/hide protein sequence

MEDSRSRRRVATGTETAWCRAVPGGTGTAVLALSSSSSSFSAPPNLQLLQNALNKLQNAHPVLKSKLHYSPISSTVSFVTSPTPSVQVKTFKAPETSKIINDQNTLLNNN
HHHAISISPLQILLEHELNENTTWRNLHRSDTAADMFFVTLYEVGSSKWVAVFRLHVAACDRTTAVSLLEELLVLMNDGGSGDKKDEMELGMENLVPRKLAKKPLLTRGL
DMISYSMNSLRLTNLKFKDVKSPRRSQVARLQMNHNQTQKILYECKRRGIKLSSAMVAAGLVAAHSSGGHSIHRHQRKYGVITLIDCRRSLEPPLSTHHFGFYHAAILNS
YTVRGGEDLWELAGKISSTLEASKNLNKHFTDMSDLNFLLCRAIENPSLTSSGAMRTSLMTVFEDTVIDNSGRMQEEIGVNDYMGCASIHGIGPSIAVFDTVRDGQLDCV
CVYPAPLHSREQMEALVENMKRFLMAAVLCTHTDAASEMSDPPAGESKSRPVGGTEYSWCRAAPGGTGTTVLGLLLSKPPDLLNLQSTLHSLQNLHPILRSKIRYDPSRR
DFSFLTPPSPLLHLQILDLTAAARAIASHPDADDPSVSDFHKILEHEINITTWLDPNHPSYSDTDVMFASVYTINDGQWAVFLRLHTAVCDRTAATALLRELLAAASGEN
EGGEFEIRDHGEIGLGIEDLIPNGKANKPLWARGLDMLGYSLNSFRLANLEFKDANSRRFSQMIRLKMNSDTTEKLLAGCKLRGIKVCGALAAAGLIATRCSKDLPPYHK
EKYGVVTLNDCRSLLNPPLTTHHLGFYHSAILNTHDISAEDTLWDVAKRCYFAFSNAKDNNKHFSDMSDLNFLMCKAIENPGLTPSSSMRTALISVFEDPIFEAFSPAQE
YLGLHDYIGCASAHGVGPSIAFFDMIRDVCLNFSVIRRIRRRCKTGCRTWWPRRIGPVFFLLLSSPSVTTWHFTSL

CmoCh06G004850 (gene) of Cucurbita moschata (Rifu) v1 genome