CuGenDBv2

Gene ID	Sed0010020
Organism	Sechium edule (Chayote v1)
Description	Mic1 domain-containing protein
Genome location	LG06:6887351..6903308
RNA-Seq Expression	Sed0010020
Synteny	Sed0010020
Gene Ontology terms	GO:0010506 - regulation of autophagy (biological process) GO:0031902 - late endosome membrane (cellular component) GO:0035658 - Mon1-Ccz1 complex (cellular component)
InterPro domains	IPR009755 - Regulator of MON1-CCZ1 complex, C-terminal IPR040371 - Regulator of MON1-CCZ1 complex

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6580792.1 Regulator of MON1-CCZ1 complex, partial [Cucurbita argyrosperma subsp. sororia]

1.3e-295

75.4

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRPSRLQP+AGLSKSSALSH Y+QY PLRCS+P P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+ EGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIF+DSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLPLLLRGFP PNIDVRSS QD+ASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN
        CL+LT+TMILEHRP+ TVAKAIDVLVSSYTL  SSK                   VSG GPV G  NR+STAG+ESEA HRT IFPSSDSE NA ++Q N
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN

Query:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
        + N QS V  E+WR  +SST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFL R+N+EKIKVNPN
Subjt:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QIL+RNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYY EALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S A A
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

XP_022151385.1 uncharacterized protein LOC111019335 [Momordica charantia]

3.6e-298

75.5

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIA------
        MSG PSRLQPSAGLSKSSALSHVY+QY PLRC IPEPRGLFYDDGNKLLIC T +QIFSWKTVPFNPAV YT +AITEGPILSIRYSLD  IIA      
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIA------

Query:  --------------TRCRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                       +CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY+SDSKSLHLVE+KKLN                            LSSAG+
Subjt:  --------------TRCRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEM MAK++A +KPVLA+ED+FI+T YGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWI+VSVVDNVLLVHQVDAKVVILYDIF+DSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDV-RSSQDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLPLLLRGFPG N+D+ RS QDS SL+AD+V+DYEAIV+GDGWKFLVPDL+CD+VNKLVWKIHIDLEAIASSSSEVPSLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDV-RSSQDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA-------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQ
        CL+LT+TMILEH P+  VA+AIDVLVSSY  T SSK                    VSG GPVSGAINR+STAGVESEA HRT IFPSSDSEENA +EQ 
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA-------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQ

Query:  NS---NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKV
        N+   + QSTV  EKWRG  SST+VQASSSQYQ LGPGCNR N DVSD GSL          +YSFVFA IE+ IVG PSYLLAIIIEFL RVN+EKIKV
Subjt:  NS---NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKV

Query:  NPNIYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPS
        NPNIYVLTVQILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHNFQT KLGLDML+QLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPS
Subjt:  NPNIYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPS

Query:  LFLQAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        LFLQAAFT N+ QHLAA+LRFL DFTP FK+T+DY+RYH ILTEM+SCASA
Subjt:  LFLQAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

XP_022934291.1 uncharacterized protein LOC111441498 isoform X1 [Cucurbita moschata]

3.1e-297

75.8

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRPSRLQP+AGLSKSSALSH Y+QY PLRCS+P P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+ EGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVS VDNVLLVHQVDAKVVILYDIFSDSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLPLLLRGFP PNIDVRSS QD+ASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN
        CL+LT+TMILEHRP+ TVAKAIDVLVSSYTL  SSK                   VSG GPV G  NR+STAG+ESEA HRT IFPSSDSE NA ++Q N
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN

Query:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
        + N QS V  E+WR  +SST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFL R+N+EKIKVNPN
Subjt:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S ASA
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

XP_022982858.1 uncharacterized protein LOC111481584 isoform X1 [Cucurbita maxima]

6.2e-298

75.94

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRP RLQP+AGLSKSSALSH Y+QY PLRCSIP P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+TEGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIF+DSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLP LLRGFP PNIDVRSS QDSASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN
        CL+LT+TMILEHRP+  VAKAIDVLVSSYTL  SSK                   VSG GPV G  NR+STAG+ESEA HRT IFPSSDSE NA ++Q N
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN

Query:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
        + N QS V  E+WRG ++ST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFLHR+N+EKIKVNPN
Subjt:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S ASA
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

XP_023527725.1 uncharacterized protein LOC111790855 isoform X1 [Cucurbita pepo subsp. pepo]

1.3e-295

75.4

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRPSRLQP+AGLSKSSALSH Y+QY PLRCS+P P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+ EGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIF+DSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLPLLLRGFP PNIDV+SS QD+ASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQ-Q
        CL+LT+TMILEHRP+ TVAKAIDVLVSSYTL  SSK                   VSG GPV G   R+STAG+ESEA HRT IFPSSDSE NA ++Q  
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQ-Q

Query:  NSNQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
          N  S V  E+WRG +SST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFL R+N+EKIKVNPN
Subjt:  NSNQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S ASA
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DB11 uncharacterized protein LOC111019335

1.8e-298

75.5

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIA------
        MSG PSRLQPSAGLSKSSALSHVY+QY PLRC IPEPRGLFYDDGNKLLIC T +QIFSWKTVPFNPAV YT +AITEGPILSIRYSLD  IIA      
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIA------

Query:  --------------TRCRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                       +CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY+SDSKSLHLVE+KKLN                            LSSAG+
Subjt:  --------------TRCRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEM MAK++A +KPVLA+ED+FI+T YGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWI+VSVVDNVLLVHQVDAKVVILYDIF+DSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDV-RSSQDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLPLLLRGFPG N+D+ RS QDS SL+AD+V+DYEAIV+GDGWKFLVPDL+CD+VNKLVWKIHIDLEAIASSSSEVPSLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDV-RSSQDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA-------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQ
        CL+LT+TMILEH P+  VA+AIDVLVSSY  T SSK                    VSG GPVSGAINR+STAGVESEA HRT IFPSSDSEENA +EQ 
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA-------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQ

Query:  NS---NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKV
        N+   + QSTV  EKWRG  SST+VQASSSQYQ LGPGCNR N DVSD GSL          +YSFVFA IE+ IVG PSYLLAIIIEFL RVN+EKIKV
Subjt:  NS---NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKV

Query:  NPNIYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPS
        NPNIYVLTVQILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHNFQT KLGLDML+QLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPS
Subjt:  NPNIYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPS

Query:  LFLQAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        LFLQAAFT N+ QHLAA+LRFL DFTP FK+T+DY+RYH ILTEM+SCASA
Subjt:  LFLQAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

A0A6J1F1E9 uncharacterized protein LOC111441498 isoform X1

1.5e-297

75.8

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRPSRLQP+AGLSKSSALSH Y+QY PLRCS+P P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+ EGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVS VDNVLLVHQVDAKVVILYDIFSDSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLPLLLRGFP PNIDVRSS QD+ASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN
        CL+LT+TMILEHRP+ TVAKAIDVLVSSYTL  SSK                   VSG GPV G  NR+STAG+ESEA HRT IFPSSDSE NA ++Q N
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN

Query:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
        + N QS V  E+WR  +SST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFL R+N+EKIKVNPN
Subjt:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S ASA
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

A0A6J1F2A9 uncharacterized protein LOC111441498 isoform X2

4.1e-295

75.53

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRPSRLQP+AGLSKSSALSH Y+QY PLRCS+P P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+ EGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVS VDNVLLVHQVDAKVVILYDIFSDSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLPLLLRGFP PNIDVRSS QD+ASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLE   AKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN
        CL+LT+TMILEHRP+ TVAKAIDVLVSSYTL  SSK                   VSG GPV G  NR+STAG+ESEA HRT IFPSSDSE NA ++Q N
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN

Query:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
        + N QS V  E+WR  +SST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFL R+N+EKIKVNPN
Subjt:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S ASA
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

A0A6J1J411 uncharacterized protein LOC111481584 isoform X2

8.2e-296

75.67

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRP RLQP+AGLSKSSALSH Y+QY PLRCSIP P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+TEGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIF+DSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLP LLRGFP PNIDVRSS QDSASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLE   AKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN
        CL+LT+TMILEHRP+  VAKAIDVLVSSYTL  SSK                   VSG GPV G  NR+STAG+ESEA HRT IFPSSDSE NA ++Q N
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN

Query:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
        + N QS V  E+WRG ++ST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFLHR+N+EKIKVNPN
Subjt:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S ASA
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

A0A6J1J5P9 uncharacterized protein LOC111481584 isoform X1

3.0e-298

75.94

Show/hide

Query:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----
        MSGRP RLQP+AGLSKSSALSH Y+QY PLRCSIP P GLF+DDGNKLLICPTV+QIFSWKTVPFNPAV YT DA+TEGPILSIRYSLD  IIA +    
Subjt:  MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATR----

Query:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI
                        CR ESESILGFFWTD  LCNIVFVKTSGLDLFAY SDSKSLHLVESKKLN                            LS+AGI
Subjt:  ----------------CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGI

Query:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA
        VRLPKFEMAMAK++ANSKPVLA+EDIFIITVYGRIYCLQVDRI+MLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIF+DSRA
Subjt:  VRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRA

Query:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL
        PISAPLP LLRGFP PNIDVRSS QDSASLEAD     EAIV+GDGWKFLVPDL+CDHVNKLVWKIHIDLEAIASSSSEV SLLEFLQ RKLEV KAKQL
Subjt:  PISAPLPLLLRGFPGPNIDVRSS-QDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQL

Query:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN
        CL+LT+TMILEHRP+  VAKAIDVLVSSYTL  SSK                   VSG GPV G  NR+STAG+ESEA HRT IFPSSDSE NA ++Q N
Subjt:  CLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKA------------------VSGLGPVSGAINRNSTAGVESEAFHRT-IFPSSDSEENAGIEQQN

Query:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN
        + N QS V  E+WRG ++ST++QASSSQYQHLGPGCNRLN DVSD+GSL          +YSFVFA IE+ IVGDPSYLLAIIIEFLHR+N+EKIKVNPN
Subjt:  S-NQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSL----------LYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPN

Query:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL
        IYVLT+QILARNERYTEIGLFVQQKI+EPSKEVALQLLESGRHN QT KLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARK       V TVRPSLFL
Subjt:  IYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFL

Query:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA
        QAAF  N+ QHLAA+LRFLSD TP FK+T+DY+RYHHILTEM S ASA
Subjt:  QAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDSCASA

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G12010.1 FUNCTIONS IN: molecular_function unknown; INVOLVED IN: biological_process unknown; EXPRESSED IN: sperm cell, cultured cell; CONTAINS InterPro DOMAIN/s: Colon cancer-associated Mic1-like (InterPro:IPR009755); Has 30201 Blast hits to 17322 proteins in 780 species: Archae - 12; Bacteria - 1396; Metazoa - 17338; Fungi - 3422; Plants - 5037; Viruses - 0; Other Eukaryotes - 2996 (source: NCBI BLink).

4.8e-179

49.86

Show/hide

Query:  SSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIAT--------------------R
        S ALSHVY+ +  LRC+IPE  GLFYDD N+LLIC T +Q+FSW+T PFNP V  + D+I+EGPILSIR+SLD   IA                     +
Subjt:  SSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIAT--------------------R

Query:  CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGIVRLPKFEMAMAKANAN
        C+  SESILGFFW+D  LC++  VKTSG+DLFA  S   SL LVE+KK N                            LS+AG+VRLP+FEM MA++ +N
Subjt:  CRQESESILGFFWTDYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLN----------------------------LSSAGIVRLPKFEMAMAKANAN

Query:  SKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRAPISAPLPLLLRGFPGP
        SKP+L+  D+ ++TVYGRIYCLQVDR AMLLH YRFYRDAVVQQGSLPIYSS ++V+VVDN+LLVHQ+DAKVVI+YD+F DSRAP+SAPLPLL RG+   
Subjt:  SKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSSWIAVSVVDNVLLVHQVDAKVVILYDIFSDSRAPISAPLPLLLRGFPGP

Query:  NIDVRSSQDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQLCLSLTKTMILEHRPMTT
            ++          + S+   +++ DGW FLVPDL+ D  NK++WKIH+DLEAI++SSS+  SLLEFLQ RKLE  KAKQLCL + + +ILE RP T 
Subjt:  NIDVRSSQDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSEVPSLLEFLQTRKLEVRKAKQLCLSLTKTMILEHRPMTT

Query:  VAKAIDVLVSSYTLTISSKAVSGLGPVSGAINRNSTAGVESEAFHRTIFPSSDSEENAGIEQQNSNQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCN
        V +AIDVLV++Y+ ++ +      G      N N+TA   +         S DSE +    Q  SN    V            E+  SS   +++     
Subjt:  VAKAIDVLVSSYTLTISSKAVSGLGPVSGAINRNSTAGVESEAFHRTIFPSSDSEENAGIEQQNSNQQSTVVHEKWRGAVSSTEVQASSSQYQHLGPGCN

Query:  RLNGDVSDKG---SLLYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPNIYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHN
        +    +S        LY FVF S+E+ +V +  YL+AII EFL  ++ EK+KV+ NIYV+T+++LA ++R+ E+ LF   KI+EPSKEVA QLL+SGR N
Subjt:  RLNGDVSDKG---SLLYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPNIYVLTVQILARNERYTEIGLFVQQKIVEPSKEVALQLLESGRHN

Query:  FQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFLQAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDS
         +  KLGLDMLRQLSLHHDY+S LVQDGYYLEALRYA+K       V +VR S+FL+AAF  N++QHLAA+LR LS+  P FK+T++Y  ++ +L +  S
Subjt:  FQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFLQAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHILTEMDS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCTGGAAGACCATCAAGATTACAACCCAGTGCTGGTCTAAGCAAATCAAGTGCTCTATCACATGTTTATGTACAATATCAACCGTTACGATGTAGTATTCCTGAACC
AAGAGGATTGTTTTATGATGATGGAAACAAGTTATTGATCTGCCCAACAGTGAATCAGATCTTCTCATGGAAAACAGTTCCGTTTAATCCTGCTGTCATTTATACCACGG
ATGCAATTACGGAAGGGCCCATTTTATCTATTCGATATTCCTTAGACTCAAATATTATTGCAACAAGATGCAGACAAGAGTCAGAGAGTATTCTGGGTTTCTTTTGGACC
GATTACTCCTTGTGCAATATTGTATTTGTGAAGACCAGCGGGCTGGACTTGTTTGCCTATAGTTCCGATTCGAAGTCTCTCCATTTGGTGGAGTCAAAGAAATTGAATCT
TTCATCAGCAGGGATTGTTCGCTTGCCTAAGTTTGAAATGGCGATGGCAAAAGCTAATGCTAATAGCAAGCCTGTCTTAGCTCTAGAGGACATTTTTATTATCACTGTCT
ATGGAAGAATATATTGCTTGCAAGTTGATAGGATTGCAATGCTACTTCATACCTACAGGTTCTACCGTGATGCTGTTGTGCAGCAGGGCTCTTTACCAATCTACTCAAGC
TGGATTGCTGTGAGTGTGGTTGACAATGTGTTGCTTGTTCACCAAGTAGATGCAAAAGTAGTTATTCTTTACGATATCTTTTCTGATTCGAGGGCACCCATATCTGCCCC
ACTTCCTTTGTTGTTGAGAGGTTTTCCTGGGCCTAATATTGATGTCCGAAGTAGTCAAGACAGTGCCAGTTTAGAGGCTGATACAGTATCTGATTATGAAGCAATTGTCT
TTGGGGACGGTTGGAAATTTCTTGTCCCAGACCTGGTCTGTGATCACGTCAACAAGTTAGTGTGGAAGATACATATAGACTTGGAGGCGATTGCTTCAAGTAGCTCTGAA
GTGCCATCACTCCTAGAATTCTTGCAGACACGGAAATTGGAGGTTAGAAAGGCTAAACAGTTGTGCTTGTCATTGACAAAGACTATGATTCTGGAGCACAGGCCAATGAC
CACTGTTGCTAAGGCTATAGATGTTCTAGTCTCATCTTATACCCTCACAATCTCAAGCAAGGCAGTTAGTGGCCTTGGCCCTGTATCTGGTGCTATTAACCGTAATTCAA
CTGCTGGAGTGGAAAGTGAAGCTTTTCATAGAACAATATTTCCGTCTTCAGATTCTGAGGAGAATGCTGGCATTGAGCAACAAAATAGCAATCAACAGTCTACTGTTGTT
CATGAAAAATGGAGAGGTGCAGTAAGTTCTACGGAAGTTCAGGCATCATCTTCACAGTATCAGCATCTTGGGCCTGGATGTAACCGGTTGAATGGCGACGTCTCTGATAA
GGGATCTCTGTTGTACAGTTTTGTGTTTGCCTCCATTGAAGATGGAATAGTTGGAGATCCTTCTTACTTGCTGGCTATAATTATTGAGTTCCTCCACAGAGTTAATTTGG
AGAAGATCAAAGTGAATCCCAACATTTATGTTTTGACTGTCCAAATACTAGCTCGGAACGAACGATACACAGAAATTGGATTATTTGTGCAGCAAAAGATTGTAGAACCT
TCTAAAGAGGTTGCGCTGCAACTACTGGAGTCTGGTCGCCATAATTTCCAGACAACGAAACTTGGTCTAGATATGCTTAGGCAGCTTTCTCTACATCATGATTATGTGTC
TCTACTTGTGCAAGACGGATATTACCTCGAAGCATTACGTTACGCTCGGAAACTTTCCAAAAACGTCATGCATGTTTACACTGTTCGGCCTTCGTTGTTTCTTCAAGCAG
CTTTCACGAAAAATAACCTGCAACATTTGGCAGCACTTTTGAGATTCTTGTCAGATTTCACTCCTAGCTTCAAAGACACCGCGGATTACAATCGGTACCATCACATTCTC
ACTGAAATGGACTCGTGTGCTTCCGCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSGRPSRLQPSAGLSKSSALSHVYVQYQPLRCSIPEPRGLFYDDGNKLLICPTVNQIFSWKTVPFNPAVIYTTDAITEGPILSIRYSLDSNIIATRCRQESESILGFFWT
DYSLCNIVFVKTSGLDLFAYSSDSKSLHLVESKKLNLSSAGIVRLPKFEMAMAKANANSKPVLALEDIFIITVYGRIYCLQVDRIAMLLHTYRFYRDAVVQQGSLPIYSS
WIAVSVVDNVLLVHQVDAKVVILYDIFSDSRAPISAPLPLLLRGFPGPNIDVRSSQDSASLEADTVSDYEAIVFGDGWKFLVPDLVCDHVNKLVWKIHIDLEAIASSSSE
VPSLLEFLQTRKLEVRKAKQLCLSLTKTMILEHRPMTTVAKAIDVLVSSYTLTISSKAVSGLGPVSGAINRNSTAGVESEAFHRTIFPSSDSEENAGIEQQNSNQQSTVV
HEKWRGAVSSTEVQASSSQYQHLGPGCNRLNGDVSDKGSLLYSFVFASIEDGIVGDPSYLLAIIIEFLHRVNLEKIKVNPNIYVLTVQILARNERYTEIGLFVQQKIVEP
SKEVALQLLESGRHNFQTTKLGLDMLRQLSLHHDYVSLLVQDGYYLEALRYARKLSKNVMHVYTVRPSLFLQAAFTKNNLQHLAALLRFLSDFTPSFKDTADYNRYHHIL
TEMDSCASA

Sed0010020 (gene) of Chayote v1 genome