; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

PI0003023 (gene) of Melon (PI 482460) v1 genome

Gene IDPI0003023
OrganismCucumis metuliferus PI 482460 (Melon (PI 482460) v1)
Descriptionprotein SCAI
Genome locationchr05:10196262..10202600
RNA-Seq ExpressionPI0003023
SyntenyPI0003023
Gene Ontology termsGO:0045892 - negative regulation of transcription, DNA-templated (biological process)
GO:0005634 - nucleus (cellular component)
GO:0003714 - transcription corepressor activity (molecular function)
InterPro domainsIPR016607 - Protein SCAI, metazoan/viridiplantae
IPR022709 - Protein SCAI


Homology Show/hide homology
GenBank top hitse value%identityAlignment
TYJ95521.1 protein SCAI isoform X2 [Cucumis melo var. makuwa]0.0e+0095.37Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSST+N+SIPVSE YWSLVDKADRKFSKIRDLPYYERN YDAYFHKAFKVYTQLWKFQQENRQKLVE GLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAI+TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VP T+T R LRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAA          AGTD+GCESINNAEDIDKTKSPCSQVEGGYKGLQS CLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSP+ATSHAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILG
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR+VLTLY PTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILG
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILG

XP_004138930.1 protein SCAI [Cucumis sativus]0.0e+0097.5Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANS+T N+SIPVSE YWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VPPTLT RYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTD+GCESINNA++IDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTA +HAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR VLT YAPTLGKKEY+PRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

XP_008457173.1 PREDICTED: protein SCAI isoform X1 [Cucumis melo]0.0e+0096.99Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSST+N+SIPVSE YWSLVDKADRKFSKIRDLPYYERN YDAYFHKAFKVYTQLWKFQQENRQKLVE GLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAI+TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VP T+T R LRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSG NFLSSPAGTD+GCESINNAEDIDKTKSPCSQVEGGYKGLQS CLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSP+ATSHAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR+VLTLY PTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

XP_008457174.1 PREDICTED: protein SCAI isoform X2 [Cucumis melo]0.0e+0095.49Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSST+N+SIPVSE YWSLVDKADRKFSKIRDLPYYERN YDAYFHKAFKVYTQLWKFQQENRQKLVE GLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAI+TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VP T+T R LRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAA          AGTD+GCESINNAEDIDKTKSPCSQVEGGYKGLQS CLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSP+ATSHAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR+VLTLY PTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

XP_038875244.1 protein SCAI [Benincasa hispida]0.0e+0094.32Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSS++N+SIPVSE YWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAILTREYFK+G FQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGG+GPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEM SDGVLLIYLSAAGSGKN  SSPAGTD+GCESINNAEDIDKT+SPC QVEG   G QSGCLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLL+IDSDGSEAFETIHGAEKGEP AMLLS +ATSH+V TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDV+MDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSES+DQVWAQILNDPFIRRLLLRFIFCRTVL LYAPTLGKKEYVPRCVPSLPS+VDPTTAT QSVVMKIA ILG SRSFVF+ENL+L EN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

TrEMBL top hitse value%identityAlignment
A0A0A0LKY8 Uncharacterized protein0.0e+0097.5Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANS+T N+SIPVSE YWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VPPTLT RYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTD+GCESINNA++IDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTA +HAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR VLT YAPTLGKKEY+PRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

A0A1S3C4H1 protein SCAI isoform X20.0e+0095.49Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSST+N+SIPVSE YWSLVDKADRKFSKIRDLPYYERN YDAYFHKAFKVYTQLWKFQQENRQKLVE GLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAI+TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VP T+T R LRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAA          AGTD+GCESINNAEDIDKTKSPCSQVEGGYKGLQS CLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSP+ATSHAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR+VLTLY PTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

A0A1S3C668 protein SCAI isoform X10.0e+0096.99Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSST+N+SIPVSE YWSLVDKADRKFSKIRDLPYYERN YDAYFHKAFKVYTQLWKFQQENRQKLVE GLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAI+TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VP T+T R LRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSG NFLSSPAGTD+GCESINNAEDIDKTKSPCSQVEGGYKGLQS CLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSP+ATSHAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR+VLTLY PTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

A0A5A7T841 Protein SCAI isoform X10.0e+0096.99Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSST+N+SIPVSE YWSLVDKADRKFSKIRDLPYYERN YDAYFHKAFKVYTQLWKFQQENRQKLVE GLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAI+TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VP T+T R LRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSG NFLSSPAGTD+GCESINNAEDIDKTKSPCSQVEGGYKGLQS CLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSP+ATSHAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR+VLTLY PTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSEN

A0A5D3BA86 Protein SCAI isoform X20.0e+0095.37Show/hide
Query:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR
        MSQPGNPANSST+N+SIPVSE YWSLVDKADRKFSKIRDLPYYERN YDAYFHKAFKVYTQLWKFQQENRQKLVE GLKRWEIGEIASRIAQLYFGQYMR
Subjt:  MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMR

Query:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
        TSEASYLSESYVFYEAI+TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF
Subjt:  TSEASYLSESYVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAF

Query:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
        MNIRPFRYSVVLEPHPDSLT VP T+T R LRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP
Subjt:  MNIRPFRYSVVLEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLP

Query:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC
        SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAA          AGTD+GCESINNAEDIDKTKSPCSQVEGGYKGLQS CLSFGTRGKGGLSC
Subjt:  SNPRKSILYRPSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSC

Query:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
        IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSP+ATSHAV TDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL
Subjt:  IYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSL

Query:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILG
        SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCR+VLTLY PTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILG
Subjt:  SEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILG

SwissProt top hitse value%identityAlignment
Q54YY1 Protein SCAI homolog2.8e-5827.81Show/hide
Query:  SQPGNPANSSTNNTS--------IPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEA---GLKRWEIGEIASRI
        S P N   ++T++TS          + +T+  L+ K+ R F  +RDLP + R ++  +F K F++YT+LWKFQQ+ R  L +    GLKR EIGEIAS+I
Subjt:  SQPGNPANSSTNNTS--------IPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEA---GLKRWEIGEIASRI

Query:  AQLYFGQYMRTSEASYLSESYVFYEAILTREYFKD-GLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQE
         QLY+  Y+RTS+ +YL+ESY+FYEAI  R YFKD  L +   +  KQLR+ +RF++VCL+LN++++V  L+ +L   +++  + ++ +D +EW LV+QE
Subjt:  AQLYFGQYMRTSEASYLSESYVFYEAILTREYFKD-GLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQE

Query:  IMKFLKADTAFM------------------------NIRPFRYSVVLEPHPDSLTHV----PPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQS
        I  FL+AD                            N      +  ++ H   L H+    PP   +    LQ AIL     N++KFSE+TLD FRM QS
Subjt:  IMKFLKADTAFM------------------------NIRPFRYSVVLEPHPDSLTHV----PPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQS

Query:  LEWEPSGSFYRPN----------NRSGQNGGTGPSRSNFSQDIVDPTLPS-------------------------NPRKSILYRPSVTHFLAVLATICEE
        LE+EP       +           +  Q         N   D  + T+PS                         NP K +LYRP+++  L  L+   +E
Subjt:  LEWEPSGSFYRPN----------NRSGQNGGTGPSRSNFSQDIVDPTLPS-------------------------NPRKSILYRPSVTHFLAVLATICEE

Query:  MASDGVLLIYLSAAG-----------------------------SGKNFLSSPAGT-----------------------DVGCESINNAED-------ID
        +  +  +L+Y+ A G                             S  N   +   T                        +   ++NN  +       + 
Subjt:  MASDGVLLIYLSAAG-----------------------------SGKNFLSSPAGT-----------------------DVGCESINNAED-------ID

Query:  KTKSPCSQVEGGYKGLQSGCLSFGTRGKGGL--------------SCIYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPT
         T +  + V        +   S  T     +                +YP DL+PF R+PF L+++S  S+ F  +      +P   LLSP +    + +
Subjt:  KTKSPCSQVEGGYKGLQSGCLSFGTRGKGGL--------------SCIYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPT

Query:  DYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSLSEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYV
        +  + G+LFT FL  P+ AFC +    G+ +   TF+    +  +SL    +LL     L   ++  L D F+R  ++RFIFC     L+        Y 
Subjt:  DYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSLSEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYV

Query:  PRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFV-FSEN-LLLSEN
         +  P LP  +    + L+S + ++ + L VS  F+  +EN L++ EN
Subjt:  PRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFV-FSEN-LLLSEN

Q8C8N2 Protein SCAI2.3e-8135.71Show/hide
Query:  LVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEA-GLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESYVFYEAILTREYFK
        L+DK+ + F+ +RDLP Y + ++ +YF + F VYT+LWKFQQ++RQ L    GLKRW+IGEIAS+I QLY+  Y+RTSE SYL+E++ FY AI  R Y+ 
Subjt:  LVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEA-GLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESYVFYEAILTREYFK

Query:  DGLFQD-VSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVVLEPHPDSLTHVP
            +D   L  K+LR+ +RF++VCL+LN+ ++V  LV +L   +++    F   D  EW LV+QE+  F++AD     +     ++V+  +  + T  P
Subjt:  DGLFQD-VSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVVLEPHPDSLTHVP

Query:  ---PTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLPSNPRKSILYRPSVTHFLAVL
             +    L L DA++    +N+VKFSELT+D FRM+Q+LE EP             N  +  ++    +    PT   NP K +LY+P+ +     L
Subjt:  ---PTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLPSNPRKSILYRPSVTHFLAVL

Query:  ATICEEMASDGVLLIYLSAAGSGKNFLSSPAGT-DVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSCIYPSDLVPFTRRPFLLVID
        A   +E+ ++ VLLIYLSA G      S   G  D G    N+  DI                +    +    +    + C++P DL PFTR+P  +V+D
Subjt:  ATICEEMASDGVLLIYLSAAGSGKNFLSSPAGT-DVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSCIYPSDLVPFTRRPFLLVID

Query:  SDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSLSEWGQLLVTSESLDQVWAQ
        S  S A++       G+P   LLSPTA   A+  D S+ GSLFTLFL  PL AF  + G+  S +    + K +  L     +  QLL  S S+DQ + Q
Subjt:  SDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSLSEWGQLLVTSESLDQVWAQ

Query:  ILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSEN
           D F+R LL RF+FC   + ++      + Y P   P LP         LQ  ++++A+IL V    +F EN
Subjt:  ILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSEN

Q8N9R8 Protein SCAI3.1e-8135.94Show/hide
Query:  LVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEA-GLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESYVFYEAILTREYFK
        L+DK+ + F+ +RDLP Y + ++ +YF + F VYT+LWKFQQ++RQ L    GLKRW+IGEIAS+I QLY+  Y+RTSE SYL+E++ FY AI  R Y+ 
Subjt:  LVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEA-GLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESYVFYEAILTREYFK

Query:  DGLFQD-VSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVVLEPHPDSLTHVP
            +D   L  K+LR+ +RF++VCL+LN+ ++V  LV +L   +++    F   D  EW LV+QE+  F++AD     +     ++V+  +  + T  P
Subjt:  DGLFQD-VSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVVLEPHPDSLTHVP

Query:  ---PTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLPSNPRKSILYRPSVTHFLAVL
             +    L L DA++    +N+VKFSELT+D FRM+Q+LE EP     + N    Q     P+R              NP K +LY+P+ +     L
Subjt:  ---PTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLPSNPRKSILYRPSVTHFLAVL

Query:  ATICEEMASDGVLLIYLSAAGSGKNFLSSPAGT-DVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSCIYPSDLVPFTRRPFLLVID
        A   +E+ ++ VLLIYLSA G      S   G  D G    N+  DI                +    +    +    + C++P DL PFTR+P  +++D
Subjt:  ATICEEMASDGVLLIYLSAAGSGKNFLSSPAGT-DVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSCIYPSDLVPFTRRPFLLVID

Query:  SDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSLSEWGQLLVTSESLDQVWAQ
        S  S A++       G+P   LLSPTA   A+  D S+ GSLFTLFL  PL AF  + G+  S +    + K +  L     +  QLL  S S+DQ + Q
Subjt:  SDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSLSEWGQLLVTSESLDQVWAQ

Query:  ILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLL
           D F+R LL RFIFC   + ++      + Y P   P LP         LQ  ++++A+IL V    VF EN +
Subjt:  ILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLL

Arabidopsis top hitse value%identityAlignment
AT3G03570.1 Protein of unknown function (DUF3550/UPF0682)1.7e-20461.94Show/hide
Query:  TNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESY
        + N +IP+SE YWSLV+KAD+KFSKIRDLP+YER+RY+ YF K FKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLY+G YMRTS+A YLSESY
Subjt:  TNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESY

Query:  VFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVV
        VFYEAILTREYFKDGLFQD+++ANKQLRFL+RFLMVCLVL RREMVHQLV+Q K L+DECKRTFQETDF+EWK+V QEI++FLK+DTAFMNIRP RYS+V
Subjt:  VFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVV

Query:  LEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNN-RSGQNGGTGPSRSNFSQDIVDPTLPSNPRKSILYR
        L+P+ D+ T        R LRL DAILSSY  NEVK+SELTLD+FRM+Q LEWEPSGS Y+    + GQN   G +R N SQ + DPTLP NPRK++LYR
Subjt:  LEPHPDSLTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNN-RSGQNGGTGPSRSNFSQDIVDPTLPSNPRKSILYR

Query:  PSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSP----AGTDVGCESINNAED--IDKTKSPCSQVEGGYKGLQ--------SGC-LSFGTRGK
        PS+THFLAVLATICEE+ S G+LL+YLSA+G      SSP    + T V    + + E   I +   P  Q+    + L+        + C LSFG+ G 
Subjt:  PSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSP----AGTDVGCESINNAED--IDKTKSPCSQVEGGYKGLQ--------SGC-LSFGTRGK

Query:  GGLSCIYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRH--GSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAE
         G S IYPSDLVPFTR+P  ++IDSD S  F+ I GAEKGEPAA+LLSP+ T   +  D+SR   GSLFT+FLT+P+ AFCLL  IS SD+E D F+KAE
Subjt:  GGLSCIYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVPTDYSRH--GSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAE

Query:  NVLSSSLSEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSEN
         +LSSS++EW   L TS++L  VW+QIL DPF+RRLLLRFIFCR VL LY P    K+  P C PSLP  + PT   +QS V ++AN+ G +  F   ++
Subjt:  NVLSSSLSEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSEN

Query:  LLLSENY
        + + E++
Subjt:  LLLSENY

AT4G40050.1 Protein of unknown function (DUF3550/UPF0682)1.4e-14546.57Show/hide
Query:  VSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESYVFYEAIL
        VS  + +LV+ ADRKF+++RDLP + R +   YF K FK Y +LW +QQ +R KLVE+GL RWEIGEIASRI QLYF QYMRTSEA +L E++VFYEAIL
Subjt:  VSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMRTSEASYLSESYVFYEAIL

Query:  TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVVLEPHPDS
         R YF +   +D+    K+LRF +RFL+V L+++R++M+  L ++L++L+D     F+ET+F+EW+LVVQEI +F+++DT    +RP RY  +L+ +P S
Subjt:  TREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVVLEPHPDS

Query:  LTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGG--------TGPSRSNFSQDIVDPTLPSNPRKSILYR
         T++     K+  + +DA+L+SY+ NEVK++E+TLDT+RM+Q LEWEPSGSFY+      +  G        +G    N + D+ DP+LP NPRK+ILYR
Subjt:  LTHVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGG--------TGPSRSNFSQDIVDPTLPSNPRKSILYR

Query:  PSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKG------------LQSGCLSFGTR-GKGG
        P+V+H LAVLA IC+E++ + V+L+YLSA+G       +     VG    + +    K  +  SQ +  YK                  L  G R G  G
Subjt:  PSVTHFLAVLATICEEMASDGVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKG------------LQSGCLSFGTR-GKGG

Query:  LSCIYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVP-TDYSR--HGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAEN
         + +YP DL+PFTR+P  L+IDSD S AF+ + GAE+GEP AMLLSP   S   P TD +   +GS FT FLTAPL AFC +LG+S +  + +   +AE+
Subjt:  LSCIYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAMLLSPTATSHAVP-TDYSR--HGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAEN

Query:  VLSSSLSEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFS
        +LS+S SEW  +L+TS+ L+ VWAQ+L DPF+RRL+LRFIFCR+VLT ++ T     Y+P+C P+LP ++   +  +QS V ++A  LGV++SF F+
Subjt:  VLSSSLSEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKKEYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCGCAGCCGGGAAATCCGGCCAATAGCAGCACCAACAACACTAGCATTCCAGTGAGCGAAACCTACTGGTCTCTTGTTGACAAAGCTGACCGGAAGTTCTCCAAGAT
CAGGGACCTGCCTTATTACGAGCGCAATAGGTACGATGCGTATTTCCATAAGGCGTTCAAAGTGTACACACAGTTATGGAAGTTTCAGCAAGAGAATCGTCAGAAGTTGG
TGGAGGCAGGGCTAAAGAGATGGGAGATTGGCGAGATTGCTTCACGAATTGCTCAGCTTTACTTTGGGCAATACATGAGGACCAGTGAGGCGAGCTATTTGTCTGAGTCT
TACGTATTTTACGAAGCAATATTGACTCGAGAGTACTTTAAGGATGGATTGTTTCAAGATGTCAGTCTTGCGAACAAGCAGTTGAGATTCCTGTCCAGATTTCTGATGGT
GTGCCTGGTTTTGAATCGAAGAGAAATGGTGCATCAGTTGGTTAATCAGCTCAAAATGTTGCTCGATGAGTGTAAGAGAACATTCCAGGAAACGGACTTTAGAGAATGGA
AGCTGGTAGTTCAGGAAATAATGAAATTTTTGAAAGCAGACACAGCCTTTATGAATATCAGGCCTTTCAGATATAGTGTTGTGTTAGAGCCTCATCCAGATTCTCTAACA
CATGTTCCTCCAACGCTTACAAAGAGATACTTGAGGTTACAGGATGCTATTCTGAGTAGCTACAATCATAATGAGGTCAAGTTTTCTGAGCTCACGCTAGACACTTTCAG
GATGATCCAGAGCCTGGAGTGGGAGCCCAGTGGTTCATTTTATCGACCAAATAATAGAAGTGGGCAGAATGGTGGTACTGGGCCAAGCCGCAGTAACTTCTCACAGGATA
TAGTTGATCCTACTCTCCCATCTAATCCTCGGAAGTCAATTTTATACCGTCCTTCAGTGACACATTTTTTAGCAGTTCTAGCTACAATTTGTGAGGAGATGGCAAGTGAT
GGGGTTCTCTTGATATATTTGTCAGCTGCAGGCAGTGGAAAGAATTTTTTATCTTCCCCAGCTGGCACTGATGTAGGCTGTGAATCTATCAACAATGCGGAGGATATTGA
TAAAACCAAGTCTCCTTGCAGTCAGGTTGAAGGAGGTTACAAAGGTCTCCAAAGTGGTTGCTTATCATTTGGCACTCGTGGAAAAGGAGGATTAAGCTGCATATATCCAA
GTGATTTGGTTCCATTTACTAGAAGACCGTTTCTTTTAGTTATTGATAGCGATGGCAGTGAAGCATTTGAGACTATTCATGGAGCAGAAAAGGGAGAGCCAGCTGCAATG
CTGTTATCTCCCACTGCTACTAGTCATGCTGTTCCTACCGATTATTCCCGTCATGGAAGCCTTTTCACACTCTTTCTCACAGCTCCTCTGCATGCTTTCTGTCTATTGCT
TGGTATCTCAGGCTCTGATGTTGAAATGGATACATTTAGTAAAGCTGAGAACGTGCTATCCTCATCATTAAGTGAGTGGGGGCAGTTATTGGTGACATCAGAGAGCCTTG
ACCAAGTTTGGGCACAGATTTTGAATGATCCATTCATAAGGCGACTTCTCTTGAGATTTATATTCTGTCGTACTGTGTTAACACTATACGCACCAACCTTGGGTAAGAAG
GAATATGTTCCGAGGTGTGTGCCATCTCTGCCCTCCGTCGTCGATCCGACAACAGCAACATTGCAATCTGTAGTCATGAAGATAGCAAATATCCTTGGTGTAAGCCGCAG
TTTCGTCTTCTCAGAAAACCTGCTACTTTCTGAAAACTATCAATGA
mRNA sequenceShow/hide mRNA sequence
CTTGGAGTATGTCATCCTTGCAAAAATATATTTTACTTTGTGTTCATAAAATAAACCGGGAAGGAAATTTATCCTGCCTCCGGTCTTTCGGTTTCCGGTACATGCGTGTA
CTCTGAATCCGAAAACTCCCATAAGCCGGAATTTTCCGGTTTTAAGTCCGATTATCCCTCCACCAACTCCGACCACCACCGCCGGAGGCACAGCTTAAAATCACGTACCT
CTCTGTTCTTTAGGGACTAATCGCTTTGCCCTGAAAACAAACAGGGAATTTTTGGGTGAAACTATATAGCGAAACTCCGAGCTCGGCGAAGATGTCGCAGCCGGGAAATC
CGGCCAATAGCAGCACCAACAACACTAGCATTCCAGTGAGCGAAACCTACTGGTCTCTTGTTGACAAAGCTGACCGGAAGTTCTCCAAGATCAGGGACCTGCCTTATTAC
GAGCGCAATAGGTACGATGCGTATTTCCATAAGGCGTTCAAAGTGTACACACAGTTATGGAAGTTTCAGCAAGAGAATCGTCAGAAGTTGGTGGAGGCAGGGCTAAAGAG
ATGGGAGATTGGCGAGATTGCTTCACGAATTGCTCAGCTTTACTTTGGGCAATACATGAGGACCAGTGAGGCGAGCTATTTGTCTGAGTCTTACGTATTTTACGAAGCAA
TATTGACTCGAGAGTACTTTAAGGATGGATTGTTTCAAGATGTCAGTCTTGCGAACAAGCAGTTGAGATTCCTGTCCAGATTTCTGATGGTGTGCCTGGTTTTGAATCGA
AGAGAAATGGTGCATCAGTTGGTTAATCAGCTCAAAATGTTGCTCGATGAGTGTAAGAGAACATTCCAGGAAACGGACTTTAGAGAATGGAAGCTGGTAGTTCAGGAAAT
AATGAAATTTTTGAAAGCAGACACAGCCTTTATGAATATCAGGCCTTTCAGATATAGTGTTGTGTTAGAGCCTCATCCAGATTCTCTAACACATGTTCCTCCAACGCTTA
CAAAGAGATACTTGAGGTTACAGGATGCTATTCTGAGTAGCTACAATCATAATGAGGTCAAGTTTTCTGAGCTCACGCTAGACACTTTCAGGATGATCCAGAGCCTGGAG
TGGGAGCCCAGTGGTTCATTTTATCGACCAAATAATAGAAGTGGGCAGAATGGTGGTACTGGGCCAAGCCGCAGTAACTTCTCACAGGATATAGTTGATCCTACTCTCCC
ATCTAATCCTCGGAAGTCAATTTTATACCGTCCTTCAGTGACACATTTTTTAGCAGTTCTAGCTACAATTTGTGAGGAGATGGCAAGTGATGGGGTTCTCTTGATATATT
TGTCAGCTGCAGGCAGTGGAAAGAATTTTTTATCTTCCCCAGCTGGCACTGATGTAGGCTGTGAATCTATCAACAATGCGGAGGATATTGATAAAACCAAGTCTCCTTGC
AGTCAGGTTGAAGGAGGTTACAAAGGTCTCCAAAGTGGTTGCTTATCATTTGGCACTCGTGGAAAAGGAGGATTAAGCTGCATATATCCAAGTGATTTGGTTCCATTTAC
TAGAAGACCGTTTCTTTTAGTTATTGATAGCGATGGCAGTGAAGCATTTGAGACTATTCATGGAGCAGAAAAGGGAGAGCCAGCTGCAATGCTGTTATCTCCCACTGCTA
CTAGTCATGCTGTTCCTACCGATTATTCCCGTCATGGAAGCCTTTTCACACTCTTTCTCACAGCTCCTCTGCATGCTTTCTGTCTATTGCTTGGTATCTCAGGCTCTGAT
GTTGAAATGGATACATTTAGTAAAGCTGAGAACGTGCTATCCTCATCATTAAGTGAGTGGGGGCAGTTATTGGTGACATCAGAGAGCCTTGACCAAGTTTGGGCACAGAT
TTTGAATGATCCATTCATAAGGCGACTTCTCTTGAGATTTATATTCTGTCGTACTGTGTTAACACTATACGCACCAACCTTGGGTAAGAAGGAATATGTTCCGAGGTGTG
TGCCATCTCTGCCCTCCGTCGTCGATCCGACAACAGCAACATTGCAATCTGTAGTCATGAAGATAGCAAATATCCTTGGTGTAAGCCGCAGTTTCGTCTTCTCAGAAAAC
CTGCTACTTTCTGAAAACTATCAATGAAATGTGTACTAAAAAAACTAGCAAATATGTATCACTTCTTGCTATTTTTGCTATGTGCTTTTTGTGTAAATGGATTTGGAATA
TCTTTGGCTGTGATTGAACTGCAGAGAATGCTATTGAAAGTGGTTTTGAATGTTTCTTAAAATATGAACTAAATGCATCACATTTCAATCATTGATGGTGATACATGTAG
AATGTATGTAATGAATACTTAGCTGCTGCACCTCAAAATAGTACCATTCCTCTATATAATGAATACTTAAATCTCTTTTGTAA
Protein sequenceShow/hide protein sequence
MSQPGNPANSSTNNTSIPVSETYWSLVDKADRKFSKIRDLPYYERNRYDAYFHKAFKVYTQLWKFQQENRQKLVEAGLKRWEIGEIASRIAQLYFGQYMRTSEASYLSES
YVFYEAILTREYFKDGLFQDVSLANKQLRFLSRFLMVCLVLNRREMVHQLVNQLKMLLDECKRTFQETDFREWKLVVQEIMKFLKADTAFMNIRPFRYSVVLEPHPDSLT
HVPPTLTKRYLRLQDAILSSYNHNEVKFSELTLDTFRMIQSLEWEPSGSFYRPNNRSGQNGGTGPSRSNFSQDIVDPTLPSNPRKSILYRPSVTHFLAVLATICEEMASD
GVLLIYLSAAGSGKNFLSSPAGTDVGCESINNAEDIDKTKSPCSQVEGGYKGLQSGCLSFGTRGKGGLSCIYPSDLVPFTRRPFLLVIDSDGSEAFETIHGAEKGEPAAM
LLSPTATSHAVPTDYSRHGSLFTLFLTAPLHAFCLLLGISGSDVEMDTFSKAENVLSSSLSEWGQLLVTSESLDQVWAQILNDPFIRRLLLRFIFCRTVLTLYAPTLGKK
EYVPRCVPSLPSVVDPTTATLQSVVMKIANILGVSRSFVFSENLLLSENYQ