; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Spg012613 (gene) of Sponge gourd (cylindrica) v1 genome

Gene IDSpg012613
OrganismLuffa cylindrica (Sponge gourd (cylindrica) v1)
Descriptionmucin-5AC
Genome locationscaffold1:16670544..16673846
RNA-Seq ExpressionSpg012613
SyntenySpg012613
Gene Ontology termsGO:0006979 - response to oxidative stress (biological process)
GO:0043622 - cortical microtubule organization (biological process)
GO:0055028 - cortical microtubule (cellular component)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_008463284.1 PREDICTED: mucin-5AC [Cucumis melo]4.8e-26380.92Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+G+RNAPLLSQHRRGHSFTGI+RDSDENLDLFSKNRRSLSV ASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA
        TL RSSSTTKASRLSVS SE NNPSRP RSSSVSRSSVSTPQY+SYSSNRS SSILNTSSASVSSYIRPSSPSTR++S+ARPSTPSSRSTPSRSSTPSRA
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA

Query:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
        RPSP SPSI+KPR +QSSRPSTP+SRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+V TPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
Subjt:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP

Query:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA
        DFPLDTPPNLRTTLPDRPISAGRSRPTP+ASVRGSPE TSTVT+PRRAASPTV+RGR+TDTPGRGR+NTNGHLSD PETRRLSSSSDL GRRPVKAS T 
Subjt:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA

Query:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA
        +ESNGFGRSISKKSLDMAIRHMDIRNGPGS+R+GSGNTLFPHSIRSATSKTQSIA SNSEA DTD+Q SS  N++RGNHF RPSA  GTEGGGENGRFSA
Subjt:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA

Query:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDL SILDNGFEALPEPFGLL
Subjt:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

XP_011653729.1 mucin-5AC [Cucumis sativus]8.6e-26080.03Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+G+RNAPL S HRRGHSFTGI+RDSDENLDLFSKNRR+LSV ASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESE+QSTVAAPRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA
        TL RSSSTTKASRLSVS SESNNPSRP RSSSVSRSSVSTPQY+SYSSNRS SSILNTSSASVSSYIRPSSPSTR++S+ARPSTPSSRSTPSRSSTPSRA
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA

Query:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
        RPSP SPSI+KPR +QSSRPSTP+SRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+V TPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
Subjt:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP

Query:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA
        DFPLDTPPNLRTTLPDRPISAGRSRPTPA+SVRGSPE TST T+PRRAASPT++RGR+TD PGRGR+NTNGHLSD PETRRLSSSSDL GRRPVKAS T 
Subjt:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA

Query:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTE-GGGENGRFS
        +ESNGFGRSISKKSLDMAIRHMDIRNGPGS+R+GSGNTLFPHSIRSATSKTQSIA SNSEAIDTD+Q SS  NM+RGNHF RPSA  GTE GGGENGRFS
Subjt:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTE-GGGENGRFS

Query:  ASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        ASLNHLDIYESSRYDAILLKEDLKNTNWLHS DDKTDL SILDNGFEALPEPFGLL
Subjt:  ASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

XP_022144099.1 serine/arginine repetitive matrix protein 2 [Momordica charantia]7.0e-26281.5Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+  RNAPLLS HRRGHSFT I+RDSDENLDLFSKNRRSLSVAASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AK+GIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR
        TL RSSSTTKASRLSVSHSESNN SRPARSSSVSRSSVSTPQY++YSSNRSSSILNTSSASVSSYIRPSSPSTRNSST RPSTPSSR T SRSSTPSRAR
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR

Query:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD
        PSPTS SIDKPRQIQSSRPSTPSSRPQ+PANLSSPAARSNSRPSTPTRRNSAPSLSS+V  PS TGRVLS NGRSSTSTSRPSSPSPRVRA+PQPIVPPD
Subjt:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD

Query:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS
        FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRR+ASPTVSRGRLTDTPGRGRVNTNGHLSD  E RRLSSSSDLGGRRPVKAS T +
Subjt:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS

Query:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSSN--MERGNHFLRPSAVNGTEGGGENGRFSAS
        ESNGFGRSISKKSLDMAIRHMDIRNGPGSMR+GSGNTLFPHSIRSATSKTQSIAS+NSEAIDTDFQ+SSN  MERGNH  R S     EGGGENGRFSAS
Subjt:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSSN--MERGNHFLRPSAVNGTEGGGENGRFSAS

Query:  LNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        LNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
Subjt:  LNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

XP_023543251.1 uncharacterized protein YMR317W [Cucurbita pepo subsp. pepo]1.1e-25479.42Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWRE L+G RNAPLLSQHRRGHSFTGI+RDSDENLDLFSKNRRSLSVAASD S+D                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            A VKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPR+S
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR
        +L RSSSTTKASRLSVS SESNNPSRPARSSSVSRSSVSTPQY+SYSSNRSSSILNTSSASVSSYIRP+SPSTR++STARPSTPSSRSTPSRSSTPSRAR
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR

Query:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD
        PSPTS SIDKPRQ+QSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+VSTPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIV PD
Subjt:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD

Query:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS
        FPLDTPPNLRTTLPDRPISAGRSRP P  SVRGSPE TSTVTMPRRA+SPTVSRGRLTD PGRGRVNTNGHLSD PETRRLSSSSDLGGRRPVK S T +
Subjt:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS

Query:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATS--KTQSIASSNSEAIDTDFQSS--SNMERGNHFLRPSAVNGTEGGGENGRFS
        ESNGFGRSISKKSLD+AIR+MDIRN PG++R+GSG+TLFPHSIR+A +  KTQSIASSN +AIDTDFQ S  +NMERGNHF R SA  GTEGGGENGRF 
Subjt:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATS--KTQSIASSNSEAIDTDFQSS--SNMERGNHFLRPSAVNGTEGGGENGRFS

Query:  ASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        ASLNH+DIYESSRYDAILLKEDLKNTNWLHSADDKTDL SILDNGFEALPEPFGLL
Subjt:  ASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

XP_038883319.1 serine/arginine repetitive matrix protein 2 [Benincasa hispida]6.3e-26381.07Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+GARNAPLLSQHRRGHSFTGI+RDSDENLDLFSKNRRSLSVAASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESE+QSTV APRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA
        TL RSSSTTKASRLSVS SES+NPSRPARSSSVSRSSVSTPQY+SYSS+RS SSILNTSSASVSSYIRPSSPSTR+SS+ARPSTPSSR+TPSRSSTPSRA
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA

Query:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
        RPSPTS SI+KPR +QSSRPSTP+SRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+V TPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
Subjt:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP

Query:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA
        DFPLDTPPNLRTTLPDRPISAGRSRP+PAASVRGSPEP+ST+ +PRRAASPTVSRGR+TD PGRGR+NTNGHLSD  ETRRLSSSSDL GRRPVKAS T 
Subjt:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA

Query:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA
        +ESNGFGRSISKKSLDMAIRHMDIRNGPGS+R+GSGNTLFPHSIRSATSKTQSIA SNSEAIDTDFQ SS  NMERGNHF RPSA  GTEGGGENGRFSA
Subjt:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA

Query:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDL SILDNGFEALPEPFGLL
Subjt:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

TrEMBL top hitse value%identityAlignment
A0A0A0KY97 Uncharacterized protein4.1e-26080.03Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+G+RNAPL S HRRGHSFTGI+RDSDENLDLFSKNRR+LSV ASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESE+QSTVAAPRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA
        TL RSSSTTKASRLSVS SESNNPSRP RSSSVSRSSVSTPQY+SYSSNRS SSILNTSSASVSSYIRPSSPSTR++S+ARPSTPSSRSTPSRSSTPSRA
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA

Query:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
        RPSP SPSI+KPR +QSSRPSTP+SRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+V TPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
Subjt:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP

Query:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA
        DFPLDTPPNLRTTLPDRPISAGRSRPTPA+SVRGSPE TST T+PRRAASPT++RGR+TD PGRGR+NTNGHLSD PETRRLSSSSDL GRRPVKAS T 
Subjt:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA

Query:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTE-GGGENGRFS
        +ESNGFGRSISKKSLDMAIRHMDIRNGPGS+R+GSGNTLFPHSIRSATSKTQSIA SNSEAIDTD+Q SS  NM+RGNHF RPSA  GTE GGGENGRFS
Subjt:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTE-GGGENGRFS

Query:  ASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        ASLNHLDIYESSRYDAILLKEDLKNTNWLHS DDKTDL SILDNGFEALPEPFGLL
Subjt:  ASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

A0A1S3CIW9 mucin-5AC2.3e-26380.92Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+G+RNAPLLSQHRRGHSFTGI+RDSDENLDLFSKNRRSLSV ASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA
        TL RSSSTTKASRLSVS SE NNPSRP RSSSVSRSSVSTPQY+SYSSNRS SSILNTSSASVSSYIRPSSPSTR++S+ARPSTPSSRSTPSRSSTPSRA
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA

Query:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
        RPSP SPSI+KPR +QSSRPSTP+SRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+V TPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
Subjt:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP

Query:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA
        DFPLDTPPNLRTTLPDRPISAGRSRPTP+ASVRGSPE TSTVT+PRRAASPTV+RGR+TDTPGRGR+NTNGHLSD PETRRLSSSSDL GRRPVKAS T 
Subjt:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA

Query:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA
        +ESNGFGRSISKKSLDMAIRHMDIRNGPGS+R+GSGNTLFPHSIRSATSKTQSIA SNSEA DTD+Q SS  N++RGNHF RPSA  GTEGGGENGRFSA
Subjt:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA

Query:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDL SILDNGFEALPEPFGLL
Subjt:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

A0A5D3C4U4 Mucin-5AC2.3e-26380.92Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+G+RNAPLLSQHRRGHSFTGI+RDSDENLDLFSKNRRSLSV ASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA
        TL RSSSTTKASRLSVS SE NNPSRP RSSSVSRSSVSTPQY+SYSSNRS SSILNTSSASVSSYIRPSSPSTR++S+ARPSTPSSRSTPSRSSTPSRA
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRA

Query:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
        RPSP SPSI+KPR +QSSRPSTP+SRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+V TPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP
Subjt:  RPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPP

Query:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA
        DFPLDTPPNLRTTLPDRPISAGRSRPTP+ASVRGSPE TSTVT+PRRAASPTV+RGR+TDTPGRGR+NTNGHLSD PETRRLSSSSDL GRRPVKAS T 
Subjt:  DFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTA

Query:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA
        +ESNGFGRSISKKSLDMAIRHMDIRNGPGS+R+GSGNTLFPHSIRSATSKTQSIA SNSEA DTD+Q SS  N++RGNHF RPSA  GTEGGGENGRFSA
Subjt:  SESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSS--NMERGNHFLRPSAVNGTEGGGENGRFSA

Query:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDL SILDNGFEALPEPFGLL
Subjt:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

A0A6J1CRA9 serine/arginine repetitive matrix protein 23.4e-26281.5Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWREPL+  RNAPLLS HRRGHSFT I+RDSDENLDLFSKNRRSLSVAASDDSSD                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            ASVKLGRLSVGSVK+AK+GIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR
        TL RSSSTTKASRLSVSHSESNN SRPARSSSVSRSSVSTPQY++YSSNRSSSILNTSSASVSSYIRPSSPSTRNSST RPSTPSSR T SRSSTPSRAR
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR

Query:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD
        PSPTS SIDKPRQIQSSRPSTPSSRPQ+PANLSSPAARSNSRPSTPTRRNSAPSLSS+V  PS TGRVLS NGRSSTSTSRPSSPSPRVRA+PQPIVPPD
Subjt:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD

Query:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS
        FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRR+ASPTVSRGRLTDTPGRGRVNTNGHLSD  E RRLSSSSDLGGRRPVKAS T +
Subjt:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS

Query:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSSN--MERGNHFLRPSAVNGTEGGGENGRFSAS
        ESNGFGRSISKKSLDMAIRHMDIRNGPGSMR+GSGNTLFPHSIRSATSKTQSIAS+NSEAIDTDFQ+SSN  MERGNH  R S     EGGGENGRFSAS
Subjt:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSSN--MERGNHFLRPSAVNGTEGGGENGRFSAS

Query:  LNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        LNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
Subjt:  LNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

A0A6J1GEV2 mucin-5AC3.8e-25379.54Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG
        MNRNWRE L+G RNAPLLSQHRRGHSFTGI+RDSDENLDLFSKNRRSLSVAASD S+D                                          
Subjt:  MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSG

Query:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS
                                            A+VKLGRLSVGSVK+AKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPR+S
Subjt:  WDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSS

Query:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR
        +L RSSSTTKASRLSVS  ESNNPSR ARSSSVSRSSVSTPQY+SYSSNRSSSILNTSSASVSSYIRP+SPSTR++STARPSTPSSRSTPSRSSTPSRAR
Subjt:  TLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRAR

Query:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD
        PSPTS SIDKPRQ+QSSRPSTP+SRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSS+VSTPSST RVLSTNGRSSTSTSRPSSPSPRVRAAPQPIV PD
Subjt:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD

Query:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS
        FPLDTPPNLRTTLPDRPISAGRSRPTP  SVRGSPE T TVTMPRRA+SPTVSRGRLTD PGRGRVNTNGHLSD PETRRLSSSSDLGGRRPVK S T +
Subjt:  FPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTAS

Query:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATS-KTQSIASSNSEAIDTDFQSS--SNMERGNHFLRPSAVNGTEGGGENGRFSA
        ESNGFGRSISKKSLD+AIR+MDIRN PG++R+GSG+TLFPHSIR+A S KTQSIASSN EAIDTDFQ S  +NMERGNHF R SA  GTE GGENGRF A
Subjt:  ESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATS-KTQSIASSNSEAIDTDFQSS--SNMERGNHFLRPSAVNGTEGGGENGRFSA

Query:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
        SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL
Subjt:  SLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT2G40070.1 BEST Arabidopsis thaliana protein match is: proline-rich family protein (TAIR:AT3G09000.1)8.3e-2733.33Show/hide
Query:  LSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPS---------SSESEVQSTVAAPRSSTLARSSSTTKASRLSVSHSESNNPS---------
        +S G+    K+  DD L+S EG K+DY+WLLTPPGTPLFPS          S++    +  A  +S LA SS+ + A     S  ++++P          
Subjt:  LSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPS---------SSESEVQSTVAAPRSSTLARSSSTTKASRLSVSHSESNNPS---------

Query:  RPARSSSV-SRSSVSTPQYNSYSSNRSSS--ILNTSSASVSSYIRPSSPSTRN--SSTARPSTPSSRSTPSRSSTPSRARPSPTSPSIDKPRQIQSSRPS
        RP+ S    SR +  T + ++ ++N  SS     TS A+VSS  RPS  ++R+  S+T +P TP SRST   S + SR  P+ + P+    R   S   S
Subjt:  RPARSSSV-SRSSVSTPQYNSYSSNRSSS--ILNTSSASVSSYIRPSSPSTRN--SSTARPSTPSSRSTPSRSSTPSRARPSPTSPSIDKPRQIQSSRPS

Query:  TPSSRPQI--PANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTS------RPSSP-------------------SPRVRAAP
        TPS+  +   P+  ++P +RS +R STPT R + P   +I  + + T R +++   ++T+ +      +PSSP                   SP VR+ P
Subjt:  TPSSRPQI--PANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTS------RPSSP-------------------SPRVRAAP

Query:  -QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPE--------PTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGP--------
         +P   P F L+TPPNLRTTLP+RP+SA R RP   +S  GS E        P      P R  +P  S G       RG    + ++S           
Subjt:  -QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPE--------PTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGP--------

Query:  --ETRRLS--SSSDLGG-RRPVKASPTASESNGFGRSISKKSLDMAIRHMDIRNG-PGSMRAGSGN--TLFPHSIRSATSKTQSIASSNSEAIDTDFQSS
            R+L+   S D G     + A  ++ +S GFGR++SKKSLDMAIRHMDIR   PG++R    N      +S+RS  ++ + +  S+S  + T   +S
Subjt:  --ETRRLS--SSSDLGG-RRPVKASPTASESNGFGRSISKKSLDMAIRHMDIRNG-PGSMRAGSGN--TLFPHSIRSATSKTQSIASSNSEAIDTDFQSS

Query:  SNME--RGNHFLRPSAVNGTEGGGENG-RFSASL
        S +     N     ++    + G E G R  ASL
Subjt:  SNME--RGNHFLRPSAVNGTEGGGENG-RFSASL

AT2G40070.2 FUNCTIONS IN: molecular_function unknown8.3e-2733.33Show/hide
Query:  LSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPS---------SSESEVQSTVAAPRSSTLARSSSTTKASRLSVSHSESNNPS---------
        +S G+    K+  DD L+S EG K+DY+WLLTPPGTPLFPS          S++    +  A  +S LA SS+ + A     S  ++++P          
Subjt:  LSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPS---------SSESEVQSTVAAPRSSTLARSSSTTKASRLSVSHSESNNPS---------

Query:  RPARSSSV-SRSSVSTPQYNSYSSNRSSS--ILNTSSASVSSYIRPSSPSTRN--SSTARPSTPSSRSTPSRSSTPSRARPSPTSPSIDKPRQIQSSRPS
        RP+ S    SR +  T + ++ ++N  SS     TS A+VSS  RPS  ++R+  S+T +P TP SRST   S + SR  P+ + P+    R   S   S
Subjt:  RPARSSSV-SRSSVSTPQYNSYSSNRSSS--ILNTSSASVSSYIRPSSPSTRN--SSTARPSTPSSRSTPSRSSTPSRARPSPTSPSIDKPRQIQSSRPS

Query:  TPSSRPQI--PANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTS------RPSSP-------------------SPRVRAAP
        TPS+  +   P+  ++P +RS +R STPT R + P   +I  + + T R +++   ++T+ +      +PSSP                   SP VR+ P
Subjt:  TPSSRPQI--PANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTS------RPSSP-------------------SPRVRAAP

Query:  -QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPE--------PTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGP--------
         +P   P F L+TPPNLRTTLP+RP+SA R RP   +S  GS E        P      P R  +P  S G       RG    + ++S           
Subjt:  -QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPE--------PTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGP--------

Query:  --ETRRLS--SSSDLGG-RRPVKASPTASESNGFGRSISKKSLDMAIRHMDIRNG-PGSMRAGSGN--TLFPHSIRSATSKTQSIASSNSEAIDTDFQSS
            R+L+   S D G     + A  ++ +S GFGR++SKKSLDMAIRHMDIR   PG++R    N      +S+RS  ++ + +  S+S  + T   +S
Subjt:  --ETRRLS--SSSDLGG-RRPVKASPTASESNGFGRSISKKSLDMAIRHMDIRNG-PGSMRAGSGN--TLFPHSIRSATSKTQSIASSNSEAIDTDFQSS

Query:  SNME--RGNHFLRPSAVNGTEGGGENG-RFSASL
        S +     N     ++    + G E G R  ASL
Subjt:  SNME--RGNHFLRPSAVNGTEGGGENG-RFSASL

AT3G08670.1 unknown protein1.1e-13552.84Show/hide
Query:  MNRNWREPLAGARNAPLLSQHRRGH-------SFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNP
        MNRN RE LAG RN P +SQ RRG+       S  G +RDSDENLDLFSK RRS  +A+SD+  D                                   
Subjt:  MNRNWREPLAGARNAPLLSQHRRGH-------SFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNP

Query:  CVVLNSGWDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQST
                                                    S KLGRLSVGS K+A  G DDLLSS EGGK+DYDWLLTPPGTPL      ++  S+
Subjt:  CVVLNSGWDPFAVPLGSFLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQST

Query:  VAAPRSSTLARSSSTTKASRLSVSHSESN-NPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPS
        +AAP+ ++ AR+SS +KASRLSVS SES  + SRPARSSSV+R S+ST QY+S++S RS SSILNTSSASVSSYIRPSSPS+R+SS+ARPSTP+  S+ S
Subjt:  VAAPRSSTLARSSSTTKASRLSVSHSESN-NPSRPARSSSVSRSSVSTPQYNSYSSNRS-SSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPS

Query:  RSSTPSRARPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSP---AARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPR
        RSSTPSR RP  +S S+DK R   SSRPSTP+SRPQ+ A  SSP   A+R NSRPSTPTRR+ + +  S  S P+ +G   ++NGR+  S SRPSSP PR
Subjt:  RSSTPSRARPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSP---AARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPR

Query:  VRAAP-QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASV-RGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNG-HLSDGPETRRLSSSS
        VR  P QPIV  DFPLDTPPNLRT+LPDRPISAGRSRP   +S+ + SPEP   +T  RR +SP V+RGRLT+T G+GR   NG HL+D PE RR+S+ S
Subjt:  VRAAP-QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASV-RGSPEPTSTVTMPRRAASPTVSRGRLTDTPGRGRVNTNG-HLSDGPETRRLSSSS

Query:  DLGGRRPVKASPTASE-SNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSSNMERGNHFLRPSAVN
        D+  RR VK S T ++ +NG GRS SK SLDMAIRHMDIRNG  +  A S  TLFP SIR A+SK Q I S N+    +D  SS+  E GN         
Subjt:  DLGGRRPVKASPTASE-SNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKTQSIASSNSEAIDTDFQSSSNMERGNHFLRPSAVN

Query:  GTEGGGENGRFSASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDK-TDLGSILDN-GFEALPEPFGLL
              E  R    L+ +D+YESSRYDA+LLKED+KNTNWLHS DD+ +D G + DN GFE LPEPF  L
Subjt:  GTEGGGENGRFSASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDK-TDLGSILDN-GFEALPEPFGLL

AT3G09000.1 proline-rich family protein4.7e-2232.41Show/hide
Query:  LVLMSASVKLGRLSVGSVKMAKSGIDDLLSS---------------TEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSSTLARSSSTTKASRLSV
        L+  S +V +      +   A SG+ +  SS               +E  K DYDWLLTPPGTP F   S   V +   AP S      S      R  +
Subjt:  LVLMSASVKLGRLSVGSVKMAKSGIDDLLSS---------------TEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSSTLARSSSTTKASRLSV

Query:  SHSESNNPS----------RPARS-SSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPST-----RNSSTARPSTPSSRSTPSRSSTPSRAR
            +N P           RP+ S SS S S  +TP   S +   S+S   T+ AS S    P+S +T       +STA P T ++ S  +RS+TP+R+ 
Subjt:  SHSESNNPS----------RPARS-SSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPST-----RNSSTARPSTPSSRSTPSRSSTPSRAR

Query:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD
        P P+S S  KP     SRP+TP+ RP  P   S  ++++ SR ++P     +P+++S+   P                 SR +SPSP + ++ +P  PP+
Subjt:  PSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPD

Query:  FP---LDTPPNLRTTLPDRPISAGRSRPTPAA-------SVRGSPEPTSTVTMPRRAASPTVSRGR---------LTDTPGRGRVNTNGHLSD-------
         P   L+ PPNLRTTL DRP+SA R RP  A+       S+     PTS  +   R  S + SRGR         LT   GR + +  G   D       
Subjt:  FP---LDTPPNLRTTLPDRPISAGRSRPTPAA-------SVRGSPEPTSTVTMPRRAASPTVSRGR---------LTDTPGRGRVNTNGHLSD-------

Query:  -GPETRRLSSSSDLG-------GRRPVKASPTASESNGFGRSISKKSLDMAIRHMDIRNG-PGSMR-------AGSGNTL--FPHSIRSATSKTQSIASS
              R+ +   LG       G R    S +A  S G+GR++SK S+DMAIRHMDIR G  G++R       A S  ++   P S+ S+   T S  SS
Subjt:  -GPETRRLSSSSDLG-------GRRPVKASPTASESNGFGRSISKKSLDMAIRHMDIRNG-PGSMR-------AGSGNTL--FPHSIRSATSKTQSIASS

Query:  NSEAID
        +  ++D
Subjt:  NSEAID

AT5G01280.1 BEST Arabidopsis thaliana protein match is: proline-rich family protein (TAIR:AT3G09000.1)8.9e-1332.6Show/hide
Query:  TEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSSTLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNT-SSAS
        ++G K DY+WL+TPPG+P         V + + AP  + +      T  SRL     E +     +  SS S S +  P  +S SS+RS+S   T +  S
Subjt:  TEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSSTLARSSSTTKASRLSVSHSESNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNT-SSAS

Query:  VSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRARPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVST
         +   RPS+P++R +ST   +T +S ST   SST S +RPS +S +      + ++R + P++        S+ + RSN+RP +    NS P   S  ST
Subjt:  VSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRARPSPTSPSIDKPRQIQSSRPSTPSSRPQIPANLSSPAARSNSRPSTPTRRNSAPSLSSIVST

Query:  PSSTGRVLSTNGRSSTSTSRPSSP----------SPRVRAAP-QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTV--TMPRRAA
        P  T R  + NG S+   S+P+ P          SP VR+ P +P   P F ++ P NLRTTLPDRP +A  SR T A     S    ST      R++ 
Subjt:  PSSTGRVLSTNGRSSTSTSRPSSP----------SPRVRAAP-QPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTSTV--TMPRRAA

Query:  SPTVSRGRLTDTPG-----RG-RVNTN-------GHLSDGPE------------TRRLSSSSDL-----GGRRPVKASPTASESNGFGRSISKKSLDMAI
        SP+ SR    +  G     RG R  TN        H + G +            T RL+ S        GG      S + S   GFGR++SK S+DMA+
Subjt:  SPTVSRGRLTDTPG-----RG-RVNTN-------GHLSDGPE------------TRRLSSSSDL-----GGRRPVKASPTASESNGFGRSISKKSLDMAI

Query:  RHMDIRNGPGSMRAGSGNTLFPHSIRSA-TSKTQSIASSNSEAIDTDFQSSSNM
        RHMD+R G     + +GN  F HS+  A  +   S+ S  +  + +   S S++
Subjt:  RHMDIRNGPGSMRAGSGNTLFPHSIRSA-TSKTQSIASSNSEAIDTDFQSSSNM


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAACCGCAACTGGAGGGAGCCGCTTGCTGGTGCCCGGAATGCTCCTCTCTTGTCGCAGCACCGCCGTGGCCATAGCTTCACCGGAATCGCCCGGGATTCCGATGAGAA
TCTGGATCTCTTCTCCAAGAATCGCCGGAGTCTCTCCGTTGCTGCCTCCGATGACTCCTCCGATGGTAATACTCCCTTCCGATTGCCTTCTTCTCATTTGTTCCTCGTCA
ATCGTGGAGGATTTGTCTCGATTGGTGTAATGTCGCTGGATTTGAGATTTCTGAATCCGTGTGTCGTTTTGAATTCGGGATGGGATCCTTTTGCTGTTCCGCTTGGATCG
TTCTTGATTCATGTTGTTCTGGTTGTTTGTTGCTTGGCGAGTTCGGTTGTTAAATTGTTTGATCTGGTTTTGATGTCAGCGTCGGTGAAATTGGGGAGGCTTTCTGTTGG
ATCGGTGAAAATGGCTAAGAGTGGGATCGATGATCTGCTGTCGTCGACTGAGGGAGGAAAACACGATTATGACTGGCTTCTCACACCGCCTGGGACTCCTCTTTTCCCTT
CATCCTCTGAAAGTGAAGTTCAATCTACTGTAGCAGCACCGAGAAGCAGCACATTAGCCAGATCATCTTCAACAACAAAAGCTTCAAGGCTTTCAGTTTCACATTCAGAG
AGCAACAATCCTTCTAGGCCAGCAAGGAGCAGTTCTGTGTCTCGGTCCTCTGTCTCCACTCCTCAGTATAATAGTTATTCCTCCAATCGATCTTCATCAATTCTTAATAC
AAGCTCAGCTTCGGTTTCCTCTTACATAAGGCCTTCCTCCCCAAGTACACGCAATTCGTCTACTGCAAGACCTTCTACTCCATCTTCACGCTCAACACCATCGAGGTCCT
CAACTCCTTCAAGGGCCCGTCCATCCCCCACCAGCCCATCCATTGACAAACCAAGACAAATACAAAGTTCAAGGCCATCCACTCCTAGTTCAAGGCCTCAAATTCCTGCA
AATTTGAGTTCTCCTGCAGCCCGGTCAAATTCCCGTCCATCTACACCCACTCGAAGAAATTCTGCTCCTTCACTCTCTTCTATTGTTAGCACTCCATCTTCTACAGGACG
TGTCCTATCAACAAATGGACGCAGTTCAACATCAACATCTCGACCAAGTTCCCCTAGTCCTCGAGTTCGGGCTGCACCTCAGCCAATTGTCCCCCCTGATTTTCCTCTTG
ATACTCCTCCAAACCTCAGAACAACATTGCCAGACAGGCCGATTTCTGCTGGTAGATCCCGCCCAACTCCTGCTGCATCAGTTAGAGGGAGTCCAGAGCCTACATCGACT
GTTACCATGCCTAGAAGAGCAGCATCTCCTACTGTCTCAAGGGGAAGACTAACCGACACCCCTGGAAGGGGTCGGGTGAATACCAATGGACACCTCAGTGATGGTCCTGA
AACTAGGAGACTTTCAAGTTCCTCTGATTTGGGCGGGAGGAGACCTGTGAAGGCTTCTCCAACTGCATCAGAAAGCAACGGATTTGGGAGGTCTATTTCAAAGAAATCAC
TTGACATGGCCATCAGACATATGGATATAAGAAATGGCCCAGGGAGCATGCGCGCAGGTTCAGGCAACACTCTATTTCCACACAGCATCCGATCGGCCACTTCCAAAACT
CAGTCCATTGCTTCAAGCAACTCCGAGGCAATCGATACCGACTTCCAATCGAGCAGTAACATGGAGAGAGGAAACCATTTTCTTAGACCCTCTGCAGTAAACGGAACCGA
AGGAGGAGGAGAGAATGGAAGATTCTCTGCAAGCTTGAATCATTTGGACATCTATGAAAGCTCCCGTTATGATGCAATATTGCTGAAAGAGGACTTGAAAAACACGAATT
GGCTGCACAGCGCAGATGATAAAACCGATTTGGGTTCCATTTTGGATAATGGATTTGAAGCTCTGCCTGAGCCTTTTGGCCTCTTATAA
mRNA sequenceShow/hide mRNA sequence
ATGAACCGCAACTGGAGGGAGCCGCTTGCTGGTGCCCGGAATGCTCCTCTCTTGTCGCAGCACCGCCGTGGCCATAGCTTCACCGGAATCGCCCGGGATTCCGATGAGAA
TCTGGATCTCTTCTCCAAGAATCGCCGGAGTCTCTCCGTTGCTGCCTCCGATGACTCCTCCGATGGTAATACTCCCTTCCGATTGCCTTCTTCTCATTTGTTCCTCGTCA
ATCGTGGAGGATTTGTCTCGATTGGTGTAATGTCGCTGGATTTGAGATTTCTGAATCCGTGTGTCGTTTTGAATTCGGGATGGGATCCTTTTGCTGTTCCGCTTGGATCG
TTCTTGATTCATGTTGTTCTGGTTGTTTGTTGCTTGGCGAGTTCGGTTGTTAAATTGTTTGATCTGGTTTTGATGTCAGCGTCGGTGAAATTGGGGAGGCTTTCTGTTGG
ATCGGTGAAAATGGCTAAGAGTGGGATCGATGATCTGCTGTCGTCGACTGAGGGAGGAAAACACGATTATGACTGGCTTCTCACACCGCCTGGGACTCCTCTTTTCCCTT
CATCCTCTGAAAGTGAAGTTCAATCTACTGTAGCAGCACCGAGAAGCAGCACATTAGCCAGATCATCTTCAACAACAAAAGCTTCAAGGCTTTCAGTTTCACATTCAGAG
AGCAACAATCCTTCTAGGCCAGCAAGGAGCAGTTCTGTGTCTCGGTCCTCTGTCTCCACTCCTCAGTATAATAGTTATTCCTCCAATCGATCTTCATCAATTCTTAATAC
AAGCTCAGCTTCGGTTTCCTCTTACATAAGGCCTTCCTCCCCAAGTACACGCAATTCGTCTACTGCAAGACCTTCTACTCCATCTTCACGCTCAACACCATCGAGGTCCT
CAACTCCTTCAAGGGCCCGTCCATCCCCCACCAGCCCATCCATTGACAAACCAAGACAAATACAAAGTTCAAGGCCATCCACTCCTAGTTCAAGGCCTCAAATTCCTGCA
AATTTGAGTTCTCCTGCAGCCCGGTCAAATTCCCGTCCATCTACACCCACTCGAAGAAATTCTGCTCCTTCACTCTCTTCTATTGTTAGCACTCCATCTTCTACAGGACG
TGTCCTATCAACAAATGGACGCAGTTCAACATCAACATCTCGACCAAGTTCCCCTAGTCCTCGAGTTCGGGCTGCACCTCAGCCAATTGTCCCCCCTGATTTTCCTCTTG
ATACTCCTCCAAACCTCAGAACAACATTGCCAGACAGGCCGATTTCTGCTGGTAGATCCCGCCCAACTCCTGCTGCATCAGTTAGAGGGAGTCCAGAGCCTACATCGACT
GTTACCATGCCTAGAAGAGCAGCATCTCCTACTGTCTCAAGGGGAAGACTAACCGACACCCCTGGAAGGGGTCGGGTGAATACCAATGGACACCTCAGTGATGGTCCTGA
AACTAGGAGACTTTCAAGTTCCTCTGATTTGGGCGGGAGGAGACCTGTGAAGGCTTCTCCAACTGCATCAGAAAGCAACGGATTTGGGAGGTCTATTTCAAAGAAATCAC
TTGACATGGCCATCAGACATATGGATATAAGAAATGGCCCAGGGAGCATGCGCGCAGGTTCAGGCAACACTCTATTTCCACACAGCATCCGATCGGCCACTTCCAAAACT
CAGTCCATTGCTTCAAGCAACTCCGAGGCAATCGATACCGACTTCCAATCGAGCAGTAACATGGAGAGAGGAAACCATTTTCTTAGACCCTCTGCAGTAAACGGAACCGA
AGGAGGAGGAGAGAATGGAAGATTCTCTGCAAGCTTGAATCATTTGGACATCTATGAAAGCTCCCGTTATGATGCAATATTGCTGAAAGAGGACTTGAAAAACACGAATT
GGCTGCACAGCGCAGATGATAAAACCGATTTGGGTTCCATTTTGGATAATGGATTTGAAGCTCTGCCTGAGCCTTTTGGCCTCTTATAA
Protein sequenceShow/hide protein sequence
MNRNWREPLAGARNAPLLSQHRRGHSFTGIARDSDENLDLFSKNRRSLSVAASDDSSDGNTPFRLPSSHLFLVNRGGFVSIGVMSLDLRFLNPCVVLNSGWDPFAVPLGS
FLIHVVLVVCCLASSVVKLFDLVLMSASVKLGRLSVGSVKMAKSGIDDLLSSTEGGKHDYDWLLTPPGTPLFPSSSESEVQSTVAAPRSSTLARSSSTTKASRLSVSHSE
SNNPSRPARSSSVSRSSVSTPQYNSYSSNRSSSILNTSSASVSSYIRPSSPSTRNSSTARPSTPSSRSTPSRSSTPSRARPSPTSPSIDKPRQIQSSRPSTPSSRPQIPA
NLSSPAARSNSRPSTPTRRNSAPSLSSIVSTPSSTGRVLSTNGRSSTSTSRPSSPSPRVRAAPQPIVPPDFPLDTPPNLRTTLPDRPISAGRSRPTPAASVRGSPEPTST
VTMPRRAASPTVSRGRLTDTPGRGRVNTNGHLSDGPETRRLSSSSDLGGRRPVKASPTASESNGFGRSISKKSLDMAIRHMDIRNGPGSMRAGSGNTLFPHSIRSATSKT
QSIASSNSEAIDTDFQSSSNMERGNHFLRPSAVNGTEGGGENGRFSASLNHLDIYESSRYDAILLKEDLKNTNWLHSADDKTDLGSILDNGFEALPEPFGLL