; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

PI0019792 (gene) of Melon (PI 482460) v1 genome

Gene IDPI0019792
OrganismCucumis metuliferus PI 482460 (Melon (PI 482460) v1)
Descriptionprotein CHUP1, chloroplastic
Genome locationchr10:20119001..20125348
RNA-Seq ExpressionPI0019792
SyntenyPI0019792
Gene Ontology termsGO:0009658 - chloroplast organization (biological process)
GO:0009707 - chloroplast outer membrane (cellular component)
GO:0016021 - integral component of membrane (cellular component)
InterPro domainsIPR040265 - Protein CHUP1-like


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0034521.1 protein CHUP1 [Cucumis melo var. makuwa]0.0e+0098.18Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEID SK EKDRVYETEMANN SELERLR+LVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEE AQ AAVKK+LEFARNKIKELQRQIQLDANQTKG LLLLKQQVSGLQAKEQET+KKDAELEK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGKISARDL+KNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        LSSPARSFSGGSP RMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQE L SPGTPNLPSIRTQT NDSLNSVASSF LMSKSVEGVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQLKERADQARAEKFGNIS+SNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

XP_008446543.1 PREDICTED: protein CHUP1, chloroplastic [Cucumis melo]0.0e+0098.18Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEID SK EKDRVYETEMANN SELERLR+LVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEE AQ AAVKK+LEFARNKIKELQRQIQLDANQTKG LLLLKQQVSGLQAKEQET+KKDAELEK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGKISARDL+KNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        LSSPARSFSGGSP RMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQE L SPGTPNLPSIRTQT NDSLNSVASSF LMSKSVEGVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQLKERADQARAEKFGNIS+SNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

XP_011655756.1 protein CHUP1, chloroplastic [Cucumis sativus]0.0e+0098.39Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITED+DILPEFENLLSGEIEFPLPEIDDSK EKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQ+KEQETIKKDAELEK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVA+TREQV+NLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGKISARDL+KNLSPKSQEKAKQLM+EYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        LSSPARSFSGGSP RMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQE LDSPGTPNLPSIRTQT NDSLNSV+SSFQLMSKSVEGVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQLKERADQARAEKFGN+SNSNLNSEFKGKTE+DRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKR+TTFVDDPKLS
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

XP_022956771.1 protein CHUP1, chloroplastic-like [Cucurbita moschata]0.0e+0094.42Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITEDE+ILPEFE+LLSGEIEFPLPEIDD+K  KDR YETEMANNASELERLR+LVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESD+TELQRQLKIK VEIDMLNITISS QAERKKLQEEIAQ A VKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE+EK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAEN+ISTLSNMTESE+V++TRE+VNNLRH NEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGK+SARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESN+SQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        +SSPARSFSGGSPSRMSMSQKPRGPLE+LMLRN SDSVAIT+FGTMEQE+ DSPGTPNLPSIRTQT NDSLNSVASSFQLMSKSV GVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQ+KERADQARAE+FGNISNSNLN EFKGKTERDRPV+LPPKL+QIKEKPVV S  AD SGENK  ES AISRMKLAEIEKRPPR PKPPP+P
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        S GASVSTNPNP+GGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSL+KG GGDKVHRAPELVEFYQ+LMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFV+SLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVD+PKL 
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

XP_038891422.1 protein CHUP1, chloroplastic [Benincasa hispida]0.0e+0097.21Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFE+LLSGEIEFPLPEIDDSK EKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESDI ELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAV+ELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELV++TREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGK+SARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
         SSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQE+ DSPGTPNLPSIRTQT NDSLNSVASSFQLMSKS+EGVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQ+KERADQARAE+FGNISNSNLNSEFKGKTERDRP+ LPPKLTQIKEKPVV SV  DAS ENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        S GASV+TNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKG GGDKVHRAPELVEFYQTLMKREAKKDTPLLSS SSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIG+DNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

TrEMBL top hitse value%identityAlignment
A0A0A0KR09 Uncharacterized protein0.0e+0098.39Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITED+DILPEFENLLSGEIEFPLPEIDDSK EKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQ+KEQETIKKDAELEK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVA+TREQV+NLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGKISARDL+KNLSPKSQEKAKQLM+EYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        LSSPARSFSGGSP RMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQE LDSPGTPNLPSIRTQT NDSLNSV+SSFQLMSKSVEGVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQLKERADQARAEKFGN+SNSNLNSEFKGKTE+DRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKR+TTFVDDPKLS
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

A0A1S3BFA3 protein CHUP1, chloroplastic0.0e+0098.18Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEID SK EKDRVYETEMANN SELERLR+LVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEE AQ AAVKK+LEFARNKIKELQRQIQLDANQTKG LLLLKQQVSGLQAKEQET+KKDAELEK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGKISARDL+KNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        LSSPARSFSGGSP RMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQE L SPGTPNLPSIRTQT NDSLNSVASSF LMSKSVEGVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQLKERADQARAEKFGNIS+SNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

A0A5A7SYJ4 Protein CHUP10.0e+0098.18Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEID SK EKDRVYETEMANN SELERLR+LVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEE AQ AAVKK+LEFARNKIKELQRQIQLDANQTKG LLLLKQQVSGLQAKEQET+KKDAELEK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGKISARDL+KNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        LSSPARSFSGGSP RMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQE L SPGTPNLPSIRTQT NDSLNSVASSF LMSKSVEGVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQLKERADQARAEKFGNIS+SNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

A0A6J1GXF9 protein CHUP1, chloroplastic-like0.0e+0094.42Show/hide
Query:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ
        GEEEEEEEVKLISSVFDQVPVYITEDE+ILPEFE+LLSGEIEFPLPEIDD+K  KDR YETEMANNASELERLR+LVKELEEREVKLEGELLEYYGLKEQ
Subjt:  GEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQ

Query:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK
        ESD+TELQRQLKIK VEIDMLNITISS QAERKKLQEEIAQ A VKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE+EK
Subjt:  ESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEK

Query:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
        KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAEN+ISTLSNMTESE+V++TRE+VNNLRH NEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE
Subjt:  KLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYE

Query:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST
        LRNYQAPTGK+SARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESN+SQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS 
Subjt:  LRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSST

Query:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH
        +SSPARSFSGGSPSRMSMSQKPRGPLE+LMLRN SDSVAIT+FGTMEQE+ DSPGTPNLPSIRTQT NDSLNSVASSFQLMSKSV GVLDEKYPAYKDRH
Subjt:  LSSPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRH

Query:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP
        KLALAREKQ+KERADQARAE+FGNISNSNLN EFKGKTERDRPV+LPPKL+QIKEKPVV S  AD SGENK  ES AISRMKLAEIEKRPPR PKPPP+P
Subjt:  KLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRP

Query:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI
        S GASVSTNPNP+GGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSL+KG GGDKVHRAPELVEFYQ+LMKREAKKDTPLLSSTSSNVSDARSNMIGEI
Subjt:  SGGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEI

Query:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS
        ENRSSFLIAVKADVETQGDFV+SLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVD+PKL 
Subjt:  ENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLS

Query:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
        CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF
Subjt:  CEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQF

Query:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
        AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  AGGFDAESMKAFEELRSRVHTTQIGDDNKQEA

A0A6J1KQX9 protein CHUP1, chloroplastic-like0.0e+0094.41Show/hide
Query:  EEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQES
        EEEEEEVKLISSVFDQVPVYITEDE+ILPEFE+LLSGEIEFPLPEIDD+K  KDR YETEMANNASELERLR+LVKELEEREVKLEGELLEYYGLKEQES
Subjt:  EEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGLKEQES

Query:  DITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEKKL
        D+TELQRQLKIK VEIDMLNITISS QAERKKLQEEIAQ A VKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE+EKKL
Subjt:  DITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEKKL

Query:  KAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYELR
        KAVKELEVEVMELKRKNKELQIEKRELTIKLDAAEN+ISTLSNMTESELV++TRE VNNLRH NEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYELR
Subjt:  KAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYELR

Query:  NYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSSTLS
        NYQAPTGK+SARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESN+SQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSS +S
Subjt:  NYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSSTLS

Query:  SPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRHKL
        SPARSFSGGSPSRMSMSQKPRGPLE+LMLRN SDSVAIT+FGTMEQE+ DSPGTPNLPSIRTQT NDSLNSVASSFQLMSKSV GVLDEKYPAYKDRHKL
Subjt:  SPARSFSGGSPSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRHKL

Query:  ALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRPSG
        ALAREKQ+KERADQARAE+FGNISNSNLN EFKGKTERDRPV+LPPKL+QIKEKPVV S  AD SGENK  ES  ISRMKLAEIEKRPPR PKPPP+PS 
Subjt:  ALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRPSG

Query:  GASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEIEN
        GASVSTNPNP+GGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSL+KG GGDKVHRAPELVEFYQ+LMKREAKKDTPLLSSTSSNVSDARSNMIGEIEN
Subjt:  GASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEIEN

Query:  RSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCE
        RSSFLIAVKADVETQGDFV+SLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVD+PKL CE
Subjt:  RSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCE

Query:  AALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAG
        AALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAG
Subjt:  AALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAG

Query:  GFDAESMKAFEELRSRVHTTQIGDDNKQEA
        GFDAESMKAFEELRSRVHTTQIGDDNKQEA
Subjt:  GFDAESMKAFEELRSRVHTTQIGDDNKQEA

SwissProt top hitse value%identityAlignment
Q9LI74 Protein CHUP1, chloroplastic0.0e+0073.63Show/hide
Query:  EEEEEEEVKLISSVFDQVPVYITE--DEDILPEFENLLSGEIEFPLPEIDDS--KVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGL
        EEEEEEEVKLI+SV +Q     ++  D+DILPEFE+LLSGEIE+PLP+ D++  K EK+R YE EMA N  ELERL+ LVKELEEREVKLEGELLEYYGL
Subjt:  EEEEEEEVKLISSVFDQVPVYITE--DEDILPEFENLLSGEIEFPLPEIDDS--KVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGL

Query:  KEQESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE
        KEQESDI ELQRQLKIK VEIDMLNITI+SLQAERKKLQEE++Q+  V+KELE ARNKIKELQRQIQLDANQTKGQLLLLKQ VS LQ KE+E + KD E
Subjt:  KEQESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE

Query:  LEKKLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACL
        +E+KLKAV++LEV+VMELKRKN+ELQ EKREL+IKLD+AE +I+TLSNMTES+ VA+ RE+VNNL+H NEDL+KQVEGLQMNRFSEVEELVYLRWVNACL
Subjt:  LEKKLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACL

Query:  RYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDD
        RYELRNYQ P GKISARDL+KNLSPKSQ KAK+LMLEYAGSERGQGDTDLESNYSQPSSPGS+DFDNAS+DSS SR+SS SKKP LIQKLKKW G+SKDD
Subjt:  RYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDD

Query:  SSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEK
        SS  SSP+RSF GGSP R+S S  K RGPLESLM+RNA +SVAITTFG ++QE   +P TPNLP IRTQ    +  + LNSVA+SF +MSKSV+ VLDEK
Subjt:  SSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEK

Query:  YPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRM
        YPAYKDRHKLA+ REK +K +ADQARAE+FG                    V LPPKL Q+KEK  VVPSV          ++ S E K +E+ A +++M
Subjt:  YPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRM

Query:  KLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGVPAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD
        KL +IEKRPPR P+PPPR +GG   +  P+ +  +P    PP PPPP G PPPPP GGPP PPPPPG+L +GA GG+KVHRAPELVEFYQ+LMKRE+KK+
Subjt:  KLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGVPAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD

Query:  --TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREA
            L+SS + N S AR+NMIGEIENRS+FL+AVKADVETQGDFV SLA EVRA++F++IED++AFV+WLDEELSFLVDERAVLKHFDWPEGKADALREA
Subjt:  --TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREA

Query:  SFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSE
        +FEYQDLMKLEK+VT+FVDDP LSCE ALKKMY LLEKVEQSVYALLRTRDMAISRY+EFGIPVDWLSDTGVVGKIKLSSVQLA+KYMKRVA ELD++S 
Subjt:  SFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSE

Query:  PEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRVHTTQIGDDN
         +K+PNREFL+LQGVRFAFRVHQFAGGFDAESMKAFEELRSR   T+ GD+N
Subjt:  PEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRVHTTQIGDDN

Arabidopsis top hitse value%identityAlignment
AT1G48280.1 hydroxyproline-rich glycoprotein family protein3.2e-6733.16Show/hide
Query:  SNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSSTLSSPARSFSGGSPSRMSMSQKPRGPL-----ESLMLRNASDSVAITTF
        S+YS  S P ++D +  +     S    +   P+  + +     +S ++   + +P R+ S   P+ +     PR P+     E++M   A++       
Subjt:  SNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSSTLSSPARSFSGGSPSRMSMSQKPRGPL-----ESLMLRNASDSVAITTF

Query:  GTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRP
          +E++L+ +                   S+    QL   +++  L+E   A     +L L   ++L +    A A+     SN     E +    +D  
Subjt:  GTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRP

Query:  VMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRPS--GGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRP
         ++  KL Q K K  V                 A+   +L+     P R P  PP P      + S     +   P APP PPPPP             P
Subjt:  VMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRPS--GGASVSTNPNPQGGVPAAPPLPPPPPGAPPPPPTGGPPRP

Query:  PPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKD-TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVV
        PPPP  L+K A   +  ++P + + +Q L K++  ++ +  ++   S V+ A ++++GEI+NRS+ LIA+KAD+ET+G+F+  L  +V    FS++EDV+
Subjt:  PPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKD-TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVV

Query:  AFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPV
         FV+WLD+EL+ L DERAVLKHF WPE KAD L+EA+ EY++L KLEK ++++ DDP +    ALKKM +LL+K EQ +  L+R R  ++  Y++F IPV
Subjt:  AFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPV

Query:  DWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRV
        +W+ D+G++ KIK +S++LA+ YM RVA+EL +    ++E  +E L+LQGVRFA+R HQFAGG D E++ A EE++ RV
Subjt:  DWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRV

AT3G25690.1 Hydroxyproline-rich glycoprotein family protein0.0e+0073.63Show/hide
Query:  EEEEEEEVKLISSVFDQVPVYITE--DEDILPEFENLLSGEIEFPLPEIDDS--KVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGL
        EEEEEEEVKLI+SV +Q     ++  D+DILPEFE+LLSGEIE+PLP+ D++  K EK+R YE EMA N  ELERL+ LVKELEEREVKLEGELLEYYGL
Subjt:  EEEEEEEVKLISSVFDQVPVYITE--DEDILPEFENLLSGEIEFPLPEIDDS--KVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGL

Query:  KEQESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE
        KEQESDI ELQRQLKIK VEIDMLNITI+SLQAERKKLQEE++Q+  V+KELE ARNKIKELQRQIQLDANQTKGQLLLLKQ VS LQ KE+E + KD E
Subjt:  KEQESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE

Query:  LEKKLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACL
        +E+KLKAV++LEV+VMELKRKN+ELQ EKREL+IKLD+AE +I+TLSNMTES+ VA+ RE+VNNL+H NEDL+KQVEGLQMNRFSEVEELVYLRWVNACL
Subjt:  LEKKLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACL

Query:  RYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDD
        RYELRNYQ P GKISARDL+KNLSPKSQ KAK+LMLEYAGSERGQGDTDLESNYSQPSSPGS+DFDNAS+DSS SR+SS SKKP LIQKLKKW G+SKDD
Subjt:  RYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDD

Query:  SSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEK
        SS  SSP+RSF GGSP R+S S  K RGPLESLM+RNA +SVAITTFG ++QE   +P TPNLP IRTQ    +  + LNSVA+SF +MSKSV+ VLDEK
Subjt:  SSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEK

Query:  YPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRM
        YPAYKDRHKLA+ REK +K +ADQARAE+FG                    V LPPKL Q+KEK  VVPSV          ++ S E K +E+ A +++M
Subjt:  YPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRM

Query:  KLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGVPAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD
        KL +IEKRPPR P+PPPR +GG   +  P+ +  +P    PP PPPP G PPPPP GGPP PPPPPG+L +GA GG+KVHRAPELVEFYQ+LMKRE+KK+
Subjt:  KLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGVPAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD

Query:  --TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREA
            L+SS + N S AR+NMIGEIENRS+FL+AVKADVETQGDFV SLA EVRA++F++IED++AFV+WLDEELSFLVDERAVLKHFDWPEGKADALREA
Subjt:  --TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREA

Query:  SFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSE
        +FEYQDLMKLEK+VT+FVDDP LSCE ALKKMY LLEKVEQSVYALLRTRDMAISRY+EFGIPVDWLSDTGVVGKIKLSSVQLA+KYMKRVA ELD++S 
Subjt:  SFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSE

Query:  PEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRVHTTQIGDDN
         +K+PNREFL+LQGVRFAFRVHQFAGGFDAESMKAFEELRSR   T+ GD+N
Subjt:  PEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRVHTTQIGDDN

AT3G25690.2 Hydroxyproline-rich glycoprotein family protein0.0e+0073.63Show/hide
Query:  EEEEEEEVKLISSVFDQVPVYITE--DEDILPEFENLLSGEIEFPLPEIDDS--KVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGL
        EEEEEEEVKLI+SV +Q     ++  D+DILPEFE+LLSGEIE+PLP+ D++  K EK+R YE EMA N  ELERL+ LVKELEEREVKLEGELLEYYGL
Subjt:  EEEEEEEVKLISSVFDQVPVYITE--DEDILPEFENLLSGEIEFPLPEIDDS--KVEKDRVYETEMANNASELERLRNLVKELEEREVKLEGELLEYYGL

Query:  KEQESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE
        KEQESDI ELQRQLKIK VEIDMLNITI+SLQAERKKLQEE++Q+  V+KELE ARNKIKELQRQIQLDANQTKGQLLLLKQ VS LQ KE+E + KD E
Subjt:  KEQESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAE

Query:  LEKKLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACL
        +E+KLKAV++LEV+VMELKRKN+ELQ EKREL+IKLD+AE +I+TLSNMTES+ VA+ RE+VNNL+H NEDL+KQVEGLQMNRFSEVEELVYLRWVNACL
Subjt:  LEKKLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACL

Query:  RYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDD
        RYELRNYQ P GKISARDL+KNLSPKSQ KAK+LMLEYAGSERGQGDTDLESNYSQPSSPGS+DFDNAS+DSS SR+SS SKKP LIQKLKKW G+SKDD
Subjt:  RYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDD

Query:  SSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEK
        SS  SSP+RSF GGSP R+S S  K RGPLESLM+RNA +SVAITTFG ++QE   +P TPNLP IRTQ    +  + LNSVA+SF +MSKSV+ VLDEK
Subjt:  SSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEK

Query:  YPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRM
        YPAYKDRHKLA+ REK +K +ADQARAE+FG                    V LPPKL Q+KEK  VVPSV          ++ S E K +E+ A +++M
Subjt:  YPAYKDRHKLALAREKQLKERADQARAEKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRM

Query:  KLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGVPAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD
        KL +IEKRPPR P+PPPR +GG   +  P+ +  +P    PP PPPP G PPPPP GGPP PPPPPG+L +GA GG+KVHRAPELVEFYQ+LMKRE+KK+
Subjt:  KLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGVPAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD

Query:  --TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREA
            L+SS + N S AR+NMIGEIENRS+FL+AVKADVETQGDFV SLA EVRA++F++IED++AFV+WLDEELSFLVDERAVLKHFDWPEGKADALREA
Subjt:  --TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREA

Query:  SFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSE
        +FEYQDLMKLEK+VT+FVDDP LSCE ALKKMY LLEKVEQSVYALLRTRDMAISRY+EFGIPVDWLSDTGVVGKIKLSSVQLA+KYMKRVA ELD++S 
Subjt:  SFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSE

Query:  PEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRVHTTQIGDDN
         +K+PNREFL+LQGVRFAFRVHQFAGGFDAESMKAFEELRSR   T+ GD+N
Subjt:  PEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRVHTTQIGDDN

AT3G25690.3 Hydroxyproline-rich glycoprotein family protein3.0e-30773.19Show/hide
Query:  KKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEKKLKAVKELEVEVMELKRKNKELQIEKRELTIK
        K LQEE++Q+  V+KELE ARNKIKELQRQIQLDANQTKGQLLLLKQ VS LQ KE+E + KD E+E+KLKAV++LEV+VMELKRKN+ELQ EKREL+IK
Subjt:  KKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETIKKDAELEKKLKAVKELEVEVMELKRKNKELQIEKRELTIK

Query:  LDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLM
        LD+AE +I+TLSNMTES+ VA+ RE+VNNL+H NEDL+KQVEGLQMNRFSEVEELVYLRWVNACLRYELRNYQ P GKISARDL+KNLSPKSQ KAK+LM
Subjt:  LDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYELRNYQAPTGKISARDLNKNLSPKSQEKAKQLM

Query:  LEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLML
        LEYAGSERGQGDTDLESNYSQPSSPGS+DFDNAS+DSS SR+SS SKKP LIQKLKKW G+SKDDSS  SSP+RSF GGSP R+S S  K RGPLESLM+
Subjt:  LEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSSTLSSPARSFSGGSPSRMSMS-QKPRGPLESLML

Query:  RNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRHKLALAREKQLKERADQARAEKFGNISN
        RNA +SVAITTFG ++QE   +P TPNLP IRTQ    +  + LNSVA+SF +MSKSV+ VLDEKYPAYKDRHKLA+ REK +K +ADQARAE+FG    
Subjt:  RNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQ----TSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRHKLALAREKQLKERADQARAEKFGNISN

Query:  SNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRMKLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGV
                        V LPPKL Q+KEK  VVPSV          ++ S E K +E+ A +++MKL +IEKRPPR P+PPPR +GG   +  P+ +  +
Subjt:  SNLNSEFKGKTERDRPVMLPPKLTQIKEK-PVVPSV---------TADASGENKTTESPA-ISRMKLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGV

Query:  PAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD--TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVK
        P    PP PPPP G PPPPP GGPP PPPPPG+L +GA GG+KVHRAPELVEFYQ+LMKRE+KK+    L+SS + N S AR+NMIGEIENRS+FL+AVK
Subjt:  PAA--PPLPPPPPGAPPPPPTGGPPRPPPPPGSLSKGA-GGDKVHRAPELVEFYQTLMKREAKKD--TPLLSSTSSNVSDARSNMIGEIENRSSFLIAVK

Query:  ADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSL
        ADVETQGDFV SLA EVRA++F++IED++AFV+WLDEELSFLVDERAVLKHFDWPEGKADALREA+FEYQDLMKLEK+VT+FVDDP LSCE ALKKMY L
Subjt:  ADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSL

Query:  LEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKA
        LEKVEQSVYALLRTRDMAISRY+EFGIPVDWLSDTGVVGKIKLSSVQLA+KYMKRVA ELD++S  +K+PNREFL+LQGVRFAFRVHQFAGGFDAESMKA
Subjt:  LEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKA

Query:  FEELRSRVHTTQIGDDN
        FEELRSR   T+ GD+N
Subjt:  FEELRSRVHTTQIGDDN

AT4G18570.1 Tetratricopeptide repeat (TPR)-like superfamily protein5.2e-8648.33Show/hide
Query:  EKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRPSGGASVST----NPNPQGG
        E   N  N+N +    G  + D           I  K  + S +  ++ E  T  S       L+ +  R PR PKPPP+ S     ST    +P PQ  
Subjt:  EKFGNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRPSGGASVST----NPNPQGG

Query:  VPAAPPLPPPPPGAPPPPP---TGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKRE---AKKDTPLLSSTSSNVSDARSN---MIGEIENRSSF
        +P  PP PPPP    PPPP   +  PP PPPPP   S      KV R PE+VEFY +LM+R+   +++D+    + ++    A SN   MIGEIENRS +
Subjt:  VPAAPPLPPPPPGAPPPPP---TGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKRE---AKKDTPLLSSTSSNVSDARSN---MIGEIENRSSF

Query:  LIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCEAALK
        L+A+K DVETQGDF+  L  EV  A FS+IEDVV FV WLD+ELS+LVDERAVLKHF+WPE KADALREA+F Y DL KL    + F +DP+ S  +ALK
Subjt:  LIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAFVNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCEAALK

Query:  KMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAGGFDA
        KM +L EK+E  VY+L R R+ A ++++ F IPVDW+ +TG+  +IKL+SV+LA KYMKRV++EL+A+      P  E L++QGVRFAFRVHQFAGGFDA
Subjt:  KMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKIKLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAGGFDA

Query:  ESMKAFEELRSRVHTTQI
        E+MKAFEELR +  +  +
Subjt:  ESMKAFEELRSRVHTTQI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCATCGTTCCATTGCAGCAAGGCGGCTCAAAATTAAATTTTCAGCCTTGCTTTTGCTTCTCAAACCTACCCTTCTACGCATCGGGGAGGAAGAGGAGGAAGAAGAAGT
CAAGTTAATTAGTAGCGTATTTGATCAAGTTCCTGTTTATATAACTGAAGATGAAGACATTTTACCTGAATTTGAAAACCTTCTATCCGGGGAGATTGAATTTCCATTAC
CTGAAATTGATGACAGTAAAGTTGAGAAGGATAGAGTATATGAAACCGAGATGGCAAATAATGCAAGTGAACTGGAGCGATTACGCAACTTGGTAAAGGAATTGGAGGAG
AGGGAAGTAAAGCTTGAAGGTGAATTGCTTGAATATTATGGATTGAAAGAACAGGAATCTGACATTACAGAGTTACAGAGGCAGCTGAAGATTAAGGCAGTAGAGATTGA
TATGCTTAATATTACCATTAGCTCTTTGCAGGCTGAAAGGAAGAAGCTTCAAGAAGAGATTGCACAAGATGCTGCAGTGAAGAAGGAGTTGGAATTTGCAAGGAATAAGA
TCAAAGAGCTGCAGAGGCAGATTCAGCTTGATGCTAACCAAACAAAAGGCCAGCTATTATTACTCAAGCAACAAGTTTCTGGTTTACAGGCAAAGGAGCAAGAAACTATA
AAGAAAGATGCTGAACTAGAAAAGAAGTTGAAAGCTGTGAAGGAATTGGAGGTTGAAGTTATGGAACTCAAGCGGAAGAACAAAGAGCTTCAAATTGAAAAGCGGGAGTT
GACTATTAAACTGGATGCTGCTGAAAATAAAATCTCAACTCTGTCCAACATGACAGAAAGTGAATTGGTAGCCGAGACTAGAGAGCAAGTCAATAATTTAAGGCATGCAA
ATGAGGACTTAATAAAGCAAGTTGAAGGACTTCAGATGAATAGGTTCAGTGAAGTTGAAGAATTAGTATACCTTCGATGGGTCAATGCATGCTTAAGATATGAACTTCGC
AATTACCAGGCTCCTACAGGAAAAATATCAGCTCGTGATCTCAACAAGAATTTGAGCCCAAAATCGCAGGAGAAAGCTAAGCAACTCATGTTGGAGTATGCAGGATCAGA
ACGTGGACAAGGGGACACAGATCTTGAAAGCAACTACTCTCAACCGTCTTCTCCTGGAAGTGAGGATTTTGACAATGCTTCAATTGATAGTTCCTTTAGTAGATATAGTA
GTCTCAGTAAGAAACCTAGCTTGATTCAGAAGTTGAAGAAGTGGGGTGGTAGAAGCAAAGATGATTCTAGTACTCTTTCATCACCTGCCAGATCCTTCTCTGGAGGTTCT
CCTAGCAGGATGAGCATGAGTCAAAAGCCTAGGGGTCCATTAGAATCGTTGATGCTTAGAAATGCAAGTGATAGTGTTGCAATCACCACCTTTGGTACGATGGAACAGGA
ACTTCTTGACTCTCCAGGCACTCCAAATCTCCCAAGTATCAGAACTCAAACTTCTAATGACTCCTTGAATTCAGTAGCATCATCATTCCAACTAATGTCTAAATCTGTTG
AAGGAGTATTAGATGAGAAATATCCAGCATACAAAGACCGACATAAGTTGGCATTAGCACGAGAGAAGCAACTTAAGGAAAGGGCGGACCAGGCGAGAGCAGAGAAGTTT
GGCAATATTTCAAATTCGAACTTGAATTCTGAATTTAAAGGTAAAACTGAGAGAGATAGACCTGTAATGTTGCCTCCAAAACTTACTCAAATAAAGGAAAAACCAGTTGT
ACCTAGTGTTACTGCTGATGCATCTGGTGAAAATAAAACGACGGAGTCTCCAGCGATCAGCAGGATGAAGCTAGCAGAGATTGAGAAGCGGCCTCCAAGGACACCTAAGC
CACCACCAAGACCATCAGGAGGTGCTTCTGTAAGCACAAATCCCAATCCTCAGGGTGGTGTACCAGCTGCTCCACCTCTACCACCTCCACCTCCTGGTGCCCCACCACCT
CCTCCAACTGGTGGACCACCTCGTCCGCCTCCTCCTCCAGGAAGCTTGTCTAAAGGTGCAGGTGGTGATAAGGTTCATAGAGCTCCTGAGTTAGTTGAGTTCTATCAGAC
ATTGATGAAACGAGAAGCAAAGAAGGACACTCCTTTACTTTCTTCTACGTCATCTAATGTATCTGATGCTAGAAGTAACATGATTGGGGAGATTGAGAATAGGTCATCGT
TCCTCATAGCGGTAAAAGCAGATGTGGAAACCCAAGGTGATTTTGTCATGTCATTGGCAGCTGAAGTTCGAGCAGCTACGTTCTCTAATATAGAGGATGTTGTGGCCTTC
GTAAATTGGTTAGATGAAGAGCTATCATTCTTGGTTGATGAAAGGGCAGTCCTGAAGCATTTTGATTGGCCAGAAGGAAAAGCAGATGCATTGAGAGAGGCATCTTTTGA
ATATCAGGACCTTATGAAGTTGGAGAAGCGGGTCACGACGTTTGTTGATGACCCTAAACTCTCATGTGAAGCAGCTTTAAAGAAAATGTACTCCTTGCTGGAGAAGGTTG
AGCAGAGTGTCTATGCACTCCTGCGCACAAGAGACATGGCTATCTCGCGATATAGAGAGTTCGGAATTCCAGTTGATTGGTTGTCTGATACAGGAGTTGTTGGAAAGATT
AAGCTTTCATCTGTACAATTAGCAAGGAAATACATGAAGCGAGTAGCATCAGAACTTGATGCAATGAGTGAACCAGAGAAGGAGCCAAACAGAGAATTTTTGGTCTTGCA
AGGGGTCCGATTTGCTTTCCGTGTTCACCAGTTCGCGGGAGGCTTCGATGCAGAGAGCATGAAAGCTTTTGAAGAGCTGAGGAGCCGAGTTCATACAACACAGATAGGAG
ATGATAATAAGCAAGAAGCCTGA
mRNA sequenceShow/hide mRNA sequence
ATGCATCGTTCCATTGCAGCAAGGCGGCTCAAAATTAAATTTTCAGCCTTGCTTTTGCTTCTCAAACCTACCCTTCTACGCATCGGGGAGGAAGAGGAGGAAGAAGAAGT
CAAGTTAATTAGTAGCGTATTTGATCAAGTTCCTGTTTATATAACTGAAGATGAAGACATTTTACCTGAATTTGAAAACCTTCTATCCGGGGAGATTGAATTTCCATTAC
CTGAAATTGATGACAGTAAAGTTGAGAAGGATAGAGTATATGAAACCGAGATGGCAAATAATGCAAGTGAACTGGAGCGATTACGCAACTTGGTAAAGGAATTGGAGGAG
AGGGAAGTAAAGCTTGAAGGTGAATTGCTTGAATATTATGGATTGAAAGAACAGGAATCTGACATTACAGAGTTACAGAGGCAGCTGAAGATTAAGGCAGTAGAGATTGA
TATGCTTAATATTACCATTAGCTCTTTGCAGGCTGAAAGGAAGAAGCTTCAAGAAGAGATTGCACAAGATGCTGCAGTGAAGAAGGAGTTGGAATTTGCAAGGAATAAGA
TCAAAGAGCTGCAGAGGCAGATTCAGCTTGATGCTAACCAAACAAAAGGCCAGCTATTATTACTCAAGCAACAAGTTTCTGGTTTACAGGCAAAGGAGCAAGAAACTATA
AAGAAAGATGCTGAACTAGAAAAGAAGTTGAAAGCTGTGAAGGAATTGGAGGTTGAAGTTATGGAACTCAAGCGGAAGAACAAAGAGCTTCAAATTGAAAAGCGGGAGTT
GACTATTAAACTGGATGCTGCTGAAAATAAAATCTCAACTCTGTCCAACATGACAGAAAGTGAATTGGTAGCCGAGACTAGAGAGCAAGTCAATAATTTAAGGCATGCAA
ATGAGGACTTAATAAAGCAAGTTGAAGGACTTCAGATGAATAGGTTCAGTGAAGTTGAAGAATTAGTATACCTTCGATGGGTCAATGCATGCTTAAGATATGAACTTCGC
AATTACCAGGCTCCTACAGGAAAAATATCAGCTCGTGATCTCAACAAGAATTTGAGCCCAAAATCGCAGGAGAAAGCTAAGCAACTCATGTTGGAGTATGCAGGATCAGA
ACGTGGACAAGGGGACACAGATCTTGAAAGCAACTACTCTCAACCGTCTTCTCCTGGAAGTGAGGATTTTGACAATGCTTCAATTGATAGTTCCTTTAGTAGATATAGTA
GTCTCAGTAAGAAACCTAGCTTGATTCAGAAGTTGAAGAAGTGGGGTGGTAGAAGCAAAGATGATTCTAGTACTCTTTCATCACCTGCCAGATCCTTCTCTGGAGGTTCT
CCTAGCAGGATGAGCATGAGTCAAAAGCCTAGGGGTCCATTAGAATCGTTGATGCTTAGAAATGCAAGTGATAGTGTTGCAATCACCACCTTTGGTACGATGGAACAGGA
ACTTCTTGACTCTCCAGGCACTCCAAATCTCCCAAGTATCAGAACTCAAACTTCTAATGACTCCTTGAATTCAGTAGCATCATCATTCCAACTAATGTCTAAATCTGTTG
AAGGAGTATTAGATGAGAAATATCCAGCATACAAAGACCGACATAAGTTGGCATTAGCACGAGAGAAGCAACTTAAGGAAAGGGCGGACCAGGCGAGAGCAGAGAAGTTT
GGCAATATTTCAAATTCGAACTTGAATTCTGAATTTAAAGGTAAAACTGAGAGAGATAGACCTGTAATGTTGCCTCCAAAACTTACTCAAATAAAGGAAAAACCAGTTGT
ACCTAGTGTTACTGCTGATGCATCTGGTGAAAATAAAACGACGGAGTCTCCAGCGATCAGCAGGATGAAGCTAGCAGAGATTGAGAAGCGGCCTCCAAGGACACCTAAGC
CACCACCAAGACCATCAGGAGGTGCTTCTGTAAGCACAAATCCCAATCCTCAGGGTGGTGTACCAGCTGCTCCACCTCTACCACCTCCACCTCCTGGTGCCCCACCACCT
CCTCCAACTGGTGGACCACCTCGTCCGCCTCCTCCTCCAGGAAGCTTGTCTAAAGGTGCAGGTGGTGATAAGGTTCATAGAGCTCCTGAGTTAGTTGAGTTCTATCAGAC
ATTGATGAAACGAGAAGCAAAGAAGGACACTCCTTTACTTTCTTCTACGTCATCTAATGTATCTGATGCTAGAAGTAACATGATTGGGGAGATTGAGAATAGGTCATCGT
TCCTCATAGCGGTAAAAGCAGATGTGGAAACCCAAGGTGATTTTGTCATGTCATTGGCAGCTGAAGTTCGAGCAGCTACGTTCTCTAATATAGAGGATGTTGTGGCCTTC
GTAAATTGGTTAGATGAAGAGCTATCATTCTTGGTTGATGAAAGGGCAGTCCTGAAGCATTTTGATTGGCCAGAAGGAAAAGCAGATGCATTGAGAGAGGCATCTTTTGA
ATATCAGGACCTTATGAAGTTGGAGAAGCGGGTCACGACGTTTGTTGATGACCCTAAACTCTCATGTGAAGCAGCTTTAAAGAAAATGTACTCCTTGCTGGAGAAGGTTG
AGCAGAGTGTCTATGCACTCCTGCGCACAAGAGACATGGCTATCTCGCGATATAGAGAGTTCGGAATTCCAGTTGATTGGTTGTCTGATACAGGAGTTGTTGGAAAGATT
AAGCTTTCATCTGTACAATTAGCAAGGAAATACATGAAGCGAGTAGCATCAGAACTTGATGCAATGAGTGAACCAGAGAAGGAGCCAAACAGAGAATTTTTGGTCTTGCA
AGGGGTCCGATTTGCTTTCCGTGTTCACCAGTTCGCGGGAGGCTTCGATGCAGAGAGCATGAAAGCTTTTGAAGAGCTGAGGAGCCGAGTTCATACAACACAGATAGGAG
ATGATAATAAGCAAGAAGCCTGA
Protein sequenceShow/hide protein sequence
MHRSIAARRLKIKFSALLLLLKPTLLRIGEEEEEEEVKLISSVFDQVPVYITEDEDILPEFENLLSGEIEFPLPEIDDSKVEKDRVYETEMANNASELERLRNLVKELEE
REVKLEGELLEYYGLKEQESDITELQRQLKIKAVEIDMLNITISSLQAERKKLQEEIAQDAAVKKELEFARNKIKELQRQIQLDANQTKGQLLLLKQQVSGLQAKEQETI
KKDAELEKKLKAVKELEVEVMELKRKNKELQIEKRELTIKLDAAENKISTLSNMTESELVAETREQVNNLRHANEDLIKQVEGLQMNRFSEVEELVYLRWVNACLRYELR
NYQAPTGKISARDLNKNLSPKSQEKAKQLMLEYAGSERGQGDTDLESNYSQPSSPGSEDFDNASIDSSFSRYSSLSKKPSLIQKLKKWGGRSKDDSSTLSSPARSFSGGS
PSRMSMSQKPRGPLESLMLRNASDSVAITTFGTMEQELLDSPGTPNLPSIRTQTSNDSLNSVASSFQLMSKSVEGVLDEKYPAYKDRHKLALAREKQLKERADQARAEKF
GNISNSNLNSEFKGKTERDRPVMLPPKLTQIKEKPVVPSVTADASGENKTTESPAISRMKLAEIEKRPPRTPKPPPRPSGGASVSTNPNPQGGVPAAPPLPPPPPGAPPP
PPTGGPPRPPPPPGSLSKGAGGDKVHRAPELVEFYQTLMKREAKKDTPLLSSTSSNVSDARSNMIGEIENRSSFLIAVKADVETQGDFVMSLAAEVRAATFSNIEDVVAF
VNWLDEELSFLVDERAVLKHFDWPEGKADALREASFEYQDLMKLEKRVTTFVDDPKLSCEAALKKMYSLLEKVEQSVYALLRTRDMAISRYREFGIPVDWLSDTGVVGKI
KLSSVQLARKYMKRVASELDAMSEPEKEPNREFLVLQGVRFAFRVHQFAGGFDAESMKAFEELRSRVHTTQIGDDNKQEA