; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmaCh04G006330 (gene) of Cucurbita maxima (Rimu) v1.1 genome

Gene IDCmaCh04G006330
OrganismCucurbita maxima Rimu (Cucurbita maxima (Rimu) v1.1)
DescriptionSerine/arginine repetitive matrix-like protein
Genome locationCma_Chr04:3249517..3250839
RNA-Seq ExpressionCmaCh04G006330
SyntenyCmaCh04G006330
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6600467.1 hypothetical protein SDJN03_05700, partial [Cucurbita argyrosperma subsp. sororia]3.3e-23197.05Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPE+VPVSEFEFRLQDPVALMLPADELFLNGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
        VPFQVSSVKPSVNVLKSMRCVS PETAAQ RR+VEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGS KTENHKTTSPSYASEANSKALRYLLH
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH

Query:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
        RRSKSSL SSF+SSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
Subjt:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP

Query:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
        TATRVGRSPMRPAPGESTRLAIRGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
Subjt:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ

Query:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH
        LFS TGTSGSSRSYQ SS SSSTNRTTTRRI+ETDGGGKLH
Subjt:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH

XP_022942648.1 uncharacterized protein LOC111447620 [Cucurbita moschata]1.1e-22996.37Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNL+GLITKPAADPAGESEIRDSDPE+VPVSEFEFRLQDPVALMLPADELFLNGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
        VPFQVSSVKPSVNVLKSMRCVS PETAAQ RR+VEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH

Query:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
        RRSKSSL SSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPN SNPPRMRQVKPRPKSEMNPRSTMDHHP
Subjt:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP

Query:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
        TATRVGRSPMRPAPGESTRLA+RGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVL+VPVCSSLRGSSKSVSVFGFGQ
Subjt:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ

Query:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH
        LFS TGTSGSSRSYQ SS SSSTNRTTTRRI+ETDGGGKLH
Subjt:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH

XP_022980895.1 uncharacterized protein LOC111480206 [Cucurbita maxima]1.9e-239100Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
        VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH

Query:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
        RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
Subjt:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP

Query:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
        TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
Subjt:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ

Query:  LFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIETDGGGKLH
        LFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIETDGGGKLH
Subjt:  LFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIETDGGGKLH

XP_023549710.1 uncharacterized protein LOC111808127 [Cucurbita pepo subsp. pepo]9.6e-23197.05Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGL+TKPAADPAGESEIRDSDPE+VPVSEFEFRLQDPVALMLPADELFLNGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
        VPF+VSSVKPSVNVLKSMRCVS PETAAQ RR+VEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH

Query:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
        RRSKSSL SSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHH 
Subjt:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP

Query:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
        TATRVGRSPMRPAPGESTRLAIRGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
Subjt:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ

Query:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH
        LFS TGTSGSSRSYQ SS SSSTNRTTTRRIIETDGGGKLH
Subjt:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH

XP_023551901.1 uncharacterized protein LOC111809733 [Cucurbita pepo subsp. pepo]4.1e-18982.17Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSR---DDSPPSTNLAGLIT--KPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELF
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSR   DDS PS+NLA  I+  KP ADPAG+SEIRD DPE+VPVSEFEF L+DPVALMLPADELF
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSR---DDSPPSTNLAGLIT--KPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELF

Query:  LNGKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGS------AKTENHKTT---SPSY
        L+GKLVP QVSSVKPSVN LKS RCVS PET  Q RR+VE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG+      AK ENHKTT   S SY
Subjt:  LNGKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGS------AKTENHKTT---SPSY

Query:  ASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRP
         SEANSKAL+Y LHR SKSSL SSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD ENKPN NPISLHRNPN++NPPRMR VKPRP
Subjt:  ASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRP

Query:  KSEMNPR--STMDHHPTATRVGRSPMRPAPGE--STRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVP
        KSE NPR  ST+DHHPTATRVGRSPMR  PGE  S+RL  IRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPK KNRG ERSYSANVR+TPVLNVP
Subjt:  KSEMNPR--STMDHHPTATRVGRSPMRPAPGE--STRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVP

Query:  VCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH
        VCSSLRGSSKS SVFGFG LF+GTG     RS+Q SS SSSTNRTTTRRI ETDGGGKLH
Subjt:  VCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH

TrEMBL top hitse value%identityAlignment
A0A5D3CZJ6 Putative serine-rich protein5.2e-18279.06Show/hide
Query:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDDSPPSTNLAGLI--TKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLN
        MASACVNN+G+S ENFLDCSS+ PCHSYGWL PR+SFSRDDSPPS NL G +  TKPA   AGESE RD DPE+VPVSEFEFRLQDPV+LMLPADELF +
Subjt:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDDSPPSTNLAGLI--TKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLN

Query:  GKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS------------NGSAKTENHKTT---
        GKLVP QVSS KPSVN LKS RCVS PET  Q RR+VE ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS            NGSAK ENHKTT   
Subjt:  GKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS------------NGSAKTENHKTT---

Query:  SPSYASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQV
        S SY SEANSKAL+Y LHR SKSSL SS DSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD ENKPNTNPISLHRNPN++NPPRMR V
Subjt:  SPSYASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQV

Query:  KPRPKSEMNPR--STMDH-HPTATRVGRSPMRPAPGE----STRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRIT
        KPRPKSE NPR  ST DH HP+ATRVGRSP+R  PGE    S+RL IRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK KNRG ERSYSANVR+T
Subjt:  KPRPKSEMNPR--STMDH-HPTATRVGRSPMRPAPGE----STRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRIT

Query:  PVLNVPVCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ---SSGSSSTNRTTTRRIIETDGGGKLH
        PVLNVPVCSSLRGSSKSVSVFGFG L   TG  GSSR++Q   S+ SSS+NRTTTRRI +T+GGGK+H
Subjt:  PVLNVPVCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ---SSGSSSTNRTTTRRIIETDGGGKLH

A0A6J1ETX7 homeobox protein prospero-like5.8e-18982.17Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSR---DDSPPSTNLAGLIT--KPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELF
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSR   DDS PS+NLA  I+  KP ADPA +SEIRD DPE+VPVSEFEF LQDPVALMLPADELF
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSR---DDSPPSTNLAGLIT--KPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELF

Query:  LNGKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSS------SNGSAKTENHKTT---SPSY
        L+GKLVP QVSSVKPSVN LKS RCVS PET  Q RR+VE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSS      SNGSAK ENHKTT   S SY
Subjt:  LNGKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSS------SNGSAKTENHKTT---SPSY

Query:  ASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRP
         SEANSKAL+Y LHR SKSSL SSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD ENKPN NPISLHRNPN++NPPRMR VKPRP
Subjt:  ASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRP

Query:  KSEMNPR--STMDHHPTATRVGRSPMRPAPGE--STRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVP
        KSE NPR  ST+DHHPTATRVGRSPMR  PG+  S+RL  IRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPK KNRG ERSYSANVR+TPVLNVP
Subjt:  KSEMNPR--STMDHHPTATRVGRSPMRPAPGE--STRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVP

Query:  VCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH
        VCSSLRGSSKS SVFGFG LF+GTG     RS+Q SS SSSTNRTTTRRI ETDGGGKLH
Subjt:  VCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH

A0A6J1FVC0 uncharacterized protein LOC1114476205.1e-23096.37Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNL+GLITKPAADPAGESEIRDSDPE+VPVSEFEFRLQDPVALMLPADELFLNGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
        VPFQVSSVKPSVNVLKSMRCVS PETAAQ RR+VEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH

Query:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
        RRSKSSL SSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPN SNPPRMRQVKPRPKSEMNPRSTMDHHP
Subjt:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP

Query:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
        TATRVGRSPMRPAPGESTRLA+RGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVL+VPVCSSLRGSSKSVSVFGFGQ
Subjt:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ

Query:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH
        LFS TGTSGSSRSYQ SS SSSTNRTTTRRI+ETDGGGKLH
Subjt:  LFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH

A0A6J1IXV4 uncharacterized protein LOC1114802069.4e-240100Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
        VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLH

Query:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
        RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP
Subjt:  RRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHP

Query:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
        TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ
Subjt:  TATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQ

Query:  LFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIETDGGGKLH
        LFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIETDGGGKLH
Subjt:  LFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIETDGGGKLH

A0A6J1JAD5 uncharacterized serine-rich protein C215.132.9e-18881.74Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSR---DDSPPSTNLAGLIT--KPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELF
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSR   DDS PS+NLA  I+  KP ADPAG+SEIRD DPE+VPVSEFEF LQDPVALMLPADELF
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSR---DDSPPSTNLAGLIT--KPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELF

Query:  LNGKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGS------AKTENHKTT---SPSY
        L+GKLVP QVSSVKPSVN LKS RCVS PE+A Q RR+VE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG+      AK ENHKTT   S SY
Subjt:  LNGKLVPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGS------AKTENHKTT---SPSY

Query:  ASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRP
         SEANSKAL+Y LHR SKSSL SSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD EN PN NPISLHRNPN++NPPRMR VKPRP
Subjt:  ASEANSKALRYLLHRRSKSSLLSSFDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRP

Query:  KSEMNPR--STMDHHPTATRVGRSPMRPAPGE--STRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVP
        KSE NPR  ST+DHHPTA RVGRSPMR  PGE  S+RL  IRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPK KNRG ERSYSANVR+TPVLNVP
Subjt:  KSEMNPR--STMDHHPTATRVGRSPMRPAPGE--STRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVP

Query:  VCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH
        VCSSLRGSSKS SVFGFG LF+GTG     RS+Q SS SSSTNRTTTRRI ETDGGGK+H
Subjt:  VCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQ-SSGSSSTNRTTTRRIIETDGGGKLH

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G56020.1 unknown protein9.4e-6745.02Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MASACV + G+SPE F         SYGW SPR+S +RDD+  S++    + K  +DP    EI+D      PV +FEF L+DPV  ML ADELF +GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPR-----RKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKAL
        VP + S  K +     +    +  E    P      R++E E S    LFSPKAPRC++RWRELLGLK+L     N   + E+ K +S S ++   + + 
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPR-----RKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKAL

Query:  RYLLHRRSKSSLLSSFDSSLNLPLLKDSD-SESVSLSSSRVSL-SSSSSGHELEDLHRLPLDWENKPNTNPISLHR-NPNNSNPPRMRQVKPRPKSEMNP
        +  LHR SKSS  +S       PL K+SD SES+S++SSR+SL SSSSS HE++DL RL LD + KP+ NP +  R +  N N PR+R  KPR       
Subjt:  RYLLHRRSKSSLLSSFDSSLNLPLLKDSD-SESVSLSSSRVSL-SSSSSGHELEDLHRLPLDWENKPNTNPISLHR-NPNNSNPPRMRQVKPRPKSEMNP

Query:  RSTMDHHPTATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLK-NRGTERSYSANVRITPVLNVPVCSSLRGSSK
            +H P+   V  S    A  ES  L    V+ DSPR+N+SGKIVFH LERSSSSP SF GGP++K + G  RSYSANVRITPVLNVPVCS   G   
Subjt:  RSTMDHHPTATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLK-NRGTERSYSANVRITPVLNVPVCSSLRGSSK

Query:  SVSVFGFGQLFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIET
              FGQLFS + +S SS     + S   +  +  RI  T
Subjt:  SVSVFGFGQLFSGTGTSGSSRSYQSSGSSSTNRTTTRRIIET

AT1G79060.1 unknown protein1.1e-7047Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MAS CVNN+ +S +           +YG  +PR SFSRDD   S+                SEI   +   V   +FEFRL++    MLPADELF +GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSV-NVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLL
        V  Q       +    + M  V           ++E     D   FSPKAPRCSSRWR+LLGLK+  Q+SS  SA T    TT+P     +++ +L+  L
Subjt:  VPFQVSSVKPSV-NVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLL

Query:  HRRSKSSLLSSFDSSL--NLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMD
        HR S+SS  SS D+SL  +LPLLKDSDSESVS+SSSR+SLSSSSSGH+ EDL RL LD E     + I+L+ N   +     R + P P     PR  + 
Subjt:  HRRSKSSLLSSFDSSL--NLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMD

Query:  HHPTA----TRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK-LKNRGTERSYSANVRITPVLNVPVCSSLRGSSKS
        +H T+     RVGRSPMR + GE++ +  RGVSVDSPR+NSSGKIVF NLERSSSSPSSFNGG    ++RG ERSYS+NVR+TPVLNVPVC S+RG S  
Subjt:  HHPTA----TRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK-LKNRGTERSYSANVRITPVLNVPVCSSLRGSSKS

Query:  VSVFGFGQLFSGTGTSGSSRSYQSSGSSSTNRTT
             FGQ FS + +S SS++   +G+++ NR +
Subjt:  VSVFGFGQLFSGTGTSGSSRSYQSSGSSSTNRTT

AT3G05980.1 unknown protein1.0e-0431.6Show/hide
Query:  LSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVA--LMLPADELFLNGKLVPFQVSSVKPSVNVLKSMRCVSLPETA
        L PRISFS D S     +   IT        E  ++ S    V VS+FEF   + V+   ML ADELF  GKL+PF    VK S   LK++   +  E  
Subjt:  LSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVA--LMLPADELFLNGKLVPFQVSSVKPSVNVLKSMRCVSLPETA

Query:  AQPRRKVEAE----------------CSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG------SAKTENHKTTSPSYASEANSKALRYLLHRRSKS
        A+ +RKVE +                   DP   SP+ P+C+  W+ELL LKK    SS+       S+ + +  T+S S   +A  +  +    +R K 
Subjt:  AQPRRKVEAE----------------CSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG------SAKTENHKTTSPSYASEANSKALRYLLHRRSKS

Query:  SLLSSFDSSLNL
         L  +  +S+ +
Subjt:  SLLSSFDSSLNL

AT3G12970.1 unknown protein1.4e-5741.78Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL
        MAS CV N+G SP            S+ W S ++S +R+  P +             PA E+E         PV +FEF L+DPV  ML ADELF +GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKL

Query:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECS--TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYL
        VP + S     V   +     S+  TA +P R++E E S   DPYLFSP+APRC+ RWRELLGLK+L ++    SA + +  ++S   +    + + R+ 
Subjt:  VPFQVSSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECS--TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYL

Query:  LHRRSKSSLLSSFDSSLNLPLLKDSD---SESVSLSSSRVSL-SSSSSGHELEDLHRLPLDWENKPNT-NPISL-----HRNPNNSNPPRMRQVKPRPKS
        L+R SKS+         + P  KDSD   S S S+SSSR+SL SSSSSGHEL+DL RL LD +NKP T NP +      H +  N N PR    KPR  +
Subjt:  LHRRSKSSLLSSFDSSLNLPLLKDSD---SESVSLSSSRVSL-SSSSSGHELEDLHRLPLDWENKPNT-NPISL-----HRNPNNSNPPRMRQVKPRPKS

Query:  EMNPRSTMDHHPTATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLK-NRGTERSYSANVRITPVLNVPVCSSLR
        +++  +                      S    +  V+ DSPR+N+SGKIVFH LERSSSSP +F GGP++K + G  RS+SANVRITPVLNVPV SSLR
Subjt:  EMNPRSTMDHHPTATRVGRSPMRPAPGESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLK-NRGTERSYSANVRITPVLNVPVCSSLR

Query:  GSSKSVSVFGFGQLFSGTGTSGSSRS----YQSSGSSSTNRTTTRRIIET
           KS  +F FGQLF+ + ++ SS S     Q   ++  NRT   R+  T
Subjt:  GSSKSVSVFGFGQLFSGTGTSGSSRS----YQSSGSSSTNRTTTRRIIET

AT5G19340.1 unknown protein3.9e-0428.88Show/hide
Query:  PRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKLVPF-QVS--------SVKPSVNVLKSMRCVS
        PRISFS D S   ++   +   P  +     E  + D   V   +FEF  ++  A ML ADELF  GKL+PF QV         ++KP V V +      
Subjt:  PRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKLVPF-QVS--------SVKPSVNVLKSMRCVS

Query:  LPETAAQPRRKVEAE---------------CSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKA
        +         K +                    DP   SP+ P+C+  W+ELL LKK  Q ++  +  +    + SPS +S + S +
Subjt:  LPETAAQPRRKVEAE---------------CSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKA


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCTTCCGCATGCGTTAACAACATCGGAATGTCGCCGGAGAATTTCCTCGATTGTTCTTCTGCTCCTTGCCATTCTTACGGCTGGCTCAGCCCTCGCATCTCC
TTCAGCCGCGACGACTCCCCGCCTTCTACTAACCTCGCAGGACTTATAACTAAGCCTGCCGCTGACCCGGCCGGAGAATCTGAGATTCGAGATTCGGATCCTGAA
GTAGTGCCGGTCAGTGAGTTCGAGTTCCGCCTTCAAGATCCCGTTGCCTTGATGCTCCCGGCGGATGAGCTGTTTCTGAATGGAAAACTCGTGCCATTTCAGGTC
TCGTCTGTTAAACCCTCGGTCAACGTTTTGAAGTCGATGAGGTGCGTTTCGTTGCCGGAGACTGCGGCTCAGCCCCGCCGGAAAGTTGAGGCAGAATGCAGTACT
GATCCATATCTGTTCTCTCCCAAGGCGCCGAGATGTTCCAGTCGATGGAGAGAGCTTTTAGGGCTCAAGAAGCTGTACCAGAGCAGCAGCAATGGCAGCGCCAAA
ACCGAAAATCACAAAACGACGTCGCCGTCTTACGCCTCGGAAGCCAATTCTAAGGCGCTGAGGTATTTACTTCACCGGCGTTCGAAATCGTCGTTATTGTCTTCG
TTCGATTCGTCACTGAACCTTCCATTGTTGAAGGACTCCGATAGTGAGTCTGTTTCGCTATCTTCTTCCCGCGTATCTCTTTCCTCGTCTTCCTCAGGCCACGAA
CTCGAAGATCTTCACAGACTCCCGCTGGATTGGGAAAATAAGCCAAACACGAATCCGATTTCTCTCCATCGGAACCCTAACAATAGCAATCCTCCGCGAATGAGA
CAGGTGAAACCTCGGCCTAAATCGGAGATGAATCCAAGATCAACAATGGATCATCATCCGACGGCAACGAGAGTAGGTAGAAGTCCAATGCGGCCTGCGCCGGGA
GAATCCACTAGATTAGCGATCCGAGGAGTATCCGTAGACAGTCCACGAATGAACTCCTCTGGTAAAATCGTGTTCCACAACTTGGAGAGAAGCTCGAGCAGTCCA
AGCAGCTTCAATGGCGGACCGAAACTGAAGAACAGAGGAACGGAAAGGTCATATTCAGCGAACGTGAGAATAACTCCCGTCCTCAACGTTCCAGTTTGTTCTTCC
CTGAGAGGATCCTCAAAATCCGTCTCTGTGTTCGGGTTCGGTCAACTATTCTCCGGTACCGGCACCAGCGGAAGCAGTAGAAGCTACCAGAGTAGTGGCAGTAGT
AGTACTAACCGGACGACGACAAGGCGGATCATCGAAACAGACGGCGGAGGTAAACTCCATTAA
mRNA sequenceShow/hide mRNA sequence
ATGGCTTCCGCATGCGTTAACAACATCGGAATGTCGCCGGAGAATTTCCTCGATTGTTCTTCTGCTCCTTGCCATTCTTACGGCTGGCTCAGCCCTCGCATCTCC
TTCAGCCGCGACGACTCCCCGCCTTCTACTAACCTCGCAGGACTTATAACTAAGCCTGCCGCTGACCCGGCCGGAGAATCTGAGATTCGAGATTCGGATCCTGAA
GTAGTGCCGGTCAGTGAGTTCGAGTTCCGCCTTCAAGATCCCGTTGCCTTGATGCTCCCGGCGGATGAGCTGTTTCTGAATGGAAAACTCGTGCCATTTCAGGTC
TCGTCTGTTAAACCCTCGGTCAACGTTTTGAAGTCGATGAGGTGCGTTTCGTTGCCGGAGACTGCGGCTCAGCCCCGCCGGAAAGTTGAGGCAGAATGCAGTACT
GATCCATATCTGTTCTCTCCCAAGGCGCCGAGATGTTCCAGTCGATGGAGAGAGCTTTTAGGGCTCAAGAAGCTGTACCAGAGCAGCAGCAATGGCAGCGCCAAA
ACCGAAAATCACAAAACGACGTCGCCGTCTTACGCCTCGGAAGCCAATTCTAAGGCGCTGAGGTATTTACTTCACCGGCGTTCGAAATCGTCGTTATTGTCTTCG
TTCGATTCGTCACTGAACCTTCCATTGTTGAAGGACTCCGATAGTGAGTCTGTTTCGCTATCTTCTTCCCGCGTATCTCTTTCCTCGTCTTCCTCAGGCCACGAA
CTCGAAGATCTTCACAGACTCCCGCTGGATTGGGAAAATAAGCCAAACACGAATCCGATTTCTCTCCATCGGAACCCTAACAATAGCAATCCTCCGCGAATGAGA
CAGGTGAAACCTCGGCCTAAATCGGAGATGAATCCAAGATCAACAATGGATCATCATCCGACGGCAACGAGAGTAGGTAGAAGTCCAATGCGGCCTGCGCCGGGA
GAATCCACTAGATTAGCGATCCGAGGAGTATCCGTAGACAGTCCACGAATGAACTCCTCTGGTAAAATCGTGTTCCACAACTTGGAGAGAAGCTCGAGCAGTCCA
AGCAGCTTCAATGGCGGACCGAAACTGAAGAACAGAGGAACGGAAAGGTCATATTCAGCGAACGTGAGAATAACTCCCGTCCTCAACGTTCCAGTTTGTTCTTCC
CTGAGAGGATCCTCAAAATCCGTCTCTGTGTTCGGGTTCGGTCAACTATTCTCCGGTACCGGCACCAGCGGAAGCAGTAGAAGCTACCAGAGTAGTGGCAGTAGT
AGTACTAACCGGACGACGACAAGGCGGATCATCGAAACAGACGGCGGAGGTAAACTCCATTAA
Protein sequenceShow/hide protein sequence
MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDDSPPSTNLAGLITKPAADPAGESEIRDSDPEVVPVSEFEFRLQDPVALMLPADELFLNGKLVPFQV
SSVKPSVNVLKSMRCVSLPETAAQPRRKVEAECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGSAKTENHKTTSPSYASEANSKALRYLLHRRSKSSLLSS
FDSSLNLPLLKDSDSESVSLSSSRVSLSSSSSGHELEDLHRLPLDWENKPNTNPISLHRNPNNSNPPRMRQVKPRPKSEMNPRSTMDHHPTATRVGRSPMRPAPG
ESTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKLKNRGTERSYSANVRITPVLNVPVCSSLRGSSKSVSVFGFGQLFSGTGTSGSSRSYQSSGSS
STNRTTTRRIIETDGGGKLH