; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0008516 (gene) of Snake gourd v1 genome

Gene IDTan0008516
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionSerine/arginine repetitive matrix-like protein
Genome locationLG01:9344092..9346125
RNA-Seq ExpressionTan0008516
SyntenyTan0008516
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6600467.1 hypothetical protein SDJN03_05700, partial [Cucurbita argyrosperma subsp. sororia]1.3e-20389.16Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MASACVNNIGMSPENFLDCSSAPCHSY WLSPRISFSRDDSPPSTNL G I+KPAAD AGESEIRD DPELVPVSEFEFRLQDPVALMLPADELFL+GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS
        VP QVSSVK PSVN LKS RCVSSPETAAQSRR VE ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG+G    KTENHKTT   S SY SEANS
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS

Query:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP
        KALRY LHR SKSSLSSSF+SSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD+ENKPNTNPISLHRNPNN+NPPRMRQVKPRPKSE NP
Subjt:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP

Query:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK
        RS MDHHPTATRVGRSPMR  PGES TRLAIRGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPK KNRG ERSYSANVR+TPVLNVPVCSSLRGSSK
Subjt:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK

Query:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH
        SVSVFGFGQLFSS  TGT GSSRS+Q SSSS+STNRTT+RRI+ETDGGGKLH
Subjt:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH

XP_022942648.1 uncharacterized protein LOC111447620 [Cucurbita moschata]1.1e-20288.94Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MASACVNNIGMSPENFLDCSSAPCHSY WLSPRISFSRDDSPPSTNL G I+KPAAD AGESEIRD DPELVPVSEFEFRLQDPVALMLPADELFL+GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS
        VP QVSSVK PSVN LKS RCVS PETAAQSRR VE ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS    NGSAKTENHKTT   S SY SEANS
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS

Query:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP
        KALRY LHR SKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD+ENKPNTNPISLHRNPN +NPPRMRQVKPRPKSE NP
Subjt:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP

Query:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK
        RS MDHHPTATRVGRSPMR  PGES TRLA+RGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPK KNRG ERSYSANVR+TPVL+VPVCSSLRGSSK
Subjt:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK

Query:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH
        SVSVFGFGQLFSS  TGT GSSRS+Q SSSS+STNRTT+RRI+ETDGGGKLH
Subjt:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH

XP_022980895.1 uncharacterized protein LOC111480206 [Cucurbita maxima]9.3e-20589.36Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MASACVNNIGMSPENFLDCSSAPCHSY WLSPRISFSRDDSPPSTNL G I+KPAAD AGESEIRD DPE+VPVSEFEFRLQDPVALMLPADELFL+GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS
        VP QVSSVK PSVN LKS RCVS PETAAQ RR+VE ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS    NGSAKTENHKTT   S SY SEANS
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS

Query:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP
        KALRY LHR SKSSL SSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD+ENKPNTNPISLHRNPNN+NPPRMRQVKPRPKSE NP
Subjt:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP

Query:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK
        RS MDHHPTATRVGRSPMR  PGES TRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK KNRG ERSYSANVR+TPVLNVPVCSSLRGSSK
Subjt:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK

Query:  SVSVFGFGQLFSSTGTGTGGSSRSHQSSSSNSTNRTTSRRIIETDGGGKLH
        SVSVFGFGQLFS  GTGT GSSRS+QSS S+STNRTT+RRIIETDGGGKLH
Subjt:  SVSVFGFGQLFSSTGTGTGGSSRSHQSSSSNSTNRTTSRRIIETDGGGKLH

XP_023549710.1 uncharacterized protein LOC111808127 [Cucurbita pepo subsp. pepo]1.5e-20288.94Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MASACVNNIGMSPENFLDCSSAPCHSY WLSPRISFSRDDSPPSTNL G ++KPAAD AGESEIRD DPELVPVSEFEFRLQDPVALMLPADELFL+GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS
        VP +VSSVK PSVN LKS RCVSSPETAAQSRR VE ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS    NGSAKTENHKTT   S SY SEANS
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS

Query:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP
        KALRY LHR SKSSLSSSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD+ENKPNTNPISLHRNPNN+NPPRMRQVKPRPKSE NP
Subjt:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP

Query:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK
        RS MDHH TATRVGRSPMR  PGES TRLAIRGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPK KNRG ERSYSANVR+TPVLNVPVCSSLRGSSK
Subjt:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK

Query:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH
        SVSVFGFGQLFS+  TGT GSSRS+Q SSSS+STNRTT+RRIIETDGGGKLH
Subjt:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH

XP_023551901.1 uncharacterized protein LOC111809733 [Cucurbita pepo subsp. pepo]2.8e-20186.83Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSR---DDSPPSTNLPGPIS--KPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELF
        MASACVN++GMSPENFLDCSSAPCHSY WLSPR+SFSR   DDS PS+NL  PIS  KP AD AG+SEIRDPDPELVPVSEFEF L+DPVALMLPADELF
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSR---DDSPPSTNLPGPIS--KPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELF

Query:  LDGKLVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG--NGNGSAKTENHKTTSSSSSS
        LDGKLVPLQVSSVK PSVNGLKSTRCVSSPET  Q+RRRVE+EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG  N NG AK ENHKTT++SSSS
Subjt:  LDGKLVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG--NGNGSAKTENHKTTSSSSSS

Query:  YFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPR
        YFSEANSKAL+YFLHR+SKSSL+SSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLD ENKPN NPISLHRNPN+NNPPRMR VKPR
Subjt:  YFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPR

Query:  PKSESNPR--SPMDHHPTATRVGRSPMRRTPGE-STTRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNV
        PKSE+NPR  S +DHHPTATRVGRSPMRRTPGE S++RL  IRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVTPVLNV
Subjt:  PKSESNPR--SPMDHHPTATRVGRSPMRRTPGE-STTRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNV

Query:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH
        PVCSSLRGSSKS SVFGFG LF    TGTGG  RSHQ SSSS+STNRTT+RRI ETDGGGKLH
Subjt:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH

TrEMBL top hitse value%identityAlignment
A0A5D3CZJ6 Putative serine-rich protein2.2e-19985.07Show/hide
Query:  MASACVNNIGMSPENFLDCSSA-PCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGK
        MASACVNN+G+S ENFLDCSS+ PCHSY WL PR+SFSRDDSPPS NL GP+SK     AGESE RDPDPELVPVSEFEFRLQDPV+LMLPADELF DGK
Subjt:  MASACVNNIGMSPENFLDCSSA-PCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGK

Query:  LVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSN--------GNGNGSAKTENHKTTSSSS
        LVPLQVSS K PSVNGLKSTRCVSSPET  QSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSN        GNGNGSAK ENHKTT++SS
Subjt:  LVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSN--------GNGNGSAKTENHKTTSSSS

Query:  SSYFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVK
        SSYFSEANSKAL+YFLHRSSKSSLSSS DSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLD ENKPNTNPISLHRNPN+NNPPRMR VK
Subjt:  SSYFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVK

Query:  PRPKSESNPR--SPMDH-HPTATRVGRSPMRRTPGE---STTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTP
        PRPKSESNPR  S  DH HP+ATRVGRSP+RRTPGE   S++RL IRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTP
Subjt:  PRPKSESNPR--SPMDH-HPTATRVGRSPMRRTPGE---STTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTP

Query:  VLNVPVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQSSSSN---STNRTTSRRIIETDGGGKLH
        VLNVPVCSSLRGSSKSVSVFGFG L     TG GGSSR+HQ+SSSN   S+NRTT+RRI +T+GGGK+H
Subjt:  VLNVPVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQSSSSN---STNRTTSRRIIETDGGGKLH

A0A6J1ETX7 homeobox protein prospero-like3.0e-20186.83Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSR---DDSPPSTNLPGPIS--KPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELF
        MASACVN++GMSPENFLDCSSAPCHSY WLSPR+SFSR   DDS PS+NL  PIS  KP AD A +SEIRDPDPELVPVSEFEF LQDPVALMLPADELF
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSR---DDSPPSTNLPGPIS--KPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELF

Query:  LDGKLVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG--NGNGSAKTENHKTTSSSSSS
        LDGKLVPLQVSSVK PSVNGLKSTRCVSSPET  Q+RRRVE+EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG  N NGSAK ENHKTT++SSSS
Subjt:  LDGKLVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG--NGNGSAKTENHKTTSSSSSS

Query:  YFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPR
        YFSEANSKAL+YFLHR+SKSSL+SSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLD ENKPN NPISLHRNPN+NNPPRMR VKPR
Subjt:  YFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPR

Query:  PKSESNPR--SPMDHHPTATRVGRSPMRRTPGE-STTRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNV
        PKSE+NPR  S +DHHPTATRVGRSPMRRTPG+ S++RL  IRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVTPVLNV
Subjt:  PKSESNPR--SPMDHHPTATRVGRSPMRRTPGE-STTRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNV

Query:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH
        PVCSSLRGSSKS SVFGFG LF    TGTGG  RSHQ SSSS+STNRTT+RRI ETDGGGKLH
Subjt:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH

A0A6J1FVC0 uncharacterized protein LOC1114476205.5e-20388.94Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MASACVNNIGMSPENFLDCSSAPCHSY WLSPRISFSRDDSPPSTNL G I+KPAAD AGESEIRD DPELVPVSEFEFRLQDPVALMLPADELFL+GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS
        VP QVSSVK PSVN LKS RCVS PETAAQSRR VE ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS    NGSAKTENHKTT   S SY SEANS
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS

Query:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP
        KALRY LHR SKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD+ENKPNTNPISLHRNPN +NPPRMRQVKPRPKSE NP
Subjt:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP

Query:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK
        RS MDHHPTATRVGRSPMR  PGES TRLA+RGVSVDSPR+NS GKIVFHNLERSSSSPSSFNGGPK KNRG ERSYSANVR+TPVL+VPVCSSLRGSSK
Subjt:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK

Query:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH
        SVSVFGFGQLFSS  TGT GSSRS+Q SSSS+STNRTT+RRI+ETDGGGKLH
Subjt:  SVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH

A0A6J1IXV4 uncharacterized protein LOC1114802064.5e-20589.36Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MASACVNNIGMSPENFLDCSSAPCHSY WLSPRISFSRDDSPPSTNL G I+KPAAD AGESEIRD DPE+VPVSEFEFRLQDPVALMLPADELFL+GKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS
        VP QVSSVK PSVN LKS RCVS PETAAQ RR+VE ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS    NGSAKTENHKTT   S SY SEANS
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANS

Query:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP
        KALRY LHR SKSSL SSFDSSL+LPLLKDSDSESVSLSSSRVSLSSSSSGHE EDLHRL LD+ENKPNTNPISLHRNPNN+NPPRMRQVKPRPKSE NP
Subjt:  KALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNP

Query:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK
        RS MDHHPTATRVGRSPMR  PGES TRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK KNRG ERSYSANVR+TPVLNVPVCSSLRGSSK
Subjt:  RSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSK

Query:  SVSVFGFGQLFSSTGTGTGGSSRSHQSSSSNSTNRTTSRRIIETDGGGKLH
        SVSVFGFGQLFS  GTGT GSSRS+QSS S+STNRTT+RRIIETDGGGKLH
Subjt:  SVSVFGFGQLFSSTGTGTGGSSRSHQSSSSNSTNRTTSRRIIETDGGGKLH

A0A6J1JAD5 uncharacterized serine-rich protein C215.133.3e-20086.39Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSR---DDSPPSTNLPGPIS--KPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELF
        MASACVN++GMSPENFLDCSSAPCHSY WLSPR+SFSR   DDS PS+NL  PIS  KP AD AG+SEIRDPDPELVPVSEFEF LQDPVALMLPADELF
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSR---DDSPPSTNLPGPIS--KPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELF

Query:  LDGKLVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG--NGNGSAKTENHKTTSSSSSS
        LDGKLVPLQVSSVK PSVNGLKSTRCVSSPE+A Q+RRRVE+EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG  N NG AK ENHKTT++SSSS
Subjt:  LDGKLVPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNG--NGNGSAKTENHKTTSSSSSS

Query:  YFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPR
        YFSEANSKAL+YFLHR+SKSSL+SSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLD EN PN NPISLHRNPN+NNPPRMR VKPR
Subjt:  YFSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPR

Query:  PKSESNPR--SPMDHHPTATRVGRSPMRRTPGE-STTRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNV
        PKSE+NPR  S +DHHPTA RVGRSPMRRTPGE S++RL  IRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVTPVLNV
Subjt:  PKSESNPR--SPMDHHPTATRVGRSPMRRTPGE-STTRL-AIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNV

Query:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH
        PVCSSLRGSSKS SVFGFG LF    TGTGG  RSHQ SSSS+STNRTT+RRI ETDGGGK+H
Subjt:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQ-SSSSNSTNRTTSRRIIETDGGGKLH

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G56020.1 unknown protein1.8e-6545.59Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELV-PVSEFEFRLQDPVALMLPADELFLDGK
        MASACV + G+SPE F         SY W SPR+S +RDD+  S+++             + +  DP PE+  PV +FEF L+DPV  ML ADELF DGK
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELV-PVSEFEFRLQDPVALMLPADELFLDGK

Query:  LVPLQVSSVKQPSVN-----GLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSY
        LVPL+ S  K  +          +T    SPE   +S RR+E E S    LFSPKAPRC++RWRELLGLK+L         N   + E+ K +SSSSS  
Subjt:  LVPLQVSSVKQPSVN-----GLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSY

Query:  FSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSD-SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNN-NPPRMRQVK
         +   + + + FLHR SKSS      ++ S PL K+SD SES+S++SSR+SL SSSSS HE +DL RLSLD + KP+ NP +  R  + N N PR+R  K
Subjt:  FSEANSKALRYFLHRSSKSSLSSSFDSSLSLPLLKDSD-SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNN-NPPRMRQVK

Query:  PRPKSESNPRSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSV--DSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPVLN
        PR            +HP +T     P       S+  +  RG++V  DSPR+N+SGKIVFH LERSSSSP SF GGP+ K + GM RSYSANVR+TPVLN
Subjt:  PRPKSESNPRSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSV--DSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPVLN

Query:  VPVCSSLRGSSKSVSVFGFGQLFSSTGTGT------GGSSRSHQSSSSNSTNRT
        VPVCS   G         FGQLFSS+ + +      G  S+   + S N  NRT
Subjt:  VPVCSSLRGSSKSVSVFGFGQLFSSTGTGT------GGSSRSHQSSSSNSTNRT

AT1G79060.1 unknown protein9.9e-7247.54Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MAS CVNN+ +S +           +Y   +PR SFSRDD            + +  VA E      +   V   +FEFRL++    MLPADELF DGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRR----RVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFS
        V  Q                   + E   + RR     +E     D   FSPKAPRCSSRWR+LLGLK+  Q+SS      +  T N ++++SS      
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRR----RVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFS

Query:  EANSKALRYFLHRSSKSSLSSSFDSSL--SLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRP
              L+ FLHRSS+SS SSS D+SL  SLPLLKDSDSESVS+SSSR+SLSSSSSGH+HEDL RLSLD E     + I+L+ N   N     R + P P
Subjt:  EANSKALRYFLHRSSKSSLSSSFDSSL--SLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRP

Query:  KSESNPRSPMDHHPTA----TRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK-FKNRGMERSYSANVRVTPVLNV
             PR  + +H T+     RVGRSPMRR+ GE T+ +  RGVSVDSPR+NSSGKIVF NLERSSSSPSSFNGG   +++RGMERSYS+NVRVTPVLNV
Subjt:  KSESNPRSPMDHHPTA----TRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK-FKNRGMERSYSANVRVTPVLNV

Query:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQSSSSNSTNRTT
        PVC S+RG S       FGQ FSS+   +  SS  +  + +N+ NR +
Subjt:  PVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQSSSSNSTNRTT

AT3G05980.1 unknown protein5.2e-0433.52Show/hide
Query:  LSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVA--LMLPADELFLDGKLVPL-QVSSVKQPSVNGLKSTRCVSSPE
        L PRISFS D S     +         DV   S         V VS+FEF   + V+   ML ADELF +GKL+P  QV   ++     LK+    ++ E
Subjt:  LSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVA--LMLPADELFLDGKLVPL-QVSSVKQPSVNGLKSTRCVSSPE

Query:  TAAQSRR---------------RVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSS
          A+ R+               RV      DP   SP+ P+C+  W+ELL LKK    SS+     +A+T +  + SSS+SS
Subjt:  TAAQSRR---------------RVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSS

AT3G12970.1 unknown protein1.6e-6144.52Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL
        MAS CV N+G SP            S+SW S ++S +R+  P               +A   E  D      PV +FEF L+DPV  ML ADELF DGKL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKL

Query:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECS--TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEA
        VPL+ S V  P    + S        TA +  RR+E E S   DPYLFSP+APRC+ RWRELLGLK+L            AKT+   + SSSS    S  
Subjt:  VPLQVSSVKQPSVNGLKSTRCVSSPETAAQSRRRVEEECS--TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEA

Query:  NSK--ALRYFLHRSSKSSLSSSFDSSLSLPLLKDSD---SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDYENKPNT-NPISLHRNPNNNNPPRMRQVK
        N K  + R+FL+RSSKS+           P  KDSD   S S S+SSSR+SL SSSSSGHE +DL RLSLD +NKP T NP +  R  ++++        
Subjt:  NSK--ALRYFLHRSSKSSLSSSFDSSLSLPLLKDSD---SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDYENKPNT-NPISLHRNPNNNNPPRMRQVK

Query:  PRPKSESNPRSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPVLNVP
           ++++ PR P  H    T+V  S       ES+    +  V+ DSPR+N+SGKIVFH LERSSSSP +F GGP+ K + GM RS+SANVR+TPVLNVP
Subjt:  PRPKSESNPRSPMDHHPTATRVGRSPMRRTPGESTTRLAIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPVLNVP

Query:  VCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSH--QSSSSNSTNRTTSRRIIET
        V SSLR   KS  +F FGQLF+S+ + +  SS  +  Q  S+N  NRT   R+  T
Subjt:  VCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSH--QSSSSNSTNRTTSRRIIET


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCTTCCGCATGCGTTAACAACATCGGAATGTCGCCGGAGAACTTCCTTGACTGTTCTTCTGCTCCTTGCCATTCCTACAGTTGGCTCAGCCCTCGCATCTCCTTCAG
CCGTGACGACTCCCCACCTTCTACTAACCTCCCCGGACCTATATCTAAGCCTGCAGCTGACGTGGCCGGAGAGTCCGAGATTCGAGATCCGGATCCTGAACTGGTGCCGG
TCAGCGAGTTCGAGTTCCGCCTTCAAGATCCCGTCGCCTTGATGCTCCCTGCGGATGAGCTGTTTCTGGATGGAAAACTCGTGCCGCTTCAGGTCTCGTCCGTTAAACAA
CCCTCGGTCAACGGTTTGAAGTCGACGAGGTGCGTTTCTTCGCCGGAGACGGCGGCTCAATCGCGCCGGAGAGTTGAGGAAGAATGCAGTACGGATCCGTATCTGTTCTC
TCCCAAGGCGCCGAGGTGTTCCAGTCGATGGAGAGAGCTTCTAGGGCTCAAGAAGCTGTACCAGAGCAGCAGCAATGGCAATGGCAATGGCAGCGCCAAAACCGAAAATC
ACAAAACGACGTCATCGTCATCGTCGTCTTACTTCTCGGAAGCGAATTCGAAGGCGCTGAGGTATTTCCTCCACCGGAGTTCGAAATCATCGTTGTCGTCTTCGTTCGAT
TCGTCTCTGAGCCTTCCATTGCTGAAGGATTCCGACAGTGAGTCTGTTTCGCTGTCTTCTTCCCGTGTATCTCTTTCCTCTTCTTCCTCAGGTCACGAACACGAAGATCT
TCACAGACTCTCGCTCGATTACGAAAACAAGCCAAACACGAATCCGATTTCCCTCCATCGGAACCCTAATAATAACAATCCACCCCGGATGAGACAGGTAAAACCTCGGC
CTAAATCGGAGTCCAATCCAAGATCACCAATGGATCATCATCCGACGGCAACAAGAGTAGGTAGAAGCCCGATGCGGCGTACGCCGGGAGAATCCACCACTAGATTAGCG
ATCCGAGGAGTATCCGTAGACAGTCCACGAATGAACTCCTCTGGTAAAATCGTATTCCACAACTTGGAGAGAAGCTCGAGCAGTCCAAGCAGCTTCAATGGCGGACCAAA
ATTCAAGAACAGAGGAATGGAACGGTCATACTCAGCGAACGTGAGAGTAACTCCAGTTCTAAATGTTCCAGTCTGTTCTTCCCTGAGAGGATCCTCAAAATCCGTCTCTG
TATTCGGATTCGGTCAGTTATTCTCCAGCACCGGCACCGGCACCGGCGGAAGCAGCAGAAGCCACCAAAGTAGTAGTAGTAATAGTACTAACCGGACGACGTCTAGGCGT
ATCATCGAAACAGACGGCGGAGGAAAACTCCATTGA
mRNA sequenceShow/hide mRNA sequence
AGCATCTGCAAAAAAAAAAAAAGGAAAAAAAAGAGATTTTTCTTTCCAATATAAATAGTGAGTTTTCTGTACGGTGGCACCACGGTCCTCTTTCTAAAAGGCCAACTCAT
CATCATCTCTCCCAAACCCTAGCTCTCTCTCTCTCTCTCTCCTCCAGATCTCGCCGGATATTCCGCCGATGTGATTTGCGCCATTAACGTTGACCTTCTCCGGCGTCACT
TTCTTCCCCATTACTGGACTTCCTCTTCTTCACCTTCGCATGATCGCCGCCGCCATCCATGGCTTCCGCATGCGTTAACAACATCGGAATGTCGCCGGAGAACTTCCTTG
ACTGTTCTTCTGCTCCTTGCCATTCCTACAGTTGGCTCAGCCCTCGCATCTCCTTCAGCCGTGACGACTCCCCACCTTCTACTAACCTCCCCGGACCTATATCTAAGCCT
GCAGCTGACGTGGCCGGAGAGTCCGAGATTCGAGATCCGGATCCTGAACTGGTGCCGGTCAGCGAGTTCGAGTTCCGCCTTCAAGATCCCGTCGCCTTGATGCTCCCTGC
GGATGAGCTGTTTCTGGATGGAAAACTCGTGCCGCTTCAGGTCTCGTCCGTTAAACAACCCTCGGTCAACGGTTTGAAGTCGACGAGGTGCGTTTCTTCGCCGGAGACGG
CGGCTCAATCGCGCCGGAGAGTTGAGGAAGAATGCAGTACGGATCCGTATCTGTTCTCTCCCAAGGCGCCGAGGTGTTCCAGTCGATGGAGAGAGCTTCTAGGGCTCAAG
AAGCTGTACCAGAGCAGCAGCAATGGCAATGGCAATGGCAGCGCCAAAACCGAAAATCACAAAACGACGTCATCGTCATCGTCGTCTTACTTCTCGGAAGCGAATTCGAA
GGCGCTGAGGTATTTCCTCCACCGGAGTTCGAAATCATCGTTGTCGTCTTCGTTCGATTCGTCTCTGAGCCTTCCATTGCTGAAGGATTCCGACAGTGAGTCTGTTTCGC
TGTCTTCTTCCCGTGTATCTCTTTCCTCTTCTTCCTCAGGTCACGAACACGAAGATCTTCACAGACTCTCGCTCGATTACGAAAACAAGCCAAACACGAATCCGATTTCC
CTCCATCGGAACCCTAATAATAACAATCCACCCCGGATGAGACAGGTAAAACCTCGGCCTAAATCGGAGTCCAATCCAAGATCACCAATGGATCATCATCCGACGGCAAC
AAGAGTAGGTAGAAGCCCGATGCGGCGTACGCCGGGAGAATCCACCACTAGATTAGCGATCCGAGGAGTATCCGTAGACAGTCCACGAATGAACTCCTCTGGTAAAATCG
TATTCCACAACTTGGAGAGAAGCTCGAGCAGTCCAAGCAGCTTCAATGGCGGACCAAAATTCAAGAACAGAGGAATGGAACGGTCATACTCAGCGAACGTGAGAGTAACT
CCAGTTCTAAATGTTCCAGTCTGTTCTTCCCTGAGAGGATCCTCAAAATCCGTCTCTGTATTCGGATTCGGTCAGTTATTCTCCAGCACCGGCACCGGCACCGGCGGAAG
CAGCAGAAGCCACCAAAGTAGTAGTAGTAATAGTACTAACCGGACGACGTCTAGGCGTATCATCGAAACAGACGGCGGAGGAAAACTCCATTGATGAAGATTAGAAGAAG
AAAATGGATTTTGGGTAACGCTAACAACCCCTATTTCATCTCTCTCGTTTTTTTCTTTGGGATTATACTGTATTCGATTGATTCGCCCTTCATTAGAAGACAGATTCAAT
CGCTAATTCTTAACACCAAAAAGAAGATTCAAAATCATCCGTGTAAATATGGGGAGGAATTTTGTTATTTCTGTTAATTTTTTTTCACCAATTTGAAAGCTCTGTTTGTA
TGGTCATCAATGGCGTCCACCTGAGAAATTTGTTTTTTCGCTGTTCCATCCAAAAGGAGGCGTTTGAAGGGCACGCGCTGAGAGGGGAGCGTGAGAGTAGAGAAGTCTCT
GGGTTTTTGTTTGAAGCTTTTTTCGTAATGATGTGTGACATACTTGTTATCTAA
Protein sequenceShow/hide protein sequence
MASACVNNIGMSPENFLDCSSAPCHSYSWLSPRISFSRDDSPPSTNLPGPISKPAADVAGESEIRDPDPELVPVSEFEFRLQDPVALMLPADELFLDGKLVPLQVSSVKQ
PSVNGLKSTRCVSSPETAAQSRRRVEEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSNGNGNGSAKTENHKTTSSSSSSYFSEANSKALRYFLHRSSKSSLSSSFD
SSLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDYENKPNTNPISLHRNPNNNNPPRMRQVKPRPKSESNPRSPMDHHPTATRVGRSPMRRTPGESTTRLA
IRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSSLRGSSKSVSVFGFGQLFSSTGTGTGGSSRSHQSSSSNSTNRTTSRR
IIETDGGGKLH