; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr029792 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr029792
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
DescriptionSerine/arginine repetitive matrix-like protein
Genome locationtig00153490:1374272..1375594
RNA-Seq ExpressionSgr029792
SyntenySgr029792
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022136380.1 uncharacterized protein LOC111008104 [Momordica charantia]1.1e-17883.15Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHS-YGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVA-MLPADE
        MASACVNN+GMSPENFLDCSSAPCHS YGWLSPRISFSRDFTD SPASSK AGAKSKP    A  PAG+SEIRDPDPE+SV EFEFRL+DPVA MLPADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHS-YGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVA-MLPADE

Query:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTT--SSYFSEAN
        LF DGKLVPLQLSS KPSVNE KSTRC E PETAAKSRRRV EECSTDPYLFSPKAPRCSSRWRELLGLKK+YQSSS+    KNE+HKTT  SSYFSEAN
Subjt:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTT--SSYFSEAN

Query:  SKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMRMVKPRPT
        SKALKY LH SSKSSLSSS D+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNP+ LHRN NPNG TNNPPRMRMVKPR +
Subjt:  SKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMRMVKPRPT

Query:  KWESNNSRSTLDHPTATRIGRSPMRRTAGE--SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVC-
        K E+ N RST DH    R+GRSP+RRT GE  SSR+GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK RGMERSYSANVRVTPVLNVPVC 
Subjt:  KWESNNSRSTLDHPTATRIGRSPMRRTAGE--SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVC-

Query:  SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST--HRTRLDRT
        SLRGSSKS SVFGFGQLFS        GT    SSR HQS+    TRLDRT
Subjt:  SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST--HRTRLDRT

XP_022931532.1 homeobox protein prospero-like [Cucurbita moschata]1.4e-16876.79Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSRDF+DDS  SS  A   SKP  G+  +PA  SEIRDPDPE + VSEFEF L+DPVA MLPADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE

Query:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S
        LF DGKLVPLQ+SS KPSVN LKSTRC  SPET  ++RRRVE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G     G  KNE+HKTT    S
Subjt:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S

Query:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR
        SYFSEANSKALKYFLHR+SKSSL+SSFD+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+NKPN NP+SLHRN N     NNPPRMR
Subjt:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR

Query:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT
        +VKPRP    +  S ST+D HPTATR+GRSPMRRT G+SS     GIRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVT
Subjt:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT

Query:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR
        PVLNVPVC SLRGSSKS SVFGFG LF          TGTGG    SS +  ST+RT   R
Subjt:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR

XP_022985085.1 uncharacterized serine-rich protein C215.13 [Cucurbita maxima]4.0e-16876.79Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSRDF+DDS  SS  A   SKP  G+  +PAG SEIRDPDPE + VSEFEF L+DPVA MLPADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE

Query:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S
        LF DGKLVPLQ+SS KPSVN LKSTRC  SPE+A ++RRRVE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G     G  KNE+HKTT    S
Subjt:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S

Query:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR
        SYFSEANSKALKYFLHR+SKSSL+SSFD+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+N PN NP+SLHRN N     NNPPRMR
Subjt:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR

Query:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT
        +VKPRP    +  S ST+D HPTA R+GRSPMRRT GESS     GIRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVT
Subjt:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT

Query:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR
        PVLNVPVC SLRGSSKS SVFGFG LF          TGTGG    SS +  ST+RT   R
Subjt:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR

XP_023551901.1 uncharacterized protein LOC111809733 [Cucurbita pepo subsp. pepo]4.2e-17077.22Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSRDF+DDS  SS  A   SKP  G+  +PAG SEIRDPDPE + VSEFEF L+DPVA MLPADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE

Query:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S
        LF DGKLVPLQ+SS KPSVN LKSTRC  SPET  ++RRRVE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G     GG KNE+HKTT    S
Subjt:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S

Query:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR
        SYFSEANSKALKYFLHR+SKSSL+SSFD+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+NKPN NP+SLHRN N     NNPPRMR
Subjt:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR

Query:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT
        +VKPRP    +  S ST+D HPTATR+GRSPMRRT GESS     GIRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVT
Subjt:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT

Query:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR
        PVLNVPVC SLRGSSKS SVFGFG LF          TGTGG    +S +  ST+RT   R
Subjt:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR

XP_038878848.1 uncharacterized serine-rich protein C215.13-like [Benincasa hispida]4.2e-17079.07Show/hide
Query:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPAD
        MASACVNN+GMS ENFLDCSS+ PCHSYGWLSPR+SFSRDF DDSP S+   G  SKP       PAG+SEIRDPDPE + VSEFEFRL+DPV+ MLPAD
Subjt:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPAD

Query:  ELFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-------GGGKNESHKTT--
        ELF DGKLVPLQ+SS KPSVN LKSTRC  SPETAA+SRRRV EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G       GG KNESHKTT  
Subjt:  ELFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-------GGGKNESHKTT--

Query:  -SSYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPR
         SSYFSEANSKALKYFLHRSSKSSLSSS D+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+NKPN+NP+SLHRN N     NNPPR
Subjt:  -SSYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPR

Query:  MRMVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGE----SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANV
        MR+VK RP    +  S ST D HPTATR+GRSP+R T GE    SSR+GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK+RGMERSYSANV
Subjt:  MRMVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGE----SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANV

Query:  RVTPVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG-SSRTHQST
        RVTPVLNVPVC SLRGSSKSVSVFGFG LF          TGTGG SSR HQS+
Subjt:  RVTPVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG-SSRTHQST

TrEMBL top hitse value%identityAlignment
A0A1S3BT64 uncharacterized serine-rich protein C215.137.6e-16575.82Show/hide
Query:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPAD
        MASACVNN+G+S ENFLDCSS+ PCHSYGWL PR+SFSRD  D  P++     +K+KPA       AG+SE RDPDPE + VSEFEFRL+DPV+ MLPAD
Subjt:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPAD

Query:  ELFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----------GGGKNESHK
        ELFFDGKLVPLQ+SSAKPSVN LKSTRC  SPET  +SRRRV EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G           G  KNE+HK
Subjt:  ELFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----------GGGKNESHK

Query:  TT----SSYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTT
        TT    SSYFSEANSKALKYFLHRSSKSSLSSS D+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+NKPN+NP+SLHRN N     
Subjt:  TT----SSYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTT

Query:  NNPPRMRMVKPRPTKWESNNSRSTLD--HPTATRIGRSPMRRTAGE----SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMER
        NNPPRMR+VKPRP    +  S ST D  HP+ATR+GRSP+RRT GE    SSR+GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMER
Subjt:  NNPPRMRMVKPRPTKWESNNSRSTLD--HPTATRIGRSPMRRTAGE----SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMER

Query:  SYSANVRVTPVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST
        SYSANVRVTPVLNVPVC SLRGSSKSVSVFGFG L           TG GGSSR HQ++
Subjt:  SYSANVRVTPVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST

A0A5D3CZJ6 Putative serine-rich protein7.6e-16575.82Show/hide
Query:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPAD
        MASACVNN+G+S ENFLDCSS+ PCHSYGWL PR+SFSRD  D  P++     +K+KPA       AG+SE RDPDPE + VSEFEFRL+DPV+ MLPAD
Subjt:  MASACVNNIGMSPENFLDCSSA-PCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPAD

Query:  ELFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----------GGGKNESHK
        ELFFDGKLVPLQ+SSAKPSVN LKSTRC  SPET  +SRRRV EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G           G  KNE+HK
Subjt:  ELFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----------GGGKNESHK

Query:  TT----SSYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTT
        TT    SSYFSEANSKALKYFLHRSSKSSLSSS D+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+NKPN+NP+SLHRN N     
Subjt:  TT----SSYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTT

Query:  NNPPRMRMVKPRPTKWESNNSRSTLD--HPTATRIGRSPMRRTAGE----SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMER
        NNPPRMR+VKPRP    +  S ST D  HP+ATR+GRSP+RRT GE    SSR+GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMER
Subjt:  NNPPRMRMVKPRPTKWESNNSRSTLD--HPTATRIGRSPMRRTAGE----SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMER

Query:  SYSANVRVTPVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST
        SYSANVRVTPVLNVPVC SLRGSSKSVSVFGFG L           TG GGSSR HQ++
Subjt:  SYSANVRVTPVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST

A0A6J1C3Q8 uncharacterized protein LOC1110081045.4e-17983.15Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHS-YGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVA-MLPADE
        MASACVNN+GMSPENFLDCSSAPCHS YGWLSPRISFSRDFTD SPASSK AGAKSKP    A  PAG+SEIRDPDPE+SV EFEFRL+DPVA MLPADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHS-YGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVA-MLPADE

Query:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTT--SSYFSEAN
        LF DGKLVPLQLSS KPSVNE KSTRC E PETAAKSRRRV EECSTDPYLFSPKAPRCSSRWRELLGLKK+YQSSS+    KNE+HKTT  SSYFSEAN
Subjt:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRV-EECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTT--SSYFSEAN

Query:  SKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMRMVKPRPT
        SKALKY LH SSKSSLSSS D+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNP+ LHRN NPNG TNNPPRMRMVKPR +
Subjt:  SKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMRMVKPRPT

Query:  KWESNNSRSTLDHPTATRIGRSPMRRTAGE--SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVC-
        K E+ N RST DH    R+GRSP+RRT GE  SSR+GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK RGMERSYSANVRVTPVLNVPVC 
Subjt:  KWESNNSRSTLDHPTATRIGRSPMRRTAGE--SSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVC-

Query:  SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST--HRTRLDRT
        SLRGSSKS SVFGFGQLFS        GT    SSR HQS+    TRLDRT
Subjt:  SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQST--HRTRLDRT

A0A6J1ETX7 homeobox protein prospero-like6.6e-16976.79Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSRDF+DDS  SS  A   SKP  G+  +PA  SEIRDPDPE + VSEFEF L+DPVA MLPADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE

Query:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S
        LF DGKLVPLQ+SS KPSVN LKSTRC  SPET  ++RRRVE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G     G  KNE+HKTT    S
Subjt:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S

Query:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR
        SYFSEANSKALKYFLHR+SKSSL+SSFD+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+NKPN NP+SLHRN N     NNPPRMR
Subjt:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR

Query:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT
        +VKPRP    +  S ST+D HPTATR+GRSPMRRT G+SS     GIRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVT
Subjt:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT

Query:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR
        PVLNVPVC SLRGSSKS SVFGFG LF          TGTGG    SS +  ST+RT   R
Subjt:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR

A0A6J1JAD5 uncharacterized serine-rich protein C215.131.9e-16876.79Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE
        MASACVN++GMSPENFLDCSSAPCHSYGWLSPR+SFSRDF+DDS  SS  A   SKP  G+  +PAG SEIRDPDPE + VSEFEF L+DPVA MLPADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPE-ISVSEFEFRLEDPVA-MLPADE

Query:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S
        LF DGKLVPLQ+SS KPSVN LKSTRC  SPE+A ++RRRVE EC+TDPYLFSPKAPRCSSRWRELLGLKKLYQSSS+G     G  KNE+HKTT    S
Subjt:  LFFDGKLVPLQLSSAKPSVNELKSTRC-ESPETAAKSRRRVE-ECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSG-----GGGKNESHKTT----S

Query:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR
        SYFSEANSKALKYFLHR+SKSSL+SSFD+SLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDC+N PN NP+SLHRN N     NNPPRMR
Subjt:  SYFSEANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMR

Query:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT
        +VKPRP    +  S ST+D HPTA R+GRSPMRRT GESS     GIRGVSVDSPRMNSSGKIVFHNLERSSSSPS+FNGGPKFKNRGMERSYSANVRVT
Subjt:  MVKPRPTKWESNNSRSTLD-HPTATRIGRSPMRRTAGESSRI---GIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVT

Query:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR
        PVLNVPVC SLRGSSKS SVFGFG LF          TGTGG    SS +  ST+RT   R
Subjt:  PVLNVPVC-SLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGG----SSRTHQSTHRTRLDR

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G56020.1 unknown protein1.5e-6946.37Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEIS--VSEFEFRLEDPVAMLPADE
        MASACV + G+SPE F         SYGW SPR+S +RD  D+  +SS                   D +  DP PEI   V +FEF LEDPV ML ADE
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEIS--VSEFEFRLEDPVAMLPADE

Query:  LFFDGKLVPLQLSSAK-------PSVNELKSTRCESPETAAKSRRRVEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFS
        LF DGKLVPL+ S  K        +VN   +    SPE   KS RR+E   +D  LFSPKAPRC++RWRELLGLK+L  +       + ES K +SS  S
Subjt:  LFFDGKLVPLQLSSAK-------PSVNELKSTRCESPETAAKSRRRVEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFS

Query:  -EANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSD-SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMRM
            + + K FLHR SKSS ++      S PL K+SD SES+S++SSR+SL SSSSS HE +DL RLSLD D KP++NP +  R  + N    N PR+R+
Subjt:  -EANSKALKYFLHRSSKSSLSSSFDASLSLPLLKDSD-SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMRM

Query:  VKPRPTKWESNNSRSTLDHPTATRIGRSPMRRTAGESSRIGIRGVSV--DSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPV
         KPR             +HP +T      +  ++  S+ I  RG++V  DSPR+N+SGKIVFH LERSSSSP SF GGP+ K + GM RSYSANVR+TPV
Subjt:  VKPRPTKWESNNSRSTLDHPTATRIGRSPMRRTAGESSRIGIRGVSV--DSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPV

Query:  LNVPVCSLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQSTHRTRLDRT
        LNVPVCSL+      S   FGQLFSS      +    G  S+   +  + R++RT
Subjt:  LNVPVCSLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQSTHRTRLDRT

AT1G79060.1 unknown protein3.7e-7950.34Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRL-EDPVAMLPADEL
        MAS CVNN+ +S +           +YG  +PR SFSRD            G +S   +GS       SEI   +  +   +FEFRL EDPV MLPADEL
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRL-EDPVAMLPADEL

Query:  FFDGKLVPLQLSSAKPSVNELKSTRCESPETAAKSRRRVEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFSEANSKALK
        F DGKLV  Q       +   K  R E  E         + CS     FSPKAPRCSSRWR+LLGLK+  Q+SS     K+ S  TT++    +++ +LK
Subjt:  FFDGKLVPLQLSSAKPSVNELKSTRCESPETAAKSRRRVEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFSEANSKALK

Query:  YFLHRSSKSSLSSSFDASL--SLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRN--SNP----NGTTNNPPRMRMVKP
         FLHRSS+SS SSS DASL  SLPLLKDSDSESVS+SSSR+SLSSSSSGH+HEDL RLSLD +    ++ ++L+ N  +NP         NPPRMR+V  
Subjt:  YFLHRSSKSSLSSSFDASL--SLPLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRN--SNP----NGTTNNPPRMRMVKP

Query:  RPTKWESNNSRSTLDHPTATRIGRSPMRRTAGESSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK-FKNRGMERSYSANVRVTPVLNVPV
               N+S S        R+GRSPMRR+ GE+S I  RGVSVDSPR+NSSGKIVF NLERSSSSPSSFNGG   +++RGMERSYS+NVRVTPVLNVPV
Subjt:  RPTKWESNNSRSTLDHPTATRIGRSPMRRTAGESSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPK-FKNRGMERSYSANVRVTPVLNVPV

Query:  CSLRGSSKSVSVFGFGQLFSSPQKRDGA-GTGTGGSSRTHQSTHRTR
        CS+RG S       FGQ FSS      +    TG ++    S H +R
Subjt:  CSLRGSSKSVSVFGFGQLFSSPQKRDGA-GTGTGGSSRTHQSTHRTR

AT3G05980.1 unknown protein1.6e-0530.16Show/hide
Query:  LSPRISFSRDFTDD------SPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLED---PVAMLPADELFFDGKLVPLQLSSAKPSVNEL
        L PRISFS D +D       +P   K    K                       + VS+FEF   +   P  ML ADELF +GKL+P      K S  +L
Subjt:  LSPRISFSRDFTDD------SPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLED---PVAMLPADELFFDGKLVPLQLSSAKPSVNEL

Query:  KSTRCESPETAAKSRRRVEECSTDPYLF--------------SPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFSEANS
        K+   ++ E     +R+VE    D  +               SP+ P+C+  W+ELL LKK    SSS    +  S  + SS  S ++S
Subjt:  KSTRCESPETAAKSRRRVEECSTDPYLF--------------SPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFSEANS

AT3G12970.1 unknown protein7.5e-5642.42Show/hide
Query:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVAMLPADELF
        MAS CV N+G SP            S+ W S ++S +R+               S+P A     PA ++E    DP   V +FEF LEDPV ML ADELF
Subjt:  MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVAMLPADELF

Query:  FDGKLVPLQLSSAK-PSVNELKSTRCESPETAAKSRRRVE-ECS--TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFSEANSK
         DGKLVPL+ S    P    + S       TA K  RR+E E S   DPYLFSP+APRC+ RWRELLGLK+L ++          S    SS      + 
Subjt:  FDGKLVPLQLSSAK-PSVNELKSTRCESPETAAKSRRRVE-ECS--TDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFSEANSK

Query:  ALKYFLHRSSKSSLSSSFDASLSLPLLKDSD---SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDCDNKPNS-NPMSLHRNSNPNGTTN-NPPRMRMVK
        + ++FL+RSSKS+           P  KDSD   S S S+SSSR+SL SSSSSGHE +DL RLSLD DNKP + NP +  R  + +   N N PR    K
Subjt:  ALKYFLHRSSKSSLSSSFDASLSLPLLKDSD---SESVSLSSSRVSL-SSSSSGHEHEDLHRLSLDCDNKPNS-NPMSLHRNSNPNGTTN-NPPRMRMVK

Query:  PRPTKWESNNSRSTLDHPTATRIGRSPMRRTAGESSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPVLNVP
        PR       ++ S+++    T                     V+ DSPR+N+SGKIVFH LERSSSSP +F GGP+ K + GM RS+SANVR+TPVLNVP
Subjt:  PRPTKWESNNSRSTLDHPTATRIGRSPMRRTAGESSRIGIRGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFK-NRGMERSYSANVRVTPVLNVP

Query:  VCSLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTG----GSSRTHQSTHRTRLDRT
        V SLR   KS  +F FGQLF+S      + +        S+     T+R+RL+ T
Subjt:  VCSLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTG----GSSRTHQSTHRTRLDRT

AT4G34419.1 unknown protein3.9e-0431.71Show/hide
Query:  LDCSSAPCHSY--GWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVAMLPADELFFDGKLVPLQLSSAK
        ++CS+   H Y   +  PRISFS  F     A++KH   K K A                   +S  +FEF +E+  +M  ADE+FFDG ++PL     K
Subjt:  LDCSSAPCHSY--GWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVAMLPADELFFDGKLVPLQLSSAK

Query:  PSVNELKSTRCESPETAAKSRRRVEECSTDPYLFSPKAPRCSSRWRELLGL-----KKLYQSSS
          VN  K       E +       EE    P     K+   S  WRE LGL     KK ++ SS
Subjt:  PSVNELKSTRCESPETAAKSRRRVEECSTDPYLFSPKAPRCSSRWRELLGL-----KKLYQSSS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCTTCCGCATGTGTTAACAATATCGGAATGTCGCCGGAGAACTTTCTGGACTGTTCTTCTGCGCCTTGTCATTCCTATGGCTGGCTGAGTCCTCGTATCTCTTTCAG
CCGCGACTTCACGGATGACTCGCCGGCTTCTTCTAAACATGCCGGAGCTAAATCTAAGCCTGCTGCTGGTTCTGCGGTGGAGCCGGCCGGTGACTCCGAGATTCGAGATC
CGGATCCTGAAATTTCCGTCAGCGAGTTCGAGTTCCGGCTTGAAGATCCCGTCGCGATGCTTCCTGCGGATGAGCTGTTTTTCGATGGAAAGCTGGTGCCACTTCAGCTC
TCGTCTGCGAAACCCTCGGTCAACGAGTTGAAGTCCACGAGATGCGAGTCGCCGGAGACTGCTGCTAAGTCCCGCCGGAGAGTTGAAGAATGCAGTACGGATCCGTATCT
GTTCTCTCCTAAGGCGCCGAGGTGTTCCAGTCGTTGGAGGGAGCTTTTGGGGCTGAAGAAGCTCTACCAGAGCAGCAGCAGCGGCGGCGGCGGCAAAAACGAGAGCCACA
AGACGACGTCGTCTTACTTCTCCGAAGCGAATTCGAAGGCACTGAAGTATTTCCTTCATCGGAGTTCAAAATCGTCGTTATCATCTTCGTTTGATGCATCTCTGAGTCTG
CCATTGTTGAAGGATTCAGATAGCGAGTCTGTTTCGCTATCGTCCTCGCGTGTATCGCTTTCGTCTTCTTCCTCAGGTCACGAACACGAAGATCTCCACAGACTCTCGCT
CGATTGCGATAACAAGCCAAATTCAAATCCGATGTCCCTTCATAGGAACTCTAATCCCAACGGGACGACGAACAATCCACCACGGATGAGAATGGTGAAACCGCGGCCTA
CTAAATGGGAGAGCAACAATTCAAGATCAACGTTGGATCATCCGACGGCAACGAGAATAGGGAGGAGTCCGATGCGGCGTACGGCGGGAGAATCGAGTCGGATAGGGATC
CGGGGAGTGTCCGTGGATAGTCCCCGGATGAACTCGTCGGGGAAGATAGTTTTCCACAACTTGGAGAGAAGCTCGAGCAGTCCGAGTAGTTTCAACGGTGGGCCAAAATT
CAAGAACAGAGGAATGGAGCGGTCTTATTCGGCCAACGTGAGAGTCACTCCGGTCCTCAACGTTCCAGTTTGTTCCCTCAGAGGATCCTCCAAATCCGTCTCCGTCTTCG
GATTCGGCCAGTTGTTCTCTTCGCCGCAGAAGAGGGACGGCGCCGGCACCGGCACCGGAGGAAGCAGCAGAACCCACCAGAGTACTCACCGGACACGGCTGGATCGAACC
TGA
mRNA sequenceShow/hide mRNA sequence
ATGGCTTCCGCATGTGTTAACAATATCGGAATGTCGCCGGAGAACTTTCTGGACTGTTCTTCTGCGCCTTGTCATTCCTATGGCTGGCTGAGTCCTCGTATCTCTTTCAG
CCGCGACTTCACGGATGACTCGCCGGCTTCTTCTAAACATGCCGGAGCTAAATCTAAGCCTGCTGCTGGTTCTGCGGTGGAGCCGGCCGGTGACTCCGAGATTCGAGATC
CGGATCCTGAAATTTCCGTCAGCGAGTTCGAGTTCCGGCTTGAAGATCCCGTCGCGATGCTTCCTGCGGATGAGCTGTTTTTCGATGGAAAGCTGGTGCCACTTCAGCTC
TCGTCTGCGAAACCCTCGGTCAACGAGTTGAAGTCCACGAGATGCGAGTCGCCGGAGACTGCTGCTAAGTCCCGCCGGAGAGTTGAAGAATGCAGTACGGATCCGTATCT
GTTCTCTCCTAAGGCGCCGAGGTGTTCCAGTCGTTGGAGGGAGCTTTTGGGGCTGAAGAAGCTCTACCAGAGCAGCAGCAGCGGCGGCGGCGGCAAAAACGAGAGCCACA
AGACGACGTCGTCTTACTTCTCCGAAGCGAATTCGAAGGCACTGAAGTATTTCCTTCATCGGAGTTCAAAATCGTCGTTATCATCTTCGTTTGATGCATCTCTGAGTCTG
CCATTGTTGAAGGATTCAGATAGCGAGTCTGTTTCGCTATCGTCCTCGCGTGTATCGCTTTCGTCTTCTTCCTCAGGTCACGAACACGAAGATCTCCACAGACTCTCGCT
CGATTGCGATAACAAGCCAAATTCAAATCCGATGTCCCTTCATAGGAACTCTAATCCCAACGGGACGACGAACAATCCACCACGGATGAGAATGGTGAAACCGCGGCCTA
CTAAATGGGAGAGCAACAATTCAAGATCAACGTTGGATCATCCGACGGCAACGAGAATAGGGAGGAGTCCGATGCGGCGTACGGCGGGAGAATCGAGTCGGATAGGGATC
CGGGGAGTGTCCGTGGATAGTCCCCGGATGAACTCGTCGGGGAAGATAGTTTTCCACAACTTGGAGAGAAGCTCGAGCAGTCCGAGTAGTTTCAACGGTGGGCCAAAATT
CAAGAACAGAGGAATGGAGCGGTCTTATTCGGCCAACGTGAGAGTCACTCCGGTCCTCAACGTTCCAGTTTGTTCCCTCAGAGGATCCTCCAAATCCGTCTCCGTCTTCG
GATTCGGCCAGTTGTTCTCTTCGCCGCAGAAGAGGGACGGCGCCGGCACCGGCACCGGAGGAAGCAGCAGAACCCACCAGAGTACTCACCGGACACGGCTGGATCGAACC
TGA
Protein sequenceShow/hide protein sequence
MASACVNNIGMSPENFLDCSSAPCHSYGWLSPRISFSRDFTDDSPASSKHAGAKSKPAAGSAVEPAGDSEIRDPDPEISVSEFEFRLEDPVAMLPADELFFDGKLVPLQL
SSAKPSVNELKSTRCESPETAAKSRRRVEECSTDPYLFSPKAPRCSSRWRELLGLKKLYQSSSSGGGGKNESHKTTSSYFSEANSKALKYFLHRSSKSSLSSSFDASLSL
PLLKDSDSESVSLSSSRVSLSSSSSGHEHEDLHRLSLDCDNKPNSNPMSLHRNSNPNGTTNNPPRMRMVKPRPTKWESNNSRSTLDHPTATRIGRSPMRRTAGESSRIGI
RGVSVDSPRMNSSGKIVFHNLERSSSSPSSFNGGPKFKNRGMERSYSANVRVTPVLNVPVCSLRGSSKSVSVFGFGQLFSSPQKRDGAGTGTGGSSRTHQSTHRTRLDRT