CuGenDBv2

Gene ID	Sgr004879
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	nucleolar complex protein 4 homolog
Genome location	tig00003412:75159..98880
RNA-Seq Expression	Sgr004879
Synteny	Sgr004879
Gene Ontology terms	GO:0006364 - rRNA processing (biological process) GO:0006486 - protein glycosylation (biological process) GO:0009793 - embryo development ending in seed dormancy (biological process) GO:0005654 - nucleoplasm (cellular component) GO:0005730 - nucleolus (cellular component) GO:0016020 - membrane (cellular component) GO:0030692 - Noc4p-Nop14p complex (cellular component) GO:0032040 - small-subunit processome (cellular component) GO:0008375 - acetylglucosaminyltransferase activity (molecular function)
InterPro domains	IPR004139 - Glycosyl transferase, family 13 IPR005612 - CCAAT-binding factor IPR016024 - Armadillo-type fold IPR027193 - Nucleolar complex protein 4 IPR029044 - Nucleotide-diphospho-sugar transferases

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7011815.1 Nucleolar complex protein 4-like B, partial [Cucurbita argyrosperma subsp. argyrosperma]

9.3e-283

86.99

Show/hide

Query:  SKKQRKKKEK-HTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFV
        S+K++KK EK H LS+LKTLGLQLLSSRAHINNLPLLLTF+SP+ PP YVLEALLSLQSFFITVLPSLPSSSKPA   D  DDAELIYRTWLRSKFD+ V
Subjt:  SKKQRKKKEK-HTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFV

Query:  KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKA
        KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGN+GKFHSAVYHRFLQSIAHS+TPVNTLIALLVKKYFNH+DVRYFTYISIEKL +TFEAEYMS DR+V+ 
Subjt:  KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKA

Query:  NGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKE
        +GDDG HSREGVEFIHIVH+I SSIPPLENSNQ SDYTMWV+SGD+KVLSDNQEAKQ  M KND+EVL+ASKIVR+MK KFT+AWISFLRLPLPIDV+KE
Subjt:  NGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKE

Query:  VLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK
        VLV LD+ VIPYL+NPIILCDFLTKSYD+GGVVSVMALSSL+LL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK
Subjt:  VLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK

Query:  LSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRH
        LSRLSLVVPPSGAL+IIALIHNLLRRHPSINCLVHREN++ESK DD+T + VA G+DA  V+AD+PNMKPGID FNYEETDPIKSSALRSSLWEID LRH
Subjt:  LSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRH

Query:  HYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID
        HYCPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSYATILGQELKKKMKRVPLAFYQ IPT+LFSESDF GWSFNHE S + ID
Subjt:  HYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID

XP_022136138.1 nucleolar complex protein 4 homolog [Momordica charantia]

1.9e-296

89.64

Show/hide

Query:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF
        MAS LS     KKEKHTLSELKTLGLQLLSSRAHINNLPLLLTF+SPTSPPHYVLEALLSLQSFF+TVLPSLPSSSKPA ADDP DDAELIY+TWLRSKF
Subjt:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF

Query:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR
        D+FVKSLIDVAVSS+CDDTLKEIVLDAIMEFVKVGNKGKFHSAVYH+FLQ+IAHSTTPVNTLIALLVKKYF H+DVRYFTYISIEKLAK FEAEYMS D 
Subjt:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR

Query:  NVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPID
        NV+ N DDGGHS EGVE IHIVH+I SSIPPLENSNQISDYTMWV+SGDDKV+ DNQE KQ  MGKNDKEVLSASKIV+RMK+KFTRAWISFLRLPLPID
Subjt:  NVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPID

Query:  VFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAA
        V+KEVLV LD+ VIPYL+NPIILCDFLTKSYDIGGVVSVMALSSLYLL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAA
Subjt:  VFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAA

Query:  FAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEID
        FAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKD++TDE VA G+DA GVDAD+PN KPGIDHFNYEETDPIKSSALRSSLWEID
Subjt:  FAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEID

Query:  SLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKIDE
        SLRHHYCPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSYATILGQELKKKMKRVPLAFYQ IPTTLFSESDF GWSF+H+ S   ID+
Subjt:  SLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKIDE

XP_022952163.1 nucleolar complex protein 4 homolog [Cucurbita moschata]

6.7e-281

86.47

Show/hide

Query:  SKKQRKKKEK-HTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFV
        S+K++KK EK H LS+LKTLGLQLLSSRAHINNLPLLLTFLSP+ PP YVLEALLSLQSFFITVLPSLPSSSKPA   D  DDAELIYRTWLRSKFD+ V
Subjt:  SKKQRKKKEK-HTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFV

Query:  KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKA
        KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGN+GKFHSA+YHRFLQSIAHS+TPVNTLIALLVKKYFNH+DVRYFTYISIEKL +TFEAEYM  DR+V+ 
Subjt:  KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKA

Query:  NGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKE
        +GDDG HSR+GVEFIHIVH+I SSIPPLENSNQ SDYTMWV+SGD+KVLSDNQEAKQ  M KND+EVL+ASKIVR+MK KFT+AWISFLRLPLPIDV+KE
Subjt:  NGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKE

Query:  VLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK
        VLV LD+ VIPYL+NPIILCDFLTKSYD+GGVVSVMALSSL+LL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK
Subjt:  VLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK

Query:  LSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRH
        LSRLSLVVPPSGAL+IIALIHNLLRRHPSINCLVHREN++ESK DD+T + VA G+DA  V+AD+PNMKPGID FNYEETDPIKSSALRSSLWEID LRH
Subjt:  LSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRH

Query:  HYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID
        HYCPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSYATILGQELKKKMKRVPLAFYQ IPT+LFS SDF GWSFNHE S + ID
Subjt:  HYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID

XP_022969033.1 nucleolar complex protein 4 homolog B [Cucurbita maxima]

1.3e-281

86.6

Show/hide

Query:  KKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFVKS
        KK++K ++ H LS+LKTLGLQLLSS+AHINNLPLLLTF+SP+ PP YVLEALLSLQSFFITVLPSLPSSSKPA   D  DDAELIYRTWLRSKFD+ VKS
Subjt:  KKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFVKS

Query:  LIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKANG
        LIDVAVSSECDDTLKEIVLDAIMEFVKVGN+GKFHSAVYHRFLQSIAHS+ PVNTLIALLVKKYFNH+DVRYFTYISIEKL +TFEAEYMS DR+V+ NG
Subjt:  LIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKANG

Query:  DDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEVL
        DDG HSREGVEFIHIVH+I SSIPPLENSNQ SDYTMWV+SGDDKVLSDNQEAKQ  M KND+EVLSAS+IVR+MK KFT+AWISFLRLPLPIDV+KEVL
Subjt:  DDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEVL

Query:  VNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLS
        V LD+ VIPYL+NPIILCDFLTKSYD+GGVVSVMALSSL+LL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLS
Subjt:  VNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLS

Query:  RLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHHY
        RLSLVVPPSGAL+IIALIHNLLRRHPSINCLVHREN++ESK DD+T + VA G+DA  V+AD+ NMKPGID FNYEETDPIKSSALRSSLWEID LRHHY
Subjt:  RLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHHY

Query:  CPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID
        CPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSYATILGQELKKKMKRVPLAFYQ IPT+LFSESDF GWSFNHE S + ID
Subjt:  CPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID

XP_023554434.1 nucleolar complex protein 4 homolog B [Cucurbita pepo subsp. pepo]

6.7e-281

85.23

Show/hide

Query:  SMASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSK
        S+  +  KK++K ++ H LS+LKTLGLQLLSSRAHINNLPLLLTF+SP+ PP YVLEALLSLQSFFITVLPSLPSSSKPA   D  DDAELIYRTWLRSK
Subjt:  SMASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSK

Query:  FDDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDD
        FD+ VKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHS+TPVNTLIALLVKKYFNH+DVRYFTYISIEKL +TFEAEYMS D
Subjt:  FDDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDD

Query:  RNVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPI
        R+V+ N DDG HSREGVEFIHIVH+I SSIPPLENSNQ SDYTMWV+SGD+KVLSDNQEAKQ  M KND+EVL+ASKIVR+MK KFT+AWISFLRLPLPI
Subjt:  RNVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPI

Query:  DVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAA
        DV+KEVLV LD+ VIPYL+NPIILCDFLTKSYD+GGVVSVMALSSL+LL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAA
Subjt:  DVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAA

Query:  AFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEI
        AFAKKLSRLSLV+PPSG+L+IIALIHNLLRRHPSINCLVHREN++ESK DD+T + VA G+DA  V+AD+PNMKPGID FNYEETDPIKSSALRSSLWEI
Subjt:  AFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEI

Query:  DSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID
        D LRHHYCPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSY TILGQELKKKMKRVPLAFYQ IPT+LFSE DF GWSFNHE S + I+
Subjt:  DSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID

TrEMBL top hits

e value

%identity

Alignment

A0A2N9HLL5 CBF domain-containing protein

4.1e-308

53.45

Show/hide

Query:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK
        M +  CDFR LLL+AAVAFIYIQMRLFATQS+YADRLA AVE+E HCTSQMRLLIDQISMQQG+IV L+EE+KR  EE  QLK L+++LERKGL + TDK
Subjt:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK

Query:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH
         QVPVAAVVIMACNRADYLERTIKS+LKYQ +VA KYP+FVSQDGS+ DVK KALSYDQLTYMQHLDY +V+TERPGEL+AYYKIARHYKWALD+LFYKH
Subjt:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH

Query:  NFSRVIILE----------------DDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF-----------------------
        NFSRVIILE                DDMEIAPDFF YFEAAA LL+KDK+IMAVSSWNDNGQKQFVHDP  L+  +F                       
Subjt:  NFSRVIILE----------------DDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF-----------------------

Query:  ----------SRHSEQKLNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEH
                  +  S    + +GSS+GQFF+QYLEPIKLNDVQ+DWKSMDLSYLME+KY K+FAD++++AKPV+G D V+KAYN  GDVRI+Y DQ +FE 
Subjt:  ----------SRHSEQKLNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEH

Query:  IARQFGIFEEWKILSSVWEYEVHISIRGIILSAIGVVRPD------IQTGP-------------LSVPAESFVRTSMAST--------------------
        IA QFGIFEEWK       Y+  +  R      + +V PD      I+  P                  ES  R  +A+                     
Subjt:  IARQFGIFEEWKILSSVWEYEVHISIRGIILSAIGVVRPD------IQTGP-------------LSVPAESFVRTSMAST--------------------

Query:  ----------------------------------LSKKQRKKKEKHTLS--ELKTLGLQLLSSRA----HI---NNLPLL----------------LTFL
                                          + ++ R  KE+ T        LG + L SRA    H+     + LL                L  +
Subjt:  ----------------------------------LSKKQRKKKEKHTLS--ELKTLGLQLLSSRA----HI---NNLPLL----------------LTFL

Query:  SPTSPPHYVLEALLSLQSFFITVL------------------------------------------PSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDF
             P  +L ++ S + FF+T                                             SLP SSKP    + HDD + IY TWLRSKFD F
Subjt:  SPTSPPHYVLEALLSLQSFFITVL------------------------------------------PSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDF

Query:  VKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVK
        V SLI+ A S   D TLKE+VLD  MEFVK     +              HST  VN ++ LLV KYF +ID+RYFTYIS+E+LA+T ++          
Subjt:  VKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVK

Query:  ANGDDGGHSREGVE-FIHIVHAIKSSIPPLENSNQISDYTMWVQSG------DDKVLSDNQEA--KQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLR
           +D  HSR GVE  I  VH I S IP LE     SDY MW +SG      D K LS N +A  +Q    K D  VLSA+KI ++MKLKFT+AWISFLR
Subjt:  ANGDDGGHSREGVE-FIHIVHAIKSSIPPLENSNQISDYTMWVQSG------DDKVLSDNQEA--KQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLR

Query:  LPLPIDVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLP
        L LP+DV+KEVLV+L + VIPYL+NPI+LCDFLT+SYDIGGVVSVMALSSL++L+T+YGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKS LLP
Subjt:  LPLPIDVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLP

Query:  AYLAAAFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENI--------NESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDP
        AYLAAAFAK+LSRLSL VPPSGALVIIALIHNLLRRHPSINCLVHR+ +        +E+ KD++  E   GG    G D  S   K GIDHF+ E+++P
Subjt:  AYLAAAFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENI--------NESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDP

Query:  IKSSALRSSLWEIDSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEK
        IKS A++SSLWEID+LRHHYCPPVSR VLSLENDLTVR+KTTE+ +KDF +GSYATI G E+++++K+VPLAFY+  PT+LFSESDF GW+F ++   EK
Subjt:  IKSSALRSSLWEIDSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEK

Query:  IDE
         D+
Subjt:  IDE

A0A5D3DJ82 Nucleolar complex protein 4-like protein

2.8e-269

84.6

Show/hide

Query:  KKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVA-DDPHDDAELIYRTWLRSKFDDFVK
        KK  K ++ H+LS+LKTLGLQLLSSRAHINNLPLLLTF+SP+SPP YVLEALLSLQSFFIT LPSLPSSSKP +A DD   DAE IYRTWLRSKFD+ VK
Subjt:  KKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVA-DDPHDDAELIYRTWLRSKFDDFVK

Query:  SLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKAN
        SLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIA S+TPV+TLIALLVKKYF+++DVRYFTYISI++LAK F+AEYMS        
Subjt:  SLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKAN

Query:  GDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEV
        GD GGHS+EGVEFIHIVH+I SSIPPLENSNQ SDYTMWV+SGD+KVLSD+QEAKQ  M KND+EVL+ASKIVRRMKLKF++AWISFL+LPLPIDV+KEV
Subjt:  GDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEV

Query:  LVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKL
        LV LD+ VIPYL+ PIIL DFLTKSYDIGGV+SVMALSSL+LL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKL
Subjt:  LVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKL

Query:  SRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHH
        SRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHREN+ ESK DD+T E  A G+DA  VDAD+P MKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHH
Subjt:  SRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHH

Query:  YCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQS
        YCPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSY+TILGQELKKK+KRVPLAFYQ  PTTLFSESDF GWSF++E S
Subjt:  YCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQS

A0A6J1C6T4 nucleolar complex protein 4 homolog

9.3e-297

89.64

Show/hide

Query:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF
        MAS LS     KKEKHTLSELKTLGLQLLSSRAHINNLPLLLTF+SPTSPPHYVLEALLSLQSFF+TVLPSLPSSSKPA ADDP DDAELIY+TWLRSKF
Subjt:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF

Query:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR
        D+FVKSLIDVAVSS+CDDTLKEIVLDAIMEFVKVGNKGKFHSAVYH+FLQ+IAHSTTPVNTLIALLVKKYF H+DVRYFTYISIEKLAK FEAEYMS D 
Subjt:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR

Query:  NVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPID
        NV+ N DDGGHS EGVE IHIVH+I SSIPPLENSNQISDYTMWV+SGDDKV+ DNQE KQ  MGKNDKEVLSASKIV+RMK+KFTRAWISFLRLPLPID
Subjt:  NVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPID

Query:  VFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAA
        V+KEVLV LD+ VIPYL+NPIILCDFLTKSYDIGGVVSVMALSSLYLL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAA
Subjt:  VFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAA

Query:  FAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEID
        FAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKD++TDE VA G+DA GVDAD+PN KPGIDHFNYEETDPIKSSALRSSLWEID
Subjt:  FAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEID

Query:  SLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKIDE
        SLRHHYCPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSYATILGQELKKKMKRVPLAFYQ IPTTLFSESDF GWSF+H+ S   ID+
Subjt:  SLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKIDE

A0A6J1GJR4 nucleolar complex protein 4 homolog

3.2e-281

86.47

Show/hide

Query:  SKKQRKKKEK-HTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFV
        S+K++KK EK H LS+LKTLGLQLLSSRAHINNLPLLLTFLSP+ PP YVLEALLSLQSFFITVLPSLPSSSKPA   D  DDAELIYRTWLRSKFD+ V
Subjt:  SKKQRKKKEK-HTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFV

Query:  KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKA
        KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGN+GKFHSA+YHRFLQSIAHS+TPVNTLIALLVKKYFNH+DVRYFTYISIEKL +TFEAEYM  DR+V+ 
Subjt:  KSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKA

Query:  NGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKE
        +GDDG HSR+GVEFIHIVH+I SSIPPLENSNQ SDYTMWV+SGD+KVLSDNQEAKQ  M KND+EVL+ASKIVR+MK KFT+AWISFLRLPLPIDV+KE
Subjt:  NGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKE

Query:  VLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK
        VLV LD+ VIPYL+NPIILCDFLTKSYD+GGVVSVMALSSL+LL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK
Subjt:  VLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKK

Query:  LSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRH
        LSRLSLVVPPSGAL+IIALIHNLLRRHPSINCLVHREN++ESK DD+T + VA G+DA  V+AD+PNMKPGID FNYEETDPIKSSALRSSLWEID LRH
Subjt:  LSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRH

Query:  HYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID
        HYCPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSYATILGQELKKKMKRVPLAFYQ IPT+LFS SDF GWSFNHE S + ID
Subjt:  HYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID

A0A6J1HZT8 nucleolar complex protein 4 homolog B

6.5e-282

86.6

Show/hide

Query:  KKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFVKS
        KK++K ++ H LS+LKTLGLQLLSS+AHINNLPLLLTF+SP+ PP YVLEALLSLQSFFITVLPSLPSSSKPA   D  DDAELIYRTWLRSKFD+ VKS
Subjt:  KKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFVKS

Query:  LIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKANG
        LIDVAVSSECDDTLKEIVLDAIMEFVKVGN+GKFHSAVYHRFLQSIAHS+ PVNTLIALLVKKYFNH+DVRYFTYISIEKL +TFEAEYMS DR+V+ NG
Subjt:  LIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKANG

Query:  DDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEVL
        DDG HSREGVEFIHIVH+I SSIPPLENSNQ SDYTMWV+SGDDKVLSDNQEAKQ  M KND+EVLSAS+IVR+MK KFT+AWISFLRLPLPIDV+KEVL
Subjt:  DDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEVL

Query:  VNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLS
        V LD+ VIPYL+NPIILCDFLTKSYD+GGVVSVMALSSL+LL+TKYGLEYPNFYEKLY LLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLS
Subjt:  VNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLS

Query:  RLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHHY
        RLSLVVPPSGAL+IIALIHNLLRRHPSINCLVHREN++ESK DD+T + VA G+DA  V+AD+ NMKPGID FNYEETDPIKSSALRSSLWEID LRHHY
Subjt:  RLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHHY

Query:  CPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID
        CPPVSRLVLSLENDLTVRSKTTE+D+KDFVAGSYATILGQELKKKMKRVPLAFYQ IPT+LFSESDF GWSFNHE S + ID
Subjt:  CPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKID

SwissProt top hits

e value

%identity

Alignment

F4IMH3 Protein NUCLEOLAR COMPLEX ASSOCIATED 4

3.4e-179

57.29

Show/hide

Query:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF
        MAS LSKKQ KK EK+TL ELK+LG  LL+SR+HINNLPLLLTF+SP SPP +V+E+LLSLQSFF  +L  LP +S  + +    +D E++++ WLRSKF
Subjt:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF

Query:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR
        D+FVK L+DV VS + +D+L+ IVL  +MEFVK+ N G+FHS++YHR L +I HS   +   + +L  KYF +IDVRYFTYIS+EK  KT EA  +S DR
Subjt:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR

Query:  NVKANGDDGGHSREGVEF-IHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPI
         V  N +    S+E +E  +  ++ + S IPP E   + S + MW  SG D+ +S+    K+    K D  +LS + I +RMKLKFT+AWISFLRLPLPI
Subjt:  NVKANGDDGGHSREGVEF-IHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPI

Query:  DVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAA
        DV+KEVL ++   VIP+L+NP +LCDFLTKSYDIGGVVSVMALSSL++L+T++GLEYP FYEKLY LLVPS+F+AKHRAKF QLLD+CLKS +LPAYLAA
Subjt:  DVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAA

Query:  AFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEI
        +F KKLSRLSL +PP+G+LVI ALI+NLLRR+P+IN LV      +   ++A +     G             K GID+FN +E+DP KS AL+SSLWEI
Subjt:  AFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEI

Query:  DSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQ
        D+LRHHYCPPVSR + SLE +LT+RSKTTE+ I+DF +GSYATI G E+++++K+VPLAFY+ +PT+LF++SDF GW+F   Q
Subjt:  DSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQ

Q5ZJC7 Nucleolar complex protein 4 homolog

8.4e-53

30.6

Show/hide

Query:  LLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVL--PSLPSSSKPAVADDPHDD--AELIYRTWLRSKFDDFVKSLIDVAVSSECDDTLKEI
        +L  R + N +  +L  L+       VL A  + +  F  +L    L + S PA  D    +  AE  Y+ W+R +++D V+SL ++         +KE 
Subjt:  LLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVL--PSLPSSSKPAVADDPHDD--AELIYRTWLRSKFDDFVKSLIDVAVSSECDDTLKEI

Query:  VLDAIMEFVK-------VGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLV---KKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKANGDDGGHSR
         L  +M+FV+       V  + K   A     L+ + +   P++   +LL+   ++Y  + DVRYF    + K+      + M   + +K          
Subjt:  VLDAIMEFVK-------VGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLV---KKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDRNVKANGDDGGHSR

Query:  EGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEVLVNLDEGV
          + F      + S I P+   N+  D   ++                  M ++++E    SK+ +  K  F R W++FL+  LP  ++K+VLV L + +
Subjt:  EGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPIDVFKEVLVNLDEGV

Query:  IPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLSRLSLVVP
        +PY+  P ++ DFLT +Y +GG +S++AL+ L++L+ ++ LEYP+FY+KLY+LL PSI+  K+RA+FF L D  L S  LPAYL AAF K+LSRL+L  P
Subjt:  IPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAAAFAKKLSRLSLVVP

Query:  PSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHHYCPPVSRL
        P   L++I  I NL RRHP+   L+HR N  +   +D                            +  E+ +P +S AL SSLWE+ SL++HY P V++ 
Subjt:  PSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRHHYCPPVSRL

Query:  VLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQV
           L   L+      E DI   +  S + +  +E+KK    VPL F QV
Subjt:  VLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQV

Q6NU91 Nucleolar complex protein 4 homolog B

1.1e-52

30.35

Show/hide

Query:  MASTLSKKQRKKKEKHTLSELKTLGLQL---LSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVL---PSLPSSSKPAVADDPHD--DAELIY
        MA+  +K   + +   + +E + L  +L   L SR + N +  +L  L   S    V++A +   S    VL     L     PA  D P D   AE  Y
Subjt:  MASTLSKKQRKKKEKHTLSELKTLGLQL---LSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVL---PSLPSSSKPAVADDPHD--DAELIY

Query:  RTWLRSKFDDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVY---HRF----LQSIAHSTTPVN---TLIALLVKKYFNHIDVRYFTYI
        + W+R++++  V  L+D+   S    +++E+VL  +M+F+++  K    ++ +   +RF    L+ +  +        TL+    ++Y  + DVRY+T  
Subjt:  RTWLRSKFDDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVY---HRF----LQSIAHSTTPVN---TLIALLVKKYFNHIDVRYFTYI

Query:  SIEKLAKTFEAEYMSDDRNVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSN---QISDYTMWVQS---GDDKVL-SDNQEAKQPGMGKNDKEVLSAS
            +  T E       +N                        K  +PP+  +N    +S   M V+    G+  V  ++N E  +P   K  K V    
Subjt:  SIEKLAKTFEAEYMSDDRNVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSN---QISDYTMWVQS---GDDKVL-SDNQEAKQPGMGKNDKEVLSAS

Query:  KIVRRMKLKFTRAWISFLRLPLPIDVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAK
                 F R W+SFL+  L + ++K+VL+ L E ++P+++ P ++ DFLT +YD+GG +S++AL+ L++L+ ++ LEYP+FY+KLY+LL PS+F  K
Subjt:  KIVRRMKLKFTRAWISFLRLPLPIDVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAK

Query:  HRAKFFQLLDSCLKSPLLPAYLAAAFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPG
        +RA+FF L +  L S  LP YL AAFAK+L+RL+L  PP   L+II  I NL+RRHP+   L+HR     S  D  TD  +                   
Subjt:  HRAKFFQLLDSCLKSPLLPAYLAAAFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPG

Query:  IDHFNYEETDPIKSSALRSSLWEIDSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAG
              EE DP KS AL S LWE++ L+ HY   V R    +   L+ +    E D+   +  S   +  +E+KKK K VPL  Y+ +   L  +SD   
Subjt:  IDHFNYEETDPIKSSALRSSLWEIDSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAG

Query:  WSF
          F
Subjt:  WSF

Q8BHY2 Nucleolar complex protein 4 homolog

3.0e-50

40.99

Show/hide

Query:  VRRMKLKFTRAWISFLRLPLPIDVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHR
        ++  K  F   W+ FL+  LP+ ++K+VLV + + ++P+LA P ++ DFLT + D+GG +S++AL+ L++L+ K+ LEYP+FY+KLY LL PSIF  K+R
Subjt:  VRRMKLKFTRAWISFLRLPLPIDVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHR

Query:  AKFFQLLDSCLKSPLLPAYLAAAFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGID
        A+FF L D  L S  LPAYL AAFAK+L+RL+L  PP   L+++ LI NLLRRHP+   +VHR                      P +DAD         
Subjt:  AKFFQLLDSCLKSPLLPAYLAAAFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGID

Query:  HFNYEETDPIKSSALRSSLWEIDSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKM-KRVPLAF
         ++  E DP +S AL S LWE+ +L+ HY P VS+    +   L+V     E+ I   +  +   I  Q+LKKKM + VPL F
Subjt:  HFNYEETDPIKSSALRSSLWEIDSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKM-KRVPLAF

Q9XGM8 Alpha-1,3-mannosyl-glycoprotein 2-beta-N-acetylglucosaminyltransferase

1.2e-136

58.14

Show/hide

Query:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK
        M    CD RFLL+ AA  FIYIQMRLF TQSQYADRL+ A+ESENHCTSQMR LID++S++Q +IVALE+ + R +EE +QLK L+Q  E+KG+ +LT  
Subjt:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK

Query:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH
         Q+PVAAVV+MAC+RADYLERT+KSVL YQT VASKYP+F+SQDGS+  VK K+LSY+QLTYMQHLD+  V TERPGEL AYYKIARHYKWALDQLFYKH
Subjt:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH

Query:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF--------------------------------SRHSEQK
         FSRVIILEDDMEIAPDFF YFEAAA L+++DKTIMA SSWNDNGQKQFVHDP  L+   F                                  H  ++
Subjt:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF--------------------------------SRHSEQK

Query:  -----------LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFG
                     + GSSLGQFF QYLEPIKLNDV +DWK+ DL YL E  Y KYF+ ++R+A+P+ G+D V+KA N   DVRI Y+DQ +FE IA +FG
Subjt:  -----------LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFG

Query:  IFEEWKILSSVWEYEVHISIRGIILSAIGVVRPDIQTGPLSV
        IFEEWK      +     + +G+++  I   R     GP SV
Subjt:  IFEEWKILSSVWEYEVHISIRGIILSAIGVVRPDIQTGPLSV

Arabidopsis top hits

e value

%identity

Alignment

AT2G17250.1 CCAAT-binding factor

2.4e-180

57.29

Show/hide

Query:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF
        MAS LSKKQ KK EK+TL ELK+LG  LL+SR+HINNLPLLLTF+SP SPP +V+E+LLSLQSFF  +L  LP +S  + +    +D E++++ WLRSKF
Subjt:  MASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSFFITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKF

Query:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR
        D+FVK L+DV VS + +D+L+ IVL  +MEFVK+ N G+FHS++YHR L +I HS   +   + +L  KYF +IDVRYFTYIS+EK  KT EA  +S DR
Subjt:  DDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHIDVRYFTYISIEKLAKTFEAEYMSDDR

Query:  NVKANGDDGGHSREGVEF-IHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPI
         V  N +    S+E +E  +  ++ + S IPP E   + S + MW  SG D+ +S+    K+    K D  +LS + I +RMKLKFT+AWISFLRLPLPI
Subjt:  NVKANGDDGGHSREGVEF-IHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLKFTRAWISFLRLPLPI

Query:  DVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAA
        DV+KEVL ++   VIP+L+NP +LCDFLTKSYDIGGVVSVMALSSL++L+T++GLEYP FYEKLY LLVPS+F+AKHRAKF QLLD+CLKS +LPAYLAA
Subjt:  DVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLPAYLAA

Query:  AFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEI
        +F KKLSRLSL +PP+G+LVI ALI+NLLRR+P+IN LV      +   ++A +     G             K GID+FN +E+DP KS AL+SSLWEI
Subjt:  AFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEI

Query:  DSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQ
        D+LRHHYCPPVSR + SLE +LT+RSKTTE+ I+DF +GSYATI G E+++++K+VPLAFY+ +PT+LF++SDF GW+F   Q
Subjt:  DSLRHHYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQ

AT4G38240.1 alpha-1,3-mannosyl-glycoprotein beta-1,2-N-acetylglucosaminyltransferase, putative

8.7e-138

58.14

Show/hide

Query:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK
        M    CD RFLL+ AA  FIYIQMRLF TQSQYADRL+ A+ESENHCTSQMR LID++S++Q +IVALE+ + R +EE +QLK L+Q  E+KG+ +LT  
Subjt:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK

Query:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH
         Q+PVAAVV+MAC+RADYLERT+KSVL YQT VASKYP+F+SQDGS+  VK K+LSY+QLTYMQHLD+  V TERPGEL AYYKIARHYKWALDQLFYKH
Subjt:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH

Query:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF--------------------------------SRHSEQK
         FSRVIILEDDMEIAPDFF YFEAAA L+++DKTIMA SSWNDNGQKQFVHDP  L+   F                                  H  ++
Subjt:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF--------------------------------SRHSEQK

Query:  -----------LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFG
                     + GSSLGQFF QYLEPIKLNDV +DWK+ DL YL E  Y KYF+ ++R+A+P+ G+D V+KA N   DVRI Y+DQ +FE IA +FG
Subjt:  -----------LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFG

Query:  IFEEWKILSSVWEYEVHISIRGIILSAIGVVRPDIQTGPLSV
        IFEEWK      +     + +G+++  I   R     GP SV
Subjt:  IFEEWKILSSVWEYEVHISIRGIILSAIGVVRPDIQTGPLSV

AT4G38240.2 alpha-1,3-mannosyl-glycoprotein beta-1,2-N-acetylglucosaminyltransferase, putative

8.7e-138

58.14

Show/hide

Query:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK
        M    CD RFLL+ AA  FIYIQMRLF TQSQYADRL+ A+ESENHCTSQMR LID++S++Q +IVALE+ + R +EE +QLK L+Q  E+KG+ +LT  
Subjt:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK

Query:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH
         Q+PVAAVV+MAC+RADYLERT+KSVL YQT VASKYP+F+SQDGS+  VK K+LSY+QLTYMQHLD+  V TERPGEL AYYKIARHYKWALDQLFYKH
Subjt:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH

Query:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF--------------------------------SRHSEQK
         FSRVIILEDDMEIAPDFF YFEAAA L+++DKTIMA SSWNDNGQKQFVHDP  L+   F                                  H  ++
Subjt:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF--------------------------------SRHSEQK

Query:  -----------LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFG
                     + GSSLGQFF QYLEPIKLNDV +DWK+ DL YL E  Y KYF+ ++R+A+P+ G+D V+KA N   DVRI Y+DQ +FE IA +FG
Subjt:  -----------LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFG

Query:  IFEEWKILSSVWEYEVHISIRGIILSAIGVVRPDIQTGPLSV
        IFEEWK      +     + +G+++  I   R     GP SV
Subjt:  IFEEWKILSSVWEYEVHISIRGIILSAIGVVRPDIQTGPLSV

AT4G38240.3 alpha-1,3-mannosyl-glycoprotein beta-1,2-N-acetylglucosaminyltransferase, putative

4.6e-139

59.63

Show/hide

Query:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK
        M    CD RFLL+ AA  FIYIQMRLF TQSQYADRL+ A+ESENHCTSQMR LID++S++Q +IVALE+ + R +EE +QLK L+Q  E+KG+ +LT  
Subjt:  MGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQYADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDK

Query:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH
         Q+PVAAVV+MAC+RADYLERT+KSVL YQT VASKYP+F+SQDGS+  VK K+LSY+QLTYMQHLD+  V TERPGEL AYYKIARHYKWALDQLFYKH
Subjt:  TQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVSQDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKH

Query:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF---------------------SRHSEQK-----------
         FSRVIILEDDMEIAPDFF YFEAAA L+++DKTIMA SSWNDNGQKQFVHDP  L+   F                       H  ++           
Subjt:  NFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHDPCKLFMDSF---------------------SRHSEQK-----------

Query:  LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFGIFEEWKILSSV
          + GSSLGQFF QYLEPIKLNDV +DWK+ DL YL E  Y KYF+ ++R+A+P+ G+D V+KA N   DVRI Y+DQ +FE IA +FGIFEEWK     
Subjt:  LNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFGIFEEWKILSSV

Query:  WEYEVHISIRGIILSAIGVVRPDIQTGPLSV
         +     + +G+++  I   R     GP SV
Subjt:  WEYEVHISIRGIILSAIGVVRPDIQTGPLSV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCAGGAAGCACAAACCCTAATGCACAGCAGAGCCCACTCCCAACCAAAGACAAGAAATCTGTAAAATTAGGCACCCACATCGCCATTAAAGTCGCCATTAGAACCAG
CAGCCATCTCAGCCACACGCAGTATCGTCCTCCCGAGAATCGCCTCTCCACAATCTCATACGCTGGATTCATCATCAATGGCATTGTGAAGAAGAGGTTTATACAGAGAC
CCAGTTTCACAATCGCGCTCAGCAATCCTGGACCCATATTTGAAGTAATCACATCGCTTGTTTCTTGGCCAAAAGCGAAGTACCCCAGAATCCCAAATCCTCCATATAGA
ATGGCAATGAACGCCATTGAAGAAGCCAAGATCTTCCCGAACCTGCATAAGCAGCCACTCCCATGCCGTAGAAGAACACCGAGAGCCCTCCGAAGGCCTCCACTGGAGGT
CTCCGCTTCAAGAAAACGAAAATGTCCTCAACCATCACCACCCCCATGGCTCCTAGGAATTGATCTCGGAGGCGCCGTCGGCGACGAGCTTCCGGCGAGTGTAGACGAGA
AGCATCATGCAGTAATAGGTGATGGCCGCGACGGAGAAGAGCATGAGGAGGCCCATAGCCCATCCAGTGCGCTTGAACGCACGTTGGCAAACGTCTTCGCTTGGGAGGAT
CGAGGCCGTCCGCCGCCGAGGAGCGGCGTGTTTTCTCCCGGCGGAGGAGGCTTGAGGCGAGCTTCTCGGCTGTGTGATTGGCTGGATGGAGAAGAAAGGAAAGAAAATGG
CAGAGTTCAAGCCCCTAAGCAACGCGCACATTTGCAAGCACGGCGTAATTTGACCAATGCTGTAAACCGCGGATCAAAAAGAAAGAAGAAGAAGACGAAGAAGAAGAAGA
AGAAGAAACCACAGATGGGTAGTTTCTTCTGCGATTTCCGGTTCCTACTTCTCATTGCAGCTGTGGCGTTCATCTACATCCAGATGCGGCTATTCGCGACACAATCACAA
TATGCAGATCGGCTAGCTGAAGCAGTTGAATCAGAGAATCACTGTACCAGTCAAATGCGATTACTAATTGATCAGATAAGCATGCAACAAGGACAAATTGTTGCCCTTGA
AGAAGAGAGGAAACGCCACAATGAGGAACGCATCCAGCTGAAGACTCTCCTTCAAGATCTTGAAAGGAAAGGTCTGCACCAACTCACCGACAAAACACAGGTGCCTGTGG
CAGCTGTTGTGATTATGGCATGCAATCGTGCAGATTATCTGGAAAGGACCATTAAGTCTGTTCTAAAATATCAAACAACTGTTGCTTCAAAATATCCTGTTTTTGTTTCC
CAGGATGGTTCAAACTCAGATGTAAAAAGAAAGGCTCTTAGCTATGATCAGTTGACCTATATGCAGCATTTAGATTATGGAGAAGTGGAAACTGAAAGGCCAGGGGAGTT
GATTGCATATTACAAAATTGCACGTCATTACAAATGGGCGTTGGATCAATTATTCTACAAGCATAATTTCAGCCGAGTGATCATACTTGAAGATGATATGGAAATTGCTC
CTGATTTTTTCAGTTACTTTGAGGCTGCAGCAATGCTACTTGAAAAGGATAAGACCATAATGGCCGTCTCTTCATGGAATGACAATGGACAAAAGCAGTTTGTGCACGAT
CCTTGTAAGTTATTTATGGATTCCTTCTCCAGACATTCAGAACAAAAATTGAATGATATGGGTTCCAGTTTGGGTCAATTTTTCAGGCAATACCTTGAGCCAATAAAGTT
GAATGACGTTCAAATCGACTGGAAGTCTATGGATTTGAGCTACCTGATGGAGGACAAGTACGTGAAGTACTTTGCCGATGTTATTAGAAAAGCAAAACCTGTTTATGGAA
ATGATGCAGTTATGAAGGCTTATAATACTGCTGGTGATGTTCGAATAGAGTACAGAGACCAGTCAGACTTTGAACACATTGCTCGGCAGTTCGGAATTTTTGAAGAGTGG
AAGATTCTCTCAAGCGTTTGGGAATATGAAGTACACATCAGTATACGAGGTATAATCTTATCCGCGATAGGAGTAGTACGCCCCGATATACAAACGGGCCCGCTCTCCGT
TCCCGCCGAGAGCTTCGTACGAACTTCAATGGCTTCCACTCTCTCAAAGAAGCAGCGGAAGAAGAAGGAGAAGCACACGCTTTCAGAGCTCAAAACCCTAGGCCTCCAAC
TCCTCTCTTCTCGAGCTCACATCAACAACCTTCCTCTCCTCCTCACCTTCCTCTCTCCCACTTCTCCTCCTCACTATGTTCTCGAAGCCCTCCTCTCCCTCCAGTCCTTC
TTCATCACCGTCCTCCCCTCGCTCCCTTCCTCTTCCAAGCCCGCCGTCGCCGACGACCCCCATGATGATGCTGAGTTGATATACCGGACCTGGCTCCGTTCCAAGTTTGA
TGACTTCGTCAAGTCGCTCATCGATGTCGCGGTTTCTTCCGAATGCGATGACACTCTCAAGGAGATTGTATTGGATGCGATCATGGAGTTTGTTAAAGTCGGAAACAAGG
GGAAATTTCACTCTGCTGTATATCACAGATTTTTGCAGAGTATCGCTCATTCTACGACGCCAGTTAATACTCTGATAGCCTTGCTTGTAAAGAAGTACTTCAATCACATC
GACGTCCGTTATTTTACATATATTAGCATTGAAAAACTTGCCAAGACTTTTGAGGCTGAGTACATGTCTGATGATAGAAATGTGAAGGCTAATGGCGATGATGGTGGTCA
TTCGAGAGAAGGAGTGGAGTTCATTCACATTGTGCACGCTATCAAATCTTCCATTCCCCCTTTGGAAAACTCAAATCAAATATCTGACTACACCATGTGGGTTCAATCAG
GTGATGACAAAGTGCTTTCTGACAATCAAGAAGCGAAGCAGCCTGGGATGGGGAAAAATGATAAAGAGGTCTTATCAGCATCGAAGATTGTTAGAAGAATGAAACTAAAA
TTTACAAGAGCATGGATTTCATTTCTCAGGTTACCTCTTCCAATAGATGTGTTCAAGGAGGTTCTTGTTAATCTTGATGAGGGAGTCATTCCTTATCTTGCTAATCCAAT
CATATTATGTGACTTCTTAACAAAATCCTATGACATTGGTGGCGTTGTCAGTGTTATGGCTCTTAGCAGCCTCTACCTTCTTGTGACAAAATATGGTTTAGAGTATCCGA
ACTTTTATGAAAAACTTTATACTCTATTGGTTCCTTCAATATTCATGGCAAAACATCGGGCCAAGTTTTTTCAGCTTCTGGATTCTTGCTTGAAGTCACCACTTCTTCCA
GCATACTTGGCTGCTGCTTTTGCTAAGAAATTGAGTAGGCTATCACTTGTTGTTCCTCCATCGGGAGCACTGGTCATTATAGCTCTTATTCACAATCTTTTGAGAAGGCA
TCCCTCAATCAACTGTTTGGTTCACCGGGAAAATATTAACGAGAGTAAGAAAGATGATGCAACAGATGAAAGGGTTGCCGGAGGCTCGGATGCGCCTGGAGTTGATGCTG
ATTCACCCAACATGAAGCCAGGCATCGATCATTTTAACTACGAGGAAACTGATCCTATTAAATCTAGTGCCTTGAGAAGTTCACTTTGGGAAATTGATAGCCTTCGACAC
CACTATTGTCCGCCCGTTTCAAGGTTAGTTTTGTCACTTGAGAATGATCTGACCGTGAGATCGAAAACAACTGAACTTGATATTAAAGATTTCGTTGCTGGTTCATACGC
TACAATACTTGGGCAAGAGTTGAAAAAGAAAATGAAACGAGTCCCCCTGGCATTCTACCAAGTAATCCCCACCACCTTGTTTTCGGAGTCTGATTTTGCTGGCTGGAGTT
TCAATCATGAACAAAGTGGGGAAAAAATTGATGAACGTTGTTACAGTATTTTCTTTCAACAAGGACTCCATTCTAGGAAGCATCAAAATGTGGGAGAAAGAGTGTCGCGT
TTATCTCAGTCGGGATTCTATCAGAACCACCACGTCCTGGATTATTCGTCTTTCTCACAGACGATTGCCTGCTTGAAGCAGTTAATCATCACTCAGAGGGCAGGTGAATT
TGCATCCATTCCATGTACCAGGCAGTCCAAATTAAATTACCAGGCATTGAAATTGAATAATCAGTTTATGCAGATAGAAGGGAGAGATCATGTTTCTTCGGTTACTCAAT
ATGTCCGTACCAGTTTTACTGTATTTATTCAGGCTCGTATAAAATTCACTAATGCCAAAGAGCCCAGTCCTGCCTGCCAGGCTTGGGTCTTATCCATCCATGCAGCACCA
GTTGGGAATGATGGATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAGSTNPNAQQSPLPTKDKKSVKLGTHIAIKVAIRTSSHLSHTQYRPPENRLSTISYAGFIINGIVKKRFIQRPSFTIALSNPGPIFEVITSLVSWPKAKYPRIPNPPYR
MAMNAIEEAKIFPNLHKQPLPCRRRTPRALRRPPLEVSASRKRKCPQPSPPPWLLGIDLGGAVGDELPASVDEKHHAVIGDGRDGEEHEEAHSPSSALERTLANVFAWED
RGRPPPRSGVFSPGGGGLRRASRLCDWLDGEERKENGRVQAPKQRAHLQARRNLTNAVNRGSKRKKKKTKKKKKKKPQMGSFFCDFRFLLLIAAVAFIYIQMRLFATQSQ
YADRLAEAVESENHCTSQMRLLIDQISMQQGQIVALEEERKRHNEERIQLKTLLQDLERKGLHQLTDKTQVPVAAVVIMACNRADYLERTIKSVLKYQTTVASKYPVFVS
QDGSNSDVKRKALSYDQLTYMQHLDYGEVETERPGELIAYYKIARHYKWALDQLFYKHNFSRVIILEDDMEIAPDFFSYFEAAAMLLEKDKTIMAVSSWNDNGQKQFVHD
PCKLFMDSFSRHSEQKLNDMGSSLGQFFRQYLEPIKLNDVQIDWKSMDLSYLMEDKYVKYFADVIRKAKPVYGNDAVMKAYNTAGDVRIEYRDQSDFEHIARQFGIFEEW
KILSSVWEYEVHISIRGIILSAIGVVRPDIQTGPLSVPAESFVRTSMASTLSKKQRKKKEKHTLSELKTLGLQLLSSRAHINNLPLLLTFLSPTSPPHYVLEALLSLQSF
FITVLPSLPSSSKPAVADDPHDDAELIYRTWLRSKFDDFVKSLIDVAVSSECDDTLKEIVLDAIMEFVKVGNKGKFHSAVYHRFLQSIAHSTTPVNTLIALLVKKYFNHI
DVRYFTYISIEKLAKTFEAEYMSDDRNVKANGDDGGHSREGVEFIHIVHAIKSSIPPLENSNQISDYTMWVQSGDDKVLSDNQEAKQPGMGKNDKEVLSASKIVRRMKLK
FTRAWISFLRLPLPIDVFKEVLVNLDEGVIPYLANPIILCDFLTKSYDIGGVVSVMALSSLYLLVTKYGLEYPNFYEKLYTLLVPSIFMAKHRAKFFQLLDSCLKSPLLP
AYLAAAFAKKLSRLSLVVPPSGALVIIALIHNLLRRHPSINCLVHRENINESKKDDATDERVAGGSDAPGVDADSPNMKPGIDHFNYEETDPIKSSALRSSLWEIDSLRH
HYCPPVSRLVLSLENDLTVRSKTTELDIKDFVAGSYATILGQELKKKMKRVPLAFYQVIPTTLFSESDFAGWSFNHEQSGEKIDERCYSIFFQQGLHSRKHQNVGERVSR
LSQSGFYQNHHVLDYSSFSQTIACLKQLIITQRAGEFASIPCTRQSKLNYQALKLNNQFMQIEGRDHVSSVTQYVRTSFTVFIQARIKFTNAKEPSPACQAWVLSIHAAP
VGNDG

Sgr004879 (gene) of Monk fruit (Qingpiguo) v1 genome