; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

ClCG11G008900 (gene) of Watermelon (Charleston Gray) v2.5 genome

Gene IDClCG11G008900
OrganismCitrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
DescriptionUPF0301 protein
Genome locationCG_Chr11:13131153..13135330
RNA-Seq ExpressionClCG11G008900
SyntenyClCG11G008900
Gene Ontology termsNA
InterPro domainsIPR003774 - Protein of unknown function UPF0301


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6578309.1 hypothetical protein SDJN03_22757, partial [Cucurbita argyrosperma subsp. sororia]1.2e-18388.46Show/hide
Query:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD
        MDLFA NVKNTA  P PFSLKHSFPDRPISC+LAK SRRFS SHP GA+LLRLLEIRVFRP +CSP     +FLVRA AKKN D+SPSPENGDHS+PGDD
Subjt:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD

Query:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG
        AKS NISDG+KSNETSS+K+ HINLDWREFRANLF+REQAEK EAD+D+QS NAHES++LGLKWAHPIP+PETGCVLVATEKLDGVRTFERTV+LLLRSG
Subjt:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG

Query:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV
        SRHP EGPFGVVINRPLHKKIKHMKPTN+DLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARN+LDEAAVLVKKGILKPQDFRFFV
Subjt:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        GYAGWQLDQLREEIES+YWYVAACSSNLI GG SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

XP_004138667.1 uncharacterized protein LOC101222789 [Cucumis sativus]2.5e-18490.06Show/hide
Query:  MDLFATNVKNTAA----PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGDDAK
        MDLFA NVKN AA    PSPFSLKHSFPDRPISC+LA TSR+FSSS+P GAELL LLEIRVF+P L SP FLVRATAKKNHD+SPSPENGDHS+PGDDAK
Subjt:  MDLFATNVKNTAA----PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGDDAK

Query:  SKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSR
        SKNISDGN+SNETSSQK   +NLDWREFRANLFAREQAEK EADV+ Q+ANAHESK L LKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSR
Subjt:  SKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSR

Query:  HPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGY
        HP EGPFGVVINRPLHKKIKHMKPTNIDLATTFS+CSLHFGGPLEASMFLLK GEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGY
Subjt:  HPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGY

Query:  AGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        AGWQLDQLREEIES+YWYVAACSSNLIGG +SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  AGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

XP_008441161.1 PREDICTED: uncharacterized protein LOC103485383 [Cucumis melo]4.1e-18790.14Show/hide
Query:  MDLFATNVKNTAA-------PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGD
        MDLFA NVKNTAA       PSPFSLKHSFPDRPISC+LA TSRRFSSS+P GAELLRLLEIRVF+P L SPAFLVRATAKKNHD+SPSPENGDHS+PGD
Subjt:  MDLFATNVKNTAA-------PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGD

Query:  DAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS
        DAKSKNISDGN+SNETSS+K  H+NLDWREFRANLFAREQAEK EADV+ Q+ANAHESK L LKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS
Subjt:  DAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS

Query:  GSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFF
        GSRHP EGPFGVVINRPLHKKIKHMKPTNIDLATTFS+CSLHFGGPLEASMFLLKTGEKSKLHGFEEV+PGLCFGARN+LDEAAVLVKKGILKPQDFRFF
Subjt:  GSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFF

Query:  VGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        VGYAGWQLDQLREEIES+YWYVAACSSNLIGG +SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  VGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

XP_022993090.1 uncharacterized protein LOC111489210 isoform X2 [Cucurbita maxima]4.2e-18489.01Show/hide
Query:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD
        MDLFA NVKNTA  P PFSLKHSFPDRPISC+LAK SRRFS SHP GA+LLRLLEIRVFRP +CSP     +FLVRA AKKN D+SPSPENGDHS+PGDD
Subjt:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD

Query:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG
        AKS NISDG+KSNETSS+K+ HINLDWREFRANLF+REQAEK EAD+DVQS NAHESK+LGLKWAHPIP+PETGCVLVATEKLDGVRTFERTV+LLLRSG
Subjt:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG

Query:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV
        SRHP EGPFGVVINRPLHKKIKHMKPTN+DLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARN+LDEAAVLVKKGILKPQDFRFFV
Subjt:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        GYAGWQLDQLREEIES+YWYVAACSSNLI GG SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

XP_023550640.1 uncharacterized protein LOC111808722 isoform X2 [Cucurbita pepo subsp. pepo]5.5e-18488.74Show/hide
Query:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD
        MDLFA NVKNTA  P PFSLKHSFPDRPISC+LAK SRRFS SHP GA+LLRLLEIRVFRP +CSP     +FLVRA AKKN D+SPSPENGDHS+PGDD
Subjt:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD

Query:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG
        AKS NISDG+KSNETSS+K+ HINLDWREFRANLF+REQAEK EAD+D+QS NAHESK+LGLKWAHPIP+PETGCVLVATEKLDGVRTFERTV+LLLRSG
Subjt:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG

Query:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV
        SRHP EGPFGVVINRPLHKKIKHMKPTN+DLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARN+LDEAAVLVKKGILKPQDFRFFV
Subjt:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        GYAGWQLDQLREEIES+YWYVAACSSNLI GG SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

TrEMBL top hitse value%identityAlignment
A0A0A0LMD9 Uncharacterized protein1.2e-18490.06Show/hide
Query:  MDLFATNVKNTAA----PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGDDAK
        MDLFA NVKN AA    PSPFSLKHSFPDRPISC+LA TSR+FSSS+P GAELL LLEIRVF+P L SP FLVRATAKKNHD+SPSPENGDHS+PGDDAK
Subjt:  MDLFATNVKNTAA----PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGDDAK

Query:  SKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSR
        SKNISDGN+SNETSSQK   +NLDWREFRANLFAREQAEK EADV+ Q+ANAHESK L LKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSR
Subjt:  SKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSR

Query:  HPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGY
        HP EGPFGVVINRPLHKKIKHMKPTNIDLATTFS+CSLHFGGPLEASMFLLK GEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGY
Subjt:  HPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGY

Query:  AGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        AGWQLDQLREEIES+YWYVAACSSNLIGG +SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  AGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

A0A1S3B2S1 uncharacterized protein LOC1034853832.0e-18790.14Show/hide
Query:  MDLFATNVKNTAA-------PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGD
        MDLFA NVKNTAA       PSPFSLKHSFPDRPISC+LA TSRRFSSS+P GAELLRLLEIRVF+P L SPAFLVRATAKKNHD+SPSPENGDHS+PGD
Subjt:  MDLFATNVKNTAA-------PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGD

Query:  DAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS
        DAKSKNISDGN+SNETSS+K  H+NLDWREFRANLFAREQAEK EADV+ Q+ANAHESK L LKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS
Subjt:  DAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS

Query:  GSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFF
        GSRHP EGPFGVVINRPLHKKIKHMKPTNIDLATTFS+CSLHFGGPLEASMFLLKTGEKSKLHGFEEV+PGLCFGARN+LDEAAVLVKKGILKPQDFRFF
Subjt:  GSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFF

Query:  VGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        VGYAGWQLDQLREEIES+YWYVAACSSNLIGG +SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  VGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

A0A5A7T638 UPF0301 protein2.0e-18790.14Show/hide
Query:  MDLFATNVKNTAA-------PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGD
        MDLFA NVKNTAA       PSPFSLKHSFPDRPISC+LA TSRRFSSS+P GAELLRLLEIRVF+P L SPAFLVRATAKKNHD+SPSPENGDHS+PGD
Subjt:  MDLFATNVKNTAA-------PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGD

Query:  DAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS
        DAKSKNISDGN+SNETSS+K  H+NLDWREFRANLFAREQAEK EADV+ Q+ANAHESK L LKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS
Subjt:  DAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRS

Query:  GSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFF
        GSRHP EGPFGVVINRPLHKKIKHMKPTNIDLATTFS+CSLHFGGPLEASMFLLKTGEKSKLHGFEEV+PGLCFGARN+LDEAAVLVKKGILKPQDFRFF
Subjt:  GSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFF

Query:  VGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        VGYAGWQLDQLREEIES+YWYVAACSSNLIGG +SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  VGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

A0A6J1FL02 uncharacterized protein LOC111445188 isoform X21.0e-18388.74Show/hide
Query:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD
        MDLFA NVKNTA  P PFSLKHSFPDRPISC+LAK SRRFS SHP GA+LLRLLEIRVFRP +CSP     +FLVRA AKKN D+SPSPENGDHS+PGDD
Subjt:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD

Query:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG
        AKS NISD +KSNETSS+K+ HINLDWREFRANLF+REQAEK EAD+DVQS NAHESK+LGLKWAHPIP+PETGCVLVATEKLDGVRTFERTV+LLLRSG
Subjt:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG

Query:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV
        SRHP EGPFGVVINRPLHKKIKHMKPTN+DLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARN+LDEAAVLVKKGILKPQDFRFFV
Subjt:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        GYAGWQLDQLREEIES+YWYVAACSSNLI GG SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

A0A6J1JXJ8 uncharacterized protein LOC111489210 isoform X22.0e-18489.01Show/hide
Query:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD
        MDLFA NVKNTA  P PFSLKHSFPDRPISC+LAK SRRFS SHP GA+LLRLLEIRVFRP +CSP     +FLVRA AKKN D+SPSPENGDHS+PGDD
Subjt:  MDLFATNVKNTAA-PSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSP-----AFLVRATAKKNHDSSPSPENGDHSIPGDD

Query:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG
        AKS NISDG+KSNETSS+K+ HINLDWREFRANLF+REQAEK EAD+DVQS NAHESK+LGLKWAHPIP+PETGCVLVATEKLDGVRTFERTV+LLLRSG
Subjt:  AKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSG

Query:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV
        SRHP EGPFGVVINRPLHKKIKHMKPTN+DLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARN+LDEAAVLVKKGILKPQDFRFFV
Subjt:  SRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
        GYAGWQLDQLREEIES+YWYVAACSSNLI GG SDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

SwissProt top hitse value%identityAlignment
A1BEV6 UPF0301 protein Cpha266_08854.9e-1827.6Show/hide
Query:  ETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCS--LHFGGPLEASMFLLKTGEKSKLHGFEEVIP
        ++G +L+A+  L     F+RTV+++      H   G  G ++NRP+  K+        +    F +    LH GGP++             + G  E+ P
Subjt:  ETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCS--LHFGGPLEASMFLLKTGEKSKLHGFEEVIP

Query:  GLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK
        GL +G     ++ + L+  G+++P + RFF+GY+GW   QL EE E   WY+A  S ++I       + E +W   ++  GG Y  ++  P+
Subjt:  GLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK

B3QMC9 UPF0301 protein Cpar_06623.8e-1828.35Show/hide
Query:  MPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEV
        M + G +L+A+  L     F+RTV+L+      H  EG  G ++N+P+  K+        +  + F   D  LH GGP++             +   +EV
Subjt:  MPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEV

Query:  IPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK
        +PGL +G     ++ + L+  G+++P + RFF+GYAGW   QL++E E   WY A  S+  +         E +W   ++  GG Y  ++  P+
Subjt:  IPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK

Q3AQ69 UPF0301 protein Cag_16012.3e-2030.64Show/hide
Query:  FERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKK
        F+RTV+L+      H  EG  G ++NRPL  K++       D+     D  LH GGP++ +           +H  +EV+PG+ +G     DE + L+  
Subjt:  FERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKK

Query:  GILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK
        G++ P + RF++GYAGW   QL  E E   WY A  + ++I       + E +W   ++  GG Y  ++  P+
Subjt:  GILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK

Q3B561 UPF0301 protein Plut_06379.9e-1928.9Show/hide
Query:  FERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKK
        F+RTV+++      H  +G  G ++NRP+  +++       ++     D  LH GGP++++           + G E+++PGL +G     +E   L+  
Subjt:  FERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKK

Query:  GILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK
        G+LKP + RFF+GYAGW   QL  E E   WY A  +  ++  G      E +W   ++  GG Y  ++  P+
Subjt:  GILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK

Q8KEM4 UPF0301 protein CT06638.4e-1830.29Show/hide
Query:  FERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLV
        F+RTV+L+      H  EG  G ++N+P+  K+        +  + F   D  LH GGP++     +       + G  EVIPGL +G     ++ + L+
Subjt:  FERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLV

Query:  KKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK
          G++K  + RFF+GYAGW   QL  E E   WY A  SS  +         E +W   ++  GG Y  ++  P+
Subjt:  KKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPK

Arabidopsis top hitse value%identityAlignment
AT1G33780.1 Protein of unknown function (DUF179)1.3e-11470.65Show/hide
Query:  AFLVRATAKKNHDSSPSPENGDHSIPGDDAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMP
        + +VRAT+KK++D        D S PGD ++    S+GNKS ++++ KS  +N DWREFRANLF +EQ EK EA+        HES+ +GLKWAHPIP P
Subjt:  AFLVRATAKKNHDSSPSPENGDHSIPGDDAKSKNISDGNKSNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMP

Query:  ETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGL
        ETGCVLVATEKLDG RTF RTVVLLLR+G+RHP EGPFGVVINRPLHK IKHMK T  +LATTFS+CSL+FGGPLEASMFLLKTG+K+K+ GFEEV+PGL
Subjt:  ETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGL

Query:  CFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM
         FG RN+LDEAAVLVKKG+LKPQ+FRFFVGYAGWQLDQLREEIES+YW+VAACSS+LI G    +SSE LWEEILQLMGG YSELSRKPK D+
Subjt:  CFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM

AT3G19780.1 LOCATED IN: endomembrane system1.5e-1429.32Show/hide
Query:  REQAEKD--EADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATT
        RE AE++     V+ QS   H   +         P  +TG VLVATEKL    TF ++ +L++++G   P  G  G++ N+ +  K     P   + A  
Subjt:  REQAEKD--EADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATT

Query:  FSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYV
          +  L FGGP+       + L +  + S  H   E+ PG+ F    ++      +K   L P ++ FF+GY+ W  +QL +EI    W V
Subjt:  FSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYV

AT3G19780.2 LOCATED IN: endomembrane system1.5e-1429.32Show/hide
Query:  REQAEKD--EADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATT
        RE AE++     V+ QS   H   +         P  +TG VLVATEKL    TF ++ +L++++G   P  G  G++ N+ +  K     P   + A  
Subjt:  REQAEKD--EADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRPLHKKIKHMKPTNIDLATT

Query:  FSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYV
          +  L FGGP+       + L +  + S  H   E+ PG+ F    ++      +K   L P ++ FF+GY+ W  +QL +EI    W V
Subjt:  FSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYV

AT3G29240.1 Protein of unknown function (DUF179)1.5e-5146.67Show/hide
Query:  DWREFRANLFAREQAEKDEAD----------VDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINR
        DWREFRA L A EQA   E D          VD Q +++    ++G KWAH I  PETGC+L+ATEKLDGV  FE+TV+LLL  G      GP GV++NR
Subjt:  DWREFRANLFAREQAEKDEAD----------VDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINR

Query:  PLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQL
        P    IK  K T +D+A TFSD  L FGGPLE  +FL+        E  K   F +V+ GL +G R ++  AA +VK+ ++   + RFF GY GW+ +QL
Subjt:  PLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQL

Query:  REEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMG
        + EI   YW VAACSS ++  G S   S GLW+E+L L+G
Subjt:  REEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMG

AT3G29240.2 Protein of unknown function (DUF179)1.5e-5146.67Show/hide
Query:  DWREFRANLFAREQAEKDEAD----------VDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINR
        DWREFRA L A EQA   E D          VD Q +++    ++G KWAH I  PETGC+L+ATEKLDGV  FE+TV+LLL  G      GP GV++NR
Subjt:  DWREFRANLFAREQAEKDEAD----------VDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINR

Query:  PLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQL
        P    IK  K T +D+A TFSD  L FGGPLE  +FL+        E  K   F +V+ GL +G R ++  AA +VK+ ++   + RFF GY GW+ +QL
Subjt:  PLHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQL

Query:  REEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMG
        + EI   YW VAACSS ++  G S   S GLW+E+L L+G
Subjt:  REEIESNYWYVAACSSNLIGGGTSDSSSEGLWEEILQLMG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGATCTCTTTGCTACCAATGTCAAGAACACCGCCGCCCCTTCCCCTTTCTCACTCAAACACTCCTTTCCTGATAGACCCATTTCTTGCACTCTGGCGAAGACT
TCGAGGAGATTCTCTTCTTCACATCCCTGTGGCGCTGAACTTCTACGCCTACTTGAGATCCGTGTTTTCAGACCCAACCTTTGCTCTCCCGCTTTTCTGGTCAGA
GCGACTGCGAAGAAGAATCACGACAGTTCTCCATCTCCTGAAAATGGAGATCATTCAATTCCTGGAGATGATGCTAAATCAAAGAATATTTCTGATGGTAACAAA
AGTAATGAAACTTCTTCCCAGAAATCGCAGCACATAAATTTGGACTGGCGAGAATTCAGAGCAAACCTATTTGCTCGTGAGCAGGCAGAAAAGGATGAAGCTGAT
GTGGATGTCCAGAGTGCAAATGCTCACGAGTCTAAGTCTCTCGGGCTGAAGTGGGCGCATCCTATTCCTATGCCGGAGACTGGCTGTGTCCTTGTTGCCACCGAG
AAGTTGGATGGTGTTCGCACTTTTGAGCGAACAGTCGTCCTTCTCCTCAGATCTGGAAGCAGACATCCTCATGAGGGACCGTTCGGTGTCGTGATAAATCGCCCA
CTCCACAAAAAGATCAAGCATATGAAACCAACCAATATTGACTTAGCAACTACATTTTCTGATTGCTCTCTACATTTCGGGGGGCCTCTTGAGGCAAGCATGTTT
TTGCTGAAGACAGGAGAAAAATCGAAACTCCATGGCTTTGAAGAAGTGATCCCAGGCCTCTGCTTTGGTGCTCGAAACACCCTGGACGAAGCTGCAGTGCTGGTG
AAGAAGGGAATCCTTAAACCTCAGGACTTCAGATTCTTTGTGGGTTATGCTGGTTGGCAACTGGATCAATTGAGGGAGGAGATTGAATCAAATTACTGGTATGTG
GCAGCTTGTAGCTCAAATCTAATTGGTGGAGGCACATCAGATTCCTCATCAGAGGGACTGTGGGAGGAAATTTTGCAGTTAATGGGCGGTCCCTATTCAGAGTTG
AGCAGAAAGCCTAAGCAAGATATGTAG
mRNA sequenceShow/hide mRNA sequence
CTCATTGTTTGGCTTTCAATCGTCAATAATATATCGCCTTATTATTCTCTCTTTTTTCCTTCCTTTTTCCTATCTCTTTTGTTTCTCCCGATTCCCGTGGATTGG
ATCATCGTCTCCGACGTTTCCGATATGGATCTCTTTGCTACCAATGTCAAGAACACCGCCGCCCCTTCCCCTTTCTCACTCAAACACTCCTTTCCTGATAGACCC
ATTTCTTGCACTCTGGCGAAGACTTCGAGGAGATTCTCTTCTTCACATCCCTGTGGCGCTGAACTTCTACGCCTACTTGAGATCCGTGTTTTCAGACCCAACCTT
TGCTCTCCCGCTTTTCTGGTCAGAGCGACTGCGAAGAAGAATCACGACAGTTCTCCATCTCCTGAAAATGGAGATCATTCAATTCCTGGAGATGATGCTAAATCA
AAGAATATTTCTGATGGTAACAAAAGTAATGAAACTTCTTCCCAGAAATCGCAGCACATAAATTTGGACTGGCGAGAATTCAGAGCAAACCTATTTGCTCGTGAG
CAGGCAGAAAAGGATGAAGCTGATGTGGATGTCCAGAGTGCAAATGCTCACGAGTCTAAGTCTCTCGGGCTGAAGTGGGCGCATCCTATTCCTATGCCGGAGACT
GGCTGTGTCCTTGTTGCCACCGAGAAGTTGGATGGTGTTCGCACTTTTGAGCGAACAGTCGTCCTTCTCCTCAGATCTGGAAGCAGACATCCTCATGAGGGACCG
TTCGGTGTCGTGATAAATCGCCCACTCCACAAAAAGATCAAGCATATGAAACCAACCAATATTGACTTAGCAACTACATTTTCTGATTGCTCTCTACATTTCGGG
GGGCCTCTTGAGGCAAGCATGTTTTTGCTGAAGACAGGAGAAAAATCGAAACTCCATGGCTTTGAAGAAGTGATCCCAGGCCTCTGCTTTGGTGCTCGAAACACC
CTGGACGAAGCTGCAGTGCTGGTGAAGAAGGGAATCCTTAAACCTCAGGACTTCAGATTCTTTGTGGGTTATGCTGGTTGGCAACTGGATCAATTGAGGGAGGAG
ATTGAATCAAATTACTGGTATGTGGCAGCTTGTAGCTCAAATCTAATTGGTGGAGGCACATCAGATTCCTCATCAGAGGGACTGTGGGAGGAAATTTTGCAGTTA
ATGGGCGGTCCCTATTCAGAGTTGAGCAGAAAGCCTAAGCAAGATATGTAGTTTACTTATTTGAAGGAACATTGAAAATATCTGGAGTTAAAATGTGTATTCTAG
TTAAAGCCATAAAAAGCTGAAAGCCAAATGTACAGAAGTTAGCTGGCTTTTGAAATTTAGCGGACCTCATCTCTTTCTTTAAGGACAACAACGCCCTTTTATAGC
TATTTCTAAATGTAGTTTATGTATATTCTGTTCACATTTGTTTGATTCAATATCTTTAGAAATCTGC
Protein sequenceShow/hide protein sequence
MDLFATNVKNTAAPSPFSLKHSFPDRPISCTLAKTSRRFSSSHPCGAELLRLLEIRVFRPNLCSPAFLVRATAKKNHDSSPSPENGDHSIPGDDAKSKNISDGNK
SNETSSQKSQHINLDWREFRANLFAREQAEKDEADVDVQSANAHESKSLGLKWAHPIPMPETGCVLVATEKLDGVRTFERTVVLLLRSGSRHPHEGPFGVVINRP
LHKKIKHMKPTNIDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNTLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESNYWYV
AACSSNLIGGGTSDSSSEGLWEEILQLMGGPYSELSRKPKQDM