; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh20G008230 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh20G008230
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Descriptionxylulose kinase
Genome locationCmo_Chr20:4075644..4081331
RNA-Seq ExpressionCmoCh20G008230
SyntenyCmoCh20G008230
Gene Ontology termsGO:0005975 - carbohydrate metabolic process (biological process)
GO:0016310 - phosphorylation (biological process)
GO:0016301 - kinase activity (molecular function)
GO:0016773 - phosphotransferase activity, alcohol group as acceptor (molecular function)
InterPro domainsIPR018485 - Carbohydrate kinase, FGGY, C-terminal
IPR043129 - ATPase, nucleotide binding domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022944280.1 uncharacterized protein LOC111448774 isoform X1 [Cucurbita moschata]5.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

XP_022944281.1 uncharacterized protein LOC111448774 isoform X2 [Cucurbita moschata]5.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

XP_022944282.1 uncharacterized protein LOC111448774 isoform X3 [Cucurbita moschata]5.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

XP_022944283.1 uncharacterized protein LOC111448774 isoform X4 [Cucurbita moschata]5.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

XP_023512560.1 uncharacterized protein LOC111777264 isoform X1 [Cucurbita pepo subsp. pepo]4.3e-24797.07Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVL QAG RLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSA SNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQY FPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPM+SSPLDYYPLTS+GERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYR LKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLAL+GAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

TrEMBL top hitse value%identityAlignment
A0A6J1FU00 uncharacterized protein LOC111448774 isoform X22.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

A0A6J1FVB8 uncharacterized protein LOC111448774 isoform X32.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

A0A6J1FXW8 uncharacterized protein LOC111448774 isoform X42.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

A0A6J1FYK4 uncharacterized protein LOC111448774 isoform X12.8e-25298.87Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

A0A6J1JG91 uncharacterized protein LOC111484231 isoform X12.8e-24495.49Show/hide
Query:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL
        M V  EVV  QAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKR+YPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVD    
Subjt:  MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYL

Query:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
         SNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL
Subjt:  CSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWL

Query:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
        LAQPYSMLLPHVKAPGTSIGYLKEDIRSQ+ FPNDCIACTGTTDSIAAFLAARAT+PGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS
Subjt:  LAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGAS

Query:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG
        NTGGAVLRQIFTDKQLEELSKQINPM+SSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGK YR LKDLGATQVEEV TAGGG
Subjt:  NTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGG

Query:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ
        SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLAL+GA+LFMQ
Subjt:  SKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQLFMQ

SwissProt top hitse value%identityAlignment
Q31KC7 D-ribulose kinase1.4e-9945.75Show/hide
Query:  LGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLYNET
        LG+DFGTSGAR    D +          +P      + +W + W+  L+ LL  +P  +R  +  I+IDGTS T +      LC   GQP ++PLLYN+ 
Subjt:  LGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLYNET

Query:  CPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKAPGT
        CP  L  +    P +H   S++S+L KL  W     +      +L QADWL   LHG    SDY+NALK+GY P+ E +   LL      LLP V  PG 
Subjt:  CPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKAPGT

Query:  SIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDKQLE
        +IG +   I  ++    DC  C GTTDSIAAFLA+ A  PG+AVTSLGST+ +KLLS   + D   GVYSH+L   WL GGASN GGA LRQ F D +LE
Subjt:  SIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDKQLE

Query:  ELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLP
         LS QI+P + S LDYYPL S GERFP ADP   P+L PRPEN V++L G+LE + ++E   Y+ L+DLGAT ++ ++TAGGG+KN  W ++R++ +G+P
Subjt:  ELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLP

Query:  VSRASQTEAAYGAALLALRGAQLF
        ++ A  TEAA+G A LA  G   F
Subjt:  VSRASQTEAAYGAALLALRGAQLF

Q7NJT1 Glycerol kinase5.0e-0423.84Show/hide
Query:  LGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSL----LEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLL
        L +D GT+G R  L D  GAV A   RE P         W      T++ L    + +V       +A++ +     T ++ D+      TG P    ++
Subjt:  LGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSL----LEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLL

Query:  YNETCPDALPLVKSI----APVNH---TVCSASSTLCKLVSWWNSADSNKEYATLLHQA--DWLLWFL-HGKLGVSDYNNALKV--------GYDPEIES
        + +    AL          AP+      V  A  +  KL   W  A     Y  L       W++W L  G++  +D +NA +          +DPE+  
Subjt:  YNETCPDALPLVKSI----APVNH---TVCSASSTLCKLVSWWNSADSNKEYATLLHQA--DWLLWFL-HGKLGVSDYNNALKV--------GYDPEIES

Query:  YPPWLLAQPYSMLLPHVKAPGTSIGYLKE-DIR-SQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGV-----YSH
            LLA P + +LP +K    S+G L E D+R   Y  P   I      D  AA  A     PG    + G+   +   + +R   +R  +     +S 
Subjt:  YPPWLLAQPYSMLLPHVKAPGTSIGYLKE-DIR-SQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGV-----YSH

Query:  RLDNMWLVGGASNTGGAVLRQIFTDKQLEELSKQINPMQSSPLD----YYPLTSIGERFPEADPQMAPRL--HPRPENDVEYLHGILESIARIEGKAYRS
        R    + + GA  T GA ++ +     + E + +   + +S  D    Y+     G   P  D      L    R     +    +LE+IA    +   +
Subjt:  RLDNMWLVGGASNTGGAVLRQIFTDKQLEELSKQINPMQSSPLD----YYPLTSIGERFPEADPQMAPRL--HPRPENDVEYLHGILESIARIEGKAYRS

Query:  LKDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVSRASQTE-AAYGAALLA
        L     T +  +   GG  +N    +++  VLG+PV R    +  A GAA  A
Subjt:  LKDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVSRASQTE-AAYGAALLA

Q8L794 D-ribulose kinase4.1e-18473.18Show/hide
Query:  RLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLY
        +LYLGMDFGTSG RF +ID++G + A+GKREYP F  +E++ WA SWK TLFSLLED+P   R LV+SIS+DGTSATT+I++     S +G+ L +P LY
Subjt:  RLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLY

Query:  NETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKA
        N++CPDALP VKSIAP NHTVCS +STLCKLVSWWN+   N+E A LLHQADWLLW LHG+LGVSDYNNALKVGYDPE ESYP WLL QPYS LLP V+A
Subjt:  NETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKA

Query:  PGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDK
        PGTSIG LKE    Q+ FP+DCI CTGTTDSIAAFLAARAT PG+AVTSLGSTLAIKLLST R+DDAR+GVYSHRLD+ WLVGGASNTGGA+LRQ+F+D+
Subjt:  PGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDK

Query:  QLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVL
        QLE LS++INPM  SPLDYYPL S GERFP ADP +APRL PRPE+DVE+LHGILESIARIEGK Y+ LK+LGAT+ EEV TAGGG+KN+KW KIR+RVL
Subjt:  QLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVL

Query:  GLPVSRASQTEAAYGAALLALRGAQ
        GLPV +A  TEA+YGA+LLAL+GA+
Subjt:  GLPVSRASQTEAAYGAALLALRGAQ

Arabidopsis top hitse value%identityAlignment
AT2G21370.1 xylulose kinase-12.9e-18573.18Show/hide
Query:  RLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLY
        +LYLGMDFGTSG RF +ID++G + A+GKREYP F  +E++ WA SWK TLFSLLED+P   R LV+SIS+DGTSATT+I++     S +G+ L +P LY
Subjt:  RLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLY

Query:  NETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKA
        N++CPDALP VKSIAP NHTVCS +STLCKLVSWWN+   N+E A LLHQADWLLW LHG+LGVSDYNNALKVGYDPE ESYP WLL QPYS LLP V+A
Subjt:  NETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKA

Query:  PGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDK
        PGTSIG LKE    Q+ FP+DCI CTGTTDSIAAFLAARAT PG+AVTSLGSTLAIKLLST R+DDAR+GVYSHRLD+ WLVGGASNTGGA+LRQ+F+D+
Subjt:  PGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDK

Query:  QLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVL
        QLE LS++INPM  SPLDYYPL S GERFP ADP +APRL PRPE+DVE+LHGILESIARIEGK Y+ LK+LGAT+ EEV TAGGG+KN+KW KIR+RVL
Subjt:  QLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVL

Query:  GLPVSRASQTEAAYGAALLALRGAQ
        GLPV +A  TEA+YGA+LLAL+GA+
Subjt:  GLPVSRASQTEAAYGAALLALRGAQ

AT2G21370.2 xylulose kinase-11.9e-16874.67Show/hide
Query:  WARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNK
        WA SWK TLFSLLED+P   R LV+SIS+DGTSATT+I++     S +G+ L +P LYN++CPDALP VKSIAP NHTVCS +STLCKLVSWWN+   N+
Subjt:  WARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSKPLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNK

Query:  EYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATL
        E A LLHQADWLLW LHG+LGVSDYNNALKVGYDPE ESYP WLL QPYS LLP V+APGTSIG LKE    Q+ FP+DCI CTGTTDSIAAFLAARAT 
Subjt:  EYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKAPGTSIGYLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATL

Query:  PGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHP
        PG+AVTSLGSTLAIKLLST R+DDAR+GVYSHRLD+ WLVGGASNTGGA+LRQ+F+D+QLE LS++INPM  SPLDYYPL S GERFP ADP +APRL P
Subjt:  PGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDKQLEELSKQINPMQSSPLDYYPLTSIGERFPEADPQMAPRLHP

Query:  RPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQ
        RPE+DVE+LHGILESIARIEGK Y+ LK+LGAT+ EEV TAGGG+KN+KW KIR+RVLGLPV +A  TEA+YGA+LLAL+GA+
Subjt:  RPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQ


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGTGTTGCAACGGAAGTGGTGCTTTCTCAAGCAGGGAATCGGCTTTACCTTGGGATGGATTTTGGTACCTCTGGGGCAAGATTTGCGCTCATTGACAAGGAAGGAGC
TGTTTGTGCGGAAGGAAAGAGGGAGTATCCGCTCTTTAAGAATGACGAAACAATCGACTGGGCAAGATCGTGGAAAACAACACTTTTCTCATTGCTTGAAGATGTTCCAA
ATCATTATCGTCATTTGGTGGCATCTATTTCTATTGATGGCACATCTGCAACAACCATAATTGTGGACAGCCTATACTTGTGCAGCAACACAGGACAGCCATTGTCAAAG
CCATTATTGTACAATGAGACTTGTCCTGATGCCTTACCATTGGTGAAGTCTATTGCTCCAGTGAACCATACAGTCTGCTCTGCGTCATCTACTTTATGCAAGCTGGTTTC
ATGGTGGAACAGTGCCGACTCAAATAAAGAATATGCCACATTGTTACATCAAGCAGATTGGTTGTTGTGGTTTCTACATGGGAAGCTTGGGGTTTCAGATTATAATAATG
CTCTGAAGGTTGGCTATGATCCTGAAATTGAATCTTACCCACCCTGGCTTCTTGCTCAACCATATTCTATGCTTTTACCTCATGTCAAAGCTCCTGGAACTTCTATTGGA
TATTTGAAAGAAGACATTAGATCACAATATGATTTTCCAAATGATTGCATTGCATGCACAGGAACCACAGATAGTATTGCTGCATTTCTTGCAGCACGTGCGACACTGCC
GGGGCAAGCTGTCACTTCCTTGGGATCCACGCTTGCCATCAAATTACTGAGTACCAATAGGATTGACGACGCACGGTTTGGAGTGTACAGCCACCGACTTGACAATATGT
GGCTCGTAGGAGGTGCTTCAAACACAGGAGGAGCCGTTCTAAGACAAATCTTTACTGACAAGCAATTAGAAGAATTGAGCAAACAAATCAATCCCATGCAAAGTTCTCCT
CTAGATTACTACCCTTTGACTTCAATTGGAGAGAGATTTCCGGAGGCAGACCCACAAATGGCTCCCAGATTACATCCACGGCCAGAAAATGATGTCGAATATTTGCATGG
AATTTTGGAATCTATTGCCCGTATTGAGGGAAAGGCTTATAGGTCATTAAAGGATCTAGGAGCAACTCAGGTAGAAGAAGTGTTCACAGCTGGCGGTGGATCCAAGAATG
AGAAATGGACGAAGATACGAGAGAGAGTTCTTGGTTTGCCTGTGAGTCGGGCAAGTCAGACCGAGGCTGCATATGGAGCAGCTCTATTGGCATTAAGAGGTGCGCAATTA
TTCATGCAATGA
mRNA sequenceShow/hide mRNA sequence
CAATTCTGAAAGAAACTGAAGCACTTCACAGAATTATGCTTCCTTCCAATCTTCATTCTCCCGCGGCAAATTTGTTTTTGCTTCCATCAACGTCATGCTCGCCCTGTAAT
CATGCTAAGTGGATGAGCTCAAATTCATCAATGCATATGATCTTCACGCATCAGGGATTTGGATTTCGAGGAATCAGAATCGAAGAAATCGAAGACGGACAACAATGAGT
GTTGCAACGGAAGTGGTGCTTTCTCAAGCAGGGAATCGGCTTTACCTTGGGATGGATTTTGGTACCTCTGGGGCAAGATTTGCGCTCATTGACAAGGAAGGAGCTGTTTG
TGCGGAAGGAAAGAGGGAGTATCCGCTCTTTAAGAATGACGAAACAATCGACTGGGCAAGATCGTGGAAAACAACACTTTTCTCATTGCTTGAAGATGTTCCAAATCATT
ATCGTCATTTGGTGGCATCTATTTCTATTGATGGCACATCTGCAACAACCATAATTGTGGACAGCCTATACTTGTGCAGCAACACAGGACAGCCATTGTCAAAGCCATTA
TTGTACAATGAGACTTGTCCTGATGCCTTACCATTGGTGAAGTCTATTGCTCCAGTGAACCATACAGTCTGCTCTGCGTCATCTACTTTATGCAAGCTGGTTTCATGGTG
GAACAGTGCCGACTCAAATAAAGAATATGCCACATTGTTACATCAAGCAGATTGGTTGTTGTGGTTTCTACATGGGAAGCTTGGGGTTTCAGATTATAATAATGCTCTGA
AGGTTGGCTATGATCCTGAAATTGAATCTTACCCACCCTGGCTTCTTGCTCAACCATATTCTATGCTTTTACCTCATGTCAAAGCTCCTGGAACTTCTATTGGATATTTG
AAAGAAGACATTAGATCACAATATGATTTTCCAAATGATTGCATTGCATGCACAGGAACCACAGATAGTATTGCTGCATTTCTTGCAGCACGTGCGACACTGCCGGGGCA
AGCTGTCACTTCCTTGGGATCCACGCTTGCCATCAAATTACTGAGTACCAATAGGATTGACGACGCACGGTTTGGAGTGTACAGCCACCGACTTGACAATATGTGGCTCG
TAGGAGGTGCTTCAAACACAGGAGGAGCCGTTCTAAGACAAATCTTTACTGACAAGCAATTAGAAGAATTGAGCAAACAAATCAATCCCATGCAAAGTTCTCCTCTAGAT
TACTACCCTTTGACTTCAATTGGAGAGAGATTTCCGGAGGCAGACCCACAAATGGCTCCCAGATTACATCCACGGCCAGAAAATGATGTCGAATATTTGCATGGAATTTT
GGAATCTATTGCCCGTATTGAGGGAAAGGCTTATAGGTCATTAAAGGATCTAGGAGCAACTCAGGTAGAAGAAGTGTTCACAGCTGGCGGTGGATCCAAGAATGAGAAAT
GGACGAAGATACGAGAGAGAGTTCTTGGTTTGCCTGTGAGTCGGGCAAGTCAGACCGAGGCTGCATATGGAGCAGCTCTATTGGCATTAAGAGGTGCGCAATTATTCATG
CAATGAGAGCTTTGTACATTGTTGAACCCTGAATATTTTGCCATTTTGGTGGCTATTAAACAAACTTATATAAGCTCCAATTAAAGAATAGTGGGTACAATTAAATGAAA
GATGCATACTTTCGGG
Protein sequenceShow/hide protein sequence
MSVATEVVLSQAGNRLYLGMDFGTSGARFALIDKEGAVCAEGKREYPLFKNDETIDWARSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTIIVDSLYLCSNTGQPLSK
PLLYNETCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWNSADSNKEYATLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEIESYPPWLLAQPYSMLLPHVKAPGTSIG
YLKEDIRSQYDFPNDCIACTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTNRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDKQLEELSKQINPMQSSP
LDYYPLTSIGERFPEADPQMAPRLHPRPENDVEYLHGILESIARIEGKAYRSLKDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVSRASQTEAAYGAALLALRGAQL
FMQ