; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS020573 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS020573
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
Descriptionxylulose kinase
Genome locationscaffold375:1301344..1305319
RNA-Seq ExpressionMS020573
SyntenyMS020573
Gene Ontology termsGO:0005975 - carbohydrate metabolic process (biological process)
GO:0016310 - phosphorylation (biological process)
GO:0016301 - kinase activity (molecular function)
GO:0016773 - phosphotransferase activity, alcohol group as acceptor (molecular function)
InterPro domainsIPR018484 - Carbohydrate kinase, FGGY, N-terminal
IPR018485 - Carbohydrate kinase, FGGY, C-terminal
IPR043129 - ATPase, nucleotide binding domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022146250.1 uncharacterized protein LOC111015510 isoform X1 [Momordica charantia]1.1e-26698.71Show/hide
Query:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE
        TNAYDLRASGIWISTNISRRNRRRTTMSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLE
Subjt:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE

Query:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK
        DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGK
Subjt:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK

Query:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
        LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
Subjt:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST

Query:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
        SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
Subjt:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI

Query:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

XP_022146251.1 uncharacterized protein LOC111015510 isoform X2 [Momordica charantia]1.9e-26198.68Show/hide
Query:  GIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHL
        GIWISTNISRRNRRRTTMSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHL
Subjt:  GIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHL

Query:  VASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNA
        VASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGKLGVSDYNNA
Subjt:  VASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNA

Query:  LKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFG
        LKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFG
Subjt:  LKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFG

Query:  VYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLR
        VYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLR
Subjt:  VYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLR

Query:  DLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        DLGATQVEEVFTAGGGSKNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  DLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

XP_022146252.1 uncharacterized protein LOC111015510 isoform X3 [Momordica charantia]1.1e-26698.71Show/hide
Query:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE
        TNAYDLRASGIWISTNISRRNRRRTTMSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLE
Subjt:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE

Query:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK
        DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGK
Subjt:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK

Query:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
        LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
Subjt:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST

Query:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
        SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
Subjt:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI

Query:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

XP_022146253.1 uncharacterized protein LOC111015510 isoform X4 [Momordica charantia]1.8e-25198.63Show/hide
Query:  MSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVD
        MSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVD
Subjt:  MSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVD

Query:  SNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLL
        SNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLL
Subjt:  SNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLL

Query:  AQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASN
        AQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASN
Subjt:  AQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASN

Query:  TGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGS
        TGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGS
Subjt:  TGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGS

Query:  KNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        KNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  KNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

XP_023512562.1 uncharacterized protein LOC111777264 isoform X3 [Cucurbita pepo subsp. pepo]6.3e-24189.63Show/hide
Query:  NAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLED
        NAYD+ ASGIWIS N +RRNRRRTTMSV T+    VV PQ   RLYLGMDFGTSGARFALID+EG V AEGKREYPL+K+DETIDWA SWKTTLFSLLED
Subjt:  NAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLED

Query:  VPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKL
        VPNHYRHLVASISIDGTSATT+IVDSNTGQPLSKP LYNE+CPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+ A SNKE A LLHQADWLLWFLHGKL
Subjt:  VPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKL

Query:  GVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTS
        GVSDYNNALKVGYDPE++SYPPWLLAQPYS LLP+VKAPGTSIGYLKEDIRS++GFPNDCI CTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST+
Subjt:  GVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTS

Query:  RIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIE
        RIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTD++LEE+SKQINPMKSSPLDYYPLTS+GERFP ADPQM+PRLHPRPENDVEYLHGILESIARIE
Subjt:  RIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIE

Query:  GNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQ
        G AYRLL+DLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPV RA+QTEAAYGAALLAL+GAQ
Subjt:  GNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQ

TrEMBL top hitse value%identityAlignment
A0A6J1CWS3 uncharacterized protein LOC111015510 isoform X15.6e-26798.71Show/hide
Query:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE
        TNAYDLRASGIWISTNISRRNRRRTTMSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLE
Subjt:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE

Query:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK
        DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGK
Subjt:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK

Query:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
        LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
Subjt:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST

Query:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
        SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
Subjt:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI

Query:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

A0A6J1CY36 uncharacterized protein LOC111015510 isoform X48.6e-25298.63Show/hide
Query:  MSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVD
        MSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVD
Subjt:  MSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVD

Query:  SNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLL
        SNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLL
Subjt:  SNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLL

Query:  AQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASN
        AQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASN
Subjt:  AQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASN

Query:  TGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGS
        TGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGS
Subjt:  TGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGS

Query:  KNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        KNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  KNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

A0A6J1CYR0 uncharacterized protein LOC111015510 isoform X29.2e-26298.68Show/hide
Query:  GIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHL
        GIWISTNISRRNRRRTTMSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHL
Subjt:  GIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHL

Query:  VASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNA
        VASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGKLGVSDYNNA
Subjt:  VASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNA

Query:  LKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFG
        LKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFG
Subjt:  LKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFG

Query:  VYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLR
        VYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLR
Subjt:  VYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLR

Query:  DLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        DLGATQVEEVFTAGGGSKNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  DLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

A0A6J1CZ33 uncharacterized protein LOC111015510 isoform X35.6e-26798.71Show/hide
Query:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE
        TNAYDLRASGIWISTNISRRNRRRTTMSVG +ALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTV AEGKREYPLYKSDETIDWASSWKTTLFSLLE
Subjt:  TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLE

Query:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK
        DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+RADSNKESAMLLHQADWLLWFLHGK
Subjt:  DVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGK

Query:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
        LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGT IGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST
Subjt:  LGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST

Query:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
        SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI
Subjt:  SRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARI

Query:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS
        EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLG PVRRATQTEAAYGAALLALRGAQS
Subjt:  EGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQS

A0A6J1FXW8 uncharacterized protein LOC111448774 isoform X45.2e-24189.85Show/hide
Query:  NAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLED
        NAYDL ASGIWIS N +RRNRRRTTMSV T+    VV  Q  NRLYLGMDFGTSGARFALID+EG V AEGKREYPL+K+DETIDWA SWKTTLFSLLED
Subjt:  NAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLED

Query:  VPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKL
        VPNHYRHLVASISIDGTSATT+IVDSNTGQPLSKP LYNE+CPDALPLVKSIAPVNHTVCSASSTLCKLVSWW+ ADSNKE A LLHQADWLLWFLHGKL
Subjt:  VPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKL

Query:  GVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTS
        GVSDYNNALKVGYDPE++SYPPWLLAQPYS LLP+VKAPGTSIGYLKEDIRS++ FPNDCI CTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLST+
Subjt:  GVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTS

Query:  RIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIE
        RIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTD++LEE+SKQINPM+SSPLDYYPLTSIGERFP ADPQM+PRLHPRPENDVEYLHGILESIARIE
Subjt:  RIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIE

Query:  GNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQ
        G AYR L+DLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPV RA+QTEAAYGAALLALRGAQ
Subjt:  GNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQ

SwissProt top hitse value%identityAlignment
P39211 Xylulose kinase8.9e-1222.12Show/hide
Query:  LGMDFGTSGARFALIDQEGTVHAEGKREYPL------YKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNE
        +G+D GTS  +  L++Q G V AE  + YPL      Y      DW       L  L+  + N     +  IS  G     +++D +  Q L    L+N+
Subjt:  LGMDFGTSGARFALIDQEGTVHAEGKREYPL------YKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNE

Query:  --SCPDALPLVKS----IAPVNHTVCSASSTLCKLVSWWSRADSN--KESAMLLHQADWLLWFLHGKLGV--SDYNNALKVGYDPEVDSYPPWLLAQPYS
          + P  + + +     +  +         TL K++ W    +    K++A+ L   D++ + + G +    SD    L +    +  S          +
Subjt:  --SCPDALPLVKS----IAPVNHTVCSASSTLCKLVSWWSRADSN--KESAMLLHQADWLLWFLHGKLGV--SDYNNALKVGYDPEVDSYPPWLLAQPYS

Query:  QLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGV--YSHRLDNMWLVGGASNTGG
         + P +      +G L   + ++ G      V  G  D+    + A     G+ + S+G++  I      +  D +  V  ++H   + +   G +   G
Subjt:  QLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGV--YSHRLDNMWLVGGASNTGG

Query:  AVL----RQIFTDEELEEMSKQIN--PMKSSPLDYYPLTSIGERFPVADPQMSPRL--HPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFT
          L    R    +E  E++ + +   P+ ++ L Y P   +GER P AD  +   L       N   +L  I+E I      +  L R+ G + V  V +
Subjt:  AVL----RQIFTDEELEEMSKQIN--PMKSSPLDYYPLTSIGERFPVADPQMSPRL--HPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFT

Query:  AGGGSKNEKWTKIRERVLGLPVRRATQTEA-AYGAALLALRGA
         GGG+KN+ W +++  +    V +    +  A GAA+LA  G+
Subjt:  AGGGSKNEKWTKIRERVLGLPVRRATQTEA-AYGAALLALRGA

Q31KC7 D-ribulose kinase5.4e-10246.75Show/hide
Query:  LGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDAL
        LG+DFGTSGAR    D +          +P  K+ +  +W   W+  L+ LL  +P  +R  +  I+IDGTS T ++ D   GQP ++P LYN++CP  L
Subjt:  LGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDAL

Query:  PLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYL
          +    P +H   S++S+L KL  W  +  +      +L QADWL   LHG    SDY+NALK+GY P+ + +   LL      LLP V  PG +IG +
Subjt:  PLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYL

Query:  KEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQ
           I   FG   DC +C GTTDSIAAFLA+ A  PG+AVTSLGST+ +KLLS   + D   GVYSH+L   WL GGASN GGA LRQ F D ELE +S Q
Subjt:  KEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQ

Query:  INPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRAT
        I+P K S LDYYPL S GERFP+ADP   P+L PRPEN V++L G+LE + ++E   Y+ L+DLGAT ++ ++TAGGG+KN  W ++R++ +G+P+  A 
Subjt:  INPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRAT

Query:  QTEAAYGAALLALRG
         TEAA+G A LA  G
Subjt:  QTEAAYGAALLALRG

Q8L794 D-ribulose kinase2.6e-18974.05Show/hide
Query:  RLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCP
        +LYLGMDFGTSG RF +ID++G + A+GKREYP +  +E++ WASSWK TLFSLLED+P   R LV+SIS+DGTSATT+I++S +G+ L +P+LYN+SCP
Subjt:  RLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCP

Query:  DALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSI
        DALP VKSIAP NHTVCS +STLCKLVSWW+    N+ESA+LLHQADWLLW LHG+LGVSDYNNALKVGYDPE +SYP WLL QPYSQLLP V+APGTSI
Subjt:  DALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSI

Query:  GYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEM
        G LKE    +FGFP+DCIVCTGTTDSIAAFLAARAT PG+AVTSLGSTLAIKLLST R+DDAR+GVYSHRLD+ WLVGGASNTGGA+LRQ+F+DE+LE +
Subjt:  GYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEM

Query:  SKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVR
        S++INPM  SPLDYYPL S GERFP+ADP ++PRL PRPE+DVE+LHGILESIARIEG  Y+LL++LGAT+ EEV TAGGG+KN+KW KIR+RVLGLPV+
Subjt:  SKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVR

Query:  RATQTEAAYGAALLALRGAQ
        +A  TEA+YGA+LLAL+GA+
Subjt:  RATQTEAAYGAALLALRGAQ

Arabidopsis top hitse value%identityAlignment
AT2G21370.1 xylulose kinase-11.9e-19074.05Show/hide
Query:  RLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCP
        +LYLGMDFGTSG RF +ID++G + A+GKREYP +  +E++ WASSWK TLFSLLED+P   R LV+SIS+DGTSATT+I++S +G+ L +P+LYN+SCP
Subjt:  RLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCP

Query:  DALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSI
        DALP VKSIAP NHTVCS +STLCKLVSWW+    N+ESA+LLHQADWLLW LHG+LGVSDYNNALKVGYDPE +SYP WLL QPYSQLLP V+APGTSI
Subjt:  DALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSI

Query:  GYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEM
        G LKE    +FGFP+DCIVCTGTTDSIAAFLAARAT PG+AVTSLGSTLAIKLLST R+DDAR+GVYSHRLD+ WLVGGASNTGGA+LRQ+F+DE+LE +
Subjt:  GYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEM

Query:  SKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVR
        S++INPM  SPLDYYPL S GERFP+ADP ++PRL PRPE+DVE+LHGILESIARIEG  Y+LL++LGAT+ EEV TAGGG+KN+KW KIR+RVLGLPV+
Subjt:  SKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVR

Query:  RATQTEAAYGAALLALRGAQ
        +A  TEA+YGA+LLAL+GA+
Subjt:  RATQTEAAYGAALLALRGAQ

AT2G21370.2 xylulose kinase-11.2e-17375.93Show/hide
Query:  WASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAML
        WASSWK TLFSLLED+P   R LV+SIS+DGTSATT+I++S +G+ L +P+LYN+SCPDALP VKSIAP NHTVCS +STLCKLVSWW+    N+ESA+L
Subjt:  WASSWKTTLFSLLEDVPNHYRHLVASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAML

Query:  LHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAV
        LHQADWLLW LHG+LGVSDYNNALKVGYDPE +SYP WLL QPYSQLLP V+APGTSIG LKE    +FGFP+DCIVCTGTTDSIAAFLAARAT PG+AV
Subjt:  LHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDSYPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAV

Query:  TSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPEND
        TSLGSTLAIKLLST R+DDAR+GVYSHRLD+ WLVGGASNTGGA+LRQ+F+DE+LE +S++INPM  SPLDYYPL S GERFP+ADP ++PRL PRPE+D
Subjt:  TSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGAVLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPEND

Query:  VEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQ
        VE+LHGILESIARIEG  Y+LL++LGAT+ EEV TAGGG+KN+KW KIR+RVLGLPV++A  TEA+YGA+LLAL+GA+
Subjt:  VEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLGLPVRRATQTEAAYGAALLALRGAQ


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ACCAATGCGTATGATCTTCGCGCGTCAGGGATTTGGATTTCGACGAATATAAGTCGAAGAAATCGAAGACGGACGACAATGAGCGTTGGAACCAAAGCCTTAAGTCCAGT
GGTGCCTCCTCAGGTCGTGAATCGGCTTTATCTTGGGATGGATTTTGGTACCTCTGGCGCAAGATTTGCGCTCATCGACCAGGAAGGGACTGTTCATGCTGAAGGAAAGA
GGGAGTACCCGCTCTATAAGAGCGATGAAACAATCGATTGGGCAAGTTCGTGGAAAACAACACTTTTTTCACTGCTTGAAGATGTTCCAAATCATTATCGTCATTTGGTG
GCATCTATTTCCATTGATGGCACATCTGCAACTACCATGATTGTTGACAGTAACACTGGACAGCCATTGTCAAAACCATTCTTGTACAATGAGAGTTGTCCTGATGCCTT
ACCATTGGTGAAGTCTATTGCTCCTGTAAACCATACAGTCTGCTCTGCCTCGTCTACTTTGTGTAAGCTGGTTTCATGGTGGAGCCGTGCTGACTCGAATAAAGAATCTG
CCATGTTGTTACATCAAGCAGATTGGTTGTTGTGGTTTCTACATGGAAAGCTTGGGGTTTCAGATTATAATAATGCTCTGAAGGTTGGCTATGATCCTGAAGTTGACTCT
TACCCACCCTGGCTTCTCGCTCAACCATACTCTCAACTTTTACCTTACGTCAAAGCTCCTGGAACTTCTATTGGGTATTTGAAAGAGGACATTAGATCACGATTCGGTTT
TCCAAATGATTGCATTGTATGCACCGGAACCACAGATAGTATTGCTGCATTTCTTGCAGCACGTGCAACACTGCCAGGCCAAGCTGTCACTTCCTTGGGCTCCACGCTTG
CCATCAAACTATTGAGTACCAGCAGGATTGACGATGCACGGTTTGGCGTGTACAGTCACCGACTTGACAACATGTGGCTCGTGGGAGGAGCTTCAAACACAGGAGGAGCC
GTGCTTAGACAAATTTTTACTGATGAGGAATTAGAAGAAATGAGCAAACAAATCAATCCCATGAAAAGTTCTCCTCTAGATTACTATCCACTGACGTCGATTGGAGAGAG
GTTTCCGGTGGCAGACCCACAAATGTCTCCCAGATTACATCCACGACCAGAAAATGATGTTGAATATTTGCATGGGATTTTGGAATCTATTGCGCGCATCGAGGGAAATG
CTTATAGGTTATTGAGGGATTTGGGAGCAACCCAGGTTGAAGAAGTGTTCACAGCTGGAGGTGGATCCAAAAATGAGAAATGGACGAAGATCCGAGAGAGAGTTCTTGGT
TTGCCTGTGCGTCGAGCAACTCAGACGGAGGCTGCTTATGGAGCTGCTCTATTGGCATTAAGAGGTGCCCAATCA
mRNA sequenceShow/hide mRNA sequence
ACCAATGCGTATGATCTTCGCGCGTCAGGGATTTGGATTTCGACGAATATAAGTCGAAGAAATCGAAGACGGACGACAATGAGCGTTGGAACCAAAGCCTTAAGTCCAGT
GGTGCCTCCTCAGGTCGTGAATCGGCTTTATCTTGGGATGGATTTTGGTACCTCTGGCGCAAGATTTGCGCTCATCGACCAGGAAGGGACTGTTCATGCTGAAGGAAAGA
GGGAGTACCCGCTCTATAAGAGCGATGAAACAATCGATTGGGCAAGTTCGTGGAAAACAACACTTTTTTCACTGCTTGAAGATGTTCCAAATCATTATCGTCATTTGGTG
GCATCTATTTCCATTGATGGCACATCTGCAACTACCATGATTGTTGACAGTAACACTGGACAGCCATTGTCAAAACCATTCTTGTACAATGAGAGTTGTCCTGATGCCTT
ACCATTGGTGAAGTCTATTGCTCCTGTAAACCATACAGTCTGCTCTGCCTCGTCTACTTTGTGTAAGCTGGTTTCATGGTGGAGCCGTGCTGACTCGAATAAAGAATCTG
CCATGTTGTTACATCAAGCAGATTGGTTGTTGTGGTTTCTACATGGAAAGCTTGGGGTTTCAGATTATAATAATGCTCTGAAGGTTGGCTATGATCCTGAAGTTGACTCT
TACCCACCCTGGCTTCTCGCTCAACCATACTCTCAACTTTTACCTTACGTCAAAGCTCCTGGAACTTCTATTGGGTATTTGAAAGAGGACATTAGATCACGATTCGGTTT
TCCAAATGATTGCATTGTATGCACCGGAACCACAGATAGTATTGCTGCATTTCTTGCAGCACGTGCAACACTGCCAGGCCAAGCTGTCACTTCCTTGGGCTCCACGCTTG
CCATCAAACTATTGAGTACCAGCAGGATTGACGATGCACGGTTTGGCGTGTACAGTCACCGACTTGACAACATGTGGCTCGTGGGAGGAGCTTCAAACACAGGAGGAGCC
GTGCTTAGACAAATTTTTACTGATGAGGAATTAGAAGAAATGAGCAAACAAATCAATCCCATGAAAAGTTCTCCTCTAGATTACTATCCACTGACGTCGATTGGAGAGAG
GTTTCCGGTGGCAGACCCACAAATGTCTCCCAGATTACATCCACGACCAGAAAATGATGTTGAATATTTGCATGGGATTTTGGAATCTATTGCGCGCATCGAGGGAAATG
CTTATAGGTTATTGAGGGATTTGGGAGCAACCCAGGTTGAAGAAGTGTTCACAGCTGGAGGTGGATCCAAAAATGAGAAATGGACGAAGATCCGAGAGAGAGTTCTTGGT
TTGCCTGTGCGTCGAGCAACTCAGACGGAGGCTGCTTATGGAGCTGCTCTATTGGCATTAAGAGGTGCCCAATCA
Protein sequenceShow/hide protein sequence
TNAYDLRASGIWISTNISRRNRRRTTMSVGTKALSPVVPPQVVNRLYLGMDFGTSGARFALIDQEGTVHAEGKREYPLYKSDETIDWASSWKTTLFSLLEDVPNHYRHLV
ASISIDGTSATTMIVDSNTGQPLSKPFLYNESCPDALPLVKSIAPVNHTVCSASSTLCKLVSWWSRADSNKESAMLLHQADWLLWFLHGKLGVSDYNNALKVGYDPEVDS
YPPWLLAQPYSQLLPYVKAPGTSIGYLKEDIRSRFGFPNDCIVCTGTTDSIAAFLAARATLPGQAVTSLGSTLAIKLLSTSRIDDARFGVYSHRLDNMWLVGGASNTGGA
VLRQIFTDEELEEMSKQINPMKSSPLDYYPLTSIGERFPVADPQMSPRLHPRPENDVEYLHGILESIARIEGNAYRLLRDLGATQVEEVFTAGGGSKNEKWTKIRERVLG
LPVRRATQTEAAYGAALLALRGAQS