; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Cmc02g0046101 (gene) of Melon (Charmono) v1.1 genome

Gene IDCmc02g0046101
OrganismCucumis melo var. cantalupensis cv. Charmono (Melon (Charmono) v1.1)
Descriptionprotein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic-like
Genome locationCMiso1.1chr02:10736240..10755281
RNA-Seq ExpressionCmc02g0046101
SyntenyCmc02g0046101
Gene Ontology termsGO:0005524 - ATP binding (molecular function)
InterPro domainsIPR003439 - ABC transporter-like, ATP-binding domain
IPR003593 - AAA+ ATPase domain
IPR017871 - ABC transporter-like, conserved site
IPR027417 - P-loop containing nucleoside triphosphate hydrolase


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAE8653580.1 hypothetical protein Csa_007562 [Cucumis sativus]1.0e-18298.21Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVS+SGSVFFPLTVP+CSSRSRKVAV+DAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDK+ESDVLIECRNVHKSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKR+GLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ
        TIRRAVDRLLFLYEG+VVWQGMTGEFTTSTNPIVQQ
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ

TYK19844.1 protein TRIGALACTOSYLDIACYLGLYCEROL 3 [Cucumis melo var. makuwa]7.2e-18198.81Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSA    DSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ
        TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ

XP_004142560.1 protein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic isoform X1 [Cucumis sativus]2.9e-19098.28Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVS+SGSVFFPLTVP+CSSRSRKVAV+DAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDK+ESDVLIECRNVHKSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKR+GLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
        TIRRAVDRLLFLYEG+VVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY

XP_008443718.1 PREDICTED: protein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic isoform X1 [Cucumis melo]3.1e-192100Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
        TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY

XP_038876767.1 protein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic isoform X1 [Benincasa hispida]4.4e-18696.84Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVSISGSVFFPLTVPNCS+RSRKVAVLDAHNSFCCK KDQRRIV CNCIAPPPYFKSD SSAVNSNDSFRSEHLS +NEDKDESDVLIECRNV+KSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKR GLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSE+QIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
        TIRRAVDRLLFLYEG+VVWQGMT EFTTSTNPIVQQFASGSLDGPIRY
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY

TrEMBL top hitse value%identityAlignment
A0A0A0LY39 ABC transporter domain-containing protein1.4e-19098.28Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVS+SGSVFFPLTVP+CSSRSRKVAV+DAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDK+ESDVLIECRNVHKSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKR+GLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
        TIRRAVDRLLFLYEG+VVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY

A0A1S3B8N5 protein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic isoform X11.5e-192100Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
        TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY

A0A5D3D8G1 Protein TRIGALACTOSYLDIACYLGLYCEROL 33.5e-18198.81Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSA    DSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
        ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ
        TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQ

A0A6J1F2M5 protein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic-like4.3e-17994.25Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK
        MVSISGSVFFPLTVP+CSSRSRKVAVLD HNSFC K KDQRRIV CNCIAPPP+FKSD SS VN NDSF SEHLS +NE +DESDVLIECRNV+KSFGEK
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEK

Query:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
        HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKR+GLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS
Subjt:  HILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQIS

Query:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
         LVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS
Subjt:  ELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHS

Query:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
        TIRRAVDRLLFLYEG+VVWQGMT EFTTSTNPIVQQFASGSLDGPI+Y
Subjt:  TIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY

A0A6J1KHV9 protein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic-like4.0e-17792.9Show/hide
Query:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSEN----EDKDESDVLIECRNVHKS
        MVSISGSVFFPLTVP+CSSRSRKVAVLD HNSFC K KDQRRIV CNCIAPPP+FKSD SS VN NDSF SEHLS +N    ED+DESDVLIECRNV+KS
Subjt:  MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSEN----EDKDESDVLIECRNVHKS

Query:  FGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSE
        FGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKR+GLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSE
Subjt:  FGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSE

Query:  DQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVT
        DQIS LVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDA GKPGKIASYI VT
Subjt:  DQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVT

Query:  HQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY
        HQHSTIRRAVDRLLFLYEG+VVWQGMT EFTTSTNPIVQQFASGSLDGPI+Y
Subjt:  HQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY

SwissProt top hitse value%identityAlignment
P30769 Probable ribonucleotide transport ATP-binding protein mkl6.4e-3936.5Show/hide
Query:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN
        V IE + + KSFG   I   V+  I  GE   ++GPSGTGKS  LK + GLL P++G + I G   I     +EL  +R   G++FQ  ALF S+ +  N
Subjt:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN

Query:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS
          F L E++   E +I ++V E L  VGL G E + P E+SGGM+KR  LAR+++ D       P+++L DEP +GLDP+ +  +  LI  ++ + +   
Subjt:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS

Query:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI
              A+ ++VTH  +  R   D +  L+   +V  G      TS  P+V+QF +G   GPI
Subjt:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI

P63358 Probable ribonucleotide transport ATP-binding protein mkl3.7e-3936.88Show/hide
Query:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN
        V IE   + KSFG   I   V+  I  GE   ++GPSGTGKS  LK + GLL P++G + I G   I     +EL  +R   G++FQ  ALF S+ +  N
Subjt:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN

Query:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS
          F L E++   E +I ++V E LA VGL G E + P E+SGGM+KR  LAR+++ D       P+++L DEP +GLDP+ +  +  LI  ++ + +   
Subjt:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS

Query:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI
              A+ ++VTH  +  R   D +  L+   +V  G      TS  P+V+QF +G   GPI
Subjt:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI

P9WQL4 Probable ribonucleotide transport ATP-binding protein mkl3.7e-3936.88Show/hide
Query:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN
        V IE   + KSFG   I   V+  I  GE   ++GPSGTGKS  LK + GLL P++G + I G   I     +EL  +R   G++FQ  ALF S+ +  N
Subjt:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN

Query:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS
          F L E++   E +I ++V E LA VGL G E + P E+SGGM+KR  LAR+++ D       P+++L DEP +GLDP+ +  +  LI  ++ + +   
Subjt:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS

Query:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI
              A+ ++VTH  +  R   D +  L+   +V  G      TS  P+V+QF +G   GPI
Subjt:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI

P9WQL5 Probable ribonucleotide transport ATP-binding protein mkl3.7e-3936.88Show/hide
Query:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN
        V IE   + KSFG   I   V+  I  GE   ++GPSGTGKS  LK + GLL P++G + I G   I     +EL  +R   G++FQ  ALF S+ +  N
Subjt:  VLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQN

Query:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS
          F L E++   E +I ++V E LA VGL G E + P E+SGGM+KR  LAR+++ D       P+++L DEP +GLDP+ +  +  LI  ++ + +   
Subjt:  VGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDAS

Query:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI
              A+ ++VTH  +  R   D +  L+   +V  G      TS  P+V+QF +G   GPI
Subjt:  GKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASGSLDGPI

Q9AT00 Protein TRIGALACTOSYLDIACYLGLYCEROL 3, chloroplastic1.7e-13279.22Show/hide
Query:  RRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPD
        RR V+C CIAPP    +D +   +   S     +  E   +++SDVLIECR+V+KSFGEKHIL+GVSFKIRHGEAVGVIGPSGTGKSTILKI+AGLL+PD
Subjt:  RRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPD

Query:  KGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFD
        KGEVYIRG+KR GLI DEE+SGLRIGLVFQSAALFDSL+VR+NVGFLLYE S +SE+QISELVT+ LAAVGLKGVE+RLPSELSGGMKKRVALARS+IFD
Subjt:  KGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFD

Query:  NTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASG
         T++ IEPEVLLYDEPTAGLDPIASTVVEDLIRSVH+  EDA GKPGKIASY+VVTHQHSTI+RAVDRLLFLYEG++VWQGMT EFTTSTNPIVQQFA+G
Subjt:  NTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASG

Query:  SLDGPIRY
        SLDGPIRY
Subjt:  SLDGPIRY

Arabidopsis top hitse value%identityAlignment
AT1G65410.1 non-intrinsic ABC protein 111.2e-13379.22Show/hide
Query:  RRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPD
        RR V+C CIAPP    +D +   +   S     +  E   +++SDVLIECR+V+KSFGEKHIL+GVSFKIRHGEAVGVIGPSGTGKSTILKI+AGLL+PD
Subjt:  RRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPD

Query:  KGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFD
        KGEVYIRG+KR GLI DEE+SGLRIGLVFQSAALFDSL+VR+NVGFLLYE S +SE+QISELVT+ LAAVGLKGVE+RLPSELSGGMKKRVALARS+IFD
Subjt:  KGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFD

Query:  NTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASG
         T++ IEPEVLLYDEPTAGLDPIASTVVEDLIRSVH+  EDA GKPGKIASY+VVTHQHSTI+RAVDRLLFLYEG++VWQGMT EFTTSTNPIVQQFA+G
Subjt:  NTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQFASG

Query:  SLDGPIRY
        SLDGPIRY
Subjt:  SLDGPIRY

AT1G67940.1 non-intrinsic ABC protein 35.6e-2231.05Show/hide
Query:  NSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGL
        N +D    EHL        E  + +         G + IL+GV+  I  G  VGVIGPSG+GKST L+ +  L  P +  V++ G      I + ++  L
Subjt:  NSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGL

Query:  --RIGLVFQSAALFDSLTVRQNVGF-LLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGL
          R+G++FQ   LF   TV  NV +        LS++++ +L+  +LA +     + +  +ELS G  +RVALAR++         EPEVLL DEPT+ L
Subjt:  --RIGLVFQSAALFDSLTVRQNVGF-LLYENSSLSEDQISELVTENLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGL

Query:  DPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQF
        DPI++  +ED+I  +         K  +  + ++V+H    I++  D +  + +G +V      E + +T+P+ Q+F
Subjt:  DPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGEFTTSTNPIVQQF

AT3G47790.1 ABC2 homolog 78.9e-2027.05Show/hide
Query:  KDESDVLIECRNVHKSFG------EKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAAL
        K   D  + C N+ K +       +K  +RG+S  +  GE  G++GP+G GK++ + ++ G++ P  G  +++G   + ++ D +     IG+  Q   L
Subjt:  KDESDVLIECRNVHKSFG------EKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAAL

Query:  FDSLTVRQNVGFLLYEN-SSLSEDQISELVTENLAAVGL--KGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDL
        ++ L+ R+++  L Y    +L    +++ V E+L +V L   G+ D+  S+ SGGMK+R+++A S+I         P+V+  DEP+ GLDP +   + D+
Subjt:  FDSLTVRQNVGFLLYEN-SSLSEDQISELVTENLAAVGL--KGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDL

Query:  IRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEG
        ++    KG           + I+ TH         DR+    +G
Subjt:  IRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEG

AT3G62150.1 P-glycoprotein 214.7e-2131.05Show/hide
Query:  IECRNVHKSF---GEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQ
        IE  NV+ S+    E+ I RG S  I  G  V ++G SG+GKST++ +I     P  GEV I G      + + +L  +R  IGLV Q   LF S ++++
Subjt:  IECRNVHKSF---GEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQ

Query:  NVGFLLYENSSLSE-DQISELVTE----NLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHI
        N+ +   EN+++ E  + +EL       +    GL  +     ++LSGG K+R+A+AR+I+ D       P +LL DE T+ LD  +  +V++ +  + +
Subjt:  NVGFLLYENSSLSE-DQISELVTE----NLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHI

Query:  KGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGE
                     + +VV H+ ST+R A D +  +++G++V +G   E
Subjt:  KGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGE

AT4G01830.1 P-glycoprotein 57.5e-1928.63Show/hide
Query:  IECRNVHKSF---GEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQ
        IE R+V  S+    ++ +  G S  I  G    ++G SG+GKST++ +I     P+ G+V I G      + + +L  +R  IGLV Q   LF S ++ +
Subjt:  IECRNVHKSF---GEKHILRGVSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLR--IGLVFQSAALFDSLTVRQ

Query:  NVGFLLYENSSLSEDQISELVTE-----NLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHI
        N+G+   E +++ E Q +  +       +   +GL+ +     ++LSGG K+R+A+AR+I+ D       P +LL DE T+ LD  +  VV++ +  + +
Subjt:  NVGFLLYENSSLSEDQISELVTE-----NLAAVGLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHI

Query:  KGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGE
                     + ++V H+ ST+R A D +  ++ G++V +G   E
Subjt:  KGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEGRVVWQGMTGE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGTTTCCATATCGGGTTCGGTATTCTTCCCATTAACAGTACCCAATTGTTCCTCTCGATCGCGTAAAGTTGCTGTTCTTGATGCGCATAATTCGTTTTGTTGT
AAGATAAAGGACCAGAGAAGGATTGTTGCTTGTAATTGCATTGCGCCTCCTCCGTACTTCAAGAGTGATGAGTCATCTGCCGTAAATTCGAATGACTCGTTTAGA
TCAGAACATTTGAGCTCAGAAAATGAGGACAAGGATGAGTCTGATGTTCTCATCGAGTGTAGAAATGTCCACAAATCCTTTGGAGAAAAACATATATTGAGAGGT
GTGAGCTTCAAGATTAGACATGGAGAAGCTGTGGGAGTAATTGGGCCTTCTGGTACTGGGAAGTCTACAATACTGAAGATCATCGCAGGTCTTCTTTCTCCAGAC
AAGGGAGAGGTGTATATTCGAGGTAGAAAGCGAATTGGTTTGATCGATGATGAAGAGCTATCTGGTCTTCGAATTGGATTGGTTTTTCAGAGTGCGGCACTTTTT
GATTCATTAACTGTTCGACAAAATGTTGGTTTCCTTTTGTATGAAAATTCAAGCTTGTCTGAAGATCAAATTTCAGAATTGGTAACTGAGAACTTAGCTGCTGTT
GGGCTAAAGGGAGTTGAGGATCGTTTACCTTCTGAATTATCAGGTGGAATGAAGAAACGAGTTGCTTTAGCTAGGTCCATAATTTTTGATAACACAAGGAAAGAA
ATTGAGCCAGAGGTGCTCTTGTACGATGAACCTACTGCTGGACTTGACCCAATTGCATCAACTGTTGTTGAAGATCTTATACGTTCTGTACATATTAAGGGTGAG
GATGCTAGTGGGAAGCCTGGAAAGATTGCATCTTATATTGTAGTCACGCACCAGCACAGTACCATTAGGAGAGCTGTTGACAGGTTATTATTTTTATACGAGGGA
AGGGTTGTCTGGCAAGGAATGACCGGTGAATTTACAACGTCTACAAATCCAATCGTTCAACAGTTTGCATCGGGAAGCTTGGATGGTCCGATTAGGTACTAG
mRNA sequenceShow/hide mRNA sequence
GCAAGCAAATTGTTAAAACTCGAAAAAAAAAAAAGAATAAAGAAAAGAAAATAAGAAAAAGCAAAAGGAGGAAGACGGCTGGCGTCTCATCACAAACCCAGTTCG
TCACGTCACCGCCGTTGGCATACGACGGGGAACTAATTAGCAATCACGTCTCTTATTAAAACTCTACGTGGGTTTCTTCTAATTTACGAAGTTTCTGCACATTCC
CATCTCTTTCCTTCATCTTTTTAAATCTTTTTCTGGGCGAGTTCTGTATCATTTCTACTTCATTCTCAAGCAGAACTCCTTAAACTATCCTTCTTTACCTTGAGT
TGCAGGATAAAATCGAGTTTTTTTTTTTTTTTGCTCATAACCCCGTTTGGGTTTCTTTAAATTTGTGAGGTTCGATTGCATTGAAACTACTAATTCAATAGGAGG
CTGATTTTGGACTGGTTGAATCGTGGGTCAGTTTCACAATCTCAAAATTCATCTACCCTTAAACGGGTCAATCCCGGTAACATGGTTTCCATATCGGGTTCGGTA
TTCTTCCCATTAACAGTACCCAATTGTTCCTCTCGATCGCGTAAAGTTGCTGTTCTTGATGCGCATAATTCGTTTTGTTGTAAGATAAAGGACCAGAGAAGGATT
GTTGCTTGTAATTGCATTGCGCCTCCTCCGTACTTCAAGAGTGATGAGTCATCTGCCGTAAATTCGAATGACTCGTTTAGATCAGAACATTTGAGCTCAGAAAAT
GAGGACAAGGATGAGTCTGATGTTCTCATCGAGTGTAGAAATGTCCACAAATCCTTTGGAGAAAAACATATATTGAGAGGTGTGAGCTTCAAGATTAGACATGGA
GAAGCTGTGGGAGTAATTGGGCCTTCTGGTACTGGGAAGTCTACAATACTGAAGATCATCGCAGGTCTTCTTTCTCCAGACAAGGGAGAGGTGTATATTCGAGGT
AGAAAGCGAATTGGTTTGATCGATGATGAAGAGCTATCTGGTCTTCGAATTGGATTGGTTTTTCAGAGTGCGGCACTTTTTGATTCATTAACTGTTCGACAAAAT
GTTGGTTTCCTTTTGTATGAAAATTCAAGCTTGTCTGAAGATCAAATTTCAGAATTGGTAACTGAGAACTTAGCTGCTGTTGGGCTAAAGGGAGTTGAGGATCGT
TTACCTTCTGAATTATCAGGTGGAATGAAGAAACGAGTTGCTTTAGCTAGGTCCATAATTTTTGATAACACAAGGAAAGAAATTGAGCCAGAGGTGCTCTTGTAC
GATGAACCTACTGCTGGACTTGACCCAATTGCATCAACTGTTGTTGAAGATCTTATACGTTCTGTACATATTAAGGGTGAGGATGCTAGTGGGAAGCCTGGAAAG
ATTGCATCTTATATTGTAGTCACGCACCAGCACAGTACCATTAGGAGAGCTGTTGACAGGTTATTATTTTTATACGAGGGAAGGGTTGTCTGGCAAGGAATGACC
GGTGAATTTACAACGTCTACAAATCCAATCGTTCAACAGTTTGCATCGGGAAGCTTGGATGGTCCGATTAGGTACTAGTGGATTCAGTAACGATGTACTTTTAGA
TTAGATGTAGCAGCGTTCCTACTTTGGAGACAACAGACTTTAGTTATGGAGAAGACAGAAAAGTTAACATGGACCAATTCTTACACATTGCTGAGAAAGAGAACA
AGCATTAAAGCTCATTTCTGTAATTCTGTTTCCTTTGTTAGAAATGTGTTCTTCGTTTGTATTTCCATTGTTTCTGTAGTATTAGGCAAATGTAGAAGCTATGTG
GGGATTATTTTTAGTTTTCCTCGAAAGCAAGCAGAGAATCTCAGAACTAAAATCTTGCTTTTCCTCCATTGATGATAGCTTTTTCCTCTTTCTATTATTCCTCAG
CAAGAAAGGAAATTATTTTGAAACACAAAACTGTCAAAAGTATTTATAAATATTATCTAAATTTCACAGCCTATTACTCATTAGTGCCTATAAACGTCTACCTAA
TTGATGATA
Protein sequenceShow/hide protein sequence
MVSISGSVFFPLTVPNCSSRSRKVAVLDAHNSFCCKIKDQRRIVACNCIAPPPYFKSDESSAVNSNDSFRSEHLSSENEDKDESDVLIECRNVHKSFGEKHILRG
VSFKIRHGEAVGVIGPSGTGKSTILKIIAGLLSPDKGEVYIRGRKRIGLIDDEELSGLRIGLVFQSAALFDSLTVRQNVGFLLYENSSLSEDQISELVTENLAAV
GLKGVEDRLPSELSGGMKKRVALARSIIFDNTRKEIEPEVLLYDEPTAGLDPIASTVVEDLIRSVHIKGEDASGKPGKIASYIVVTHQHSTIRRAVDRLLFLYEG
RVVWQGMTGEFTTSTNPIVQQFASGSLDGPIRY