; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

HG10013410 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome

Gene IDHG10013410
OrganismLagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Descriptionsymplekin isoform X1
Genome locationChr02:1199373..1205742
RNA-Seq ExpressionHG10013410
SyntenyHG10013410
Gene Ontology termsNA
InterPro domainsIPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold
IPR032460 - Symplekin/Pta1, N-terminal


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022940450.1 symplekin isoform X1 [Cucurbita moschata]2.4e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

XP_022940452.1 uncharacterized protein LOC111446048 isoform X3 [Cucurbita moschata]2.4e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

XP_022940453.1 uncharacterized protein LOC111446048 isoform X4 [Cucurbita moschata]2.4e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

XP_022940454.1 uncharacterized protein LOC111446048 isoform X5 [Cucurbita moschata]2.4e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

XP_023524841.1 symplekin isoform X1 [Cucurbita pepo subsp. pepo]2.4e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

TrEMBL top hitse value%identityAlignment
A0A6J1FII2 symplekin isoform X21.2e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

A0A6J1FJM8 uncharacterized protein LOC111446048 isoform X31.2e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

A0A6J1FK62 uncharacterized protein LOC111446048 isoform X51.2e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

A0A6J1FPB5 uncharacterized protein LOC111446048 isoform X41.2e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

A0A6J1FQL4 symplekin isoform X11.2e-8788.56Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIIL+IEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLL SLKDE+S+VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
        GQSIISGQKLFC TLREMTL            Q HRRGKVERWLEE+WMRMLKFKD+VLA+AIEPGSVG+RLLALKFLETYVLLFTSDTNDPQKAISE N
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  G
        G
Subjt:  G

SwissProt top hitse value%identityAlignment
Q7ZYV9 Symplekin4.5e-0423.08Show/hide
Query:  LSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAGQSIISGQK
        L++ A A N      KI+ LKQV+++I+  +P+        ++  Q+     +RK+++  IE+      E    L++ L   LKDE   V  +SI++  +
Subjt:  LSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAGQSIISGQK

Query:  LFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEENGVAM
        L+ V L+ +        A  R P   +        E  W  + +   ++L + +E  + G R  A+KF+E+ ++  +  T D +    ++  +++
Subjt:  LFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEENGVAM

Arabidopsis top hitse value%identityAlignment
AT1G27570.1 phosphatidylinositol 3- and 4-kinase family protein8.6e-4348.73Show/hide
Query:  RALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAGQSIISG
        +AL+LLAAA NHGDL VK+SSLK+VK+I+L++EPS +AE++ YL EL  SPE L+R+ LIE+IE++GLR +EHS +L+SVL+  + D +  VA +SI +G
Subjt:  RALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAGQSIISG

Query:  QKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEV--LAVAIEPGS-VGRRLLALKFLETYVLLFTSDTNDPQKAISEENG
           F   L +M              Q H RGKV+RW   LW  ML FKD V  +A+ +EPG  VG ++LALKF+ET++LL T   +DP+K  +   G
Subjt:  QKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEV--LAVAIEPGS-VGRRLLALKFLETYVLLFTSDTNDPQKAISEENG

AT1G27570.2 phosphatidylinositol 3- and 4-kinase family protein9.9e-2339.33Show/hide
Query:  RALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAGQSIISG
        +AL+LLAAA NHGDL VK+SSLK+VK+I+L++EPS +AE++ YL EL  SPE L+R+ LIE+IE++                            +SI +G
Subjt:  RALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAGQSIISG

Query:  QKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLF
           F   L +M  Q++ + +       H RGKV+RW   LW  ML FKD V  +A++   + RR   L  ++  +LLF
Subjt:  QKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLF

AT1G27590.1 CONTAINS InterPro DOMAIN/s: Protein of unknown function DUF3453 (InterPro:IPR021850)8.3e-5455.33Show/hide
Query:  AGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAG
        A   R +ALSLLAAANNHGDL VK+SSL+QVK+I+L++EPS +AE++ YL EL  S E L+RK LIE+IE++GLR ++HS +L+SVLL   +DE+  VA 
Subjt:  AGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAG

Query:  QSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISE
        +SI  G   FC  L EM +            Q H RGKV+RW  ELW  M+KFKD V A A+EPG VG ++LALKF+ET++LLFT D +DP+KA SE
Subjt:  QSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISE

AT5G01400.1 HEAT repeat-containing protein8.7e-1930.92Show/hide
Query:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA
        MA   R R   L  +A +  +L  K+  L+ ++  +   +  F  EL  +L +L S     +RK + E++ +IGL+ +E  P ++ +L+ SL+DE   VA
Subjt:  MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVA

Query:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN
         Q I  G  LF  TL  + +Q            LH   ++   LE  W  ++KFKDE+ +VA + G+ G +L A+KF+E  +LL+T     P + I  + 
Subjt:  GQSIISGQKLFCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEEN

Query:  GVAMLDG
         +++L G
Subjt:  GVAMLDG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCAGGAGTTCTCAGAGAAAGAGCACTCTCTCTCCTCGCCGCCGCTAACAACCACGGCGATTTAACGGTGAAGATTTCATCTTTGAAGCAGGTCAAGGATATCATACT
GGCCATCGAGCCATCATTCGCAGCAGAGCTCTACTCCTACTTGGTCGAGCTTCAGTCCTCCCCCGAGAGCTTACTACGTAAATTGTTAATTGAGGTGATTGAAGACATTG
GATTAAGAGCCATGGAACATTCTCCTCTGTTAATGTCGGTTTTATTGACATCTTTAAAGGATGAAGAATCAATCGTAGCAGGACAATCAATTATTAGTGGCCAAAAATTA
TTTTGTGTTACTTTAAGAGAGATGACATTGCAGCTTTATAAATTAGATGCTAATTTTAGAACTCCACAGTTGCATCGGCGAGGTAAAGTTGAAAGATGGCTTGAAGAACT
GTGGATGAGAATGTTGAAGTTTAAAGATGAGGTTTTGGCAGTTGCTATAGAGCCTGGTTCTGTTGGGAGGAGATTGCTGGCTTTGAAATTTTTGGAAACGTATGTTCTAC
TTTTTACATCCGATACAAATGATCCACAGAAAGCAATCTCAGAAGAAAATGGAGTAGCAATGCTAGATGGTGTTAGACTGCAAAATTATATGGGTACTTTGGAGCACCAG
TGGCCAGTGATAGGAATGGATAACTGGTGCAATGATTACCCTATGTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCAGGAGTTCTCAGAGAAAGAGCACTCTCTCTCCTCGCCGCCGCTAACAACCACGGCGATTTAACGGTGAAGATTTCATCTTTGAAGCAGGTCAAGGATATCATACT
GGCCATCGAGCCATCATTCGCAGCAGAGCTCTACTCCTACTTGGTCGAGCTTCAGTCCTCCCCCGAGAGCTTACTACGTAAATTGTTAATTGAGGTGATTGAAGACATTG
GATTAAGAGCCATGGAACATTCTCCTCTGTTAATGTCGGTTTTATTGACATCTTTAAAGGATGAAGAATCAATCGTAGCAGGACAATCAATTATTAGTGGCCAAAAATTA
TTTTGTGTTACTTTAAGAGAGATGACATTGCAGCTTTATAAATTAGATGCTAATTTTAGAACTCCACAGTTGCATCGGCGAGGTAAAGTTGAAAGATGGCTTGAAGAACT
GTGGATGAGAATGTTGAAGTTTAAAGATGAGGTTTTGGCAGTTGCTATAGAGCCTGGTTCTGTTGGGAGGAGATTGCTGGCTTTGAAATTTTTGGAAACGTATGTTCTAC
TTTTTACATCCGATACAAATGATCCACAGAAAGCAATCTCAGAAGAAAATGGAGTAGCAATGCTAGATGGTGTTAGACTGCAAAATTATATGGGTACTTTGGAGCACCAG
TGGCCAGTGATAGGAATGGATAACTGGTGCAATGATTACCCTATGTGA
Protein sequenceShow/hide protein sequence
MAGVLRERALSLLAAANNHGDLTVKISSLKQVKDIILAIEPSFAAELYSYLVELQSSPESLLRKLLIEVIEDIGLRAMEHSPLLMSVLLTSLKDEESIVAGQSIISGQKL
FCVTLREMTLQLYKLDANFRTPQLHRRGKVERWLEELWMRMLKFKDEVLAVAIEPGSVGRRLLALKFLETYVLLFTSDTNDPQKAISEENGVAMLDGVRLQNYMGTLEHQ
WPVIGMDNWCNDYPM