; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS028231 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS028231
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
Descriptionorgan-specific protein S2-like isoform X3
Genome locationscaffold47:476468..478012
RNA-Seq ExpressionMS028231
SyntenyMS028231
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
CAG2254779.1 unnamed protein product [Mytilus edulis]2.2e-1733.44Show/hide
Query:  KDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRK----PFFQDL
        + + PQS+V D      P +S  ND +K     + PQS+V D    V P +S  ND +    K ++P+S+V D      P +S  ND ++      ++ +
Subjt:  KDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRK----PFFQDL

Query:  KPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDIRPQSFVFDYAHHVKPKESSSNDQQKPLLNYIKPQSFVF
         PQS+V D    V P +S  ND +    K + PQ +V D  ++V P +S  NDQ+    K + PQS+V D   HV P +S  NDQ+K    ++ PQS+V 
Subjt:  KPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDIRPQSFVFDYAHHVKPKESSSNDQQKPLLNYIKPQSFVF

Query:  DYAHHV--------KSKESSPQKPLKDIKSQSFVFDYAHDVKPK-----ESSSPDPQKPLKD----IKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKP
        D   HV        + K   PQ   K +  QS+V D    V P+     +    DPQ  + D    + PQS+V D   HV P+  S  N QK   R + P
Subjt:  DYAHHV--------KSKESSPQKPLKDIKSQSFVFDYAHDVKPK-----ESSSPDPQKPLKD----IKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKP

Query:  QSFVFDYARNVKQKESSSNDPQE
        QS+V D  R+V   +S  ND ++
Subjt:  QSFVFDYARNVKQKESSSNDPQE

XP_021860185.1 uncharacterized protein LOC110799264 isoform X2 [Spinacia oleracea]1.1e-1325.4Show/hide
Query:  VVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQA--DHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDIN----P
        ++FI   S+IL+   T  R  PGD+ R I  +KD  +P++  D  + ++   ES   L K   P      Y H    +E      +K   ++  N    P
Subjt:  VVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQA--DHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDIN----P

Query:  QVFVFDYAHGVKPKE-----SSFNDPQKPLLKDIKPQSFVFDYAHG--AKPKESSSNDPRKPLLQDLK----PQSFVFDYAHGVKPKESSS-----NDPQ
              Y H V PKE         +  K   K+  P   V  Y H   AK  E  +N+  +  ++D      P   V  Y H V PKE  S      +  
Subjt:  QVFVFDYAHGVKPKE-----SSFNDPQKPLLKDIKPQSFVFDYAHG--AKPKESSSNDPRKPLLQDLK----PQSFVFDYAHGVKPKESSS-----NDPQ

Query:  KSLLKDINPKSFVFDYAHGAKPKE-----SSSNDPRKPFFQDLKPQSFVFDYAHGVKPKE-----SSSNDPQKPLLKDIKPQSFVFDYARNVKPKE----
        K   K+ +P   V  Y H    KE         +  K F ++  P S    Y H V  KE         +  K   K+  P S    Y   V  KE    
Subjt:  KSLLKDINPKSFVFDYAHGAKPKE-----SSSNDPRKPFFQDLKPQSFVFDYAHGVKPKE-----SSSNDPQKPLLKDIKPQSFVFDYARNVKPKE----

Query:  -SSSNDQQKPLLKDIRPQSFVFDYAHHVKPK------------ESSSNDQQKPLLNYIK---PQSFVFDYAHHV
             +  K   K+  P   V  Y H+V P+            E  S+++++ +  + K   P S V  Y H+V
Subjt:  -SSSNDQQKPLLKDIRPQSFVFDYAHHVKPK------------ESSSNDQQKPLLNYIK---PQSFVFDYAHHV

XP_022135668.1 uncharacterized protein LOC111007568 [Momordica charantia]2.0e-15698.22Show/hide
Query:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVF
        MKGVVFITFFSLILIV TTESRHEPGDHQRRINVLKDD LPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVF
Subjt:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVF

Query:  VFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHG
        VFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAH VKPKESSSNDPQKSLLKDINPKSFVFDYAHG
Subjt:  VFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHG

Query:  AKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDI
        AKPKESSSNDPRKPFFQDL+PQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQK LLKDI
Subjt:  AKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDI

XP_022135723.1 uncharacterized protein LOC111007615 [Momordica charantia]1.8e-2435.18Show/hide
Query:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDS-LPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGA----KQQESSSN-----DPRKPL
        MKG+VFI F SL+LI ST ESR EPGD + R NV+KD+S LPQA++ DDSKP LES  PL KD+K QS  ++         K  +S  N     + R+PL
Subjt:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDS-LPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGA----KQQESSSN-----DPRKPL

Query:  GLQDINPQVFVFDYAHGVKPKESSFNDP------------QKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSN
          +D+ PQ    ++ +  +  ES F D             ++PL KD+K Q           P   +     +PL + +KPQ           P   +++
Subjt:  GLQDINPQVFVFDYAHGVKPKESSFNDP------------QKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSN

Query:  DPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLL
        + Q+   KD+ P           +P   ++++  +P F+D+KPQ           P    + +  +PL +D+KPQ   F +  +VKP+ESSS DQQKPL 
Subjt:  DPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLL

Query:  K-DIRPQ
        K DI+PQ
Subjt:  K-DIRPQ

XP_022952150.1 uncharacterized protein LOC111454914 isoform X1 [Cucurbita moschata]1.1e-1626Show/hide
Query:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQ--ADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQ
        MKG+VFI FF LIL+ +T ESR+EPGDH  R N + D SL +   +       SL SE    K+++  +       G    ++    P+       +  +
Subjt:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQ--ADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQ

Query:  VFVFDYAHGVKPKESSFNDP----QKPLLKDIKPQ---SFVFD------YAHGAKPKESSSNDP----RKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQ
        +F  D    +KP+ S+   P    +K + +DI+P+   SF  D      ++   +P+ S+S  P    +K + +D++P+  +  Y   VK K  S     
Subjt:  VFVFDYAHGVKPKESSFNDP----QKPLLKDIKPQ---SFVFD------YAHGAKPKESSSNDP----RKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQ

Query:  KSLLKDINPKSFVFDYAHGAKPK---ESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDP----QKPLLKDIKPQ---SFVFD------YARNVKP
            KDI P+     Y    K K   E     P   F+ D+        ++  ++P+ S+S  P    +K + +DI+P+   SF  D      ++++++P
Subjt:  KSLLKDINPKSFVFDYAHGAKPK---ESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDP----QKPLLKDIKPQ---SFVFD------YARNVKP

Query:  KESSS----NDQQKPLLKDIRPQ---SFVFD------YAHHVKPKESSS---NDQQKPLLNYIKPQSFVFDYAHHVKSKESSPQKPLKDIKSQSFVFDYA
        + S+S    + ++K + +DI P+   SF  D      ++ ++KP+ S+S   +D +  ++  IKP+  V  Y   +K+K +      KDI+ Q  +  Y 
Subjt:  KESSS----NDQQKPLLKDIRPQ---SFVFD------YAHHVKPKESSS---NDQQKPLLNYIKPQSFVFDYAHHVKSKESSPQKPLKDIKSQSFVFDYA

Query:  HDVKPKESSSPDPQKPL------------KDIKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKPQSFVFDYARNVK
         D+K K +   +P++ +            KDI+P+  V  Y + +K K          +++DI+P++ V  Y  ++K
Subjt:  HDVKPKESSSPDPQKPL------------KDIKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKPQSFVFDYARNVK

TrEMBL top hitse value%identityAlignment
A0A6J1C3J9 uncharacterized protein LOC1110076181.7e-1228.72Show/hide
Query:  ITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQA----DHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVFVF
        I  F L+L+VS  ESR+EPG H R  N ++D  LP+A    + C +    LE+E   +KDI+P+  +  Y + AK+  +          + DI PQ    
Subjt:  ITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQA----DHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVFVF

Query:  DYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHGAK
         Y   VK          K   +DI P+  V  Y          ++  +  L +D++P+  V  Y   VK          K   KDI+P+  V  Y +  K
Subjt:  DYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHGAK

Query:  PKESSSNDPR------------KPFFQDLKPQSFVFDYAHGVK--------PKESSS---NDPQKPLLKDIKPQSFVFDYARNVKPKES
         + +   +PR            K F +D+ P+  V  Y + VK        P+ S++   +D Q  L KDI+P+  V  Y   +K KES
Subjt:  PKESSSNDPR------------KPFFQDLKPQSFVFDYAHGVK--------PKESSS---NDPQKPLLKDIKPQSFVFDYARNVKPKES

A0A6J1C5I1 uncharacterized protein LOC1110075689.8e-15798.22Show/hide
Query:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVF
        MKGVVFITFFSLILIV TTESRHEPGDHQRRINVLKDD LPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVF
Subjt:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVF

Query:  VFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHG
        VFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAH VKPKESSSNDPQKSLLKDINPKSFVFDYAHG
Subjt:  VFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHG

Query:  AKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDI
        AKPKESSSNDPRKPFFQDL+PQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQK LLKDI
Subjt:  AKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDI

A0A6J1C5P1 uncharacterized protein LOC1110076158.9e-2535.18Show/hide
Query:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDS-LPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGA----KQQESSSN-----DPRKPL
        MKG+VFI F SL+LI ST ESR EPGD + R NV+KD+S LPQA++ DDSKP LES  PL KD+K QS  ++         K  +S  N     + R+PL
Subjt:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDS-LPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGA----KQQESSSN-----DPRKPL

Query:  GLQDINPQVFVFDYAHGVKPKESSFNDP------------QKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSN
          +D+ PQ    ++ +  +  ES F D             ++PL KD+K Q           P   +     +PL + +KPQ           P   +++
Subjt:  GLQDINPQVFVFDYAHGVKPKESSFNDP------------QKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSN

Query:  DPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLL
        + Q+   KD+ P           +P   ++++  +P F+D+KPQ           P    + +  +PL +D+KPQ   F +  +VKP+ESSS DQQKPL 
Subjt:  DPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLL

Query:  K-DIRPQ
        K DI+PQ
Subjt:  K-DIRPQ

A0A6J1GKY7 uncharacterized protein LOC111454914 isoform X15.3e-1726Show/hide
Query:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQ--ADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQ
        MKG+VFI FF LIL+ +T ESR+EPGDH  R N + D SL +   +       SL SE    K+++  +       G    ++    P+       +  +
Subjt:  MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQ--ADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQ

Query:  VFVFDYAHGVKPKESSFNDP----QKPLLKDIKPQ---SFVFD------YAHGAKPKESSSNDP----RKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQ
        +F  D    +KP+ S+   P    +K + +DI+P+   SF  D      ++   +P+ S+S  P    +K + +D++P+  +  Y   VK K  S     
Subjt:  VFVFDYAHGVKPKESSFNDP----QKPLLKDIKPQ---SFVFD------YAHGAKPKESSSNDP----RKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQ

Query:  KSLLKDINPKSFVFDYAHGAKPK---ESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDP----QKPLLKDIKPQ---SFVFD------YARNVKP
            KDI P+     Y    K K   E     P   F+ D+        ++  ++P+ S+S  P    +K + +DI+P+   SF  D      ++++++P
Subjt:  KSLLKDINPKSFVFDYAHGAKPK---ESSSNDPRKPFFQDLKPQSFVFDYAHGVKPKESSSNDP----QKPLLKDIKPQ---SFVFD------YARNVKP

Query:  KESSS----NDQQKPLLKDIRPQ---SFVFD------YAHHVKPKESSS---NDQQKPLLNYIKPQSFVFDYAHHVKSKESSPQKPLKDIKSQSFVFDYA
        + S+S    + ++K + +DI P+   SF  D      ++ ++KP+ S+S   +D +  ++  IKP+  V  Y   +K+K +      KDI+ Q  +  Y 
Subjt:  KESSS----NDQQKPLLKDIRPQ---SFVFD------YAHHVKPKESSS---NDQQKPLLNYIKPQSFVFDYAHHVKSKESSPQKPLKDIKSQSFVFDYA

Query:  HDVKPKESSSPDPQKPL------------KDIKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKPQSFVFDYARNVK
         D+K K +   +P++ +            KDI+P+  V  Y + +K K          +++DI+P++ V  Y  ++K
Subjt:  HDVKPKESSSPDPQKPL------------KDIKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKPQSFVFDYARNVK

T1I9L0 Uncharacterized protein8.7e-1226.4Show/hide
Query:  SKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSS--NDPRKPLGLQDINPQVFVFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSS
        S  S  + GPL K   P   +      +K+  S     D RK    +D +P+  + D       KESS  D  +PL++D +              KESS 
Subjt:  SKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSS--NDPRKPLGLQDINPQVFVFDYAHGVKPKESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSS

Query:  NDPRKPLLQDLKPQSFVFDYAHGV---KPKESSSNDPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRKPFFQDLKPQSFVFDYA-HGVK--PKESSSN
         D  KPL++D + +S   D    +     KESS  D +KSL++D                KESS  D  K   +D K +S   D + H V+   +E S  
Subjt:  NDPRKPLLQDLKPQSFVFDYAHGV---KPKESSSNDPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRKPFFQDLKPQSFVFDYA-HGVK--PKESSSN

Query:  DPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDIRPQSFVFDYAHHVKPKESSSNDQQKPLLNYIKPQSFVFDYAHHVKSKESSPQKPLKDIK
        D  +PL++D +              KESS  D  K L++D R +S   D    +  +ES   D  K L+ +   +           S++ SP+  ++D +
Subjt:  DPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDIRPQSFVFDYAHHVKPKESSSNDQQKPLLNYIKPQSFVFDYAHHVKSKESSPQKPLKDIK

Query:  SQSFVFDYAH---DVKPKESSSPDPQKPL---------KDIKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKPQSFVFDYARNVKQKESSSND
         +S   D +     V  KES   D  +PL         K   P+S + D       KK +  +  KPL+R    + +  D  +  KQ++  S +
Subjt:  SQSFVFDYAH---DVKPKESSSPDPQKPL---------KDIKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKPQSFVFDYARNVKQKESSSND

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAAGGGGGTTGTTTTCATCACTTTCTTCTCGCTTATATTGATTGTAAGCACTACAGAATCAAGACATGAGCCAGGAGATCATCAAAGGAGGATAAATGTGTTAAAAGA
TGATTCGTTGCCTCAAGCAGATCATTGTGACGATTCAAAGCCATCTTTGGAAAGTGAAGGGCCTCTTCTTAAGGATATAAAGCCTCAATCATTCGTATTTGACTACGCAC
ATGGTGCTAAACAACAAGAGTCGTCATCGAATGATCCACGAAAGCCTCTCGGCCTTCAGGATATAAATCCTCAAGTGTTTGTATTTGACTATGCACATGGTGTTAAACCA
AAAGAGTCGTCCTTCAATGATCCACAAAAGCCTCTCCTTAAGGATATAAAGCCTCAGTCATTTGTATTTGACTATGCACATGGTGCTAAACCAAAAGAGTCGTCCTCCAA
TGATCCACGAAAACCTCTCCTTCAGGATTTAAAGCCCCAATCGTTTGTATTTGACTATGCACATGGTGTTAAACCAAAAGAGTCGTCCTCCAATGATCCACAAAAGTCTC
TCCTTAAGGATATAAATCCTAAGTCATTTGTATTTGACTACGCACATGGTGCTAAACCAAAAGAGTCGTCATCCAATGATCCACGAAAGCCTTTCTTTCAAGACTTAAAG
CCTCAATCGTTTGTATTTGACTATGCACATGGTGTTAAACCAAAAGAATCTTCCTCCAATGATCCACAAAAGCCTCTCCTTAAGGATATAAAGCCTCAGTCATTTGTATT
TGATTACGCACGTAATGTTAAACCAAAAGAGTCATCCTCCAATGACCAACAAAAGCCTCTCCTCAAGGATATAAGACCTCAGTCATTTGTATTTGACTATGCACATCATG
TTAAACCAAAAGAGTCATCCTCTAATGACCAACAAAAGCCTCTCCTTAATTATATAAAGCCTCAGTCATTTGTATTTGACTACGCACATCATGTTAAATCAAAAGAGTCG
TCCCCACAAAAGCCTCTCAAAGATATAAAGTCTCAATCATTCGTATTTGATTACGCACATGATGTTAAACCAAAAGAGTCATCCTCCCCTGATCCACAAAAGCCTCTCAA
AGATATAAAACCTCAATCATTCGTATTTGACTATGCACACCATGTTAAACCAAAAAAGTCGTCCTCCCATAATCCACAAAAACCTCTCCTTAGGGACATAAAGCCTCAAT
CATTCGTATTTGACTATGCACGTAATGTTAAACAAAAAGAGTCATCTTCCAATGATCCACAAGAGCCTTCATTAAGGAATGAGAATCTTTTGAGTGAAGCCTGA
mRNA sequenceShow/hide mRNA sequence
ATGAAGGGGGTTGTTTTCATCACTTTCTTCTCGCTTATATTGATTGTAAGCACTACAGAATCAAGACATGAGCCAGGAGATCATCAAAGGAGGATAAATGTGTTAAAAGA
TGATTCGTTGCCTCAAGCAGATCATTGTGACGATTCAAAGCCATCTTTGGAAAGTGAAGGGCCTCTTCTTAAGGATATAAAGCCTCAATCATTCGTATTTGACTACGCAC
ATGGTGCTAAACAACAAGAGTCGTCATCGAATGATCCACGAAAGCCTCTCGGCCTTCAGGATATAAATCCTCAAGTGTTTGTATTTGACTATGCACATGGTGTTAAACCA
AAAGAGTCGTCCTTCAATGATCCACAAAAGCCTCTCCTTAAGGATATAAAGCCTCAGTCATTTGTATTTGACTATGCACATGGTGCTAAACCAAAAGAGTCGTCCTCCAA
TGATCCACGAAAACCTCTCCTTCAGGATTTAAAGCCCCAATCGTTTGTATTTGACTATGCACATGGTGTTAAACCAAAAGAGTCGTCCTCCAATGATCCACAAAAGTCTC
TCCTTAAGGATATAAATCCTAAGTCATTTGTATTTGACTACGCACATGGTGCTAAACCAAAAGAGTCGTCATCCAATGATCCACGAAAGCCTTTCTTTCAAGACTTAAAG
CCTCAATCGTTTGTATTTGACTATGCACATGGTGTTAAACCAAAAGAATCTTCCTCCAATGATCCACAAAAGCCTCTCCTTAAGGATATAAAGCCTCAGTCATTTGTATT
TGATTACGCACGTAATGTTAAACCAAAAGAGTCATCCTCCAATGACCAACAAAAGCCTCTCCTCAAGGATATAAGACCTCAGTCATTTGTATTTGACTATGCACATCATG
TTAAACCAAAAGAGTCATCCTCTAATGACCAACAAAAGCCTCTCCTTAATTATATAAAGCCTCAGTCATTTGTATTTGACTACGCACATCATGTTAAATCAAAAGAGTCG
TCCCCACAAAAGCCTCTCAAAGATATAAAGTCTCAATCATTCGTATTTGATTACGCACATGATGTTAAACCAAAAGAGTCATCCTCCCCTGATCCACAAAAGCCTCTCAA
AGATATAAAACCTCAATCATTCGTATTTGACTATGCACACCATGTTAAACCAAAAAAGTCGTCCTCCCATAATCCACAAAAACCTCTCCTTAGGGACATAAAGCCTCAAT
CATTCGTATTTGACTATGCACGTAATGTTAAACAAAAAGAGTCATCTTCCAATGATCCACAAGAGCCTTCATTAAGGAATGAGAATCTTTTGAGTGAAGCCTGA
Protein sequenceShow/hide protein sequence
MKGVVFITFFSLILIVSTTESRHEPGDHQRRINVLKDDSLPQADHCDDSKPSLESEGPLLKDIKPQSFVFDYAHGAKQQESSSNDPRKPLGLQDINPQVFVFDYAHGVKP
KESSFNDPQKPLLKDIKPQSFVFDYAHGAKPKESSSNDPRKPLLQDLKPQSFVFDYAHGVKPKESSSNDPQKSLLKDINPKSFVFDYAHGAKPKESSSNDPRKPFFQDLK
PQSFVFDYAHGVKPKESSSNDPQKPLLKDIKPQSFVFDYARNVKPKESSSNDQQKPLLKDIRPQSFVFDYAHHVKPKESSSNDQQKPLLNYIKPQSFVFDYAHHVKSKES
SPQKPLKDIKSQSFVFDYAHDVKPKESSSPDPQKPLKDIKPQSFVFDYAHHVKPKKSSSHNPQKPLLRDIKPQSFVFDYARNVKQKESSSNDPQEPSLRNENLLSEA