; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS024307 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS024307
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
DescriptionMicrobial collagenase
Genome locationscaffold30:2711664..2713033
RNA-Seq ExpressionMS024307
SyntenyMS024307
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6587672.1 hypothetical protein SDJN03_16237, partial [Cucurbita argyrosperma subsp. sororia]2.6e-11181.47Show/hide
Query:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR
        + +S FSWFASSSS      PKIF KTPSNA   YPIS KSSN+PS  R  R KT A L  KDPNGAAPL V EE+SSS I++EEVE SVK+LK AAKTR
Subjt:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR

Query:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ
        RVAAEE+LSALS++EKAKLDPS+FF+TLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGV+LGP+GSLTFEGR+SWKNRILAFIFE+
Subjt:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ

Query:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        IRIK GPL PLEI+LGKK+EREPSSKDPFFIWFYVDEE+AVARGRSGGTAFWCRCRRVN
Subjt:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

XP_022135523.1 uncharacterized protein LOC111007458 [Momordica charantia]1.4e-13699.21Show/hide
Query:  MAASTFSWFASSSSPKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTRRVAAEE
        MAASTFSWFASSSSPKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIM+EEVE SVKLLKSAAKTRRVAAEE
Subjt:  MAASTFSWFASSSSPKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTRRVAAEE

Query:  ILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVG
        ILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVG
Subjt:  ILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVG

Query:  PLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVNN
        PLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVNN
Subjt:  PLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVNN

XP_022929153.1 uncharacterized protein LOC111435818 [Cucurbita moschata]3.4e-11181.47Show/hide
Query:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR
        + +S FSWFASSSS      PKIF KTPSNA   YPIS KSSN+PS  R  R KT A L  KDPNGAAPL V EE+SSS I++EEVE SVK+LK AAKTR
Subjt:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR

Query:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ
        RVAAEE+LSALS++EKAKLDPS+FF+TLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGV+LGP+GSLTFEGR+SWKNRILAFIFE+
Subjt:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ

Query:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        IRIK GPL PLEI+LGKK+EREPSSKDPFFIWFYVDEE+AVARGRSGGTAFWCRCRRVN
Subjt:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

XP_023005200.1 uncharacterized protein LOC111498299 [Cucurbita maxima]1.3e-11081.08Show/hide
Query:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR
        + +S FSWFASSSS      PKIF KTPSNA   YPIS KSSN+PS  R  R K  A L  KDPNGAAPL V EE+SSS I++EEVE SVK+LK AAKTR
Subjt:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR

Query:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ
        RVAAEE+LSALS++EKAKLDPS+FF+TLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGV+LGP+GSLTFEGR+SWKNRILAFIFE+
Subjt:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ

Query:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        IRIK GPL PLEI+LGKK+EREPSSKDPFFIWFYVDEE+AVARGRSGGTAFWCRCRRVN
Subjt:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

XP_023529441.1 uncharacterized protein LOC111792300 [Cucurbita pepo subsp. pepo]2.4e-10980.31Show/hide
Query:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR
        + +S FSW ASSSS      PKIF KTPSNA   YPIS KSSN+PS  R  R K  A L  KDPNGAAPL V EE+SSS I++EEVE SVK+LK AAKTR
Subjt:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR

Query:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ
        RVAAEE+L+ALS++EKAKLDPS+FF+TLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGV+LGP+GSLTFEGR+SWKNRILAFIFE+
Subjt:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ

Query:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        IRIK GPL PLEI+LGKK+EREPSSKDPFFIWFYVDEE+AVARGRSGGTAFWCRCRRVN
Subjt:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

TrEMBL top hitse value%identityAlignment
A0A1S3BXG3 uncharacterized protein LOC1034941593.0e-10576.6Show/hide
Query:  MAASTFS-----WFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENS-SSLIMNEEVETSVKLLK
        +AAS+FS      FASSSS      PK+F K P NA     ISFKSSN+PS+ R   +KT A LDGKDPNGA P+LV+EE+S SS I+NEEVE SVK+LK
Subjt:  MAASTFS-----WFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENS-SSLIMNEEVETSVKLLK

Query:  SAAKTRRVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRIL
        +AAKTR+V AEE+LSALS++EKAKLDPS FF+TLGGTSSPGRTWMLIFTAEKKL+KGRYFP+TAIQRFDAAGKRIENGV+LGP+GSLTFEGRLSWK RIL
Subjt:  SAAKTRRVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRIL

Query:  AFIFEQIRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        AFIFE++RIK+GPL+PLEI+LG+KEEREPS+KDP FIWFYVDEEIAVARGRSGGTAFWCRCRRVN
Subjt:  AFIFEQIRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

A0A5A7USJ0 Uncharacterized protein3.0e-10576.6Show/hide
Query:  MAASTFS-----WFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENS-SSLIMNEEVETSVKLLK
        +AAS+FS      FASSSS      PK+F K P NA     ISFKSSN+PS+ R   +KT A LDGKDPNGA P+LV+EE+S SS I+NEEVE SVK+LK
Subjt:  MAASTFS-----WFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENS-SSLIMNEEVETSVKLLK

Query:  SAAKTRRVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRIL
        +AAKTR+V AEE+LSALS++EKAKLDPS FF+TLGGTSSPGRTWMLIFTAEKKL+KGRYFP+TAIQRFDAAGKRIENGV+LGP+GSLTFEGRLSWK RIL
Subjt:  SAAKTRRVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRIL

Query:  AFIFEQIRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        AFIFE++RIK+GPL+PLEI+LG+KEEREPS+KDP FIWFYVDEEIAVARGRSGGTAFWCRCRRVN
Subjt:  AFIFEQIRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

A0A6J1C517 uncharacterized protein LOC1110074586.6e-13799.21Show/hide
Query:  MAASTFSWFASSSSPKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTRRVAAEE
        MAASTFSWFASSSSPKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIM+EEVE SVKLLKSAAKTRRVAAEE
Subjt:  MAASTFSWFASSSSPKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTRRVAAEE

Query:  ILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVG
        ILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVG
Subjt:  ILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVG

Query:  PLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVNN
        PLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVNN
Subjt:  PLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVNN

A0A6J1ERA0 uncharacterized protein LOC1114358181.6e-11181.47Show/hide
Query:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR
        + +S FSWFASSSS      PKIF KTPSNA   YPIS KSSN+PS  R  R KT A L  KDPNGAAPL V EE+SSS I++EEVE SVK+LK AAKTR
Subjt:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR

Query:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ
        RVAAEE+LSALS++EKAKLDPS+FF+TLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGV+LGP+GSLTFEGR+SWKNRILAFIFE+
Subjt:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ

Query:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        IRIK GPL PLEI+LGKK+EREPSSKDPFFIWFYVDEE+AVARGRSGGTAFWCRCRRVN
Subjt:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

A0A6J1KWT0 uncharacterized protein LOC1114982996.2e-11181.08Show/hide
Query:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR
        + +S FSWFASSSS      PKIF KTPSNA   YPIS KSSN+PS  R  R K  A L  KDPNGAAPL V EE+SSS I++EEVE SVK+LK AAKTR
Subjt:  MAASTFSWFASSSS------PKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTR

Query:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ
        RVAAEE+LSALS++EKAKLDPS+FF+TLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGV+LGP+GSLTFEGR+SWKNRILAFIFE+
Subjt:  RVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQ

Query:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN
        IRIK GPL PLEI+LGKK+EREPSSKDPFFIWFYVDEE+AVARGRSGGTAFWCRCRRVN
Subjt:  IRIKVGPLSPLEINLGKKEEREPSSKDPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVN

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G18060.1 unknown protein7.8e-8268.75Show/hide
Query:  ISFKSSNQPSLSRLLRVKTL-AALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTRRVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPG
        +S  SS+    SR  R+  + A +DG+  N   P   ++      I N++V  SV +LK+AAKTR+VAA+EIL+A S IEKAK+DPS F +TLGG  SPG
Subjt:  ISFKSSNQPSLSRLLRVKTL-AALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTRRVAAEEILSALSIIEKAKLDPSRFFDTLGGTSSPG

Query:  RTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVGPLSPLEINLGKKEE-REPSSKDPFFIWFY
        RTWMLIFTAEKKL KGRYFPLTA+QRFDAAGKRIENGVYLGP G+LTFEGR SWKNRILAF+FEQIRIK+GPL PLE +LGKK+   EPS+KDPFFIWFY
Subjt:  RTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVGPLSPLEINLGKKEE-REPSSKDPFFIWFY

Query:  VDEEIAVARGRSGGTAFWCRCRRV
        +DEEIAVARGRSGGTAFWCRCRR+
Subjt:  VDEEIAVARGRSGGTAFWCRCRRV


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGGCTTCCACCTTCAGCTGGTTCGCTTCGAGTTCATCACCAAAAATCTTCCCTAAAACCCCTTCTAATGCCAACCCGTCATACCCCATTTCATTCAAATCCTCGAA
TCAGCCTTCACTTTCAAGATTGCTGAGAGTGAAAACATTGGCAGCTTTGGATGGAAAAGACCCAAATGGAGCAGCCCCTCTTCTGGTAGAGGAAGAGAATTCCAGCAGTC
TTATTATGAATGAGGAAGTGGAAACGAGTGTCAAATTGCTAAAAAGTGCGGCAAAGACAAGACGGGTAGCAGCAGAAGAAATTCTGTCAGCCCTTTCCATAATTGAGAAG
GCAAAACTTGATCCTTCAAGGTTTTTTGACACACTTGGTGGAACAAGCTCTCCCGGGAGAACCTGGATGCTTATTTTCACAGCTGAGAAAAAATTGGAAAAGGGGCGGTA
CTTTCCTCTCACAGCCATCCAGAGGTTTGATGCCGCTGGAAAAAGAATAGAGAATGGAGTGTATCTGGGGCCTGTTGGAAGCTTAACATTTGAAGGTAGACTTTCATGGA
AGAATAGAATACTGGCGTTCATTTTCGAGCAAATTCGGATAAAAGTTGGACCTTTAAGCCCTTTAGAGATAAATCTTGGTAAAAAGGAAGAAAGGGAGCCAAGCAGCAAG
GATCCTTTCTTTATCTGGTTTTATGTTGATGAGGAAATAGCTGTTGCTCGTGGTAGAAGTGGGGGAACTGCATTCTGGTGCCGGTGTCGCCGTGTCAATAATTAG
mRNA sequenceShow/hide mRNA sequence
ATGGCGGCTTCCACCTTCAGCTGGTTCGCTTCGAGTTCATCACCAAAAATCTTCCCTAAAACCCCTTCTAATGCCAACCCGTCATACCCCATTTCATTCAAATCCTCGAA
TCAGCCTTCACTTTCAAGATTGCTGAGAGTGAAAACATTGGCAGCTTTGGATGGAAAAGACCCAAATGGAGCAGCCCCTCTTCTGGTAGAGGAAGAGAATTCCAGCAGTC
TTATTATGAATGAGGAAGTGGAAACGAGTGTCAAATTGCTAAAAAGTGCGGCAAAGACAAGACGGGTAGCAGCAGAAGAAATTCTGTCAGCCCTTTCCATAATTGAGAAG
GCAAAACTTGATCCTTCAAGGTTTTTTGACACACTTGGTGGAACAAGCTCTCCCGGGAGAACCTGGATGCTTATTTTCACAGCTGAGAAAAAATTGGAAAAGGGGCGGTA
CTTTCCTCTCACAGCCATCCAGAGGTTTGATGCCGCTGGAAAAAGAATAGAGAATGGAGTGTATCTGGGGCCTGTTGGAAGCTTAACATTTGAAGGTAGACTTTCATGGA
AGAATAGAATACTGGCGTTCATTTTCGAGCAAATTCGGATAAAAGTTGGACCTTTAAGCCCTTTAGAGATAAATCTTGGTAAAAAGGAAGAAAGGGAGCCAAGCAGCAAG
GATCCTTTCTTTATCTGGTTTTATGTTGATGAGGAAATAGCTGTTGCTCGTGGTAGAAGTGGGGGAACTGCATTCTGGTGCCGGTGTCGCCGTGTCAATAATTAG
Protein sequenceShow/hide protein sequence
MAASTFSWFASSSSPKIFPKTPSNANPSYPISFKSSNQPSLSRLLRVKTLAALDGKDPNGAAPLLVEEENSSSLIMNEEVETSVKLLKSAAKTRRVAAEEILSALSIIEK
AKLDPSRFFDTLGGTSSPGRTWMLIFTAEKKLEKGRYFPLTAIQRFDAAGKRIENGVYLGPVGSLTFEGRLSWKNRILAFIFEQIRIKVGPLSPLEINLGKKEEREPSSK
DPFFIWFYVDEEIAVARGRSGGTAFWCRCRRVNN