; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MC04g1453 (gene) of Bitter gourd (Dali-11) v1 genome

Gene IDMC04g1453
OrganismMomordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
DescriptionProtein of unknown function (DUF1997)
Genome locationMC04:22453638..22457023
RNA-Seq ExpressionMC04g1453
SyntenyMC04g1453
Gene Ontology termsNA
InterPro domainsIPR018971 - Protein of unknown function DUF1997


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_008456550.1 PREDICTED: uncharacterized protein SYNPCC7002_A1590 isoform X1 [Cucumis melo]1.25e-14487.19Show/hide
Query:  MALSSCSPGSIPLPYKN---PRKFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MA SSCSP SI L YKN   P  F H+P+ +LASSA+DS+RP L  S NSNPKARF+ARRSES TVRQL RPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSSCSPGSIPLPYKN---PRKFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVL+VRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRF  QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

XP_022133875.1 uncharacterized protein LOC111006320 [Momordica charantia]1.48e-167100Show/hide
Query:  MALSSCSPGSIPLPYKNPRKFAHRPYVLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYV
        MALSSCSPGSIPLPYKNPRKFAHRPYVLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYV
Subjt:  MALSSCSPGSIPLPYKNPRKFAHRPYVLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYV

Query:  YRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQV
        YRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQV
Subjt:  YRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQV

Query:  LEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        LEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
Subjt:  LEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

XP_022939662.1 uncharacterized protein LOC111445487 isoform X2 [Cucurbita moschata]5.10e-14488.43Show/hide
Query:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALSSCSP SI L  ++PR       RP+V LASSADDS RP LR SANSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

XP_022992978.1 uncharacterized protein LOC111489142 isoform X2 [Cucurbita maxima]7.25e-14488.43Show/hide
Query:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALSSCSP SI L  ++PR       RP+V LASSADDS RP LR SANSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

XP_038883978.1 uncharacterized protein SYNPCC7002_A1590 isoform X1 [Benincasa hispida]7.57e-14689.26Show/hide
Query:  MALSSCSPGSIPLPYKNPR---KFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALSSCSP SI L  KNPR      HRP+ +LASSADDS RP LR S NSNPKARFIARRSES TVRQLARPLNEYMSLPASQYSVLDAERIERVDD TF
Subjt:  MALSSCSPGSIPLPYKNPR---KFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDAYMVNQISYDVNRGNSPLQKLTS+TVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

TrEMBL top hitse value%identityAlignment
A0A1S3C468 uncharacterized protein SYNPCC7002_A1590 isoform X16.07e-14587.19Show/hide
Query:  MALSSCSPGSIPLPYKN---PRKFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MA SSCSP SI L YKN   P  F H+P+ +LASSA+DS+RP L  S NSNPKARF+ARRSES TVRQL RPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSSCSPGSIPLPYKN---PRKFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVL+VRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRF  QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

A0A5D3BDM7 Uncharacterized protein6.07e-14587.19Show/hide
Query:  MALSSCSPGSIPLPYKN---PRKFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MA SSCSP SI L YKN   P  F H+P+ +LASSA+DS+RP L  S NSNPKARF+ARRSES TVRQL RPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSSCSPGSIPLPYKN---PRKFAHRPY-VLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVL+VRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRF  QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

A0A6J1BWG8 uncharacterized protein LOC1110063207.19e-168100Show/hide
Query:  MALSSCSPGSIPLPYKNPRKFAHRPYVLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYV
        MALSSCSPGSIPLPYKNPRKFAHRPYVLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYV
Subjt:  MALSSCSPGSIPLPYKNPRKFAHRPYVLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYV

Query:  YRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQV
        YRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQV
Subjt:  YRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQV

Query:  LEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        LEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
Subjt:  LEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

A0A6J1FHF9 uncharacterized protein LOC111445487 isoform X22.47e-14488.43Show/hide
Query:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALSSCSP SI L  ++PR       RP+V LASSADDS RP LR SANSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

A0A6J1K0U6 uncharacterized protein LOC111489142 isoform X23.51e-14488.43Show/hide
Query:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALSSCSP SI L  ++PR       RP+V LASSADDS RP LR SANSNPKARF+ARRSES TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSSCSPGSIPLPYKNPR---KFAHRPYV-LASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVE QPNGCCIKLLSCKLEGSPIV AQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI
        GTQVLEQILK+MLPRFT QLVKDYQAWASGDTSRQPLGTG+I
Subjt:  GTQVLEQILKIMLPRFTTQLVKDYQAWASGDTSRQPLGTGKI

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT4G31115.1 Protein of unknown function (DUF1997)1.6e-2033.12Show/hide
Query:  NEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNS
        +E++  P+   +V++A+ ++    VDD   T+RC + + +  +FEV PVL++RV      C ++LLSCKLEGS ++  Q+++F A M N +++++     
Subjt:  NEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNS

Query:  PLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW
        P   L  D  + V +EI    F  +PV A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  PLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW

AT4G31115.2 Protein of unknown function (DUF1997)1.6e-2033.12Show/hide
Query:  NEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNS
        +E++  P+   +V++A+ ++    VDD   T+RC + + +  +FEV PVL++RV      C ++LLSCKLEGS ++  Q+++F A M N +++++     
Subjt:  NEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNS

Query:  PLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW
        P   L  D  + V +EI    F  +PV A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  PLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAW

AT5G04440.1 Protein of unknown function (DUF1997)2.2e-8675.71Show/hide
Query:  ASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIK
        +S A  SS   +R S++S PKARFIAR+ +S +VRQL RPL EYMSLPASQYSVLDAERIERVDD TFRCYVY FKFF FEVCPVL+VRVEEQPNGCCIK
Subjt:  ASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYVYRFKFFAFEVCPVLIVRVEEQPNGCCIK

Query:  LLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAWASGDT
        LLSCKLEGSP+V AQNDKFDA MVN++S D  +  S  Q++TSD VIEVNIEIPFAFR  PV AIE+ GTQVL+QILK+MLPRF +QL KDY AWASGDT
Subjt:  LLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDYQAWASGDT

Query:  SRQPLGTGKI
        SRQPLGTG+I
Subjt:  SRQPLGTGKI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGTTGAGTTCCTGCTCGCCAGGTTCCATTCCACTCCCCTACAAAAACCCTAGAAAGTTTGCGCACAGACCATATGTTCTCGCTTCTTCTGCGGACGATTCTTCCAG
GCCGTTGCTTCGCACCTCCGCCAATTCGAATCCAAAAGCGCGCTTCATTGCCCGGAGAAGCGAATCCGCCACCGTTCGGCAGCTGGCGCGGCCTCTAAATGAGTATATGA
GCTTGCCGGCTAGTCAGTACTCGGTGTTGGATGCAGAGAGGATCGAGCGGGTTGACGATTGCACCTTTAGGTGCTACGTTTATAGATTTAAGTTCTTTGCGTTTGAGGTT
TGCCCTGTTTTGATTGTTCGAGTTGAAGAGCAGCCCAATGGGTGTTGCATCAAGCTGCTGTCATGCAAGCTTGAGGGCTCACCGATTGTGGCTGCACAGAATGACAAATT
TGACGCTTATATGGTGAACCAGATTTCTTATGATGTCAATCGAGGCAACTCACCCTTGCAGAAACTCACGTCAGATACTGTCATTGAGGTTAACATCGAGATTCCTTTCG
CCTTCCGTGCAATTCCCGTACAAGCAATCGAATCAGCTGGGACCCAAGTCCTCGAACAAATATTGAAGATCATGCTTCCTCGCTTCACAACCCAGCTCGTGAAGGATTAT
CAAGCATGGGCCTCTGGTGATACATCAAGGCAACCTCTTGGAACAGGTAAGATCTGA
mRNA sequenceShow/hide mRNA sequence
GCAACACTTCGAAAATCGCTGCGCCAGTGGCAGTGGGCAGTGGCCATTGTCTTATCCGTCTCTCCCGCAGGTCTCTGGTTGCTATCCATTAGAAATTACTCTCAGGAAAA
ACGTCGAACACTTTAATGGCGTTGAGTTCCTGCTCGCCAGGTTCCATTCCACTCCCCTACAAAAACCCTAGAAAGTTTGCGCACAGACCATATGTTCTCGCTTCTTCTGC
GGACGATTCTTCCAGGCCGTTGCTTCGCACCTCCGCCAATTCGAATCCAAAAGCGCGCTTCATTGCCCGGAGAAGCGAATCCGCCACCGTTCGGCAGCTGGCGCGGCCTC
TAAATGAGTATATGAGCTTGCCGGCTAGTCAGTACTCGGTGTTGGATGCAGAGAGGATCGAGCGGGTTGACGATTGCACCTTTAGGTGCTACGTTTATAGATTTAAGTTC
TTTGCGTTTGAGGTTTGCCCTGTTTTGATTGTTCGAGTTGAAGAGCAGCCCAATGGGTGTTGCATCAAGCTGCTGTCATGCAAGCTTGAGGGCTCACCGATTGTGGCTGC
ACAGAATGACAAATTTGACGCTTATATGGTGAACCAGATTTCTTATGATGTCAATCGAGGCAACTCACCCTTGCAGAAACTCACGTCAGATACTGTCATTGAGGTTAACA
TCGAGATTCCTTTCGCCTTCCGTGCAATTCCCGTACAAGCAATCGAATCAGCTGGGACCCAAGTCCTCGAACAAATATTGAAGATCATGCTTCCTCGCTTCACAACCCAG
CTCGTGAAGGATTATCAAGCATGGGCCTCTGGTGATACATCAAGGCAACCTCTTGGAACAGGTAAGATCTGAAACGTGAATCTAAGAACTTCACCCTGATGTTCGATTTT
CGATTTTCGATTTTCGAAGTCTTCTGTTTCCTTCGACGCTCGCGTAGGACTCGAGAGGCTGCAAGAATCTGTGTACTAGGATTCTAGGACCACTCTTTTAGGCTATTTAT
GCTCTTGTTTTCCCAGCCAAGACAGATTCTTCAATAGTAGTCAATTAATAAAATTTTTGTTTTTAGCAGGTTGAGTGAGTACATGTAAATTTCCTTGAGGTATTTTACCG
CAAGTATAGTTAATGTATGTTATTTGAAGTCTTGAACTACTACTTAAGAATAATTTGGATTTATTGCTTGAATGATATTATTGTTTATAAAAGATGGTGGTATATTATAT
TTGGTGTATGATTAATTTTATTTTCAATAAATTGAAATTGATTGGGATTTGTAATGTATTCCAACTATCTGTTAATTTCTACTTTCTCATTTAAATGTTATAAGATTTTT
TTAGTTCAACAACACGTGGGGTTGAGATTCAAATTGAACTTCTGG
Protein sequenceShow/hide protein sequence
MALSSCSPGSIPLPYKNPRKFAHRPYVLASSADDSSRPLLRTSANSNPKARFIARRSESATVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYVYRFKFFAFEV
CPVLIVRVEEQPNGCCIKLLSCKLEGSPIVAAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKIMLPRFTTQLVKDY
QAWASGDTSRQPLGTGKI