; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Carg02436 (gene) of Silver-seed gourd (SMH-JMG-627) v2 genome

Gene IDCarg02436
OrganismCucurbita argyrosperma subsp. argyrosperma cv. SMH-JMG-627 (Silver-seed gourd (SMH-JMG-627) v2)
DescriptionProtein of unknown function (DUF1997)
Genome locationCarg_Chr15:2385286..2388331
RNA-Seq ExpressionCarg02436
SyntenyCarg02436
Gene Ontology termsNA
InterPro domainsIPR018971 - Protein of unknown function DUF1997


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6578788.1 hypothetical protein SDJN03_23236, partial [Cucurbita argyrosperma subsp. sororia]3.9e-11493.72Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

KAG7016319.1 hypothetical protein SDJN02_21426 [Cucurbita argyrosperma subsp. argyrosperma]2.9e-125100Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTALTLIWCRNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLE
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTALTLIWCRNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLE
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTALTLIWCRNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLE

Query:  QILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        QILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  QILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

XP_022939661.1 uncharacterized protein LOC111445487 isoform X1 [Cucurbita moschata]8.8e-11493.31Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQL+RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

XP_022939662.1 uncharacterized protein LOC111445487 isoform X2 [Cucurbita moschata]1.6e-11593.39Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQL+RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

XP_022992978.1 uncharacterized protein LOC111489142 isoform X2 [Cucurbita maxima]8.0e-11592.56Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPR SFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSES+TVRQL+RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

TrEMBL top hitse value%identityAlignment
A0A5D3BDM7 Uncharacterized protein2.3e-10484.71Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MA SSCSP+SISLH ++ +T FS T +PF+ILASSA+DS RPSL IS NSNPKARFVARRSESVTVRQL RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVL+VRVE+QPNGCCIKLLS  L    ++  +N    A MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRF AQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

A0A6J1FGJ8 uncharacterized protein LOC111445487 isoform X14.3e-11493.31Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQL+RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

A0A6J1FHF9 uncharacterized protein LOC111445487 isoform X27.8e-11693.39Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQL+RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

A0A6J1JRG4 uncharacterized protein LOC111489142 isoform X12.1e-11392.47Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPR SFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSES+TVRQL+RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

A0A6J1K0U6 uncharacterized protein LOC111489142 isoform X23.9e-11592.56Show/hide
Query:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF
        MALSSCSPTSISLHSRSPR SFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSES+TVRQL+RPLNEYMSLPASQYSVLDAERIERIDDCTF
Subjt:  MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLS  L    ++  +N    ANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT4G31115.1 Protein of unknown function (DUF1997)2.3e-1125.97Show/hide
Query:  RSPRTSFSITRRPFVILASSADDSPRPSLRIS----------ANSNPKARFVARRSESVTVR---QLSRPLNEYMSLPASQYSVLDAERIER---IDDC-
        R+P+TS S       +L S  +  PR  + +            +S  KA   A R + + +    +     +E++  P+   +V++A+ ++    +DD  
Subjt:  RSPRTSFSITRRPFVILASSADDSPRPSLRIS----------ANSNPKARFVARRSESVTVR---QLSRPLNEYMSLPASQYSVLDAERIER---IDDC-

Query:  -TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTALTLIWC------RNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPF-AFRAIPVQA
         T+RC + + +  +FEV PVL++RV      C ++LLS  L           R +A M N +++++     P   L  D  + V +EI    F  +PV A
Subjt:  -TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTALTLIWC------RNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPF-AFRAIPVQA

Query:  IESAGTQVLEQILKLMLPRFTAQLVKDYQAW
        +E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  IESAGTQVLEQILKLMLPRFTAQLVKDYQAW

AT4G31115.2 Protein of unknown function (DUF1997)3.9e-1127.13Show/hide
Query:  NSNPKARFVARRSESVTVR---QLSRPLNEYMSLPASQYSVLDAERIER---IDDC--TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTALTL
        +S  KA   A R + + +    +     +E++  P+   +V++A+ ++    +DD   T+RC + + +  +FEV PVL++RV      C ++LLS  L  
Subjt:  NSNPKARFVARRSESVTVR---QLSRPLNEYMSLPASQYSVLDAERIER---IDDC--TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTALTL

Query:  IWC------RNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW
                 R +A M N +++++     P   L  D  + V +EI    F  +PV A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  IWC------RNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPF-AFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW

AT5G04440.1 Protein of unknown function (DUF1997)3.5e-7662.45Show/hide
Query:  MALSSCS--PTSISL-------HSRSPRTSFSITRRPFVILASSADDSPRPS----------LRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPA
        MALSS +   TS+S        + R+P  SF+IT       +SS D+SP+PS          +R+S++S PKARF+AR+ +SV+VRQL RPL EYMSLPA
Subjt:  MALSSCS--PTSISL-------HSRSPRTSFSITRRPFVILASSADDSPRPS----------LRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPA

Query:  SQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEV
        SQYSVLDAERIER+DD TFRCYVY FKFF FEVCPVL+VRVE QPNGCCIKLLS  L    ++  +N    A+MVN++S D  +  S  Q++TSD VIEV
Subjt:  SQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSTAL---TLIWCRN---AANMVNQISYDVNRGSSPLQKLTSDTVIEV

Query:  NIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        NIEIPFAFR  PV AIE+ GTQVL+QILKLMLPRF +QL KDY AWASGDTSRQPLGTGEI
Subjt:  NIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGTTGAGTTCTTGCTCGCCGACTTCCATTTCACTCCACTCTAGAAGCCCTAGAACTTCTTTTTCCATCACTCGTAGACCATTCGTTATACTTGCCTCCTCTGCGGA
TGATTCTCCCAGGCCTTCGCTTCGAATCTCCGCGAATTCCAATCCGAAAGCGCGCTTCGTTGCCCGGAGGAGCGAGTCCGTCACTGTTCGGCAGCTGTCTAGGCCTCTAA
ATGAGTATATGAGTTTGCCGGCTAGTCAGTACTCGGTGTTGGATGCGGAGAGGATTGAGCGGATTGATGATTGCACCTTTAGGTGCTATGTTTATAGATTTAAGTTCTTT
GCTTTTGAGGTTTGCCCTGTTTTGATTGTTCGGGTTGAAGTGCAGCCTAATGGCTGTTGCATCAAGCTTCTGTCGACTGCTTTGACATTGATTTGGTGTCGGAATGCAGC
TAATATGGTGAACCAGATATCTTATGATGTCAATCGAGGCAGCTCACCCTTGCAGAAACTCACATCGGACACTGTCATTGAGGTTAACATCGAGATTCCTTTCGCCTTTC
GTGCAATTCCTGTACAAGCAATTGAATCAGCTGGGACCCAAGTCCTGGAACAAATACTGAAGCTTATGCTTCCCCGCTTCACAGCCCAGCTTGTGAAGGACTATCAAGCA
TGGGCCTCAGGTGATACATCAAGGCAACCTCTTGGAACAGGTGAGATCTGA
mRNA sequenceShow/hide mRNA sequence
CATCGATATCCATTCCACTTCCTCTCTGCAAATTTCTCGAACGCTTCAATGGCGTTGAGTTCTTGCTCGCCGACTTCCATTTCACTCCACTCTAGAAGCCCTAGAACTTC
TTTTTCCATCACTCGTAGACCATTCGTTATACTTGCCTCCTCTGCGGATGATTCTCCCAGGCCTTCGCTTCGAATCTCCGCGAATTCCAATCCGAAAGCGCGCTTCGTTG
CCCGGAGGAGCGAGTCCGTCACTGTTCGGCAGCTGTCTAGGCCTCTAAATGAGTATATGAGTTTGCCGGCTAGTCAGTACTCGGTGTTGGATGCGGAGAGGATTGAGCGG
ATTGATGATTGCACCTTTAGGTGCTATGTTTATAGATTTAAGTTCTTTGCTTTTGAGGTTTGCCCTGTTTTGATTGTTCGGGTTGAAGTGCAGCCTAATGGCTGTTGCAT
CAAGCTTCTGTCGACTGCTTTGACATTGATTTGGTGTCGGAATGCAGCTAATATGGTGAACCAGATATCTTATGATGTCAATCGAGGCAGCTCACCCTTGCAGAAACTCA
CATCGGACACTGTCATTGAGGTTAACATCGAGATTCCTTTCGCCTTTCGTGCAATTCCTGTACAAGCAATTGAATCAGCTGGGACCCAAGTCCTGGAACAAATACTGAAG
CTTATGCTTCCCCGCTTCACAGCCCAGCTTGTGAAGGACTATCAAGCATGGGCCTCAGGTGATACATCAAGGCAACCTCTTGGAACAGGTGAGATCTGAGATTCATATTC
AAAATTTATGCCCCGATTTTCGGCTAGCGAAGTTCTATTTCCCTCGACATTCACATAGGACTCTTGAATCCGCAAGAGTTTGTGTACTAGGAGTCTAGGAACACTATTTT
AGGCTGTTTATGCTCTTGTTTGCCAAGCCAAGACACATTCTTCAGGATATGGCTTTAGTAAAATTTTGATTCTTAGCAAGTTGAATGAGTACATGTAAATTATTTCTTCA
TGGTATTTAGTGAAAATATAATATAGTTCATGTATGTTATTGGAGCTATATTTTGAAGTCATTAAGAATAATTTGGATTTATTGCTCTGATGATAATGTTAATTATTTGT
ATGCCATTTTATCTGATATAGATTCTGAATAAATTTAAGCTTTATTAAAATATAAATGAAAAAGTAATCTAATTTAAATTCCATATTCTTGTTGTATATATAAACTACAT
GGGACAAACCCATTTTTCTGGATCCTTTTAAAATTATTACAAATATTCAATTAAAGAAAAGGAAAAATAAATAATATTAAATAAAAGTAACAT
Protein sequenceShow/hide protein sequence
MALSSCSPTSISLHSRSPRTSFSITRRPFVILASSADDSPRPSLRISANSNPKARFVARRSESVTVRQLSRPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFF
AFEVCPVLIVRVEVQPNGCCIKLLSTALTLIWCRNAANMVNQISYDVNRGSSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQA
WASGDTSRQPLGTGEI