; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

HG10004161 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome

Gene IDHG10004161
OrganismLagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
DescriptionProtein of unknown function (DUF1997)
Genome locationChr08:14319624..14322468
RNA-Seq ExpressionHG10004161
SyntenyHG10004161
Gene Ontology termsNA
InterPro domainsIPR018971 - Protein of unknown function DUF1997


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6578788.1 hypothetical protein SDJN03_23236, partial [Cucurbita argyrosperma subsp. sororia]9.9e-12193.31Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQL+RPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

XP_022939661.1 uncharacterized protein LOC111445487 isoform X1 [Cucurbita moschata]4.5e-12193.72Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

XP_022939662.1 uncharacterized protein LOC111445487 isoform X2 [Cucurbita moschata]8.1e-12393.8Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

XP_022992978.1 uncharacterized protein LOC111489142 isoform X2 [Cucurbita maxima]4.0e-12292.98Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PR SFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

XP_038883978.1 uncharacterized protein SYNPCC7002_A1590 isoform X1 [Benincasa hispida]3.0e-12597.11Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SPSSISL CKNPRT FSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDD TF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRG SPLQKLTS+TVIEVNIEIPFAFRAIPIQAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

TrEMBL top hitse value%identityAlignment
A0A5D3BDM7 Uncharacterized protein5.3e-12091.74Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MA S  SPSSISLH KN +T FS TH+PFLILASSA+DS RPSL ISTNSNPKARF+ARRSESVTVRQL RPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVL+VRVE+QPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRF AQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

A0A6J1FGJ8 uncharacterized protein LOC111445487 isoform X12.2e-12193.72Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

A0A6J1FHF9 uncharacterized protein LOC111445487 isoform X23.9e-12393.8Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

A0A6J1JRG4 uncharacterized protein LOC111489142 isoform X11.1e-12092.89Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PR SFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGT

A0A6J1K0U6 uncharacterized protein LOC111489142 isoform X22.0e-12292.98Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PR SFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESA
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESA

Query:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
        GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
Subjt:  GTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT4G31115.1 Protein of unknown function (DUF1997)4.7e-2028.14Show/hide
Query:  KNPRTSFSLTHRPFLILASSADDSPRPSLRIST----------NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC-
        + P+TS S       +L S  +  PR  + +            +S  KA   A R + + +    +     +E++  P+   +V++A+ ++    VDD  
Subjt:  KNPRTSFSLTHRPFLILASSADDSPRPSLRIST----------NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC-

Query:  -TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQA
         T+RC + + +  +FEV PVL++RV      C ++LLSCKLEGS ++  Q+++F A M N +++++   + P   L  D  + V +EI    F  +P+ A
Subjt:  -TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQA

Query:  IESAGTQVLEQILKLMLPRFTAQLVKDYQAW
        +E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  IESAGTQVLEQILKLMLPRFTAQLVKDYQAW

AT4G31115.2 Protein of unknown function (DUF1997)6.2e-2030.32Show/hide
Query:  NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG
        +S  KA   A R + + +    +     +E++  P+   +V++A+ ++    VDD   T+RC + + +  +FEV PVL++RV      C ++LLSCKLEG
Subjt:  NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG

Query:  SPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW
        S ++  Q+++F A M N +++++   + P   L  D  + V +EI    F  +P+ A+E+ G  V++ ++  ++P    QL+KDY  W
Subjt:  SPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAW

AT5G04440.1 Protein of unknown function (DUF1997)1.3e-8968.92Show/hide
Query:  ALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPS----------LRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAER
        +LSF S    + + +NP  SF++T       +SS D+SP+PS          +R+S++S PKARFIAR+ +SV+VRQL RPL EYMSLPASQYSVLDAER
Subjt:  ALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPS----------LRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAER

Query:  IERVDDCTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRA
        IERVDD TFRCYVY FKFF FEVCPVL+VRVE QPNGCCIKLLSCKLEGSP+VVAQNDKFDA MVN++S D  +  S  Q++TSD VIEVNIEIPFAFR 
Subjt:  IERVDDCTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRA

Query:  IPIQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI
         P+ AIE+ GTQVL+QILKLMLPRF +QL KDY AWASGDTSRQPLGTGEI
Subjt:  IPIQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGTTGAGTTTTCGCTCTCCGTCTTCCATTTCCCTTCACTGCAAAAACCCTAGAACTTCTTTTTCTCTCACTCACAGACCATTCCTTATACTTGCTTCCTCT
GCAGACGATTCTCCCAGGCCTTCGCTTCGAATCTCCACGAATTCCAATCCAAAAGCGCGCTTCATCGCCCGGAGAAGCGAGTCCGTCACGGTTCGGCAGCTGGCG
CGGCCTCTAAATGAGTATATGAGTTTGCCGGCTAGTCAATACTCGGTGTTGGATGCGGAGAGGATTGAGCGAGTTGATGATTGCACTTTTAGGTGCTATGTTTAT
AGATTTAAATTCTTTGCTTTTGAGGTTTGCCCTGTTTTGATTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTGTCGTGTAAGCTTGAAGGC
TCCCCAATTGTGGTTGCACAGAATGATAAGTTTGACGCTTATATGGTGAACCAGATATCTTATGATGTGAATCGAGGCAAATCGCCCTTGCAGAAGCTCACATCG
GATACCGTCATTGAGGTTAACATTGAGATTCCTTTCGCCTTCCGTGCAATTCCTATACAAGCAATTGAATCAGCTGGGACCCAAGTTCTTGAACAAATATTGAAG
CTTATGCTTCCCCGCTTCACAGCCCAGCTTGTGAAGGACTACCAAGCATGGGCCTCTGGTGATACATCAAGGCAACCTCTTGGAACAGGTGAAATCTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCGTTGAGTTTTCGCTCTCCGTCTTCCATTTCCCTTCACTGCAAAAACCCTAGAACTTCTTTTTCTCTCACTCACAGACCATTCCTTATACTTGCTTCCTCT
GCAGACGATTCTCCCAGGCCTTCGCTTCGAATCTCCACGAATTCCAATCCAAAAGCGCGCTTCATCGCCCGGAGAAGCGAGTCCGTCACGGTTCGGCAGCTGGCG
CGGCCTCTAAATGAGTATATGAGTTTGCCGGCTAGTCAATACTCGGTGTTGGATGCGGAGAGGATTGAGCGAGTTGATGATTGCACTTTTAGGTGCTATGTTTAT
AGATTTAAATTCTTTGCTTTTGAGGTTTGCCCTGTTTTGATTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTGTCGTGTAAGCTTGAAGGC
TCCCCAATTGTGGTTGCACAGAATGATAAGTTTGACGCTTATATGGTGAACCAGATATCTTATGATGTGAATCGAGGCAAATCGCCCTTGCAGAAGCTCACATCG
GATACCGTCATTGAGGTTAACATTGAGATTCCTTTCGCCTTCCGTGCAATTCCTATACAAGCAATTGAATCAGCTGGGACCCAAGTTCTTGAACAAATATTGAAG
CTTATGCTTCCCCGCTTCACAGCCCAGCTTGTGAAGGACTACCAAGCATGGGCCTCTGGTGATACATCAAGGCAACCTCTTGGAACAGGTGAAATCTGA
Protein sequenceShow/hide protein sequence
MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYVY
RFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILK
LMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI