; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sed0022708 (gene) of Chayote v1 genome

Gene IDSed0022708
OrganismSechium edule (Chayote v1)
DescriptionProtein of unknown function, DUF584
Genome locationLG11:27890997..27892231
RNA-Seq ExpressionSed0022708
SyntenySed0022708
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsIPR007608 - Senescence regulator S40


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KGN64943.1 hypothetical protein Csa_022813 [Cucumis sativus]4.2e-9579.92Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL
        MDL LPSSRFRHR SPSS+RFL SFPSP   +S   S+ A D D++LNEDD+FWTGD ++DS HHSHS+P   SSSTP HH HHL  HKGFPLPETFGIL
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL

Query:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE
        AALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PLDRLPLP+S++LKYQSAPVNVP+MSKA   R  EV   DVDD+DE DGEMLPPHE
Subjt:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE

Query:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        +VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_008461249.1 PREDICTED: uncharacterized protein LOC103499884 [Cucumis melo]6.7e-9379.1Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL
        MDL L SSRFRHR SPSS+RFL SFPSP    S   S+ A D D++LNEDD+FWTGD ++DS HHSHS+P   SSSTP HH HHL  HKGFPLPETFGIL
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL

Query:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE
        AALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PLDRLPLP+S++LKYQSAPVNVP+MSKA   R  EV   DVD +DE DGEMLPPHE
Subjt:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE

Query:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        +VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022945942.1 uncharacterized protein LOC111450033 [Cucurbita moschata]1.8e-9379.03Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA----ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPET
        MDL  PSSRFRHRKSPSS+RFL SF SP+   S NP+SA     DD +++LNEDD+FWTGD +ADS HH+HS+P   SSSTP HH HHL  HKGFP  ET
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA----ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPET

Query:  FGILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEML
        FGILAALPENE SSSLRNSS+FYHKASVSSSSSSSPSSSRMIP+IPK PL+RLPLP+SS+LKYQSAPVNVPMMSKAA  RH E+   DVDD+DE DGEML
Subjt:  FGILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEML

Query:  PPHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PPHE+VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PPHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022967102.1 uncharacterized protein LOC111466606 [Cucurbita maxima]1.9e-9278.54Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA---ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETF
        M+L  PSSRFRHRKSP S+RFL SF SP+   S NP+SA    DD +++LNEDD+FWTGD +ADS HH+HS+P   SSSTP HH HHL  HKGFP  ETF
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA---ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETF

Query:  GILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEMLP
        GILAALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PL+RLPL +SS+LKYQSAPVNVPMMSKAA  RH E+   DVDD+DE DGEMLP
Subjt:  GILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEMLP

Query:  PHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PHE+VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_038894579.1 uncharacterized protein LOC120083099 [Benincasa hispida]2.7e-9480.41Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA-ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGI
        MDL LPS RFRHRKSPSS+RFL SF SP    +ANPSS    D D +LNEDD+FWTGD +ADS HHSHS+P   SSSTP HH HHL  HKGFPLPETFGI
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA-ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGI

Query:  LAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPH
        LAALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PL+RLPLP+SS+LKYQSAPVNVP+MSKA   R  E+   DVDD+DE DGEMLPPH
Subjt:  LAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPH

Query:  EMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        E+VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  EMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

TrEMBL top hitse value%identityAlignment
A0A0A0LT40 Uncharacterized protein2.0e-9579.92Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL
        MDL LPSSRFRHR SPSS+RFL SFPSP   +S   S+ A D D++LNEDD+FWTGD ++DS HHSHS+P   SSSTP HH HHL  HKGFPLPETFGIL
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL

Query:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE
        AALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PLDRLPLP+S++LKYQSAPVNVP+MSKA   R  EV   DVDD+DE DGEMLPPHE
Subjt:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE

Query:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        +VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A1S4E4F1 uncharacterized protein LOC1034998843.2e-9379.1Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL
        MDL L SSRFRHR SPSS+RFL SFPSP    S   S+ A D D++LNEDD+FWTGD ++DS HHSHS+P   SSSTP HH HHL  HKGFPLPETFGIL
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL

Query:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE
        AALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PLDRLPLP+S++LKYQSAPVNVP+MSKA   R  EV   DVD +DE DGEMLPPHE
Subjt:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE

Query:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        +VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A5A7SY45 Senescence regulator3.2e-9379.1Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL
        MDL L SSRFRHR SPSS+RFL SFPSP    S   S+ A D D++LNEDD+FWTGD ++DS HHSHS+P   SSSTP HH HHL  HKGFPLPETFGIL
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETFGIL

Query:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE
        AALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PLDRLPLP+S++LKYQSAPVNVP+MSKA   R  EV   DVD +DE DGEMLPPHE
Subjt:  AALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA-APRHDEVDMDDVDDIDEGDGEMLPPHE

Query:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        +VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1G2B0 uncharacterized protein LOC1114500338.5e-9479.03Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA----ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPET
        MDL  PSSRFRHRKSPSS+RFL SF SP+   S NP+SA     DD +++LNEDD+FWTGD +ADS HH+HS+P   SSSTP HH HHL  HKGFP  ET
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA----ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPET

Query:  FGILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEML
        FGILAALPENE SSSLRNSS+FYHKASVSSSSSSSPSSSRMIP+IPK PL+RLPLP+SS+LKYQSAPVNVPMMSKAA  RH E+   DVDD+DE DGEML
Subjt:  FGILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEML

Query:  PPHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PPHE+VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PPHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1HPU4 uncharacterized protein LOC1114666069.4e-9378.54Show/hide
Query:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA---ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETF
        M+L  PSSRFRHRKSP S+RFL SF SP+   S NP+SA    DD +++LNEDD+FWTGD +ADS HH+HS+P   SSSTP HH HHL  HKGFP  ETF
Subjt:  MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSA---ADDGDADLNEDDLFWTGDLSADSGHHSHSSP---SSSTPHHHFHHLHPHKGFPLPETF

Query:  GILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEMLP
        GILAALPENE SSSLRNSSHFYHKASVSSSSSSSPSSSRMIP+IPK PL+RLPL +SS+LKYQSAPVNVPMMSKAA  RH E+   DVDD+DE DGEMLP
Subjt:  GILAALPENEPSSSLRNSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAA-PRHDEVDMDDVDDIDEGDGEMLP

Query:  PHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PHE+VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G61930.1 Protein of unknown function, DUF5842.5e-1351.69Show/hide
Query:  SAPVNVPMMSKAAPRHDEV----DMDDVDDIDEGDGEMLPPHEMVARSLAQSPLL----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF
        SAPVNVP  SK   R D V    ++DD DD DE  G M+PPHE +A+S A+          SV +G GRTLKGR+LR+VR+A+W +TGF
Subjt:  SAPVNVPMMSKAAPRHDEV----DMDDVDDIDEGDGEMLPPHEMVARSLAQSPLL----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF

AT3G15040.1 Protein of unknown function, DUF5842.6e-3450.41Show/hide
Query:  FPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSPSS----STPHHHFHHLHPHKGFPLPETFGILAALPENEPSSSLRNSSHFYHK--
        F SP++ A     + +D  D +LNEDD+F   D+S       HS  SS     TP           G    E  GILAALPE+  SSS   S  F+HK  
Subjt:  FPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSPSS----STPHHHFHHLHPHKGFPLPETFGILAALPENEPSSSLRNSSHFYHK--

Query:  --------ASVSSSSSS-------SPSSSRMIPSIPKSPLDRLPLPVS--SALKY-QSAPVNVPMMSKA-APRH-DEVDMDDV--DDIDEGDGEMLPPHE
                ++ SSSSSS       S SS+R IP+ PK P +RLP   S     KY QSAPV VP++S A   RH  E  + DV  DD +E +GEMLPPHE
Subjt:  --------ASVSSSSSS-------SPSSSRMIPSIPKSPLDRLPLPVS--SALKY-QSAPVNVPMMSKA-APRH-DEVDMDDV--DDIDEGDGEMLPPHE

Query:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        +VARSLAQS LLSCSVLEGAGRTLKGRDLRQVRNAV+RRTGF+D
Subjt:  MVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G04630.1 Protein of unknown function, DUF5841.2e-1543.51Show/hide
Query:  ILAALPENEPSSSLRN--SSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMM------SKAAPRHDEVDMDDVDDIDE-
        + + L E E SS       SHF    S SSSSSSSP + R    +             S +K  SAP+NVP        SK+  R   +     DD DE 
Subjt:  ILAALPENEPSSSLRN--SSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMM------SKAAPRHDEVDMDDVDDIDE-

Query:  GDGEMLPPHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
         DG M+PPHE VAR LA++ + S S+ EG GRTLKGRDL +VRNAV  +TGFL+
Subjt:  GDGEMLPPHEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G21970.1 Protein of unknown function, DUF5846.6e-1440.41Show/hide
Query:  ENEPSSSLRNSSHFYHKASVSSS----SSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA---APRHDEVDMDDVDDIDEGDGEMLPP
        E E  S LR S     +  +S S    S+SS SS+R IP   +         VS   K  SAP+N+P  SK    + ++    +      D+ +G M+PP
Subjt:  ENEPSSSLRNSSHFYHKASVSSS----SSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKA---APRHDEVDMDDVDDIDEGDGEMLPP

Query:  HEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        HE+VA+ LA++ + S S+ EG GRTLKGRDL + RNAV  RTGFL+
Subjt:  HEMVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT5G60680.1 Protein of unknown function, DUF5849.5e-1344.35Show/hide
Query:  SSSPSSSRMIPSIPKS--PLDRLPLPVSSALKYQSAPVNVPMMSKAA-------PRHDEVDMDDVDDIDEGDGEMLPPHEMVARSLAQSPLLSCSVLEGA
        S SP   R I S  +S       P   SSA    S PVNVP  SK          R    D DD DD +E  G+ LPPHE     LA++ + S SV EG 
Subjt:  SSSPSSSRMIPSIPKS--PLDRLPLPVSSALKYQSAPVNVPMMSKAA-------PRHDEVDMDDVDDIDEGDGEMLPPHEMVARSLAQSPLLSCSVLEGA

Query:  GRTLKGRDLRQVRNAVWRRTGFLD
        GRTLKGRDL +VRNA++ + GF D
Subjt:  GRTLKGRDLRQVRNAVWRRTGFLD


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACCTCAAGCTCCCTTCCTCCCGTTTCCGCCACCGCAAATCCCCCTCCTCCGACCGATTTCTCACCTCCTTCCCTTCCCCCGCCGCCGCCGCCTCTGCAAACCCTAG
CTCCGCCGCCGACGACGGCGACGCCGACCTCAACGAGGACGACCTCTTCTGGACTGGCGATTTATCTGCCGATTCCGGTCACCATAGCCACTCCAGTCCTTCCTCCTCCA
CTCCGCATCACCATTTCCATCACCTCCACCCTCACAAGGGTTTTCCCCTTCCCGAGACCTTCGGCATCCTCGCCGCGCTCCCGGAGAACGAGCCGTCTTCCAGCCTGAGG
AACTCCTCGCATTTCTACCACAAGGCCTCTGTTTCGTCTTCGTCTTCTTCCTCGCCTTCCTCCTCTCGGATGATTCCGTCTATCCCTAAATCTCCTCTGGATCGGTTGCC
TTTACCGGTTTCTTCCGCGTTGAAGTACCAGTCGGCTCCGGTGAATGTGCCGATGATGTCCAAGGCGGCTCCGAGACACGACGAGGTCGATATGGATGATGTGGATGATA
TTGATGAAGGAGACGGGGAGATGCTGCCGCCTCATGAAATGGTGGCGAGGAGCTTGGCGCAATCGCCATTGTTGTCTTGCTCCGTGCTCGAGGGCGCGGGCAGGACGTTG
AAGGGCAGGGATCTTCGCCAGGTTCGTAACGCCGTTTGGAGACGAACGGGGTTTCTTGATTGA
mRNA sequenceShow/hide mRNA sequence
TTTCCACAAATTGACCTTTTTTGTCTACAAAATTCGCCATATAAATATATAAAACATAAAAAAAGAAGAAGAAAATGAAAACCTGCATCCTCTCACGAGTTGGACGACGG
CGGCTGTGTTTCTGAAATTCCGATTTCCGTACAGATCCGCCATTGCCATGGACCTCAAGCTCCCTTCCTCCCGTTTCCGCCACCGCAAATCCCCCTCCTCCGACCGATTT
CTCACCTCCTTCCCTTCCCCCGCCGCCGCCGCCTCTGCAAACCCTAGCTCCGCCGCCGACGACGGCGACGCCGACCTCAACGAGGACGACCTCTTCTGGACTGGCGATTT
ATCTGCCGATTCCGGTCACCATAGCCACTCCAGTCCTTCCTCCTCCACTCCGCATCACCATTTCCATCACCTCCACCCTCACAAGGGTTTTCCCCTTCCCGAGACCTTCG
GCATCCTCGCCGCGCTCCCGGAGAACGAGCCGTCTTCCAGCCTGAGGAACTCCTCGCATTTCTACCACAAGGCCTCTGTTTCGTCTTCGTCTTCTTCCTCGCCTTCCTCC
TCTCGGATGATTCCGTCTATCCCTAAATCTCCTCTGGATCGGTTGCCTTTACCGGTTTCTTCCGCGTTGAAGTACCAGTCGGCTCCGGTGAATGTGCCGATGATGTCCAA
GGCGGCTCCGAGACACGACGAGGTCGATATGGATGATGTGGATGATATTGATGAAGGAGACGGGGAGATGCTGCCGCCTCATGAAATGGTGGCGAGGAGCTTGGCGCAAT
CGCCATTGTTGTCTTGCTCCGTGCTCGAGGGCGCGGGCAGGACGTTGAAGGGCAGGGATCTTCGCCAGGTTCGTAACGCCGTTTGGAGACGAACGGGGTTTCTTGATTGA
GGAATTGAATTGCTGTAATTACTTCTGGAGAACTGATCTTCACCAGGTTCACTTTGGCACTATTTGTGTCGCTCTTTTTAGAATGTTTGAGGGTCCAGGAATATTTGAAT
CTGCTCGACACTCATCGTAACAAGGATTTGGAATTGGCATTGTAATTATCTCTCAAGGGCGTCTAAGATTTTACTTTGAAGCTTATTTGTAAGTTTGACTATTTTCTGAA
ACATTTTTCAATCTATCAATTATTGAATTCTAGTAATGTTGTCAGATTTGCATTTAATCTTTCAGTGAGAATGTCATTTTTTTTATAGTCCCAAATGGTGTTTGTTGAAT
TTGGTTATTGTTTCCTTTATCTAGC
Protein sequenceShow/hide protein sequence
MDLKLPSSRFRHRKSPSSDRFLTSFPSPAAAASANPSSAADDGDADLNEDDLFWTGDLSADSGHHSHSSPSSSTPHHHFHHLHPHKGFPLPETFGILAALPENEPSSSLR
NSSHFYHKASVSSSSSSSPSSSRMIPSIPKSPLDRLPLPVSSALKYQSAPVNVPMMSKAAPRHDEVDMDDVDDIDEGDGEMLPPHEMVARSLAQSPLLSCSVLEGAGRTL
KGRDLRQVRNAVWRRTGFLD