; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr030203 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr030203
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
DescriptionProtein of unknown function, DUF584
Genome locationtig00153574:1292241..1294093
RNA-Seq ExpressionSgr030203
SyntenySgr030203
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsIPR007608 - Senescence regulator S40


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6573630.1 hypothetical protein SDJN03_27517, partial [Cucurbita argyrosperma subsp. sororia]6.2e-9986.15Show/hide
Query:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDD---NELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETF
        MD+   S+RFRHRKS S+ERFL S  SP+  P NPT+ N +D+D   +ELNEDDVFWTGDFAADS HH HSTPSSSSSSTPRHHIHHLQHHKGFPQSETF
Subjt:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDD---NELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETF

Query:  GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHE
        GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP+PISSSLKYQSAPVNVPM+SK AVQRHQE+DV+DVDE DGEMLPPHE
Subjt:  GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQ
        IVARSLAQSP+LSCSVLEGAGRTLKGRDLRQ
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQ

XP_022142671.1 homeobox protein vnd-like [Momordica charantia]4.3e-10084.23Show/hide
Query:  MDVNIGS-TRFRHRKSSSTERFLGSL-SPASLPGNPTAD------NGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQ
        MDVN+GS  RFRHRKSSSTERFLGSL SPAS  GNP+        NG DD+NELNEDDVFWTGDFAA+SGHH HSTPSSSSSSTPRHHIHHLQ HKGFPQ
Subjt:  MDVNIGS-TRFRHRKSSSTERFLGSL-SPASLPGNPTAD------NGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQ

Query:  SETFGILAALPENEASSSLRNSSYFYHKASV-SSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDVDEGDGEML
         ETFGILAALPENEASSSLR+SSYFYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLP+PIS+SLKYQSAPVNVP++SK VQRHQELDV+D+DEGDGEML
Subjt:  SETFGILAALPENEASSSLRNSSYFYHKASV-SSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDVDEGDGEML

Query:  PPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        PPHE VARSLAQSP+LSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  PPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

XP_022945942.1 uncharacterized protein LOC111450033 [Cucurbita moschata]1.2e-9984.39Show/hide
Query:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDD---NELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETF
        MD+   S+RFRHRKS S+ERFL S  SP+  P NPT+ N +D+D   +ELNEDDVFWTGDFAADS HH HSTPSSSSSSTPRHHIHHLQHHKGFPQSETF
Subjt:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDD---NELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETF

Query:  GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHE
        GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP+PISSSLKYQSAPVNVPM+SK AVQRHQE+DV+DVDE DGEMLPPHE
Subjt:  GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        IVARSLAQSP+LSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

XP_023522766.1 uncharacterized protein LOC111786770 [Cucurbita pepo subsp. pepo]4.7e-9986.52Show/hide
Query:  STRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDN--ELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGILAALP
        S+RFRHRKS S+ERFL S  SP+  P NPT+ N +DDDN  ELNEDDVFWTGDFAADS HH HSTPSSSSSSTPRHHIHHLQHHK FPQSETFGILAALP
Subjt:  STRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDN--ELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGILAALP

Query:  ENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHEIVARSLA
        ENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP+PISSSLKYQSAPVNVPM+SK AVQRHQE+DV+DVDE DGEMLPPHEIVARSLA
Subjt:  ENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHEIVARSLA

Query:  QSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        QSP+LSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  QSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

XP_038894579.1 uncharacterized protein LOC120083099 [Benincasa hispida]3.6e-9984.19Show/hide
Query:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGIL
        MD+N+ S RFRHRKS S+ERFL S  SP     NP++ NGVDDD ELNEDDVFWTGDFAADS HH+HSTPSSSSSSTPRHHIHHLQHHKGFP  ETFGIL
Subjt:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGIL

Query:  AALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKA-VQRHQELDVNDVDEGDGEMLPPHEIVA
        AALPENEASSSLRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP+PISSSLKYQSAPVNVP++SKA VQR QE+DV+DVDE DGEMLPPHEIVA
Subjt:  AALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKA-VQRHQELDVNDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        RSLAQSP+LSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

TrEMBL top hitse value%identityAlignment
A0A0A0LT40 Uncharacterized protein1.2e-9581.2Show/hide
Query:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGIL
        MD+N+ S+RFRHR S S+ERFL S  SP     NP++   +DDD+ELNEDDVFWTGDFA+DS HH+HSTPSSSSSSTPRHHIHHLQHHKGFP  ETFGIL
Subjt:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGIL

Query:  AALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKA-VQRHQELDVNDVDEGDGEMLPPHEIVA
        AALPENEASSSLRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPL+RLP+PIS+SLKYQSAPVNVP++SKA VQR  E+DV+DVDE DGEMLPPHEIVA
Subjt:  AALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKA-VQRHQELDVNDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

A0A1S4E4F1 uncharacterized protein LOC1034998841.3e-9480.77Show/hide
Query:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGIL
        MD+N+ S+RFRHR S S+ERFL S  SP     NP++   +DDD+ELNEDDVFWTGDFA+DS HH+HSTPSSSSSSTPRHHIHHLQHHKGFP  ETFGIL
Subjt:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGIL

Query:  AALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKA-VQRHQELDVNDVDEGDGEMLPPHEIVA
        AALPENEASSSLRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPL+RLP+PIS+SLKYQSAPVNVP++SKA VQR  E+DV+ VDE DGEMLPPHEIVA
Subjt:  AALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKA-VQRHQELDVNDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

A0A6J1CMW3 homeobox protein vnd-like2.1e-10084.23Show/hide
Query:  MDVNIGS-TRFRHRKSSSTERFLGSL-SPASLPGNPTAD------NGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQ
        MDVN+GS  RFRHRKSSSTERFLGSL SPAS  GNP+        NG DD+NELNEDDVFWTGDFAA+SGHH HSTPSSSSSSTPRHHIHHLQ HKGFPQ
Subjt:  MDVNIGS-TRFRHRKSSSTERFLGSL-SPASLPGNPTAD------NGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQ

Query:  SETFGILAALPENEASSSLRNSSYFYHKASV-SSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDVDEGDGEML
         ETFGILAALPENEASSSLR+SSYFYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLP+PIS+SLKYQSAPVNVP++SK VQRHQELDV+D+DEGDGEML
Subjt:  SETFGILAALPENEASSSLRNSSYFYHKASV-SSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDVDEGDGEML

Query:  PPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        PPHE VARSLAQSP+LSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  PPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

A0A6J1G2B0 uncharacterized protein LOC1114500336.0e-10084.39Show/hide
Query:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDD---NELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETF
        MD+   S+RFRHRKS S+ERFL S  SP+  P NPT+ N +D+D   +ELNEDDVFWTGDFAADS HH HSTPSSSSSSTPRHHIHHLQHHKGFPQSETF
Subjt:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDD---NELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETF

Query:  GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHE
        GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP+PISSSLKYQSAPVNVPM+SK AVQRHQE+DV+DVDE DGEMLPPHE
Subjt:  GILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        IVARSLAQSP+LSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

A0A6J1HPU4 uncharacterized protein LOC1114666068.7e-9983.9Show/hide
Query:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDN--ELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFG
        M+++  S+RFRHRKS  +ERFL S  SP+  P NPT+ N +DDDN  ELNEDDVFWTGDFAADS HH HSTPSSSSSSTPRHHIHHLQHHKGFPQSETFG
Subjt:  MDVNIGSTRFRHRKSSSTERFLGSL-SPASLPGNPTADNGVDDDN--ELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFG

Query:  ILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHEI
        ILAALPENEASSSLRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP+ ISSSLKYQSAPVNVPM+SK AVQRHQE+DV+DVDE DGEMLPPHEI
Subjt:  ILAALPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK-AVQRHQELDVNDVDEGDGEMLPPHEI

Query:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY
        VARSLAQSP+LSCSVLEGAGRTLKGRDLRQ   +V+
Subjt:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSVY

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G61930.1 Protein of unknown function, DUF5841.8e-0841.46Show/hide
Query:  SAPVNVPMLSK-----AVQRHQELDVNDVDEGDGEMLPPHEIVARSLAQSPML----SCSVLEGAGRTLKGRDLRQPNTSVY
        SAPVNVP  SK     +V+   ELD  D ++ +  M+PPHE +A+S A+          SV +G GRTLKGR+LR+   +++
Subjt:  SAPVNVPMLSK-----AVQRHQELDVNDVDEGDGEMLPPHEIVARSLAQSPML----SCSVLEGAGRTLKGRDLRQPNTSVY

AT3G15040.1 Protein of unknown function, DUF5847.0e-3250Show/hide
Query:  DNELNEDDVFWTGDFAADSGH---HAHSTPSSS--SSSTPRHHIHHLQHHKGFPQSETFGILAALPENEASSSLRNSSYFYHK----------ASVSSSS
        D ELNEDD+     FA D  H    A  +P SS     TP   +   +   G    E  GILAALPE+  SSS   S  F+HK          ++ SSSS
Subjt:  DNELNEDDVFWTGDFAADSGH---HAHSTPSSS--SSSTPRHHIHHLQHHKGFPQSETFGILAALPENEASSSLRNSSYFYHK----------ASVSSSS

Query:  SS-------SPSSSRMIPTIPKPPLERLPVPIS--SSLKY-QSAPVNVPMLSKA-VQRHQE----LDV--NDVDEGDGEMLPPHEIVARSLAQSPMLSCS
        SS       S SS+R IPT PKPP ERLP   S     KY QSAPV VP++S A + RH++     DV  +D +E +GEMLPPHEIVARSLAQS +LSCS
Subjt:  SS-------SPSSSRMIPTIPKPPLERLPVPIS--SSLKY-QSAPVNVPMLSKA-VQRHQE----LDV--NDVDEGDGEMLPPHEIVARSLAQSPMLSCS

Query:  VLEGAGRTLKGRDLRQPNTSVY
        VLEGAGRTLKGRDLRQ   +V+
Subjt:  VLEGAGRTLKGRDLRQPNTSVY

AT3G45210.1 Protein of unknown function, DUF5844.5e-0730Show/hide
Query:  LPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDVDEGDGEMLPPHEIVARSL
        LP +   +   +S + + ++ + S+ S SP   R + T  +   +  P  ++++    S P+NV   SK + +     + + D+G    LPPHE     L
Subjt:  LPENEASSSLRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDVDEGDGEMLPPHEIVARSL

Query:  AQSPMLSCSVLEGAGRTLKGRDLRQPNTSV
        A++ M S SV EG GRTLKGRD+ +   ++
Subjt:  AQSPMLSCSVLEGAGRTLKGRDLRQPNTSV

AT4G04630.1 Protein of unknown function, DUF5843.4e-1037.67Show/hide
Query:  ILAALPENEASSSLRN--SSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK----------AVQRHQELDVNDVDE
        + + L E E SS       S+F    S SSSSSSSP + R    +             S +K  SAP+NVP  SK          +   H     +D ++
Subjt:  ILAALPENEASSSLRN--SSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSK----------AVQRHQELDVNDVDE

Query:  GDGEMLPPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSV
         DG M+PPHE VAR LA++ + S S+ EG GRTLKGRDL +   +V
Subjt:  GDGEMLPPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSV

AT4G21970.1 Protein of unknown function, DUF5849.8e-1036.23Show/hide
Query:  ENEASSSLRNSSYFYHKASVSSS----SSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDV------DEGDGEMLPP
        E E  S LR S     +  +S S    S+SS SS+R IP   +         +S   K  SAP+N+P  SK     ++   + +      D+ +G M+PP
Subjt:  ENEASSSLRNSSYFYHKASVSSS----SSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDV------DEGDGEMLPP

Query:  HEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSV
        HE+VA+ LA++ + S S+ EG GRTLKGRDL +   +V
Subjt:  HEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQPNTSV


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACGTCAATATCGGGTCGACCCGTTTCCGCCACCGGAAATCCTCCTCCACCGAACGCTTTCTCGGTTCCCTATCTCCGGCGTCGCTCCCTGGAAACCCTACCGCTGA
CAATGGAGTCGACGACGATAACGAGCTCAACGAAGATGACGTCTTCTGGACCGGTGATTTTGCTGCCGATTCCGGCCACCATGCCCACTCCACTCCTTCCTCCTCTTCCT
CTTCCACTCCTCGTCACCACATCCACCACCTTCAGCATCACAAGGGTTTCCCCCAATCGGAGACCTTCGGAATCCTTGCTGCTCTCCCCGAGAACGAGGCGTCGTCCAGT
CTCCGGAACTCTTCGTATTTCTACCATAAGGCGTCCGTTTCGTCGTCGTCTTCTTCTTCCCCTTCGTCTTCTCGTATGATTCCCACCATTCCCAAACCCCCTCTGGAGCG
ATTACCCGTGCCGATTTCTTCGTCGCTGAAGTACCAGTCGGCCCCAGTGAATGTGCCAATGCTGTCGAAGGCGGTCCAGAGACACCAAGAGTTAGACGTGAACGATGTTG
ATGAAGGAGATGGCGAGATGTTGCCGCCGCACGAGATTGTCGCCAGAAGTTTGGCCCAATCGCCGATGTTGTCGTGCTCAGTGCTCGAGGGCGCAGGAAGGACGTTAAAG
GGCAGGGATCTTCGCCAGCCCAACACGTCTGTTTATTGGGGTTGGAGGCATAGGGAGCAAAAGTATCCATTTACTGCTGTGTTTATTGATATTTTCCTTAGTTCCTGCGT
CAGAGGCATCCCCTTGAAGTTTATTTTGTGTCTTTCTTTTCTTTTCTTTTCTCTTTTTTTTTTTTTTGGGGTGGGGTGGGGTGGGGTGTCATCAGGCATGTATGGAATGC
ACATGCAGGATGAGTACCTACTGATGTGGGAGGAAGGGGGAAAAGAGAGGATAAATTAG
mRNA sequenceShow/hide mRNA sequence
ATGGACGTCAATATCGGGTCGACCCGTTTCCGCCACCGGAAATCCTCCTCCACCGAACGCTTTCTCGGTTCCCTATCTCCGGCGTCGCTCCCTGGAAACCCTACCGCTGA
CAATGGAGTCGACGACGATAACGAGCTCAACGAAGATGACGTCTTCTGGACCGGTGATTTTGCTGCCGATTCCGGCCACCATGCCCACTCCACTCCTTCCTCCTCTTCCT
CTTCCACTCCTCGTCACCACATCCACCACCTTCAGCATCACAAGGGTTTCCCCCAATCGGAGACCTTCGGAATCCTTGCTGCTCTCCCCGAGAACGAGGCGTCGTCCAGT
CTCCGGAACTCTTCGTATTTCTACCATAAGGCGTCCGTTTCGTCGTCGTCTTCTTCTTCCCCTTCGTCTTCTCGTATGATTCCCACCATTCCCAAACCCCCTCTGGAGCG
ATTACCCGTGCCGATTTCTTCGTCGCTGAAGTACCAGTCGGCCCCAGTGAATGTGCCAATGCTGTCGAAGGCGGTCCAGAGACACCAAGAGTTAGACGTGAACGATGTTG
ATGAAGGAGATGGCGAGATGTTGCCGCCGCACGAGATTGTCGCCAGAAGTTTGGCCCAATCGCCGATGTTGTCGTGCTCAGTGCTCGAGGGCGCAGGAAGGACGTTAAAG
GGCAGGGATCTTCGCCAGCCCAACACGTCTGTTTATTGGGGTTGGAGGCATAGGGAGCAAAAGTATCCATTTACTGCTGTGTTTATTGATATTTTCCTTAGTTCCTGCGT
CAGAGGCATCCCCTTGAAGTTTATTTTGTGTCTTTCTTTTCTTTTCTTTTCTCTTTTTTTTTTTTTTGGGGTGGGGTGGGGTGGGGTGTCATCAGGCATGTATGGAATGC
ACATGCAGGATGAGTACCTACTGATGTGGGAGGAAGGGGGAAAAGAGAGGATAAATTAG
Protein sequenceShow/hide protein sequence
MDVNIGSTRFRHRKSSSTERFLGSLSPASLPGNPTADNGVDDDNELNEDDVFWTGDFAADSGHHAHSTPSSSSSSTPRHHIHHLQHHKGFPQSETFGILAALPENEASSS
LRNSSYFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPVPISSSLKYQSAPVNVPMLSKAVQRHQELDVNDVDEGDGEMLPPHEIVARSLAQSPMLSCSVLEGAGRTLK
GRDLRQPNTSVYWGWRHREQKYPFTAVFIDIFLSSCVRGIPLKFILCLSFLFFSLFFFFGVGWGGVSSGMYGMHMQDEYLLMWEEGGKERIN