; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CcUC01G011950 (gene) of Watermelon (PI 537277) v1 genome

Gene IDCcUC01G011950
OrganismCitrullus colocynthis (Watermelon (PI 537277) v1)
DescriptionProtein of unknown function, DUF584
Genome locationCicolChr01:20918953..20920974
RNA-Seq ExpressionCcUC01G011950
SyntenyCcUC01G011950
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsIPR007608 - Senescence regulator S40


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KGN64943.1 hypothetical protein Csa_022813 [Cucumis sativus]4.5e-11492.41Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL
        MDLNLPSSRFRHR SPSSERFL SFPSPP R++NPSST ALDDD+ELNEDDVFWTGDF +DS HHSHSTPSSSSSSTPRHHIHHLQHHK FPLPETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL

Query:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA
        AALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPIS+SLKYQSAPVNVPIMSKA VQR  E+DVDDVDE+DGEMLPPHEIVA
Subjt:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

XP_008461249.1 PREDICTED: uncharacterized protein LOC103499884 [Cucumis melo]1.9e-11291.98Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL
        MDLNL SSRFRHR SPSSERFL SFPSPP RT+NPSST ALDDD+ELNEDDVFWTGDF +DS HHSHSTPSSSSSSTPRHHIHHLQHHK FPLPETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL

Query:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA
        AALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPIS+SLKYQSAPVNVPIMSKA VQR  E+DVD VDE+DGEMLPPHEIVA
Subjt:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

XP_022967102.1 uncharacterized protein LOC111466606 [Cucurbita maxima]4.1e-10789.12Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDN--ELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFG
        M+L+ PSSRFRHRKSP SERFL SF SP  R +NP+S NALDDDN  ELNEDDVFWTGDF ADSAHH+HSTPSSSSSSTPRHHIHHLQHHK FP  ETFG
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDN--ELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFG

Query:  ILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHEI
        ILAALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPL+RLPL ISSSLKYQSAPVNVP+MSK AVQRHQEIDVDDVDE DGEMLPPHEI
Subjt:  ILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHEI

Query:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

XP_023522766.1 uncharacterized protein LOC111786770 [Cucurbita pepo subsp. pepo]3.1e-10789.96Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDN--ELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFG
        MDL  PSSRFRHRKSPSSERFL SF SP  R +NP+S NALDDDN  ELNEDDVFWTGDF ADS HH+HSTPSSSSSSTPRHHIHHLQHHKAFP  ETFG
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDN--ELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFG

Query:  ILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHEI
        ILAALPENEASS+LRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPL+RLPLPISSSLKYQSAPVNVP+MSK AVQRHQEIDVDDVDE DGEMLPPHEI
Subjt:  ILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHEI

Query:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

XP_038894579.1 uncharacterized protein LOC120083099 [Benincasa hispida]9.1e-11593.67Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL
        MDLNLPS RFRHRKSPSSERFL SF SPP RTANPSSTN +DDD ELNEDDVFWTGDF ADSAHHSHSTPSSSSSSTPRHHIHHLQHHK FPLPETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL

Query:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA
        AALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPL+RLPLPISSSLKYQSAPVNVPIMSKA VQR QEIDVDDVDE+DGEMLPPHEIVA
Subjt:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        RSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

TrEMBL top hitse value%identityAlignment
A0A0A0LT40 Uncharacterized protein2.2e-11492.41Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL
        MDLNLPSSRFRHR SPSSERFL SFPSPP R++NPSST ALDDD+ELNEDDVFWTGDF +DS HHSHSTPSSSSSSTPRHHIHHLQHHK FPLPETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL

Query:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA
        AALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPIS+SLKYQSAPVNVPIMSKA VQR  E+DVDDVDE+DGEMLPPHEIVA
Subjt:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

A0A1S4E4F1 uncharacterized protein LOC1034998849.2e-11391.98Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL
        MDLNL SSRFRHR SPSSERFL SFPSPP RT+NPSST ALDDD+ELNEDDVFWTGDF +DS HHSHSTPSSSSSSTPRHHIHHLQHHK FPLPETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL

Query:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA
        AALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPIS+SLKYQSAPVNVPIMSKA VQR  E+DVD VDE+DGEMLPPHEIVA
Subjt:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

A0A5A7SY45 Senescence regulator9.2e-11391.98Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL
        MDLNL SSRFRHR SPSSERFL SFPSPP RT+NPSST ALDDD+ELNEDDVFWTGDF +DS HHSHSTPSSSSSSTPRHHIHHLQHHK FPLPETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGIL

Query:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA
        AALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPIS+SLKYQSAPVNVPIMSKA VQR  E+DVD VDE+DGEMLPPHEIVA
Subjt:  AALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKA-VQRHQEIDVDDVDEEDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

A0A6J1G2B0 uncharacterized protein LOC1114500332.6e-10788.75Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDD---NELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETF
        MDL  PSSRFRHRKSPSSERFL SF SP  R +NP+S NALD+D   +ELNEDDVFWTGDF ADSAHH+HSTPSSSSSSTPRHHIHHLQHHK FP  ETF
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDD---NELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETF

Query:  GILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHE
        GILAALPENEASS+LRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPL+RLPLPISSSLKYQSAPVNVP+MSK AVQRHQEIDVDDVDE DGEMLPPHE
Subjt:  GILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        IVARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

A0A6J1HPU4 uncharacterized protein LOC1114666062.0e-10789.12Show/hide
Query:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDN--ELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFG
        M+L+ PSSRFRHRKSP SERFL SF SP  R +NP+S NALDDDN  ELNEDDVFWTGDF ADSAHH+HSTPSSSSSSTPRHHIHHLQHHK FP  ETFG
Subjt:  MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDN--ELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFG

Query:  ILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHEI
        ILAALPENEASS+LRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPL+RLPL ISSSLKYQSAPVNVP+MSK AVQRHQEIDVDDVDE DGEMLPPHEI
Subjt:  ILAALPENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK-AVQRHQEIDVDDVDEEDGEMLPPHEI

Query:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRT
Subjt:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G11700.1 Protein of unknown function, DUF5844.5e-1146.99Show/hide
Query:  SAPVNVPIMSKAVQRHQEIDVDDVDEED----GEMLPPHEIVARSLAQSPMLS---CSVLEGAGRTLKGRDLRQVRNAVWRRT
        SAPVNVP  SK  + +    + + DEE+    G M+PPHE +A+S  +    S    SV EG GRTLKGR+LR+VR+A+W +T
Subjt:  SAPVNVPIMSKAVQRHQEIDVDDVDEED----GEMLPPHEIVARSLAQSPMLS---CSVLEGAGRTLKGRDLRQVRNAVWRRT

AT3G15040.1 Protein of unknown function, DUF5847.6e-3549.17Show/hide
Query:  SPPARTANPSSTNALDD--DNELNEDDVFWTGDFTADSAHHSHSTPSS-SSSSTPRHHIHHLQHHKAFPLPETFGILAALPENEASSTLRNSSHFYHK--
        +P    ++PSS   + D  D ELNEDD+F   D +       HS  SS +   TP   +   +        E  GILAALPE+  SS+   S  F+HK  
Subjt:  SPPARTANPSSTNALDD--DNELNEDDVFWTGDFTADSAHHSHSTPSS-SSSSTPRHHIHHLQHHKAFPLPETFGILAALPENEASSTLRNSSHFYHK--

Query:  --------ASVSSSSSS-------SPSSSRMIPTIPKPPLDRLPLPIS--SSLKY-QSAPVNVPIMSKA-VQRHQ------EIDVDDVDEEDGEMLPPHE
                ++ SSSSSS       S SS+R IPT PKPP +RLP   S     KY QSAPV VP++S A + RH+      ++  DD +EE+GEMLPPHE
Subjt:  --------ASVSSSSSS-------SPSSSRMIPTIPKPPLDRLPLPIS--SSLKY-QSAPVNVPIMSKA-VQRHQ------EIDVDDVDEEDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        IVARSLAQS +LSCSVLEGAGRTLKGRDLRQVRNAV+RRT
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

AT4G04630.1 Protein of unknown function, DUF5844.3e-1441.33Show/hide
Query:  ILAALPENEASSTLRN--SSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK----------AVQRHQEIDVDDVDE
        + + L E E SS       SHF    S SSSSSSSP + R    +             S +K  SAP+NVP  SK          +   H     DD ++
Subjt:  ILAALPENEASSTLRN--SSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSK----------AVQRHQEIDVDDVDE

Query:  EDGEMLPPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT
        +DG M+PPHE VAR LA++ + S S+ EG GRTLKGRDL +VRNAV  +T
Subjt:  EDGEMLPPHEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRT

AT4G21970.1 Protein of unknown function, DUF5844.8e-1337.58Show/hide
Query:  ENEASSTLRNSSHFYHKASVSSS----SSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKAVQRHQEIDVDDV------DEEDGEMLPP
        E E  S LR S     +  +S S    S+SS SS+R IP   +         +S   K  SAP+N+P  SK     ++     +      D+++G M+PP
Subjt:  ENEASSTLRNSSHFYHKASVSSS----SSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKAVQRHQEIDVDDV------DEEDGEMLPP

Query:  HEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTASMISDL
        HE+VA+ LA++ + S S+ EG GRTLKGRDL + RNAV  RT  + S++
Subjt:  HEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTASMISDL

AT5G60680.1 Protein of unknown function, DUF5847.2e-0936.88Show/hide
Query:  ENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKAVQ------RHQEI----DVDDVDEEDGEMLPP
        E++  + + + S  + +   SS  S   SS+R             P   SS+    S PVNVP  SK ++      R + I    D DD +E+ G+ LPP
Subjt:  ENEASSTLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKAVQ------RHQEI----DVDDVDEEDGEMLPP

Query:  HEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRR
        HE     LA++ M S SV EG GRTLKGRDL +VRNA++ +
Subjt:  HEIVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACCTCAACCTTCCTTCTTCCCGCTTCCGCCACCGCAAATCTCCTTCCTCCGAACGCTTTCTCGGTTCCTTCCCTTCTCCCCCTGCTCGCACTGCAAACCCTAGCTC
CACCAACGCCCTCGACGACGATAACGAGCTCAACGAAGACGACGTCTTCTGGACCGGCGATTTTACTGCCGATTCCGCCCACCATAGCCACTCCACTCCCTCCTCCTCCT
CCTCTTCCACTCCTCGTCACCATATTCATCACCTCCAGCATCACAAGGCTTTTCCCTTGCCGGAGACCTTCGGAATCCTCGCTGCTCTCCCCGAGAACGAGGCCTCCTCC
ACCCTTCGCAACTCTTCACACTTCTATCACAAGGCCTCCGTTTCCTCCTCCTCCTCCTCTTCCCCCTCCTCTTCTCGGATGATTCCGACCATCCCTAAACCTCCTCTCGA
CCGATTGCCTCTTCCCATTTCCTCTTCCTTGAAGTACCAGTCCGCCCCTGTGAATGTGCCTATAATGTCGAAGGCGGTTCAGAGACACCAGGAGATTGACGTGGATGATG
TTGATGAAGAAGATGGAGAGATGTTGCCGCCGCATGAGATTGTCGCAAGAAGTCTGGCTCAGTCGCCGATGTTGTCTTGCTCGGTTCTCGAGGGTGCAGGAAGGACGTTA
AAGGGCAGGGATCTTCGACAAGTTCGCAACGCGGTTTGGAGACGAACAGCTTCCATGATCAGTGATCTCAAATATAGAGGGCCTATATGGAATGCAGGATATGTGAAAAT
GGGGAAGGGAACAATAATTGTAGAGGAGAGAGTAGAAACTTGA
mRNA sequenceShow/hide mRNA sequence
ATGGACCTCAACCTTCCTTCTTCCCGCTTCCGCCACCGCAAATCTCCTTCCTCCGAACGCTTTCTCGGTTCCTTCCCTTCTCCCCCTGCTCGCACTGCAAACCCTAGCTC
CACCAACGCCCTCGACGACGATAACGAGCTCAACGAAGACGACGTCTTCTGGACCGGCGATTTTACTGCCGATTCCGCCCACCATAGCCACTCCACTCCCTCCTCCTCCT
CCTCTTCCACTCCTCGTCACCATATTCATCACCTCCAGCATCACAAGGCTTTTCCCTTGCCGGAGACCTTCGGAATCCTCGCTGCTCTCCCCGAGAACGAGGCCTCCTCC
ACCCTTCGCAACTCTTCACACTTCTATCACAAGGCCTCCGTTTCCTCCTCCTCCTCCTCTTCCCCCTCCTCTTCTCGGATGATTCCGACCATCCCTAAACCTCCTCTCGA
CCGATTGCCTCTTCCCATTTCCTCTTCCTTGAAGTACCAGTCCGCCCCTGTGAATGTGCCTATAATGTCGAAGGCGGTTCAGAGACACCAGGAGATTGACGTGGATGATG
TTGATGAAGAAGATGGAGAGATGTTGCCGCCGCATGAGATTGTCGCAAGAAGTCTGGCTCAGTCGCCGATGTTGTCTTGCTCGGTTCTCGAGGGTGCAGGAAGGACGTTA
AAGGGCAGGGATCTTCGACAAGTTCGCAACGCGGTTTGGAGACGAACAGCTTCCATGATCAGTGATCTCAAATATAGAGGGCCTATATGGAATGCAGGATATGTGAAAAT
GGGGAAGGGAACAATAATTGTAGAGGAGAGAGTAGAAACTTGA
Protein sequenceShow/hide protein sequence
MDLNLPSSRFRHRKSPSSERFLGSFPSPPARTANPSSTNALDDDNELNEDDVFWTGDFTADSAHHSHSTPSSSSSSTPRHHIHHLQHHKAFPLPETFGILAALPENEASS
TLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLDRLPLPISSSLKYQSAPVNVPIMSKAVQRHQEIDVDDVDEEDGEMLPPHEIVARSLAQSPMLSCSVLEGAGRTL
KGRDLRQVRNAVWRRTASMISDLKYRGPIWNAGYVKMGKGTIIVEERVET