; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MC03g0433 (gene) of Bitter gourd (Dali-11) v1 genome

Gene IDMC03g0433
OrganismMomordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
DescriptionProtein of unknown function, DUF584
Genome locationMC03:11213683..11214423
RNA-Seq ExpressionMC03g0433
SyntenyMC03g0433
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsIPR007608 - Senescence regulator S40


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022142671.1 homeobox protein vnd-like [Momordica charantia]1.47e-16799.6Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
        MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP

Query:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
        ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
Subjt:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP

Query:  PHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022945942.1 uncharacterized protein LOC111450033 [Cucurbita moschata]4.67e-12982.73Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ
        MD+   S+ RFRHRKS S+ERFL S SSP+ R  NP+   +A  ++  D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQH KGFPQ
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM
         ETFGILAALPENEASSSLR+SSYFYHKAS+S SSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM

Query:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022967102.1 uncharacterized protein LOC111466606 [Cucurbita maxima]3.52e-12683.06Show/hide
Query:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQPETFGIL
        ++RFRHRKS  +ERFL S SSP+ R  NP    T+A     D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQH KGFPQ ETFGIL
Subjt:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQPETFGIL

Query:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEMLPPHEFV
        AALPENEASSSLR+SS+FYHKAS+S SSSSSSPSSSRMIPTIPKPPLERLPL IS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLPPHE V
Subjt:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEMLPPHEFV

Query:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_023522766.1 uncharacterized protein LOC111786770 [Cucurbita pepo subsp. pepo]7.19e-12882.19Show/hide
Query:  VNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQPE
        +++  ++RFRHRKS S+ERFL S SSP+ R  NP    T+A     D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQH K FPQ E
Subjt:  VNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQPE

Query:  TFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEMLP
        TFGILAALPENEASSSLR+SSYFYHKAS+S SSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLP
Subjt:  TFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEMLP

Query:  PHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_038894579.1 uncharacterized protein LOC120083099 [Benincasa hispida]1.47e-12983.13Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ
        MD+N+ S  RFRHRKS S+ERFL S  SP  R  NPS        NG DD+ ELNEDDVFWTGDFAA+S HH+HSTPSSSSSSTPRHHIHHLQH KGFP 
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPV-QRHQELDVDDIDEGDGEM
        PETFGILAALPENEASSSLR+SS+FYHKAS+S SSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVPIMSK V QR QE+DVDD+DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPV-QRHQELDVDDIDEGDGEM

Query:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

TrEMBL top hitse value%identityAlignment
A0A0A0LT40 Uncharacterized protein2.63e-12581.53Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ
        MD+N+ S+ RFRHR S S+ERFL S  SP  R  NPS S+TA      DD++ELNEDDVFWTGDFA++S HH+HSTPSSSSSSTPRHHIHHLQH KGFP 
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPV-QRHQELDVDDIDEGDGEM
        PETFGILAALPENEASSSLR+SS+FYHKAS+S SSSSSSPSSSRMIPTIPKPPL+RLPLPIS SLKYQSAPVNVPIMSK V QR  E+DVDD+DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPV-QRHQELDVDDIDEGDGEM

Query:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHE VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A1S4E4F1 uncharacterized protein LOC1034998848.75e-12481.12Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ
        MD+N+ S+ RFRHR S S+ERFL S  SP  R  NPS S+TA      DD++ELNEDDVFWTGDFA++S HH+HSTPSSSSSSTPRHHIHHLQH KGFP 
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPV-QRHQELDVDDIDEGDGEM
        PETFGILAALPENEASSSLR+SS+FYHKAS+S SSSSSSPSSSRMIPTIPKPPL+RLPLPIS SLKYQSAPVNVPIMSK V QR  E+DVD +DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPV-QRHQELDVDDIDEGDGEM

Query:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHE VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1CMW3 homeobox protein vnd-like7.12e-16899.6Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
        MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP

Query:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
        ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
Subjt:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP

Query:  PHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1G2B0 uncharacterized protein LOC1114500332.26e-12982.73Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ
        MD+   S+ RFRHRKS S+ERFL S SSP+ R  NP+   +A  ++  D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQH KGFPQ
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM
         ETFGILAALPENEASSSLR+SSYFYHKAS+S SSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM

Query:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1HPU4 uncharacterized protein LOC1114666061.71e-12683.06Show/hide
Query:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQPETFGIL
        ++RFRHRKS  +ERFL S SSP+ R  NP    T+A     D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQH KGFPQ ETFGIL
Subjt:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQH-KGFPQPETFGIL

Query:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEMLPPHEFV
        AALPENEASSSLR+SS+FYHKAS+S SSSSSSPSSSRMIPTIPKPPLERLPL IS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLPPHE V
Subjt:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEMLPPHEFV

Query:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G11700.1 Protein of unknown function, DUF5849.8e-1348.84Show/hide
Query:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEFVARSLAQSPLLS---CSVLEGAGRTLKGRDLRQVRNAVWRRTGF
        SAPVNVP  SK      V+   E D ++ +E  G M+PPHE++A+S  +    S    SV EG GRTLKGR+LR+VR+A+W +TGF
Subjt:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEFVARSLAQSPLLS---CSVLEGAGRTLKGRDLRQVRNAVWRRTGF

AT1G61930.1 Protein of unknown function, DUF5846.8e-1447.13Show/hide
Query:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEFVARSLAQSPLL----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF
        SAPVNVP  SK      V+   ELD +D ++ +  M+PPHE++A+S A+          SV +G GRTLKGR+LR+VR+A+W +TGF
Subjt:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEFVARSLAQSPLL----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF

AT3G15040.1 Protein of unknown function, DUF5842.0e-3751.68Show/hide
Query:  FSSTAAPVNGADD-ENELNEDDVFWTGDFAAESGHHTHSTPSS-SSSSTPRHHIHHLQHKGFPQPETFGILAALPENEASSSLRSSSYFYHK--------
        FSS ++    +D  + ELNEDD+F   D +       HS  SS +   TP   +      G    E  GILAALPE+  SSS   S  F+HK        
Subjt:  FSSTAAPVNGADD-ENELNEDDVFWTGDFAAESGHHTHSTPSS-SSSSTPRHHIHHLQHKGFPQPETFGILAALPENEASSSLRSSSYFYHK--------

Query:  -ASISSSSSSS-------SPSSSRMIPTIPKPPLERLPLPIS--ASLKY-QSAPVNVPIMSKP-VQRHQE----LDV--DDIDEGDGEMLPPHEFVARSL
         +S +SSSSSS       S SS+R IPT PKPP ERLP   S     KY QSAPV VP++S   + RH++     DV  DD +E +GEMLPPHE VARSL
Subjt:  -ASISSSSSSS-------SPSSSRMIPTIPKPPLERLPLPIS--ASLKY-QSAPVNVPIMSKP-VQRHQE----LDV--DDIDEGDGEMLPPHEFVARSL

Query:  AQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        AQS LLSCSVLEGAGRTLKGRDLRQVRNAV+RRTGF+D
Subjt:  AQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G04630.1 Protein of unknown function, DUF5846.1e-1537.5Show/hide
Query:  SSSSSTPRHHIHHLQHKGFPQPETF---GILAALPENEASSSLRS--SSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNV
        S  S    H+   +   G    E F    + + L E E SS       S+F      SSSSSSSSP + R    +             + +K  SAP+NV
Subjt:  SSSSSTPRHHIHHLQHKGFPQPETF---GILAALPENEASSSLRS--SSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNV

Query:  PIMSK----------PVQRHQELDVDDIDEGDGEMLPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        P  SK              H     DD ++ DG M+PPHE+VAR LA++ + S S+ EG GRTLKGRDL +VRNAV  +TGFL+
Subjt:  PIMSK----------PVQRHQELDVDDIDEGDGEMLPPHEFVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G21970.1 Protein of unknown function, DUF5846.8e-1439.86Show/hide
Query:  ENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDI------DEGDGEMLPPHEF
        E E  S LR S     +  +S S++  S SSS     IPK         +S   K  SAP+N+P  SK     ++     +      D+ +G M+PPHE 
Subjt:  ENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDI------DEGDGEMLPPHEF

Query:  VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        VA+ LA++ + S S+ EG GRTLKGRDL + RNAV  RTGFL+
Subjt:  VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACGTCAATGTTGGCTCCGCCGCCCGTTTCCGCCACCGCAAATCCTCATCCACCGAACGATTTCTCGGTTCCCTCTCATCTCCGGCCTCCCGCCATGGAAACCCTAG
CTTCAGCTCCACCGCCGCCCCTGTCAACGGAGCCGACGATGAGAACGAGCTCAACGAGGACGACGTCTTCTGGACCGGCGATTTCGCTGCCGAATCCGGCCACCATACCC
ACTCCACTCCCTCCTCCTCTTCCTCTTCCACTCCTCGCCACCACATCCACCACCTTCAGCACAAGGGTTTCCCCCAGCCGGAGACCTTCGGAATCCTCGCCGCTCTCCCC
GAAAACGAGGCCTCGTCCAGTCTCCGCAGCTCTTCCTATTTCTACCACAAGGCGTCCATTTCCTCCTCGTCGTCTTCTTCCTCCCCTTCGTCTTCCCGTATGATTCCCAC
CATTCCGAAACCTCCTCTGGAACGATTGCCCCTTCCGATTTCTGCCTCGTTGAAGTACCAGTCGGCCCCGGTGAATGTGCCGATAATGTCGAAGCCGGTTCAGAGACACC
AGGAGTTGGACGTGGATGACATTGATGAAGGAGATGGTGAGATGTTGCCGCCGCACGAGTTTGTGGCCAGAAGTTTGGCCCAATCGCCATTGTTGTCATGCTCAGTGCTC
GAGGGCGCAGGAAGGACGTTAAAGGGCAGGGATCTCCGCCAGGTTCGCAACGCAGTTTGGAGACGAACAGGTTTTCTTGAT
mRNA sequenceShow/hide mRNA sequence
ATGGACGTCAATGTTGGCTCCGCCGCCCGTTTCCGCCACCGCAAATCCTCATCCACCGAACGATTTCTCGGTTCCCTCTCATCTCCGGCCTCCCGCCATGGAAACCCTAG
CTTCAGCTCCACCGCCGCCCCTGTCAACGGAGCCGACGATGAGAACGAGCTCAACGAGGACGACGTCTTCTGGACCGGCGATTTCGCTGCCGAATCCGGCCACCATACCC
ACTCCACTCCCTCCTCCTCTTCCTCTTCCACTCCTCGCCACCACATCCACCACCTTCAGCACAAGGGTTTCCCCCAGCCGGAGACCTTCGGAATCCTCGCCGCTCTCCCC
GAAAACGAGGCCTCGTCCAGTCTCCGCAGCTCTTCCTATTTCTACCACAAGGCGTCCATTTCCTCCTCGTCGTCTTCTTCCTCCCCTTCGTCTTCCCGTATGATTCCCAC
CATTCCGAAACCTCCTCTGGAACGATTGCCCCTTCCGATTTCTGCCTCGTTGAAGTACCAGTCGGCCCCGGTGAATGTGCCGATAATGTCGAAGCCGGTTCAGAGACACC
AGGAGTTGGACGTGGATGACATTGATGAAGGAGATGGTGAGATGTTGCCGCCGCACGAGTTTGTGGCCAGAAGTTTGGCCCAATCGCCATTGTTGTCATGCTCAGTGCTC
GAGGGCGCAGGAAGGACGTTAAAGGGCAGGGATCTCCGCCAGGTTCGCAACGCAGTTTGGAGACGAACAGGTTTTCTTGAT
Protein sequenceShow/hide protein sequence
MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQPETFGILAALP
ENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLPPHEFVARSLAQSPLLSCSVL
EGAGRTLKGRDLRQVRNAVWRRTGFLD