; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS002833 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS002833
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
DescriptionProtein of unknown function, DUF584
Genome locationscaffold359:66222..66962
RNA-Seq ExpressionMS002833
SyntenyMS002833
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsIPR007608 - Senescence regulator S40


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022142671.1 homeobox protein vnd-like [Momordica charantia]1.6e-12999.6Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
        MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP

Query:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
        ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
Subjt:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP

Query:  PHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022945942.1 uncharacterized protein LOC111450033 [Cucurbita moschata]1.5e-10084.3Show/hide
Query:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL
        ++RFRHRKS S+ERFL S SSP+ R  NP   ++A  ++  D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQ HKGFPQ ETFGIL
Subjt:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL

Query:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV
        AALPENEASSSLR+SSYFYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLPPHEIV
Subjt:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV

Query:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022967102.1 uncharacterized protein LOC111466606 [Cucurbita maxima]2.4e-9883.47Show/hide
Query:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL
        ++RFRHRKS  +ERFL S SSP+ R  NP    T+A     D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQ HKGFPQ ETFGIL
Subjt:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL

Query:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV
        AALPENEASSSLR+SS+FYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLPL IS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLPPHEIV
Subjt:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV

Query:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_023522766.1 uncharacterized protein LOC111786770 [Cucurbita pepo subsp. pepo]1.7e-9984.3Show/hide
Query:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL
        ++RFRHRKS S+ERFL S SSP+ R  NP    T+A     D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQ HK FPQ ETFGIL
Subjt:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL

Query:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV
        AALPENEASSSLR+SSYFYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLPPHEIV
Subjt:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV

Query:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_038894579.1 uncharacterized protein LOC120083099 [Benincasa hispida]6.8e-10183.53Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQ
        MD+N+ S  RFRHRKS S+ERFL S  SP  R  NPS        NG DD+ ELNEDDVFWTGDFAA+S HH+HSTPSSSSSSTPRHHIHHLQ HKGFP 
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM
        PETFGILAALPENEASSSLR+SS+FYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVPIMSK  VQR QE+DVDD+DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM

Query:  LPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

TrEMBL top hitse value%identityAlignment
A0A0A0LT40 Uncharacterized protein7.6e-9881.93Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQ
        MD+N+ S +RFRHR S S+ERFL S  SP  R  NPS S+TA      DD++ELNEDDVFWTGDFA++S HH+HSTPSSSSSSTPRHHIHHLQ HKGFP 
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM
        PETFGILAALPENEASSSLR+SS+FYHKAS+ SSSSSSSPSSSRMIPTIPKPPL+RLPLPIS SLKYQSAPVNVPIMSK  VQR  E+DVDD+DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM

Query:  LPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHEIVARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A1S4E4F1 uncharacterized protein LOC1034998841.1e-9681.53Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQ
        MD+N+ S +RFRHR S S+ERFL S  SP  R  NPS S+TA      DD++ELNEDDVFWTGDFA++S HH+HSTPSSSSSSTPRHHIHHLQ HKGFP 
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQ

Query:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM
        PETFGILAALPENEASSSLR+SS+FYHKAS+ SSSSSSSPSSSRMIPTIPKPPL+RLPLPIS SLKYQSAPVNVPIMSK  VQR  E+DVD +DE DGEM
Subjt:  PETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKP-VQRHQELDVDDIDEGDGEM

Query:  LPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        LPPHEIVARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  LPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1CMW3 homeobox protein vnd-like7.6e-13099.6Show/hide
Query:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
        MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP
Subjt:  MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQP

Query:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
        ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP
Subjt:  ETFGILAALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLP

Query:  PHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        PHE VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  PHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1G2B0 uncharacterized protein LOC1114500337.4e-10184.3Show/hide
Query:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL
        ++RFRHRKS S+ERFL S SSP+ R  NP   ++A  ++  D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQ HKGFPQ ETFGIL
Subjt:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL

Query:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV
        AALPENEASSSLR+SSYFYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLPLPIS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLPPHEIV
Subjt:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV

Query:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1HPU4 uncharacterized protein LOC1114666061.2e-9883.47Show/hide
Query:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL
        ++RFRHRKS  +ERFL S SSP+ R  NP    T+A     D+ +ELNEDDVFWTGDFAA+S HHTHSTPSSSSSSTPRHHIHHLQ HKGFPQ ETFGIL
Subjt:  AARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQ-HKGFPQPETFGIL

Query:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV
        AALPENEASSSLR+SS+FYHKAS+ SSSSSSSPSSSRMIPTIPKPPLERLPL IS+SLKYQSAPVNVP+MSK  VQRHQE+DVDD+DE DGEMLPPHEIV
Subjt:  AALPENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSK-PVQRHQELDVDDIDEGDGEMLPPHEIV

Query:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  ARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G11700.1 Protein of unknown function, DUF5843.7e-1248.84Show/hide
Query:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEIVARSLAQSPLLS---CSVLEGAGRTLKGRDLRQVRNAVWRRTGF
        SAPVNVP  SK      V+   E D ++ +E  G M+PPHE +A+S  +    S    SV EG GRTLKGR+LR+VR+A+W +TGF
Subjt:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEIVARSLAQSPLLS---CSVLEGAGRTLKGRDLRQVRNAVWRRTGF

AT1G61930.1 Protein of unknown function, DUF5842.6e-1347.13Show/hide
Query:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEIVARSLAQSPLL----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF
        SAPVNVP  SK      V+   ELD +D ++ +  M+PPHE +A+S A+          SV +G GRTLKGR+LR+VR+A+W +TGF
Subjt:  SAPVNVPIMSK-----PVQRHQELDVDDIDEGDGEMLPPHEIVARSLAQSPLL----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF

AT3G15040.1 Protein of unknown function, DUF5848.8e-3852.1Show/hide
Query:  FSSTAAPVNGADD-ENELNEDDVFWTGDFAAESGHHTHSTPSS-SSSSTPRHHIHHLQHKGFPQPETFGILAALPENEASSSLRSSSYFYHK--------
        FSS ++    +D  + ELNEDD+F   D +       HS  SS +   TP   +      G    E  GILAALPE+  SSS   S  F+HK        
Subjt:  FSSTAAPVNGADD-ENELNEDDVFWTGDFAAESGHHTHSTPSS-SSSSTPRHHIHHLQHKGFPQPETFGILAALPENEASSSLRSSSYFYHK--------

Query:  -ASISSSSSSS-------SPSSSRMIPTIPKPPLERLPLPIS--ASLKY-QSAPVNVPIMSKP-VQRHQE----LDV--DDIDEGDGEMLPPHEIVARSL
         +S +SSSSSS       S SS+R IPT PKPP ERLP   S     KY QSAPV VP++S   + RH++     DV  DD +E +GEMLPPHEIVARSL
Subjt:  -ASISSSSSSS-------SPSSSRMIPTIPKPPLERLPLPIS--ASLKY-QSAPVNVPIMSKP-VQRHQE----LDV--DDIDEGDGEMLPPHEIVARSL

Query:  AQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        AQS LLSCSVLEGAGRTLKGRDLRQVRNAV+RRTGF+D
Subjt:  AQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G04630.1 Protein of unknown function, DUF5842.3e-1437.5Show/hide
Query:  SSSSSTPRHHIHHLQHKGFPQPETF---GILAALPENEASSSLRS--SSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNV
        S  S    H+   +   G    E F    + + L E E SS       S+F      SSSSSSSSP + R    +             + +K  SAP+NV
Subjt:  SSSSSTPRHHIHHLQHKGFPQPETF---GILAALPENEASSSLRS--SSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNV

Query:  PIMSK----------PVQRHQELDVDDIDEGDGEMLPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        P  SK              H     DD ++ DG M+PPHE VAR LA++ + S S+ EG GRTLKGRDL +VRNAV  +TGFL+
Subjt:  PIMSK----------PVQRHQELDVDDIDEGDGEMLPPHEIVARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G21970.1 Protein of unknown function, DUF5845.2e-1439.86Show/hide
Query:  ENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDI------DEGDGEMLPPHEI
        E E  S LR S     +  +S S++  S SSS     IPK         +S   K  SAP+N+P  SK     ++     +      D+ +G M+PPHE+
Subjt:  ENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDI------DEGDGEMLPPHEI

Query:  VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        VA+ LA++ + S S+ EG GRTLKGRDL + RNAV  RTGFL+
Subjt:  VARSLAQSPLLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACGTCAATGTTGGCTCCGCCGCCCGTTTCCGCCACCGCAAATCCTCATCCACCGAACGATTTCTCGGTTCCCTCTCATCTCCGGCCTCCCGCCATGGAAACCCTAG
CTTCAGCTCCACCGCCGCCCCTGTCAACGGAGCCGACGATGAGAACGAGCTCAACGAGGACGACGTCTTCTGGACCGGCGATTTCGCTGCCGAATCCGGCCACCATACCC
ACTCCACTCCCTCCTCCTCTTCCTCTTCCACTCCTCGCCACCACATCCACCACCTTCAGCACAAGGGTTTCCCCCAGCCGGAGACCTTCGGAATCCTCGCCGCTCTCCCC
GAAAACGAGGCCTCGTCCAGTCTCCGCAGCTCTTCCTATTTCTACCACAAGGCGTCCATTTCCTCCTCGTCGTCTTCTTCCTCCCCTTCGTCTTCCCGTATGATTCCCAC
CATTCCGAAACCTCCTCTGGAACGATTGCCCCTTCCGATTTCTGCCTCGTTGAAGTACCAGTCGGCCCCGGTGAATGTGCCGATAATGTCGAAGCCGGTTCAGAGACACC
AGGAGTTGGACGTGGATGACATTGATGAAGGAGATGGTGAGATGTTGCCGCCGCACGAGATTGTGGCCAGAAGTTTGGCCCAATCGCCATTGTTGTCATGCTCAGTGCTC
GAGGGCGCAGGAAGGACGTTAAAGGGCAGGGATCTCCGCCAGGTTCGCAACGCAGTTTGGAGACGAACAGGTTTTCTTGAT
mRNA sequenceShow/hide mRNA sequence
ATGGACGTCAATGTTGGCTCCGCCGCCCGTTTCCGCCACCGCAAATCCTCATCCACCGAACGATTTCTCGGTTCCCTCTCATCTCCGGCCTCCCGCCATGGAAACCCTAG
CTTCAGCTCCACCGCCGCCCCTGTCAACGGAGCCGACGATGAGAACGAGCTCAACGAGGACGACGTCTTCTGGACCGGCGATTTCGCTGCCGAATCCGGCCACCATACCC
ACTCCACTCCCTCCTCCTCTTCCTCTTCCACTCCTCGCCACCACATCCACCACCTTCAGCACAAGGGTTTCCCCCAGCCGGAGACCTTCGGAATCCTCGCCGCTCTCCCC
GAAAACGAGGCCTCGTCCAGTCTCCGCAGCTCTTCCTATTTCTACCACAAGGCGTCCATTTCCTCCTCGTCGTCTTCTTCCTCCCCTTCGTCTTCCCGTATGATTCCCAC
CATTCCGAAACCTCCTCTGGAACGATTGCCCCTTCCGATTTCTGCCTCGTTGAAGTACCAGTCGGCCCCGGTGAATGTGCCGATAATGTCGAAGCCGGTTCAGAGACACC
AGGAGTTGGACGTGGATGACATTGATGAAGGAGATGGTGAGATGTTGCCGCCGCACGAGATTGTGGCCAGAAGTTTGGCCCAATCGCCATTGTTGTCATGCTCAGTGCTC
GAGGGCGCAGGAAGGACGTTAAAGGGCAGGGATCTCCGCCAGGTTCGCAACGCAGTTTGGAGACGAACAGGTTTTCTTGAT
Protein sequenceShow/hide protein sequence
MDVNVGSAARFRHRKSSSTERFLGSLSSPASRHGNPSFSSTAAPVNGADDENELNEDDVFWTGDFAAESGHHTHSTPSSSSSSTPRHHIHHLQHKGFPQPETFGILAALP
ENEASSSLRSSSYFYHKASISSSSSSSSPSSSRMIPTIPKPPLERLPLPISASLKYQSAPVNVPIMSKPVQRHQELDVDDIDEGDGEMLPPHEIVARSLAQSPLLSCSVL
EGAGRTLKGRDLRQVRNAVWRRTGFLD