; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0001118 (gene) of Snake gourd v1 genome

Gene IDTan0001118
OrganismTrichosanthes anguina (Snake gourd v1)
Descriptionprotein SPEAR1
Genome locationLG08:1293496..1296548
RNA-Seq ExpressionTan0001118
SyntenyTan0001118
Gene Ontology termsGO:0006355 - regulation of transcription, DNA-templated (biological process)
GO:0003700 - DNA-binding transcription factor activity (molecular function)
InterPro domainsIPR040356 - SPEAR family


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_008458547.1 PREDICTED: protein SPEAR1 [Cucumis melo]8.9e-8384.88Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAA-SSFSYSTTQSSS
        MGSGYFGEMN  NI+KRRSGSPAAA    GRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAY H YPNLSA DDMRMQT   S+FSYS+TQSSS
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAA-SSFSYSTTQSSS

Query:  SSSPSYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDS-MHKNMNTKYGSDSIGSSSQNSESSETQELDLE
        SS  SYGFHQNFMGMGEYERGS RY DSQ TT  S+RWDPSNTFLETQHFGQPNM+GHLFN  +QDS +H NMNTKYGSDS+GSSSQNSESSETQELDLE
Subjt:  SSSPSYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDS-MHKNMNTKYGSDSIGSSSQNSESSETQELDLE

Query:  LRLSI
        LRLSI
Subjt:  LRLSI

XP_011648648.1 protein SPEAR1 [Cucumis sativus]9.9e-8283.5Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAAS-SFSYSTTQSSS
        MGSGYFGEMN  NI+KRRSGSP+AA    GRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAY H YPNLSA DD RMQT  + +FSYS+T  SS
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAAS-SFSYSTTQSSS

Query:  SSSP-SYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSM-HKNMNTKYGSDSIGSSSQNSESSETQELDL
        +SSP SYGFHQNFMGMGEYERGS RY DSQ TT  S+RWDPSNTFLETQHFGQPNM+GHLFNP +QDSM HKN+NTKYGSDS+GSSSQNSESSETQELDL
Subjt:  SSSP-SYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSM-HKNMNTKYGSDSIGSSSQNSESSETQELDL

Query:  ELRLSI
        ELRLSI
Subjt:  ELRLSI

XP_022999537.1 protein SPEAR3-like isoform X1 [Cucurbita maxima]3.2e-7277.34Show/hide
Query:  MGSGYFGEMNMG--NIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSS
        MGSGYFGEMNMG  NIDKRRSGS     AA  RRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGH YP LSASDDMR++TA            
Subjt:  MGSGYFGEMNMG--NIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSS

Query:  SSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELR
        SSSSPSYGFHQNFMGMGE+ERGSLR  DSQPTTS+RWDPS+TFLET HFGQPNMTGHLFN  +QDS+  N+N KYGSDS+  S QNSESS   ELDLELR
Subjt:  SSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELR

Query:  LSI
        LSI
Subjt:  LSI

XP_023522169.1 protein SPEAR1-like [Cucurbita pepo subsp. pepo]6.2e-7679.13Show/hide
Query:  MGSGYFGEMNMG--NIDKRRSGSP--AAAAAATGRRGRK-GGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTT
        MGSGYFGEMNMG  NIDKRRSGSP  AAA A   RRGRK GGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMR++TA         
Subjt:  MGSGYFGEMNMG--NIDKRRSGSP--AAAAAATGRRGRK-GGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTT

Query:  QSSSSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDL
           SSSSPSYGFHQNFMGMGE+ERGS  Y DSQP TS+RWDP++TFLETQHFGQPNMTGHLFN  +QDS+H N+N KYGSDS+ SSSQNSESS   ELDL
Subjt:  QSSSSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDL

Query:  ELRLSI
        ELRLSI
Subjt:  ELRLSI

XP_038889470.1 protein SPEAR1-like [Benincasa hispida]1.0e-8686.96Show/hide
Query:  MGSGYFGEMNMG---NIDKRRSGSPA-AAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAY-GHLYPNLSASDDMRMQTAASSFSYSTT
        MGSGYFGEMNMG   NI+KRRSGSPA  AAA TGRRGRKG GGEKPKQPQRGLGVAQLEKIRLHGEMGCAAY GH YPNLSA DDMRMQT A SFSYS+T
Subjt:  MGSGYFGEMNMG---NIDKRRSGSPA-AAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAY-GHLYPNLSASDDMRMQTAASSFSYSTT

Query:  QSSSSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTT-SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELD
        QSSSSS   Y FHQNFMG+GEYERGSLRY DSQPTT S RWDPSNTFLETQHFGQPNMTGHLFNP +QDS+HKNMNTKYGSDS+GSSSQNSESSET+ELD
Subjt:  QSSSSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTT-SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELD

Query:  LELRLSI
        LELRLSI
Subjt:  LELRLSI

TrEMBL top hitse value%identityAlignment
A0A0A0LFV0 SPOROCYTELESS-like EAR-containing protein 14.8e-8283.5Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAAS-SFSYSTTQSSS
        MGSGYFGEMN  NI+KRRSGSP+AA    GRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAY H YPNLSA DD RMQT  + +FSYS+T  SS
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAAS-SFSYSTTQSSS

Query:  SSSP-SYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSM-HKNMNTKYGSDSIGSSSQNSESSETQELDL
        +SSP SYGFHQNFMGMGEYERGS RY DSQ TT  S+RWDPSNTFLETQHFGQPNM+GHLFNP +QDSM HKN+NTKYGSDS+GSSSQNSESSETQELDL
Subjt:  SSSP-SYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSM-HKNMNTKYGSDSIGSSSQNSESSETQELDL

Query:  ELRLSI
        ELRLSI
Subjt:  ELRLSI

A0A1S3C7M3 protein SPEAR14.3e-8384.88Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAA-SSFSYSTTQSSS
        MGSGYFGEMN  NI+KRRSGSPAAA    GRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAY H YPNLSA DDMRMQT   S+FSYS+TQSSS
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAA-SSFSYSTTQSSS

Query:  SSSPSYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDS-MHKNMNTKYGSDSIGSSSQNSESSETQELDLE
        SS  SYGFHQNFMGMGEYERGS RY DSQ TT  S+RWDPSNTFLETQHFGQPNM+GHLFN  +QDS +H NMNTKYGSDS+GSSSQNSESSETQELDLE
Subjt:  SSSPSYGFHQNFMGMGEYERGSLRYRDSQPTT--SIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDS-MHKNMNTKYGSDSIGSSSQNSESSETQELDLE

Query:  LRLSI
        LRLSI
Subjt:  LRLSI

A0A6J1G472 protein SPEAR1-like7.2e-7075.12Show/hide
Query:  MGSGYFGEMNMGN--IDKRRSGSPAAAAAATG--RRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQ
        MGSGYFGEMNMGN  IDKRRSGSP+AAAA     RRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGH YPNLSASDDMR++TA          
Subjt:  MGSGYFGEMNMGN--IDKRRSGSPAAAAAATG--RRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQ

Query:  SSSSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLE
          SSSSPSYGF QNFMG          Y DSQPTTS+RWDP++TFLETQHFGQPNMTGHLFN  +QDS+H N+N KYG DS+ SSSQNSESS   ELDLE
Subjt:  SSSSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLE

Query:  LRLSI
        LRLSI
Subjt:  LRLSI

A0A6J1HQB1 protein SPEAR1-like4.6e-6974.26Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS
        MGSGYFGEMNMGNIDKRRSGSPAAAAA  GRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCA YGH YPNLSA                       
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS

Query:  SSPSYGFHQNFMGMGEYERGSLRYRDSQP-TTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRL
                    GMGEYERGS RY DSQP TTSIRW+ SNT +ETQHFG+PNMTGHL NP++ DSMHKNMNTKYGSDSIGSSSQNSESSET ELDLELRL
Subjt:  SSPSYGFHQNFMGMGEYERGSLRYRDSQP-TTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRL

Query:  SI
        SI
Subjt:  SI

A0A6J1KB48 protein SPEAR3-like isoform X11.5e-7277.34Show/hide
Query:  MGSGYFGEMNMG--NIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSS
        MGSGYFGEMNMG  NIDKRRSGS     AA  RRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGH YP LSASDDMR++TA            
Subjt:  MGSGYFGEMNMG--NIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSS

Query:  SSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELR
        SSSSPSYGFHQNFMGMGE+ERGSLR  DSQPTTS+RWDPS+TFLET HFGQPNMTGHLFN  +QDS+  N+N KYGSDS+  S QNSESS   ELDLELR
Subjt:  SSSSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELR

Query:  LSI
        LSI
Subjt:  LSI

SwissProt top hitse value%identityAlignment
Q6IDB0 Protein SPEAR34.1e-3043.87Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSAS---DDMRMQ-------TAASSF
        MGS +FG   MG      S SP +++++  +RG+   G +KPKQPQRGLGVAQLEKIRLHGE  C ++ + YP+   S   +D+R+Q       +++ SF
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSAS---DDMRMQ-------TAASSF

Query:  SYSTTQSSSSSSPSYGFHQNFM---GMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSES
        SY+   SSS     YGFH N M      +YER ++RY DSQP  +  W+PS   LE+QHF +PN T H         +H++      + S+GS  QN E+
Subjt:  SYSTTQSSSSSSPSYGFHQNFM---GMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSES

Query:  SETQELDLELRL
        SE  ELDLELRL
Subjt:  SETQELDLELRL

Q84X40 Protein SPEAR16.5e-2843.28Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS
        MGS +FG  N+       S   +++++   RRG+K  G EKPKQPQRGLGVAQLEKIRLHGEM C ++    P+L   +D+RMQ   SS         S 
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS

Query:  SSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRLS
        SS  YGF+ N M MG        +RD     ++ W+PS   LE+QH  +PN+T H  N     +  +       S S+GS  Q+S SSE QE+DLELRLS
Subjt:  SSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRLS

Query:  I
        +
Subjt:  I

Arabidopsis top hitse value%identityAlignment
AT2G20080.1 unknown protein4.6e-2943.28Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS
        MGS +FG  N+       S   +++++   RRG+K  G EKPKQPQRGLGVAQLEKIRLHGEM C ++    P+L   +D+RMQ   SS         S 
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS

Query:  SSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRLS
        SS  YGF+ N M MG        +RD     ++ W+PS   LE+QH  +PN+T H  N     +  +       S S+GS  Q+S SSE QE+DLELRLS
Subjt:  SSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRLS

Query:  I
        +
Subjt:  I

AT2G20080.2 unknown protein1.6e-2136.82Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS
        MGS +FG  N+       S   +++++   RRG+K  G EKPKQPQRGLGVAQLEKIRLHGEM C ++    P+L                         
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSS

Query:  SSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRLS
          P  G H                RD     ++ W+PS   LE+QH  +PN+T H  N     +  +       S S+GS  Q+S SSE QE+DLELRLS
Subjt:  SSPSYGFHQNFMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRLS

Query:  I
        +
Subjt:  I

AT4G28840.1 unknown protein2.9e-3143.87Show/hide
Query:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSAS---DDMRMQ-------TAASSF
        MGS +FG   MG      S SP +++++  +RG+   G +KPKQPQRGLGVAQLEKIRLHGE  C ++ + YP+   S   +D+R+Q       +++ SF
Subjt:  MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSAS---DDMRMQ-------TAASSF

Query:  SYSTTQSSSSSSPSYGFHQNFM---GMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSES
        SY+   SSS     YGFH N M      +YER ++RY DSQP  +  W+PS   LE+QHF +PN T H         +H++      + S+GS  QN E+
Subjt:  SYSTTQSSSSSSPSYGFHQNFM---GMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSES

Query:  SETQELDLELRL
        SE  ELDLELRL
Subjt:  SETQELDLELRL


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGGAAGTGGTTATTTTGGGGAGATGAATATGGGGAATATTGATAAGAGGAGGAGTGGGTCGCCGGCGGCGGCGGCGGCGGCGACGGGGAGGAGAGGGAGGAAGGGTGG
CGGCGGAGAGAAACCGAAGCAGCCGCAGAGAGGGTTGGGAGTTGCTCAGTTGGAGAAGATCAGATTGCATGGGGAAATGGGTTGTGCTGCTTATGGCCACTTGTATCCAA
ATCTCTCCGCCAGTGATGATATGAGAATGCAAACAGCAGCTTCTTCTTTTTCTTACTCCACAACTCAATCTTCATCTTCTTCTTCTCCTTCCTATGGCTTCCACCAAAAC
TTTATGGGAATGGGAGAATATGAAAGAGGAAGCTTGAGATATAGGGATTCTCAGCCAACAACTTCTATAAGATGGGACCCAAGTAATACATTCTTGGAGACCCAACATTT
TGGGCAACCAAACATGACTGGACACCTTTTCAATCCTCAAATACAGGATTCAATGCACAAGAACATGAATACAAAATATGGGAGTGATTCAATTGGTTCAAGCAGTCAGA
ATTCTGAATCAAGTGAGACTCAAGAGCTAGATTTGGAGCTGAGATTGTCAATCTAA
mRNA sequenceShow/hide mRNA sequence
AAAAAAGCATAAAATCTAAGTATAAATAACATAAAAATCCTAGAGACAATCTGATCCAGCGATGCAATAATTGTTGGGACTGTGAAAAAGAGCTTAAAAAGAGGGCTTTA
GAGATCTCTGGTTTCTCAGATTGCCGGCCAGCAAAACAAGCCACCCACTTTCTCTCTCTAGTTTTTTTTATTTGTTTCTCTCTCTTTGTTTTTTTTTTTTTGAAGATATA
ATATGGGAAGTGGTTATTTTGGGGAGATGAATATGGGGAATATTGATAAGAGGAGGAGTGGGTCGCCGGCGGCGGCGGCGGCGGCGACGGGGAGGAGAGGGAGGAAGGGT
GGCGGCGGAGAGAAACCGAAGCAGCCGCAGAGAGGGTTGGGAGTTGCTCAGTTGGAGAAGATCAGATTGCATGGGGAAATGGGTTGTGCTGCTTATGGCCACTTGTATCC
AAATCTCTCCGCCAGTGATGATATGAGAATGCAAACAGCAGCTTCTTCTTTTTCTTACTCCACAACTCAATCTTCATCTTCTTCTTCTCCTTCCTATGGCTTCCACCAAA
ACTTTATGGGAATGGGAGAATATGAAAGAGGAAGCTTGAGATATAGGGATTCTCAGCCAACAACTTCTATAAGATGGGACCCAAGTAATACATTCTTGGAGACCCAACAT
TTTGGGCAACCAAACATGACTGGACACCTTTTCAATCCTCAAATACAGGATTCAATGCACAAGAACATGAATACAAAATATGGGAGTGATTCAATTGGTTCAAGCAGTCA
GAATTCTGAATCAAGTGAGACTCAAGAGCTAGATTTGGAGCTGAGATTGTCAATCTAATTAATAAAGTGGGTTTCAATCAATCAATTTCCTACCATTTATATAAATAATT
TATAAATTACTGCACCAATCCTGTAATTTTACCTATTTTATGAACCATGC
Protein sequenceShow/hide protein sequence
MGSGYFGEMNMGNIDKRRSGSPAAAAAATGRRGRKGGGGEKPKQPQRGLGVAQLEKIRLHGEMGCAAYGHLYPNLSASDDMRMQTAASSFSYSTTQSSSSSSPSYGFHQN
FMGMGEYERGSLRYRDSQPTTSIRWDPSNTFLETQHFGQPNMTGHLFNPQIQDSMHKNMNTKYGSDSIGSSSQNSESSETQELDLELRLSI