; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0001030 (gene) of Snake gourd v1 genome

Gene IDTan0001030
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionProtein of unknown function, DUF584
Genome locationLG05:52903672..52905287
RNA-Seq ExpressionTan0001030
SyntenyTan0001030
Gene Ontology termsGO:0003677 - DNA binding (molecular function)
InterPro domainsIPR007608 - Senescence regulator S40


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KGN64943.1 hypothetical protein Csa_022813 [Cucumis sativus]2.4e-11190.04Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL
        MDLNLPSSRFRHR SPSSE FLASFPSP  R SNPSST  LDDD+ELNEDDVFWTGDFA+DS HH+HSTPSSSSSSTPRHHIHHLQHHKGFP PETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL

Query:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA
        AALPENEA SSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPL+R  LPIS+SLKYQSAPVNVP+MSKA VQR  E+DV+DVDE DGEMLPPHEIVA
Subjt:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022945942.1 uncharacterized protein LOC111450033 [Cucurbita moschata]9.2e-11190.16Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDD---NELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETF
        MDL  PSSRFRHRKSPSSE FL SF SP+ RPSNP+S N LD+D   +ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQ ETF
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDD---NELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETF

Query:  GILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHE
        GILAALPENEA SSLRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPLER  LPISSSLKYQSAPVNVPMMSK AVQRHQEIDV+DVDE DGEMLPPHE
Subjt:  GILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        IVARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_022967102.1 uncharacterized protein LOC111466606 [Cucurbita maxima]8.3e-11290.95Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDN--ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFG
        M+L+ PSSRFRHRKSP SE FL SF SP+ RPSNP+S N LDDDN  ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQ ETFG
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDN--ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFG

Query:  ILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP--ISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHEI
        ILAALPENEA SSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP  ISSSLKYQSAPVNVPMMSK AVQRHQEIDV+DVDE DGEMLPPHEI
Subjt:  ILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP--ISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHEI

Query:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_023522766.1 uncharacterized protein LOC111786770 [Cucurbita pepo subsp. pepo]7.8e-11090.53Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDN--ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFG
        MDL  PSSRFRHRKSPSSE FL SF SP+ RPSNP+S N LDDDN  ELNEDDVFWTGDFAADS HHTHSTPSSSSSSTPRHHIHHLQHHK FPQ ETFG
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDN--ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFG

Query:  ILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHEI
        ILAALPENEA SSLRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPLER  LPISSSLKYQSAPVNVPMMSK AVQRHQEIDV+DVDE DGEMLPPHEI
Subjt:  ILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHEI

Query:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

XP_038894579.1 uncharacterized protein LOC120083099 [Benincasa hispida]7.5e-11391.7Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL
        MDLNLPS RFRHRKSPSSE FLASF SP  R +NPSSTNG+DDD ELNEDDVFWTGDFAADSAHH+HSTPSSSSSSTPRHHIHHLQHHKGFP PETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL

Query:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA
        AALPENEA SSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER  LPISSSLKYQSAPVNVP+MSKA VQR QEIDV+DVDE DGEMLPPHEIVA
Subjt:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        RSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

TrEMBL top hitse value%identityAlignment
A0A0A0LT40 Uncharacterized protein1.2e-11190.04Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL
        MDLNLPSSRFRHR SPSSE FLASFPSP  R SNPSST  LDDD+ELNEDDVFWTGDFA+DS HH+HSTPSSSSSSTPRHHIHHLQHHKGFP PETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL

Query:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA
        AALPENEA SSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPL+R  LPIS+SLKYQSAPVNVP+MSKA VQR  E+DV+DVDE DGEMLPPHEIVA
Subjt:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A1S4E4F1 uncharacterized protein LOC1034998841.4e-10989.21Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL
        MDLNL SSRFRHR SPSSE FLASFPSP  R SNPSST  LDDD+ELNEDDVFWTGDFA+DS HH+HSTPSSSSSSTPRHHIHHLQHHKGFP PETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL

Query:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA
        AALPENEA SSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPL+R  LPIS+SLKYQSAPVNVP+MSKA VQR  E+DV+ VDE DGEMLPPHEIVA
Subjt:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A5A7SY45 Senescence regulator1.4e-10989.21Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL
        MDLNL SSRFRHR SPSSE FLASFPSP  R SNPSST  LDDD+ELNEDDVFWTGDFA+DS HH+HSTPSSSSSSTPRHHIHHLQHHKGFP PETFGIL
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGIL

Query:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA
        AALPENEA SSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPL+R  LPIS+SLKYQSAPVNVP+MSKA VQR  E+DV+ VDE DGEMLPPHEIVA
Subjt:  AALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSKA-VQRHQEIDVEDVDEGDGEMLPPHEIVA

Query:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  RSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1G2B0 uncharacterized protein LOC1114500334.4e-11190.16Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDD---NELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETF
        MDL  PSSRFRHRKSPSSE FL SF SP+ RPSNP+S N LD+D   +ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQ ETF
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDD---NELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETF

Query:  GILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHE
        GILAALPENEA SSLRNSS+FYHKASVSSSSSSSPSSSRMIPTIPKPPLER  LPISSSLKYQSAPVNVPMMSK AVQRHQEIDV+DVDE DGEMLPPHE
Subjt:  GILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLER--LPISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        IVARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

A0A6J1HPU4 uncharacterized protein LOC1114666064.0e-11290.95Show/hide
Query:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDN--ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFG
        M+L+ PSSRFRHRKSP SE FL SF SP+ RPSNP+S N LDDDN  ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQ ETFG
Subjt:  MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDN--ELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFG

Query:  ILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP--ISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHEI
        ILAALPENEA SSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP  ISSSLKYQSAPVNVPMMSK AVQRHQEIDV+DVDE DGEMLPPHEI
Subjt:  ILAALPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLP--ISSSLKYQSAPVNVPMMSK-AVQRHQEIDVEDVDEGDGEMLPPHEI

Query:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        VARSLAQSP+LSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
Subjt:  VARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G61930.1 Protein of unknown function, DUF5841.5e-1347.13Show/hide
Query:  SAPVNVPMMSK-----AVQRHQEIDVEDVDEGDGEMLPPHEIVARSLAQSPML----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF
        SAPVNVP  SK     +V+   E+D ED ++ +  M+PPHE +A+S A+          SV +G GRTLKGR+LR+VR+A+W +TGF
Subjt:  SAPVNVPMMSK-----AVQRHQEIDVEDVDEGDGEMLPPHEIVARSLAQSPML----SCSVLEGAGRTLKGRDLRQVRNAVWRRTGF

AT3G15040.1 Protein of unknown function, DUF5843.4e-3951.67Show/hide
Query:  SNPSSTNGLDD--DNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHH--IHHLQHHK-GFPQPETFGILAALPENEAPSSLRNSSHFYHK------
        S+PSS   + D  D ELNEDD+     FA D +H       S  SS  +       LQ  K G    E  GILAALPE+   SS   S  F+HK      
Subjt:  SNPSSTNGLDD--DNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHH--IHHLQHHK-GFPQPETFGILAALPENEAPSSLRNSSHFYHK------

Query:  ----ASVSSSSSS-------SPSSSRMIPTIPKPPLERLPISSSL----KY-QSAPVNVPMMSKA-VQRHQ------EIDVEDVDEGDGEMLPPHEIVAR
            ++ SSSSSS       S SS+R IPT PKPP ERLP S+S     KY QSAPV VP++S A + RH+      ++  +D +E +GEMLPPHEIVAR
Subjt:  ----ASVSSSSSS-------SPSSSRMIPTIPKPPLERLPISSSL----KY-QSAPVNVPMMSKA-VQRHQ------EIDVEDVDEGDGEMLPPHEIVAR

Query:  SLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        SLAQS +LSCSVLEGAGRTLKGRDLRQVRNAV+RRTGF+D
Subjt:  SLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT3G45210.1 Protein of unknown function, DUF5843.0e-1135.29Show/hide
Query:  LPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPISSSLKYQSAPVNVPMMSKAVQRHQEIDVEDVDEGDGEMLPPHEIVARSLAQ
        LP +   +   +S   + ++ + S+ S SP   R + T  +       ++++    S P+NV   SK + +     +E+ D+G    LPPHE     LA+
Subjt:  LPENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPISSSLKYQSAPVNVPMMSKAVQRHQEIDVEDVDEGDGEMLPPHEIVARSLAQ

Query:  SPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        + M S SV EG GRTLKGRD+ +VRNA+  +TGFLD
Subjt:  SPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G04630.1 Protein of unknown function, DUF5845.3e-1642.36Show/hide
Query:  ENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPISSSLKYQSAPVNVPMMSK----------AVQRHQEIDVEDVDEGDGEMLPPHE
        E  +P      SHF    S SSSSSSSP + R    +           S +K  SAP+NVP  SK          +   H     +D ++ DG M+PPHE
Subjt:  ENEAPSSLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPISSSLKYQSAPVNVPMMSK----------AVQRHQEIDVEDVDEGDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
         VAR LA++ + S S+ EG GRTLKGRDL +VRNAV  +TGFL+
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD

AT4G21970.1 Protein of unknown function, DUF5841.7e-1440.28Show/hide
Query:  ENEAPSSLRNSSHFYHKASVSSS----SSSSPSSSRMIPTIPKPPLERLPISSSLKYQSAPVNVPMMSKAVQRHQEIDVEDV------DEGDGEMLPPHE
        E E  S LR S     +  +S S    S+SS SS+R IP       +   +S   K  SAP+N+P  SK     ++     +      D+ +G M+PPHE
Subjt:  ENEAPSSLRNSSHFYHKASVSSS----SSSSPSSSRMIPTIPKPPLERLPISSSLKYQSAPVNVPMMSKAVQRHQEIDVEDV------DEGDGEMLPPHE

Query:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD
        +VA+ LA++ + S S+ EG GRTLKGRDL + RNAV  RTGFL+
Subjt:  IVARSLAQSPMLSCSVLEGAGRTLKGRDLRQVRNAVWRRTGFLD


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACCTCAACCTTCCTTCCTCCCGTTTCCGCCACCGCAAATCCCCCTCCTCCGAACACTTTCTCGCCTCCTTCCCTTCTCCGGCCGCCCGCCCTTCAAACCCTAGCTC
CACCAACGGCCTCGACGACGATAACGAGCTCAATGAGGACGACGTCTTCTGGACCGGCGATTTCGCTGCCGATTCCGCCCACCATACCCACTCCACTCCCTCCTCCTCCT
CCTCTTCTACTCCTCGTCACCATATTCATCACCTTCAGCATCACAAGGGTTTTCCCCAGCCCGAGACCTTCGGAATCCTCGCTGCGCTCCCCGAGAACGAGGCGCCCTCC
AGTCTTCGGAACTCTTCGCATTTCTATCACAAGGCCTCTGTTTCCTCCTCCTCCTCTTCGTCCCCTTCGTCTTCTCGGATGATTCCGACGATCCCTAAACCTCCTCTCGA
GCGATTGCCGATTTCTTCCTCCTTGAAGTACCAGTCGGCTCCGGTCAATGTCCCTATGATGTCGAAGGCGGTTCAGAGACACCAAGAGATAGATGTGGAGGATGTTGATG
AAGGAGATGGGGAGATGTTGCCGCCGCATGAAATTGTGGCCAGAAGTTTGGCTCAATCGCCAATGTTGTCTTGCTCCGTGCTTGAGGGAGCAGGAAGGACGTTAAAGGGC
AGGGATCTTCGCCAGGTTCGCAATGCTGTTTGGAGACGAACAGGTTTTCTTGATTAA
mRNA sequenceShow/hide mRNA sequence
TTATTCCAATAGATTTTGATTTGGATTCTTTTAACGATCCTATCTCTATTTCCAAAAAGTAAACCAAGACCTCCTTCTTCTTATTGCCCTTTTGTCTACAAAATTCGCGT
CATATAAAATTGGGAAAAAAAAAAAAAGAAAAAGAACCCTGCGTCCCTCTCACGGATTGGACGACGGCGGCTGTATTCCTTCTGTTCTGAAACTCTGATTTTCATACGGA
CCCGCCATTGCCATTGCCATTGCCATTGCCATTGCCATTCCTATGGACCTCAACCTTCCTTCCTCCCGTTTCCGCCACCGCAAATCCCCCTCCTCCGAACACTTTCTCGC
CTCCTTCCCTTCTCCGGCCGCCCGCCCTTCAAACCCTAGCTCCACCAACGGCCTCGACGACGATAACGAGCTCAATGAGGACGACGTCTTCTGGACCGGCGATTTCGCTG
CCGATTCCGCCCACCATACCCACTCCACTCCCTCCTCCTCCTCCTCTTCTACTCCTCGTCACCATATTCATCACCTTCAGCATCACAAGGGTTTTCCCCAGCCCGAGACC
TTCGGAATCCTCGCTGCGCTCCCCGAGAACGAGGCGCCCTCCAGTCTTCGGAACTCTTCGCATTTCTATCACAAGGCCTCTGTTTCCTCCTCCTCCTCTTCGTCCCCTTC
GTCTTCTCGGATGATTCCGACGATCCCTAAACCTCCTCTCGAGCGATTGCCGATTTCTTCCTCCTTGAAGTACCAGTCGGCTCCGGTCAATGTCCCTATGATGTCGAAGG
CGGTTCAGAGACACCAAGAGATAGATGTGGAGGATGTTGATGAAGGAGATGGGGAGATGTTGCCGCCGCATGAAATTGTGGCCAGAAGTTTGGCTCAATCGCCAATGTTG
TCTTGCTCCGTGCTTGAGGGAGCAGGAAGGACGTTAAAGGGCAGGGATCTTCGCCAGGTTCGCAATGCTGTTTGGAGACGAACAGGTTTTCTTGATTAAGGAATTGAATT
GCTGTAATTACCTTTGGAGAACAGATTTGCTTACTTCGTCTTTTTGACAATATTCGATAAGCTGCGCGTGTCCGGTTCACTTTGACGACTATTTGTGTCGCTCTTTTTAG
AACATTGAGGGTCCAGGAATATTCGAGTCTGCTTGACACTCATCGTAAGAAGGAATTGGAATTGGAATTGTACTTATCTGAAGGGCGTCTAAGATTTTACTTTGAAGCTT
ATTTTTGTAAGTTTGACTGTTATCTGAAAATATTTTTCAATCTATCATTATTAAATTCTAGTAAAGTTGTTAGATTTGCATCTACTTCTTTCAGTATGAAGGTCATTTTT
TTGCCACTCGTCTTCCATTACAATAGTTCAACCGAAGTCGGGGGATTCTTCATAAGACCATTGGCACAAGCTGTGTAAAGAATAAACTTCAGAAAAAGAAGTCCCAAATG
GAGTGTGTTTAATTTGATTCATTGTATCCACTATAGGAGAGGGGTTTACCATTCTGTTTATAATTGGGAGCTCAGTTACACTTAACGAGGTCATATAAGGCGTCATTAAA
CACTTCATACTACAGGCACAATTTATTTCCCTTTCCGTGATTTGACTGAATTTATTAATATCACACTAGTTGTAGC
Protein sequenceShow/hide protein sequence
MDLNLPSSRFRHRKSPSSEHFLASFPSPAARPSNPSSTNGLDDDNELNEDDVFWTGDFAADSAHHTHSTPSSSSSSTPRHHIHHLQHHKGFPQPETFGILAALPENEAPS
SLRNSSHFYHKASVSSSSSSSPSSSRMIPTIPKPPLERLPISSSLKYQSAPVNVPMMSKAVQRHQEIDVEDVDEGDGEMLPPHEIVARSLAQSPMLSCSVLEGAGRTLKG
RDLRQVRNAVWRRTGFLD