; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Carg23329 (gene) of Silver-seed gourd (SMH-JMG-627) v2 genome

Gene IDCarg23329
OrganismCucurbita argyrosperma subsp. argyrosperma cv. SMH-JMG-627 (Silver-seed gourd (SMH-JMG-627) v2)
DescriptionHNHc domain-containing protein
Genome locationCarg_Chr06:10456240..10459561
RNA-Seq ExpressionCarg23329
SyntenyCarg23329
Gene Ontology termsGO:0090305 - nucleic acid phosphodiester bond hydrolysis (biological process)
GO:0004519 - endonuclease activity (molecular function)
InterPro domainsIPR003615 - HNH nuclease
IPR029471 - HNH endonuclease 5


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6597719.1 hypothetical protein SDJN03_10899, partial [Cucurbita argyrosperma subsp. sororia]1.5e-152100Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
        MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF

Query:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
        RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
Subjt:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV

Query:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

XP_008465340.1 PREDICTED: uncharacterized protein LOC103502982 [Cucumis melo]2.1e-13087.99Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVS-GDDAILDIDYDYEFES
        MAQFTAHSRVKLLLNGDG+P GSE KDR R KLRS+R   RR PLS  SS     S+SS SALRKS Q     RVGVR ESV+ GDDAI+  DYDYEFES
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVS-GDDAILDIDYDYEFES

Query:  DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTI
        DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNILYRDNYTCQYCSSHESLTI
Subjt:  DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTI

Query:  DHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        DHVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  DHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

XP_022152374.1 uncharacterized protein LOC111020122 [Momordica charantia]8.4e-13288.3Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESD
        MAQFT  +RVKLLLNGDGVPFGSE KDR R KLRS+    RR PLS A+STG+SPS+SSASALRKSAQ     RVGVR ESVS D AI+ +D DYEFESD
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESD

Query:  DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTID
        DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNILYRDNYTCQYCSSH+SLTID
Subjt:  DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTID

Query:  HVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        HVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLS+EQ
Subjt:  HVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

XP_022932702.1 uncharacterized protein LOC111439170 [Cucurbita moschata]1.2e-15199.28Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
        MAQFTAHSRVKLLLNGDGVPFGSEPKDRSR KLRS+RTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF

Query:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
        RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
Subjt:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV

Query:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

XP_038905692.1 uncharacterized protein LOC120091663 [Benincasa hispida]2.2e-14091.84Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESD
        MAQFTAHSRVKLLLNGDGVPFGSEPKDR R KLR +RTLKRR PLSG      SPS+SSASALRKSAQ     RVGVRGESVSGDDAI+D+DYDYEFE+D
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESD

Query:  DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTID
        DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNILYRDNYTCQYCSSHESLTID
Subjt:  DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTID

Query:  HVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        HVLP+SRGGEWTWENLVAACV+CNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  HVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

TrEMBL top hitse value%identityAlignment
A0A1S3CNK0 uncharacterized protein LOC1035029821.0e-13087.99Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVS-GDDAILDIDYDYEFES
        MAQFTAHSRVKLLLNGDG+P GSE KDR R KLRS+R   RR PLS  SS     S+SS SALRKS Q     RVGVR ESV+ GDDAI+  DYDYEFES
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVS-GDDAILDIDYDYEFES

Query:  DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTI
        DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNILYRDNYTCQYCSSHESLTI
Subjt:  DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTI

Query:  DHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        DHVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  DHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

A0A5D3E2H2 HNH endonuclease1.0e-13087.99Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVS-GDDAILDIDYDYEFES
        MAQFTAHSRVKLLLNGDG+P GSE KDR R KLRS+R   RR PLS  SS     S+SS SALRKS Q     RVGVR ESV+ GDDAI+  DYDYEFES
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVS-GDDAILDIDYDYEFES

Query:  DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTI
        DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNILYRDNYTCQYCSSHESLTI
Subjt:  DDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTI

Query:  DHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        DHVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  DHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

A0A6J1DFU6 uncharacterized protein LOC1110201224.1e-13288.3Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESD
        MAQFT  +RVKLLLNGDGVPFGSE KDR R KLRS+    RR PLS A+STG+SPS+SSASALRKSAQ     RVGVR ESVS D AI+ +D DYEFESD
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESD

Query:  DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTID
        DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNILYRDNYTCQYCSSH+SLTID
Subjt:  DLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTID

Query:  HVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        HVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLS+EQ
Subjt:  HVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

A0A6J1F2H9 uncharacterized protein LOC1114391706.0e-15299.28Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
        MAQFTAHSRVKLLLNGDGVPFGSEPKDRSR KLRS+RTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF

Query:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
        RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
Subjt:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV

Query:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

A0A6J1IAG4 uncharacterized protein LOC1114707256.0e-15299.28Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
        MAQFTAHSRVKLLLNGDGVPFGSEPKDRSR KLRS+RTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACF

Query:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
        RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV
Subjt:  RGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPV

Query:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
        SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ
Subjt:  SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT2G23840.1 HNH endonuclease5.3e-9262.81Show/hide
Query:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYD---YEFESDD-
        MA F+A  R+KLL + DG+ FG + +D+ RQ   SL      +PL     + L   +   S+     +R  +R   +   +  LDID D   ++F+ DD 
Subjt:  MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYD---YEFESDD-

Query:  -------LACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSH
               L+CFRGLVLDISYRPVNVVCWKRAICLE+M+KADVLEYYDQTVSSP+GSFYIPAVLRVPHLLQVVKRRR+K SLSRKNIL RD+YTCQYCSS 
Subjt:  -------LACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSH

Query:  ESLTIDHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLS
        E+LTIDHV+PVSRGGEWTW+NLVAAC +CNS+KGQKT +EA+MKL K PK PKDYDI+AIPLT+ AI+ML+  KG PEEWRQYL+
Subjt:  ESLTIDHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCCCAATTCACCGCACACAGTCGGGTTAAGTTGTTGCTCAACGGAGACGGAGTGCCATTCGGTTCAGAACCAAAAGATCGTTCGAGACAAAAGCTCAGATCACTACG
AACCCTTAAGCGAAGAACTCCTTTATCCGGTGCCTCCTCCACTGGACTTTCCCCTTCGTCGTCCTCGGCTTCAGCTTTGAGGAAATCCGCTCAGCGTGTCGGTGTGAGGG
GTGAGAGCGTTAGCGGAGACGACGCCATTCTTGATATTGACTATGATTACGAGTTTGAGAGCGACGATCTGGCTTGCTTCAGAGGTCTCGTCTTGGATATTTCCTACAGG
CCAGTTAACGTTGTTTGTTGGAAGCGTGCAATTTGTTTGGAGTTCATGGAGAAGGCTGATGTATTGGAATACTATGACCAGACTGTGAGTTCTCCAAGTGGATCCTTCTA
TATACCAGCAGTCTTAAGGGTTCCTCATTTATTGCAAGTTGTAAAGAGAAGAAGAATCAAGCAGTCTTTGAGTCGTAAAAACATCCTTTATCGGGACAATTACACTTGTC
AGTATTGTTCATCACATGAGAGTTTGACGATTGACCATGTTTTGCCCGTGTCTCGGGGTGGAGAATGGACATGGGAAAATCTGGTGGCCGCCTGCGTGAAATGCAATTCA
AAGAAAGGGCAAAAAACTGTTGAAGAAGCAAATATGAAGCTGAAAAAGACTCCCAAGGCACCAAAAGATTATGACATACTTGCCATTCCTCTAACCAGTACCGCAATAAA
GATGTTGAAACTCAGGAAGGGGACCCCTGAAGAATGGCGTCAATATCTGTCGAGTGAGCAATGA
mRNA sequenceShow/hide mRNA sequence
ATGGCCCAATTCACCGCACACAGTCGGGTTAAGTTGTTGCTCAACGGAGACGGAGTGCCATTCGGTTCAGAACCAAAAGATCGTTCGAGACAAAAGCTCAGATCACTACG
AACCCTTAAGCGAAGAACTCCTTTATCCGGTGCCTCCTCCACTGGACTTTCCCCTTCGTCGTCCTCGGCTTCAGCTTTGAGGAAATCCGCTCAGCGTGTCGGTGTGAGGG
GTGAGAGCGTTAGCGGAGACGACGCCATTCTTGATATTGACTATGATTACGAGTTTGAGAGCGACGATCTGGCTTGCTTCAGAGGTCTCGTCTTGGATATTTCCTACAGG
CCAGTTAACGTTGTTTGTTGGAAGCGTGCAATTTGTTTGGAGTTCATGGAGAAGGCTGATGTATTGGAATACTATGACCAGACTGTGAGTTCTCCAAGTGGATCCTTCTA
TATACCAGCAGTCTTAAGGGTTCCTCATTTATTGCAAGTTGTAAAGAGAAGAAGAATCAAGCAGTCTTTGAGTCGTAAAAACATCCTTTATCGGGACAATTACACTTGTC
AGTATTGTTCATCACATGAGAGTTTGACGATTGACCATGTTTTGCCCGTGTCTCGGGGTGGAGAATGGACATGGGAAAATCTGGTGGCCGCCTGCGTGAAATGCAATTCA
AAGAAAGGGCAAAAAACTGTTGAAGAAGCAAATATGAAGCTGAAAAAGACTCCCAAGGCACCAAAAGATTATGACATACTTGCCATTCCTCTAACCAGTACCGCAATAAA
GATGTTGAAACTCAGGAAGGGGACCCCTGAAGAATGGCGTCAATATCTGTCGAGTGAGCAATGACGTACACTCATAATGGCACTTGTAAATTCTTCTTTGAACAAATTGC
ACATATCATACATACACTTGTTTCTTCTAATACTTCGGCACCTTCAAACTAATTTATTCTATCATTACTCCCACAAGCATTTTGCATTTTGCTTCTTAATTTGGATTGAT
TTTCTAAAACATACTTTAGAAAAATTAAGTTTGA
Protein sequenceShow/hide protein sequence
MAQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSASALRKSAQRVGVRGESVSGDDAILDIDYDYEFESDDLACFRGLVLDISYR
PVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNILYRDNYTCQYCSSHESLTIDHVLPVSRGGEWTWENLVAACVKCNS
KKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ