; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lsi03G019800 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome

Gene IDLsi03G019800
OrganismLagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
DescriptionPWWP domain protein
Genome locationchr03:31181355..31187215
RNA-Seq ExpressionLsi03G019800
SyntenyLsi03G019800
Gene Ontology termsGO:0016021 - integral component of membrane (cellular component)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004137983.1 uncharacterized protein LOC101217493 isoform X2 [Cucumis sativus]2.4e-11591.67Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKT QKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLF YSSSI  + T+AL RLSLNEVG SKL+V+HSDNT EELSSSSLVKCSNSL  DE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL
         LSLCSSPDEMQSVEC LS+SSCKAVSKRKGTSKIS+PVGKKLPDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDND+H 
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL

Query:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

XP_008442738.1 PREDICTED: uncharacterized protein LOC103486526 isoform X2 [Cucumis melo]2.5e-11290.48Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKT  KKKGE QSPLIDNIPKYSQQRRSSPPKRRTDFSSLF YSSSI  +  +AL RLSLNEVG SKL+VNHSDNTNEELSSSSLVKCSNSL EDE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL
         LSLCSSPDEMQSVECRLS+SSC    KRKGTSKIS+PVGKKLPDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDND+H 
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL

Query:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

XP_031739028.1 uncharacterized protein LOC101217493 isoform X1 [Cucumis sativus]6.0e-11491.3Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKT QKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLF YSSSI  + T+AL RLSLNEVG SKL+V+HSDNT EELSSSSLVKCSNSL  DE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSC-DKGSSSNSSRIEDNDVH
         LSLCSSPDEMQSVEC LS+SSCKAVSKRKGTSKIS+PVGKKLPDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSC DKGSSSNSSRIEDND+H
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSC-DKGSSSNSSRIEDNDVH

Query:  LDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
         DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  LDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

XP_038905234.1 uncharacterized protein LOC120091323 isoform X1 [Benincasa hispida]3.9e-12193.68Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKTPQ+KKGE Q PL+DNIPKYSQQRRSSPPKRRTDFSSLFCYSSSI   GTSALP+LSLNEVG SKLIVNHSD+TNEELSSSSLVKCSNSLGEDE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSC-DKGSSSNSSRIEDNDVH
        ELSLCSSPDEMQS+ECRLSDSSCKAVSKRKGTSKIS+PVGKK+PDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSC DKGSSSNSSRIEDND+H
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSC-DKGSSSNSSRIEDNDVH

Query:  LDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        LDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  LDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

XP_038905235.1 uncharacterized protein LOC120091323 isoform X2 [Benincasa hispida]1.6e-12294.05Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKTPQ+KKGE Q PL+DNIPKYSQQRRSSPPKRRTDFSSLFCYSSSI   GTSALP+LSLNEVG SKLIVNHSD+TNEELSSSSLVKCSNSLGEDE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL
        ELSLCSSPDEMQS+ECRLSDSSCKAVSKRKGTSKIS+PVGKK+PDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDND+HL
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL

Query:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

TrEMBL top hitse value%identityAlignment
A0A0A0LAN1 Uncharacterized protein1.4e-12176.42Show/hide
Query:  KKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDGSFFTS-------VIQFSKRYLNFLTMAKKRKTPQKKKGEKQS
        K    S S+S S +  +    S+ S    SS+++      S    SSS+SS    +  S F+S          F + YLNFLTMAKKRKT QKKKGEKQS
Subjt:  KKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDGSFFTS-------VIQFSKRYLNFLTMAKKRKTPQKKKGEKQS

Query:  PLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDEELSLCSSPDEMQSVECR
        PLIDNIPKYSQQRRSSPPKRRTDFSSLF YSSSI  + T+AL RLSLNEVG SKL+V+HSDNT EELSSSSLVKCSNSL  DE LSLCSSPDEMQSVEC 
Subjt:  PLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDEELSLCSSPDEMQSVECR

Query:  LSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHLDRGRGKRERKPKVPFDE
        LS+SSCKAVSKRKGTSKIS+PVGKKLPDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDND+H DRGRGKRERKPKVPFDE
Subjt:  LSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHLDRGRGKRERKPKVPFDE

Query:  EMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        EMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  EMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

A0A1S3B734 uncharacterized protein LOC103486526 isoform X21.2e-11290.48Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKT  KKKGE QSPLIDNIPKYSQQRRSSPPKRRTDFSSLF YSSSI  +  +AL RLSLNEVG SKL+VNHSDNTNEELSSSSLVKCSNSL EDE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL
         LSLCSSPDEMQSVECRLS+SSC    KRKGTSKIS+PVGKKLPDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDND+H 
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL

Query:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

A0A5A7TQ68 PWWP domain protein3.0e-11190.12Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKT  KKKGE QSPLIDNIPKYSQQRRSSPPKRRTDFSSLF YSSSI  +  +AL RLSLNEVG SKL+VNHSDNTNEELSSSSLVKCSNSL EDE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSC-DKGSSSNSSRIEDNDVH
         LSLCSSPDEMQSVECRLS+SSC    KRKGTSKIS+PVGKKLPDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSC DKGSSSNSSRIEDND+H
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSC-DKGSSSNSSRIEDNDVH

Query:  LDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
         DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  LDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

A0A5D3DNG7 PWWP domain protein1.2e-11290.48Show/hide
Query:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE
        MAKKRKT  KKKGE QSPLIDNIPKYSQQRRSSPPKRRTDFSSLF YSSSI  +  +AL RLSLNEVG SKL+VNHSDNTNEELSSSSLVKCSNSL EDE
Subjt:  MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDE

Query:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL
         LSLCSSPDEMQSVECRLS+SSC    KRKGTSKIS+PVGKKLPDSESNSLS TPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDND+H 
Subjt:  ELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHL

Query:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  DRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

A0A6J1J672 uncharacterized protein LOC111481710 isoform X21.3e-11184.62Show/hide
Query:  KRYLNFLTMAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKC
        K +L FLTMAKKR+T Q+KKG++Q PLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIA +GT+ LP+ SL          NHSDNTNEELSSSSLVKC
Subjt:  KRYLNFLTMAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKC

Query:  SNSLGEDEELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSR
        SNS GED+ELS CSSPD++QSVECRLS+SSCKA+SKRKGTSKISYPV KKLPDSESNSLSETPENVQLWSTESFEERSSNTT EFQDQSCDKGSSSNSSR
Subjt:  SNSLGEDEELSLCSSPDEMQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSR

Query:  IEDNDVHLDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA
        IEDND+H+DR RGKRERKPKVPFDEE TIS+K+TRKFRRMRIMRYLGLAAPVGSPFSPIA
Subjt:  IEDNDVHLDRGRGKRERKPKVPFDEEMTISLKSTRKFRRMRIMRYLGLAAPVGSPFSPIA

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGAAGAAGAGAAAGACGCCCCAGAAGAAAAAGGGCGAAAAACAATCACCCCTTATCGATAATATACCCAAGTATTCTCAACAGCGCCGAAGCTCACCGCCTAAACG
CCGCACTGATTTCTCCTCTCTCTTTTGCTATTCTTCTTCAATTGCCCGTCGAGGCACATCTGCCTTGCCACGATTGTCGTTGAATGAAGTTGGATTGTCAAAATTGATAG
TGAATCACTCAGATAATACAAATGAAGAACTCTCTTCTAGCTCTTTGGTGAAATGCAGCAACTCCCTGGGGGAAGATGAAGAACTAAGCCTATGCTCAAGTCCTGATGAA
ATGCAATCAGTTGAATGCCGCCTCAGCGATAGTTCATGCAAGGCTGTAAGCAAGAGAAAAGGTACTTCTAAGATATCATACCCTGTTGGTAAAAAATTACCAGATTCAGA
AAGCAACAGTCTTTCTGAAACTCCAGAGAATGTACAGCTGTGGTCTACTGAAAGTTTCGAGGAGAGGAGTTCAAACACAACGGTAGAGTTTCAAGATCAATCATGTGATA
AGGGGTCTTCATCAAACTCAAGCAGGATTGAAGATAATGACGGCTCCTTCTTTACCTCAGTAATTCAATTTTCAAAGCGTTATCTCAATTTCTTGACAATGGCGAAGAAG
AGAAAGACGCCCCAGAAGAAAAAGGGCGAAAAACAATCACCCCTTATCGATAATATACCCAAGTATTCTCAACAGCGCCGAAGCTCACCGCCTAAACGCCGCACTGATTT
CTCCTCTCTCTTTTGCTATTCTTCTTCAATTGCCCGTCGAGGCACATCTGCCTTGCCACGATTGTCGTTGAATGAAGTTGGATTGTCAAAATTGATAGTGAATCACTCAG
ATAATACAAATGAAGAACTCTCTTCTAGCTCTTTGGTGAAATGCAGCAACTCCCTGGGGGAAGATGAAGAACTAAGCCTATGCTCAAGTCCTGATGAAATGCAATCAGTT
GAATGCCGCCTCAGCGATAGTTCATGCAAGGCTGTAAGCAAGAGAAAAGGTACTTCTAAGATATCATACCCTGTTGGTAAAAAATTACCAGATTCAGAAAGCAACAGTCT
TTCTGAAACTCCAGAGAATGTACAGCTGTGGTCTACTGAAAGTTTCGAGGAGAGGAGTTCAAACACAACGGTAGAGTTTCAAGATCAATCATGTGATAAGGGGTCTTCAT
CAAACTCAAGCAGGATTGAAGATAATGACGTACACCTAGACAGAGGAAGAGGAAAAAGGGAAAGAAAGCCAAAAGTTCCCTTCGATGAAGAGATGACCATATCTCTTAAA
TCAACAAGAAAGTTTCGCCGAATGAGGATTATGCGGTACCTTGGGCTTGCAGCTCCAGTTGGTTCTCCTTTTTCACCAATTGCCTGA
mRNA sequenceShow/hide mRNA sequence
TGGGAATTTATAATGGCCCATTCTTAGTGTTATAGGAATTGGGAATTCTTCACTGCCCCCCATTCTATTCTCTCATTCAGATCCACTGCCAAACAAATCCCCTTCTTCTT
CTTCTTCTTCTAGGGCTCCTTCTTTACCTCAGTAATTCAATTTTCAAAGCGTTATCTCAATTTCTTGACAATGGCGAAGAAGAGAAAGACGCCCCAGAAGAAAAAGGGCG
AAAAACAATCACCCCTTATCGATAATATACCCAAGTATTCTCAACAGCGCCGAAGCTCACCGCCTAAACGCCGCACTGATTTCTCCTCTCTCTTTTGCTATTCTTCTTCA
ATTGCCCGTCGAGGCACATCTGCCTTGCCACGATTGTCGTTGAATGAAGTTGGATTGTCAAAATTGATAGTGAATCACTCAGATAATACAAATGAAGAACTCTCTTCTAG
CTCTTTGGTGAAATGCAGCAACTCCCTGGGGGAAGATGAAGAACTAAGCCTATGCTCAAGTCCTGATGAAATGCAATCAGTTGAATGCCGCCTCAGCGATAGTTCATGCA
AGGCTGTAAGCAAGAGAAAAGGTACTTCTAAGATATCATACCCTGTTGGTAAAAAATTACCAGATTCAGAAAGCAACAGTCTTTCTGAAACTCCAGAGAATGTACAGCTG
TGGTCTACTGAAAGTTTCGAGGAGAGGAGTTCAAACACAACGGTAGAGTTTCAAGATCAATCATGTGATAAGGGGTCTTCATCAAACTCAAGCAGGATTGAAGATAATGA
CGGCTCCTTCTTTACCTCAGTAATTCAATTTTCAAAGCGTTATCTCAATTTCTTGACAATGGCGAAGAAGAGAAAGACGCCCCAGAAGAAAAAGGGCGAAAAACAATCAC
CCCTTATCGATAATATACCCAAGTATTCTCAACAGCGCCGAAGCTCACCGCCTAAACGCCGCACTGATTTCTCCTCTCTCTTTTGCTATTCTTCTTCAATTGCCCGTCGA
GGCACATCTGCCTTGCCACGATTGTCGTTGAATGAAGTTGGATTGTCAAAATTGATAGTGAATCACTCAGATAATACAAATGAAGAACTCTCTTCTAGCTCTTTGGTGAA
ATGCAGCAACTCCCTGGGGGAAGATGAAGAACTAAGCCTATGCTCAAGTCCTGATGAAATGCAATCAGTTGAATGCCGCCTCAGCGATAGTTCATGCAAGGCTGTAAGCA
AGAGAAAAGGTACTTCTAAGATATCATACCCTGTTGGTAAAAAATTACCAGATTCAGAAAGCAACAGTCTTTCTGAAACTCCAGAGAATGTACAGCTGTGGTCTACTGAA
AGTTTCGAGGAGAGGAGTTCAAACACAACGGTAGAGTTTCAAGATCAATCATGTGATAAGGGGTCTTCATCAAACTCAAGCAGGATTGAAGATAATGACGTACACCTAGA
CAGAGGAAGAGGAAAAAGGGAAAGAAAGCCAAAAGTTCCCTTCGATGAAGAGATGACCATATCTCTTAAATCAACAAGAAAGTTTCGCCGAATGAGGATTATGCGGTACC
TTGGGCTTGCAGCTCCAGTTGGTTCTCCTTTTTCACCAATTGCCTGAGCCATAATCCAATCCAACTTCCTATGTGCACAAGTTGAAATTGTGATGGTCTTGAATCTGTGG
ATGGACATCTCTCTCCAGTCGTGGGTCTATTTGAAGTTGGGGACATCTTGTTTTTTGGCCAATCAAGGAGATGGAAAATGTTATAGGAATGTGGCTTTATGCAGCAAGTT
TCCATTGAGGTATTGCCTGTTGGTTTGATAAATTATGACTGCCTGAAAGAAATCTCTGCACACTTATTATCCATGTTTGGTTCACCACATAGATAAATGTGAATTTGTAT
AGTTTTGATCTGTTTAATAATCATCTTGTTGTTAGTTTT
Protein sequenceShow/hide protein sequence
MAKKRKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDEELSLCSSPDE
MQSVECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDGSFFTSVIQFSKRYLNFLTMAKK
RKTPQKKKGEKQSPLIDNIPKYSQQRRSSPPKRRTDFSSLFCYSSSIARRGTSALPRLSLNEVGLSKLIVNHSDNTNEELSSSSLVKCSNSLGEDEELSLCSSPDEMQSV
ECRLSDSSCKAVSKRKGTSKISYPVGKKLPDSESNSLSETPENVQLWSTESFEERSSNTTVEFQDQSCDKGSSSNSSRIEDNDVHLDRGRGKRERKPKVPFDEEMTISLK
STRKFRRMRIMRYLGLAAPVGSPFSPIA