; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

HG10000393 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome

Gene IDHG10000393
OrganismLagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
DescriptionProtein of unknown function (DUF1645)
Genome locationChr09:4662219..4662896
RNA-Seq ExpressionHG10000393
SyntenyHG10000393
Gene Ontology termsNA
InterPro domainsIPR012442 - Protein of unknown function DUF1645, plant


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0032056.1 uncharacterized protein E6C27_scaffold223G00160 [Cucumis melo var. makuwa]1.5e-9183.77Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA
        MSSPRSPHN RLSPRK+KSNID  NIN+DPFEAAL+KET  HR NYEL+DS  NN+  RGRTDKISYI S+F+RKQTRSLSPFR+SSE ALHGD      
Subjt:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA

Query:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK
          G +KSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDD+KISSFRS D GGPRM +TAANRAVSEEL KKKSFLPNK
Subjt:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK

Query:  PGFLGRCLRFNRSGMQEISRGIGSLTRG
        PGFLGRCLRFNRSG+QEISRGIGSLTRG
Subjt:  PGFLGRCLRFNRSGMQEISRGIGSLTRG

XP_004153625.1 uncharacterized protein LOC101210068 [Cucumis sativus]1.9e-8982.89Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDSNNDKN--RGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA
        +SSP+SPHN RLSPRKTKSNID  NIN+DPFEAAL+KET   R NYEL+DSNN+    RGRTDKI+YISS+FARKQTRSLSPFR+SSE ALH D      
Subjt:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDSNNDKN--RGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA

Query:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK
           T+KSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKAD LRSTYVVMSEKLDDDMKISSFRS D GG RM FTAANRAVSEEL KKKSFLPNK
Subjt:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK

Query:  PGFLGRCLRFNRSGMQEISRGIGSLTRG
        P FLGRCLRFNRSGMQEISRGIGSLTRG
Subjt:  PGFLGRCLRFNRSGMQEISRGIGSLTRG

XP_008459213.1 PREDICTED: uncharacterized protein LOC103498403 [Cucumis melo]1.5e-9183.77Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA
        MSSPRSPHN RLSPRK+KSNID  NIN+DPFEAAL+KET  HR NYEL+DS  NN+  RGRTDKISYI S+F+RKQTRSLSPFR+SSE ALHGD      
Subjt:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA

Query:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK
          G +KSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDD+KISSFRS D GGPRM +TAANRAVSEEL KKKSFLPNK
Subjt:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK

Query:  PGFLGRCLRFNRSGMQEISRGIGSLTRG
        PGFLGRCLRFNRSG+QEISRGIGSLTRG
Subjt:  PGFLGRCLRFNRSGMQEISRGIGSLTRG

XP_022986568.1 uncharacterized protein LOC111484268 [Cucurbita maxima]1.7e-8276.89Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLAGVG
        +SSPRSPHN R+SPRKTK++ DMNIN+DPFEAALMKETLSHR+N EL D  + KNRGRT++ISYISSDFARK TRS+SP+RISS   +HGD D+S    G
Subjt:  MSSPRSPHNPRLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLAGVG

Query:  TKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKPGF
          KSKS SFLSAISFSK NRKWRLRDLLFRS SEGRATEKADKLRSTYVVMSE++++D+KISSFRSAD   PR HFTAANR VSEELMKKKS       F
Subjt:  TKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKPGF

Query:  LGRCLRFNRSGMQEISRGIGSLTRG
        LGRCLRFNRSGMQEISR IGSLTRG
Subjt:  LGRCLRFNRSGMQEISRGIGSLTRG

XP_038900517.1 uncharacterized protein LOC120087714 [Benincasa hispida]6.0e-10490.75Show/hide
Query:  MSSPRSPHNPRLSPRKTKS-NIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISY-ISSDFARKQTRSLSPFRISSEIALHGDDDNSLAG
        +SSPRSPHNPRLSPRKTKS NIDMNIN+DPFEAALMKETLSHRSNYEL+DS N+KNRGRTDKISY IS +FARKQTRSLSPFRISSE   HGDDDNSLAG
Subjt:  MSSPRSPHNPRLSPRKTKS-NIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISY-ISSDFARKQTRSLSPFRISSEIALHGDDDNSLAG

Query:  VGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKP
        V   KSKSSSFLSAISFSKTNRKWRLRDLLFRSASEG  TEKADKLRSTYVVMSEKLDDD+KISSFRS D GGPRMHFTAANRAVSEELMKKKSFLPNK 
Subjt:  VGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKP

Query:  GFLGRCLRFNRSGMQEISRGIGSLTRG
        GFLGRCLRFNRSGMQEISRGIGSLTRG
Subjt:  GFLGRCLRFNRSGMQEISRGIGSLTRG

TrEMBL top hitse value%identityAlignment
A0A0A0LII3 Uncharacterized protein9.1e-9082.89Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDSNNDKN--RGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA
        +SSP+SPHN RLSPRKTKSNID  NIN+DPFEAAL+KET   R NYEL+DSNN+    RGRTDKI+YISS+FARKQTRSLSPFR+SSE ALH D      
Subjt:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDSNNDKN--RGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA

Query:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK
           T+KSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKAD LRSTYVVMSEKLDDDMKISSFRS D GG RM FTAANRAVSEEL KKKSFLPNK
Subjt:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK

Query:  PGFLGRCLRFNRSGMQEISRGIGSLTRG
        P FLGRCLRFNRSGMQEISRGIGSLTRG
Subjt:  PGFLGRCLRFNRSGMQEISRGIGSLTRG

A0A1S3CA74 uncharacterized protein LOC1034984037.4e-9283.77Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA
        MSSPRSPHN RLSPRK+KSNID  NIN+DPFEAAL+KET  HR NYEL+DS  NN+  RGRTDKISYI S+F+RKQTRSLSPFR+SSE ALHGD      
Subjt:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA

Query:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK
          G +KSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDD+KISSFRS D GGPRM +TAANRAVSEEL KKKSFLPNK
Subjt:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK

Query:  PGFLGRCLRFNRSGMQEISRGIGSLTRG
        PGFLGRCLRFNRSG+QEISRGIGSLTRG
Subjt:  PGFLGRCLRFNRSGMQEISRGIGSLTRG

A0A5A7SPX1 Uncharacterized protein7.4e-9283.77Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA
        MSSPRSPHN RLSPRK+KSNID  NIN+DPFEAAL+KET  HR NYEL+DS  NN+  RGRTDKISYI S+F+RKQTRSLSPFR+SSE ALHGD      
Subjt:  MSSPRSPHNPRLSPRKTKSNID-MNINNDPFEAALMKETLSHRSNYELLDS--NNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLA

Query:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK
          G +KSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDD+KISSFRS D GGPRM +TAANRAVSEEL KKKSFLPNK
Subjt:  GVGTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNK

Query:  PGFLGRCLRFNRSGMQEISRGIGSLTRG
        PGFLGRCLRFNRSG+QEISRGIGSLTRG
Subjt:  PGFLGRCLRFNRSGMQEISRGIGSLTRG

A0A6J1FYJ1 uncharacterized protein LOC1114487317.0e-8275.56Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLAGVG
        MSSPRSPHN R+S RKTK++ +MNIN+DPFEAALMKETL+HR+NYEL D  + KNRGRT++ISYISS+FARK TRS+SP+RISS   +HGD D      G
Subjt:  MSSPRSPHNPRLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLAGVG

Query:  TKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKPGF
          KSKS SFLSAISFSK NRKWRLRDLLFRS SEGRATEKADKLRSTYVVMSE++++DMKISSFRSAD  GPR HFTAANR VSEE MKK+S       F
Subjt:  TKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKPGF

Query:  LGRCLRFNRSGMQEISRGIGSLTRG
        LGRCLRFNRSGMQEISR IGSLTRG
Subjt:  LGRCLRFNRSGMQEISRGIGSLTRG

A0A6J1JGW7 uncharacterized protein LOC1114842688.3e-8376.89Show/hide
Query:  MSSPRSPHNPRLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLAGVG
        +SSPRSPHN R+SPRKTK++ DMNIN+DPFEAALMKETLSHR+N EL D  + KNRGRT++ISYISSDFARK TRS+SP+RISS   +HGD D+S    G
Subjt:  MSSPRSPHNPRLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLAGVG

Query:  TKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKPGF
          KSKS SFLSAISFSK NRKWRLRDLLFRS SEGRATEKADKLRSTYVVMSE++++D+KISSFRSAD   PR HFTAANR VSEELMKKKS       F
Subjt:  TKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKPGF

Query:  LGRCLRFNRSGMQEISRGIGSLTRG
        LGRCLRFNRSGMQEISR IGSLTRG
Subjt:  LGRCLRFNRSGMQEISRGIGSLTRG

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT2G15760.1 Protein of unknown function (DUF1645)8.9e-2138.71Show/hide
Query:  PFEAALMKETLSHRS-NYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNS--LAGVGTKKSKSSSFLSAISF-SKTNRKWRL
        P    L     S RS   E+ DS++ K+RGR       SS + RK +RS+SP R+S  +    ++  S  +    T   KSS FLSAI F  +  +KW+L
Subjt:  PFEAALMKETLSHRS-NYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNS--LAGVGTKKSKSSSFLSAISF-SKTNRKWRL

Query:  RD-LLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADG----------------GGPRMHFTAANRAVSEELMKKKSFLPNKPGFLGRCLRF
        +D LLFRSAS+GR     + L + Y ++++K  ++++ SS RS +                     MH+T  NRAVSEEL K+K+FLP K G+LG CL F
Subjt:  RD-LLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADG----------------GGPRMHFTAANRAVSEELMKKKSFLPNKPGFLGRCLRF

Query:  NRSGMQEISRGIGSLTR
        N   + EI+R +GSL+R
Subjt:  NRSGMQEISRGIGSLTR

AT2G26530.1 Protein of unknown function (DUF1645)4.6e-0930.84Show/hide
Query:  SPRSPHNP----------RLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISS--------
        SPRSP +P            SPRK   N+      DPFE A+ K                ++ RGR         +  R+  RSLSPFR+S+        
Subjt:  SPRSPHNP----------RLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISS--------

Query:  -EIALHGDDDNSLAGVGTKKSKSSSFLSAISFSKTNRKWRLRD-LLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMH-FTAANR
         +     D      G  +    +SS       S +++KWRL+D LLFRSASEGRA    D ++ T+  +  K  +D K SS R         H F   ++
Subjt:  -EIALHGDDDNSLAGVGTKKSKSSSFLSAISFSKTNRKWRLRD-LLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMH-FTAANR

Query:  AVSEELMKKKSFLP
            + +KKK+FLP
Subjt:  AVSEELMKKKSFLP

AT2G26530.2 Protein of unknown function (DUF1645)4.3e-0733.82Show/hide
Query:  RKQTRSLSPFRISS---------EIALHGDDDNSLAGVGTKKSKSSSFLSAISFSKTNRKWRLRD-LLFRSASEGRATEKADKLRSTYVVMSEKLDDDMK
        R+  RSLSPFR+S+         +     D      G  +    +SS       S +++KWRL+D LLFRSASEGRA    D ++ T+  +  K  +D K
Subjt:  RKQTRSLSPFRISS---------EIALHGDDDNSLAGVGTKKSKSSSFLSAISFSKTNRKWRLRD-LLFRSASEGRATEKADKLRSTYVVMSEKLDDDMK

Query:  ISSFRSADGGGPRMH-FTAANRAVSEELMKKKSFLP
         SS R         H F   ++    + +KKK+FLP
Subjt:  ISSFRSADGGGPRMH-FTAANRAVSEELMKKKSFLP

AT3G27880.1 Protein of unknown function (DUF1645)5.8e-0431.3Show/hide
Query:  GTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGG---GPRMHFTAANRAVSEELMKKKSFLPN
        G +KSKS+   S  ++S   ++WRLRD L RS S+G+ + K       ++  + + DDD    S +             F   N+A+ EE  K+KS+LP 
Subjt:  GTKKSKSSSFLSAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGG---GPRMHFTAANRAVSEELMKKKSFLPN

Query:  KPGFLGRCLRFNRSG
        K   +G     +R G
Subjt:  KPGFLGRCLRFNRSG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCGTCGCCGAGATCGCCGCACAATCCGAGGCTGTCTCCTCGAAAAACCAAAAGCAATATCGACATGAACATCAACAACGACCCATTTGAAGCAGCGCTAATGAAAGA
GACTCTTAGCCATAGAAGCAATTACGAGCTCCTTGATTCAAATAACGATAAAAACAGAGGAAGAACCGATAAAATTTCATACATTTCCTCTGATTTTGCTCGCAAACAAA
CTCGATCTCTTTCCCCTTTCAGAATCTCCTCTGAAATTGCACTCCATGGAGATGACGACAACTCCCTCGCCGGCGTCGGCACAAAAAAATCAAAGTCGTCGTCTTTTTTG
TCGGCGATTTCATTTTCAAAGACTAACAGAAAATGGAGGCTCAGAGACTTGTTGTTTCGTAGTGCGTCAGAAGGCCGTGCGACGGAGAAAGCCGATAAGCTGAGGTCTAC
GTACGTTGTAATGTCGGAAAAATTGGATGACGACATGAAGATTTCAAGTTTCCGGTCAGCCGACGGTGGCGGTCCGAGAATGCATTTCACGGCGGCGAACCGGGCGGTTT
CTGAGGAGTTGATGAAGAAGAAGAGTTTTTTGCCTAACAAACCGGGCTTTTTGGGCCGTTGCTTGCGGTTTAACCGGTCCGGTATGCAGGAGATTTCTAGAGGAATTGGG
TCGTTGACACGTGGATGA
mRNA sequenceShow/hide mRNA sequence
ATGTCGTCGCCGAGATCGCCGCACAATCCGAGGCTGTCTCCTCGAAAAACCAAAAGCAATATCGACATGAACATCAACAACGACCCATTTGAAGCAGCGCTAATGAAAGA
GACTCTTAGCCATAGAAGCAATTACGAGCTCCTTGATTCAAATAACGATAAAAACAGAGGAAGAACCGATAAAATTTCATACATTTCCTCTGATTTTGCTCGCAAACAAA
CTCGATCTCTTTCCCCTTTCAGAATCTCCTCTGAAATTGCACTCCATGGAGATGACGACAACTCCCTCGCCGGCGTCGGCACAAAAAAATCAAAGTCGTCGTCTTTTTTG
TCGGCGATTTCATTTTCAAAGACTAACAGAAAATGGAGGCTCAGAGACTTGTTGTTTCGTAGTGCGTCAGAAGGCCGTGCGACGGAGAAAGCCGATAAGCTGAGGTCTAC
GTACGTTGTAATGTCGGAAAAATTGGATGACGACATGAAGATTTCAAGTTTCCGGTCAGCCGACGGTGGCGGTCCGAGAATGCATTTCACGGCGGCGAACCGGGCGGTTT
CTGAGGAGTTGATGAAGAAGAAGAGTTTTTTGCCTAACAAACCGGGCTTTTTGGGCCGTTGCTTGCGGTTTAACCGGTCCGGTATGCAGGAGATTTCTAGAGGAATTGGG
TCGTTGACACGTGGATGA
Protein sequenceShow/hide protein sequence
MSSPRSPHNPRLSPRKTKSNIDMNINNDPFEAALMKETLSHRSNYELLDSNNDKNRGRTDKISYISSDFARKQTRSLSPFRISSEIALHGDDDNSLAGVGTKKSKSSSFL
SAISFSKTNRKWRLRDLLFRSASEGRATEKADKLRSTYVVMSEKLDDDMKISSFRSADGGGPRMHFTAANRAVSEELMKKKSFLPNKPGFLGRCLRFNRSGMQEISRGIG
SLTRG