; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CaUC01G012380 (gene) of Watermelon (USVL246-FR2) v1 genome

Gene IDCaUC01G012380
OrganismCitrullus amarus (Watermelon (USVL246-FR2) v1)
DescriptionPentatricopeptide repeat-containing protein
Genome locationCiama_Chr01:24224566..24237266
RNA-Seq ExpressionCaUC01G012380
SyntenyCaUC01G012380
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR011990 - Tetratricopeptide-like helical domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0052071.1 pentatricopeptide repeat-containing protein [Cucumis melo var. makuwa]2.8e-9886.3Show/hide
Query:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR
        SS+   +E EEI+AYDY KDT+VVWDSDEIEAISSLFQGRIPQKPG LNR+R LPLPLP+KLRPPRLPN KIRP T VSSRAL+SK+VYKRPDFLIGLAR
Subjt:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR

Query:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG
        AI DLS EENVSKVLNRWG FLQKGSLSLTIKELGHMGLPDR LKTFCW QE+ RLFPDDRVLA+TVEVL+RNHELKVP+NLEEFT+LASRGVLEAM+RG
Subjt:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG

Query:  FIKGGSLNLAWKLLVAAKK
        FIKGGSLNLAWKLLVAAKK
Subjt:  FIKGGSLNLAWKLLVAAKK

XP_004139567.1 pentatricopeptide repeat-containing protein At2g01860 [Cucumis sativus]2.0e-9684.93Show/hide
Query:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR
        SS+   +E EEI+A+DY KDT+VVWDSDEIEAISSLFQGRIPQKPG LNR+R LPLPLP+KLRPPRLPN KIRP T+VSSRAL+SKQVYKRPDFLIGLAR
Subjt:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR

Query:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG
         I DLS EENVSKVLNRWG FLQKGSLSLTIKELGHMGLPDR L TFCWAQE+ RLFPDDRVLA+TVEVL+RNHELKV +NLEEFT+LASRGVLEAM+RG
Subjt:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG

Query:  FIKGGSLNLAWKLLVAAKK
        FI+GGSLNLAWKLLVAAKK
Subjt:  FIKGGSLNLAWKLLVAAKK

XP_008462173.1 PREDICTED: pentatricopeptide repeat-containing protein At2g01860 [Cucumis melo]2.8e-9886.3Show/hide
Query:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR
        SS+   +E EEI+AYDY KDT+VVWDSDEIEAISSLFQGRIPQKPG LNR+R LPLPLP+KLRPPRLPN KIRP T VSSRAL+SK+VYKRPDFLIGLAR
Subjt:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR

Query:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG
        AI DLS EENVSKVLNRWG FLQKGSLSLTIKELGHMGLPDR LKTFCW QE+ RLFPDDRVLA+TVEVL+RNHELKVP+NLEEFT+LASRGVLEAM+RG
Subjt:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG

Query:  FIKGGSLNLAWKLLVAAKK
        FIKGGSLNLAWKLLVAAKK
Subjt:  FIKGGSLNLAWKLLVAAKK

XP_022951808.1 pentatricopeptide repeat-containing protein At2g01860 isoform X2 [Cucurbita moschata]1.1e-9167.27Show/hide
Query:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII
        E ++   +  +A D  D++VVWDS+EIEAI+SLF+GRIPQKPG LNR+R LPLPLP+KLRPP LPN KIRPRT VSSRALMSKQVYKRPDFLIGLARAI 
Subjt:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII

Query:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK
        DL  EENVSKVLNRW  FLQKGSLSLTIKELGHMGL DR LKTFCW QE+PRL+PDDRVLA+TVEVLARNHELK+P NL+EFT+LASRGVLEAM+RGFIK
Subjt:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK

Query:  GGSLNLAWKLLVAAKKDFLSTDHYSTLIPTHTSDFFIITSYAFHFFPFRLSSYFHASTLTMRYLSPDHASNMVFY
        GG L+LAWKLLVAAK D L       L    TS    +++        RL  +  A  L   Y+   H  ++V Y
Subjt:  GGSLNLAWKLLVAAKKDFLSTDHYSTLIPTHTSDFFIITSYAFHFFPFRLSSYFHASTLTMRYLSPDHASNMVFY

XP_038893977.1 pentatricopeptide repeat-containing protein At2g01860 [Benincasa hispida]2.9e-10088.43Show/hide
Query:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII
        + +D+E EEI+AYDYKDT+VVWDSDEIEAISSLFQGRIPQKPG LNRDR LPLPLP+KLRP  LP+ KIRPR MVSSRAL+SKQVYKRPDFLIGLARAI 
Subjt:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII

Query:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK
        DLS EENVSKVLNRWG FLQKGSLSLTIKELGHMGLPDR LKTF WAQE+PRLFPDDRVLA+TVEVLARNHELKVPL+LEEFT+LASRGVLEAMVRGFIK
Subjt:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK

Query:  GGSLNLAWKLLVAAKK
        GGSLNLAWKLLVAAKK
Subjt:  GGSLNLAWKLLVAAKK

TrEMBL top hitse value%identityAlignment
A0A0A0LVM0 Uncharacterized protein9.6e-9784.93Show/hide
Query:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR
        SS+   +E EEI+A+DY KDT+VVWDSDEIEAISSLFQGRIPQKPG LNR+R LPLPLP+KLRPPRLPN KIRP T+VSSRAL+SKQVYKRPDFLIGLAR
Subjt:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR

Query:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG
         I DLS EENVSKVLNRWG FLQKGSLSLTIKELGHMGLPDR L TFCWAQE+ RLFPDDRVLA+TVEVL+RNHELKV +NLEEFT+LASRGVLEAM+RG
Subjt:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG

Query:  FIKGGSLNLAWKLLVAAKK
        FI+GGSLNLAWKLLVAAKK
Subjt:  FIKGGSLNLAWKLLVAAKK

A0A1S3CGD0 pentatricopeptide repeat-containing protein At2g018601.3e-9886.3Show/hide
Query:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR
        SS+   +E EEI+AYDY KDT+VVWDSDEIEAISSLFQGRIPQKPG LNR+R LPLPLP+KLRPPRLPN KIRP T VSSRAL+SK+VYKRPDFLIGLAR
Subjt:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR

Query:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG
        AI DLS EENVSKVLNRWG FLQKGSLSLTIKELGHMGLPDR LKTFCW QE+ RLFPDDRVLA+TVEVL+RNHELKVP+NLEEFT+LASRGVLEAM+RG
Subjt:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG

Query:  FIKGGSLNLAWKLLVAAKK
        FIKGGSLNLAWKLLVAAKK
Subjt:  FIKGGSLNLAWKLLVAAKK

A0A5D3BQZ3 Pentatricopeptide repeat-containing protein1.3e-9886.3Show/hide
Query:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR
        SS+   +E EEI+AYDY KDT+VVWDSDEIEAISSLFQGRIPQKPG LNR+R LPLPLP+KLRPPRLPN KIRP T VSSRAL+SK+VYKRPDFLIGLAR
Subjt:  SSESKDNEREEIYAYDY-KDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLAR

Query:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG
        AI DLS EENVSKVLNRWG FLQKGSLSLTIKELGHMGLPDR LKTFCW QE+ RLFPDDRVLA+TVEVL+RNHELKVP+NLEEFT+LASRGVLEAM+RG
Subjt:  AIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRG

Query:  FIKGGSLNLAWKLLVAAKK
        FIKGGSLNLAWKLLVAAKK
Subjt:  FIKGGSLNLAWKLLVAAKK

A0A6J1GIR9 pentatricopeptide repeat-containing protein At2g01860 isoform X25.4e-9267.27Show/hide
Query:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII
        E ++   +  +A D  D++VVWDS+EIEAI+SLF+GRIPQKPG LNR+R LPLPLP+KLRPP LPN KIRPRT VSSRALMSKQVYKRPDFLIGLARAI 
Subjt:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII

Query:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK
        DL  EENVSKVLNRW  FLQKGSLSLTIKELGHMGL DR LKTFCW QE+PRL+PDDRVLA+TVEVLARNHELK+P NL+EFT+LASRGVLEAM+RGFIK
Subjt:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK

Query:  GGSLNLAWKLLVAAKKDFLSTDHYSTLIPTHTSDFFIITSYAFHFFPFRLSSYFHASTLTMRYLSPDHASNMVFY
        GG L+LAWKLLVAAK D L       L    TS    +++        RL  +  A  L   Y+   H  ++V Y
Subjt:  GGSLNLAWKLLVAAKKDFLSTDHYSTLIPTHTSDFFIITSYAFHFFPFRLSSYFHASTLTMRYLSPDHASNMVFY

A0A6J1KI41 pentatricopeptide repeat-containing protein At2g01860 isoform X22.1e-9166.55Show/hide
Query:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII
        E ++   +  +A D  D+++VWD +EIEAI+SLF+GRIPQKPG LNR+R LPLPLP+KLRPP LPN KIRPRT VSSRALMSKQVYKRPDFLIGLARAI 
Subjt:  ESKDNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAII

Query:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK
        DL  EENVSKVLNRW  FLQKGSLSLTIKELGHMGL DR LKTFCW QE+PRL+PDDRVLA+TVEVLARNHELK+P NL+EFT+LASRGVLEAM+RGFIK
Subjt:  DLSLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK

Query:  GGSLNLAWKLLVAAKKDFLSTDHYSTLIPTHTSDFFIITSYAFHFFPFRLSSYFHASTLTMRYLSPDHASNMVFY
        GG L+LAWKLLVAAK D L       L    TS    +++        RL  +  A  L   Y+   H  ++V Y
Subjt:  GGSLNLAWKLLVAAKKDFLSTDHYSTLIPTHTSDFFIITSYAFHFFPFRLSSYFHASTLTMRYLSPDHASNMVFY

SwissProt top hitse value%identityAlignment
Q5XET4 Pentatricopeptide repeat-containing protein At2g018601.5e-5153.46Show/hide
Query:  DNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRAL--MSKQVYKRPDFLIGLARAIID
        D++ +   + +  D  VVW+ +EIEAISSLFQ RIPQKP   +R R LPLP P+KLRP  LP  K   + ++ S AL  +SKQVYK P FLIGLAR I  
Subjt:  DNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRAL--MSKQVYKRPDFLIGLARAIID

Query:  L-SLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK
        L S + +VS VLN+W  FL+KGSLS TI+ELGHMGLP+R L+T+ WA++   L PD+R+LA+T++VLA++HELK+   L+    LAS+ V+EAM++G I+
Subjt:  L-SLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK

Query:  GGSLNLAWKLLVAAKKD
        GG LNLA KL++ +K +
Subjt:  GGSLNLAWKLLVAAKKD

Arabidopsis top hitse value%identityAlignment
AT2G01860.1 Tetratricopeptide repeat (TPR)-like superfamily protein1.1e-5253.46Show/hide
Query:  DNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRAL--MSKQVYKRPDFLIGLARAIID
        D++ +   + +  D  VVW+ +EIEAISSLFQ RIPQKP   +R R LPLP P+KLRP  LP  K   + ++ S AL  +SKQVYK P FLIGLAR I  
Subjt:  DNEREEIYAYDYKDTNVVWDSDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRAL--MSKQVYKRPDFLIGLARAIID

Query:  L-SLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK
        L S + +VS VLN+W  FL+KGSLS TI+ELGHMGLP+R L+T+ WA++   L PD+R+LA+T++VLA++HELK+   L+    LAS+ V+EAM++G I+
Subjt:  L-SLEENVSKVLNRWGHFLQKGSLSLTIKELGHMGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIK

Query:  GGSLNLAWKLLVAAKKD
        GG LNLA KL++ +K +
Subjt:  GGSLNLAWKLLVAAKKD


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCTGAACTAAATATGTACTTTACCGTCAAAGATTCAAAACCCACATACCAAATACAGTCAAATAGAAACATAGAAAGAGAGAGAGGGAGCAACATACATAATCAATC
TTTAAGCTACTGGGACGACGGTAACGCTAAGATCGAAAGCTACGGCTTCTGGCTTCCGGCCTCCGATCTCCGGTCTCCGGTCTCCGGGTTTTGGGTTCTGGGTTCGGCAG
GAAAAGCTTCTCCCTACAAGTTTGAGTGCAAGAAATCGAGTGAAAGTAAAGACAATGAGCGTGAAGAAATCTATGCTTATGACTATAAGGATACTAATGTTGTTTGGGAT
TCGGATGAAATTGAAGCTATTTCATCACTCTTTCAAGGGAGAATTCCTCAGAAACCTGGTACATTGAACAGGGACAGATCTCTTCCTCTCCCACTTCCTTACAAGCTACG
ACCACCAAGACTTCCTAACCTAAAAATCCGCCCAAGAACAATGGTCTCTTCGCGTGCTTTGATGTCTAAGCAAGTCTACAAGCGTCCTGATTTTCTTATTGGCCTTGCCA
GGGCGATTATAGATTTGTCCTTGGAGGAAAATGTGTCCAAGGTTCTCAATCGGTGGGGTCATTTTTTGCAAAAGGGCTCTCTATCATTGACGATCAAGGAACTAGGTCAT
ATGGGTCTTCCTGATAGAGTTCTAAAGACGTTCTGTTGGGCACAGGAACGACCTCGCCTCTTCCCGGATGATCGTGTTTTGGCCACAACGGTTGAGGTCCTTGCAAGGAA
CCATGAACTGAAGGTACCTCTAAACTTGGAAGAGTTCACTGAACTTGCTAGTCGTGGCGTGCTTGAGGCAATGGTGAGAGGGTTTATCAAAGGTGGGAGCTTAAATCTTG
CTTGGAAGCTTCTTGTAGCTGCGAAGAAGGATTTCCTTTCAACGGATCACTATTCAACTTTAATCCCTACTCATACGTCTGACTTCTTCATAATTACCTCCTATGCGTTT
CACTTCTTTCCCTTCAGGCTCTCGAGTTACTTCCATGCGTCCACCCTTACCATGCGTTACCTTAGTCCTGACCATGCGTCCAACATGGTCTTTTACTTCTTTTCTTTATA
G
mRNA sequenceShow/hide mRNA sequence
ATGTCTGAACTAAATATGTACTTTACCGTCAAAGATTCAAAACCCACATACCAAATACAGTCAAATAGAAACATAGAAAGAGAGAGAGGGAGCAACATACATAATCAATC
TTTAAGCTACTGGGACGACGGTAACGCTAAGATCGAAAGCTACGGCTTCTGGCTTCCGGCCTCCGATCTCCGGTCTCCGGTCTCCGGGTTTTGGGTTCTGGGTTCGGCAG
GAAAAGCTTCTCCCTACAAGTTTGAGTGCAAGAAATCGAGTGAAAGTAAAGACAATGAGCGTGAAGAAATCTATGCTTATGACTATAAGGATACTAATGTTGTTTGGGAT
TCGGATGAAATTGAAGCTATTTCATCACTCTTTCAAGGGAGAATTCCTCAGAAACCTGGTACATTGAACAGGGACAGATCTCTTCCTCTCCCACTTCCTTACAAGCTACG
ACCACCAAGACTTCCTAACCTAAAAATCCGCCCAAGAACAATGGTCTCTTCGCGTGCTTTGATGTCTAAGCAAGTCTACAAGCGTCCTGATTTTCTTATTGGCCTTGCCA
GGGCGATTATAGATTTGTCCTTGGAGGAAAATGTGTCCAAGGTTCTCAATCGGTGGGGTCATTTTTTGCAAAAGGGCTCTCTATCATTGACGATCAAGGAACTAGGTCAT
ATGGGTCTTCCTGATAGAGTTCTAAAGACGTTCTGTTGGGCACAGGAACGACCTCGCCTCTTCCCGGATGATCGTGTTTTGGCCACAACGGTTGAGGTCCTTGCAAGGAA
CCATGAACTGAAGGTACCTCTAAACTTGGAAGAGTTCACTGAACTTGCTAGTCGTGGCGTGCTTGAGGCAATGGTGAGAGGGTTTATCAAAGGTGGGAGCTTAAATCTTG
CTTGGAAGCTTCTTGTAGCTGCGAAGAAGGATTTCCTTTCAACGGATCACTATTCAACTTTAATCCCTACTCATACGTCTGACTTCTTCATAATTACCTCCTATGCGTTT
CACTTCTTTCCCTTCAGGCTCTCGAGTTACTTCCATGCGTCCACCCTTACCATGCGTTACCTTAGTCCTGACCATGCGTCCAACATGGTCTTTTACTTCTTTTCTTTATA
G
Protein sequenceShow/hide protein sequence
MSELNMYFTVKDSKPTYQIQSNRNIERERGSNIHNQSLSYWDDGNAKIESYGFWLPASDLRSPVSGFWVLGSAGKASPYKFECKKSSESKDNEREEIYAYDYKDTNVVWD
SDEIEAISSLFQGRIPQKPGTLNRDRSLPLPLPYKLRPPRLPNLKIRPRTMVSSRALMSKQVYKRPDFLIGLARAIIDLSLEENVSKVLNRWGHFLQKGSLSLTIKELGH
MGLPDRVLKTFCWAQERPRLFPDDRVLATTVEVLARNHELKVPLNLEEFTELASRGVLEAMVRGFIKGGSLNLAWKLLVAAKKDFLSTDHYSTLIPTHTSDFFIITSYAF
HFFPFRLSSYFHASTLTMRYLSPDHASNMVFYFFSL