; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Clc11G01360 (gene) of Watermelon (cordophanus) v2 genome

Gene IDClc11G01360
OrganismCitrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
DescriptionDUF3067 domain-containing protein
Genome locationClcChr11:1415545..1421267
RNA-Seq ExpressionClc11G01360
SyntenyClc11G01360
Gene Ontology termsNA
InterPro domainsIPR021420 - Protein of unknown function DUF3067


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6607672.1 hypothetical protein SDJN03_01014, partial [Cucurbita argyrosperma subsp. sororia]4.2e-12192.58Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEHLGR K SRV++SYSEYCCPFLPSR+T+T +GN VA+CRRRTGRQ+RPVLAGSVDG MDPDESDR IND E  KPENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLAT+IRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

KAG7028479.1 hypothetical protein SDJN02_09660, partial [Cucurbita argyrosperma subsp. argyrosperma]4.2e-12192.58Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEHLGR K SRV++SYSEYCCPFLPSR+T+T +GN VA+CRRRTGRQ+RPVLAGSVDG MDPDESDR IND E  KPENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLAT+IRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

XP_022926184.1 uncharacterized protein LOC111433376 [Cucurbita moschata]4.2e-12192.58Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEHLGR K SRV++SYSEYCCPFLPSR+T+T +GN VA+CRRRTGRQ+RPVLAGSVDG MDPDESDR IND E  KPENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLAT+IRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

XP_023525612.1 uncharacterized protein LOC111789180 [Cucurbita pepo subsp. pepo]4.2e-12192.58Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEHLGR K SRV++SYSEYCCPFLPSR+T+T +GN VA+CRRRTGRQ+RPVLAGSVDG MDPDESDR IND E  KPENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLAT+IRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

XP_038893276.1 uncharacterized protein LOC120082114 isoform X3 [Benincasa hispida]2.5e-12193.91Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTT-TPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGG
        MTSVTFGHQSNWSPGIGIQEHLGRTK SRVSYSYSEYCCPFLPSRD T T +GN VA+CRR++GR VRPVLAGSVDG MDPDESDRGIND E  KPENGG
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTT-TPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGG

Query:  MNFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDK
        MNFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDK
Subjt:  MNFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDK

Query:  TKDRPRIGKAVSIFIDMDESGGRANEWIYK
        TKDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  TKDRPRIGKAVSIFIDMDESGGRANEWIYK

TrEMBL top hitse value%identityAlignment
A0A1S3C5E8 uncharacterized protein LOC1034966691.2e-11088.21Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEH GRTK SRV       CCPFLPS    T +GN VA+CRRRTGRQ+RPVLAGS+DG MDPD+ DR IND E  K ENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

A0A5A7SMD4 DUF3067 domain-containing protein1.2e-11088.21Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEH GRTK SRV       CCPFLPS    T +GN VA+CRRRTGRQ+RPVLAGS+DG MDPD+ DR IND E  K ENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

A0A6J1DNM9 uncharacterized protein LOC1110223111.4e-10181.7Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDT--TTPYGNQVAFC-RRRTGRQVRPVLA-GSVDGGMDPDESDRGINDGEITKPE
        MTSVT GH SNWSPGIGI+EHLGR   SRV  SYSEYC PF+PSR+T  TTP+GN++A+C RRR+GR+ RPV A GSVDG  DPD+SD G+N+ +  + E
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDT--TTPYGNQVAFC-RRRTGRQVRPVLA-GSVDGGMDPDESDRGINDGEITKPE

Query:  NG--GMNFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIR
        N    MNF+MLRENLERSVGTDDSRFSGIDLATLIRNKYG+SYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIR
Subjt:  NG--GMNFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIR

Query:  NSLDKTKDRPRIGKAVSIFIDMDESGGRANEWIYK
        NSL KTKDRPRIGKAVSIFIDMDESGGRA EWIYK
Subjt:  NSLDKTKDRPRIGKAVSIFIDMDESGGRANEWIYK

A0A6J1EEF2 uncharacterized protein LOC1114333762.0e-12192.58Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEHLGR K SRV++SYSEYCCPFLPSR+T+T +GN VA+CRRRTGRQ+RPVLAGSVDG MDPDESDR IND E  KPENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLAT+IRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

A0A6J1J2G4 uncharacterized protein LOC1114806512.7e-12192.58Show/hide
Query:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM
        MTSVTFGHQSNWSPGIGIQEHLGR K SRV++SYSEYCCPFLPSR+T+T +GN VA+CRRRTGRQ+RPVLAGSVDG MDPDESDR IND E  KPENGGM
Subjt:  MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGM

Query:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
        NFEMLRENLERSVGTDDSRFSGIDLAT+IRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT
Subjt:  NFEMLRENLERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKT

Query:  KDRPRIGKAVSIFIDMDESGGRANEWIYK
        KDRPRIGKAVSIFIDMDESGGRANEWIYK
Subjt:  KDRPRIGKAVSIFIDMDESGGRANEWIYK

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT3G19900.1 unknown protein1.3e-5957.92Show/hide
Query:  IQEHLGRTKTSRVSYSYSEYCCP-------FLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVD--GGMDPDESDRGINDGEITKPENGGMNFEMLREN
        I E  G    S+V  S S YC P       F  S    T YG        +T R+    +   VD  G +D  + +   +  + TK +   MN    R N
Subjt:  IQEHLGRTKTSRVSYSYSEYCCP-------FLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVD--GGMDPDESDRGINDGEITKPENGGMNFEMLREN

Query:  LERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKTKDRPRIGK
        LER VG+DDS F+G+DLATLIR KYGKSYDVQLIKKEFMG+NLLA+NVMWKYREQ+SFPL+EEEY+LRLD VAN LKCWGAV+HIR+SL K+K+RPRIGK
Subjt:  LERSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKTKDRPRIGK

Query:  AVSIFIDMDESGGRANEWIYK
        AVSIFIDMD +GGRANEWIYK
Subjt:  AVSIFIDMDESGGRANEWIYK


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGACGAGCGTAACGTTCGGCCACCAGAGTAATTGGTCGCCGGGGATTGGAATTCAAGAACATCTAGGTAGAACAAAGACTTCTAGGGTTTCGTATTCATATTCGGAGTA
TTGTTGTCCATTTCTTCCTTCCAGAGACACAACCACTCCCTATGGGAATCAAGTTGCTTTCTGTCGCCGGCGAACTGGACGGCAAGTGAGGCCTGTTCTTGCCGGTTCCG
TCGACGGTGGCATGGATCCAGATGAGTCCGATCGTGGGATTAACGATGGTGAGATCACCAAACCCGAAAATGGAGGGATGAACTTTGAAATGCTTAGGGAGAACTTGGAG
AGATCGGTTGGGACAGATGATTCAAGATTTAGTGGGATTGACCTGGCTACTCTTATCAGAAACAAGTATGGCAAGTCTTATGATGTTCAACTAATAAAGAAGGAGTTCAT
GGGACGGAATCTTCTTGCTTTAAATGTCATGTGGAAATACAGAGAGCAGAAATCATTTCCATTGTCCGAGGAAGAGTATCTATTGCGGCTTGATGGTGTGGCTAATACAT
TAAAATGCTGGGGAGCCGTTGCTCACATTCGAAACAGCTTAGATAAAACTAAAGACAGACCTCGGATAGGAAAGGCAGTTAGTATTTTTATCGACATGGACGAGTCTGGT
GGTCGTGCCAATGAGTGGATATACAAGTAG
mRNA sequenceShow/hide mRNA sequence
TATAACCTTAATAAATAGCCTAAATTAAGTGACTTCCACGATAATTTTTTTTTAAAAGTGGAGTGTTAATTAATGCAATTACAAAAGTTCAGGATTTGTTTGAATACATA
AATTAAATTTTTCAAAACAAAAAAGAAAAAAAAAAGAAAGAAAAAGGAGTCGTGTGGGTCTACAATTGCAAAGCAAACAAGTGGTTCAAATTAATCTCAAAGTGAAACAA
ATAAAACAACTCGAACCACATCCTTTCTCAAATTCTTGATTCTCTGCTCGCTTCCGATTCCATTCTCGATCCTCCAATTATCGTAAAAGGTAATGTTTATATGCAATTTT
CCGTAGAAATTACTTGACTTCTCTACTTCCAATTTCAATTGCTCCAATTTCTAATCGATGAAACCGATTGATTGTTTTTGCAGATTATGACGAGCGTAACGTTCGGCCAC
CAGAGTAATTGGTCGCCGGGGATTGGAATTCAAGAACATCTAGGTAGAACAAAGACTTCTAGGGTTTCGTATTCATATTCGGAGTATTGTTGTCCATTTCTTCCTTCCAG
AGACACAACCACTCCCTATGGGAATCAAGTTGCTTTCTGTCGCCGGCGAACTGGACGGCAAGTGAGGCCTGTTCTTGCCGGTTCCGTCGACGGTGGCATGGATCCAGATG
AGTCCGATCGTGGGATTAACGATGGTGAGATCACCAAACCCGAAAATGGAGGGATGAACTTTGAAATGCTTAGGGAGAACTTGGAGAGATCGGTTGGGACAGATGATTCA
AGATTTAGTGGGATTGACCTGGCTACTCTTATCAGAAACAAGTATGGCAAGTCTTATGATGTTCAACTAATAAAGAAGGAGTTCATGGGACGGAATCTTCTTGCTTTAAA
TGTCATGTGGAAATACAGAGAGCAGAAATCATTTCCATTGTCCGAGGAAGAGTATCTATTGCGGCTTGATGGTGTGGCTAATACATTAAAATGCTGGGGAGCCGTTGCTC
ACATTCGAAACAGCTTAGATAAAACTAAAGACAGACCTCGGATAGGAAAGGCAGTTAGTATTTTTATCGACATGGACGAGTCTGGTGGTCGTGCCAATGAGTGGATATAC
AAGTAGATTACTTACACGAACAAAATTCAAATGTATATTTCTTATATATTTTTTTGTATAGTTAAAAATCTAATAAAGATACATTTTATTTATTTATATAACTCTAATTT
CTCTAAACTACATTTGTTT
Protein sequenceShow/hide protein sequence
MTSVTFGHQSNWSPGIGIQEHLGRTKTSRVSYSYSEYCCPFLPSRDTTTPYGNQVAFCRRRTGRQVRPVLAGSVDGGMDPDESDRGINDGEITKPENGGMNFEMLRENLE
RSVGTDDSRFSGIDLATLIRNKYGKSYDVQLIKKEFMGRNLLALNVMWKYREQKSFPLSEEEYLLRLDGVANTLKCWGAVAHIRNSLDKTKDRPRIGKAVSIFIDMDESG
GRANEWIYK