; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MC07g0025 (gene) of Bitter gourd (Dali-11) v1 genome

Gene IDMC07g0025
OrganismMomordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Descriptionsmall acidic protein-like isoform X2
Genome locationMC07:282824..284997
RNA-Seq ExpressionMC07g0025
SyntenyMC07g0025
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR036020 - WW domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0039848.1 uncharacterized protein E6C27_scaffold122G001230 [Cucumis melo var. makuwa]1.62e-8576.85Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-N
        +VKEDPRTA A   D   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRSD+ N
Subjt:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-N

Query:  GFP
        GFP
Subjt:  GFP

XP_004140554.1 uncharacterized protein LOC101221916 [Cucumis sativus]1.18e-8575.49Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGDSSYYSEDEEGS----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-
        +VKEDPRTA A   D   Y ED++G     SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRSD+ 
Subjt:  RVKEDPRTAEADGGDSSYYSEDEEGS----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-

Query:  NGFP
        NGFP
Subjt:  NGFP

XP_016902460.1 PREDICTED: uncharacterized protein LOC103498882 [Cucumis melo]1.64e-8376.77Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD
        +VKEDPRTA A   D   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRSD+
Subjt:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD

XP_022148882.1 uncharacterized protein LOC111017445 [Momordica charantia]8.84e-128100Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
        MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR

Query:  TAEADGGDSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
        TAEADGGDSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
Subjt:  TAEADGGDSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP

XP_038906838.1 uncharacterized protein LOC120092736 [Benincasa hispida]3.66e-8776.1Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRL+SAAA+SA   R  SS SSS SSSDDE       H++FDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGDSSYYSEDEEGS-----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD
        RVKEDPRTAEA   D   YSEDE+       SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRSD+
Subjt:  RVKEDPRTAEADGGDSSYYSEDEEGS-----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD

Query:  -NGFP
         NGFP
Subjt:  -NGFP

TrEMBL top hitse value%identityAlignment
A0A0A0KF89 Uncharacterized protein5.70e-8675.49Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGDSSYYSEDEEGS----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-
        +VKEDPRTA A   D   Y ED++G     SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRSD+ 
Subjt:  RVKEDPRTAEADGGDSSYYSEDEEGS----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-

Query:  NGFP
        NGFP
Subjt:  NGFP

A0A1S4E3A8 uncharacterized protein LOC1034988827.96e-8476.77Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD
        +VKEDPRTA A   D   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRSD+
Subjt:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD

A0A5A7TA84 Uncharacterized protein7.82e-8676.85Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-N
        +VKEDPRTA A   D   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRSD+ N
Subjt:  RVKEDPRTAEADGGDSSYYSED--EEGS-SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-N

Query:  GFP
        GFP
Subjt:  GFP

A0A6J1D688 uncharacterized protein LOC1110174454.28e-128100Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
        MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR

Query:  TAEADGGDSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
        TAEADGGDSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
Subjt:  TAEADGGDSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP

A0A6J1GM82 uncharacterized protein LOC1114557801.20e-8174Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSD---DEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKE
        MKSPDMAA+TDSLEQSFR FSLNHRL SAA ++  R  RSSSSSSS        ++HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYY NCRTGMRV E
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSD---DEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKE

Query:  DPRTAEADGGDSSYYSEDEEGS----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-NGFP
        DPRTAEA   D   YSED++ +    SS D GSEESC SSS G  R+Q     EEDVLVVAGCKRCFMYFMVPKQVEDCPKCSS  LVHFDRS+D NGFP
Subjt:  DPRTAEADGGDSSYYSEDEEGS----SSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSL-LVHFDRSDD-NGFP

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G28070.1 unknown protein3.7e-2845.11Show/hide
Query:  MAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPRTAEAD
        MA IT+ LE+S +N SL                R SS       SD+     D  LEL+SH S+P   EQCLDLKTGE+YY +  +GMRVKEDPR + + 
Subjt:  MAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPRTAEAD

Query:  GGDSSYYSEDEEGS--SSDDGG----SEESCCSSSCGGR---RKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR
        G  +   S +  G+  SS++      SEES   SS   R   +++ +EDVLVVAGCK C MYFMVPK  +DCPKC++ L+HFD+
Subjt:  GGDSSYYSEDEEGS--SSDDGG----SEESCCSSSCGGR---RKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR

AT2G33510.1 CONTAINS InterPro DOMAIN/s: WW/Rsp5/WWP (InterPro:IPR001202)5.4e-4051.28Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKED
        MK+P+M  IT+SLE+S  N SLN R            RR         SS +EH     D TLELNSH+SLP  WEQCLDLKTGE+YYIN + GMRVKED
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKED

Query:  PR---TAEADGG----------DSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR
        PR    A+ D G          DSSYY  +E  S S     E            ++ EEDVLVVAGCK CFMYFMVPK VEDCPKC++ L+HFDR
Subjt:  PR---TAEADGG----------DSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR

AT2G33510.2 unknown protein5.6e-3747.62Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLK---------------TGE
        MK+P+M  IT+SLE+S  N SLN R            RR         SS +EH     D TLELNSH+SLP  WEQCLDLK               TGE
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLK---------------TGE

Query:  VYYINCRTGMRVKEDPR---TAEADGG----------DSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPK
        +YYIN + GMRVKEDPR    A+ D G          DSSYY  +E  S S     E            ++ EEDVLVVAGCK CFMYFMVPK VEDCPK
Subjt:  VYYINCRTGMRVKEDPR---TAEADGG----------DSSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPK

Query:  CSSLLVHFDR
        C++ L+HFDR
Subjt:  CSSLLVHFDR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAAATCTCCGGATATGGCGGCGATTACTGATTCTCTGGAGCAGTCTTTCCGTAACTTCTCCCTCAATCATCGCCTCTCCTCGGCTGCCGCGGCCTCCGCCGCAAGGCC
CCGGAGGTCCTCCTCCTCTTCCTCTTCACCTTCTTCTTCCGACGACGAACATCATCGCTTCGACACAACCTTGGAACTCAACTCTCACATCTCCCTCCCTCCTTTCTGGG
AACAATGCCTCGATTTAAAGACAGGGGAAGTGTACTACATCAACTGCCGGACCGGGATGAGAGTAAAGGAAGATCCTCGGACGGCGGAAGCAGACGGCGGAGACTCTTCG
TACTACTCGGAAGACGAGGAGGGGAGCTCGTCGGACGACGGCGGGAGCGAGGAGTCGTGTTGTTCGTCGTCGTGCGGTGGTAGGAGAAAGCAAAACGAGGAGGACGTGCT
GGTGGTGGCCGGATGCAAGAGATGCTTCATGTACTTCATGGTGCCGAAGCAGGTGGAAGATTGCCCCAAATGCAGCAGTCTTCTTGTTCATTTCGATCGCTCCGACGATA
ATGGCTTCCCATGA
mRNA sequenceShow/hide mRNA sequence
GTTTTTTGAAGAATATTATGTCAGAAACGTGTCAGGTAATGTAGAAATTTAAATTTAGATGGAGATAACTTAAGAAATAAATTATGTTGATGTGGGTGGATATATTTTAA
AATTGAAGTATTTAAAAACAAAGAATATGTTCTCCAGTTTATATATAATTTAGGGAAGAGAAAAAAAGAAAAAGTGAGGAGATGTCGAGGAAAGCTCCGGCATTCTTTTT
GGTAATGAGCGGATCACTCGGCCCAAAAGAAAAAAGGGAAAAATCTCACGCTCCAACCGACGTGTTTTCTGTTCAGCGGTTGGCGGGCGATTGGGGTTATGCGCGCGTGG
GGCTCATCCGTTTTCTTTTCGTTGATGACACGTGGCATGCTATTCGGTTGCTACAGTTCGGAATCTGTGGGTCCCAGTGGAGAACTCCCACGCGCACTCACGACGGCTTC
GGCTGGCTTGACCCGTCTTGGTTTTGTTGTATTCTATAATTCATTTCTCATCCGATGGCATAACACAACACAACACAACACAGCCTTCGTTCTTTTTCTTTCTTCCGTTG
ATCTTCTTCTTCTTCTTCCTCCTCCAGATGAAATCTCCGGATATGGCGGCGATTACTGATTCTCTGGAGCAGTCTTTCCGTAACTTCTCCCTCAATCATCGCCTCTCCTC
GGCTGCCGCGGCCTCCGCCGCAAGGCCCCGGAGGTCCTCCTCCTCTTCCTCTTCACCTTCTTCTTCCGACGACGAACATCATCGCTTCGACACAACCTTGGAACTCAACT
CTCACATCTCCCTCCCTCCTTTCTGGGAACAATGCCTCGATTTAAAGACAGGGGAAGTGTACTACATCAACTGCCGGACCGGGATGAGAGTAAAGGAAGATCCTCGGACG
GCGGAAGCAGACGGCGGAGACTCTTCGTACTACTCGGAAGACGAGGAGGGGAGCTCGTCGGACGACGGCGGGAGCGAGGAGTCGTGTTGTTCGTCGTCGTGCGGTGGTAG
GAGAAAGCAAAACGAGGAGGACGTGCTGGTGGTGGCCGGATGCAAGAGATGCTTCATGTACTTCATGGTGCCGAAGCAGGTGGAAGATTGCCCCAAATGCAGCAGTCTTC
TTGTTCATTTCGATCGCTCCGACGATAATGGCTTCCCATGAGAGAGCCAACCACATTTCCAAAATCAAACTGTATTTGGTATTTGGGTTAACCTGACAAAATCATTGATT
CTTTTTCCTTCGATATTATTGATTGGGTGCAAACTGCAAAGGGCGAACGGAGTTTTAATTTCTTTTGCTCGTCATTAATTAATTTCCTCGGTATAACATCTCTCTGTAGA
GTGTAGTTTAATTAATTTGTTGTCGTTGTTGTGGTTTTCCTTATGGATTGGAAGTTTTTATTGAAAAGAAAAAAGGAAATGAAAAGAATCTTGTGATGGGGGTTCTGCCA
TGGATGGTCTGTGGAGGTGTGAGTGGGATGGTCAACGACTCTAATCGAAGAAGAAGGAATAATATTTGCTCGTGAAGACAGCGACTTGTTGCTTTCATTATTCCACA
Protein sequenceShow/hide protein sequence
MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPRTAEADGGDSS
YYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP