; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Moc06g06310 (gene) of Bitter gourd (OHB3-1) v2 genome

Gene IDMoc06g06310
OrganismMomordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
DescriptionSerine-rich protein-like protein
Genome locationchr6:4551978..4553364
RNA-Seq ExpressionMoc06g06310
SyntenyMoc06g06310
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7021750.1 hypothetical protein SDJN02_15477, partial [Cucurbita argyrosperma subsp. argyrosperma]1.7e-7891.4Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV
        MAVSSRKSSGPVLRSLSPSGRFY SYSSS SS SSAFASSTS+FSTRN T FFRRS SP+R+NLQ SSSPSASSVRFSLDRSISPNRP+SV TR SG+QV
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV

Query:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        VKRQ NQKRTCMCSPTTHPGSFRCSLHKG PSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

XP_022135541.1 uncharacterized protein DDB_G0271670-like [Momordica charantia]5.9e-8797.89Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASY----SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSS
        MAVSSRKSSGPVLRSLSPSGRFYASY    SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSS
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASY----SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSS

Query:  GSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        GSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  GSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

XP_022933728.1 uncharacterized protein LOC111441057 [Cucurbita moschata]1.7e-7891.4Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV
        MAVSSRKSSGPVLRSLSPSGRFY SYSSS SS SSAFASSTS+FSTRN T FFRRS SP+R+NLQ SSSPSASSVRFSLDRSISPNRP+SV TR SG+QV
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV

Query:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        VKRQ NQKRTCMCSPTTHPGSFRCSLHKG PSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

XP_022966156.1 uncharacterized protein LOC111465917 [Cucurbita maxima]1.7e-7891.4Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV
        MAVSSRKSSGPVLRSLSPSGRFY SYSSS SS SSAFASSTS+FSTRN T FFRRS SP+R+NLQ SSSPSASSVRFSLDRSISPNRP+SV TR SG+QV
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV

Query:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        VKRQ NQKRTCMCSPTTHPGSFRCSLHKG PSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

XP_023530348.1 uncharacterized protein LOC111792947 [Cucurbita pepo subsp. pepo]6.5e-7890.86Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV
        MAVSSRKSSGPVLRSLSPSGRFY SYSSS SS SSAFASSTS+FSTRN T FFRRS SP+R++LQ SSSPSASSVRFSLDRSISPNRP+SV TR SG+QV
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV

Query:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        VKRQ NQKRTCMCSPTTHPGSFRCSLHKG PSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

TrEMBL top hitse value%identityAlignment
A0A0A0LW36 Uncharacterized protein2.3e-7688.77Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGS-Q
        MAVSSRKSSGPVLRSLSPSGRFY S SS SSSSSSAFASSTS+FSTRNATSFF RS SP+RVNLQGSSSPSASSVRFSLDRSISPNRP+SVL+R+SG+ Q
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGS-Q

Query:  VVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        VVK+Q  QKRTCMCSPTTHPGSFRCSLHKG  SQPSTPYSSNRLNARRSAMTNSLVRIGGVEGD+++RALASLIRPSSHSQRRR DF
Subjt:  VVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

A0A6J1C124 uncharacterized protein DDB_G0271670-like2.9e-8797.89Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASY----SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSS
        MAVSSRKSSGPVLRSLSPSGRFYASY    SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSS
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASY----SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSS

Query:  GSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        GSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  GSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

A0A6J1F5M8 uncharacterized protein LOC1114410578.3e-7991.4Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV
        MAVSSRKSSGPVLRSLSPSGRFY SYSSS SS SSAFASSTS+FSTRN T FFRRS SP+R+NLQ SSSPSASSVRFSLDRSISPNRP+SV TR SG+QV
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV

Query:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        VKRQ NQKRTCMCSPTTHPGSFRCSLHKG PSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

A0A6J1HNK6 uncharacterized protein LOC1114659178.3e-7991.4Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV
        MAVSSRKSSGPVLRSLSPSGRFY SYSSS SS SSAFASSTS+FSTRN T FFRRS SP+R+NLQ SSSPSASSVRFSLDRSISPNRP+SV TR SG+QV
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQV

Query:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        VKRQ NQKRTCMCSPTTHPGSFRCSLHKG PSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
Subjt:  VKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

A0A6J1JI11 uncharacterized serine-rich protein C215.13-like1.6e-7485.86Show/hide
Query:  MAVSSRKSSGPVLRSLSPSGRFYASY-----SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRS
        MAVSSRKSSGP +RSLSPSGRF   Y     SSSSSSSSSAFASSTS+FST N TSFFRRS SP+RV+LQGSSS SASSVRF+LDRSISPNR +SVLTR 
Subjt:  MAVSSRKSSGPVLRSLSPSGRFYASY-----SSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRS

Query:  SGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        SG+QVVKRQ NQKRTC+CSPTTHPGSFRCSLHKG PSQP+TPYSSNRLNARRSAMTNSLVRIGGVEGDLV+RALASLIRPSSHSQRRRADF
Subjt:  SGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G67910.1 unknown protein7.9e-0557.58Show/hide
Query:  GSQVVKRQGNQKRT-CMCSPTTHPGSFRCSLHK
        GS+ + RQ +  +T C+CSPTTHPGSFRC +H+
Subjt:  GSQVVKRQGNQKRT-CMCSPTTHPGSFRCSLHK

AT5G11090.1 serine-rich protein-related4.6e-3755.72Show/hide
Query:  SSRKSSGPVLRSLSPSGRFYASYSSS-SSSSSSAFASSTSTFSTRNATSFF------------RRSTSPTRVNLQGSSSPSASSVRFSLD-RSISP-NRP
        S  KS+GPVLRS SPSGRF   YS +  SSSSSAFASSTS+  +  +++FF             RS SPTRVNL  ++ P + S R+SLD RSISP N+ 
Subjt:  SSRKSSGPVLRSLSPSGRFYASYSSS-SSSSSSAFASSTSTFSTRNATSFF------------RRSTSPTRVNLQGSSSPSASSVRFSLD-RSISP-NRP

Query:  LSVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHK--GHP-SQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRAD
        +SV    S +Q         R CMCSPTTHPGSFRCSLHK   +P  Q +  Y++N LN RRSAMTNSLVRIGGVEG+ V+RAL +LIRPSSH  +RRA 
Subjt:  LSVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHK--GHP-SQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRAD

Query:  F
        +
Subjt:  F

AT5G20370.1 serine-rich protein-related1.5e-1138.67Show/hide
Query:  RRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLH------KGHPSQPSTPYSSNR-----
        +RS SP   NL         ++R       S  +P SV+T SS  Q        KR C+CSPTTHPGSFRCS H      K      ST   +NR     
Subjt:  RRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLH------KGHPSQPSTPYSSNR-----

Query:  -----LNARRSAMTNSLVRIGGVEGDLVKRAL-ASLIRPSSHSQRRRADF
             LN R+ A+ NSL +IG VE +  +R+L A+L +PSS    RR +F
Subjt:  -----LNARRSAMTNSLVRIGGVEGDLVKRAL-ASLIRPSSHSQRRRADF

AT5G25280.1 serine-rich protein-related1.1e-3552.5Show/hide
Query:  SSRKSSGPVLRSLSPSGRFYASYSS---SSSSSSSAFASSTSTFSTRNATSFF----------RRSTSPTRVNLQGSSSPSASSVRFSLD-RSISPNRPL
        ++R +    LRS SPSGRF   YS+   SSS SSS FASSTS+  +  +T+FF           RS SPTRVNL  +S+P   S R+S+D RSISPNR +
Subjt:  SSRKSSGPVLRSLSPSGRFYASYSS---SSSSSSSAFASSTSTFSTRNATSFF----------RRSTSPTRVNLQGSSSPSASSVRFSLD-RSISPNRPL

Query:  SVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHK--GHP-SQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        +V +    +    +  + +R CMCSPTTHPGSFRCSLHK   +P  Q +  Y++N LN RRSAMTNSLVRIGGVEG+ V+RAL +LIRPSSH  +RR+ +
Subjt:  SVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHK--GHP-SQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF

AT5G25280.2 serine-rich protein-related1.1e-3552.5Show/hide
Query:  SSRKSSGPVLRSLSPSGRFYASYSS---SSSSSSSAFASSTSTFSTRNATSFF----------RRSTSPTRVNLQGSSSPSASSVRFSLD-RSISPNRPL
        ++R +    LRS SPSGRF   YS+   SSS SSS FASSTS+  +  +T+FF           RS SPTRVNL  +S+P   S R+S+D RSISPNR +
Subjt:  SSRKSSGPVLRSLSPSGRFYASYSS---SSSSSSSAFASSTSTFSTRNATSFF----------RRSTSPTRVNLQGSSSPSASSVRFSLD-RSISPNRPL

Query:  SVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHK--GHP-SQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF
        +V +    +    +  + +R CMCSPTTHPGSFRCSLHK   +P  Q +  Y++N LN RRSAMTNSLVRIGGVEG+ V+RAL +LIRPSSH  +RR+ +
Subjt:  SVLTRSSGSQVVKRQGNQKRTCMCSPTTHPGSFRCSLHK--GHP-SQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADF


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGGTTTCTTCTAGAAAGTCGAGCGGGCCGGTTCTGAGGTCTCTCTCCCCTTCTGGGAGATTCTATGCCTCCTATTCTTCTTCTTCGTCTTCTTCTTCGTCG
GCCTTTGCGTCGTCGACTTCGACTTTTTCCACCAGAAATGCCACTTCGTTTTTCCGTAGATCTACGTCTCCCACTCGCGTCAATCTTCAAGGTTCTTCTTCTCCG
TCGGCGTCGTCTGTGCGGTTTTCACTCGATCGATCCATTTCTCCGAATCGGCCTCTCTCCGTTTTGACTCGTAGCAGTGGGAGTCAAGTAGTGAAGAGGCAGGGC
AACCAGAAGAGGACCTGCATGTGCTCTCCGACCACGCATCCTGGTTCGTTCCGGTGTAGTCTCCACAAAGGCCATCCGTCGCAGCCTTCGACTCCTTACTCATCT
AATCGCCTCAACGCTCGGAGATCGGCGATGACGAACTCTCTGGTCAGAATCGGAGGAGTTGAAGGCGATTTGGTGAAGCGGGCCTTGGCGTCTCTCATCCGGCCT
TCGTCTCACAGTCAAAGGCGCCGAGCGGATTTCCTTTTCGACGACGAAGACGGCGGATTCCGACCACAGAGCGGCTGTGTTTGTCCGTTCGGCGTCGACCATCTC
CTTCCTTCCGTTGTTGCCTTCTCCGTTCATCGTCGGCGTGAAATTAAAGCCAGAAATTTATTCACTCGTGCTACCGCTATCCGTTCCGTCAAGCATAGTGATTTC
TCAAAGATTCATTTGCAGGTTGAAATGGAAGACACTGAACTGTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCGGTTTCTTCTAGAAAGTCGAGCGGGCCGGTTCTGAGGTCTCTCTCCCCTTCTGGGAGATTCTATGCCTCCTATTCTTCTTCTTCGTCTTCTTCTTCGTCG
GCCTTTGCGTCGTCGACTTCGACTTTTTCCACCAGAAATGCCACTTCGTTTTTCCGTAGATCTACGTCTCCCACTCGCGTCAATCTTCAAGGTTCTTCTTCTCCG
TCGGCGTCGTCTGTGCGGTTTTCACTCGATCGATCCATTTCTCCGAATCGGCCTCTCTCCGTTTTGACTCGTAGCAGTGGGAGTCAAGTAGTGAAGAGGCAGGGC
AACCAGAAGAGGACCTGCATGTGCTCTCCGACCACGCATCCTGGTTCGTTCCGGTGTAGTCTCCACAAAGGCCATCCGTCGCAGCCTTCGACTCCTTACTCATCT
AATCGCCTCAACGCTCGGAGATCGGCGATGACGAACTCTCTGGTCAGAATCGGAGGAGTTGAAGGCGATTTGGTGAAGCGGGCCTTGGCGTCTCTCATCCGGCCT
TCGTCTCACAGTCAAAGGCGCCGAGCGGATTTCCTTTTCGACGACGAAGACGGCGGATTCCGACCACAGAGCGGCTGTGTTTGTCCGTTCGGCGTCGACCATCTC
CTTCCTTCCGTTGTTGCCTTCTCCGTTCATCGTCGGCGTGAAATTAAAGCCAGAAATTTATTCACTCGTGCTACCGCTATCCGTTCCGTCAAGCATAGTGATTTC
TCAAAGATTCATTTGCAGGTTGAAATGGAAGACACTGAACTGTGA
Protein sequenceShow/hide protein sequence
MAVSSRKSSGPVLRSLSPSGRFYASYSSSSSSSSSAFASSTSTFSTRNATSFFRRSTSPTRVNLQGSSSPSASSVRFSLDRSISPNRPLSVLTRSSGSQVVKRQG
NQKRTCMCSPTTHPGSFRCSLHKGHPSQPSTPYSSNRLNARRSAMTNSLVRIGGVEGDLVKRALASLIRPSSHSQRRRADFLFDDEDGGFRPQSGCVCPFGVDHL
LPSVVAFSVHRRREIKARNLFTRATAIRSVKHSDFSKIHLQVEMEDTEL