CuGenDBv2

Gene ID	Tan0015678
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Nascent polypeptide-associated complex subunit alpha, muscle-specific form
Genome location	LG07:74408182..74411065
RNA-Seq Expression	Tan0015678
Synteny	Tan0015678
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6571464.1 hypothetical protein SDJN03_28192, partial [Cucurbita argyrosperma subsp. sororia]

2.2e-97

88.78

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAV+VVEQHRNQYYGR++PH PARF S PSRDFRGMNCRSFQSGAGILPTPLKAC S TK  YPSSPKTPPTCLSSN+GNGKQLA+V+SAPIPI  KFS
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL
        NKNSA HEEFYD +FSFSELWAGPTYSNSPPPSSLPIPKFSVAKRT SLELPRSAPEFEMH PSAKSAPPSPTREL  SSRF FHSADSATKTLRRILNL
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL

Query:  DVDNE
        DVDNE
Subjt:  DVDNE

KAG6606421.1 hypothetical protein SDJN03_03738, partial [Cucurbita argyrosperma subsp. sororia]

1.4e-86

82.52

Show/hide

Query:  MEAVVVVE-QHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKF
        MEAVVVVE QHRNQYYG       A FGS PSRDFRG+NCRSFQSGAGILPTP KA TSET+ FYPSSPKTP TCLSSNSGN K  ATV +APIPIK KF
Subjt:  MEAVVVVE-QHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKF

Query:  SNKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILN
         N NS  HEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTS E+PRSAPEF++HHPSAKSAPPSPTR+ NFS RFFFH+ DSATKTLRRIL+
Subjt:  SNKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILN

Query:  LDVDNE
        LDVDNE
Subjt:  LDVDNE

KAG7011227.1 hypothetical protein SDJN02_26130, partial [Cucurbita argyrosperma subsp. argyrosperma]

6.3e-84

87.85

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAV+VVEQHRNQYYGR++PH PARF S PSRDFRGMNCRSFQSGAGILPTPLKAC S TK  YPSSPKTPPTCLSSN+GNGKQLA+V+SAPIPI  KFS
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSR
        NKNSA HEEFYD +FSFSELWAGPTYSNSPPPSSLPIPKFSVAKRT SLELPRSAPEFEMH PSAKSAPPSPTREL  SSR
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSR

KGN47907.1 hypothetical protein Csa_004001 [Cucumis sativus]

2.7e-95

88.29

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAVVV+EQHRNQYY RVKPH PARFGSL SRDFRGMNCRSFQSGAGILPTPLKAC SET+ FYP SPKTPP CL+SNS N KQLAT+RSAPIPIK K S
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL
        N+++AFHEEFYD SFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLEL RSAPEFEMHHPSAKSAPPSPTR+ NFS+RFFFHSADSATKTLRRILNL
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL

Query:  DVDNE
        DV NE
Subjt:  DVDNE

XP_016900729.1 PREDICTED: uncharacterized protein LOC107990294 [Cucumis melo]

1.7e-92

86.34

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAVVV+EQHRNQYY RVKPH PARFGSL SRDF GMNCRSFQSGAGILPTPLKACTSET+ FYP SPKTPP  L+SNS N KQLAT RSAPI IK K S
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL
        N+++ FHEEFYD SFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLEL RSAPEFEMHHPSAKSAPPSPTR+ +FS+R+FFHSADSATKTLRRILNL
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL

Query:  DVDNE
        DVDNE
Subjt:  DVDNE

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KHP6 Uncharacterized protein

1.3e-95

88.29

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAVVV+EQHRNQYY RVKPH PARFGSL SRDFRGMNCRSFQSGAGILPTPLKAC SET+ FYP SPKTPP CL+SNS N KQLAT+RSAPIPIK K S
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL
        N+++AFHEEFYD SFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLEL RSAPEFEMHHPSAKSAPPSPTR+ NFS+RFFFHSADSATKTLRRILNL
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL

Query:  DVDNE
        DV NE
Subjt:  DVDNE

A0A1S4DXL6 uncharacterized protein LOC107990294

8.0e-93

86.34

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAVVV+EQHRNQYY RVKPH PARFGSL SRDF GMNCRSFQSGAGILPTPLKACTSET+ FYP SPKTPP  L+SNS N KQLAT RSAPI IK K S
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL
        N+++ FHEEFYD SFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLEL RSAPEFEMHHPSAKSAPPSPTR+ +FS+R+FFHSADSATKTLRRILNL
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNL

Query:  DVDNE
        DVDNE
Subjt:  DVDNE

A0A5A7UUU2 Nascent polypeptide-associated complex subunit alpha, muscle-specific form

1.6e-72

81.11

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAVVV+EQHRNQYY RVKPH PARFGSL SRDF GMNCRSFQSGAGILPTPLKACTSET+ FYP SPKTPP  L+SNS N KQLAT RSAPI IK K S
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSS
        N+++ FHEEFYD SFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLEL RSAPEFEMHHPSAK    +P   L  S+
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSS

A0A5D3CPQ8 Nascent polypeptide-associated complex subunit alpha, muscle-specific form

1.6e-72

81.11

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS
        MEAVVV+EQHRNQYY RVKPH PARFGSL SRDF GMNCRSFQSGAGILPTPLKACTSET+ FYP SPKTPP  L+SNS N KQLAT RSAPI IK K S
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFS

Query:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSS
        N+++ FHEEFYD SFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLEL RSAPEFEMHHPSAK    +P   L  S+
Subjt:  NKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSS

A0A6P4A757 uncharacterized protein LOC107425950

1.6e-56

64.47

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTP-PTCLSSNSGNGKQLATVRSAPIPIKTKF
        ME +VVV QHRNQYY R KP  PAR+GS PSRDFRG+NCRSFQS AG+LPTP KACTS   +   SSPKTP P+  S      + L   +S PI I    
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTP-PTCLSSNSGNGKQLATVRSAPIPIKTKF

Query:  SNKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSV-AKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLR
        S+K   F EE  + + SFSELWAGP YSNSPPPSSLPIPKFSV  KRT SLELP SAPE EM HP AKSAPPSPTRE N S R  F SA+ ATKTL+
Subjt:  SNKNSAFHEEFYDPSFSFSELWAGPTYSNSPPPSSLPIPKFSV-AKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G02715.1 unknown protein

3.9e-31

44.91

Show/hide

Query:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPS---SPKTPPTCL------SSNSGNGKQLATVRSA
        ME ++V  +HR+QYYG+ K     RF S PS+ FR +NCR+FQSG G+LP P +  ++   +   S   SP++P + L      S +SG        R++
Subjt:  MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPS---SPKTPPTCL------SSNSGNGKQLATVRSA

Query:  PIPIKTKFSNKNSAFHEEFYDP--SFSFSELWAGPTYSNSPPPSSLPIPKFSV-AKRTTSLELPRSAPEFEMH-HPSAKSAPPSPTRELNFSSRFFFHSA
        PIPI     ++      EF D   S S+SELWAGPTYSNSPPP+S+PIPKFS+  KRT SL  P  AP+  +     AKSAP SPT     S    F S 
Subjt:  PIPIKTKFSNKNSAFHEEFYDP--SFSFSELWAGPTYSNSPPPSSLPIPKFSV-AKRTTSLELPRSAPEFEMH-HPSAKSAPPSPTRELNFSSRFFFHSA

Query:  DSATKTLRRILNLDVD
         SAT TLRR+LNL+++
Subjt:  DSATKTLRRILNLDVD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGCCGTGGTCGTTGTTGAGCAGCATAGGAACCAATATTATGGTCGGGTCAAGCCGCATGAGCCAGCTCGATTTGGATCACTCCCGTCCCGGGACTTCAGAGGGAT
GAACTGTAGGAGTTTTCAATCGGGAGCTGGTATACTCCCAACTCCCTTGAAGGCTTGTACCTCTGAAACTAAACAGTTCTACCCTTCTTCTCCCAAAACACCACCAACTT
GTTTAAGTTCCAACTCCGGAAATGGTAAACAACTTGCTACTGTGCGAAGTGCTCCAATTCCTATCAAAACCAAGTTTTCAAACAAGAACAGTGCTTTCCATGAAGAATTC
TATGATCCAAGTTTCTCATTCTCTGAGCTTTGGGCTGGACCCACTTACTCAAATTCACCGCCCCCAAGTTCATTGCCCATTCCAAAATTTTCAGTTGCTAAGAGAACCAC
GTCACTGGAGTTGCCTCGTTCTGCTCCTGAATTTGAAATGCATCATCCATCTGCCAAGTCTGCACCACCATCCCCAACTCGAGAGCTAAACTTTTCCTCCAGATTTTTCT
TTCATAGTGCTGACTCTGCGACTAAGACTCTACGTCGCATTCTTAATCTTGATGTTGACAATGAATGA

mRNA sequence

Show/hide mRNA sequence

CAATGCTCGGGGCTTGGGCATGATATTTAAATACAACTCTGAAAGCATTTCAGATCCGTGGATTCTGGTTCAAACCCTCGCTGGGGGCTCAATCTTCATCTCCATGGCAG
CACTCTAATCCAAACTGGAGATAATCTTCGAAAAAGAAAAAACATAAACAAAAAAAAAAACAAAAACAAAAACAAAAAAAAGAAGGAGAAAAAAATAGGAAAAAATTAGA
ACCGCTAGAGTTCGTTGACGAAGAATTTCAGTCTATATCTTCGTTACGGTTCATCTTTATCTTCTATAGATCTTAATCCTACTGAAGAACTTCCTCGATAATTCCGCTAA
GCTGGTTGAATCGTCGGTTTGTTCGATTTGGATCTAGCGTGGAAGGTTGTGACTTTTAGTTTAGTTTAGTTTAGTTTAGTTATCAGCCTTGTGTTGAGTTGTAGAGGTTG
GATCTACTGGGAGAAACTGAAATTGTGTCTCTAACTTAAAACTGGATACATACTTTGACTTGGAAGTTGTTTTGCTATGGAAGCCGTGGTCGTTGTTGAGCAGCATAGGA
ACCAATATTATGGTCGGGTCAAGCCGCATGAGCCAGCTCGATTTGGATCACTCCCGTCCCGGGACTTCAGAGGGATGAACTGTAGGAGTTTTCAATCGGGAGCTGGTATA
CTCCCAACTCCCTTGAAGGCTTGTACCTCTGAAACTAAACAGTTCTACCCTTCTTCTCCCAAAACACCACCAACTTGTTTAAGTTCCAACTCCGGAAATGGTAAACAACT
TGCTACTGTGCGAAGTGCTCCAATTCCTATCAAAACCAAGTTTTCAAACAAGAACAGTGCTTTCCATGAAGAATTCTATGATCCAAGTTTCTCATTCTCTGAGCTTTGGG
CTGGACCCACTTACTCAAATTCACCGCCCCCAAGTTCATTGCCCATTCCAAAATTTTCAGTTGCTAAGAGAACCACGTCACTGGAGTTGCCTCGTTCTGCTCCTGAATTT
GAAATGCATCATCCATCTGCCAAGTCTGCACCACCATCCCCAACTCGAGAGCTAAACTTTTCCTCCAGATTTTTCTTTCATAGTGCTGACTCTGCGACTAAGACTCTACG
TCGCATTCTTAATCTTGATGTTGACAATGAATGAACTCCGGGGAGCATCAAGCTCCTGTAAATAGGCTTACTTTGTGAGCTGCTTAGTGTCATGTATATAGAATGAATAA
ATTGGTTAGTGATGACAGTCATGAGTATCCTTAGTTTTCAGTGCTGGTGTGCATCCTCCGATTGCAGCTACGGGCTCTGATACCTTCAACTAATATCCAGATGTTGCACC
TTAATCTGTGCTTAGATGCTGATCTGGATTGGGTTCTGGCAGACAAAGACAAGATAGGGTGTGATAGATACACAGATTAAATCAAGATATTCGAAAGGCAGAAGTAGGCT
GTTGGTGAACTTTAATGTTGTTGTGAATGAAACCTTCATTCTGCACTGCATGAATCTGCTGGCTTTTATCTATCTAGTTAAATATGAACATTGCTAAGAGTAGTCATGGA
TCTGCTGGCTATTATCTCTGTCCCGGCCATCATGTCCTTACCAAATTCTCAGTTTTCATTCCATTCTAGAGTTTAGGTAGTCATGTAATTTGTATCATACTGTAGGATCC
CAAACTAATGCTTCATTTAAGATTTGTAGGCTTCTGTTTCATTCTTTTCATCCATTCCTTACTTACATCCTCGGTTCTAGTTGCTATCCTTCTTACATAGATAGTCCGAT
GACTTATTGGTTAGGTTCTTTGTCCCTGATGAATCGGTTATTCGACAGTTAAATCTCTCCTTTTCTTAATAGTTAATATCCTCAATCCTATACCTCCTCTAATCATCTTA
TAGCTTCACTCCTTTGCCTGCACACTATTGAGGGAGATATTCCTTCTTTTCTGCCTTTTCAGTTTTTTTGAAAGAAAAGGTGGGGTAGGATAGTGATAGTTATGACTTTC
TAGTTTGCTTCTTTTTGGGATTACTCCGTGTAGGATTTTCCTGGTTTCAGTGCCTCCTGGTTTTGTCATCTGTGTACCTGTCTAGTATGGAACTTTCTTACTGGGTTTTT
GCAAGGTTCGTGGTCCTTCTCGGAGATCATTGATCACATGGAGTGGTATATGAGACAACCTAAGGGTGAACAGTTCAGGTGATGGTTTCAGTAGTAGTATAGTTGGTTTG
CTGTGGACGTAGTTCGTCACCAGAGAAAGTCTTCTTCTTAGAAGCCTAGGTCCAGTGTATGTTTGTTTATCCTTGTATTGAAAGCTGTACACTCTCAGAGTCCTACTGTT
GGTCGTTGGAGCTTTTTTCTTTTTCCTTCATATCAGTTTGAATGGTAATTGCCTTCGATTTCTGTTTTGAAGAGCAATGTTTATTGCATCTCCAGAAAGTGAAGCAATAT
TGTAATGTTAATGTTATTTCAGTTTGTTAGCTACTTGGTTATGTAAAATCGATAAGATATCGTAAAAGCTTTGTTATAGATTCGTTTTCTGCTACATGTTGAGAACCACA
TGGGAATGATGAAGAAATCTGGAAAACTAAGGGCCCG

Protein sequence

Show/hide protein sequence

MEAVVVVEQHRNQYYGRVKPHEPARFGSLPSRDFRGMNCRSFQSGAGILPTPLKACTSETKQFYPSSPKTPPTCLSSNSGNGKQLATVRSAPIPIKTKFSNKNSAFHEEF
YDPSFSFSELWAGPTYSNSPPPSSLPIPKFSVAKRTTSLELPRSAPEFEMHHPSAKSAPPSPTRELNFSSRFFFHSADSATKTLRRILNLDVDNE

Tan0015678 (gene) of Snake gourd v1 genome