CuGenDBv2

Gene ID	Spg033665
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	SAP30_Sin3_bdg domain-containing protein
Genome location	scaffold13:39054257..39056935
RNA-Seq Expression	Spg033665
Synteny	Spg033665
Gene Ontology terms	GO:0006355 - regulation of transcription, DNA-templated (biological process) GO:0000118 - histone deacetylase complex (cellular component) GO:0003712 - transcription coregulator activity (molecular function)
InterPro domains	IPR024145 - Histone deacetylase complex subunit SAP30/SAP30-like IPR038291 - SAP30, C-terminal domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004152712.1 uncharacterized protein LOC101220556 isoform X1 [Cucumis sativus]

3.4e-89

96.63

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWN ++MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGST+VDLSKLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

XP_022144390.1 uncharacterized protein LOC111014080 isoform X1 [Momordica charantia]

6.8e-90

97.19

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWNGL+MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGST+VDL KLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

XP_022144391.1 uncharacterized protein LOC111014080 isoform X2 [Momordica charantia]

2.2e-88

97.19

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWNGL+MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGST VDL KLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

XP_022962615.1 uncharacterized protein LOC111463011 isoform X1 [Cucurbita moschata]

5.7e-89

77.97

Show/hide

Query:  MIEAVETSIN-GGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEF
        MI+AVE+SIN GGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPT NEEDDDLEF
Subjt:  MIEAVETSIN-GGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEF

Query:  ENLQWNGLEMASDDAQKSHKSRHKLHKSSG-SSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLVSRRYSQPVKRAIGRSGSEAF
        ENLQWNG++MASDDAQK HKSRH+LHKSSG SSHKTMSRSLSCDSQSKSSVSAPQGST+VDLSKLEM ALWRYW+HFNLV      P K  +       F
Subjt:  ENLQWNGLEMASDDAQKSHKSRHKLHKSSG-SSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLVSRRYSQPVKRAIGRSGSEAF

Query:  HVTATGRVAGHNGFCEGCKETEDSVQMRGGEELGNP
               +    GF +  K  + +VQ+RGGE+LGNP
Subjt:  HVTATGRVAGHNGFCEGCKETEDSVQMRGGEELGNP

XP_038883974.1 uncharacterized protein LOC120074938 isoform X1 [Benincasa hispida]

5.7e-89

96.63

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWNG++MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSA QGST+VDLSKLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LNK2 SAP30_Sin3_bdg domain-containing protein

1.6e-89

96.63

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWN ++MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGST+VDLSKLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

A0A1S3BAV7 uncharacterized protein LOC103487947 isoform X1

1.6e-89

96.63

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWN ++MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGST+VDLSKLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

A0A5A7VFZ9 Histone deacetylase complex subunit SAP30/SAP30-like protein

1.6e-89

96.63

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWN ++MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGST+VDLSKLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

A0A6J1CRH4 uncharacterized protein LOC111014080 isoform X1

3.3e-90

97.19

Show/hide

Query:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
        MIEAVE+SINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE
Subjt:  MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE

Query:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        NLQWNGL+MASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGST+VDL KLEM ALWRYWRHFNLV
Subjt:  NLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

A0A6J1HFL4 uncharacterized protein LOC111463011 isoform X1

2.8e-89

77.97

Show/hide

Query:  MIEAVETSIN-GGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEF
        MI+AVE+SIN GGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPT NEEDDDLEF
Subjt:  MIEAVETSIN-GGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEF

Query:  ENLQWNGLEMASDDAQKSHKSRHKLHKSSG-SSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLVSRRYSQPVKRAIGRSGSEAF
        ENLQWNG++MASDDAQK HKSRH+LHKSSG SSHKTMSRSLSCDSQSKSSVSAPQGST+VDLSKLEM ALWRYW+HFNLV      P K  +       F
Subjt:  ENLQWNGLEMASDDAQKSHKSRHKLHKSSG-SSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLVSRRYSQPVKRAIGRSGSEAF

Query:  HVTATGRVAGHNGFCEGCKETEDSVQMRGGEELGNP
               +    GF +  K  + +VQ+RGGE+LGNP
Subjt:  HVTATGRVAGHNGFCEGCKETEDSVQMRGGEELGNP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G19330.1 unknown protein

4.7e-65

74.87

Show/hide

Query:  MIEAVETS--INGGFSHLQS-CGD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDD
        M+EAV++S  +NGGF  +QS  GD SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSV+E PTGNEEDDD
Subjt:  MIEAVETS--INGGFSHLQS-CGD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDD

Query:  LEFENLQWNGLEM-----ASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        L+FEN Q NG +M     AS+D  K HKS+ +  +SS SSHKTMSRSLS DSQSKSS   P  + +VDLSKLEM AL  YWRHFNLV
Subjt:  LEFENLQWNGLEM-----ASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

AT1G19330.2 unknown protein

1.9e-66

76.37

Show/hide

Query:  MIEAVETS--INGGFSHLQS-CGD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDD
        M+EAV++S  +NGGF  +QS  GD SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSV+E PTGNEEDDD
Subjt:  MIEAVETS--INGGFSHLQS-CGD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDD

Query:  LEFENLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        L+FEN Q NG +M S+D  K HKS+ +  +SS SSHKTMSRSLS DSQSKSS   P  + +VDLSKLEM AL  YWRHFNLV
Subjt:  LEFENLQWNGLEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

AT1G19330.3 unknown protein

1.8e-64

74.47

Show/hide

Query:  MIEAVETS--INGGFSHLQS-CGD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDD
        M+EAV++S  +NGGF  +QS  GD SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSV+E PTGNEEDDD
Subjt:  MIEAVETS--INGGFSHLQS-CGD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDD

Query:  LEFENLQWNGLEM-----ASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSS-VSAPQGSTRVDLSKLEMTALWRYWRHFNLV
        L+FEN Q NG +M     AS+D  K HKS+ +  +SS SSHKTMSRSLS DSQSKSS  + P+   +VDLSKLEM AL  YWRHFNLV
Subjt:  LEFENLQWNGLEM-----ASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSS-VSAPQGSTRVDLSKLEMTALWRYWRHFNLV

AT1G75060.1 unknown protein

1.9e-58

72.09

Show/hide

Query:  GGFSHLQSC-GD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE-NLQWN-G
        GGFS LQSC GD SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSV+E PTGNEED+DLE + + QWN  
Subjt:  GGFSHLQSC-GD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE-NLQWN-G

Query:  LEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
         +M ++D  K HKS+ + H+SS  S K + R +SCDS SK S   P+ + +VDL+KL+M AL RYWRHFNLV
Subjt:  LEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

AT1G75060.2 unknown protein

6.1e-57

72.09

Show/hide

Query:  GGFSHLQSC-GD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE-NLQWN-G
        GGFS LQSC GD SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSV+E PTGNEED+DLE + + QWN  
Subjt:  GGFSHLQSC-GD-SSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFE-NLQWN-G

Query:  LEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV
         +M ++D  K HKS+ + H+SS  S K + R +SCDS SK S   P+    VDL+KL+M AL RYWRHFNLV
Subjt:  LEMASDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATTGAAGCTGTGGAGACTTCCATCAATGGCGGTTTCTCGCACTTGCAGAGCTGTGGGGACAGTAGCGAGGAGGAGCTTTCGGTTCTTCCTCGTCATACCAAGGTCGT
CGTTACCGGAAATAATCGAACCAAATCGGTCCTCGTTGGACTTCAAGGCGTCGTCAAGAAAGCCGTTGGCCTTGGCGGCTGGCATTGGCTGGTTCTAACAAATGGAATAG
AAGTGAAACTACAACGGAATGCCCTTAGCGTGATCGAGGCTCCGACGGGTAATGAGGAAGACGACGACCTCGAATTTGAGAACTTGCAATGGAATGGATTGGAGATGGCA
TCCGATGACGCCCAAAAATCCCACAAATCAAGGCATAAATTACACAAATCATCTGGGTCATCTCACAAGACTATGAGCAGATCCCTTTCCTGTGACTCACAGTCGAAGAG
CTCGGTTTCTGCACCGCAAGGATCCACGAGGGTTGACCTTAGTAAATTGGAGATGACTGCATTATGGAGATATTGGCGACACTTCAATCTCGTAAGTAGACGCTATTCCC
AACCCGTCAAAAGAGCAATTGGTAGATCTGGTTCAGAGGCATTTCATGTCACAGCAACTGGACGAGTTGCAGGTCATAATGGGTTTTGTGAAGGCTGCAAAGAGACTGAA
GACAGTGTGCAAATGAGAGGAGGAGAGGAACTGGGGAATCCATCG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MIEAVETSINGGFSHLQSCGDSSEEELSVLPRHTKVVVTGNNRTKSVLVGLQGVVKKAVGLGGWHWLVLTNGIEVKLQRNALSVIEAPTGNEEDDDLEFENLQWNGLEMA
SDDAQKSHKSRHKLHKSSGSSHKTMSRSLSCDSQSKSSVSAPQGSTRVDLSKLEMTALWRYWRHFNLVSRRYSQPVKRAIGRSGSEAFHVTATGRVAGHNGFCEGCKETE
DSVQMRGGEELGNPS

Spg033665 (gene) of Sponge gourd (cylindrica) v1 genome