CuGenDBv2

Gene ID	Tan0007771
Organism	Trichosanthes anguina (Snake gourd v1)
Description	zinc finger homeobox protein 4-like isoform X1
Genome location	LG02:90253029..90254819
RNA-Seq Expression	Tan0007771
Synteny	Tan0007771
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6585540.1 hypothetical protein SDJN03_18273, partial [Cucurbita argyrosperma subsp. sororia]

2.5e-89

68.38

Show/hide

Query:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
        PHC+     F+P E  VAQIL+E     +KS   LG IP W++RRKRS + SPP+S+     A+V S  SKKVKESSPTSPL LNS P SRSESDE+TNA
Subjt:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA

Query:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ
        K SKKKP++DKKSQ+VEAIDELTKQNQ LKGEF+AM+QHYN LK INS LKAKKQEMILG   SKNES IPEIG  SSAM+ VK  TVESS H       
Subjt:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ

Query:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM
             Q APMAEQS N SQNFQIP+G IPFYDP S+ P+GIPDLNISLEEINQR+YS+FMAARAR+NRIQICKNK+NG  KLQ+PP NPCM
Subjt:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM

KAG7020453.1 hypothetical protein SDJN02_17137, partial [Cucurbita argyrosperma subsp. argyrosperma]

3.6e-88

68.29

Show/hide

Query:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
        PHC+     F+P E  VAQIL+E     +KS   LG IP W++RRKRS + SPP+S+     A+V S  SKKVKESSPTSPL LNS P SRSESDE+TNA
Subjt:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA

Query:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ
        K SKKKP++DKKSQ+VEAIDELTKQNQ LKGEF+AM+QHYN LK INS LKAKKQEMILG   SKNES IPEIG  SSAM+ VK  TVESS H       
Subjt:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ

Query:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPPN
             Q APMAEQS N SQNFQIP+G IPFYDP S+ P+GIPDLNISLEEINQR+YS+FMAARAR+NRIQICKNK+NG  KLQ+PPN
Subjt:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPPN

XP_022951578.1 uncharacterized protein LOC111454352 [Cucurbita moschata]

3.8e-90

68.73

Show/hide

Query:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
        PHC+S D  F+P E  VAQIL+E     +KS   LG IP W++RRKRS + SPP+S+     A+V S  SKKVKESSPTSPL LNS P SRSESDE+TNA
Subjt:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA

Query:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ
        K SKKKP++DKKSQ+VEAIDELTKQNQ LKGEF+AM+QHYN LK INS LKAKKQEMILG   SKNES IPEIG  SSAM+ VK  TVESS H       
Subjt:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ

Query:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM
             Q  PMAEQS N SQNFQIP+G IPFYDP S+ P+GIPDLNISLEEINQR+YS+FMAARAR+NRIQICKNK+NG  KLQ+PP NPCM
Subjt:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM

XP_023002465.1 uncharacterized protein LOC111496295 [Cucurbita maxima]

2.9e-90

69.07

Show/hide

Query:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
        P C+S D  F P E  VAQIL+E     +KS   LG IP W++RRKRS + SPP+S+     A+V S  SKKVKESSPTSPL LNS P SRSESDE+TNA
Subjt:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA

Query:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ
        K SKKK ++DKKSQ+VEAIDELTKQNQ LKGEF+AM+QHYN LK INS LKAKKQEMILG   SKNES IPEIG  SSAM+ VK  TVESSNHQ      
Subjt:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ

Query:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM
             Q APMAEQS N SQNFQIP+G IPFYDP S+ P+GIPDLNISLEEINQR+YS+FMAARAR+NRIQICKNK+NG  KLQ+PP NPCM
Subjt:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM

XP_023537124.1 uncharacterized protein LOC111798295 [Cucurbita pepo subsp. pepo]

8.5e-90

68.73

Show/hide

Query:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
        PHC+S D  F P E  VAQIL+E     +KS   LG IP W++RRKRS + SPP+S+     A+V S  SKKVKESSPTSPL LNS P SRSESDE+TNA
Subjt:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA

Query:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ
        K +KKKP+ DKKSQ+VEAIDELTKQNQ LKGEF+AM+QHYN LK INS LKAKKQEMILG   SKNES IPEIG  SSAM+ VK  TVESS H       
Subjt:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ

Query:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM
             Q APMAEQS N SQNFQIP+G IPFYDP S+ P+GIPDLNISLEEINQR+YS+FMAARAR+NRIQICKNK+NG  KLQ+PP NPCM
Subjt:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LRP1 Uncharacterized protein

1.2e-73

58.04

Show/hide

Query:  FNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSA------PAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTN-AKL
        F+P+E +VAQIL +LPLL+Q+S+FSLGL P+W IRRKRS +DSPPD++      P P P  +   SS++ KESSPT+PL+L+S P SRSESDENT  AK+
Subjt:  FNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSA------PAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTN-AKL

Query:  SKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILGSKNESGIPEIGALSS-AMKAVKFTVESSN---HQHHHEFQPS
        SKKK  VDKKSQY+E I++LT Q Q L+G+ +AM++H+ +LKTINS LKAKKQE++ G  N S  P+ G  +S AM+  K TV+SS+     +H E +PS
Subjt:  SKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILGSKNESGIPEIGALSS-AMKAVKFTVESSN---HQHHHEFQPS

Query:  INNQTAPMAEQSTNNSQNFQIPVGAIPFYDPSMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNK-----SNGAAKLQS
        + NQT P+AEQS N+ QN+QIP+G IP YDPS+GP+GIPDLN+SLE+I  ++Y+K++AA+ARQNRIQI KNK     +NGA KLQS
Subjt:  INNQTAPMAEQSTNNSQNFQIPVGAIPFYDPSMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNK-----SNGAAKLQS

A0A1S3BAR4 uncharacterized protein LOC103488049

6.8e-77

61.35

Show/hide

Query:  FNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDS----APAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDEN-TNAKLSK
        F+P+EL+VAQIL +LPLL+QKSNFSLGL P+W IRRKRS +DSPPD+       P P      SS++ KESSPT+PL+LNS P SRSESDEN T AK+SK
Subjt:  FNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDS----APAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDEN-TNAKLSK

Query:  KKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILGSKNESGIPEIGALSS-AMKAVKFTVESSN---HQHHHEFQPSIN
        KK  VDKKSQY+E ID+LT Q Q L+G+ +AM++H+ +LKTINS LKAKKQE++ G  N S  PEIG  SS AM+  K TV+SS      +H E +PS+ 
Subjt:  KKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILGSKNESGIPEIGALSS-AMKAVKFTVESSN---HQHHHEFQPSIN

Query:  NQTAPMAEQSTNNSQNFQIPVGAIPFYDPSMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNK---SNGAAKLQS
        NQT P AEQ  N+++N+QIP+G IP YDPS+GP+GIPDLN+SLE+I  +SY+K++AARARQNRIQI KNK   +NGA KLQS
Subjt:  NQTAPMAEQSTNNSQNFQIPVGAIPFYDPSMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNK---SNGAAKLQS

A0A5A7VHE1 Uncharacterized protein

6.8e-77

61.35

Show/hide

Query:  FNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDS----APAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDEN-TNAKLSK
        F+P+EL+VAQIL +LPLL+QKSNFSLGL P+W IRRKRS +DSPPD+       P P      SS++ KESSPT+PL+LNS P SRSESDEN T AK+SK
Subjt:  FNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDS----APAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDEN-TNAKLSK

Query:  KKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILGSKNESGIPEIGALSS-AMKAVKFTVESSN---HQHHHEFQPSIN
        KK  VDKKSQY+E ID+LT Q Q L+G+ +AM++H+ +LKTINS LKAKKQE++ G  N S  PEIG  SS AM+  K TV+SS      +H E +PS+ 
Subjt:  KKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILGSKNESGIPEIGALSS-AMKAVKFTVESSN---HQHHHEFQPSIN

Query:  NQTAPMAEQSTNNSQNFQIPVGAIPFYDPSMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNK---SNGAAKLQS
        NQT P AEQ  N+++N+QIP+G IP YDPS+GP+GIPDLN+SLE+I  +SY+K++AARARQNRIQI KNK   +NGA KLQS
Subjt:  NQTAPMAEQSTNNSQNFQIPVGAIPFYDPSMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNK---SNGAAKLQS

A0A6J1GI34 uncharacterized protein LOC111454352

1.8e-90

68.73

Show/hide

Query:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
        PHC+S D  F+P E  VAQIL+E     +KS   LG IP W++RRKRS + SPP+S+     A+V S  SKKVKESSPTSPL LNS P SRSESDE+TNA
Subjt:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA

Query:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ
        K SKKKP++DKKSQ+VEAIDELTKQNQ LKGEF+AM+QHYN LK INS LKAKKQEMILG   SKNES IPEIG  SSAM+ VK  TVESS H       
Subjt:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ

Query:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM
             Q  PMAEQS N SQNFQIP+G IPFYDP S+ P+GIPDLNISLEEINQR+YS+FMAARAR+NRIQICKNK+NG  KLQ+PP NPCM
Subjt:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM

A0A6J1KP15 uncharacterized protein LOC111496295

1.4e-90

69.07

Show/hide

Query:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
        P C+S D  F P E  VAQIL+E     +KS   LG IP W++RRKRS + SPP+S+     A+V S  SKKVKESSPTSPL LNS P SRSESDE+TNA
Subjt:  PHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA

Query:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ
        K SKKK ++DKKSQ+VEAIDELTKQNQ LKGEF+AM+QHYN LK INS LKAKKQEMILG   SKNES IPEIG  SSAM+ VK  TVESSNHQ      
Subjt:  KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILG---SKNESGIPEIGALSSAMKAVK-FTVESSNHQHHHEFQ

Query:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM
             Q APMAEQS N SQNFQIP+G IPFYDP S+ P+GIPDLNISLEEINQR+YS+FMAARAR+NRIQICKNK+NG  KLQ+PP NPCM
Subjt:  PSINNQTAPMAEQSTNNSQNFQIPVGAIPFYDP-SMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPP-NPCM

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGTCTTCTTCTTATCCTCCTCCTCCTCCTCATTGTTCCTCCCCCGATCCCCCCTTCAACCCTGACGAACTCTACGTCGCTCAAATCCTCATCGAATTGCCTCTTCT
CGTTCAGAAATCCAACTTTTCTCTCGGCTTAATCCCCGCCTGGTCCATCCGACGCAAGAGATCCGTCATTGATTCGCCGCCGGACTCCGCCCCCGCCCCCGCCCCCGCCG
CTGTCTCCTCTCTGTCGTCCAAGAAGGTCAAAGAGTCCAGCCCTACTTCTCCTCTTGCCCTCAACTCCACGCCCTTTTCCCGGAGTGAATCCGATGAGAATACCAACGCC
AAACTCTCCAAGAAGAAGCCCGCTGTCGATAAGAAATCTCAGTATGTGGAAGCCATTGACGAATTGACCAAGCAGAATCAAGATTTGAAAGGGGAATTTCAGGCTATGCA
GCAACATTATAATAGTCTCAAAACTATCAATTCGAACTTGAAGGCAAAAAAGCAAGAGATGATTCTGGGTTCTAAGAACGAATCAGGAATTCCAGAAATAGGAGCCTTAA
GTTCGGCCATGAAAGCCGTTAAGTTCACTGTCGAGTCCTCAAATCATCAACATCATCATGAATTTCAACCGTCGATCAACAATCAGACGGCTCCCATGGCGGAACAGAGT
ACTAACAACAGTCAGAATTTTCAAATCCCAGTTGGGGCAATTCCTTTCTATGATCCATCAATGGGTCCAATTGGTATTCCTGATTTGAACATATCTCTTGAAGAAATTAA
TCAGAGGAGTTACTCCAAATTCATGGCGGCTCGAGCAAGACAGAACAGGATTCAGATCTGCAAGAACAAGAGCAACGGAGCCGCCAAATTGCAGAGTCCTCCTAATCCCT
GTATGTGA

mRNA sequence

Show/hide mRNA sequence

CCTCTCACTGCTCTCTTTTCTCTTCTTCTATTCTTCCTCTTCTATAAATCCCCCAATCCCTTTTCTTCACTGAATAATTCTCTCTCTCTTTTTCATGGAATTTCGCTTGC
CCTAGACCTCCGTACATCCACTCCCATGGCGTCTTCTTCTTATCCTCCTCCTCCTCCTCATTGTTCCTCCCCCGATCCCCCCTTCAACCCTGACGAACTCTACGTCGCTC
AAATCCTCATCGAATTGCCTCTTCTCGTTCAGAAATCCAACTTTTCTCTCGGCTTAATCCCCGCCTGGTCCATCCGACGCAAGAGATCCGTCATTGATTCGCCGCCGGAC
TCCGCCCCCGCCCCCGCCCCCGCCGCTGTCTCCTCTCTGTCGTCCAAGAAGGTCAAAGAGTCCAGCCCTACTTCTCCTCTTGCCCTCAACTCCACGCCCTTTTCCCGGAG
TGAATCCGATGAGAATACCAACGCCAAACTCTCCAAGAAGAAGCCCGCTGTCGATAAGAAATCTCAGTATGTGGAAGCCATTGACGAATTGACCAAGCAGAATCAAGATT
TGAAAGGGGAATTTCAGGCTATGCAGCAACATTATAATAGTCTCAAAACTATCAATTCGAACTTGAAGGCAAAAAAGCAAGAGATGATTCTGGGTTCTAAGAACGAATCA
GGAATTCCAGAAATAGGAGCCTTAAGTTCGGCCATGAAAGCCGTTAAGTTCACTGTCGAGTCCTCAAATCATCAACATCATCATGAATTTCAACCGTCGATCAACAATCA
GACGGCTCCCATGGCGGAACAGAGTACTAACAACAGTCAGAATTTTCAAATCCCAGTTGGGGCAATTCCTTTCTATGATCCATCAATGGGTCCAATTGGTATTCCTGATT
TGAACATATCTCTTGAAGAAATTAATCAGAGGAGTTACTCCAAATTCATGGCGGCTCGAGCAAGACAGAACAGGATTCAGATCTGCAAGAACAAGAGCAACGGAGCCGCC
AAATTGCAGAGTCCTCCTAATCCCTGTATGTGATCGCAGAGTTCAACAAATTCGACAATTCCACATTTTTACATTCTTTTTTTATCTTAGTATTCAATTTCATCAATTTG
ATGATGGGGGGCCTATTTTGATTGTGGAATTTGGGGTAGGTTTTTAATTTTTATTTTTATTTTAATTTTGTCCTTTTTGTAGATTTTTGAATTGGGGGTTACTCCAATTG
TAAAGTTAGATAGAATCCTAAGAGCTGCCCCCTCTAGTGAGCCATTCTATTTTTT

Protein sequence

Show/hide protein sequence

MASSSYPPPPPHCSSPDPPFNPDELYVAQILIELPLLVQKSNFSLGLIPAWSIRRKRSVIDSPPDSAPAPAPAAVSSLSSKKVKESSPTSPLALNSTPFSRSESDENTNA
KLSKKKPAVDKKSQYVEAIDELTKQNQDLKGEFQAMQQHYNSLKTINSNLKAKKQEMILGSKNESGIPEIGALSSAMKAVKFTVESSNHQHHHEFQPSINNQTAPMAEQS
TNNSQNFQIPVGAIPFYDPSMGPIGIPDLNISLEEINQRSYSKFMAARARQNRIQICKNKSNGAAKLQSPPNPCM

Tan0007771 (gene) of Snake gourd v1 genome