CuGenDBv2

Gene ID	Tan0003015
Organism	Trichosanthes anguina (Snake gourd v1)
Description	ABC transporter ABCE
Genome location	LG06:79806068..79810801
RNA-Seq Expression	Tan0003015
Synteny	Tan0003015
Gene Ontology terms	GO:0016020 - membrane (cellular component) GO:0046872 - metal ion binding (molecular function) GO:0051536 - iron-sulfur cluster binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6575112.1 hypothetical protein SDJN03_25751, partial [Cucurbita argyrosperma subsp. sororia]

5.7e-142

88.42

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHAAL LQHQVAS N+SNKNLD+VR LV RIGIASVQSSPLESLR+GNW+KLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAAR IV VRRPWVMISVNDDQDLHFRKAEFDPENCP+DCSRPCEIVCPANAISL EE M E S+VAS+ G LKGGVITERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTA+LIK  DVDALEIHTNGRQTTPFQELWDKLGDSSKYLRL+AVSLPNIGDLT+STMKTM+S+MES+L C NLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

KAG7013681.1 hypothetical protein SDJN02_23848 [Cucurbita argyrosperma subsp. argyrosperma]

6.8e-143

88.77

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHAAL LQHQVAS N+SNKNLD+VR LV RIGIASVQSSPLESLR+GNW+KLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAAR IV VRRPWVMISVNDDQDLHFRKAEFDPENCP+DCSRPCEIVCPANAISL EE M E S+VAS+ G LKGGVITERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTA+LIKR DVDALEIHTNGRQTTPFQELWDKLGDSSKYLRL+AVSLPNIGDLT+STMKTM+S+MES+L C NLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

XP_023547405.1 uncharacterized protein LOC111806365 isoform X1 [Cucurbita pepo subsp. pepo]

2.0e-142

88.77

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHAAL LQHQVAS N+SNKNLD+VR LV RIGIASVQSSPLESLR+GNW+KLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAAR IV VRRPWVMISVNDDQDLHFRKAEFDPENCP+DCSRPCEIVCPANAISL EE M E S+VAS+ G LKGGVITERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTAELIKR DVDALEIHTNGRQTT FQELWDKLGDSSKYLRL+AVSLPNIGDLT+STMKTM+S+MES+L C NLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

XP_023547406.1 uncharacterized protein LOC111806365 isoform X2 [Cucurbita pepo subsp. pepo]

2.0e-142

88.77

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHAAL LQHQVAS N+SNKNLD+VR LV RIGIASVQSSPLESLR+GNW+KLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAAR IV VRRPWVMISVNDDQDLHFRKAEFDPENCP+DCSRPCEIVCPANAISL EE M E S+VAS+ G LKGGVITERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTAELIKR DVDALEIHTNGRQTT FQELWDKLGDSSKYLRL+AVSLPNIGDLT+STMKTM+S+MES+L C NLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

XP_038906651.1 uncharacterized protein LOC120092590 [Benincasa hispida]

5.3e-148

91.58

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHA LHLQHQVAS+NNSNKNL++VR+LV RIGIASVQSSPL+SLRNG+WVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISL EETM+E SQVASV G LKGGV+TERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTA+LIKR DVDALEIHTNGRQTTPFQELWDKLGDSSKYLRL+AVSLPNIGDLTVSTMKTM+S+MES+LHCLNLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

TrEMBL top hits

e value

%identity

Alignment

A0A1S3C7M9 uncharacterized protein LOC103497790 isoform X2

1.8e-141

88.89

Show/hide

Query:  MTLSLS-CHAALHL-QHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVN
        M LSLS CHA LHL QHQVAS+NNS+KNLD+VR+LV RIGIASVQSS L+SL+NGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVN
Subjt:  MTLSLS-CHAALHL-QHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVN

Query:  EGIQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKI
        EGIQAARGI+GVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISL EE ++ELSQVA V G LKGGVITERCYGCGRCSPVCPYDKI
Subjt:  EGIQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKI

Query:  KLATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIG-DLTVSTMKTMYSMMESRLHCLNLWQV
         L TYVRDAATT +LIKR DVDALEIHTNGRQTT FQELWDKLGDSSKYLRL+AVSLPNIG DLTVSTMKTM+S+MES+LHCLNLWQ+
Subjt:  KLATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIG-DLTVSTMKTMYSMMESRLHCLNLWQV

A0A5D3BV06 Uncharacterized protein

1.8e-141

88.89

Show/hide

Query:  MTLSLS-CHAALHL-QHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVN
        M LSLS CHA LHL QHQVAS+NNS+KNLD+VR+LV RIGIASVQSS L+SL+NGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVN
Subjt:  MTLSLS-CHAALHL-QHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVN

Query:  EGIQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKI
        EGIQAARGI+GVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISL EE ++ELSQVA V G LKGGVITERCYGCGRCSPVCPYDKI
Subjt:  EGIQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKI

Query:  KLATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIG-DLTVSTMKTMYSMMESRLHCLNLWQV
         L TYVRDAATT +LIKR DVDALEIHTNGRQTT FQELWDKLGDSSKYLRL+AVSLPNIG DLTVSTMKTM+S+MES+LHCLNLWQ+
Subjt:  KLATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIG-DLTVSTMKTMYSMMESRLHCLNLWQV

A0A6J1H6Q4 uncharacterized protein LOC111460121

3.6e-142

88.42

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHAAL LQHQVAS N+SNKNLD+VR LV RIGIASVQSSPLESLR+GNW+KLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAAR IV VRRPWVMISVND QDLHFRKAEFDPENCP+DCSRPCEIVCPANAISL EE M E S+VAS+ G LKGGVITERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTA+LIKR DVDALEIHTNGRQTTPFQELWDKLGDSSKYLRL+AVSLPNIGDLT+STMKTM+S+MES+L C NLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

A0A6J1KVU8 uncharacterized protein LOC111499161 isoform X1

4.7e-142

87.37

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHAAL LQHQVAS+N+SNKNLD+VR LV RIGI+SVQSSPLESLR+GNW+KLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAAR I+ VRRPWVMISVNDDQDLHFRKA FDPENCP+DCSRPCEIVCPANAISL +E M E S+VAS+ G LKGGVITERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTA+LIKR DVDALEIHTNGRQTTPFQELW+KLGDSSKYLRL+AVSLPNIGDLT+STMKTM+S+MES+L CLNLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

A0A6J1L4W8 uncharacterized protein LOC111499161 isoform X2

4.7e-142

87.37

Show/hide

Query:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
        M LSLSCHAAL LQHQVAS+N+SNKNLD+VR LV RIGI+SVQSSPLESLR+GNW+KLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG
Subjt:  MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEG

Query:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL
        IQAAR I+ VRRPWVMISVNDDQDLHFRKA FDPENCP+DCSRPCEIVCPANAISL +E M E S+VAS+ G LKGGVITERCYGCGRCSPVCPYDKI L
Subjt:  IQAARGIVGVRRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKL

Query:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV
         TYVRDAATTA+LIKR DVDALEIHTNGRQTTPFQELW+KLGDSSKYLRL+AVSLPNIGDLT+STMKTM+S+MES+L CLNLWQ+
Subjt:  ATYVRDAATTAELIKRSDVDALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACTCTGAGCCTGTCCTGCCATGCCGCTCTTCACCTTCAACATCAAGTGGCTTCCAAGAACAACAGCAACAAGAACCTCGACAGCGTAAGAAACCTCGTAAAACGAAT
TGGAATTGCTTCAGTTCAATCTTCTCCTCTTGAATCTCTCCGAAATGGCAACTGGGTCAAGCTTATTTGCGGTGCAAGTTTCGAGGATGTGGTTGATATTAGGAATCTCT
CACTTGTTTACACCCTTGCTGGGGTTGATTGTATTGATTGTGCTGCTGATGCATCGGTTGTTAGTGCGGTGAATGAGGGAATTCAAGCAGCAAGAGGGATTGTTGGTGTT
CGTAGGCCTTGGGTGATGATTAGTGTTAATGATGATCAAGATCTTCACTTCCGCAAAGCTGAGTTTGATCCTGAGAATTGTCCAATTGACTGTTCAAGGCCTTGTGAAAT
TGTTTGCCCTGCTAATGCAATCTCACTACATGAAGAAACCATGCAAGAGCTTTCACAAGTAGCTAGTGTATTTGGAGGATTGAAGGGCGGAGTAATCACGGAGCGCTGTT
ATGGTTGTGGTCGTTGCTCTCCCGTCTGCCCATATGATAAAATAAAGCTAGCCACATATGTAAGAGATGCAGCTACTACTGCTGAACTTATAAAACGGAGCGATGTCGAT
GCATTGGAGATTCACACCAATGGAAGGCAAACCACTCCTTTTCAAGAACTTTGGGATAAATTAGGGGACTCATCCAAATATCTAAGGCTAATAGCAGTAAGCCTACCTAA
TATTGGGGATTTAACAGTATCTACAATGAAAACGATGTACTCGATGATGGAATCTCGGCTCCATTGTTTGAACTTATGGCAGGTCTGCCTTGAACTTCATAAAGCCAAAC
AAATTACTTTCACTTATATATCTCTATGA

mRNA sequence

Show/hide mRNA sequence

GTTCATTTCTGTTGCTTGTATTCCAACATCCTTCTCTTCTCCAACAAAAGAAAGAAAAAATCAAAATGACTCTGAGCCTGTCCTGCCATGCCGCTCTTCACCTTCAACAT
CAAGTGGCTTCCAAGAACAACAGCAACAAGAACCTCGACAGCGTAAGAAACCTCGTAAAACGAATTGGAATTGCTTCAGTTCAATCTTCTCCTCTTGAATCTCTCCGAAA
TGGCAACTGGGTCAAGCTTATTTGCGGTGCAAGTTTCGAGGATGTGGTTGATATTAGGAATCTCTCACTTGTTTACACCCTTGCTGGGGTTGATTGTATTGATTGTGCTG
CTGATGCATCGGTTGTTAGTGCGGTGAATGAGGGAATTCAAGCAGCAAGAGGGATTGTTGGTGTTCGTAGGCCTTGGGTGATGATTAGTGTTAATGATGATCAAGATCTT
CACTTCCGCAAAGCTGAGTTTGATCCTGAGAATTGTCCAATTGACTGTTCAAGGCCTTGTGAAATTGTTTGCCCTGCTAATGCAATCTCACTACATGAAGAAACCATGCA
AGAGCTTTCACAAGTAGCTAGTGTATTTGGAGGATTGAAGGGCGGAGTAATCACGGAGCGCTGTTATGGTTGTGGTCGTTGCTCTCCCGTCTGCCCATATGATAAAATAA
AGCTAGCCACATATGTAAGAGATGCAGCTACTACTGCTGAACTTATAAAACGGAGCGATGTCGATGCATTGGAGATTCACACCAATGGAAGGCAAACCACTCCTTTTCAA
GAACTTTGGGATAAATTAGGGGACTCATCCAAATATCTAAGGCTAATAGCAGTAAGCCTACCTAATATTGGGGATTTAACAGTATCTACAATGAAAACGATGTACTCGAT
GATGGAATCTCGGCTCCATTGTTTGAACTTATGGCAGGTCTGCCTTGAACTTCATAAAGCCAAACAAATTACTTTCACTTATATATCTCTATGATCTAAATTCTCAAACC
TATATTTGTCTTCACAATCATCGTCTCGTTTAACCATTGAATGAAGTTAGATGGACGGCCGATGAGTGGAGATATCGGACGAGGTGCCACGAGAGAAACAATTGCTTTTG
CTGCTCAATTAGCTCTTTCTAGTGACCGTCCTCCCGGTTCGTGTACAGGCTTATCCCATGAGGCTCATATTCATGTCATTTCACCAACAAGCTTCTTGTTTCCTCTGCAG
GCTTCTTTCAACTGGCTGGTGGCACAAATTTTCACACTGTTGATGGCTTGAAGAAAGAAAAACTTTTTCAAACCACCTCAATTCTCAAGAATTCGATGATCGAAGAATTA
TCAGAAAAATCACCCAGTTCATTACACGCGTTGATCGGTGGTATCGCTTACGGGGGCTATGCCCGAAAAATAATTGGAAGGGTTTTGAATTCAATGCAAACACAAAATGG
AGATGCTAACATTGAAGATTATCCGGATTATCTCTTGGCTGCACTTGTGGAAGCCTTGGCTTTGGTGGGAACTGTCAAATGTTATGATCCTTCTGTGATCAGCTCAGCAA
AAGCTAATTGATCCTTAAGTTTGTAGTTCGTTTCAGACCACACTTTCGATAGCCTGGTTGTCGAAGTTGTCGTTTTTATGTCGACAACGTTGGCAAATAAGTTCGAGAAT
CCTTAGGGAGCGACTTAGACCTCTTCGACAAACTCAATAGATCAATTTTCTGCCATGGAAGATCAGTCGAAGAAACAACCGTGGAGCATGCTTAGAATTCGAAGAATCGT
CAAAGCATCGCCTTGATACTTTGTTCTGAATTCAAGAGAATAATTTGAAGAATACAGCATTTTAACGGCTAGATAATGTAGCTTGATTGAACTAAAGTTTTGTGTAGCCC
ATTTACCACAAAAAAAAATCAATTTTTTTTTTTCCAAAAAAAAAATCAATTTTTTCCCATACCCCAACCACTTCAACAGTCGTCCTACAATTACCGAGCACT

Protein sequence

Show/hide protein sequence

MTLSLSCHAALHLQHQVASKNNSNKNLDSVRNLVKRIGIASVQSSPLESLRNGNWVKLICGASFEDVVDIRNLSLVYTLAGVDCIDCAADASVVSAVNEGIQAARGIVGV
RRPWVMISVNDDQDLHFRKAEFDPENCPIDCSRPCEIVCPANAISLHEETMQELSQVASVFGGLKGGVITERCYGCGRCSPVCPYDKIKLATYVRDAATTAELIKRSDVD
ALEIHTNGRQTTPFQELWDKLGDSSKYLRLIAVSLPNIGDLTVSTMKTMYSMMESRLHCLNLWQVCLELHKAKQITFTYISL

Tan0003015 (gene) of Snake gourd v1 genome