CuGenDBv2

Gene ID	Tan0015595
Organism	Trichosanthes anguina (Snake gourd v1)
Description	N-acetyltransferase domain-containing protein
Genome location	LG09:67978104..67983512
RNA-Seq Expression	Tan0015595
Synteny	Tan0015595
Gene Ontology terms	GO:0009507 - chloroplast (cellular component) GO:0008080 - N-acetyltransferase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022134834.1 uncharacterized protein LOC111007009 [Momordica charantia]

1.7e-60

78.92

Show/hide

Query:  MAVLSSPLCSWSP---HRP-SCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRV
        M+VLSS LC+  P   HRP SCSSSSS SISWL+  SS SFSFLR Q SVP  SCFL R  I VSNV THQ+TI VDKSKLRVSEGTS+ ELWAAACLRV
Subjt:  MAVLSSPLCSWSP---HRP-SCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRV

Query:  RTFNQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        RTFN+FRP+SYGI+DHK+YLAEHEYEAIKER AGKRV FKRVSCINATLP AEISTLADDLC+TCK
Subjt:  RTFNQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

XP_022929037.1 uncharacterized protein LOC111435752 isoform X1 [Cucurbita moschata]

8.7e-65

84.66

Show/hide

Query:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF
        MAVLSS PLC+W  HRPS SSSSSSS+SWL+ FSS SFSF  TQL VP  +CF    PI VSNVFTHQRTITVDKSKLRVSE TSKDELWAAACLRVRTF
Subjt:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF

Query:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        NQFRPDSY IDDHKRYLAE+EYEAI+ERIAGKRVSFKRVSCINATLP AEISTLADDLCSTCK
Subjt:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

XP_022929046.1 uncharacterized protein LOC111435752 isoform X2 [Cucurbita moschata]

2.5e-56

78.53

Show/hide

Query:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF
        MAVLSS PLC+W  HRPS SSSSS              SF  TQL VP  +CF    PI VSNVFTHQRTITVDKSKLRVSE TSKDELWAAACLRVRTF
Subjt:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF

Query:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        NQFRPDSY IDDHKRYLAE+EYEAI+ERIAGKRVSFKRVSCINATLP AEISTLADDLCSTCK
Subjt:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

XP_022969109.1 uncharacterized protein LOC111468198 isoform X1 [Cucurbita maxima]

1.9e-56

78.53

Show/hide

Query:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF
        MAVLSS PLC+W  HRPS SSSSS               F  TQL VP  +CF  R PI VSNVFTHQRTITVDKSKLRVSE TSKDELWAAACLRVRTF
Subjt:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF

Query:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        NQFRPDSY IDDHKRYLAE+EYEAI+ERIAGKRVSFKRVSCINATLP AEISTLADDLCSTCK
Subjt:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

XP_023531978.1 uncharacterized protein LOC111794081 isoform X1 [Cucurbita pepo subsp. pepo]

2.8e-63

84.05

Show/hide

Query:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF
        MAVLSS PLC+W  HRPS SSSSSSS SWL+ FSS SFSF  TQL VP  +CF    PI VSNV THQRTITVDKSKLRVSE TSKDELWAAACLRVRTF
Subjt:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF

Query:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        NQFRPDSY IDDHKRYLAE+EYEAI+ERIAGKRVSFKRVSCINATLP AEISTLADDLCSTCK
Subjt:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BJ79 uncharacterized protein LOC103490280 isoform X1

1.6e-48

70.73

Show/hide

Query:  MAVLSSPLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGI-SCFLSRRPITVSNVFTH-QRTITVDKSKLRVSEGTSKDELWAAACLRVRT
        M VLSSP     P     SSSSSSSIS L+ FSS SFS LRT+ SVP   SCFL+R  I +SN+FT+ Q+TIT+  S  RVSEGTS DELWAAA LRVRT
Subjt:  MAVLSSPLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGI-SCFLSRRPITVSNVFTH-QRTITVDKSKLRVSEGTSKDELWAAACLRVRT

Query:  FNQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        FNQF PDS+ I DHK+YLAEHE+EA+KERIAGKRV FKRVSCINATLP +EISTLA+DLCSTCK
Subjt:  FNQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

A0A6J1BZW7 uncharacterized protein LOC111007009

8.2e-61

78.92

Show/hide

Query:  MAVLSSPLCSWSP---HRP-SCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRV
        M+VLSS LC+  P   HRP SCSSSSS SISWL+  SS SFSFLR Q SVP  SCFL R  I VSNV THQ+TI VDKSKLRVSEGTS+ ELWAAACLRV
Subjt:  MAVLSSPLCSWSP---HRP-SCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRV

Query:  RTFNQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        RTFN+FRP+SYGI+DHK+YLAEHEYEAIKER AGKRV FKRVSCINATLP AEISTLADDLC+TCK
Subjt:  RTFNQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

A0A6J1ELM7 uncharacterized protein LOC111435752 isoform X1

4.2e-65

84.66

Show/hide

Query:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF
        MAVLSS PLC+W  HRPS SSSSSSS+SWL+ FSS SFSF  TQL VP  +CF    PI VSNVFTHQRTITVDKSKLRVSE TSKDELWAAACLRVRTF
Subjt:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF

Query:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        NQFRPDSY IDDHKRYLAE+EYEAI+ERIAGKRVSFKRVSCINATLP AEISTLADDLCSTCK
Subjt:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

A0A6J1EM00 uncharacterized protein LOC111435752 isoform X2

1.2e-56

78.53

Show/hide

Query:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF
        MAVLSS PLC+W  HRPS SSSSS              SF  TQL VP  +CF    PI VSNVFTHQRTITVDKSKLRVSE TSKDELWAAACLRVRTF
Subjt:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF

Query:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        NQFRPDSY IDDHKRYLAE+EYEAI+ERIAGKRVSFKRVSCINATLP AEISTLADDLCSTCK
Subjt:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

A0A6J1I1L4 uncharacterized protein LOC111468198 isoform X1

9.4e-57

78.53

Show/hide

Query:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF
        MAVLSS PLC+W  HRPS SSSSS               F  TQL VP  +CF  R PI VSNVFTHQRTITVDKSKLRVSE TSKDELWAAACLRVRTF
Subjt:  MAVLSS-PLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTF

Query:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK
        NQFRPDSY IDDHKRYLAE+EYEAI+ERIAGKRVSFKRVSCINATLP AEISTLADDLCSTCK
Subjt:  NQFRPDSYGIDDHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G28030.1 Acyl-CoA N-acyltransferases (NAT) superfamily protein

1.5e-30

42.33

Show/hide

Query:  CSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTFNQFRPDSYGIDDHKRYLA
        CSS  SSS S        +    R+ LS+P +   L  RP+  S   +H     +DKS   +SE  S+DELWAAACLRVRTFN+  P +Y I DH+RYLA
Subjt:  CSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTFNQFRPDSYGIDDHKRYLA

Query:  EHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCKVC------LFLYCSNMNSVSWAPFLDHFRNFKPLTVNVQLVMIF
        E E+EA+KER +GKR  F RV+CINATLP +++S+  +DLCS CK        + +   ++N   W P  D     KP  + V     +
Subjt:  EHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCKVC------LFLYCSNMNSVSWAPFLDHFRNFKPLTVNVQLVMIF

AT4G28030.2 Acyl-CoA N-acyltransferases (NAT) superfamily protein

1.5e-30

42.33

Show/hide

Query:  CSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTFNQFRPDSYGIDDHKRYLA
        CSS  SSS S        +    R+ LS+P +   L  RP+  S   +H     +DKS   +SE  S+DELWAAACLRVRTFN+  P +Y I DH+RYLA
Subjt:  CSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTFNQFRPDSYGIDDHKRYLA

Query:  EHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCKVC------LFLYCSNMNSVSWAPFLDHFRNFKPLTVNVQLVMIF
        E E+EA+KER +GKR  F RV+CINATLP +++S+  +DLCS CK        + +   ++N   W P  D     KP  + V     +
Subjt:  EHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCKVC------LFLYCSNMNSVSWAPFLDHFRNFKPLTVNVQLVMIF

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTGTCCTCTCATCTCCTCTTTGCAGTTGGAGCCCTCATCGGCCTTCTTGTTCATCATCGTCATCTTCCTCCATTTCTTGGCTTACATTGTTCTCTTCCAAATCTTT
CTCCTTCCTTAGAACCCAACTATCTGTGCCTGGAATCTCTTGTTTTCTTAGTCGTCGACCGATTACAGTCTCAAATGTTTTCACCCACCAACGGACGATCACAGTCGACA
AATCTAAGTTGAGGGTCTCCGAAGGTACCTCCAAGGATGAGCTCTGGGCTGCTGCTTGTCTCCGCGTTCGCACCTTTAATCAGTTCCGCCCCGATTCCTATGGCATCGAC
GATCATAAGAGGTACTTGGCAGAGCATGAATATGAAGCAATTAAAGAGCGTATTGCTGGAAAAAGGGTTAGCTTTAAAAGGGTATCTTGCATAAATGCTACTCTTCCATC
AGCCGAAATATCAACCCTAGCTGATGATTTATGTTCAACATGTAAGGTCTGTTTATTTCTTTATTGTTCCAATATGAATAGTGTGTCATGGGCTCCATTCCTGGATCACT
TTAGGAATTTCAAACCTTTAACTGTCAATGTTCAGTTGGTTATGATATTTGAAGGATCAGATAAAATCATTATCTGA

mRNA sequence

Show/hide mRNA sequence

GGACGAGGAGCCTAGGAATATCCTAAAACACCGAACGCGGAGTGAACGAGAGATGGCTGTCCTCTCATCTCCTCTTTGCAGTTGGAGCCCTCATCGGCCTTCTTGTTCAT
CATCGTCATCTTCCTCCATTTCTTGGCTTACATTGTTCTCTTCCAAATCTTTCTCCTTCCTTAGAACCCAACTATCTGTGCCTGGAATCTCTTGTTTTCTTAGTCGTCGA
CCGATTACAGTCTCAAATGTTTTCACCCACCAACGGACGATCACAGTCGACAAATCTAAGTTGAGGGTCTCCGAAGGTACCTCCAAGGATGAGCTCTGGGCTGCTGCTTG
TCTCCGCGTTCGCACCTTTAATCAGTTCCGCCCCGATTCCTATGGCATCGACGATCATAAGAGGTACTTGGCAGAGCATGAATATGAAGCAATTAAAGAGCGTATTGCTG
GAAAAAGGGTTAGCTTTAAAAGGGTATCTTGCATAAATGCTACTCTTCCATCAGCCGAAATATCAACCCTAGCTGATGATTTATGTTCAACATGTAAGGTCTGTTTATTT
CTTTATTGTTCCAATATGAATAGTGTGTCATGGGCTCCATTCCTGGATCACTTTAGGAATTTCAAACCTTTAACTGTCAATGTTCAGTTGGTTATGATATTTGAAGGATC
AGATAAAATCATTATCTGAATTCTGGCAGTTCTTAAGCTTTTTTATATGAAAAATGATGTCGAGAAGTATGCGATAATAAAAAATTGAAGAGGCTGTTTAAAGAAATAGC
CTTCATTTCAGAAAATTAAAAACATTAGGTATTTTCTTCATTTGAATTGAAAAACATTAGGTATTGCAGGAAAGGCAAGGCACATGTATTAATGATGCTGCCTCGCCTCA
CATGAGGAGAGTTGCCTTTGAGGTACTAGACATGTTAAGATAGTGTATGTGTTGGCAACAATGTTGTTTGATAATGTTATGTATAGGCATGCTAAAATTATGAAAAAAAA
ATCTATATAACTAAAAAAATGATGTGGGTTTACCAAAAGCATATTTTGAAGATGGAAAAGGAATGAAACAGATTGAGACAAAATATATTGACTATTTTTCCCTCTTTATG
TAAATGCAGGGTCTTCTAATGCAAAAAAGTTATAATATTGATTGTAATGCTCTGGCCATGTTTTTTCCTTACCTGCTGCTGTAGATTTTGAGTTGATTGAAGCAGATTAT
GCAACCTTTTATGTCTCCTCTCTGAGCTTCGACTATATCACTTCTATAAGTTCTACTTTGTTTTGATCTGCAATCTTTTATTTATATTTTATTATCCTTTTCTCTTTTAG
TTTTCTGATGATGGAGAAGACCGAGTTGTTGTTGGCTCACTTGACATTAATCTGTGTCTAAGGCTTCCAGATGAAATAGCGGGAATGAAACCTGAGAATTTGGTAGACTC
CATGTGTTTCTATAATTCAGAATTTCAGATTATTGGACAGTATGGTACTATTCTTTTTGTTTTATTATTGTTTTTAAAATAAAATAGTAATTAGAAAGGGACTCCAGCCT
TTAGCCTGTCGAGATTTATACTTGGTCATACTATTAAGCTGGTTGTTATGTAAATAGGCCGTTGTATGTGCTATTATTCTTAAATGTTGTTATTGAAAAACCAGGCTGGT
TAGTTTGAATGTGTTATATAATGGAGAACTGCATATGTGTAAATAGCAAAGTAGGCCTTGAAGTTGAACAACTTTCGCAGAATATTATTCTATTTTTCCCTCTGAATGGA
AGTTGCATGCTCTAGCAGCTAACATTAGTAAAGACTGTGTCATCCTCAATTTTGTCCAATCCACGATCTTGTAATCTGGCAGCACCTAAAACACACATCGTCAGTTGTGT
AAAGCTAAGGTTATGCGATGCAAGAGCTCTTTCAAATCAGAGTAAAGGATATTTCTCCATGAAGGAATCTTTATAAGTTGAAGACCTCTCTGATTTGCTAGCCTCATAGG
TCACATAACGGAGAAAGACAACATTGTAAAGAGCTCTTTCAAATCAGAGTAAAGGATATTTCTCCATGAAGGAATCTTTATAAGTTGAAGACCTCTCTGATTTGCTAGCC
TCATAGGTCACATAACGGAGAAAGACAACATTGTAAAGAGTGTCTTAACTGATCTTGAAGCTGAATATTAATTTCTGTGATGACAATTATCACCTCAAAAATCAAGTCTT
TAACCATTCAAAAGACAAGTATCTTCCTCCTTGCATATGAGAGTTGCGTGCAACAAAATTTTCCAAACTTCGATGGATCTCAGATTCTCAACCTTGTGTAAATATGACCT
ATCTAGGTGAATCAAAGAAAAACAGTGAAAGTCAACGTCCTGTCGAGGAGGAAGCCAAAATGCTAATGATAGAGGAGAAAAGGATACAATGGAGAAAATTTATGGTCAAG
GAATTCTAAACCGGATAGCTCTATGGAAAGTTTTGACATAATGTATTCAAATGTTACTTCCACTTTGATTAATTGTTCAATGGGTTCCAAGTTCCACTAAGAATCCTTCT
ATATGTTGCTGTGCGAATAGCTGCTTCAGGCCACTTCATCGAATACCTTTGCTGATTTACCCTAATCAGAGAATGAGAGTTGAAAAGAGAACAATAATCTGCAAAGTTTA
TGTTCAACTTGAATTTCAACTCTACTATTTGAACATATGATAGATTGATAGTTTACTTAATAGAACTATTGCCGGGAGTCTTCTAGATTGTCCATAAACTTCTGAGGTTA
CGTCTTCCAGTCTCTATTTCATTCTAATAGCTAACTAATAGGGATTCCGTTTTTTTTTTGGTGTGTGTAACTGTGGTTGGTTTCTTCCATTCCTATTGTAGTCCATTCAT
TTGAGAGTTGTTTCATGTCCTTTCTTTTAAAGAAAACACATGCGGGCAGGCACACATATTTGTTTGCAATTGCACATCTTTCTGTATCATCTGTTGCTTTGTCGAATCTT
CAATGATAAGTGAGGTTTATCTCCAATTAAGTATATCCTTGTATTAACAAGATTTGATTCTGGATCATGAGTTGATTTTTTCATGATAAAGGATATCTAAAATATTTTTC
CAACAGGGAATTGGGGCCGATTTCACAAGGGCATACCTGAGTAATGTATGTGTTGCCAAGGAACTCCACAGAAATGGGTTGGGTTATGCACTTGTTGCAAAGGCAAAGAC
AATTGCAGAAAATTGGGGTAACAGTTTTGAGATACTATGTTTGTCCAATTCATTCATGTCAAATATGGTCATGATCTTGGTGCATTATTAGCATCTCCATTTTTATGACT
TCTGTTTTAGAATGTGGTCTTGGTGTTTATTGTGGAACTCTACTTCTAAGAACTATATGGATAATTTGTGCTACAATGTTCTAATGTTTTAGGCATCAGCGATCTGTACG
TCCATGTAGCTTTCGACAACGAACCCGCAAAGAATCTCTACTTGAAAAGTGGTTTTGTCTATGAAAGCGATGAACCCGCTTGGCAAGCCAGGTTTCTAGATCGACCTCGC
AGGATTCTCCTGTGGACTGCTCTCTCAGAACTTCTCTGATATTGCACTGAATTGATTTTTGCTCATAATTTTACTTGCAGTTTTTTCTCTTCACTGGTACACAGATCATT
TTCTTCCTTTAATATACTAAAATTCTATTCATTGTAAAATTATGTGAATATGCTGTCCATCTTCATAATTTATTATATAGCATGCAAAAATAGAATTGACGTCTCTCTAT
AGTCTATGGTGTGTTGGTGTCTCTCTCTGAAACTCCTCTTGCAAGCAATTTTCTTGATTTGCAAGCAAAGCCACCAGCAAACTCAGTTGTCTTCTTCCCAAAAAAGAAAA
AAGTTGTTTGGTGTATAAATATAGTAATAAAGGTTGTGGCTTGGGAATGGTCATACTTGAAACCAGTAATATTCTCTACAAAGTTTGTTGATGGAAAAATAAAAGCAATC
TTCATTGAAAAAAAGTTGAAGTTGCTGAGATTACAGTCATTGGTTGGTCAAGATACATAAAACCACCAAAGATTGAAGATCACAACCCACCATGAAGTGAGCATTGAAGA
ACCTTTTATCCTGCATTTGATGCAAGTCTGGTAGTTTTGGTCTTTCTGCTAAAAAACTTATCTATTTCTGAGATCTGAATTTGTTAAGCAAGGGGCAAGAAATCTGGTAG
TTTTGGCCTTTTTATGTCTAAAGCAGGCTAAGTGGTTTTGAAATTACCAACAGATTGATCCCAGAACCTGCTTTTTCCGTCCTTATTGTGTCAACATTTTGTGATTGGCC
TGTTAATTATCTGCAGGAAGCCTTATACGAGAATGTGTTTGCAACTTACAGAAATCAGTCTGCATCCCCCCTTTTTTTTAATAAAAAGGCTGGAGCTCTTGATCTTGCTA
CACAGCAGACAACTATGTCTTAATATGTATCAAGAAATAAACTATCTTATTCTGACCAAACATTGTACAAGCATTGAGAGTGATAGGATGTGGTAGTTTAGGTAAAACGA
TGAACTAATTTAACAATAAATAGGTAAAAGCTCGGATATATTATTTGATGAACTCATTTATAATGATTCAGTGTATATTGTGTATCATATATACATCTATATATACATCT
ATCGATCTTAAGAGAGAAATTATTAATTCAGTCGATTTCATATGACATTAATACAGTTCAATGTTGTTTAGGTATCTC

Protein sequence

Show/hide protein sequence

MAVLSSPLCSWSPHRPSCSSSSSSSISWLTLFSSKSFSFLRTQLSVPGISCFLSRRPITVSNVFTHQRTITVDKSKLRVSEGTSKDELWAAACLRVRTFNQFRPDSYGID
DHKRYLAEHEYEAIKERIAGKRVSFKRVSCINATLPSAEISTLADDLCSTCKVCLFLYCSNMNSVSWAPFLDHFRNFKPLTVNVQLVMIFEGSDKIII

Tan0015595 (gene) of Snake gourd v1 genome