CuGenDBv2

Gene ID	Sed0012412
Organism	Sechium edule (Chayote v1)
Description	AT hook motif-containing protein, putative
Genome location	LG13:15664739..15671264
RNA-Seq Expression	Sed0012412
Synteny	Sed0012412
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022150988.1 uncharacterized protein LOC111019016 isoform X1 [Momordica charantia]

3.4e-80

74.54

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN
        A+PISPGSGVNG+QSHP I IQ  A+GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN + F TGN+T  +
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN

Query:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES
        H     EVPSH+SSG KLGF +  SHSN DASKDK+ISSIFAQ++P GSSRG V+PVVLQPAK T G SVA ES TIQT +++SSKG E LVGTFT+NES
Subjt:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES

Query:  ALTNVAVGIESFPFPP
        A TNV +GIESFPF P
Subjt:  ALTNVAVGIESFPFPP

XP_022150997.1 uncharacterized protein LOC111019016 isoform X2 [Momordica charantia]

3.4e-80

74.54

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN
        A+PISPGSGVNG+QSHP I IQ  A+GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN + F TGN+T  +
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN

Query:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES
        H     EVPSH+SSG KLGF +  SHSN DASKDK+ISSIFAQ++P GSSRG V+PVVLQPAK T G SVA ES TIQT +++SSKG E LVGTFT+NES
Subjt:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES

Query:  ALTNVAVGIESFPFPP
        A TNV +GIESFPF P
Subjt:  ALTNVAVGIESFPFPP

XP_023520441.1 uncharacterized protein LOC111783826 isoform X2 [Cucurbita pepo subsp. pepo]

1.0e-76

71.89

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN
        AMPISPGSGVNG+QS PAI+IQ +++GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN++ FATGN++ GN
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN

Query:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE
        +P S N EVPSHESSG  LGFKY   HSN DA K+KS+SSI AQ++P GSSRG VVPVV  PAKLT G    +E+ T+QT DI+SSKG E L+G+FT+NE
Subjt:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE

Query:  SALTNVAVGIESFPFPP
        SA  +V VGIESF F P
Subjt:  SALTNVAVGIESFPFPP

XP_038905587.1 uncharacterized protein LOC120091567 isoform X1 [Benincasa hispida]

2.5e-83

76.5

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN
        A+PISPGSG NGSQSHP I+IQ V +GML QVVSGVIEA FEAGYLLCV  GNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN++  ATGN+  G+
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN

Query:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE
        +P SKN E+PSHESSG KLGFKY   HSNRDA KD SISSI AQ++P GSSRG VVPVVLQPAKLT G SV TE++TIQT DI+SSKG E LVGTFT+NE
Subjt:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE

Query:  SALTNVAVGIESFPFPP
        SA T+V VGIESFPF P
Subjt:  SALTNVAVGIESFPFPP

XP_038905591.1 uncharacterized protein LOC120091567 isoform X2 [Benincasa hispida]

2.5e-83

76.5

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN
        A+PISPGSG NGSQSHP I+IQ V +GML QVVSGVIEA FEAGYLLCV  GNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN++  ATGN+  G+
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN

Query:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE
        +P SKN E+PSHESSG KLGFKY   HSNRDA KD SISSI AQ++P GSSRG VVPVVLQPAKLT G SV TE++TIQT DI+SSKG E LVGTFT+NE
Subjt:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE

Query:  SALTNVAVGIESFPFPP
        SA T+V VGIESFPF P
Subjt:  SALTNVAVGIESFPFPP

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DAY0 uncharacterized protein LOC111019016 isoform X1

1.7e-80

74.54

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN
        A+PISPGSGVNG+QSHP I IQ  A+GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN + F TGN+T  +
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN

Query:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES
        H     EVPSH+SSG KLGF +  SHSN DASKDK+ISSIFAQ++P GSSRG V+PVVLQPAK T G SVA ES TIQT +++SSKG E LVGTFT+NES
Subjt:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES

Query:  ALTNVAVGIESFPFPP
        A TNV +GIESFPF P
Subjt:  ALTNVAVGIESFPFPP

A0A6J1DCA8 uncharacterized protein LOC111019016 isoform X2

1.7e-80

74.54

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN
        A+PISPGSGVNG+QSHP I IQ  A+GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN + F TGN+T  +
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN-ILFATGNETNGN

Query:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES
        H     EVPSH+SSG KLGF +  SHSN DASKDK+ISSIFAQ++P GSSRG V+PVVLQPAK T G SVA ES TIQT +++SSKG E LVGTFT+NES
Subjt:  HPPSKNEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANES

Query:  ALTNVAVGIESFPFPP
        A TNV +GIESFPF P
Subjt:  ALTNVAVGIESFPFPP

A0A6J1EVJ4 uncharacterized protein LOC111438469 isoform X1

5.5e-76

70.51

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN
        A+P+SPGSGVNG+QS PAI+IQ +++GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN++ FATGN++ GN
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN

Query:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE
        +P S N EVPSHESSG  LGF+Y   HSN DA K+KS+SSI AQ++P GSSRG VVPVV  PAKLT G    +E+ T+QT DI+SSKG E L+G+FT+NE
Subjt:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE

Query:  SALTNVAVGIESFPFPP
        SA  +V VGIESF F P
Subjt:  SALTNVAVGIESFPFPP

A0A6J1JAQ9 uncharacterized protein LOC111483279 isoform X1

1.5e-76

71.43

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN
        A+PISPGSGVNG+QS PAI+IQ +++GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN++ FATGN++ GN
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN

Query:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE
        +P S N EVPSHESSG  LGFKY   HSN DA K+KS+SSI AQ++P GSSRG VVPVV  PAKLT G    +E+ T+QT DI+SSKG E L+G+FT+NE
Subjt:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE

Query:  SALTNVAVGIESFPFPP
        SA  +V VGIESF F P
Subjt:  SALTNVAVGIESFPFPP

A0A6J1JCN8 uncharacterized protein LOC111483279 isoform X2

1.5e-76

71.43

Show/hide

Query:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN
        A+PISPGSGVNG+QS PAI+IQ +++GML QVVSGVIEA FEAGYLLCV VGNSG+TLRGVVFKPGHYVPVSAEND+APD QMIRRN++ FATGN++ GN
Subjt:  AMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNIL-FATGNETNGN

Query:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE
        +P S N EVPSHESSG  LGFKY   HSN DA K+KS+SSI AQ++P GSSRG VVPVV  PAKLT G    +E+ T+QT DI+SSKG E L+G+FT+NE
Subjt:  HPPSKN-EVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANE

Query:  SALTNVAVGIESFPFPP
        SA  +V VGIESF F P
Subjt:  SALTNVAVGIESFPFPP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G21895.1 DNA binding

3.4e-09

33.62

Show/hide

Query:  MLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNILFATGNETNGNHPPSK---------NEVPSHESSGTKLG
        ++ +VV+GVIE +F+AGYLL V V +S   LRG+VF  G   P++ END+AP  +M  R  +    N+T+ + P  +          ++   ESS   + 
Subjt:  MLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNILFATGNETNGNHPPSK---------NEVPSHESSGTKLG

Query:  FKYITSHSNRDASKDK
            T+   ++A+KD+
Subjt:  FKYITSHSNRDASKDK

AT5G52890.1 AT hook motif-containing protein

5.8e-09

45.31

Show/hide

Query:  VANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN
        V   ++ +VVSGV+E +FEAGY L V V ++   L+GVVF P    P++   DL P A+M  RN
Subjt:  VANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN

AT5G52890.2 AT hook motif-containing protein

5.8e-09

45.31

Show/hide

Query:  VANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN
        V   ++ +VVSGV+E +FEAGY L V V ++   L+GVVF P    P++   DL P A+M  RN
Subjt:  VANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRN

AT5G54930.1 AT hook motif-containing protein

1.8e-18

36.41

Show/hide

Query:  SPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNILFATGNETNGNHPPSK
        S G   + S+S    + +     M+ Q +SGVIEA FEAG+LL V VGNS   LRGVVFKPGH  PVS +ND+APD  MIRRN                 
Subjt:  SPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNILFATGNETNGNHPPSK

Query:  NEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNE
        ++V  H+ S  K G K           + +++  +  Q +        +VPVVLQPA L  G     E + I    +Q+  G++
Subjt:  NEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNE

AT5G54930.2 AT hook motif-containing protein

1.8e-18

36.41

Show/hide

Query:  SPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNILFATGNETNGNHPPSK
        S G   + S+S    + +     M+ Q +SGVIEA FEAG+LL V VGNS   LRGVVFKPGH  PVS +ND+APD  MIRRN                 
Subjt:  SPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNILFATGNETNGNHPPSK

Query:  NEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNE
        ++V  H+ S  K G K           + +++  +  Q +        +VPVVLQPA L  G     E + I    +Q+  G++
Subjt:  NEVPSHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNE

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTGGCTATGCCTATTTCTCCTGGTTCTGGAGTAAATGGAAGCCAATCACATCCAGCAATTAAAATTCAAAAGGTAGCTAATGGGATGCTGAGGCAGGTTGTATCGGG
TGTCATTGAGGCAGCATTCGAAGCTGGATATCTTCTGTGTGTTAATGTTGGCAACTCTGGACTCACTTTGAGGGGTGTTGTTTTTAAGCCTGGGCATTATGTTCCTGTTT
CAGCAGAGAATGACCTGGCCCCAGATGCTCAAATGATCAGAAGAAATATTCTTTTTGCTACAGGAAATGAAACTAATGGAAATCACCCCCCATCTAAAAATGAAGTCCCA
TCTCATGAATCATCAGGTACCAAACTGGGGTTTAAATATATAACTTCACATTCTAACCGGGATGCATCGAAAGACAAATCTATATCATCTATATTTGCCCAAGTATCTCC
TTTGGGAAGCTCAAGAGGTACTGTGGTCCCTGTTGTATTACAGCCTGCTAAATTAACCTATGGGCGCTCAGTTGCCACTGAATCACTTACTATTCAAACTCCTGATATTC
AATCCTCAAAAGGCAATGAGTTTCTTGTAGGTACTTTTACAGCAAATGAATCAGCTCTCACCAATGTGGCAGTTGGAATTGAAAGCTTTCCTTTCCCACCCTAA

mRNA sequence

Show/hide mRNA sequence

TTAAATTTGAACCCTCTAAGTTTGGAAAACTTTTGTTTCCACCCTCCTCTCTGTCGTGGCTGTCTCAATGCAAAATCCGGAGCTCTCTTCTTTGCCCTATCCGTGCTTGC
TTCCTCTCATCCACGTTGTCGCTACTACTTTCCATACATCACTCATTTTTCTCTCAATTTCACACTCCCTACCCAGGTATCCCCGATTTTCCTCTATTTGATTTCGCTAC
ATTTATTGCATTTTCCAAGAATGTGCATGTTTTTGCTGCCTAATTTATACGGGGTTTATGGAATTTTCCCCCAAGATGGCCTTCGAGATGGTGTTAGTATCTGTAATTTG
GGGATTTTCTTTAGTTTTCACTAGAATGGAGTTTATTCATTCTACTGCTAGGAGTTTGTTCAAACATGATTTTGGTTCTGCTGCATTTAATAGGTCATTCCAATGATGAA
ATCTTTCTTCTTCTTTTTTTAAAGATTTTGAGCTATGTTTAAGGATGGCATTTGCGAGTTTGTTACAACTTAAAATAGTTCTTACGGGGTTTCCCATTGGCGAACAAGAG
TTTCATACATCTTTGTTACAATCCTATTTTTTCCATTAGTTTTATAAGAAGAATTAGGCTTTTGTATAAGCTCGTTTATGACTATTTTCCAGGCCAAATGTGTTCTTTTT
TCGACGGCTAAACAATTAAGGAAAAACTTAGCCCAACCTTAGTAAACGTATGTATGAACAGTCTGTTTTGGGAATTGCTTGGCACAAAAATCATTTTGATGGACAATTCT
TTCACTATTCTTTCATTTTAATAGATATTTAATACAATCTTTCCTTGCATCTCCGAGAAATGAACTAAAGAATTCATTCAGCAGGTCCATTTTTTCCTTTATAATTCTCC
ATTTCATTCTTGTAGTCCCCAAGAGCGGTCTCGATGGTATAGGCTTGGGGTCTCCAAGGTATATTCCTTTTGAGCAGTATTTTTAAAGGCGTAAGGCGCAAAGACTATTT
GGAGCCTGAGGCGCAAGGCGCAAAAAAGGCGCGAGCTTTATCTTAAAGGCGCACCATGTATAAAAAAAAAATTAAAAATATTTATTTATCACAAAACATTAAAAAAAATA
TATGTATCACAAAAATATTTATTAAGTTATAAACCACTAAGTTGCAATATTCATGCATATATAAGATATCAAAACAAGAGGTAGCTTTATAATATTAGTAGCATTGTATC
CAATCAAAATATTAAATAAGTCCTAAAGCTCGAACTCCTCTCCACTGAATTCCAAATCCTCCACATCCACTTCATTGTTGGACTTGTATCCCTCGGCCTCTATATCTTCT
TCTTCTTCACTATCAATCTCCATAATTGACCCACGTCGTATAAAAGGTTGTGGTTGTGTGGAGGATGAAGATTGAGATGTAGTCTTGTTTCTAGAGGTATTAGCCCTAGA
ATAATATGTTGGTTCATTCGCTCCAGCAGCTCGAGAGACATCGCCCCAAGTTAATGTATCATCTTCAAACACAAGATCACGATCCTCATCAGAATCATCTTCCATTACTC
CAAGCAAAGATTCATTGCAATCATCAATGTCATGTAAAGTGATGGGGTCGATGGAATCTCGAATGGTATATCGACGCTTCAATGCTCTATTGTATTTGATGTAGACTAAG
TCATTTAATCGACTTTGATCAAGTCTATTTCTCCTCTTGCTATGAAGCTGCAAAGCCAATTATAAATAAGTAAAGTTTAACTCCATTACTTTACTTTAGTATACTTCAAG
TTTAGGAGATTACATTACTAACCTATTCAAAAACACTCCACTTACGCTCACAACCTGATGCACTACAAGTAAGGCCTAAAACCTTTATCGCAAACTTTTTAAAAGATGGA
GTTGAATGTCCAAAGGTACTCCACCACGCCACTAAAGATCAAAATTCAAAACTACATATGTTAATAACTATTAACTTCCACACTTAAAGTTAAATTGAAGTATTTCGTGC
TCATTTGTCGTACCTGGAGATCTTTTATCTCGATTTCTAATAGCCAATGGTTGTCCAAATGATTCTTCAGCTTCCTTGTATTTAGGGATCTCTGCAAGTATCTTGTCTTG
TTCTCCCAAAGAAGGAATCATTCGGGTTATACATGCTAGTAACCCTTCGTTAATTTCTTTATTATCGGCAATGGTAGGATCTTTGTAAAATAACTCAGGGTTTAGAAAAT
GACCCGCTGCATGCAATAGACAATGTAATTGAAGCTCCCACCTTCGATCAATAATAGCAAACACGTCCTCGTACTTCTCCTTCTGACCATGAAACGCTCTCTCTATGGAC
TCTTTTGCTCGATCCATAGCCTCATAAATGTATCCCATTGGAGGCTTCTTCTCATCGTCAACCAACTGAAGCACTCGCACTAAAGGGTTTGAAACTTTAAGACCAAAGAG
TATTGTAGCCCAAAAATTAGTCATCATAATGGTTTTAAGAACTCGTTTGCTTTGTTGCTCTTTGATCCATTTGCTATTTCTCCATTCTTCAGATGTAAACATCTTCCTCA
AGTTAGCTTGTTAAGTGTGTAGACTAGACAATGTTATGCTAGCTGTAGCAAATCGAGTCTTCGCCGGTCTAATCAACTCCTTTGAATTAGTGAACTTCCTCATCATATTC
AATAATCCTGGTCTTACATAAATGAAATTACTGATATCCATGGATCGTTTCAAAGTCTTACGCAACTTTGGGATCTTGAATATGTCTTCCAACATTAGATCTAAACAGTG
TGCTGCACATGGCGACCAAAATAAATGTGGTCTTTTCGCTTCTAACAATCTCCCTGCCATTACGTTTGTAGAGGCACTATCAGTAACAGCTTGAAGTACATTAGGCTTTC
CAATACACTCAATAAAGTTATCCATTAATTCAAACATCTTTTTTCCATCTTTAACAACAGATGAGGCATCGATATACTCGATGAACACTGTCCTTTTTGGACTATTAACC
AAAACGTTCAGCAATGTTCTATTTCTCCTATCCGTTCATCCATTGGTCATTATTGTACATCCAACCTTAGCCCATTGTTCTTTGTGAGACTTGAGCATCTCATCAGTACT
TTTAACCTCTTTCTTCAGGCAAGGGGCTCTCAATTCGTGATATGTAGGTGGCTTTAATCCTGGACTGAATTGTCCTATTGCTTCTATCATTGGAGCAAAACTATTGTAAT
TGCAAGCATTAAGAGGAATCCCGACATCATAAAACCATCTCGCAATGAATTGGATAACATTCGATCTCATTTCCTTTTTGAATGTTGCATTCAAAGTTGTTTGCTTTTGA
GTTATTGCTCCACTCCCTATAGGTTTTGGAGCGAAGAATGCGTCCATGGGACCCTTAGCTTTGGGTTTCTTGAAATTCGATTACGAACTTGAACTTGAGTTACTTGATGT
AGGTATTTTCCCCAAAAGAGTAACAGTTTCTTCATCTTCGTCACATTCATCATACAAACCATAGAGTTCGGTTTCTACATCGTTTGCAACAGCCTCTGAAACCAAATTTC
ATTGTTGTTTGATATCCTTTTTATTCATCATAAACACTCTCAATTCTTCCTTCACATGTTCAGGACATTTTCTACAATTCGTTGCATTTCGAAAGCCTCCAACGAGGTGT
TGCTTCATTCTATAAACACCTTCTTTAGTTACTTTCATACAAAACTCGCTCACCAATGAATTTTTATCTTCAGGTTTTTCTAACTGAGCATATTTCCATGCTGGATCTTT
TCTTGAGTCTTCTTCACTTTTTTAACTTGCCATCTTTGAATAAAGGTATACTTAAGAAAAAACATAAAATAACCTATAGTAAAAAAACATCACACATTCACACTAAATAC
ACATTATATAAATCAAAGATTCCAAATAGTTAAACAGATAGCCAAGGTGCAAGTCAGTAATCAAAATGTGAAATTTATCTTATAAGTCTATAACACAGTGAAACACATAT
CCAATTCCAAGTCAGTAATTAAACAAAATCATAAATCAAACATACTATTTATGAACATCAACTTTTAATCATTCAAAACAGAAAAGAAATGCAAACATTACAAACCAAAA
AAAAATCAAACAGAGAAGAGAAGAGAAGATGAATAGAACACTTGGTTTTTTAAAACAAATAGAACACTTGGTTTGATATTTAAAAAGAAAAAAAGAGGGGGATTTCGAAG
AGGAAGAAGAAGACTCATCAGGCACTACCGGTGAGTCTTCGAAAACAGCCGTTGAAGAAGATGTCGAGGTCGCGAAGCTGTCGGAGAATTTTGAGAAGAAGACGTCGATG
TTGCGCAGCTGTCGGAAAATTTCGAGAAGAAGCTGCCGGAGAATTTCGAGAAGAAGTTGACAAAGAAGACGTTTCTACGAATAGGGTTTCGAAGATATGCGACGTCGAGG
GTTTTACGATTGAAAACTTATCGATGAAGTTTCATTTTTGGTTTATTAAAAAATATATATAAATGATGAAACGACGTCGTTTTGATGCCGGTTTTAAAAATAAAAAAATA
ATGATAAAGAAAAAATATTAGGCGCGCGCCTCGTGCTCCCTAGCGCCTTAGAAAAAGGCTCGGGAGGCACGCGCTTTCCCTTGCGCGCTGCGACTTGGCCAAGCAAGGCG
CAGGCTGCGCGCCTTGCGCCTTATGGAGCTTTTTAAAACACTGCTTTTGAGGTCTGTGAACTTAATATTAAAATCCCTTGGAGGTCTCGGGTTAATTTGAATATATAATA
GTGTCTTGGTTTCCTATAAAAGAAACAAATACATTAAATATTAAACTTCTTTCTTAAGCTTGAAATATATGTTCCTTTTGCTGTTGTGGGAGGGAGTTAATTAGTGCTAC
TGAACAAGCAATAATTTGGTAGGAATAAAGAGGATGAGTCAGGAAGACCAAGGAATCCGCGCTGATAATTTAGCTGATGTTCACTGGAAGCGAAAACGTGGTCGCCCTAG
ATAAGTTCCAAATTTAAATTATGATGAGAGTATTCTTATTACAAAGAACAAACATATGGTGGCTATGCCTATTTCTCCTGGTTCTGGAGTAAATGGAAGCCAATCACATC
CAGCAATTAAAATTCAAAAGGTAGCTAATGGGATGCTGAGGCAGGTTGTATCGGGTGTCATTGAGGCAGCATTCGAAGCTGGATATCTTCTGTGTGTTAATGTTGGCAAC
TCTGGACTCACTTTGAGGGGTGTTGTTTTTAAGCCTGGGCATTATGTTCCTGTTTCAGCAGAGAATGACCTGGCCCCAGATGCTCAAATGATCAGAAGAAATATTCTTTT
TGCTACAGGAAATGAAACTAATGGAAATCACCCCCCATCTAAAAATGAAGTCCCATCTCATGAATCATCAGGTACCAAACTGGGGTTTAAATATATAACTTCACATTCTA
ACCGGGATGCATCGAAAGACAAATCTATATCATCTATATTTGCCCAAGTATCTCCTTTGGGAAGCTCAAGAGGTACTGTGGTCCCTGTTGTATTACAGCCTGCTAAATTA
ACCTATGGGCGCTCAGTTGCCACTGAATCACTTACTATTCAAACTCCTGATATTCAATCCTCAAAAGGCAATGAGTTTCTTGTAGGTACTTTTACAGCAAATGAATCAGC
TCTCACCAATGTGGCAGTTGGAATTGAAAGCTTTCCTTTCCCACCCTAATCTAGTCAGCATGTCTTACAAGATGATGTTGTTTCTGTAGAAAATAGTTCTCACAGCCATT
CCTTAGTTTTGGAAGGTAAATCGATGACATTGCCTAGCACGCCTTTCGATAGTCTTGCGACTGAAGTGATCAAGAGAATTCAAGCCCCTCTGTTCGCTGAGATGCCGACT
GAGAATGATAAATCAACCGGCAAGACATCAGCGAAAGAATGCGAAGATACCTCGAAGGTTGAGGCTAACATAGTGGATGGACTTGTGTTAGAAGAATCCCTAAAAGCAGT
GCAGCACCCCCATGAAAGTTCAGTGACTGTTCCCAAAGCTCTGGATGGTGAGTCTAAAACTGGGAAAATGACTGAGTAATGTTACAGGAAAACGTGATGCAAACTACATA
GCCATGGGCTGAAAAGCAGAACCCAGATTTGATGTTTAAGTCCATTGAACCTAATGAATAAAAAACAGAGATTGGGGATGAAGAAGCTGCCAACCAAAAGCAAATCTGAG
TAGCATCGTATCGTCACGATTAATATTTTCGTTGTAGGTAAATCATATGGTGTAGCTGATTTCTGGATGCTACCACGCCTAATCCTAACTTAAGTGTAGTTGGATGATTC
TCTAGAAAGTTATTGTTTTTTTCTAGTTGGATATTATAGATATGGACAATTTCACACTTGTAAAGGTTTCATTGGGTGGAGTGAATTTATCAAAAAAAAGTTTTGACCAA
A

Protein sequence

Show/hide protein sequence

MVAMPISPGSGVNGSQSHPAIKIQKVANGMLRQVVSGVIEAAFEAGYLLCVNVGNSGLTLRGVVFKPGHYVPVSAENDLAPDAQMIRRNILFATGNETNGNHPPSKNEVP
SHESSGTKLGFKYITSHSNRDASKDKSISSIFAQVSPLGSSRGTVVPVVLQPAKLTYGRSVATESLTIQTPDIQSSKGNEFLVGTFTANESALTNVAVGIESFPFPP

Sed0012412 (gene) of Chayote v1 genome