CuGenDBv2

Gene ID	Tan0006828
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Cytochrome c oxidase assembly protein cox16
Genome location	LG04:5141580..5147315
RNA-Seq Expression	Tan0006828
Synteny	Tan0006828
Gene Ontology terms	GO:0005743 - mitochondrial inner membrane (cellular component) GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_008446874.1 PREDICTED: uncharacterized protein LOC103489460 isoform X1 [Cucumis melo]

3.7e-60

91.54

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAGM +STE KKI+SA+NAARASPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMR+ALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQE+VDINNYEYKRIP+PTDR+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

XP_022956367.1 uncharacterized protein LOC111458129 [Cucurbita moschata]

2.5e-61

93.85

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAGM QSTE KK  SANNAAR+SPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQEKVDINNYEYKRIPKPTDR+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

XP_022969704.1 uncharacterized protein LOC111468648 [Cucurbita maxima]

7.4e-61

93.08

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAG+ QSTE KK  SANNAAR+SPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQEKVDINNYEYKRIPKPTDR+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

XP_023533207.1 uncharacterized protein LOC111795161 [Cucurbita pepo subsp. pepo]

5.7e-61

93.08

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAGM QSTE KK  SANNAAR+SPSMF+RWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQEKVDINNYEYKRIPKPTDR+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

XP_038891357.1 uncharacterized protein LOC120080793 isoform X2 [Benincasa hispida]

1.7e-60

92.31

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAG+ QSTE KKIAS NNA RASPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKV+DDQEWEITEMRKALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQEKVDINNYEYKRIPKPTD++S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

TrEMBL top hits

e value

%identity

Alignment

A0A1S4DWC3 uncharacterized protein LOC103489460 isoform X1

1.8e-60

91.54

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAGM +STE KKI+SA+NAARASPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMR+ALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQE+VDINNYEYKRIP+PTDR+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

A0A5A7SXX4 Cytochrome c oxidase assembly protein cox16

1.5e-51

81.06

Show/hide

Query:  TTTSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN
        T   TEAGM +STE KKI+SA+NAARASPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMR+ALSRTGPIDA+   +
Subjt:  TTTSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN

Query:  LSLEEELRALQEKVDINNYEYKRIPKPTDRSS
        L + ++ +ALQE+VDINNYEYKRIP+PTDR+S
Subjt:  LSLEEELRALQEKVDINNYEYKRIPKPTDRSS

A0A6J1CBH5 uncharacterized protein LOC111010064

2.4e-57

87.69

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TS E GMVQS E  KI+SA N ARASPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGP+DAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQEKV+IN+YEYKRIPKP+ R+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

A0A6J1GWL5 uncharacterized protein LOC111458129

1.2e-61

93.85

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAGM QSTE KK  SANNAAR+SPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQEKVDINNYEYKRIPKPTDR+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

A0A6J1HX89 uncharacterized protein LOC111468648

3.6e-61

93.08

Show/hide

Query:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS
        TSTEAG+ QSTE KK  SANNAAR+SPSMFRRWGRRHPF+RYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN+S
Subjt:  TSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKNLS

Query:  LEEELRALQEKVDINNYEYKRIPKPTDRSS
        LEEELRALQEKVDINNYEYKRIPKPTDR+S
Subjt:  LEEELRALQEKVDINNYEYKRIPKPTDRSS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G14145.1 unknown protein

1.8e-44

66.67

Show/hide

Query:  TTTSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN
        TT  T     +S+ S    +     + S + F+RWGRRHPFVRYGLPMISLTV GA+GLG LLQGSKDIAKVKDDQEWEI E RKALSRTGP+DAYKPKN
Subjt:  TTTSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKALSRTGPIDAYKPKN

Query:  LSLEEELRALQEKVDINNYEYKRIPKPTDRSS
         S+E+EL+A+QEKVDIN YEYK+IPK  +  S
Subjt:  LSLEEELRALQEKVDINNYEYKRIPKPTDRSS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATATCTTTGGTTGGGTTGGCAGTCCCTCGATCTTGGTTTCATAGCCAAAGTTTTTCCACGGTTTGCACAACGACGAGCACTGAGGCAGGAATGGTTCAGTCTACAGA
ATCAAAGAAGATTGCCTCTGCCAACAATGCAGCTCGGGCATCTCCATCCATGTTTAGAAGATGGGGTAGAAGACACCCATTTGTCAGATATGGACTTCCAATGATCTCTC
TCACTGTGCTTGGGGCAGTTGGTCTTGGCCATCTCTTGCAAGGAAGTAAAGATATTGCAAAGGTAAAAGATGATCAAGAATGGGAGATCACTGAGATGAGAAAAGCGCTT
TCAAGAACCGGACCTATCGATGCATATAAGCCGAAGAACTTATCTTTGGAGGAGGAGTTGAGGGCTTTACAAGAAAAGGTAGACATCAATAACTATGAGTACAAGAGAAT
TCCAAAGCCTACCGATCGATCGTCGTAA

mRNA sequence

Show/hide mRNA sequence

CGTGCGCAGCCTCCTCCTCATTCTTCTTCTTCTTCACGCCGTCTCCTCCTCCGTTTCAGCAGTGCCACCGGTTCTCTCCTGTTCAGCCGCCGCCCTCGTCGTTGCGCCGC
CGAACGCCACTCGCGAACCAACCGCACGCCGCTCGCGAAAACAGCCGCGCCGCCCAGATCCGAGAAGAAGCTCCGCCACGAGTCGCAAGCCACTGCCTCGCCTGCTCGTC
TCCGTCGCGCCGCCCATCACCCACTGAGGGCAACACCACCAAGCCTACCTCAATTTACTCTCTCGCGCGATCTGCTCAGACAACAAGGTTTCTTATGATATCTTTGGTTG
GGTTGGCAGTCCCTCGATCTTGGTTTCATAGCCAAAGTTTTTCCACGGTTTGCACAACGACGAGCACTGAGGCAGGAATGGTTCAGTCTACAGAATCAAAGAAGATTGCC
TCTGCCAACAATGCAGCTCGGGCATCTCCATCCATGTTTAGAAGATGGGGTAGAAGACACCCATTTGTCAGATATGGACTTCCAATGATCTCTCTCACTGTGCTTGGGGC
AGTTGGTCTTGGCCATCTCTTGCAAGGAAGTAAAGATATTGCAAAGGTAAAAGATGATCAAGAATGGGAGATCACTGAGATGAGAAAAGCGCTTTCAAGAACCGGACCTA
TCGATGCATATAAGCCGAAGAACTTATCTTTGGAGGAGGAGTTGAGGGCTTTACAAGAAAAGGTAGACATCAATAACTATGAGTACAAGAGAATTCCAAAGCCTACCGAT
CGATCGTCGTAAAGTTTTGCCCGCGTTGCATACGAGATCTGCTCAGGTATTTTTGTGTTTCTACCTGTGATGCAAGTTAGATTCAATTTCCAAAGAGAACAATTGGAATG
AATGATCTAGCTAAATCCTTGTTGAAGATTATGCTAATAAGCGTCATTTTCAAAGGAGCAGAATGTGCCAAGAAAAAAAAAGAATTAAGCTTGTTTAGCGTGATAAACAC
CATTGATAAAATATAGATAGATATTGGAGCCTTTATAATTACGAGTTCCTCTCTTCTTTGAAAGTTAATACGAGTATTAGTTTTTACTTGATTAAATTAATAACATGAGT
TATAATAGTCAA

Protein sequence

Show/hide protein sequence

MISLVGLAVPRSWFHSQSFSTVCTTTSTEAGMVQSTESKKIASANNAARASPSMFRRWGRRHPFVRYGLPMISLTVLGAVGLGHLLQGSKDIAKVKDDQEWEITEMRKAL
SRTGPIDAYKPKNLSLEEELRALQEKVDINNYEYKRIPKPTDRSS

Tan0006828 (gene) of Snake gourd v1 genome