CuGenDBv2

Gene ID	Spg010284
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	CACTA en-spm transposon protein
Genome location	scaffold8:19270864..19278822
RNA-Seq Expression	Spg010284
Synteny	Spg010284
Gene Ontology terms	GO:0016560 - protein import into peroxisome matrix, docking (biological process) GO:0005777 - peroxisome (cellular component) GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR015931 - Aconitase/3-isopropylmalate dehydratase large subunit, alpha/beta/alpha, subdomain 1/3 IPR035463 - Peroxin 13

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0044973.1 CACTA en-spm transposon protein [Cucumis melo var. makuwa]

3.3e-19

33.78

Show/hide

Query:  HVFLNVAWSFTALCCRNFRYIRFREVILVAYESRVSSSVARLEVREPGALQEDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYF
        H  L     F A C R+F+     E ++  +++     V R++      +  +    N   + KQ     P+NH +GSKSFL  Q               
Subjt:  HVFLNVAWSFTALCCRNFRYIRFREVILVAYESRVSSSVARLEVREPGALQEDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYF

Query:  FLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSS
                 +EL + R G+++  ++LF +T  + G  +VSQAA +AH+QM+ LQ  PTP+G+QP   D+IC+ VLG R    KGLGWGPKPK+R+  S+S
Subjt:  FLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSS

Query:  DAT-----SLRREHELSAVLSE
         ++     S ++E EL A L E
Subjt:  DAT-----SLRREHELSAVLSE

KAA0055457.1 CACTA en-spm transposon protein [Cucumis melo var. makuwa]

5.6e-19

39.52

Show/hide

Query:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ
        ++     NK    K P+NH +GSKSFL  Q                        +EL + R G+ +  ++LF +T  + G  +VSQAA +AH+QM+ LQ 
Subjt:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ

Query:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE
         PTP+G+QP   D+IC+ VLG R D  KGLGWGPKPK+R+  S+S ++     S ++E EL A L E
Subjt:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE

KAA0066000.1 CACTA en-spm transposon protein [Cucumis melo var. makuwa]

4.3e-19

38.92

Show/hide

Query:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ
        ++     NK    K P+NH +GSKSFL  Q + A                          R G+++  ++LF +T  + G  +VSQAA + HDQM+ LQ 
Subjt:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ

Query:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE
         PTP+G+QP   D+IC+ VLG R    KGLGWGPKPK+R+ TS+S ++     S  +E EL A L E
Subjt:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE

TYK11183.1 CACTA en-spm transposon protein [Cucumis melo var. makuwa]

3.3e-19

40.48

Show/hide

Query:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ
        ++   + NK    K P+NH +GSKSFL  Q                        +EL K R+GE++  ++LF KT  + G  +VSQA  +AH+QM+ LQ 
Subjt:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ

Query:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSET
         PT  G+QP   D+IC+ VLG R    KGLGWGPKPK+R+ TS+S ++     S ++E EL A L+ET
Subjt:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSET

XP_022156286.1 uncharacterized protein LOC111023212 [Momordica charantia]

5.4e-22

41.18

Show/hide

Query:  EDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMV
        E P+WK + +KNK+N AKLPFNH AGSKSFL +Q +                          K +EG ++GP+DLF ++ Y E  G V+  A +A++ M 
Subjt:  EDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMV

Query:  ALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDATS
         L +APT +G +P    + C  VLG R D +KGLG+GP+P   K  SSS+ TS
Subjt:  ALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDATS

TrEMBL top hits

e value

%identity

Alignment

A0A5A7TN85 CACTA en-spm transposon protein

1.6e-19

33.78

Show/hide

Query:  HVFLNVAWSFTALCCRNFRYIRFREVILVAYESRVSSSVARLEVREPGALQEDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYF
        H  L     F A C R+F+     E ++  +++     V R++      +  +    N   + KQ     P+NH +GSKSFL  Q               
Subjt:  HVFLNVAWSFTALCCRNFRYIRFREVILVAYESRVSSSVARLEVREPGALQEDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYF

Query:  FLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSS
                 +EL + R G+++  ++LF +T  + G  +VSQAA +AH+QM+ LQ  PTP+G+QP   D+IC+ VLG R    KGLGWGPKPK+R+  S+S
Subjt:  FLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSS

Query:  DAT-----SLRREHELSAVLSE
         ++     S ++E EL A L E
Subjt:  DAT-----SLRREHELSAVLSE

A0A5A7ULK1 CACTA en-spm transposon protein

2.7e-19

39.52

Show/hide

Query:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ
        ++     NK    K P+NH +GSKSFL  Q                        +EL + R G+ +  ++LF +T  + G  +VSQAA +AH+QM+ LQ 
Subjt:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ

Query:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE
         PTP+G+QP   D+IC+ VLG R D  KGLGWGPKPK+R+  S+S ++     S ++E EL A L E
Subjt:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE

A0A5D3CH15 CACTA en-spm transposon protein

1.6e-19

40.48

Show/hide

Query:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ
        ++   + NK    K P+NH +GSKSFL  Q                        +EL K R+GE++  ++LF KT  + G  +VSQA  +AH+QM+ LQ 
Subjt:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ

Query:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSET
         PT  G+QP   D+IC+ VLG R    KGLGWGPKPK+R+ TS+S ++     S ++E EL A L+ET
Subjt:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSET

A0A5D3DZR1 CACTA en-spm transposon protein

2.1e-19

38.92

Show/hide

Query:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ
        ++     NK    K P+NH +GSKSFL  Q + A                          R G+++  ++LF +T  + G  +VSQAA + HDQM+ LQ 
Subjt:  WKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVALQQ

Query:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE
         PTP+G+QP   D+IC+ VLG R    KGLGWGPKPK+R+ TS+S ++     S  +E EL A L E
Subjt:  APTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDAT-----SLRREHELSAVLSE

A0A6J1DUH3 uncharacterized protein LOC111023212

2.6e-22

41.18

Show/hide

Query:  EDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMV
        E P+WK + +KNK+N AKLPFNH AGSKSFL +Q +                          K +EG ++GP+DLF ++ Y E  G V+  A +A++ M 
Subjt:  EDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMV

Query:  ALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDATS
         L +APT +G +P    + C  VLG R D +KGLG+GP+P   K  SSS+ TS
Subjt:  ALQQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDATS

SwissProt top hits

e value

%identity

Alignment

Q9SRR0 Peroxisomal membrane protein 13

7.9e-08

67.44

Show/hide

Query:  MHGVVNFFGRISILIDQNTQAFHMFMTALLQL-DRYVRIHGKI
        M G VNFFGR+++LIDQNTQAFHMFM+ALLQL DR   ++G++
Subjt:  MHGVVNFFGRISILIDQNTQAFHMFMTALLQL-DRYVRIHGKI

Arabidopsis top hits

e value

%identity

Alignment

AT3G07560.1 peroxin 13

5.6e-09

67.44

Show/hide

Query:  MHGVVNFFGRISILIDQNTQAFHMFMTALLQL-DRYVRIHGKI
        M G VNFFGR+++LIDQNTQAFHMFM+ALLQL DR   ++G++
Subjt:  MHGVVNFFGRISILIDQNTQAFHMFMTALLQL-DRYVRIHGKI

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATCAAACCCTCGGCGTCGAGACATTGGCAACAGTGTTGAGACGCCAAAAACGTGCCTGCACCCAGTTTCGTCCAAAGTGTCTTGACATTGTCACCTGCTTCTATAA
ATTGTTAGCGAACTACCTTGCTTCACCTCCTTTGGTGGTAGCTTATGCCTTAGCTGGCACGATGCATGGTGTTGTGAACTTCTTTGGTCGAATATCTATTCTCATTGACC
AAAACACACAGGCATTCCATATGTTCATGACTGCACTACTTCAGCTGGATAGATACGTTCGCATCCATGGGAAGATACCTATCGAGATCACCGACGAGTTGAGAAAGCCG
GTGTGTGACAATGCAGTAAAATTCAGAGGTACCACTGGTAAAATTGTCAGAGAATCATTTTCCGTACGTTATGCAAAGTCAAAAGTTGTACCGAAGGACGCAAGGGATCA
TCTTAAACATTGTCTTTTGTGCTCCTCTAATGAACAACCTGTTTATGGTCCAACCAGTAAACAGAAAGTCCCTCTCGAGCCAGTGAGAGGGCGAGATCCCTTTGATACCC
CCGCCCGCATGTCTCCTACATGGACGCCTTGGATCAATACGTTTGTATCGAATACAAAGTGTTACCAGGATAAGATGGGAGGTGTAACACCCCGTGCACATTTGGCAGCC
CCCTTTGCCGTTTGCTTTAGCGGCCGCGTGTCCCCTCCAGCCGAAGTCTCGCGCCGTCGCAGCCTAGCCCTTTGCAGTCGAGGAACGCCGCCGTGGGTTGCCGCCGCTCG
AGCTCCAGCGCCGTCGTCGCCGTGTTCATCGTACCGCCCCTTCGTCGCTCGGATCTCCCTCTCTCTGCGTCAATCTTGCGCGGACAGCAGCTCGGAGTCTCCTTTCCTCG
CGTTTTCGCCTCTTTCCAGCAGCGTCATTGGGCGTTCCCGGCGTCATTTAGCGATTTCGGTTTTTAAATCATGGTTTAACTGGAAGCTCGTTTTGGAGCAAGTCTGTGCA
GTTCCAGCTAGCGTTGGTATTAAAAGCATTTCATGTTATGCTGTTTACAATCGTTCTGAATTGTTTGAGATGAGCTCGTTTTGTTCATCGCTTGTGGCTAGCTTGTGTCA
CGGGAAGTGTAGCATAAGTCTAGTGGTAGCGTTGCATGACGCCCTGGCGCATAATGCATGCAAGTGGTTTTGCGTAGCATGGCGCGAAATGCACGTTTTTCTGAATGTTG
CCTGGAGTTTTACGGCGTTATGCTGCCGAAATTTTCGATACATTCGGTTTAGAGAAGTTATCCTAGTTGCTTATGAGTCTAGAGTGAGTAGTAGCGTTGCTAGGCTAGAG
GTTAGAGAACCTGGGGCGTTACAGGAGGACCCCAAGTGGAAGAACATGGGTGAGAAGAATAAACAGAATCATGCCAAACTTCCTTTCAACCACTATGCTGGGTCAAAATC
ATTTCTTCACATACAACAGAAGAATGCAAGTTTAAAAATAATCTTAAGGGTAAGCTATTTTTTTCTAATATTACTAATATGTGCGAAATTTGAACTACAGAAAACTAGAG
AAGGTGAGAATTTGGGTCCTATTGACTTATTTCATAAGACTAGATACAAGGAAGGAAAGGGGTGGGTTAGTCAAGCCGCCAATGAAGCTCATGATCAAATGGTGGCATTG
CAACAGGCACCCACCCCAGATGGGACCCAACCGCCTAAACCAGATGACATATGCGAAGCTGTTCTGGGTAGTCGATCGGATCAAATTAAAGGGCTTGGTTGGGGACCAAA
GCCGAAGTCGAGAAAGTGTACCTCCTCATCCGATGCAACTTCATTAAGACGAGAGCATGAACTAAGTGCAGTCTTGAGTGAGACCTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDQTLGVETLATVLRRQKRACTQFRPKCLDIVTCFYKLLANYLASPPLVVAYALAGTMHGVVNFFGRISILIDQNTQAFHMFMTALLQLDRYVRIHGKIPIEITDELRKP
VCDNAVKFRGTTGKIVRESFSVRYAKSKVVPKDARDHLKHCLLCSSNEQPVYGPTSKQKVPLEPVRGRDPFDTPARMSPTWTPWINTFVSNTKCYQDKMGGVTPRAHLAA
PFAVCFSGRVSPPAEVSRRRSLALCSRGTPPWVAAARAPAPSSPCSSYRPFVARISLSLRQSCADSSSESPFLAFSPLSSSVIGRSRRHLAISVFKSWFNWKLVLEQVCA
VPASVGIKSISCYAVYNRSELFEMSSFCSSLVASLCHGKCSISLVVALHDALAHNACKWFCVAWREMHVFLNVAWSFTALCCRNFRYIRFREVILVAYESRVSSSVARLE
VREPGALQEDPKWKNMGEKNKQNHAKLPFNHYAGSKSFLHIQQKNASLKIILRVSYFFLILLICAKFELQKTREGENLGPIDLFHKTRYKEGKGWVSQAANEAHDQMVAL
QQAPTPDGTQPPKPDDICEAVLGSRSDQIKGLGWGPKPKSRKCTSSSDATSLRREHELSAVLSET

Spg010284 (gene) of Sponge gourd (cylindrica) v1 genome