; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh14G011150 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh14G011150
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
DescriptionPentatricopeptide repeat-containing protein
Genome locationCmo_Chr14:7572480..7575463
RNA-Seq ExpressionCmoCh14G011150
SyntenyCmoCh14G011150
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR002885 - Pentatricopeptide repeat
IPR011990 - Tetratricopeptide-like helical domain superfamily
IPR033443 - Pentacotripeptide-repeat region of PRORP


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6581658.1 Pentatricopeptide repeat-containing protein, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia]8.1e-6997.83Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKVE GYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

KAG7018152.1 Pentatricopeptide repeat-containing protein, chloroplastic [Cucurbita argyrosperma subsp. argyrosperma]8.1e-6997.83Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKVE GYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

XP_022930554.1 pentatricopeptide repeat-containing protein At1g10910, chloroplastic [Cucurbita moschata]7.3e-7098.55Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

XP_022980545.1 pentatricopeptide repeat-containing protein At1g10910, chloroplastic [Cucurbita maxima]2.0e-6795.65Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKVEHGYAKALELLKE QNNGLCMD VSYGTLIAVCASHNRLE+AESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELEALG+GENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

XP_023528492.1 pentatricopeptide repeat-containing protein At1g10910, chloroplastic [Cucurbita pepo subsp. pepo]7.3e-7098.55Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

TrEMBL top hitse value%identityAlignment
A0A0A0LCK2 PPR_long domain-containing protein7.1e-6387.68Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCI+V+HGYAKA+ELLKE Q+NGLCMD VSYGTLIA+CASHNRLEDAE FFNQM+ EG+SPNMFHYGSLLNAYS++GDYKKADELIEDMKL GLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELE+LGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

A0A1S3CMQ2 pentatricopeptide repeat-containing protein At1g10910, chloroplastic isoform X29.3e-6387.68Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCI+V+HGYAKA+ELLKE Q+NGLCMD V YGTLIA+CASHNRLEDAESFFNQM+ EG+SPNMFHYGSLLNAYS++GDYKKADELIEDMKL GLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELE+LGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

A0A6J1DRU4 pentatricopeptide repeat-containing protein At1g10910, chloroplastic5.5e-6389.86Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKV+HGYAKALELLKE Q NGLCMDSV YGTLIAVCASHNRLEDAESFF QMKNEG+SPNMFHYGSLLNAYS SGDYKKADELI+DMKL GLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKV+LTTLLKVYVRGGLFEKS+KLLS+LEALGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

A0A6J1ERS3 pentatricopeptide repeat-containing protein At1g10910, chloroplastic3.5e-7098.55Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

A0A6J1IWQ9 pentatricopeptide repeat-containing protein At1g10910, chloroplastic9.6e-6895.65Show/hide
Query:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
        + MLTGCIKVEHGYAKALELLKE QNNGLCMD VSYGTLIAVCASHNRLE+AESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV
Subjt:  ANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        PNKVILTTLLKVYVRGGLFEKSRKLLSELEALG+GENE
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

SwissProt top hitse value%identityAlignment
Q0WVV0 Pentatricopeptide repeat-containing protein At1g10910, chloroplastic1.1e-4765.44Show/hide
Query:  MLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPN
        +L GCIKV++GY KA+EL+ E  +NG+ MDSV YGT++A+CAS+ R E+AE+F  QMK EG+SPN++HY SLLN+YS  GDYKKADEL+ +MK  GLVPN
Subjt:  MLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPN

Query:  KVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        KV++TTLLKVY++GGLF++SR+LLSELE+ GY ENE
Subjt:  KVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

Q5G1S8 Pentatricopeptide repeat-containing protein At3g18110, chloroplastic1.1e-1228.69Show/hide
Query:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG
        A+ELL   +N+GL  D+++Y TL++ C+  + L+ A   F  M+     P+++ Y ++++ Y   G   +A+ L  +++LKG  P+ V   +LL  + R 
Subjt:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG

Query:  GLFEKSRKLLSELEALGYGENE
           EK +++  +++ +G+G++E
Subjt:  GLFEKSRKLLSELEALGYGENE

Q940A6 Pentatricopeptide repeat-containing protein At4g19440, chloroplastic5.9e-1433.33Show/hide
Query:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG
        ALEL ++ ++ G+  +S +Y +LI   +  +R+E+A+  F +M+ EG  PN+FHY +L++ Y   G   K + L+ +M  K + PNK+  T ++  Y R 
Subjt:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG

Query:  GLFEKSRKLLSELEALG
        G   ++ +LL+E+   G
Subjt:  GLFEKSRKLLSELEALG

Q9FIT7 Pentatricopeptide repeat-containing protein At5g61990, mitochondrial5.9e-1431.15Show/hide
Query:  KALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVR
        +A    +   + G+  D+ +Y  L+     +++++DAE  F +M+ +G +P++F YG L+N +S  G+ +KA  + ++M  +GL PN +I   LL  + R
Subjt:  KALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVR

Query:  GGLFEKSRKLLSELEALGYGEN
         G  EK+++LL E+   G   N
Subjt:  GGLFEKSRKLLSELEALGYGEN

Q9M316 Pentatricopeptide repeat-containing protein At3g61520, mitochondrial5.5e-1231.54Show/hide
Query:  NMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV-
        NML G    ++   K  E+L + +  G   DS++Y TLI+    H   E  E    QM+ +G  P +  YG++++AY   G+  +A +L +DM L   V 
Subjt:  NMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLV-

Query:  PNKVILTTLLKVYVRGGLFEKSRKLLSELE
        PN VI   L+  + + G F ++  L  E++
Subjt:  PNKVILTTLLKVYVRGGLFEKSRKLLSELE

Arabidopsis top hitse value%identityAlignment
AT1G10910.1 Pentatricopeptide repeat (PPR) superfamily protein7.6e-4965.44Show/hide
Query:  MLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPN
        +L GCIKV++GY KA+EL+ E  +NG+ MDSV YGT++A+CAS+ R E+AE+F  QMK EG+SPN++HY SLLN+YS  GDYKKADEL+ +MK  GLVPN
Subjt:  MLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPN

Query:  KVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE
        KV++TTLLKVY++GGLF++SR+LLSELE+ GY ENE
Subjt:  KVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENE

AT3G18110.1 Pentatricopeptide repeat (PPR) superfamily protein7.9e-1428.69Show/hide
Query:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG
        A+ELL   +N+GL  D+++Y TL++ C+  + L+ A   F  M+     P+++ Y ++++ Y   G   +A+ L  +++LKG  P+ V   +LL  + R 
Subjt:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG

Query:  GLFEKSRKLLSELEALGYGENE
           EK +++  +++ +G+G++E
Subjt:  GLFEKSRKLLSELEALGYGENE

AT4G19440.1 Tetratricopeptide repeat (TPR)-like superfamily protein4.2e-1533.33Show/hide
Query:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG
        ALEL ++ ++ G+  +S +Y +LI   +  +R+E+A+  F +M+ EG  PN+FHY +L++ Y   G   K + L+ +M  K + PNK+  T ++  Y R 
Subjt:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG

Query:  GLFEKSRKLLSELEALG
        G   ++ +LL+E+   G
Subjt:  GLFEKSRKLLSELEALG

AT4G19440.2 Tetratricopeptide repeat (TPR)-like superfamily protein4.2e-1533.33Show/hide
Query:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG
        ALEL ++ ++ G+  +S +Y +LI   +  +R+E+A+  F +M+ EG  PN+FHY +L++ Y   G   K + L+ +M  K + PNK+  T ++  Y R 
Subjt:  ALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVRG

Query:  GLFEKSRKLLSELEALG
        G   ++ +LL+E+   G
Subjt:  GLFEKSRKLLSELEALG

AT5G61990.1 Pentatricopeptide repeat (PPR) superfamily protein4.2e-1531.15Show/hide
Query:  KALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVR
        +A    +   + G+  D+ +Y  L+     +++++DAE  F +M+ +G +P++F YG L+N +S  G+ +KA  + ++M  +GL PN +I   LL  + R
Subjt:  KALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKKADELIEDMKLKGLVPNKVILTTLLKVYVR

Query:  GGLFEKSRKLLSELEALGYGEN
         G  EK+++LL E+   G   N
Subjt:  GGLFEKSRKLLSELEALGYGEN


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGGAACAGTAATGGAGATAAATCCTATAACAAAGGAAAATATTCTTAAAGGTAGAGCCAAGGAGCATAATGCCAATATGCTTACTGGTTGTATCAAGGTTGAACATGG
TTATGCCAAAGCATTGGAGCTTCTAAAGGAGTCGCAAAACAATGGACTATGCATGGATTCTGTGTCGTATGGGACACTGATAGCTGTTTGTGCTTCACATAATAGATTGG
AAGACGCAGAGAGTTTCTTCAACCAGATGAAAAATGAAGGCTATTCGCCAAATATGTTTCATTATGGCTCGCTACTCAATGCTTATTCAATGAGTGGAGATTATAAAAAG
GCTGATGAGCTGATCGAGGATATGAAATTGAAGGGGTTAGTACCAAATAAGGTGATTTTAACAACATTGCTGAAGGTTTATGTCAGGGGAGGTTTGTTTGAGAAATCAAG
GAAACTCTTATCAGAACTGGAAGCCCTTGGCTACGGTGAAAATGAGGAGTTGATGAAGCTGAGCTATTGA
mRNA sequenceShow/hide mRNA sequence
ATGGGAACAGTAATGGAGATAAATCCTATAACAAAGGAAAATATTCTTAAAGGTAGAGCCAAGGAGCATAATGCCAATATGCTTACTGGTTGTATCAAGGTTGAACATGG
TTATGCCAAAGCATTGGAGCTTCTAAAGGAGTCGCAAAACAATGGACTATGCATGGATTCTGTGTCGTATGGGACACTGATAGCTGTTTGTGCTTCACATAATAGATTGG
AAGACGCAGAGAGTTTCTTCAACCAGATGAAAAATGAAGGCTATTCGCCAAATATGTTTCATTATGGCTCGCTACTCAATGCTTATTCAATGAGTGGAGATTATAAAAAG
GCTGATGAGCTGATCGAGGATATGAAATTGAAGGGGTTAGTACCAAATAAGGTGATTTTAACAACATTGCTGAAGGTTTATGTCAGGGGAGGTTTGTTTGAGAAATCAAG
GAAACTCTTATCAGAACTGGAAGCCCTTGGCTACGGTGAAAATGAGGAGTTGATGAAGCTGAGCTATTGA
Protein sequenceShow/hide protein sequence
MGTVMEINPITKENILKGRAKEHNANMLTGCIKVEHGYAKALELLKESQNNGLCMDSVSYGTLIAVCASHNRLEDAESFFNQMKNEGYSPNMFHYGSLLNAYSMSGDYKK
ADELIEDMKLKGLVPNKVILTTLLKVYVRGGLFEKSRKLLSELEALGYGENEELMKLSY