; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0020759 (gene) of Snake gourd v1 genome

Gene IDTan0020759
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionPentatricopeptide repeat-containing protein
Genome locationLG01:1689715..1692374
RNA-Seq ExpressionTan0020759
SyntenyTan0020759
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR002885 - Pentatricopeptide repeat
IPR011990 - Tetratricopeptide-like helical domain superfamily
IPR044646 - Pentatricopeptide repeat-containing protein EMB1417-like


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7013270.1 Pentatricopeptide repeat-containing protein [Cucurbita argyrosperma subsp. argyrosperma]1.9e-15487.57Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        M HSLVPASLSS+ ASNRM TLIYSFPVISK IESVKFS   SSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYY+R MHDKLFE+F
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLEDE
        ADMEELGVQP+MAIVTM+GNVFQ+LGMLDKYEKLKKKYPPPKWEYRYI+GKRV+IRA  L+E+ SSNNGS ELDKKEHSST +LLEE +ITS+DSSLED+
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLEDE

Query:  EMSEDPDEGEDPDDVLEDESTS-KESNFEHDFVGFGQL
        EMSEDP E       LEDES   KES FEHDF+GFGQL
Subjt:  EMSEDPDEGEDPDDVLEDESTS-KESNFEHDFVGFGQL

XP_022140817.1 pentatricopeptide repeat-containing protein At4g21190 [Momordica charantia]2.8e-15386.01Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        M HS V ASLSSSSASNRM TLIYSFPVISKRIESVKFSWS SS+VVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQ+LESMPR+FFHKMISLYYD+GMHDKLFEVF
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE
        ADMEELGVQPN  IVTM+GNVFQELGM DKYEKLKKKYPP KWEYRY+KGKRVRIRA YL E  +SNNGSSELD+K+ SS KLLEEAE  S+DSSLEDEE
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE

Query:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL
        M EDPDE      +LEDES  +  +FE++F+G+G+L
Subjt:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL

XP_022945794.1 pentatricopeptide repeat-containing protein At4g21190 [Cucurbita moschata]3.3e-15487.57Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        M HSLVPASLSS+ ASNRM TLIYSFPVISK IESVKFS   SSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALA DGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYY+R MHDKLFE+F
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLEDE
        ADMEELGVQP+MAIVT +GNVFQ+LGMLDKYEKLKKKYPPPKWEYRYI+GKRV+IRA  L+E+ SSNNGS ELDKKEHSST +LLEE EITS+DSSLED+
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLEDE

Query:  EMSEDPDEGEDPDDVLEDESTS-KESNFEHDFVGFGQL
        EMSEDPDE       LEDES   KES FEHDF+GFGQL
Subjt:  EMSEDPDEGEDPDDVLEDESTS-KESNFEHDFVGFGQL

XP_023541679.1 pentatricopeptide repeat-containing protein At4g21190 [Cucurbita pepo subsp. pepo]7.3e-15487.35Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSW--SPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFI
        M HSLVPASLSS+ ASNRM TLIYSFPVISK IESVKFS   S SSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFI
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSW--SPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFI

Query:  AWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFE
        AWELEFPLI VKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYY+R MHDKLFE
Subjt:  AWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFE

Query:  VFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLE
        +FADMEELGVQP+MAIVTM+GNVFQ+LGMLDKYEKLKKKYPPPKWEYRYI+GKRV+IRA  L+E+ SSNNGS + DKKEHSST +LLEE EITS+DSSLE
Subjt:  VFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLE

Query:  DEEMSEDPDEGEDPDDVLEDES-TSKESNFEHDFVGFGQL
        D+EMSEDPDE       LEDES   KES FEHDF+GFGQL
Subjt:  DEEMSEDPDEGEDPDDVLEDES-TSKESNFEHDFVGFGQL

XP_038888232.1 pentatricopeptide repeat-containing protein At4g21190 isoform X1 [Benincasa hispida]1.9e-15486.65Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        M HSL  ASLSSSSAS RMLTLIYSFPVISKRIESV FSW  SSSVVCAAKGPRPRYPRVWKT+KRIGT+SKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKAL+TLE QREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDR MHDKLFEVF
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDE-
        ADMEELGVQPNM IVTMVGNVF ELGMLDKYEKL KKYPPPKWEYRYIKGKRVRIR+ YLYE+ + NN  S+ DK EHSSTKLLEEAEITSED++LED+ 
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDE-

Query:  EMSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL
        EMSEDP+E      + +DE  SKE NFEHDF+GFGQL
Subjt:  EMSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL

TrEMBL top hitse value%identityAlignment
A0A0A0L6Q9 Uncharacterized protein1.2e-15184.82Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        MTHSL  A+LSS  AS RMLTL+Y+FPV SKRIESV FSW PSSSVVCAAKGPRPRYPRVWKT+KRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKALKTLE QREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLES+PRIFFHKMISLYYD+ MHDKLFEVF
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE
        ADMEELGVQPNMAIVT VGNVFQELGMLDKY+KL KKYPPPKWEYRYIKGKRV+IRA YL E+ +SNNG SE  K EHSST  ++EAEITSEDSSLED+E
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE

Query:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL
             D  EDPD++LEDE    +SNFEHDF+G GQL
Subjt:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL

A0A5D3DHA7 Pentatricopeptide repeat-containing protein6.2e-15184.23Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        MTH L  A+L+S SAS RMLTL+Y+FPV SKRIESV FSW PSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKALKTLE QREWKRIIQLTKWMLSKGQGRTMGSYFTLLNAL EDGRLDEAEELWNKLFSQ+LESMPRIFFHKMISLYYDR MHDKLFEVF
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE
        ADMEELGVQPNMAIVT VGN+FQELGMLDKYEKL KKYPPPKWEYRYIKGKRV+IR  YL E+ +S NG SE +K EHSST  L+EAEITSEDSSLED+E
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE

Query:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL
             + G+DPD++LEDE    +SNFEHDF+G GQL
Subjt:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL

A0A6J1CI57 pentatricopeptide repeat-containing protein At4g211901.3e-15386.01Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        M HS V ASLSSSSASNRM TLIYSFPVISKRIESVKFSWS SS+VVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQ+LESMPR+FFHKMISLYYD+GMHDKLFEVF
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE
        ADMEELGVQPN  IVTM+GNVFQELGM DKYEKLKKKYPP KWEYRY+KGKRVRIRA YL E  +SNNGSSELD+K+ SS KLLEEAE  S+DSSLEDEE
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEE

Query:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL
        M EDPDE      +LEDES  +  +FE++F+G+G+L
Subjt:  MSEDPDEGEDPDDVLEDESTSKESNFEHDFVGFGQL

A0A6J1G1Y3 pentatricopeptide repeat-containing protein At4g211901.6e-15487.57Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
        M HSLVPASLSS+ ASNRM TLIYSFPVISK IESVKFS   SSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAW

Query:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF
        ELEFPLI VKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALA DGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYY+R MHDKLFE+F
Subjt:  ELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVF

Query:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLEDE
        ADMEELGVQP+MAIVT +GNVFQ+LGMLDKYEKLKKKYPPPKWEYRYI+GKRV+IRA  L+E+ SSNNGS ELDKKEHSST +LLEE EITS+DSSLED+
Subjt:  ADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLEDE

Query:  EMSEDPDEGEDPDDVLEDESTS-KESNFEHDFVGFGQL
        EMSEDPDE       LEDES   KES FEHDF+GFGQL
Subjt:  EMSEDPDEGEDPDDVLEDESTS-KESNFEHDFVGFGQL

A0A6J1HWS4 pentatricopeptide repeat-containing protein At4g211901.1e-15086.47Show/hide
Query:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSW--SPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFI
        M HSLVPASLSS+ ASNRM TLIYSFPVISK IESVKFS   S  SSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFI
Subjt:  MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSW--SPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFI

Query:  AWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFE
        AWELEFPLI VKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYY+R MHDKLFE
Subjt:  AWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFE

Query:  VFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLE
        +FADMEELGVQP+MAIVTM+G+VFQ+LGMLDK EKLKKKYPPPKWEYRYI+GKRV+IRA  L+E+ SSNNGS ELDKKE SST +LLEE E TS+DSSLE
Subjt:  VFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSST-KLLEEAEITSEDSSLE

Query:  DEEMSEDPDEGEDPDDVLEDES-TSKESNFEHDFVGFGQL
        D+EMSED DE      VLEDES   KES FEHDF+GFGQL
Subjt:  DEEMSEDPDEGEDPDDVLEDES-TSKESNFEHDFVGFGQL

SwissProt top hitse value%identityAlignment
Q2V3H0 Pentatricopeptide repeat-containing protein At4g18975, chloroplastic1.4e-4345.59Show/hide
Query:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE
        +WK     G+  KA  LV  + GL N KE VYGAL+ ++AWE+EFP+I   KAL+ L  + +W R+IQL KWMLSKGQG TMG+Y  LL A   D R DE
Subjt:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE

Query:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY
        AE LWN +   H  S+PR  F +MI+LY    +HDK+ EVFADMEEL V P+      V   F+EL   +  + + ++Y   +++Y Y  G+RVR++  +
Subjt:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY

Query:  LYES
          +S
Subjt:  LYES

Q8LG95 Pentatricopeptide repeat-containing protein At4g211902.8e-10063.69Show/hide
Query:  MLTLIYSFP--VISKRIESVK-FSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKT
        ML+L YS P  ++  R  S K F+  P++ VVCAA+GPRPR PRVWKTRKRIGTISKAAK++ C+KGLSNVKEEVYGALDSFIAWELEFPL+IVKKAL  
Subjt:  MLTLIYSFP--VISKRIESVK-FSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKT

Query:  LEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIV
        LE ++EWK+IIQ+TKWMLSKGQGRTMG+YF+LLNALAED RLDEAEELWNKLF +HLE  PR FF+KMIS+YY R MH KLFEVFADMEELGV+PN+AIV
Subjt:  LEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIV

Query:  TMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNG-SSELDKKEHSSTKLLEEAEITSEDSSLEDEEMSEDPDEGEDPDDV
        +MVG VF +L M DKYEKL KKYPPP+WE+RYIKG+RV+++A  L E S    G SS+ DK ++         EI SE+   + E++SE+ ++ ++    
Subjt:  TMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNG-SSELDKKEHSSTKLLEEAEITSEDSSLEDEEMSEDPDEGEDPDDV

Query:  LEDESTSKESNFEH
         + + TS+E + +H
Subjt:  LEDESTSKESNFEH

Arabidopsis top hitse value%identityAlignment
AT4G18975.1 Pentatricopeptide repeat (PPR) superfamily protein1.0e-4445.59Show/hide
Query:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE
        +WK     G+  KA  LV  + GL N KE VYGAL+ ++AWE+EFP+I   KAL+ L  + +W R+IQL KWMLSKGQG TMG+Y  LL A   D R DE
Subjt:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE

Query:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY
        AE LWN +   H  S+PR  F +MI+LY    +HDK+ EVFADMEEL V P+      V   F+EL   +  + + ++Y   +++Y Y  G+RVR++  +
Subjt:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY

Query:  LYES
          +S
Subjt:  LYES

AT4G18975.2 Pentatricopeptide repeat (PPR) superfamily protein1.0e-4445.59Show/hide
Query:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE
        +WK     G+  KA  LV  + GL N KE VYGAL+ ++AWE+EFP+I   KAL+ L  + +W R+IQL KWMLSKGQG TMG+Y  LL A   D R DE
Subjt:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE

Query:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY
        AE LWN +   H  S+PR  F +MI+LY    +HDK+ EVFADMEEL V P+      V   F+EL   +  + + ++Y   +++Y Y  G+RVR++  +
Subjt:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY

Query:  LYES
          +S
Subjt:  LYES

AT4G18975.3 Pentatricopeptide repeat (PPR) superfamily protein1.0e-4445.59Show/hide
Query:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE
        +WK     G+  KA  LV  + GL N KE VYGAL+ ++AWE+EFP+I   KAL+ L  + +W R+IQL KWMLSKGQG TMG+Y  LL A   D R DE
Subjt:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE

Query:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY
        AE LWN +   H  S+PR  F +MI+LY    +HDK+ EVFADMEEL V P+      V   F+EL   +  + + ++Y   +++Y Y  G+RVR++  +
Subjt:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY

Query:  LYES
          +S
Subjt:  LYES

AT4G18975.4 Pentatricopeptide repeat (PPR) superfamily protein1.0e-4445.59Show/hide
Query:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE
        +WK     G+  KA  LV  + GL N KE VYGAL+ ++AWE+EFP+I   KAL+ L  + +W R+IQL KWMLSKGQG TMG+Y  LL A   D R DE
Subjt:  VWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDE

Query:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY
        AE LWN +   H  S+PR  F +MI+LY    +HDK+ EVFADMEEL V P+      V   F+EL   +  + + ++Y   +++Y Y  G+RVR++  +
Subjt:  AEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANY

Query:  LYES
          +S
Subjt:  LYES

AT4G21190.1 Pentatricopeptide repeat (PPR) superfamily protein2.0e-10163.69Show/hide
Query:  MLTLIYSFP--VISKRIESVK-FSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKT
        ML+L YS P  ++  R  S K F+  P++ VVCAA+GPRPR PRVWKTRKRIGTISKAAK++ C+KGLSNVKEEVYGALDSFIAWELEFPL+IVKKAL  
Subjt:  MLTLIYSFP--VISKRIESVK-FSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVKKALKT

Query:  LEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIV
        LE ++EWK+IIQ+TKWMLSKGQGRTMG+YF+LLNALAED RLDEAEELWNKLF +HLE  PR FF+KMIS+YY R MH KLFEVFADMEELGV+PN+AIV
Subjt:  LEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIV

Query:  TMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNG-SSELDKKEHSSTKLLEEAEITSEDSSLEDEEMSEDPDEGEDPDDV
        +MVG VF +L M DKYEKL KKYPPP+WE+RYIKG+RV+++A  L E S    G SS+ DK ++         EI SE+   + E++SE+ ++ ++    
Subjt:  TMVGNVFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNG-SSELDKKEHSSTKLLEEAEITSEDSSLEDEEMSEDPDEGEDPDDV

Query:  LEDESTSKESNFEH
         + + TS+E + +H
Subjt:  LEDESTSKESNFEH


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGACGCACTCCCTAGTTCCAGCATCGCTCTCGTCCTCTTCGGCTTCCAACCGGATGCTTACTTTGATTTACTCTTTTCCAGTCATATCCAAAAGGATAGAATCTGTTAA
ATTTTCATGGAGTCCAAGCAGTTCAGTGGTATGCGCTGCAAAAGGTCCACGGCCGAGATATCCTCGGGTCTGGAAAACCAGAAAGAGAATTGGGACCATATCCAAGGCAG
CAAAGCTTGTTGATTGTGTCAAGGGACTGTCTAACGTCAAAGAGGAAGTTTACGGGGCTCTTGATTCCTTCATTGCCTGGGAACTAGAGTTTCCTCTAATTATTGTAAAG
AAGGCCCTGAAAACCCTAGAGATCCAAAGAGAATGGAAGAGGATAATTCAGTTGACGAAATGGATGTTAAGTAAAGGCCAAGGAAGAACAATGGGAAGCTATTTCACATT
ATTAAATGCCTTAGCTGAAGATGGAAGACTTGATGAAGCTGAAGAGCTTTGGAACAAGTTGTTTTCTCAGCATCTCGAGAGCATGCCTCGCATATTCTTTCATAAAATGA
TATCCCTCTACTATGACCGGGGTATGCACGACAAGTTATTTGAGGTATTTGCTGATATGGAGGAACTTGGAGTTCAACCAAATATGGCAATTGTGACTATGGTTGGAAAT
GTCTTCCAAGAGTTGGGTATGTTAGATAAATATGAAAAACTGAAGAAGAAATATCCCCCACCAAAATGGGAATATCGTTACATCAAAGGAAAGCGCGTAAGAATACGAGC
AAATTATCTGTACGAAAGCAGTAGTTCCAACAATGGTTCGAGTGAGCTTGACAAAAAGGAGCACAGTTCAACAAAACTGTTGGAGGAAGCTGAGATAACTTCCGAAGATT
CCAGTCTTGAAGATGAGGAAATGAGTGAAGACCCAGATGAAGGTGAAGACCCAGATGATGTTTTGGAAGATGAAAGTACGTCAAAGGAATCCAATTTTGAGCACGATTTC
GTGGGGTTTGGGCAATTGTAA
mRNA sequenceShow/hide mRNA sequence
AAAATATCGAGAAAATAAGAAAGGAAGAAATACGGGAAATGAAAGACATTTCTACTTATTTCTTCAATGACGCACTCCCTAGTTCCAGCATCGCTCTCGTCCTCTTCGGC
TTCCAACCGGATGCTTACTTTGATTTACTCTTTTCCAGTCATATCCAAAAGGATAGAATCTGTTAAATTTTCATGGAGTCCAAGCAGTTCAGTGGTATGCGCTGCAAAAG
GTCCACGGCCGAGATATCCTCGGGTCTGGAAAACCAGAAAGAGAATTGGGACCATATCCAAGGCAGCAAAGCTTGTTGATTGTGTCAAGGGACTGTCTAACGTCAAAGAG
GAAGTTTACGGGGCTCTTGATTCCTTCATTGCCTGGGAACTAGAGTTTCCTCTAATTATTGTAAAGAAGGCCCTGAAAACCCTAGAGATCCAAAGAGAATGGAAGAGGAT
AATTCAGTTGACGAAATGGATGTTAAGTAAAGGCCAAGGAAGAACAATGGGAAGCTATTTCACATTATTAAATGCCTTAGCTGAAGATGGAAGACTTGATGAAGCTGAAG
AGCTTTGGAACAAGTTGTTTTCTCAGCATCTCGAGAGCATGCCTCGCATATTCTTTCATAAAATGATATCCCTCTACTATGACCGGGGTATGCACGACAAGTTATTTGAG
GTATTTGCTGATATGGAGGAACTTGGAGTTCAACCAAATATGGCAATTGTGACTATGGTTGGAAATGTCTTCCAAGAGTTGGGTATGTTAGATAAATATGAAAAACTGAA
GAAGAAATATCCCCCACCAAAATGGGAATATCGTTACATCAAAGGAAAGCGCGTAAGAATACGAGCAAATTATCTGTACGAAAGCAGTAGTTCCAACAATGGTTCGAGTG
AGCTTGACAAAAAGGAGCACAGTTCAACAAAACTGTTGGAGGAAGCTGAGATAACTTCCGAAGATTCCAGTCTTGAAGATGAGGAAATGAGTGAAGACCCAGATGAAGGT
GAAGACCCAGATGATGTTTTGGAAGATGAAAGTACGTCAAAGGAATCCAATTTTGAGCACGATTTCGTGGGGTTTGGGCAATTGTAAATATACAGTGTATTTCCCATTTG
AGGTTCATCAAAATTCTCTTCCTCAATTTATAGTGTAGACTTTAATTTTTTTTTTTTCTTTTGTAATTTGAACAGACGGGATCACTGGTAGCATTGTGATCGTAAAGCAA
ATTCTCTTCATTTCAGCCCTCAATATTATAGTACCCGACCAGACGTATGGCCTAG
Protein sequenceShow/hide protein sequence
MTHSLVPASLSSSSASNRMLTLIYSFPVISKRIESVKFSWSPSSSVVCAAKGPRPRYPRVWKTRKRIGTISKAAKLVDCVKGLSNVKEEVYGALDSFIAWELEFPLIIVK
KALKTLEIQREWKRIIQLTKWMLSKGQGRTMGSYFTLLNALAEDGRLDEAEELWNKLFSQHLESMPRIFFHKMISLYYDRGMHDKLFEVFADMEELGVQPNMAIVTMVGN
VFQELGMLDKYEKLKKKYPPPKWEYRYIKGKRVRIRANYLYESSSSNNGSSELDKKEHSSTKLLEEAEITSEDSSLEDEEMSEDPDEGEDPDDVLEDESTSKESNFEHDF
VGFGQL