; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Clc02G03370 (gene) of Watermelon (cordophanus) v2 genome

Gene IDClc02G03370
OrganismCitrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
DescriptionPentatricopeptide repeat-containing protein
Genome locationClcChr02:2969676..2970608
RNA-Seq ExpressionClc02G03370
SyntenyClc02G03370
Gene Ontology termsGO:0000373 - Group II intron splicing (biological process)
GO:0009658 - chloroplast organization (biological process)
GO:0003723 - RNA binding (molecular function)
GO:0005515 - protein binding (molecular function)
InterPro domainsIPR002885 - Pentatricopeptide repeat
IPR011990 - Tetratricopeptide-like helical domain superfamily
IPR044190 - Protein THYLAKOID ASSEMBLY 8-like


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6572189.1 Protein THYLAKOID ASSEMBLY 8-like, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia]5.6e-11185.14Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+AT PS TILSPP+ L   GGK S LRLG  EGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRV+D+K+RRLLKFDMMAVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVR E WYKPQVSLYADI++VLASNGLFE+V+IIHSY KAE DLAPEI+GFN LLKALV +NLG+LAMESYYLMKEVGCEPDK 
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLEST E+VDLRTVK+DAQ+LYGESLEFLEEE+E AT ISMH
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

TYK08129.1 pentatricopeptide repeat-containing protein [Cucumis melo var. makuwa]3.0e-11287.15Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+ T PSPTILSPP  LPS   K  CL+LG AEGY RVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDM+AVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV+II SY+KAE DLAPEIDGFNALLK LV HNLG+LAMESYYLMKEVGCEP+KA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLE  GEAVDLRTVKQDAQKLYGESLEFLEE EE ATAIS+H
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

XP_008451190.1 PREDICTED: pentatricopeptide repeat-containing protein At3g46870-like [Cucumis melo]1.0e-11287.55Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+ T PSPTILSPP  LPS   K  CL+LG AEGY RVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDM+AVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV+II SY+KAE DLAPEIDGFNALLKALV HNLG+LAMESYYLMKEVGCEP+KA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLE  GEAVDLRTVKQDAQKLYGESLEFLEE EE ATAIS+H
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

XP_031744771.1 protein THYLAKOID ASSEMBLY 8-like, chloroplastic [Cucumis sativus]1.7e-11287.5Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+ATP SPTI SP    PS  G A CL+LG AEGY RVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDM+AVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVR EHWYKPQVSLYADIITVLASNGLFERV+II SY+KAEADLAPEIDGFNALLKALV HNLGELAMESYYLMK+VGCEPDKA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISM
        SFRI+IKGLES GEAVDLRTVKQDAQ+LYGESLEFLEEEEE ATA S+
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISM

XP_038888189.1 protein THYLAKOID ASSEMBLY 8, chloroplastic-like [Benincasa hispida]3.1e-11789.56Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+  PPSPTILSP + L S GG+ASCL LG AEGYR+VTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDMMAVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADII VLASNGLFERV+IIHSYLKAE DLAPEIDGFNALLKALV HNLGELAMESYYLMKE+GCEPDKA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLES GEAVDLRTVKQDAQKLYGESLEFLEEEEE A AIS H
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

TrEMBL top hitse value%identityAlignment
A0A0A0K6A9 Uncharacterized protein8.5e-11387.5Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+ATP SPTI SP    PS  G A CL+LG AEGY RVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDM+AVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVR EHWYKPQVSLYADIITVLASNGLFERV+II SY+KAEADLAPEIDGFNALLKALV HNLGELAMESYYLMK+VGCEPDKA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISM
        SFRI+IKGLES GEAVDLRTVKQDAQ+LYGESLEFLEEEEE ATA S+
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISM

A0A1S3BRZ8 pentatricopeptide repeat-containing protein At3g46870-like5.0e-11387.55Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+ T PSPTILSPP  LPS   K  CL+LG AEGY RVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDM+AVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV+II SY+KAE DLAPEIDGFNALLKALV HNLG+LAMESYYLMKEVGCEP+KA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLE  GEAVDLRTVKQDAQKLYGESLEFLEE EE ATAIS+H
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

A0A5A7UZI6 Pentatricopeptide repeat-containing protein5.0e-11387.55Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+ T PSPTILSPP  LPS   K  CL+LG AEGY RVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDM+AVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV+II SY+KAE DLAPEIDGFNALLKALV HNLG+LAMESYYLMKEVGCEP+KA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLE  GEAVDLRTVKQDAQKLYGESLEFLEE EE ATAIS+H
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

A0A5D3CCT4 Pentatricopeptide repeat-containing protein1.4e-11287.15Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+ T PSPTILSPP  LPS   K  CL+LG AEGY RVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKR KKDLQQLDRV+D+K+RRLLKFDM+AVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV+II SY+KAE DLAPEIDGFNALLK LV HNLG+LAMESYYLMKEVGCEP+KA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLE  GEAVDLRTVKQDAQKLYGESLEFLEE EE ATAIS+H
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

A0A6J1HX85 protein THYLAKOID ASSEMBLY 8-like, chloroplastic3.6e-11185.54Show/hide
Query:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR
        MSF+AT PS TILSPP+ L   GGK S LRLG  EGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRV+D+K+RRLLKFDMMAVLR
Subjt:  MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLR

Query:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA
        ELLRQNECSLALKVFEDVR E WYKPQVSLYADI++VLASNGLFE+V+IIHSYLKAE DLAPEI+GFN LLKALV +NLGELAMESYYLMKEVGCEPDKA
Subjt:  ELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKA

Query:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH
        SFRI+IKGLEST E+VDLR VK+DAQ+LYGESLEFLEEE+E AT IS H
Subjt:  SFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEEETATAISMH

SwissProt top hitse value%identityAlignment
O82178 Pentatricopeptide repeat-containing protein At2g351301.9e-0829.41Show/hide
Query:  LALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGL
        ++ K++ ++R+ H  KP +  Y  ++   A  GL E+ E I   L+ E  L P++  +NAL+++         A E + LM+ +GCEPD+AS+ I++   
Subjt:  LALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGL

Query:  ESTGEAVDLRTVKQDAQKL
           G   D   V ++ ++L
Subjt:  ESTGEAVDLRTVKQDAQKL

Q1PFH7 Pentatricopeptide repeat-containing protein At1g623503.5e-1533.14Show/hide
Query:  LSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAE
        +S E + A + LKR +    +LDR   + + RLLK D+++VL E  RQN+  L +K++E VR E WY+P +  Y D++ +LA N   +  + +   LK E
Subjt:  LSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAE

Query:  ADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLY
          L  +   F  L++  + + L   AM  Y  M+E    P    FR+++KGL    E  +   VK D  +L+
Subjt:  ADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLY

Q9LVW6 Protein THYLAKOID ASSEMBLY 8, chloroplastic3.8e-1738.98Show/hide
Query:  GGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKP-QVSLYADIITVLASNG
        G  +NR PL KGR LS EAIQ++QSLKRA +    L  +    LRRL+K D+++VLRELLRQ+ C+LA+ V   +R E  Y P  + LYADI+  L  N 
Subjt:  GGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKP-QVSLYADIITVLASNG

Query:  LFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVG-----CEPDKASFRILIKGLESTGE
         F+ ++ +   +    D   +      L++A+V     E  +  Y LM+E G      E D+    +L KGL   GE
Subjt:  LFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVG-----CEPDKASFRILIKGLESTGE

Q9SCP4 Pentatricopeptide repeat-containing protein At3g531702.1e-0728.32Show/hide
Query:  MMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVG
        ++  L E +++N    ALK+F  +R +HWY+P+   Y  +  VL +    ++  ++   + +E  L P ID + +L+       L + A  +   MK V 
Subjt:  MMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVG

Query:  -CEPDKASFRILI
         C+PD  +F +LI
Subjt:  -CEPDKASFRILI

Q9STF9 Protein THYLAKOID ASSEMBLY 8-like, chloroplastic3.4e-1832.64Show/hide
Query:  RKPLQKGRNL-SIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV
        R PL +G+ L   EA+  +  LKR K+D ++LD+     + RLLK DM+AV+ EL RQ E +LA+K+FE ++ + WY+P V +Y D+I  LA +   +  
Subjt:  RKPLQKGRNL-SIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV

Query:  EIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEE
          +   +K E +L P+   +  +++  +       AM  Y  M +    P++  FR+L+KGL      +    VK+D ++L+ E   +   EE
Subjt:  EIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEE

Arabidopsis top hitse value%identityAlignment
AT1G62350.1 Pentatricopeptide repeat (PPR) superfamily protein2.5e-1633.14Show/hide
Query:  LSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAE
        +S E + A + LKR +    +LDR   + + RLLK D+++VL E  RQN+  L +K++E VR E WY+P +  Y D++ +LA N   +  + +   LK E
Subjt:  LSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAE

Query:  ADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLY
          L  +   F  L++  + + L   AM  Y  M+E    P    FR+++KGL    E  +   VK D  +L+
Subjt:  ADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLY

AT2G35130.1 Tetratricopeptide repeat (TPR)-like superfamily protein1.3e-0929.41Show/hide
Query:  LALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGL
        ++ K++ ++R+ H  KP +  Y  ++   A  GL E+ E I   L+ E  L P++  +NAL+++         A E + LM+ +GCEPD+AS+ I++   
Subjt:  LALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGL

Query:  ESTGEAVDLRTVKQDAQKL
           G   D   V ++ ++L
Subjt:  ESTGEAVDLRTVKQDAQKL

AT3G27750.1 FUNCTIONS IN: molecular_function unknown2.7e-1838.98Show/hide
Query:  GGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKP-QVSLYADIITVLASNG
        G  +NR PL KGR LS EAIQ++QSLKRA +    L  +    LRRL+K D+++VLRELLRQ+ C+LA+ V   +R E  Y P  + LYADI+  L  N 
Subjt:  GGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKP-QVSLYADIITVLASNG

Query:  LFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVG-----CEPDKASFRILIKGLESTGE
         F+ ++ +   +    D   +      L++A+V     E  +  Y LM+E G      E D+    +L KGL   GE
Subjt:  LFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVG-----CEPDKASFRILIKGLESTGE

AT3G46870.1 Pentatricopeptide repeat (PPR) superfamily protein2.4e-1932.64Show/hide
Query:  RKPLQKGRNL-SIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV
        R PL +G+ L   EA+  +  LKR K+D ++LD+     + RLLK DM+AV+ EL RQ E +LA+K+FE ++ + WY+P V +Y D+I  LA +   +  
Subjt:  RKPLQKGRNL-SIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERV

Query:  EIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEE
          +   +K E +L P+   +  +++  +       AM  Y  M +    P++  FR+L+KGL      +    VK+D ++L+ E   +   EE
Subjt:  EIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQDAQKLYGESLEFLEEEE

AT5G09320.1 Vacuolar sorting protein 9 (VPS9) domain6.3e-6055.8Show/hide
Query:  VTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQ---------------LDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWY
        + MR  S+NRKPLQ+GR LSIEAIQAVQ+LKRA   L                 LDRV  +K RRLLKFDM+AVLRELLRQNECSLALKVFE++R E+WY
Subjt:  VTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQ---------------LDRVHDAKLRRLLKFDMMAVLRELLRQNECSLALKVFEDVRNEHWY

Query:  KPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQD
        KPQV +Y D+ITV+A N L E V  ++S +K+E  L  EI+ FN LL  L+ H L +L M+ Y  M+ +G EPD+ASFR+L+ GLES GE      V+QD
Subjt:  KPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRTVKQD

Query:  AQKLYGESLEFLEEEEETATAISM
        A + YGESLEF+EE+EE ++  S+
Subjt:  AQKLYGESLEFLEEEEETATAISM


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAGTTTTATAGCAACTCCTCCGTCGCCGACAATTCTCAGTCCGCCGTTCAATTTACCGAGCTATGGCGGGAAAGCATCCTGCCTACGACTAGGCAGCGCGGAGGGATA
TCGGAGAGTGACTATGAGAGGCGGAAGTGAAAACCGGAAGCCATTGCAGAAGGGGAGGAACCTCAGCATCGAAGCAATTCAAGCGGTGCAGTCGTTGAAGCGAGCCAAGA
AAGATTTACAACAATTGGACCGAGTGCATGATGCCAAACTTAGGCGTTTATTGAAGTTCGATATGATGGCTGTCCTTCGCGAGCTCCTTCGCCAGAACGAGTGTTCTCTG
GCTCTTAAGGTTTTCGAAGATGTTAGAAATGAACACTGGTACAAGCCTCAGGTCTCGCTGTATGCTGATATTATTACAGTATTGGCTAGCAATGGATTGTTCGAACGAGT
AGAAATTATTCATTCGTACTTGAAAGCAGAAGCTGACTTAGCACCTGAAATTGACGGGTTTAATGCTCTTTTGAAGGCCTTGGTTTGTCATAACTTAGGTGAACTTGCGA
TGGAGTCGTATTACTTGATGAAAGAAGTAGGTTGTGAGCCAGATAAGGCTTCCTTCAGGATTCTCATAAAAGGATTGGAATCAACGGGAGAGGCAGTTGATTTAAGAACT
GTGAAGCAGGATGCACAAAAGCTTTATGGTGAATCACTTGAGTTTCTAGAGGAAGAAGAAGAGACAGCTACAGCCATATCTATGCACTGA
mRNA sequenceShow/hide mRNA sequence
ATGAGTTTTATAGCAACTCCTCCGTCGCCGACAATTCTCAGTCCGCCGTTCAATTTACCGAGCTATGGCGGGAAAGCATCCTGCCTACGACTAGGCAGCGCGGAGGGATA
TCGGAGAGTGACTATGAGAGGCGGAAGTGAAAACCGGAAGCCATTGCAGAAGGGGAGGAACCTCAGCATCGAAGCAATTCAAGCGGTGCAGTCGTTGAAGCGAGCCAAGA
AAGATTTACAACAATTGGACCGAGTGCATGATGCCAAACTTAGGCGTTTATTGAAGTTCGATATGATGGCTGTCCTTCGCGAGCTCCTTCGCCAGAACGAGTGTTCTCTG
GCTCTTAAGGTTTTCGAAGATGTTAGAAATGAACACTGGTACAAGCCTCAGGTCTCGCTGTATGCTGATATTATTACAGTATTGGCTAGCAATGGATTGTTCGAACGAGT
AGAAATTATTCATTCGTACTTGAAAGCAGAAGCTGACTTAGCACCTGAAATTGACGGGTTTAATGCTCTTTTGAAGGCCTTGGTTTGTCATAACTTAGGTGAACTTGCGA
TGGAGTCGTATTACTTGATGAAAGAAGTAGGTTGTGAGCCAGATAAGGCTTCCTTCAGGATTCTCATAAAAGGATTGGAATCAACGGGAGAGGCAGTTGATTTAAGAACT
GTGAAGCAGGATGCACAAAAGCTTTATGGTGAATCACTTGAGTTTCTAGAGGAAGAAGAAGAGACAGCTACAGCCATATCTATGCACTGA
Protein sequenceShow/hide protein sequence
MSFIATPPSPTILSPPFNLPSYGGKASCLRLGSAEGYRRVTMRGGSENRKPLQKGRNLSIEAIQAVQSLKRAKKDLQQLDRVHDAKLRRLLKFDMMAVLRELLRQNECSL
ALKVFEDVRNEHWYKPQVSLYADIITVLASNGLFERVEIIHSYLKAEADLAPEIDGFNALLKALVCHNLGELAMESYYLMKEVGCEPDKASFRILIKGLESTGEAVDLRT
VKQDAQKLYGESLEFLEEEEETATAISMH