CuGenDBv2

Gene ID	Sgr021338
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	protein IN CHLOROPLAST ATPASE BIOGENESIS, chloroplastic-like isoform X2
Genome location	tig00153654:1208996..1212260
RNA-Seq Expression	Sgr021338
Synteny	Sgr021338
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0045770.1 uncharacterized protein E6C27_scaffold243G002910 [Cucumis melo var. makuwa]

6.4e-182

92.75

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTR-GGSIISPGAKQGIIPLAIPLAKNSSGTITALLR
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSST+DHVSFIKD+AAT+PPQHLFHLLKMLKTR G SIISPGAKQGIIPL +PLAKNS+GTITALLR
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTR-GGSIISPGAKQGIIPLAIPLAKNSSGTITALLR

Query:  WPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEE
        WPTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAA AGQKLY +GDF+ESQ+TN+D YLLKKVGLFPDVIERKILRHFEE
Subjt:  WPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEE

Query:  GDLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQV
        GDLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQV
Subjt:  GDLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQV

Query:  ALDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        ALDQAAFLLDLASVDGTWDN +ERIAQCYEEAGLHEIA F+LYRD
Subjt:  ALDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

XP_004149691.1 protein IN CHLOROPLAST ATPASE BIOGENESIS, chloroplastic isoform X1 [Cucumis sativus]

1.3e-182

93.02

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSSTSDHVSFIKD+AAT+PPQHLFHLLKMLKTRG SIISPGAKQGIIPL +PLAKNSSGTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAA AGQKLY +GDF+ESQ+TN+D YLLKKVGLFPD+IERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWDN +ERIAQCYEEAGL EIA F+LYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

XP_008457752.1 PREDICTED: uncharacterized protein LOC103497369 [Cucumis melo]

2.6e-183

93.02

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSST+DHVSFIKD+AAT+PPQHLFHLLKMLKTRG SIISPGAKQGIIPL +PLAKNS+GTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAA AGQKLY +GDF+ESQ+TN+D YLLKKVGLFPDVIERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWDN +ERIAQCYEEAGLHEIA F+LYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

XP_023533903.1 uncharacterized protein LOC111795609 [Cucurbita pepo subsp. pepo]

1.9e-181

93.02

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAA LPSLLLGR GVTIRCSSSSSTSDHVSFIKD+AAT+PPQHL +LLKMLKTRG SIISPGAKQGIIPLAIPLAKNSSGTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDA+GSGEQNDELFLAAA AGQKLYE+GDFAESQ+ N+D YLLKKVG+FPD+IERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEY KEKVTEEGK EDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWD S+ERIAQCYEEAGL EIARF+LYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

XP_038900520.1 protein IN CHLOROPLAST ATPASE BIOGENESIS, chloroplastic-like [Benincasa hispida]

1.2e-183

93.31

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSSTSDHVSF+KDIAAT+PPQHLFHLLKMLKTRG SIISPGAKQGIIPL IPLAKNSSGTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSG+QNDELFLAAA AGQKLY +GDF+ES++TN+D YLLKKVGLFPDVIERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGR TEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEK+TEEGKQEDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWDNS++RIAQCYEEAGLHEIARFILYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LJE6 Uncharacterized protein

6.3e-183

93.02

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSSTSDHVSFIKD+AAT+PPQHLFHLLKMLKTRG SIISPGAKQGIIPL +PLAKNSSGTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAA AGQKLY +GDF+ESQ+TN+D YLLKKVGLFPD+IERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWDN +ERIAQCYEEAGL EIA F+LYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

A0A1S3C5T9 uncharacterized protein LOC103497369

1.3e-183

93.02

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSST+DHVSFIKD+AAT+PPQHLFHLLKMLKTRG SIISPGAKQGIIPL +PLAKNS+GTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAA AGQKLY +GDF+ESQ+TN+D YLLKKVGLFPDVIERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWDN +ERIAQCYEEAGLHEIA F+LYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

A0A5A7TRJ7 Uncharacterized protein

3.1e-182

92.75

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTR-GGSIISPGAKQGIIPLAIPLAKNSSGTITALLR
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSST+DHVSFIKD+AAT+PPQHLFHLLKMLKTR G SIISPGAKQGIIPL +PLAKNS+GTITALLR
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTR-GGSIISPGAKQGIIPLAIPLAKNSSGTITALLR

Query:  WPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEE
        WPTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAA AGQKLY +GDF+ESQ+TN+D YLLKKVGLFPDVIERKILRHFEE
Subjt:  WPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEE

Query:  GDLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQV
        GDLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQV
Subjt:  GDLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQV

Query:  ALDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        ALDQAAFLLDLASVDGTWDN +ERIAQCYEEAGLHEIA F+LYRD
Subjt:  ALDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

A0A5D3BJN5 Uncharacterized protein

1.3e-183

93.02

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAAALPSLLL R GVT+RCS+SSST+DHVSFIKD+AAT+PPQHLFHLLKMLKTRG SIISPGAKQGIIPL +PLAKNS+GTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGM+MPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAA AGQKLY +GDF+ESQ+TN+D YLLKKVGLFPDVIERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWDN +ERIAQCYEEAGLHEIA F+LYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

A0A6J1D7C4 uncharacterized protein LOC111017955 isoform X2

4.5e-181

93.31

Show/hide

Query:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW
        MKIGGGVVCGSPRAA LPSLLL R G TIR SSSSSTSDHVSFI DIAAT+PPQHL  LLKMLKTRGGSIISPGAKQGIIPLA+PLAKNSSGTITALLRW
Subjt:  MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRW

Query:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG
        PTAPAGMDMPVVDVNRNGVWLLAKNVDQFI+RLLVEEDARGSGEQ+DELFLAAA AGQKLYE+G FAES+VTNVD+YLLKKVGLFPDVIERKILRHFEEG
Subjt:  PTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEG

Query:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA
        DLVSALVTGEFYTKKEHFPGFARP+VFNAEVLLKVGR+TEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGK+EDLKKGKAPAQVA
Subjt:  DLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVA

Query:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD
        LDQAAFLLDLASVDGTWDNS+ERIAQCYEEAGLHEIA+F+LYRD
Subjt:  LDQAAFLLDLASVDGTWDNSMERIAQCYEEAGLHEIARFILYRD

SwissProt top hits

e value

%identity

Alignment

Q94JY0 Protein IN CHLOROPLAST ATPASE BIOGENESIS, chloroplastic

6.6e-129

70.48

Show/hide

Query:  RCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQF
        R   S  +S HVSFIKD+AAT+PP HL HLLK+L+TRG +IISPGAKQG+IPLAIPL+KNSSG++TALLRWPTAP GMDMPVV+V R+GV L+A+NVD++
Subjt:  RCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQF

Query:  IHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNA
        IHR+LVEEDA    ++  EL+ A+  AG+KLYEKG FAES++ N+D Y+LKKVGLFPD++ERK+LRHF+EGD VSA+VTGEFYTKK+ FPGF RPFV+ A
Subjt:  IHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNA

Query:  EVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYE
         +L KVGR  EAKDAAR AL+SPWWTLGC YEEVA+IAQWEDEQIE+ +EKV++EG+ EDL KGKAP QVALD AAFLLDLAS++GTW  S+  IA+CYE
Subjt:  EVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYE

Query:  EAGLHEIARFILYRD
        EAGLH I+ F+LY D
Subjt:  EAGLHEIARFILYRD

Arabidopsis top hits

e value

%identity

Alignment

AT2G23370.1 unknown protein

6.1e-122

66.03

Show/hide

Query:  SSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHR
        SSSS S+H  FIKDIA  +PP+HL  LL +   RG SI+SPGAKQG++PL IPL K S G+  ALLRWPTAP+ M+MPVV+V ++GVW LA NVDQFIHR
Subjt:  SSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHR

Query:  LLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNAEVL
        +LVEED     E + E+F AA  AG+KLY KGDFA S++ ++DAYLL+KVGLFPD +ERK++RH E GD VSALV  EFYTK+ +FPGFARPF FNA+VL
Subjt:  LLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNAEVL

Query:  LKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYEEAG
        LK+GR  EAKDAARGALKS WWTLGC+YEE+A IA+W +EQI  +KE+VT EGKQ D+ +GK  AQ +LD+AAFLL+LAS++GTWD S+ER+AQCY+EAG
Subjt:  LKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYEEAG

Query:  LHEIARFILYRD
        L++IA+F+LYRD
Subjt:  LHEIARFILYRD

AT4G34090.1 unknown protein

4.7e-130

70.48

Show/hide

Query:  RCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQF
        R   S  +S HVSFIKD+AAT+PP HL HLLK+L+TRG +IISPGAKQG+IPLAIPL+KNSSG++TALLRWPTAP GMDMPVV+V R+GV L+A+NVD++
Subjt:  RCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQF

Query:  IHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNA
        IHR+LVEEDA    ++  EL+ A+  AG+KLYEKG FAES++ N+D Y+LKKVGLFPD++ERK+LRHF+EGD VSA+VTGEFYTKK+ FPGF RPFV+ A
Subjt:  IHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNA

Query:  EVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYE
         +L KVGR  EAKDAAR AL+SPWWTLGC YEEVA+IAQWEDEQIE+ +EKV++EG+ EDL KGKAP QVALD AAFLLDLAS++GTW  S+  IA+CYE
Subjt:  EVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYE

Query:  EAGLHEIARFILYRD
        EAGLH I+ F+LY D
Subjt:  EAGLHEIARFILYRD

AT4G34090.2 unknown protein

1.2e-128

70.25

Show/hide

Query:  RCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSS-GTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQ
        R   S  +S HVSFIKD+AAT+PP HL HLLK+L+TRG +IISPGAKQG+IPLAIPL+KNSS G++TALLRWPTAP GMDMPVV+V R+GV L+A+NVD+
Subjt:  RCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSS-GTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQ

Query:  FIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFN
        +IHR+LVEEDA    ++  EL+ A+  AG+KLYEKG FAES++ N+D Y+LKKVGLFPD++ERK+LRHF+EGD VSA+VTGEFYTKK+ FPGF RPFV+ 
Subjt:  FIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFN

Query:  AEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCY
        A +L KVGR  EAKDAAR AL+SPWWTLGC YEEVA+IAQWEDEQIE+ +EKV++EG+ EDL KGKAP QVALD AAFLLDLAS++GTW  S+  IA+CY
Subjt:  AEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCY

Query:  EEAGLHEIARFILYRD
        EEAGLH I+ F+LY D
Subjt:  EEAGLHEIARFILYRD

AT4G34090.3 unknown protein

2.2e-127

70.42

Show/hide

Query:  HVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDA
        HVSFIKD+AAT+PP HL HLLK+L+TRG +IISPGAKQG+IPLAIPL+KNSSG++TALLRWPTAP GMDMPVV+V R+GV L+A+NVD++IHR+LVEEDA
Subjt:  HVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMPVVDVNRNGVWLLAKNVDQFIHRLLVEEDA

Query:  RGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLK-----
            ++  EL+ A+  AG+KLYEKG FAES++ N+D Y+LKKVGLFPD++ERK+LRHF+EGD VSA+VTGEFYTKK+ FPGF RPFV+ A +L K     
Subjt:  RGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPGFARPFVFNAEVLLK-----

Query:  -VGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYEEAGL
         VGR  EAKDAAR AL+SPWWTLGC YEEVA+IAQWEDEQIE+ +EKV++EG+ EDL KGKAP QVALD AAFLLDLAS++GTW  S+  IA+CYEEAGL
Subjt:  -VGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYEEAGL

Query:  HEIARFILYRD
        H I+ F+LY D
Subjt:  HEIARFILYRD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAAATTGGTGGTGGAGTGGTATGCGGAAGTCCACGCGCCGCCGCTCTGCCCTCACTGCTTCTCGGACGCGGTGGAGTTACCATTCGCTGCTCTTCATCTTCCTCTAC
TTCCGACCATGTATCGTTCATTAAGGATATTGCGGCAACTAAGCCTCCTCAGCATTTGTTTCATTTGCTGAAAATGCTGAAGACAAGAGGTGGATCCATTATTTCTCCTG
GAGCCAAGCAAGGGATAATTCCTCTTGCCATTCCACTAGCGAAAAACAGCTCAGGTACTATAACTGCACTGCTGCGCTGGCCTACTGCACCCGCTGGGATGGATATGCCA
GTAGTGGACGTCAATAGAAATGGAGTGTGGCTTCTAGCCAAGAACGTGGATCAATTTATTCATAGACTTCTAGTTGAAGAAGATGCCAGAGGAAGTGGAGAACAAAATGA
TGAGCTATTTCTTGCAGCAGCTGGTGCTGGGCAGAAACTTTATGAAAAGGGTGATTTTGCTGAATCTCAGGTCACGAATGTAGATGCGTATCTGCTTAAAAAGGTTGGGT
TGTTTCCAGATGTCATAGAACGTAAAATATTGCGCCATTTTGAGGAAGGCGACCTTGTTTCAGCTTTGGTGACTGGAGAATTCTATACTAAAAAGGAGCACTTCCCAGGA
TTTGCACGGCCATTCGTATTCAATGCAGAGGTTTTGCTCAAGGTGGGACGAAAAACAGAGGCTAAGGATGCTGCGAGGGGAGCCTTAAAATCACCATGGTGGACCCTAGG
CTGTAAATATGAGGAAGTTGCTAATATTGCGCAATGGGAAGATGAGCAAATTGAGTATTTCAAAGAGAAGGTCACAGAAGAAGGAAAGCAAGAGGATCTTAAGAAGGGAA
AGGCTCCTGCCCAGGTTGCCTTGGACCAAGCAGCCTTTTTGTTGGATTTAGCTTCTGTTGATGGAACTTGGGACAACTCTATGGAGCGCATTGCTCAATGTTATGAAGAG
GCAGGCCTTCATGAGATTGCGAGATTCATACTTTACAGAGACTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKIGGGVVCGSPRAAALPSLLLGRGGVTIRCSSSSSTSDHVSFIKDIAATKPPQHLFHLLKMLKTRGGSIISPGAKQGIIPLAIPLAKNSSGTITALLRWPTAPAGMDMP
VVDVNRNGVWLLAKNVDQFIHRLLVEEDARGSGEQNDELFLAAAGAGQKLYEKGDFAESQVTNVDAYLLKKVGLFPDVIERKILRHFEEGDLVSALVTGEFYTKKEHFPG
FARPFVFNAEVLLKVGRKTEAKDAARGALKSPWWTLGCKYEEVANIAQWEDEQIEYFKEKVTEEGKQEDLKKGKAPAQVALDQAAFLLDLASVDGTWDNSMERIAQCYEE
AGLHEIARFILYRD

Sgr021338 (gene) of Monk fruit (Qingpiguo) v1 genome