CuGenDBv2

Gene ID	Moc04g25810
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	INVOLVED IN: biological_process unknown; LOCATED IN: chloroplast; BEST Arabidopsis thaliana protein match is: my s in 277 species: Archae - 0; Bacteria - 0; Metazoa - 736; Fungi - 347; Plants - 385; Viruses - 0; Other Eukaryotes - 339 (source: NCBI BLink).
Genome location	chr4:18704717..18709101
RNA-Seq Expression	Moc04g25810
Synteny	Moc04g25810
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component) GO:0043167 - ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022138041.1 uncharacterized protein LOC111009298 [Momordica charantia]

1.2e-118

89.37

Show/hide

Query:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKGA GIVKGPTSIKGWVRKWFYASGEWLAKDES              V+IRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVLLKRRR
        AVRP+ESSRPNSELAMVCGFASNVKRK KG+AHALEAAQSSKP TPA+VGPASEDPAPVIELESS GPSREKRPRDQTEAVDVSPLGEEVREEV LKRRR
Subjt:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVLLKRRR

Query:  KKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQ
        KKKKTTSPLEV ARGVLPASFADRVDDPEA+MGGT DVTTRFR+EPSSSGVRDQ
Subjt:  KKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQ

XP_022144034.1 uncharacterized protein LOC111013826 [Momordica charantia]

9.2e-140

93.04

Show/hide

Query:  MFEYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVR
        MFEYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSE+AELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVR
Subjt:  MFEYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVR

Query:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFAS
        KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAVRP+E SRPNS LAMVC FAS
Subjt:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFAS

Query:  NVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE
         VKRK KGRAHALEAAQSSKP TPA+VGPASEDPAPVIELESSGGPSREKRPRDQTEAV       DV PLGE
Subjt:  NVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE

XP_022150343.1 uncharacterized protein LOC111018538 [Momordica charantia]

1.1e-124

86.32

Show/hide

Query:  GTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAFVASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKD
        G   +  + RIEPSSSGVRDQVSRISAASLDRCLRRASKF+  PGSVLQRTIDYA EAFVASIQSALAVKAELDGRE LAAREKEEFSAALE ASSTMKD
Subjt:  GTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAFVASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKD

Query:  ELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFD
        ELLKAHSEVE LKAEVE++AELLKKEEDRR+AQLRAAHAIT+GLE+EKFQLLKEKDDMLQALEAK++EL+HATAELE  KERLSNG LLEE+FRQHPDFD
Subjt:  ELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFD

Query:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLNSNYSDLEEDQVGTTQEGAPQAGS
        GFAKDFSDAGFKFLMKGIASDMPDLQIDL GLK+RYAE+WASGP GTPGPQALVD+YVRDL+S+YSD EEDQVG+TQEGA   GS
Subjt:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLNSNYSDLEEDQVGTTQEGAPQAGS

XP_022159063.1 uncharacterized protein LOC111025502, partial [Momordica charantia]

3.1e-188

94.37

Show/hide

Query:  MSSSFSSDLGSDEVLACRLESELEEIENFRFSDDGEDSDASTSGQGLEYPFRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMFEYG
        MSSS SS+L SD  LA RLES+LEEIEN R SDDGEDSDASTSGQGLEYP RIPEHYLGSLRRGFAIPENILLR+PEEGERADNPPEGWVTLYFKMFEYG
Subjt:  MSSSFSSDLGSDEVLACRLESELEEIENFRFSDDGEDSDASTSGQGLEYPFRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMFEYG

Query:  LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA
        LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSE+AEL DVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA
Subjt:  LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA

Query:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFASNVKRK
        SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAVRP+ESSRPNSELAMVCGFAS VKRK
Subjt:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFASNVKRK

Query:  PKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVD
         KGRAHALEAAQSSKPATPA+VGPASEDPA VIELESSGGPSREKRPRDQTEAVD
Subjt:  PKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVD

XP_022159252.1 uncharacterized protein LOC111025665 [Momordica charantia]

5.7e-198

70.9

Show/hide

Query:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKG GGIVKGPTSIKGWV KWF+ASGEWLAKDESGR+FFDVPTRFGNLVSI+ +PEL QA+FDTLK+YK+HFPR RK+ TLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAM--------VGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVRE
         VR +E+SRPNSELAMVCGF  +VKRK KGRAHAL+    ++P TP +         GP+S  P PVIEL+ SGG S EKR R+++EA+DVSPL  EVR 
Subjt:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAM--------VGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVRE

Query:  EVLLKRRRKKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAF
        E  L+RRRKKKKT+S  E  ARG LP S AD VDDPEA+M GTS+V  RF +EPSSSGV+DQVSRISA  LDR LRRASKF+ DPGSVLQRTID   EAF
Subjt:  EVLLKRRRKKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAF

Query:  VASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKDELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDML
        +ASI  A+ VKAELDGREALAA+E+E   AALEAA +T+K ELLKA  EV+IL+AEV+AK +LLKKE ++ KA LRAAHAITKGLEKEKFQLLKEKDD+ 
Subjt:  VASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKDELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDML

Query:  QALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVR
        Q LE K+  +   T EL+ +KERL+NG LLEESFRQHPDFDGFAKDFSDAGFKFLMKGIA+DMP LQIDL GLKK+Y+E+WASGP+GTP PQ+LVDKYVR
Subjt:  QALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVR

Query:  DLNSNYSDLEED--------QVGTTQEGAP--QAGS
        +L+S+YSD+EE+        +VGTTQE  P  Q GS
Subjt:  DLNSNYSDLEED--------QVGTTQEGAP--QAGS

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C8K9 uncharacterized protein LOC111009298

5.6e-119

89.37

Show/hide

Query:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKGA GIVKGPTSIKGWVRKWFYASGEWLAKDES              V+IRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVLLKRRR
        AVRP+ESSRPNSELAMVCGFASNVKRK KG+AHALEAAQSSKP TPA+VGPASEDPAPVIELESS GPSREKRPRDQTEAVDVSPLGEEVREEV LKRRR
Subjt:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVLLKRRR

Query:  KKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQ
        KKKKTTSPLEV ARGVLPASFADRVDDPEA+MGGT DVTTRFR+EPSSSGVRDQ
Subjt:  KKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQ

A0A6J1CR42 uncharacterized protein LOC111013826

4.4e-140

93.04

Show/hide

Query:  MFEYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVR
        MFEYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSE+AELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVR
Subjt:  MFEYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVR

Query:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFAS
        KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAVRP+E SRPNS LAMVC FAS
Subjt:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFAS

Query:  NVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE
         VKRK KGRAHALEAAQSSKP TPA+VGPASEDPAPVIELESSGGPSREKRPRDQTEAV       DV PLGE
Subjt:  NVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE

A0A6J1D971 uncharacterized protein LOC111018538

5.3e-125

86.32

Show/hide

Query:  GTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAFVASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKD
        G   +  + RIEPSSSGVRDQVSRISAASLDRCLRRASKF+  PGSVLQRTIDYA EAFVASIQSALAVKAELDGRE LAAREKEEFSAALE ASSTMKD
Subjt:  GTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAFVASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKD

Query:  ELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFD
        ELLKAHSEVE LKAEVE++AELLKKEEDRR+AQLRAAHAIT+GLE+EKFQLLKEKDDMLQALEAK++EL+HATAELE  KERLSNG LLEE+FRQHPDFD
Subjt:  ELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFD

Query:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLNSNYSDLEEDQVGTTQEGAPQAGS
        GFAKDFSDAGFKFLMKGIASDMPDLQIDL GLK+RYAE+WASGP GTPGPQALVD+YVRDL+S+YSD EEDQVG+TQEGA   GS
Subjt:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLNSNYSDLEEDQVGTTQEGAPQAGS

A0A6J1DXS5 uncharacterized protein LOC111025502

1.5e-188

94.37

Show/hide

Query:  MSSSFSSDLGSDEVLACRLESELEEIENFRFSDDGEDSDASTSGQGLEYPFRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMFEYG
        MSSS SS+L SD  LA RLES+LEEIEN R SDDGEDSDASTSGQGLEYP RIPEHYLGSLRRGFAIPENILLR+PEEGERADNPPEGWVTLYFKMFEYG
Subjt:  MSSSFSSDLGSDEVLACRLESELEEIENFRFSDDGEDSDASTSGQGLEYPFRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMFEYG

Query:  LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA
        LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSE+AEL DVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA
Subjt:  LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA

Query:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFASNVKRK
        SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAVRP+ESSRPNSELAMVCGFAS VKRK
Subjt:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFASNVKRK

Query:  PKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVD
         KGRAHALEAAQSSKPATPA+VGPASEDPA VIELESSGGPSREKRPRDQTEAVD
Subjt:  PKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVD

A0A6J1DZB3 uncharacterized protein LOC111025665

2.7e-198

70.9

Show/hide

Query:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKG GGIVKGPTSIKGWV KWF+ASGEWLAKDESGR+FFDVPTRFGNLVSI+ +PEL QA+FDTLK+YK+HFPR RK+ TLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAM--------VGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVRE
         VR +E+SRPNSELAMVCGF  +VKRK KGRAHAL+    ++P TP +         GP+S  P PVIEL+ SGG S EKR R+++EA+DVSPL  EVR 
Subjt:  AVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAM--------VGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVRE

Query:  EVLLKRRRKKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAF
        E  L+RRRKKKKT+S  E  ARG LP S AD VDDPEA+M GTS+V  RF +EPSSSGV+DQVSRISA  LDR LRRASKF+ DPGSVLQRTID   EAF
Subjt:  EVLLKRRRKKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAF

Query:  VASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKDELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDML
        +ASI  A+ VKAELDGREALAA+E+E   AALEAA +T+K ELLKA  EV+IL+AEV+AK +LLKKE ++ KA LRAAHAITKGLEKEKFQLLKEKDD+ 
Subjt:  VASIQSALAVKAELDGREALAAREKEEFSAALEAASSTMKDELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDML

Query:  QALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVR
        Q LE K+  +   T EL+ +KERL+NG LLEESFRQHPDFDGFAKDFSDAGFKFLMKGIA+DMP LQIDL GLKK+Y+E+WASGP+GTP PQ+LVDKYVR
Subjt:  QALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVR

Query:  DLNSNYSDLEED--------QVGTTQEGAP--QAGS
        +L+S+YSD+EE+        +VGTTQE  P  Q GS
Subjt:  DLNSNYSDLEED--------QVGTTQEGAP--QAGS

SwissProt top hits

e value

%identity

Alignment

Q9LEX8 Uncharacterized protein At3g60930, chloroplastic

4.0e-05

23.68

Show/hide

Query:  EHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMFEYG--LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLD
        E  L  L+  F +   + LR+P   ERAD+PP G+ TLY + F YG  L LP+   V E++    +A +Q+       + +L  L  +  R  E    + 
Subjt:  EHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMFEYG--LRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLD

Query:  VDQLLACFEAKRIAK-KPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFG----NLVSIRPVPELTQASFDTLKYYK--
        +  L    E +R+ K +  R+Y+   KG   I   P+  + +   +F+ + E    ++       V TR+G     L  + P+P+   ++F  L   K  
Subjt:  VDQLLACFEAKRIAK-KPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFG----NLVSIRPVPELTQASFDTLKYYK--

Query:  --EHFPRGRKVGTL-----VTDKLLLESG---------LLDYNPAVRPVESSRPNSE---LAMVCGFASNVKRKPKGRAHALE---------AAQSSKPA
          +HF R R    L     V+     ES          +      +R V + +   +   LA      +     P+    A +         A Q++  A
Subjt:  --EHFPRGRKVGTL-----VTDKLLLESG---------LLDYNPAVRPVESSRPNSE---LAMVCGFASNVKRKPKGRAHALE---------AAQSSKPA

Query:  TPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSP-----LGEEVREEVLLKRRRKKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVT
        +   V P +  P      E+ G       P    EAV   P      G+ +R + +  +++KKKK  S  EVE   +LP  F DR        G    + 
Subjt:  TPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSP-----LGEEVREEVLLKRRRKKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVT

Query:  TRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAFVAS--IQSALAVKAELDGREALAAREKEEFSAALEAASST---MKDE
            + P  + +  +    +A+   R +   ++ +    S ++  ++ A +   A   IQ+    K E     A A  EKEE              M ++
Subjt:  TRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAFVAS--IQSALAVKAELDGREALAAREKEEFSAALEAASST---MKDE

Query:  LLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFDG
         LKA+SE+  LK  + ++A  L+  E  R  Q          + K K    + K  +L  +  +   L  A A  +++ E L  G +LE    Q    D 
Subjt:  LLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELEMVKERLSNGALLEESFRQHPDFDG

Query:  FAKDFSDA
        + KDF+DA
Subjt:  FAKDFSDA

Arabidopsis top hits

e value

%identity

Alignment

AT2G15420.1 myosin heavy chain-related

2.7e-04

24.46

Show/hide

Query:  PENILLRIPEEGERADNPPEGWVTLYFKMF-EYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIA
        P  I L  P+  +R   PPEG++ LY   F   GL  PL  F+ E+  R  +A +Q+          LAIL       +E    +D D         R+ 
Subjt:  PENILLRIPEEGERADNPPEGWVTLYFKMF-EYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIA

Query:  KKPGRFYMCARKGAGGIVKGPTS-IKGWVRKWFYAS--------------GEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRG
        + PG +Y  A K    IV G  S I GW R++F+                 +W    E      D P  F  L +I  + EL    + T  + +    R 
Subjt:  KKPGRFYMCARKGAGGIVKGPTS-IKGWVRKWFYAS--------------GEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFPRG

Query:  RKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAMVGPASED---PAPVIE---LESSGG--PSR
        R +G ++           +    +  VE S   +E  +      N   +  GR  A E+A        +   P +ED      V+    L S GG  PS+
Subjt:  RKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAMVGPASED---PAPVIE---LESSGG--PSR

Query:  EKRPRDQTEAVDVSPLGEEVREEVLLKRRRKKKKTTSPLEVEARGVLPASFA--DRVDDPEAKMGGTS--DVTTRFRIEPSSSGVRDQVSRISAASLDRC
        ++  RD  E                  +   K   T   E   RG +   F+   +  D       TS  D+ +R R      G  D  S     S+DR 
Subjt:  EKRPRDQTEAVDVSPLGEEVREEVLLKRRRKKKKTTSPLEVEARGVLPASFA--DRVDDPEAKMGGTS--DVTTRFRIEPSSSGVRDQVSRISAASLDRC

Query:  LRR------ASKFLCDPGSVLQRTIDYATEAFVASIQSALAVKAELDGREALAAR--EKEEFSAALEAASSTMKDELLKAHSEVEILKAEVEAKAELLKK
        + R      A K     G+  + +     +A V++ + A    AE +  + LA     + E SA LE  SS + +++    S V+  + ++EA  +    
Subjt:  LRR------ASKFLCDPGSVLQRTIDYATEAFVASIQSALAVKAELDGREALAAR--EKEEFSAALEAASSTMKDELLKAHSEVEILKAEVEAKAELLKK

Query:  EEDR-RKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHAT-AELEMVKERLSNGA-LLEESFRQHPDFDGFAKDFSDAGFKFLMKGIA
        E  R RK+++    A  K  + +    L+     L+ L  K+  +  AT  ELE+ +  L NG   LE +     D D F +  + A    L+ GI+
Subjt:  EEDR-RKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHAT-AELEMVKERLSNGA-LLEESFRQHPDFDGFAKDFSDAGFKFLMKGIA

AT5G38190.1 INVOLVED IN: biological_process unknown

4.9e-06

23.71

Show/hide

Query:  VLACRLESELEEIENFRFSDDGEDSDASTSGQGLEY------PFRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMF-EYGLRLPLH
        V + R +++ +   N    D+ E +D + SG+  +       P       +G       +P  + +RIP + +R  + PEG++ L+   F E GLR P+ 
Subjt:  VLACRLESELEEIENFRFSDDGEDSDASTSGQGLEY------PFRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMF-EYGLRLPLH

Query:  PFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA
         F+  F     +A +Q+       I   A L  L AR       L V+ +       ++  K G+ Y+ + +G   +   P+  + W+  +FYA
Subjt:  PFVQEFLFRTGLAPAQVAPNGWGVIFALAILFWLRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAGGTCTTGGGAAGACATGTAGATCATTCAAGGAAGGAACGATCTTCCGTACTAAGCCGAATTTCAAATGACAATCATATGAAATGGAATAGCTACTCCCGACAAGC
CGACCTTCAACCGACATGTCCAACTGCCTATTGGATACCTCAACCTATAAATAGGGCACTTTGCTCATCAATCAGTGTATTTCAGATTGCAGCTCGAACTCGGCCTCCGG
ACCGATCTGAATACTTGGGCGGGCCTGCACAAAAAGGTGAGCACTCCGACGATCAAGTCAGTATAGGTCGAATTCCCAGTTTAGTTCGAGGGTATTCTTTCCCCCAAACA
TTGGCCCCCTCTCTGTCTAGTCCGATCTCGACCTGGCAGAGAAGTTCATTTGATTCGCTTCGGACACGTGGCGACTTCCTATTCGTGGGAAAACATAACCGTTGCGGTGG
ATTTATCATCGGAATATTCAAATATTCCGACGCTTCGGATCTTCGGGAGGATCCTAGCCGCTCGTTGATTACCCGTCTCGAACCCTTGGTAGGTCGGTCTCTTCCCTCAC
TTTCTCTTTCGAACGTAGTTGCCATGTCGTCCTCTTTTAGCAGCGACTTAGGATCCGATGAGGTTTTAGCTTGTAGGTTAGAGTCCGAGCTCGAGGAGATAGAAAACTTT
AGGTTCTCCGATGACGGGGAGGATAGTGATGCCTCCACCTCGGGTCAGGGTTTGGAATACCCTTTTAGGATTCCTGAGCACTACCTTGGATCCCTTCGTAGGGGGTTCGC
TATCCCTGAGAACATCCTCCTTAGGATTCCGGAGGAGGGGGAAAGAGCTGACAATCCTCCAGAGGGATGGGTCACTCTCTACTTCAAAATGTTTGAGTACGGCCTCAGAC
TTCCCCTTCACCCTTTCGTCCAAGAGTTTCTTTTCCGAACTGGGCTGGCTCCGGCTCAAGTGGCCCCCAATGGGTGGGGTGTCATTTTCGCTTTGGCCATCCTCTTTTGG
CTACGAGCTCGGGATAGTGAAAAGGCCGAGCTGTTGGATGTAGACCAGCTCCTCGCGTGCTTCGAAGCGAAAAGGATAGCTAAGAAGCCTGGTCGGTTCTATATGTGCGC
AAGGAAAGGCGCAGGCGGTATAGTTAAGGGGCCGACCTCCATCAAGGGATGGGTGAGGAAGTGGTTCTACGCTTCTGGGGAATGGCTTGCAAAGGACGAGTCAGGTCGTT
CCTTCTTTGACGTTCCCACTAGGTTTGGGAACCTAGTTTCAATCCGACCAGTCCCCGAGCTTACGCAAGCCTCCTTCGACACGTTGAAATATTACAAGGAGCATTTTCCG
AGGGGTAGGAAGGTCGGAACCTTGGTGACCGACAAGCTGCTGCTTGAGTCCGGGCTGCTAGATTACAACCCTGCAGTTCGTCCCGTTGAATCCTCAAGGCCGAACTCCGA
ATTAGCCATGGTTTGCGGGTTTGCGAGTAACGTGAAACGCAAGCCCAAGGGCCGAGCCCATGCTCTTGAGGCCGCCCAGAGTTCGAAACCTGCCACTCCTGCTATGGTAG
GGCCAGCCTCGGAAGATCCAGCCCCAGTGATCGAGCTGGAGTCTTCTGGGGGTCCTTCGAGGGAGAAGCGCCCCAGGGATCAGACCGAGGCGGTGGACGTCTCGCCCTTG
GGCGAGGAGGTGAGGGAGGAAGTCCTTCTGAAGCGAAGGAGGAAGAAGAAGAAGACCACCTCCCCCTTGGAGGTCGAAGCTCGTGGGGTCTTGCCTGCGAGCTTCGCAGA
TCGGGTGGACGATCCTGAGGCCAAGATGGGCGGGACGTCCGACGTGACAACACGGTTCAGAATCGAGCCGTCAAGTTCTGGGGTGAGGGACCAGGTGTCCCGCATCTCGG
CTGCAAGTTTGGACCGCTGCCTCAGAAGAGCGTCCAAATTTTTATGTGACCCGGGGTCCGTCCTGCAGAGGACCATCGACTACGCCACTGAGGCGTTTGTTGCTTCCATT
CAATCGGCTCTGGCCGTGAAGGCCGAGCTGGATGGAAGGGAAGCTCTGGCAGCGAGGGAGAAAGAGGAGTTCTCTGCTGCCTTGGAGGCTGCCTCTTCCACCATGAAGGA
TGAGCTGCTGAAAGCTCACTCTGAGGTGGAAATTTTGAAGGCTGAGGTGGAGGCCAAGGCCGAGCTGCTGAAGAAAGAAGAGGACAGACGCAAGGCCCAGCTCCGAGCTG
CCCATGCTATCACCAAGGGCTTGGAGAAGGAGAAGTTCCAACTCCTCAAGGAGAAGGACGACATGCTCCAGGCGCTTGAAGCGAAGGAGGAGGAGCTGAAGCACGCGACT
GCTGAGCTGGAGATGGTGAAGGAGCGTCTCAGCAATGGAGCCCTATTGGAGGAATCGTTCAGGCAACATCCTGACTTCGATGGATTTGCCAAAGACTTCTCTGACGCGGG
CTTCAAGTTTCTCATGAAGGGCATTGCTTCCGACATGCCTGACCTTCAGATCGATCTCGGTGGTCTGAAGAAGAGATATGCTGAGCAGTGGGCGTCTGGGCCTAGTGGCA
CCCCTGGCCCCCAAGCGTTGGTGGATAAGTACGTCAGAGATCTGAACTCTAACTACTCCGACCTCGAAGAGGATCAGGTCGGCACCACTCAGGAGGGCGCTCCTCAAGCA
GGCTCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKVLGRHVDHSRKERSSVLSRISNDNHMKWNSYSRQADLQPTCPTAYWIPQPINRALCSSISVFQIAARTRPPDRSEYLGGPAQKGEHSDDQVSIGRIPSLVRGYSFPQT
LAPSLSSPISTWQRSSFDSLRTRGDFLFVGKHNRCGGFIIGIFKYSDASDLREDPSRSLITRLEPLVGRSLPSLSLSNVVAMSSSFSSDLGSDEVLACRLESELEEIENF
RFSDDGEDSDASTSGQGLEYPFRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVTLYFKMFEYGLRLPLHPFVQEFLFRTGLAPAQVAPNGWGVIFALAILFW
LRARDSEKAELLDVDQLLACFEAKRIAKKPGRFYMCARKGAGGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELTQASFDTLKYYKEHFP
RGRKVGTLVTDKLLLESGLLDYNPAVRPVESSRPNSELAMVCGFASNVKRKPKGRAHALEAAQSSKPATPAMVGPASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPL
GEEVREEVLLKRRRKKKKTTSPLEVEARGVLPASFADRVDDPEAKMGGTSDVTTRFRIEPSSSGVRDQVSRISAASLDRCLRRASKFLCDPGSVLQRTIDYATEAFVASI
QSALAVKAELDGREALAAREKEEFSAALEAASSTMKDELLKAHSEVEILKAEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHAT
AELEMVKERLSNGALLEESFRQHPDFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLNSNYSDLEEDQVGTTQEGAPQA
GS

Moc04g25810 (gene) of Bitter gourd (OHB3-1) v2 genome