CuGenDBv2

Gene ID	Clc03G08230
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	DUF676 domain-containing protein
Genome location	ClcChr03:8515060..8529209
RNA-Seq Expression	Clc03G08230
Synteny	Clc03G08230
Gene Ontology terms	GO:0044255 - cellular lipid metabolic process (biological process) GO:0016787 - hydrolase activity (molecular function) GO:0046872 - metal ion binding (molecular function)
InterPro domains	IPR006121 - Heavy metal-associated domain, HMA IPR007751 - Domain of unknown function DUF676, lipase-like IPR029058 - Alpha/Beta hydrolase fold IPR036163 - Heavy metal-associated domain superfamily IPR044294 - Lipase-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0057035.1 putative lipase isoform X3 [Cucumis melo var. makuwa]

2.1e-181

85.53

Show/hide

Query:  LCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEV
        L K+SNHSWRLPG G QAMSTSTLGTFSSS SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEV
Subjt:  LCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEV

Query:  LQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIV
        LQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL+SS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIV
Subjt:  LQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIV

Query:  VGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPP
        VGRTGSQLFLTDGKPDKPPLLLRMASDC+EGKFISALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPP
Subjt:  VGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPP

Query:  EAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        EAAQAKEAAQ SP+ +NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  EAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

XP_008443198.1 PREDICTED: uncharacterized protein LOC103486851 isoform X1 [Cucumis melo]

2.6e-179

84.63

Show/hide

Query:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
        DSNHSWRLPG G QAMSTSTLGTFSSS SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
Subjt:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV

Query:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR
        VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL+SS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIVVGR
Subjt:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR

Query:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFI------SALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPH
        TGSQLFLTDGKPDKPPLLLRMASDC+EGKFI      SALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPH
Subjt:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFI------SALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPH

Query:  FPPEAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        FPPEAAQAKEAAQ SP+ +NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  FPPEAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

XP_008443207.1 PREDICTED: uncharacterized protein LOC103486851 isoform X2 [Cucumis melo]

2.8e-181

85.93

Show/hide

Query:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
        DSNHSWRLPG G QAMSTSTLGTFSSS SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
Subjt:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV

Query:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR
        VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL+SS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIVVGR
Subjt:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR

Query:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA
        TGSQLFLTDGKPDKPPLLLRMASDC+EGKFISALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA
Subjt:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA

Query:  QAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        QAKEAAQ SP+ +NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  QAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

XP_011657777.1 putative lipase C4A8.10 isoform X1 [Cucumis sativus]

3.4e-179

85.46

Show/hide

Query:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
        D NHSWRLPG G QAMSTSTLGTFSSS+SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSN+FTKTFTGIDGAGKRLADEVLQV
Subjt:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV

Query:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL-SSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVG
        VHKTESLKRISFLAHSLGGLFARYAIAVLYNNS+SL SSS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIVVG
Subjt:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL-SSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVG

Query:  RTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA
        RTGSQLFLTDGKP KPPLLLRMASDC+EGKFISALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA
Subjt:  RTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA

Query:  AQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        AQAKEAAQKSP+T+NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  AQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

XP_023520181.1 putative lipase C4A8.10 [Cucurbita pepo subsp. pepo]

1.3e-173

83.89

Show/hide

Query:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
        DSNHSWRLP LGPQAMST T GT SSSSSIGN KN+PDHLLVLVHGIMASPSDW YFEAELKRRLGRN+LIYASSSNTFTKTFTGIDGAGKRLADEVLQV
Subjt:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV

Query:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR
        V +TESLKRISFLAHSLGGLFARYAIAVLYNNS+SLSSSIPNDP +SSKKG +AGLEPISFITLATPHLGVR         GVP LEKLA PIAPIVVGR
Subjt:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR

Query:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA
        TGSQLFLTDGKPDKPPLLLRMAS  E+ KFISALG+FRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSL GYKHVVDVEY PPVSSAGPHFPPEAA
Subjt:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA

Query:  QAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        QAKEAAQKSPTTHNTVDYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSS APVASL
Subjt:  QAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LX84 DUF676 domain-containing protein

1.7e-179

85.46

Show/hide

Query:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
        D NHSWRLPG G QAMSTSTLGTFSSS+SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSN+FTKTFTGIDGAGKRLADEVLQV
Subjt:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV

Query:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL-SSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVG
        VHKTESLKRISFLAHSLGGLFARYAIAVLYNNS+SL SSS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIVVG
Subjt:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL-SSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVG

Query:  RTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA
        RTGSQLFLTDGKP KPPLLLRMASDC+EGKFISALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA
Subjt:  RTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA

Query:  AQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        AQAKEAAQKSP+T+NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  AQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

A0A1S3B7J4 uncharacterized protein LOC103486851 isoform X2

1.4e-181

85.93

Show/hide

Query:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
        DSNHSWRLPG G QAMSTSTLGTFSSS SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
Subjt:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV

Query:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR
        VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL+SS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIVVGR
Subjt:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR

Query:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA
        TGSQLFLTDGKPDKPPLLLRMASDC+EGKFISALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA
Subjt:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAA

Query:  QAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        QAKEAAQ SP+ +NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  QAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

A0A1S3B889 uncharacterized protein LOC103486851 isoform X1

1.3e-179

84.63

Show/hide

Query:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
        DSNHSWRLPG G QAMSTSTLGTFSSS SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV
Subjt:  DSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQV

Query:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR
        VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL+SS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIVVGR
Subjt:  VHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVGR

Query:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFI------SALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPH
        TGSQLFLTDGKPDKPPLLLRMASDC+EGKFI      SALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPH
Subjt:  TGSQLFLTDGKPDKPPLLLRMASDCEEGKFI------SALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPH

Query:  FPPEAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        FPPEAAQAKEAAQ SP+ +NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  FPPEAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

A0A5A7UU10 Putative lipase isoform X3

1.0e-181

85.53

Show/hide

Query:  LCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEV
        L K+SNHSWRLPG G QAMSTSTLGTFSSS SIGNV+N+PDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEV
Subjt:  LCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEV

Query:  LQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIV
        LQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSL+SS+PNDP NSSKKG IAGLEPISFITLATPHLGVR         GVPLLEKLAAPIAPIV
Subjt:  LQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIV

Query:  VGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPP
        VGRTGSQLFLTDGKPDKPPLLLRMASDC+EGKFISALGSFRSR+LYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPP
Subjt:  VGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPP

Query:  EAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        EAAQAKEAAQ SP+ +NT DYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSSFAP+ASL
Subjt:  EAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

A0A6J1EPC9 uncharacterized protein LOC111434365 isoform X1

3.0e-173

Show/hide

Query:  SDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGK
        S   T    DSNH+WRLP LG QAMST T GT SSSSSIGNVKN+PDHLLVLVHGIMASPSDW YFEAELKRRLGRN+LIYASSSNTFTKTF+GIDGAGK
Subjt:  SDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGK

Query:  RLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAA
        RLADEVLQVV +TESLKRISFLAHSLGGLFARYAIAVLYNNS+SLSSSIPNDP +SSKKG +AGLEPISFITLATPHLGVR         GVP LEKLA 
Subjt:  RLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAA

Query:  PIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSA
        PIAPIVVGRTGSQLFLTDGKPDKPPLLLRMAS  E+ KFISALG+FRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSL GYKHVVDVEY PPVSSA
Subjt:  PIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSA

Query:  GPHFPPEAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL
        GPHFPPEAAQAKEAAQKSPTTHNTVDYHEIM E M   LQQ                        VKNEWLYNAGAGVVAHVADTLKQQEPSS APVASL
Subjt:  GPHFPPEAAQAKEAAQKSPTTHNTVDYHEIM-EGMKPQLQQ-----------------------EVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

SwissProt top hits

e value

%identity

Alignment

B3H6D0 Heavy metal-associated isoprenylated plant protein 45

1.5e-20

37.72

Show/hide

Query:  MTVTEMRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKP
        +++ E+ V MDC+GCEK+VR+A+  L+GVD V ID+  QKVTV G+  ++++LK V+R GRTAE WP+PYN  Y+G      +Y    QH  Q   +   
Subjt:  MTVTEMRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKP

Query:  IITYNSLSSSSSSHKHKMSPMHEYGSSYNYSRGGADYGYYQEPPFTTIDEEAGAMFSDENPHFCAVM
         I+Y        S K+    + ++ ++ N +  G  Y    +     IDE A  +FSD+N H C +M
Subjt:  IITYNSLSSSSSSHKHKMSPMHEYGSSYNYSRGGADYGYYQEPPFTTIDEEAGAMFSDENPHFCAVM

F4IC29 Heavy metal-associated isoprenylated plant protein 28

5.0e-24

41.67

Show/hide

Query:  EMRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKPIITY
        EMRVHMDC GCE +V+ AL+ + GVD V ID+  QKVTV G+A QKK+LK VR+ GR AELW  PYNP + G       Y  +PQ  + P     P+ T 
Subjt:  EMRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKPIITY

Query:  NSLSSSSSSHKHKMSPMHEYGSSYNYSRGG---ADYGYYQEPPF--TTIDEEAGAMFSDENPHFCAVM
                             SSYNY + G    DY  Y+  P   +    + G+ FSDENP+ C++M
Subjt:  NSLSSSSSSHKHKMSPMHEYGSSYNYSRGG---ADYGYYQEPPF--TTIDEEAGAMFSDENPHFCAVM

F4IQG4 Heavy metal-associated isoprenylated plant protein 30

1.6e-14

32.73

Show/hide

Query:  EMRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKPIITY
        +++V M C GCE+ V+ A+  L GVD V ++L  ++VTV+G+ ++KK+LKAVRR G+ AE WPYP  P+Y                              
Subjt:  EMRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKPIITY

Query:  NSLSSSSSSHKHKMSPMHEYGSSYNYSRGGADYGYYQEPPFTTI--DEEAGAMFSDENPHFCAVM
             +SS H  K     E+  SYNY R G +          T   D++    F+D+N H C++M
Subjt:  NSLSSSSSSHKHKMSPMHEYGSSYNYSRGGADYGYYQEPPFTTI--DEEAGAMFSDENPHFCAVM

Q84K70 Heavy metal-associated isoprenylated plant protein 31

1.5e-15

34.91

Show/hide

Query:  MTVTEMRV-HMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGW-AKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQT
        MTV E+RV ++DC+GC  ++RK L  L+GV++V +++ TQKVT  G+  ++KK+LKAVRR G+ AELWPY     +    + Y  Y+ +  H++    +T
Subjt:  MTVTEMRV-HMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGW-AKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQT

Query:  KPIITYNSLSSSSSSHKHKMSPMHEYGSSYNYSRGGADYGYYQEPPFTTIDEEAGAMFSDENPHFCAVM
         P                        G  + +    ADY           DE A +MFSD+NPH C +M
Subjt:  KPIITYNSLSSSSSSHKHKMSPMHEYGSSYNYSRGGADYGYYQEPPFTTIDEEAGAMFSDENPHFCAVM

Q9LP41 Heavy metal-associated isoprenylated plant protein 29

1.0e-21

40.72

Show/hide

Query:  MRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRR-NGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKPIITY
        M V MDC GCE +VRKALE + GV DV ID+  Q+VTV G A+QKK+LK  R    R   LW YPY+P+ +G+   Y                       
Subjt:  MRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRR-NGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKPIITY

Query:  NSLSSSSSSHKHKMSPMHEYGSSYNYSR---GGADYGYYQEPPFT-TIDEEAGAMFSDENPHFCAVM
                  +  MS   E  SSYNY +    G ++GYYQE P++  I+  A +MFS+ENPHFC++M
Subjt:  NSLSSSSSSHKHKMSPMHEYGSSYNYSR---GGADYGYYQEPPFT-TIDEEAGAMFSDENPHFCAVM

Arabidopsis top hits

e value

%identity

Alignment

AT1G29120.1 Hydrolase-like protein family

4.2e-135

65.66

Show/hide

Query:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG
        I++ D+G      SN SW   G   QAMS++    FS S    + KNEPDHLLVLVHGI+ASPSDW Y EAELKRRLGR +LIYASSSNTFTKTF GIDG
Subjt:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG

Query:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL
        AGKRLA+EV QVV K++SLK+ISFLAHSLGGLF+R+A+AVLY+ + +  S +    S +S   +G IAGLEPI+FITLATPHLGVR         GVP+L
Subjt:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL

Query:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYP
        EKLAAPIAP  VGRTGSQLFLTDGK DKPPLLLRMASD E+ KF+SALG+FRSR++YANV+YDHMVGWRTSSIRRE ELIKP RRSLDGYKHVVDVEY P
Subjt:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYP

Query:  PVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIME----------GMK-----------PQLQQ---EVKNEWLYNAGAGVVAHVADTLKQQEPSSF
        PVSS G HFPPEAA+AKEAAQ SP+  NT++YHEI+E          G K           P L      VK+E LY AGAGV+AHVAD++KQQE S+F
Subjt:  PVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIME----------GMK-----------PQLQQ---EVKNEWLYNAGAGVVAHVADTLKQQEPSSF

AT1G29120.2 Hydrolase-like protein family

4.2e-135

65.66

Show/hide

Query:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG
        I++ D+G      SN SW   G   QAMS++    FS S    + KNEPDHLLVLVHGI+ASPSDW Y EAELKRRLGR +LIYASSSNTFTKTF GIDG
Subjt:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG

Query:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL
        AGKRLA+EV QVV K++SLK+ISFLAHSLGGLF+R+A+AVLY+ + +  S +    S +S   +G IAGLEPI+FITLATPHLGVR         GVP+L
Subjt:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL

Query:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYP
        EKLAAPIAP  VGRTGSQLFLTDGK DKPPLLLRMASD E+ KF+SALG+FRSR++YANV+YDHMVGWRTSSIRRE ELIKP RRSLDGYKHVVDVEY P
Subjt:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYP

Query:  PVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIME----------GMK-----------PQLQQ---EVKNEWLYNAGAGVVAHVADTLKQQEPSSF
        PVSS G HFPPEAA+AKEAAQ SP+  NT++YHEI+E          G K           P L      VK+E LY AGAGV+AHVAD++KQQE S+F
Subjt:  PVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIME----------GMK-----------PQLQQ---EVKNEWLYNAGAGVVAHVADTLKQQEPSSF

AT1G29120.3 Hydrolase-like protein family

1.9e-127

71.87

Show/hide

Query:  SNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQVV
        SN SW   G   QAMS++    FS S    + KNEPDHLLVLVHGI+ASPSDW Y EAELKRRLGR +LIYASSSNTFTKTF GIDGAGKRLA+EV QVV
Subjt:  SNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQVV

Query:  HKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVG
         K++SLK+ISFLAHSLGGLF+R+A+AVLY+ + +  S +    S +S   +G IAGLEPI+FITLATPHLGVR         GVP+LEKLAAPIAP  VG
Subjt:  HKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLLEKLAAPIAPIVVG

Query:  RTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA
        RTGSQLFLTDGK DKPPLLLRMASD E+ KF+SALG+FRSR++YANV+YDHMVGWRTSSIRRE ELIKP RRSLDGYKHVVDVEY PPVSS G HFPPEA
Subjt:  RTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEA

Query:  AQAKEAAQKSPTTHNTVDYHEIMEGMK
        A+AKEAAQ SP+  NT++YHEI+EG++
Subjt:  AQAKEAAQKSPTTHNTVDYHEIMEGMK

AT1G29120.4 Hydrolase-like protein family

5.0e-128

70.29

Show/hide

Query:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG
        I++ D+G      SN SW   G   QAMS++    FS S    + KNEPDHLLVLVHGI+ASPSDW Y EAELKRRLGR +LIYASSSNTFTKTF GIDG
Subjt:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG

Query:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL
        AGKRLA+EV QVV K++SLK+ISFLAHSLGGLF+R+A+AVLY+ + +  S +    S +S   +G IAGLEPI+FITLATPHLGVR         GVP+L
Subjt:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL

Query:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYP
        EKLAAPIAP  VGRTGSQLFLTDGK DKPPLLLRMASD E+ KF+SALG+FRSR++YANV+YDHMVGWRTSSIRRE ELIKP RRSLDGYKHVVDVEY P
Subjt:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYP

Query:  PVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIMEGMK
        PVSS G HFPPEAA+AKEAAQ SP+  NT++YHEI+EG K
Subjt:  PVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIMEGMK

AT1G29120.5 Hydrolase-like protein family

1.2e-132

65.25

Show/hide

Query:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG
        I++ D+G      SN SW   G   QAMS++    FS S    + KNEPDHLLVLVHGI+ASPSDW Y EAELKRRLGR +LIYASSSNTFTKTF GIDG
Subjt:  IVDSDYGTVLCKDSNHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDG

Query:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL
        AGKRLA+EV QVV K++SLK+ISFLAHSLGGLF+R+A+AVLY+ + +  S +    S +S   +G IAGLEPI+FITLATPHLGVR         GVP+L
Subjt:  AGKRLADEVLQVVHKTESLKRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSK--KGAIAGLEPISFITLATPHLGVR---------GVPLL

Query:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYD-HMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYY
        EKLAAPIAP  VGRTGSQLFLTDGK DKPPLLLRMASD E+ KF+SALG+FRSR++YANV+YD  MVGWRTSSIRRE ELIKP RRSLDGYKHVVDVEY 
Subjt:  EKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRMASDCEEGKFISALGSFRSRVLYANVAYD-HMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYY

Query:  PPVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIME----------GMK-----------PQLQQ---EVKNEWLYNAGAGVVAHVADTLKQQEPSSF
        PPVSS G HFPPEAA+AKEAAQ SP+  NT++YHEI+E          G K           P L      VK+E LY AGAGV+AHVAD++KQQE S+F
Subjt:  PPVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIME----------GMK-----------PQLQQ---EVKNEWLYNAGAGVVAHVADTLKQQEPSSF

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGGTAACAGAGATGAGAGTTCATATGGACTGTCAGGGATGTGAAAAGCAAGTAAGAAAAGCTCTCGAAAATCTGGAAGGTGTGGATGATGTGATAATAGAT
TTGAGCACACAGAAGGTGACTGTGATGGGATGGGCAAAGCAAAAGAAGATTCTGAAGGCGGTGCGGCGGAATGGGCGGACGGCGGAGCTGTGGCCATACCCTTAC
AACCCCCAATACCATGGCTTCCTCCACCACTACCAGCATTACCTTAACTCTCCACAGCATCACCATCAGCCTCAGCCTCAGACTAAACCAATCATCACTTACAAT
TCACTGTCATCTTCTTCTTCCTCGCACAAGCACAAGATGAGTCCAATGCATGAATATGGTAGTAGCTACAACTACAGCCGCGGCGGTGCTGACTATGGCTATTAT
CAAGAGCCACCATTTACCACTATTGATGAAGAAGCTGGTGCCATGTTCAGCGATGAGAACCCACATTTTTGCGCTGTCATGGCATGGGCTTTTCCCTTGATCATC
GAAATCCAAGAGGATAACGAAAGTTATGGCTTCTTGTTGACTCCACTTGGACAACAACAATCTCACTCCTCTCTTTCTTTTGCCTTGCTTCCTCTGCTAATTCTC
TCTTGTAATATATATATATATATATATATATATGGCATTGGCGCCTTTCATTCACGCGCGCTGTTGTTACAACCCCATTTTCGGTGCTCAAAGAACCGGTTCTTC
TCATGGACCTGTAGGAACGTCGTCGTTTTCTTCTTCCTCTTCCTCCTCCTCTTCCTCGTCTCCCTGTTCTTCCTCTTCTGTTATAGCTGGATATACAAATCTTCT
AAATTTTATATACTTTATGAATTCGCGAACTCTTCGTTCTGGATTACCAATCTTTTGTATTTAATCGTGGATTCTGATTATGGAACTGTACTTTGCAAAGACTCG
AATCACAGCTGGAGATTACCTGGCCTTGGACCCCAAGCAATGAGTACTTCAACCCTTGGAACATTCTCATCATCAAGTAGCATTGGAAATGTGAAAAACGAGCCT
GATCATCTTCTTGTCCTTGTTCATGGCATCATGGCTAGCCCAAGTGACTGGACTTACTTTGAAGCAGAGTTAAAAAGGCGTCTTGGAAGAAACTACTTGATATAT
GCAAGTTCGTCAAATACTTTTACTAAAACTTTCACGGGAATTGATGGAGCAGGAAAACGATTAGCTGATGAGGTCTTGCAAGTGGTACATAAAACAGAGAGCTTA
AAAAGGATATCTTTTTTGGCTCATTCACTTGGTGGTTTGTTTGCGAGATATGCTATTGCTGTACTTTACAATAACTCAAATTCATTGTCTAGTAGCATCCCAAAT
GATCCTTCCAATTCTTCGAAAAAAGGTGCGATTGCTGGGCTAGAGCCAATCAGTTTCATTACCTTGGCAACTCCTCATTTAGGAGTGAGAGGAGTTCCCCTCCTA
GAGAAACTGGCTGCACCAATAGCCCCTATTGTTGTGGGCCGAACGGGTAGTCAGCTATTCCTTACCGATGGAAAACCTGATAAACCACCACTTCTATTAAGAATG
GCATCCGATTGTGAAGAAGGGAAATTCATATCTGCCCTTGGCTCTTTTCGGTCCCGTGTTCTTTATGCCAATGTAGCTTATGATCATATGGTTGGTTGGCGCACT
TCGTCTATAAGGAGGGAAAATGAACTTATCAAGCCCCCTCGCCGATCATTGGATGGTTACAAGCATGTCGTAGATGTGGAATATTATCCTCCTGTTTCCTCTGCT
GGTCCCCATTTTCCCCCTGAAGCAGCTCAAGCAAAGGAGGCTGCACAAAAATCACCAACCACACACAATACAGTGGATTATCATGAAATCATGGAAGGTATGAAG
CCCCAACTCCAGCAGGAGGTGAAAAACGAATGGCTTTACAATGCTGGTGCTGGCGTGGTGGCTCATGTTGCAGACACCCTCAAGCAACAAGAACCGTCTTCATTT
GCCCCTGTGGCGAGCTTATAG

mRNA sequence

Show/hide mRNA sequence

TTTCATAGAGACAGCGAGAGGGAAGGCTTACTTATAATTCATATAAATTGACTGTTGCTTCCCTTCATCTCCTTGTAGACTTGTTTTGTTCTCTCATTGACAGGG
AAAGCTTCTTCGTGCCCCTCTTCAATTGGTATACCGACATGACGGTAACAGAGATGAGAGTTCATATGGACTGTCAGGGATGTGAAAAGCAAGTAAGAAAAGCTC
TCGAAAATCTGGAAGGTGTGGATGATGTGATAATAGATTTGAGCACACAGAAGGTGACTGTGATGGGATGGGCAAAGCAAAAGAAGATTCTGAAGGCGGTGCGGC
GGAATGGGCGGACGGCGGAGCTGTGGCCATACCCTTACAACCCCCAATACCATGGCTTCCTCCACCACTACCAGCATTACCTTAACTCTCCACAGCATCACCATC
AGCCTCAGCCTCAGACTAAACCAATCATCACTTACAATTCACTGTCATCTTCTTCTTCCTCGCACAAGCACAAGATGAGTCCAATGCATGAATATGGTAGTAGCT
ACAACTACAGCCGCGGCGGTGCTGACTATGGCTATTATCAAGAGCCACCATTTACCACTATTGATGAAGAAGCTGGTGCCATGTTCAGCGATGAGAACCCACATT
TTTGCGCTGTCATGGCATGGGCTTTTCCCTTGATCATCGAAATCCAAGAGGATAACGAAAGTTATGGCTTCTTGTTGACTCCACTTGGACAACAACAATCTCACT
CCTCTCTTTCTTTTGCCTTGCTTCCTCTGCTAATTCTCTCTTGTAATATATATATATATATATATATATATGGCATTGGCGCCTTTCATTCACGCGCGCTGTTGT
TACAACCCCATTTTCGGTGCTCAAAGAACCGGTTCTTCTCATGGACCTGTAGGAACGTCGTCGTTTTCTTCTTCCTCTTCCTCCTCCTCTTCCTCGTCTCCCTGT
TCTTCCTCTTCTGTTATAGCTGGATATACAAATCTTCTAAATTTTATATACTTTATGAATTCGCGAACTCTTCGTTCTGGATTACCAATCTTTTGTATTTAATCG
TGGATTCTGATTATGGAACTGTACTTTGCAAAGACTCGAATCACAGCTGGAGATTACCTGGCCTTGGACCCCAAGCAATGAGTACTTCAACCCTTGGAACATTCT
CATCATCAAGTAGCATTGGAAATGTGAAAAACGAGCCTGATCATCTTCTTGTCCTTGTTCATGGCATCATGGCTAGCCCAAGTGACTGGACTTACTTTGAAGCAG
AGTTAAAAAGGCGTCTTGGAAGAAACTACTTGATATATGCAAGTTCGTCAAATACTTTTACTAAAACTTTCACGGGAATTGATGGAGCAGGAAAACGATTAGCTG
ATGAGGTCTTGCAAGTGGTACATAAAACAGAGAGCTTAAAAAGGATATCTTTTTTGGCTCATTCACTTGGTGGTTTGTTTGCGAGATATGCTATTGCTGTACTTT
ACAATAACTCAAATTCATTGTCTAGTAGCATCCCAAATGATCCTTCCAATTCTTCGAAAAAAGGTGCGATTGCTGGGCTAGAGCCAATCAGTTTCATTACCTTGG
CAACTCCTCATTTAGGAGTGAGAGGAGTTCCCCTCCTAGAGAAACTGGCTGCACCAATAGCCCCTATTGTTGTGGGCCGAACGGGTAGTCAGCTATTCCTTACCG
ATGGAAAACCTGATAAACCACCACTTCTATTAAGAATGGCATCCGATTGTGAAGAAGGGAAATTCATATCTGCCCTTGGCTCTTTTCGGTCCCGTGTTCTTTATG
CCAATGTAGCTTATGATCATATGGTTGGTTGGCGCACTTCGTCTATAAGGAGGGAAAATGAACTTATCAAGCCCCCTCGCCGATCATTGGATGGTTACAAGCATG
TCGTAGATGTGGAATATTATCCTCCTGTTTCCTCTGCTGGTCCCCATTTTCCCCCTGAAGCAGCTCAAGCAAAGGAGGCTGCACAAAAATCACCAACCACACACA
ATACAGTGGATTATCATGAAATCATGGAAGGTATGAAGCCCCAACTCCAGCAGGAGGTGAAAAACGAATGGCTTTACAATGCTGGTGCTGGCGTGGTGGCTCATG
TTGCAGACACCCTCAAGCAACAAGAACCGTCTTCATTTGCCCCTGTGGCGAGCTTATAGCAGTTAGCTATATCTTAGTGGCAGTAGAATTTAATCATGTTGAAGA
ATCAGCGGTTGCAAAATGAGAGAATATCACAGATTGTTTTGTACTGTCATAGTTTAGTATATTGTAGCTTGGATTGGATGTAAGCTTTGCATAGCTCAGCCACAT
GTAAAAAGCTTTATTAAGGAGAAATTAAGGATAATTCTACATTTGCTTCTCTACAATAATAATAATGATGCTGAATAAAAAGCAACATTGATCAACTAGATGATT
AACTATTAACTAGGATTTGTTATGGCCATTTTTCTTGATGATTGGTCTATTTGTTCTAGCAACGAAGAATTTATTCTTCTTCCA

Protein sequence

Show/hide protein sequence

MTVTEMRVHMDCQGCEKQVRKALENLEGVDDVIIDLSTQKVTVMGWAKQKKILKAVRRNGRTAELWPYPYNPQYHGFLHHYQHYLNSPQHHHQPQPQTKPIITYN
SLSSSSSSHKHKMSPMHEYGSSYNYSRGGADYGYYQEPPFTTIDEEAGAMFSDENPHFCAVMAWAFPLIIEIQEDNESYGFLLTPLGQQQSHSSLSFALLPLLIL
SCNIYIYIYIYGIGAFHSRALLLQPHFRCSKNRFFSWTCRNVVVFFFLFLLLFLVSLFFLFCYSWIYKSSKFYILYEFANSSFWITNLLYLIVDSDYGTVLCKDS
NHSWRLPGLGPQAMSTSTLGTFSSSSSIGNVKNEPDHLLVLVHGIMASPSDWTYFEAELKRRLGRNYLIYASSSNTFTKTFTGIDGAGKRLADEVLQVVHKTESL
KRISFLAHSLGGLFARYAIAVLYNNSNSLSSSIPNDPSNSSKKGAIAGLEPISFITLATPHLGVRGVPLLEKLAAPIAPIVVGRTGSQLFLTDGKPDKPPLLLRM
ASDCEEGKFISALGSFRSRVLYANVAYDHMVGWRTSSIRRENELIKPPRRSLDGYKHVVDVEYYPPVSSAGPHFPPEAAQAKEAAQKSPTTHNTVDYHEIMEGMK
PQLQQEVKNEWLYNAGAGVVAHVADTLKQQEPSSFAPVASL

Clc03G08230 (gene) of Watermelon (cordophanus) v2 genome