CuGenDBv2

Gene ID	MS004000
Organism	Momordica charantia cv. TR (Bitter gourd (TR) v1)
Description	FCP1 homology domain-containing protein
Genome location	scaffold1597:440199..443732
RNA-Seq Expression	MS004000
Synteny	MS004000
Gene Ontology terms	NA
InterPro domains	IPR004274 - FCP1 homology domain IPR023214 - HAD superfamily IPR036412 - HAD-like superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6584401.1 hypothetical protein SDJN03_20333, partial [Cucurbita argyrosperma subsp. sororia]

1.3e-213

73.21

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MD+SE DT+  LEHK KKRKQEQFD AP  NN+ +V SGSE+ASSMD ILSEND A  A  IICSKLESET +    +C    NVH K+ +DD + S+DM
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN
         TEH NINGS +LI            YS+EMEEPSSM+  K +S +SED    R+HDDH NVA V +EL++E +D  KD     HS E+ SDS  HFPCN
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN

Query:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE
        EQE+ERD SLK+SD+EQING             A+EEASV  +VG E+DDETSTSKE IISTP C+PPE +NA+TVK  EEVVCFS SGETS  +DAIIE
Subjt:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE

Query:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL
        E  P  VLDTS+KGDSI  SRKKLLVLDVNGLLADFICYVPYGYKPD++IGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDM IDFLMGD +QKL
Subjt:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL

Query:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ
        LFCWDQSHCTDTTFSTVEN HKPLVLK+IKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRVYLEGLS+AENVQ
Subjt:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ

Query:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        KYVEQNPFGQRPITEKN SWKFYRRIIYFVER+ND++D NSF WN
Subjt:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

XP_008451760.1 PREDICTED: uncharacterized protein LOC103492827 isoform X2 [Cucumis melo]

3.3e-233

76.82

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDISE DT+  LEHK KKRKQEQFD A E NN G+VCSG E ASS+D IL ENDP+PDAT+I+CSKLESETG++ P ICN EGNVH  EHNDD + S+D 
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDS-RVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHF
        DTEHENI+GS +LILN   VKQNVA  S+EM+EP+SMNAYKEDS  VSEDP   RDH+  D GN+  V QEL+KEMID  KD     HS EK SD  Y  
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDS-RVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHF

Query:  PCNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDA
        PCNEQEYE D SLK+ D+EQI+   GNN SEK V+  +EEASV C+VG E+DDE STSKE I+STPSC+PP  ENA+T K  EEVVCF+ASGETS  ++A
Subjt:  PCNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDA

Query:  IIEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLK
        + EE  P LVLDTSEKGDSIGS+RKKLLVLDVNGLLADFICYVP GYKPDIII QKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGD +
Subjt:  IIEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLK

Query:  QKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAE
        +KLLFCWDQSHCTDTTFSTVEN HKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRV+LEGLS+AE
Subjt:  QKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAE

Query:  NVQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        NVQKYVEQN FGQRPITEKN SWKFYRRIIYFVER+ND++++N F+WN
Subjt:  NVQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

XP_022137426.1 uncharacterized protein LOC111008876 [Momordica charantia]

0.0e+00

99.82

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVG+VCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN
        DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN

Query:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE
        EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE
Subjt:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE

Query:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL
        ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL
Subjt:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL

Query:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ
        LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ
Subjt:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ

Query:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
Subjt:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

XP_031738119.1 uncharacterized protein LOC101203219 isoform X2 [Cucumis sativus]

2.6e-233

76.42

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDIS  DT+  LEHK KKRKQEQFD A E NN G+VCSG E ASSMD IL E DP+PDAT+++CSKLESETG++ P ICN +GNVH KEHNDD + SKD 
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFP
        DTE+ENINGS +LILN  +VKQNVA YS+EMEEPSSMNAYKEDS +SEDP   R H+  D GN+  V QEL+KEMID  KD     HS EK SD DY  P
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFP

Query:  CNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAI
        CNE EY+ D SLK+ D+EQIN   GNN SEK V+  +EEASVCC+ G E+DDE ST KE I+STPSC+PP  ENA+T K  EEVVCF+ SGETS  ++A+
Subjt:  CNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAI

Query:  IEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQ
         EE  P LVLDTSEKGDSIGS+ KKLLVLDVNGLLADFICYVP GYKPDIII QKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLM D ++
Subjt:  IEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQ

Query:  KLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAEN
        KLLFCWDQSHCTDTTFSTVEN HKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRV+LEGLS+AEN
Subjt:  KLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAEN

Query:  VQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        VQKYVEQN FGQRPITEKN SWKFYRRIIYFVER+ND+++ NSF+WN
Subjt:  VQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

XP_038894827.1 uncharacterized protein LOC120083233 isoform X1 [Benincasa hispida]

1.8e-242

78.9

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDISE DT   LEHK KKRKQEQFD   E NN+G+V SGS++  SMD ILSENDPA DA  IICSKLESETG++ P ICN +GNVHGKEHNDD + SKDM
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN
        DTEH+NING  +LILNT +VK+NVARYS+E+EEPSSMNAYKEDS +SEDP    DHDDHGN+  V QEL+KEMID  KD     HS EK SD  YH PCN
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN

Query:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE
        E+E E D SLK+S++EQIN   GNN SEK V+ A+EE SVCC+V  E+DDETSTSKE I+STP C+PPE ENA+T KEE   VCFSASGETS  +DAI E
Subjt:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE

Query:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL
        E  P LVLDTSEKGDSIG SRKKLLVLDVNGLLADFI YVP GYKPDI+IGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGD ++KL
Subjt:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL

Query:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ
        LFCWDQSHCTDTTFSTVEN HKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRV+LEGLS+AENVQ
Subjt:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ

Query:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        KYVEQN FGQRPITEKN SWKFYRRIIYFVER+ND++DTNSFKWN
Subjt:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LSV7 FCP1 homology domain-containing protein

1.2e-233

76.42

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDIS  DT+  LEHK KKRKQEQFD A E NN G+VCSG E ASSMD IL E DP+PDAT+++CSKLESETG++ P ICN +GNVH KEHNDD + SKD 
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFP
        DTE+ENINGS +LILN  +VKQNVA YS+EMEEPSSMNAYKEDS +SEDP   R H+  D GN+  V QEL+KEMID  KD     HS EK SD DY  P
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFP

Query:  CNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAI
        CNE EY+ D SLK+ D+EQIN   GNN SEK V+  +EEASVCC+ G E+DDE ST KE I+STPSC+PP  ENA+T K  EEVVCF+ SGETS  ++A+
Subjt:  CNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAI

Query:  IEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQ
         EE  P LVLDTSEKGDSIGS+ KKLLVLDVNGLLADFICYVP GYKPDIII QKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLM D ++
Subjt:  IEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQ

Query:  KLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAEN
        KLLFCWDQSHCTDTTFSTVEN HKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRV+LEGLS+AEN
Subjt:  KLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAEN

Query:  VQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        VQKYVEQN FGQRPITEKN SWKFYRRIIYFVER+ND+++ NSF+WN
Subjt:  VQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

A0A1S3BRN0 uncharacterized protein LOC103492827 isoform X2

1.6e-233

76.82

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDISE DT+  LEHK KKRKQEQFD A E NN G+VCSG E ASS+D IL ENDP+PDAT+I+CSKLESETG++ P ICN EGNVH  EHNDD + S+D 
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDS-RVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHF
        DTEHENI+GS +LILN   VKQNVA  S+EM+EP+SMNAYKEDS  VSEDP   RDH+  D GN+  V QEL+KEMID  KD     HS EK SD  Y  
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDS-RVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHF

Query:  PCNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDA
        PCNEQEYE D SLK+ D+EQI+   GNN SEK V+  +EEASV C+VG E+DDE STSKE I+STPSC+PP  ENA+T K  EEVVCF+ASGETS  ++A
Subjt:  PCNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDA

Query:  IIEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLK
        + EE  P LVLDTSEKGDSIGS+RKKLLVLDVNGLLADFICYVP GYKPDIII QKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGD +
Subjt:  IIEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLK

Query:  QKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAE
        +KLLFCWDQSHCTDTTFSTVEN HKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRV+LEGLS+AE
Subjt:  QKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAE

Query:  NVQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        NVQKYVEQN FGQRPITEKN SWKFYRRIIYFVER+ND++++N F+WN
Subjt:  NVQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

A0A5D3BIK1 Putative C-terminal domain small phosphatase isoform X2

1.6e-233

76.82

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDISE DT+  LEHK KKRKQEQFD A E NN G+VCSG E ASS+D IL ENDP+PDAT+I+CSKLESETG++ P ICN EGNVH  EHNDD + S+D 
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDS-RVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHF
        DTEHENI+GS +LILN   VKQNVA  S+EM+EP+SMNAYKEDS  VSEDP   RDH+  D GN+  V QEL+KEMID  KD     HS EK SD  Y  
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDS-RVSEDPSSRRDHD--DHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHF

Query:  PCNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDA
        PCNEQEYE D SLK+ D+EQI+   GNN SEK V+  +EEASV C+VG E+DDE STSKE I+STPSC+PP  ENA+T K  EEVVCF+ASGETS  ++A
Subjt:  PCNEQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDA

Query:  IIEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLK
        + EE  P LVLDTSEKGDSIGS+RKKLLVLDVNGLLADFICYVP GYKPDIII QKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGD +
Subjt:  IIEENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLK

Query:  QKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAE
        +KLLFCWDQSHCTDTTFSTVEN HKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRV+LEGLS+AE
Subjt:  QKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAE

Query:  NVQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        NVQKYVEQN FGQRPITEKN SWKFYRRIIYFVER+ND++++N F+WN
Subjt:  NVQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

A0A6J1C778 uncharacterized protein LOC111008876

0.0e+00

99.82

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVG+VCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN
        DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN

Query:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE
        EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE
Subjt:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE

Query:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL
        ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL
Subjt:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL

Query:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ
        LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ
Subjt:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ

Query:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
Subjt:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

A0A6J1KFT0 uncharacterized protein LOC111495396 isoform X2

1.0e-211

72.66

Show/hide

Query:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM
        MD+SE DT+  LEHK KKRKQEQFD AP  NN+ +V SGSE+ASSMD ILSEND A  A  IICSKLESET +    +C    NVH K+ +DD + S+DM
Subjt:  MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDM

Query:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN
         TEH NINGS +LI            YS+EMEEPSSM+ YK +S +SED    R+HDDH NV  V +EL++E ID  KD    +HS E+ SD   +FPC 
Subjt:  DTEHENINGSASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCN

Query:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE
        EQE ERD SLK+S +EQING              +EEASV  +VG E+DDETSTSKE I STP C+PPE +NA+TVK  EEVVCFS SGETS  +DAIIE
Subjt:  EQEYERDDSLKTSDIEQINGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIE

Query:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL
        E  P LVLDTSEKGDSIG SRKKLLVLDVNGLLADFICYVPYGYKPD++IGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDM IDFLMGD +QKL
Subjt:  ENAPLLVLDTSEKGDSIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKL

Query:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ
        LFCWDQS CTDTTFSTVEN HKPLVLK+IKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRD  DTSLGPGGDLRVYLEGLS+AENVQ
Subjt:  LFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQ

Query:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN
        KYVE+NPFGQRPITEKN SWKFYRRIIYFVER+ND++DTNSF WN
Subjt:  KYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

SwissProt top hits

e value

%identity

Alignment

O94336 Uncharacterized FCP1 homology domain-containing protein C1271.03c

4.8e-09

24.62

Show/hide

Query:  SSRKKLLVLDVNGLLADFIC-YVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQK-LLFCWDQSHCTDTTFST
        +  +KL++LD+NG L   +C  +    +  +    +    RP   +F+K+ F  F V V+SS    NV  ++  +M + ++K L+ CW +    D   + 
Subjt:  SSRKKLLVLDVNGLLADFIC-YVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQK-LLFCWDQSHCTDTTFST

Query:  VENMHKPLVLKEIKKLWKYL------KPREFNASNTLLLDDSPHKALCNPAN-TAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQNPF
         +   K    K +  +W+ +      KP  ++  NT+++DDS  K   +P N  A+     +        +     +R YL+ L    NV  Y+ + PF
Subjt:  VENMHKPLVLKEIKKLWKYL------KPREFNASNTLLLDDSPHKALCNPAN-TAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQNPF

Q9XYL0 Probable C-terminal domain small phosphatase

9.1e-08

28.65

Show/hide

Query:  KLLVLDVNGLLADFICYVPYGYKPDII--------IGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTTF
        K LVLD++  L     + P  + PD I        I Q  V KRPF DDF++   E+FE+ V+++   +  D V+DFL  D  + + +   +  C     
Subjt:  KLLVLDVNGLLADFICYVPYGYKPDII--------IGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTTF

Query:  STVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQN
            + HK   +K++ +L + LK       +T+++D+SP   L +P N    P+   F D  D  L    DL   L+ L   E+V+  ++++
Subjt:  STVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQN

Arabidopsis top hits

e value

%identity

Alignment

AT2G36540.1 Haloacid dehalogenase-like hydrolase (HAD) superfamily protein

1.2e-39

39.44

Show/hide

Query:  SSRKKLLVLDVNGLLADFI-----CYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTT
        + +KKLLVL ++GLL   +        P    PD   G   V+KRPF ++F+KFC ERFEVG+WSS            L+  L   +L       CTD+ 
Subjt:  SSRKKLLVLDVNGLLADFI-----CYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTT

Query:  FSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQNPFGQRPI
        + T+EN +KPL  K++ K++K  K   F+ASNT+ +DD P+KAL NP NT +FP++Y   ++ D  L P G+L  YLEGL+ + +VQ Y++ + FG+  I
Subjt:  FSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQNPFGQRPI

Query:  TEKNLSWKFYRRI
           +  W FY  +
Subjt:  TEKNLSWKFYRRI

AT2G36550.1 CONTAINS InterPro DOMAIN/s: NLI interacting factor (InterPro:IPR004274)

9.0e-27

42.62

Show/hide

Query:  DQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVE
        DQ  CTD+ + T+EN  KPL  K++ K+++  K   F+ASNT+ +++ P+KAL NP NT +FP++Y   D  D  L P G+   YL+GL+ + +VQ Y++
Subjt:  DQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPREFNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVE

Query:  QNPFGQRPITEKNLSWKFYRRI
        ++PFGQ  I   +L W +YRR+
Subjt:  QNPFGQRPITEKNLSWKFYRRI

AT3G29760.1 Haloacid dehalogenase-like hydrolase (HAD) superfamily protein

8.1e-44

40.47

Show/hide

Query:  NGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIEENAPLLVLDTSEKGDSIG
        N +C  +  E   K+  +E SV   V   ++DE    K    +  SC+   +E  +  +E   +    +S E S     ++E N   +V       +S+ 
Subjt:  NGACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIEENAPLLVLDTSEKGDSIG

Query:  SSRKKLLVLDVNGLLADFICYVPYGYKP-DIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTTFSTV
          RKKLLVLD+NGLLAD +   P    P DI IG++A+FKRPFCD+F++FCF++FEVG+WSSR + NV  + +FL+GDLK KLLFCWD S+C  T+  ++
Subjt:  SSRKKLLVLDVNGLLADFICYVPYGYKP-DIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTTFSTV

Query:  ENMHKPLVLKEIKKLWKYLKPR------EFNASNTLLLDDSPHKALCNPANTAIFPV
        EN +K +V K++ +LW+   PR      ++N +NT+LLDDSP+KAL NP  + I  +
Subjt:  ENMHKPLVLKEIKKLWKYLKPR------EFNASNTLLLDDSPHKALCNPANTAIFPV

AT4G26190.1 Haloacid dehalogenase-like hydrolase (HAD) superfamily protein

3.2e-56

40.89

Show/hide

Query:  EENADTVKEEEEVVCFSASGETSISMDAIIEENAPLLVLDTSEKGD-----SIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDF
        +++    +++EE        ETS+S   +I+ +     + +SE GD           +KL++ D+NG+LAD +      + PD  +  ++VF+RPF   F
Subjt:  EENADTVKEEEEVVCFSASGETSISMDAIIEENAPLLVLDTSEKGD-----SIGSSRKKLLVLDVNGLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDF

Query:  IKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYL------KPREFNASNTLLLDDSPHKALC
        + FCFERF+V +WSSR R  +D +I+ +M +  + LLFC+DQ+ CT T F T E   KPL LK+++++W ++        R+++ +NTLL+DDSP KALC
Subjt:  IKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYL------KPREFNASNTLLLDDSPHKALC

Query:  NPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQNPFGQRPITEKNLSWKFYRRII
        NP +T IFP  Y++ +  D++LGP G+LR YLE L+ AENVQK+V +NPFGQ  ITE + SW+FY + +
Subjt:  NPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQNPFGQRPITEKNLSWKFYRRII

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATATTTCAGAGTCTGATACAAGTCGAGACTTGGAGCACAAAACGAAAAAGAGAAAGCAAGAACAGTTTGATACTGCTCCTGAAGTTAACAATGTGGGCACTGTTTG
TTCTGGTTCTGAAAATGCGTCTTCAATGGATAATATCCTGTCTGAAAATGATCCAGCTCCAGATGCCACGATCATTATATGCTCAAAGTTGGAATCTGAAACAGGACAAT
CTCATCCAGTGATATGTAATCCGGAAGGAAATGTTCATGGAAAGGAGCATAACGATGACCATGAATTTTCAAAGGATATGGATACAGAGCATGAAAATATAAATGGTTCT
GCGAGTCTTATCCTGAATACAGTAGATGTAAAACAAAATGTTGCTAGATATAGTATTGAAATGGAAGAGCCGAGTTCCATGAATGCTTACAAAGAAGACTCTAGGGTCTC
TGAAGATCCAAGTTCTAGGAGAGATCACGATGATCATGGAAACGTAGCCATTGTTCCCCAAGAACTGACCAAGGAAATGATAGATGGGACAAAGGATGCATGTATAATTC
ATCATTCTACAGAGAAAGCCTCCGACTCTGATTATCATTTTCCATGTAACGAGCAGGAATATGAGAGGGATGATTCATTGAAAACTTCAGATATAGAACAGATAAATGGT
GCATGTGGTAATAATGTCTCAGAGAAGTTTGTGAAAGATGCCATGGAGGAAGCTTCTGTTTGCTGTACAGTTGGGGAGGAGAATGATGATGAAACTTCAACAAGCAAGGA
GCAGATTATATCAACTCCTTCCTGCATGCCTCCTGAAGAAGAAAATGCTGATACTGTGAAGGAAGAAGAAGAAGTTGTATGTTTCTCAGCTTCTGGTGAAACAAGCATCA
GTATGGATGCTATTATTGAAGAGAACGCTCCATTGTTGGTATTGGATACTTCAGAGAAAGGAGATTCTATTGGTTCTTCAAGGAAAAAGCTTCTTGTTCTTGATGTAAAT
GGACTGCTTGCAGATTTTATTTGTTACGTTCCTTATGGGTATAAGCCAGATATAATAATAGGACAAAAAGCAGTATTCAAGAGGCCATTTTGTGATGATTTTATAAAGTT
TTGTTTTGAAAGATTCGAGGTGGGTGTTTGGTCATCAAGAACCCGGAGAAATGTCGACATGGTGATAGATTTTCTAATGGGAGACTTAAAACAAAAATTACTCTTTTGCT
GGGATCAATCACATTGTACCGATACCACATTCTCTACCGTTGAGAACATGCACAAGCCTCTAGTTTTGAAGGAAATTAAAAAGCTGTGGAAATACCTTAAGCCACGAGAG
TTTAATGCATCAAACACTCTATTGTTGGATGATTCTCCACACAAGGCATTGTGCAATCCGGCAAACACTGCAATATTTCCTGTAACGTATCGGTTTAGGGATGTTGCCGA
TACATCGTTAGGACCTGGAGGCGATCTTCGAGTTTATTTGGAAGGCTTATCAGTGGCAGAAAACGTTCAAAAATATGTCGAACAGAATCCTTTTGGTCAACGTCCCATTA
CAGAAAAGAACCTGTCTTGGAAGTTTTATCGACGAATCATATATTTTGTCGAGCGCCAAAACGATCGGGACGATACCAATTCTTTCAAATGGAAC

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDISESDTSRDLEHKTKKRKQEQFDTAPEVNNVGTVCSGSENASSMDNILSENDPAPDATIIICSKLESETGQSHPVICNPEGNVHGKEHNDDHEFSKDMDTEHENINGS
ASLILNTVDVKQNVARYSIEMEEPSSMNAYKEDSRVSEDPSSRRDHDDHGNVAIVPQELTKEMIDGTKDACIIHHSTEKASDSDYHFPCNEQEYERDDSLKTSDIEQING
ACGNNVSEKFVKDAMEEASVCCTVGEENDDETSTSKEQIISTPSCMPPEEENADTVKEEEEVVCFSASGETSISMDAIIEENAPLLVLDTSEKGDSIGSSRKKLLVLDVN
GLLADFICYVPYGYKPDIIIGQKAVFKRPFCDDFIKFCFERFEVGVWSSRTRRNVDMVIDFLMGDLKQKLLFCWDQSHCTDTTFSTVENMHKPLVLKEIKKLWKYLKPRE
FNASNTLLLDDSPHKALCNPANTAIFPVTYRFRDVADTSLGPGGDLRVYLEGLSVAENVQKYVEQNPFGQRPITEKNLSWKFYRRIIYFVERQNDRDDTNSFKWN

MS004000 (gene) of Bitter gourd (TR) v1 genome