CuGenDBv2

Gene ID	Clc05G06400
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	OBERON-like protein isoform X1
Genome location	ClcChr05:4721696..4726726
RNA-Seq Expression	Clc05G06400
Synteny	Clc05G06400
Gene Ontology terms	GO:0005634 - nucleus (cellular component)
InterPro domains	IPR032881 - Oberon, PHD finger domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0049358.1 protein OBERON 1-like isoform X2 [Cucumis melo var. makuwa]

2.1e-255

91.08

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        M+GDPV+T+VLEDTNGC+    KNELILRPVSQDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNAD+DAFFASFSWKIPAKKSSLAQGI+VKQI CPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADCRDD+EEIL+LG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IEL+IEK+K+G CLEEIWKMEEDSSANCTDAPD ADSTE SH+TS SIISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLLLHKNYLHNLFQQL+KEQTELRHQT ST QNAV+NRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

XP_008438665.1 PREDICTED: uncharacterized protein LOC103483705 isoform X1 [Cucumis melo]

2.1e-255

90.87

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        M+GDPV+T+VLEDTNGC+    KNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNAD+DAFFASFSWKIPAKKSSLAQGI+VKQI CPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADCRDD+EEIL+LG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IEL+IEK+K+G CLEEIWKMEEDSSANCTDAPD ADSTE SH+TS SIISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLLLHKNYLHNLFQQL+KEQTELRHQT ST QNAV+NRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

XP_008438666.1 PREDICTED: uncharacterized protein LOC103483705 isoform X2 [Cucumis melo]

2.1e-255

90.87

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        M+GDPV+T+VLEDTNGC+    KNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNAD+DAFFASFSWKIPAKKSSLAQGI+VKQI CPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADCRDD+EEIL+LG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IEL+IEK+K+G CLEEIWKMEEDSSANCTDAPD ADSTE SH+TS SIISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLLLHKNYLHNLFQQL+KEQTELRHQT ST QNAV+NRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

XP_038897111.1 protein OBERON 4-like isoform X1 [Benincasa hispida]

7.2e-256

93.15

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        MSGDPVE  VLEDTNG  PRA KNEL LRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIG SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNADIDAFFASFSWKIPAKKSSLAQG +VKQI  PLPSKE+EECSASESQ  RVGCKAGNKNC SLSVA+NPSS KSMSCDICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILCSKIIDTT ESYSYIKCKA+VGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQS QSADCRDDIEEILSLGFCIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IELNIEKLKSGTCLEEI KME DSSAN TDAPDNA STEGSHD SDS ISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEE LLLHKNYLHNLFQQL+KEQTELRHQTSST QNA+TNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

XP_038897148.1 protein OBERON 2-like isoform X2 [Benincasa hispida]

4.0e-254

92.95

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        MSGDPVE  VLEDTNG  PRA KNEL LRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIG SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNADIDAFFASFSWKIPAKKSSLAQG +VKQI  PLPSKE+EECSASESQ  RVGCKAGNKNC SLSVA+NPSS KSMSCDICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILCSKIIDTT ESYSYIKCKA+VGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQS QSADCRDDIEEILSLGFCIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IELNIEKLKSGTCLEEI KME DSSAN  DAPDNA STEGSHD SDS ISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEE LLLHKNYLHNLFQQL+KEQTELRHQTSST QNA+TNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

TrEMBL top hits

e value

%identity

Alignment

A0A0A0L5I4 PHD_Oberon domain-containing protein

9.2e-249

88.38

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        MSG+P +T+VLEDTNGC+    KNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKG  FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNAD++AFFASFSWKIPAKKSS AQG +VK I C LPSK++EECSAS SQ D+VGCKAGNKNC SLSV+ENPSS KSMSC ICCSE RFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILC KIIDTT ESYSYIKCKAVVGDGYICGH +HIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADC+DD+EEIL+LG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IEL+IEK+K+GTCLE+IWKMEEDSSANCTDAPD ADSTE SH+TSDS+ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLLLHKNYLHNLFQQL+KEQTELRHQ  ST QNAV+NRVDQIKREVKRLKRMEK+ADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

A0A1S3AWZ1 uncharacterized protein LOC103483705 isoform X2

1.0e-255

90.87

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        M+GDPV+T+VLEDTNGC+    KNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNAD+DAFFASFSWKIPAKKSSLAQGI+VKQI CPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADCRDD+EEIL+LG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IEL+IEK+K+G CLEEIWKMEEDSSANCTDAPD ADSTE SH+TS SIISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLLLHKNYLHNLFQQL+KEQTELRHQT ST QNAV+NRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

A0A1S4DSZ4 uncharacterized protein LOC103483705 isoform X1

1.0e-255

90.87

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        M+GDPV+T+VLEDTNGC+    KNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNAD+DAFFASFSWKIPAKKSSLAQGI+VKQI CPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADCRDD+EEIL+LG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IEL+IEK+K+G CLEEIWKMEEDSSANCTDAPD ADSTE SH+TS SIISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLLLHKNYLHNLFQQL+KEQTELRHQT ST QNAV+NRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

A0A5D3D0Q3 Protein OBERON 1-like isoform X2

1.0e-255

91.08

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        M+GDPV+T+VLEDTNGC+    KNELILRPVSQDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKGH FASKLSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPNAD+DAFFASFSWKIPAKKSSLAQGI+VKQI CPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADCRDD+EEIL+LG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKEL R+IEL+IEK+K+G CLEEIWKMEEDSSANCTDAPD ADSTE SH+TS SIISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLLLHKNYLHNLFQQL+KEQTELRHQT ST QNAV+NRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNAVTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

A0A6J1ITE5 OBERON-like protein isoform X1

3.3e-246

87.65

Show/hide

Query:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER
        MSGDPVET+VL D NGC P+  KN+LILRPVSQDESGEGLPYAPENWPN GDNWSWRVG+RVAITGHF DRYLYSPRGIG S NS+R+GHGFAS+LSVER
Subjt:  MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVER

Query:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFP+AD+DAFFASFSWKIPAKKSSLAQG ++KQISCPLPSKE EECSAS+SQIDRV CKAGNKNCNSLSVAE PS LKSMSCDICCSEP+FCRDCC
Subjt:  YIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL
        CILCSK IDTT ES SYIKCKA+VGDGYICGHHAHIKCGLKSY AGTVGG IGLDAEYYCRRCDARTDLVSHVERFLQ CQS DCRDDI EILSLG CIL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCIL

Query:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGS KMRAKEL R+ +LNI KLK+GTCLEE+WKMEEDSSANCTDAPDNADSTEGSHD SDSIISSEWT+STPFDHWIESLKLE+EIDQVLQ LK+SQEFE
Subjt:  RGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNA----VTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        YNLAEEKLL HKNYLHNLFQQLDKEQ EL HQ+SST QN     VTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
Subjt:  YNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNA----VTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G05410.1 Protein of unknown function (DUF1423)

1.2e-120

49.13

Show/hide

Query:  LILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGI-GTSENSARKGHGFASKLSVERYIQSEFPNADIDAFFASFSWKIPA
        L+LRPVS  ESGEGLPYAPENWPNPGD W W+VG R++  G+F+DRYLY P+ + G      RK   F S+LS++RYI+  FP AD+  FFASFSW IP 
Subjt:  LILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGI-GTSENSARKGHGFASKLSVERYIQSEFPNADIDAFFASFSWKIPA

Query:  KKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVV
        +     QG+ + Q    LP    +E    +   D   CKAGN+ C SL       +L +M CDICC E +FC DCCCILC K+I      YSYIKC+AVV
Subjt:  KKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVV

Query:  GDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCILRGSHKMRAKELFRNIELNIEKLKS
         +G+ICGH AH+ C L++Y AGT+GGS+GLD EYYCRRCDA+ DL  HV +FL+ CQ+ + + D+E+IL+LG CILRG+ +  AKEL   IE  + KLK 
Subjt:  GDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCILRGSHKMRAKELFRNIELNIEKLKS

Query:  GTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLDK
        GT LE++W   +D+    +D  D+ ++ E  +DT  S+         PF+H  E  KLE+EI +VL+ L+++QEFEY +AE KL   K  L +L++QL+K
Subjt:  GTCLEEIWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLDK

Query:  EQTELRHQTSSTEQNA----VTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE
        E++EL  + S T+ N+    V  R+DQI++EV +LK ME+VA GFG TP+ +L+E F L++E
Subjt:  EQTELRHQTSSTEQNA----VTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

AT1G05410.2 Protein of unknown function (DUF1423)

2.0e-102

46.74

Show/hide

Query:  VGKRVAITGHFLDRYLYSPRGI-GTSENSARKGHGFASKLSVERYIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQ
        VG R++  G+F+DRYLY P+ + G      RK   F S+LS++RYI+  FP AD+  FFASFSW IP +     QG+ + Q    LP    +E    +  
Subjt:  VGKRVAITGHFLDRYLYSPRGI-GTSENSARKGHGFASKLSVERYIQSEFPNADIDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQ

Query:  IDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDA
         D   CKAGN+ C SL       +L +M CDICC E +FC DCCCILC K+I      YSYIKC+AVV +G+ICGH AH+ C L++Y AGT+GGS+GLD 
Subjt:  IDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDA

Query:  EYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCILRGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSH
        EYYCRRCDA+ DL  HV +FL+ CQ+ + + D+E+IL+LG CILRG+ +  AKEL   IE  + KLK GT LE++W   +D+    +D  D+ ++ E  +
Subjt:  EYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCILRGSHKMRAKELFRNIELNIEKLKSGTCLEEIWKMEEDSSANCTDAPDNADSTEGSH

Query:  DTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNA----VTNRVDQIKREV
        DT  S+         PF+H  E  KLE+EI +VL+ L+++QEFEY +AE KL   K  L +L++QL+KE++EL  + S T+ N+    V  R+DQI++EV
Subjt:  DTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNA----VTNRVDQIKREV

Query:  KRLKRMEKVADGFGMTPKDILKEDFDLDVE
         +LK ME+VA GFG TP+ +L+E F L++E
Subjt:  KRLKRMEKVADGFGMTPKDILKEDFDLDVE

AT3G22520.1 unknown protein

2.0e-22

51.58

Show/hide

Query:  PVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVERYIQSEFPNADIDAFFASFSWKIPA
        PVS   +G+GLPYAP +WP+PGD W+WRVG+RV   G+  DR+L  P+ +            FASK  + RY++S+FP  D DAFFASFSWK+PA
Subjt:  PVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVERYIQSEFPNADIDAFFASFSWKIPA

AT4G14840.1 unknown protein

1.4e-18

41.8

Show/hide

Query:  GDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVERYI
        GD  + KV  D +  T     N+L   P +   SG+GLP+AP ++P+PGD W+WRVG+RV   G   DR L  P  +            FASK ++ RY+
Subjt:  GDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVERYI

Query:  QSEFPNADIDAFFASFSWKIPA
        ++ FP+ D +AFFASF+W IPA
Subjt:  QSEFPNADIDAFFASFSWKIPA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCGGGGGATCCTGTGGAGACTAAAGTTCTTGAGGATACAAATGGCTGTACACCTAGGGCGAAGAAAAATGAACTGATCCTTAGGCCAGTTTCTCAAGATGAATCTGG
GGAGGGCTTGCCATATGCTCCTGAAAATTGGCCCAATCCTGGTGATAACTGGAGTTGGAGGGTGGGGAAGAGAGTTGCTATAACTGGCCATTTTCTGGATAGGTACCTTT
ATTCTCCTCGTGGTATTGGCACTTCTGAGAACTCAGCTCGTAAAGGGCATGGTTTTGCAAGCAAGCTTTCAGTTGAAAGATATATCCAGTCTGAGTTTCCCAATGCAGAC
ATTGATGCATTTTTTGCCTCATTCAGTTGGAAGATACCAGCAAAAAAGTCATCTTTAGCGCAAGGTATTCAAGTAAAACAAATTTCATGCCCTCTACCTTCAAAAGAGAT
GGAAGAATGCTCTGCATCTGAGTCCCAGATTGATAGAGTGGGTTGCAAGGCTGGAAATAAGAACTGTAATAGTTTATCTGTTGCAGAGAATCCATCTTCATTAAAATCCA
TGTCCTGTGATATTTGCTGCAGCGAACCTCGGTTTTGCCGTGATTGCTGCTGTATACTATGCAGCAAGATTATAGACACGACCACAGAAAGTTATAGCTACATAAAATGT
AAAGCAGTGGTGGGTGATGGTTATATTTGTGGACATCATGCTCATATAAAATGTGGTCTTAAATCATATACAGCTGGGACAGTTGGAGGAAGCATTGGATTGGATGCTGA
GTATTATTGTCGACGTTGTGATGCCAGAACGGATTTGGTATCACATGTAGAAAGATTTTTGCAGTCATGTCAATCAGCTGACTGTCGAGATGATATTGAGGAGATCTTAA
GCCTTGGTTTCTGCATTTTGCGTGGTTCACACAAAATGAGAGCAAAGGAGCTGTTTAGAAATATTGAATTGAACATTGAAAAGCTTAAATCTGGGACTTGCTTGGAAGAG
ATTTGGAAGATGGAGGAAGACAGCTCAGCGAATTGCACTGATGCACCTGATAATGCTGATTCTACAGAAGGTTCTCATGACACTTCAGACTCCATTATAAGCTCAGAATG
GACTATGTCCACCCCTTTTGATCATTGGATTGAGTCCCTAAAACTTGAAGACGAGATTGATCAGGTTTTGCAGGGACTGAAAAGATCACAAGAGTTCGAGTATAATTTGG
CAGAAGAAAAGCTTCTGTTACATAAAAATTATCTACATAATCTCTTTCAGCAACTTGACAAGGAGCAAACTGAACTCAGACATCAAACATCATCAACGGAACAAAATGCC
GTAACAAACAGAGTGGACCAAATAAAACGAGAAGTAAAGAGACTCAAGAGAATGGAAAAGGTTGCTGATGGATTTGGAATGACTCCAAAAGATATCCTCAAGGAGGACTT
CGATTTGGATGTTGAGTAG

mRNA sequence

Show/hide mRNA sequence

CAGTACTTCGTCGGTCCATCAAAGGCGTCGAGCCTCCTTTTTCTTCCCGTTGTGCGGCGGAAAGAACCTTTTTCTCGATTTCCTATGCTTCGGCATTCGTTCTTGTGCAG
CATCTTCTCATTCCCGCGAAAAAATTCATCTGCTTAATCTCTCTACTTTCTCATTCTCTCTAGTTTCTCTACAACATTAAGAGACGACTACTGGACAGAGAAAACCCTAA
AGTTCTCTGGATGTCTTATTAAATTCTTCGAGCGAGGAAAAAAAAAGTATTGCCTATGCTTATAGGTTCGTTCATCAACCATTGTTAGATGTCGGGGGATCCTGTGGAGA
CTAAAGTTCTTGAGGATACAAATGGCTGTACACCTAGGGCGAAGAAAAATGAACTGATCCTTAGGCCAGTTTCTCAAGATGAATCTGGGGAGGGCTTGCCATATGCTCCT
GAAAATTGGCCCAATCCTGGTGATAACTGGAGTTGGAGGGTGGGGAAGAGAGTTGCTATAACTGGCCATTTTCTGGATAGGTACCTTTATTCTCCTCGTGGTATTGGCAC
TTCTGAGAACTCAGCTCGTAAAGGGCATGGTTTTGCAAGCAAGCTTTCAGTTGAAAGATATATCCAGTCTGAGTTTCCCAATGCAGACATTGATGCATTTTTTGCCTCAT
TCAGTTGGAAGATACCAGCAAAAAAGTCATCTTTAGCGCAAGGTATTCAAGTAAAACAAATTTCATGCCCTCTACCTTCAAAAGAGATGGAAGAATGCTCTGCATCTGAG
TCCCAGATTGATAGAGTGGGTTGCAAGGCTGGAAATAAGAACTGTAATAGTTTATCTGTTGCAGAGAATCCATCTTCATTAAAATCCATGTCCTGTGATATTTGCTGCAG
CGAACCTCGGTTTTGCCGTGATTGCTGCTGTATACTATGCAGCAAGATTATAGACACGACCACAGAAAGTTATAGCTACATAAAATGTAAAGCAGTGGTGGGTGATGGTT
ATATTTGTGGACATCATGCTCATATAAAATGTGGTCTTAAATCATATACAGCTGGGACAGTTGGAGGAAGCATTGGATTGGATGCTGAGTATTATTGTCGACGTTGTGAT
GCCAGAACGGATTTGGTATCACATGTAGAAAGATTTTTGCAGTCATGTCAATCAGCTGACTGTCGAGATGATATTGAGGAGATCTTAAGCCTTGGTTTCTGCATTTTGCG
TGGTTCACACAAAATGAGAGCAAAGGAGCTGTTTAGAAATATTGAATTGAACATTGAAAAGCTTAAATCTGGGACTTGCTTGGAAGAGATTTGGAAGATGGAGGAAGACA
GCTCAGCGAATTGCACTGATGCACCTGATAATGCTGATTCTACAGAAGGTTCTCATGACACTTCAGACTCCATTATAAGCTCAGAATGGACTATGTCCACCCCTTTTGAT
CATTGGATTGAGTCCCTAAAACTTGAAGACGAGATTGATCAGGTTTTGCAGGGACTGAAAAGATCACAAGAGTTCGAGTATAATTTGGCAGAAGAAAAGCTTCTGTTACA
TAAAAATTATCTACATAATCTCTTTCAGCAACTTGACAAGGAGCAAACTGAACTCAGACATCAAACATCATCAACGGAACAAAATGCCGTAACAAACAGAGTGGACCAAA
TAAAACGAGAAGTAAAGAGACTCAAGAGAATGGAAAAGGTTGCTGATGGATTTGGAATGACTCCAAAAGATATCCTCAAGGAGGACTTCGATTTGGATGTTGAGTAGAGA
CACAAGCACAAACATATGATGTCTCACAAAATTTCACTGAATTTTGTTGGTTCATTTAGCCTTATATGGGTTTTTGTAGTTTTTACTGTGTATCATATGGCCTCACATGA
GGCTGAGTGTATGATATCGAGGTTTTAATTGGTTTATGAAGATAGCTGGATTCAGGAAGCAAAATACTGAACCTATGCAGTTGCGGAGCTGCCAGAAGGAATGTAGAGTA
GAGAGATTTTGGTCTATTGGAAACTAACCCTCTGCAACAAGTTTTCACGATAAACTTCCTCGTTCCCATTGGTCGCTTGACGGATTGCTTTTTATGGCTTCTGTGGAGCT
CAGTAGGGATCCAGTCTGTCTGGTTCAGACTTCTTATCACTAAATGCAGAAGAGAGGATGATGATGATGATTGTTGCACCTACTGTTGACGTGTGATTCTGTTCACGACA
AAAAAGGTCGGCTCCTTACTTTGTCATTTGGCTTTTCCATCCTTACGAATGTATTTTTGTAGTTGTCCTCTGAGACCGTAGTGATAATGCAAGTTTTTATTTTTCCCTCA
ACCAAGGACGTTATTAAGTTCCTTTTAGCTAGCTGTTTAATCAAAAAGCGATTTGTTTTTGGTATTCTCTTTCTTTTTTCCTTTTTATTACAGGCCTTTTGACTAGTTAT
AATTAGCCCCCAATAATGGCTAGGAAAATGCCTCCATAATGTGTGAATGAAGTCTCCTTATTTTTCTTAAATTTTATAAACTAAAAACTTAGCTGAATATGAAGCCAGGG
AAATCTAGTTTTGTGCTACGAAATAAAGAGTAAAGAGATCAACTTGGTTGTTGGATCCTCTTA

Protein sequence

Show/hide protein sequence

MSGDPVETKVLEDTNGCTPRAKKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGHGFASKLSVERYIQSEFPNAD
IDAFFASFSWKIPAKKSSLAQGIQVKQISCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKC
KAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCRDDIEEILSLGFCILRGSHKMRAKELFRNIELNIEKLKSGTCLEE
IWKMEEDSSANCTDAPDNADSTEGSHDTSDSIISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLDKEQTELRHQTSSTEQNA
VTNRVDQIKREVKRLKRMEKVADGFGMTPKDILKEDFDLDVE

Clc05G06400 (gene) of Watermelon (cordophanus) v2 genome