CuGenDBv2

Gene ID	Lsi05G016080
Organism	Lagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
Description	OBERON-like protein isoform X1
Genome location	chr05:23774298..23786545
RNA-Seq Expression	Lsi05G016080
Synteny	Lsi05G016080
Gene Ontology terms	GO:0005634 - nucleus (cellular component)
InterPro domains	IPR019398 - Pre-rRNA-processing protein TSR2 IPR032881 - Oberon, PHD finger domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0049358.1 protein OBERON 1-like isoform X2 [Cucumis melo var. makuwa]

7.6e-250

89.63

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        M+GDPV TEVLEDTNGC+   NKNELILRPVSQDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKG  FASKLSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPN D+DAFFASFSW+IPAKKSS AQGIRVKQIPCPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADC DD+EEI +LG  IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKELLRHIEL+IEK+KTG CLEEIWKMEEDSSANCTDAPD ADS + SH+TS S ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEEKLLLHKNYLHNLFQQLE    ELRHQT STGQNAV+NRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

KAE8650358.1 hypothetical protein Csa_010013 [Cucumis sativus]

8.3e-297

83.82

Show/hide

Query:  MESIDGLTSTNYKAGSVSSLQMAISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQVQY
        ME IDGLTSTNYKAGSVS+LQMAISSVFSRWDGLQMAIENQWGGRDSHQKSLNL SDVFSWFS SKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQ+  
Subjt:  MESIDGLTSTNYKAGSVSSLQMAISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQVQY

Query:  FGGPSKASSLLSLPVVRRQEPFTRLPMLWFVRQPFQMSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAI
                      +         L     + + F+MSG+P  TEVLEDTNGC+   NKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAI
Subjt:  FGGPSKASSLLSLPVVRRQEPFTRLPMLWFVRQPFQMSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAI

Query:  TGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKA
        TGHFLDRYLYSPRGI  SENSARKGQ FASKLSVERYIQSEFPN D++AFFASFSW+IPAKKSS AQG RVK IPC LPSK++EECSAS SQ D+VGCKA
Subjt:  TGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKA

Query:  GNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCD
        GNKNC SLSV+ENPSS KSMSC ICCSE RFCRDCCCILC KIIDTT ESYSYIKCKAVVGDGYICGH +HIKCGLKSYTAGTVGGSIGLDAEYYCRRCD
Subjt:  GNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCD

Query:  ARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRILRGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNIS
        ARTDLVSHVERFLQSCQSADC DD+EEI +LG  ILRGSHKMRAKELLRHIEL+IEK+KTG CLE+IWKMEEDSSANCTDAPD ADS + SH+TSDS IS
Subjt:  ARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRILRGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNIS

Query:  SEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADG
        SEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLE    ELRHQ  STGQNAV+NRVDQIK+EVKRLKRMEK+ADG
Subjt:  SEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADG

Query:  FGMTPKDILKEDFDLDVQ
        FGMTPKDILKEDFDLDV+
Subjt:  FGMTPKDILKEDFDLDVQ

XP_008438665.1 PREDICTED: uncharacterized protein LOC103483705 isoform X1 [Cucumis melo]

7.6e-250

89.42

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        M+GDPV TEVLEDTNGC+   NKNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKG  FASKLSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPN D+DAFFASFSW+IPAKKSS AQGIRVKQIPCPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADC DD+EEI +LG  IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKELLRHIEL+IEK+KTG CLEEIWKMEEDSSANCTDAPD ADS + SH+TS S ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEEKLLLHKNYLHNLFQQLE    ELRHQT STGQNAV+NRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

XP_008438666.1 PREDICTED: uncharacterized protein LOC103483705 isoform X2 [Cucumis melo]

7.6e-250

89.42

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        M+GDPV TEVLEDTNGC+   NKNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKG  FASKLSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPN D+DAFFASFSW+IPAKKSS AQGIRVKQIPCPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADC DD+EEI +LG  IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKELLRHIEL+IEK+KTG CLEEIWKMEEDSSANCTDAPD ADS + SH+TS S ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEEKLLLHKNYLHNLFQQLE    ELRHQT STGQNAV+NRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

XP_038897111.1 protein OBERON 4-like isoform X1 [Benincasa hispida]

4.9e-249

90.66

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        MSGDPV+  VLEDTNG  PRA+KNEL LRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIG SENSARKG  FASKLSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPN DIDAFFASFSW+IPAKKSS AQG RVKQIP PLPSKE+EECSASESQ  RVGCKAGNKNC SLSVA+NPSS KSMSCDICCSEPRFCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILCSKIIDTT ESYSYIKCKA+VGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQS QSADC DDIEEI SLGF IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKELLRHIELNIEKLK+G CLEEI KME DSSAN TDAPDNA S +GSHD SDS ISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEE LLLHKNYLHNLFQQLE    ELRHQTSSTGQNA+TNRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

TrEMBL top hits

e value

%identity

Alignment

A0A0A0L5I4 PHD_Oberon domain-containing protein

1.4e-246

87.6

Show/hide

Query:  FQMSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSV
        F+MSG+P  TEVLEDTNGC+   NKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKGQ FASKLSV
Subjt:  FQMSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSV

Query:  ERYIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRD
        ERYIQSEFPN D++AFFASFSW+IPAKKSS AQG RVK IPC LPSK++EECSAS SQ D+VGCKAGNKNC SLSV+ENPSS KSMSC ICCSE RFCRD
Subjt:  ERYIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRD

Query:  CCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFR
        CCCILC KIIDTT ESYSYIKCKAVVGDGYICGH +HIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADC DD+EEI +LG  
Subjt:  CCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFR

Query:  ILRGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQE
        ILRGSHKMRAKELLRHIEL+IEK+KTG CLE+IWKMEEDSSANCTDAPD ADS + SH+TSDS ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQE
Subjt:  ILRGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQE

Query:  FEYNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        FEYNLAEEKLLLHKNYLHNLFQQLE    ELRHQ  STGQNAV+NRVDQIK+EVKRLKRMEK+ADGFGMTPKDILKEDFDLDV+
Subjt:  FEYNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

A0A1S3AWZ1 uncharacterized protein LOC103483705 isoform X2

3.7e-250

89.42

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        M+GDPV TEVLEDTNGC+   NKNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKG  FASKLSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPN D+DAFFASFSW+IPAKKSS AQGIRVKQIPCPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADC DD+EEI +LG  IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKELLRHIEL+IEK+KTG CLEEIWKMEEDSSANCTDAPD ADS + SH+TS S ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEEKLLLHKNYLHNLFQQLE    ELRHQT STGQNAV+NRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

A0A1S4DSZ4 uncharacterized protein LOC103483705 isoform X1

3.7e-250

89.42

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        M+GDPV TEVLEDTNGC+   NKNELILRPV+QDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKG  FASKLSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPN D+DAFFASFSW+IPAKKSS AQGIRVKQIPCPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADC DD+EEI +LG  IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKELLRHIEL+IEK+KTG CLEEIWKMEEDSSANCTDAPD ADS + SH+TS S ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEEKLLLHKNYLHNLFQQLE    ELRHQT STGQNAV+NRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

A0A5D3D0Q3 Protein OBERON 1-like isoform X2

3.7e-250

89.63

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        M+GDPV TEVLEDTNGC+   NKNELILRPVSQDESGEGLPYAPENWPNPGD WSWRVGKRVAITGHFLDRYLYSPRGI  SENSARKG  FASKLSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFPN D+DAFFASFSW+IPAKKSS AQGIRVKQIPCPLPSK++EECSASESQ DRVGCKAGNKNC+SLSV+ENPSS KSMSC ICCSEPRFCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILC KIIDTTTESYSYIKCK VVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVE FLQSCQSADC DD+EEI +LG  IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGSHKMRAKELLRHIEL+IEK+KTG CLEEIWKMEEDSSANCTDAPD ADS + SH+TS S ISSEWTMSTPFDHWIESLKLEDEIDQVL GLKRSQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEEKLLLHKNYLHNLFQQLE    ELRHQT STGQNAV+NRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

A0A6J1ITE5 OBERON-like protein isoform X1

1.4e-238

85.19

Show/hide

Query:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER
        MSGDPV+TEVL D NGC P+ NKN+LILRPVSQDESGEGLPYAPENWPN GDNWSWRVG+RVAITGHF DRYLYSPRGIG S NS+R+G GFAS+LSVER
Subjt:  MSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVER

Query:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC
        YIQSEFP+ D+DAFFASFSW+IPAKKSS AQG R+KQI CPLPSKE EECSAS+SQIDRV CKAGNKNCNSLSVAE PS LKSMSCDICCSEP+FCRDCC
Subjt:  YIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCC

Query:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL
        CILCSK IDTT ES SYIKCKA+VGDGYICGHHAHIKCGLKSY AGTVGG IGLDAEYYCRRCDARTDLVSHVERFLQ CQS DC DDI EI SLG  IL
Subjt:  CILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRIL

Query:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE
        RGS KMRAKELLRH +LNI KLKTG CLEE+WKMEEDSSANCTDAPDNADS +GSHD SDS ISSEWT+STPFDHWIESLKLE+EIDQVLQ LK+SQEFE
Subjt:  RGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFE

Query:  YNLAEEKLLLHKNYLHNLFQQLEN---ELRHQTSSTGQNA----VTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
        YNLAEEKLL HKNYLHNLFQQL+    EL HQ+SSTGQN     VTNRVDQIK+EVKRLKRMEKVADGFGMTPKDILKEDFDLDV+
Subjt:  YNLAEEKLLLHKNYLHNLFQQLEN---ELRHQTSSTGQNA----VTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

SwissProt top hits

e value

%identity

Alignment

Q3T090 Pre-rRNA-processing protein TSR2 homolog

1.8e-04

34.21

Show/hide

Query:  AISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV
        A+ +    W  LQ+A+EN +GG  S +K+  L   V  +F ++   L ++++E+ L E ++  F+T +EDGS+ QV
Subjt:  AISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV

Q8C8T8 Pre-rRNA-processing protein TSR2 homolog

6.3e-05

35.53

Show/hide

Query:  AISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV
        A+ +    W  LQ+A+EN +GG  S +K+  L   V  +F  +   L +E++E+ L E +   F+T +EDGS+ QV
Subjt:  AISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV

Q969E8 Pre-rRNA-processing protein TSR2 homolog

2.4e-04

34.67

Show/hide

Query:  ISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV
        + +    W  LQ+A+EN +GG  S +K+  L   V  +F ++   L ++++E+ L E L   F+T +EDGS+ QV
Subjt:  ISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV

Arabidopsis top hits

e value

%identity

Alignment

AT1G05410.1 Protein of unknown function (DUF1423)

5.8e-115

48.05

Show/hide

Query:  LILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGI-GTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPA
        L+LRPVS  ESGEGLPYAPENWPNPGD W W+VG R++  G+F+DRYLY P+ + G      RK + F S+LS++RYI+  FP  D+  FFASFSW IP 
Subjt:  LILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGI-GTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPA

Query:  KKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVV
        +     QG+ + Q    LP    +E    +   D   CKAGN+ C SL       +L +M CDICC E +FC DCCCILC K+I      YSYIKC+AVV
Subjt:  KKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVV

Query:  GDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRILRGSHKMRAKELLRHIELNIEKLKT
         +G+ICGH AH+ C L++Y AGT+GGS+GLD EYYCRRCDA+ DL  HV +FL+ CQ+ +   D+E+I +LG  ILRG+ +  AKELL  IE  + KLK 
Subjt:  GDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRILRGSHKMRAKELLRHIELNIEKLKT

Query:  GACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLE-
        G  LE++W   +D+    +D  D+ ++R+  +DT  S          PF+H  E  KLE+EI +VL+ L+++QEFEY +AE KL   K  L +L++QLE 
Subjt:  GACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLE-

Query:  --NELRHQTSSTGQNA----VTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ
          +EL  + S T  N+    V  R+DQI++EV +LK ME+VA GFG TP+ +L+E F L+++
Subjt:  --NELRHQTSSTGQNA----VTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

AT1G05410.2 Protein of unknown function (DUF1423)

9.3e-97

45.58

Show/hide

Query:  VGKRVAITGHFLDRYLYSPRGI-GTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQ
        VG R++  G+F+DRYLY P+ + G      RK + F S+LS++RYI+  FP  D+  FFASFSW IP +     QG+ + Q    LP    +E    +  
Subjt:  VGKRVAITGHFLDRYLYSPRGI-GTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQ

Query:  IDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDA
         D   CKAGN+ C SL       +L +M CDICC E +FC DCCCILC K+I      YSYIKC+AVV +G+ICGH AH+ C L++Y AGT+GGS+GLD 
Subjt:  IDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPRFCRDCCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDA

Query:  EYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRILRGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSH
        EYYCRRCDA+ DL  HV +FL+ CQ+ +   D+E+I +LG  ILRG+ +  AKELL  IE  + KLK G  LE++W   +D+    +D  D+ ++R+  +
Subjt:  EYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRILRGSHKMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSH

Query:  DTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNA----VTNRVDQIKQEV
        DT  S          PF+H  E  KLE+EI +VL+ L+++QEFEY +AE KL   K  L +L++QLE   +EL  + S T  N+    V  R+DQI++EV
Subjt:  DTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNYLHNLFQQLE---NELRHQTSSTGQNA----VTNRVDQIKQEV

Query:  KRLKRMEKVADGFGMTPKDILKEDFDLDVQ
         +LK ME+VA GFG TP+ +L+E F L+++
Subjt:  KRLKRMEKVADGFGMTPKDILKEDFDLDVQ

AT3G22510.1 Pre-rRNA-processing protein TSR2, conserved region

3.2e-20

62.96

Show/hide

Query:  SSLQMAISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV
        S LQ  I  + SRW GLQMA++NQWGG DS +KS  LA ++F   SQS   + VE++ENLLHE+LLLSFNTEIEDGSIE+V
Subjt:  SSLQMAISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQV

AT3G22520.1 unknown protein

1.5e-22

50.53

Show/hide

Query:  PVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPA
        PVS   +G+GLPYAP +WP+PGD W+WRVG+RV   G+  DR+L  P+ +          + FASK  + RY++S+FP +D DAFFASFSW++PA
Subjt:  PVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPA

AT4G14840.1 unknown protein

4.1e-20

41.27

Show/hide

Query:  FQMSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSV
        F   GD  D +V  D +  T   + N+L   P +   SG+GLP+AP ++P+PGD W+WRVG+RV   G   DR L  P  +          + FASK ++
Subjt:  FQMSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSENSARKGQGFASKLSV

Query:  ERYIQSEFPNVDIDAFFASFSWRIPA
         RY+++ FP++D +AFFASF+W IPA
Subjt:  ERYIQSEFPNVDIDAFFASFSWRIPA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAGTCAATTGATGGATTAACCTCAACCAATTACAAGGCGGGATCTGTCTCCAGCCTCCAAATGGCCATTTCATCAGTGTTTTCTAGGTGGGACGGCCTTCAAATGGC
CATTGAAAACCAATGGGGAGGTCGCGACTCTCACCAGAAATCTCTGAATCTCGCCTCTGATGTCTTCTCTTGGTTCTCTCAATCCAAACCTCCTTTATACGTGGAAGATC
TGGAAAATTTGCTCCATGAAACCCTGTTGCTCTCCTTCAACACCGAGATCGAAGATGGCAGCATCGAACAGGTCCAGTACTTCGGCGGTCCATCAAAGGCGTCAAGCCTT
CTTTCTCTTCCCGTTGTGCGGCGGCAGGAACCTTTTACTCGACTTCCTATGCTTTGGTTCGTTCGTCAACCATTTCAGATGTCGGGGGATCCTGTGGATACTGAAGTTCT
TGAGGATACAAATGGCTGCACGCCTAGGGCGAACAAAAATGAACTGATCCTTAGGCCAGTTTCTCAAGATGAATCTGGGGAGGGCTTGCCATATGCTCCTGAAAATTGGC
CCAATCCTGGTGATAACTGGAGTTGGAGGGTGGGGAAGAGAGTTGCTATAACTGGCCATTTTCTGGATAGGTACCTTTATTCTCCTCGTGGTATTGGCACTTCTGAGAAC
TCAGCTCGTAAAGGGCAGGGTTTTGCAAGCAAGCTTTCAGTTGAAAGATATATCCAGTCTGAGTTCCCTAATGTAGACATTGATGCATTTTTTGCCTCATTCAGTTGGAG
GATACCAGCAAAAAAGTCATCTTTTGCGCAAGGTATTCGAGTAAAGCAAATTCCTTGCCCTCTGCCCTCAAAAGAGATGGAAGAATGCTCGGCATCTGAGTCCCAGATTG
ATAGAGTGGGTTGCAAGGCTGGAAATAAGAACTGTAATAGTTTATCTGTTGCTGAAAATCCATCTTCGTTAAAATCCATGTCCTGTGATATTTGCTGCAGTGAACCTCGG
TTTTGCCGTGATTGCTGCTGTATACTTTGCAGCAAGATTATAGACACAACCACGGAAAGCTATAGCTACATAAAATGTAAAGCAGTGGTGGGTGATGGTTATATTTGTGG
ACATCATGCTCATATAAAATGTGGTCTTAAATCGTATACAGCAGGGACAGTTGGAGGAAGCATTGGATTGGATGCTGAGTATTATTGTCGACGTTGTGATGCCAGAACGG
ATTTGGTATCACATGTAGAAAGATTTTTGCAGTCGTGTCAATCAGCTGACTGTCTAGATGATATTGAGGAGATCTTCAGCCTTGGTTTCCGCATTTTGCGTGGTTCGCAC
AAAATGAGAGCAAAGGAGTTGTTAAGACATATTGAATTGAACATTGAAAAGCTTAAAACTGGGGCTTGCTTGGAAGAGATTTGGAAGATGGAGGAAGACAGCTCAGCGAA
TTGCACTGATGCCCCTGATAATGCTGATTCTAGAGATGGTTCTCATGACACTTCAGACTCCAATATAAGCTCAGAATGGACTATGTCCACCCCTTTTGATCATTGGATTG
AGTCCCTAAAACTTGAAGACGAGATTGATCAGGTTTTGCAGGGACTGAAAAGATCACAAGAGTTCGAGTATAATTTAGCAGAAGAAAAGCTTCTATTACATAAAAATTAT
CTACATAATCTCTTTCAGCAACTTGAAAATGAACTCAGACATCAAACATCATCAACGGGACAAAATGCCGTAACAAACAGAGTGGACCAAATAAAACAAGAAGTAAAGAG
ACTCAAGAGAATGGAAAAGGTTGCTGATGGATTTGGAATGACTCCGAAAGATATCCTCAAGGAGGACTTCGATTTGGATGTTCAATAG

mRNA sequence

Show/hide mRNA sequence

ATTTCCCATAAAAATCAATCAACCCATTTGAAACAGAGACATTCTGCCCATACCCGCATCTAATAATGAACCCATGAAGCTGACACCCAGGCCCCAAGCCTAGTTTGTCC
GAACACGCATTGAAAAAAGCACAAAATGTTATGGAATCTGGCTTCCCACCAACTCGAAGTAGCTCAATAAATGCAATGGCAGAGTCTTCAGGTCGCCCATGGAGCACGGA
ATTGGATATATACGCATTCCACATCTCGAGATTTCGATAAGGCATTTCATCAAACACCTTGTATGCGTCATTAAGAAAGCCCAATTTGCTGTACATGTCGAAGACACTGC
ACCCGACGAAGACATCACTTATTAATCCCTCCTTAACCGCAAGTGCGTGTAGCTGTTTGCCTGTCATGGCCATGCGAAGACCAGTGGAGGCTTTGAAAACGCAAGGGAAA
GTGAAGTCATTGGGTCGAACACAGTCACTTAGCATGTCGGAGAAGTGAAGCAGAGCGGAAGCAAAACAACCGTTTTGGACGGAACCGGCGATGAGGGCGGTCCAAGTGAC
AACGGAGCGGCAAGGGGCGAGTTCGAGGATGAGTTTGGCCGAGTTAAGATGGTCGAGTTTGGCGTACATGTTCACGAGGTGGTTGTAGAGGAAGGCTGGAAGAGGGGTTT
TTAGGGTTTTGAGAATTTGGGCATGGGCGGCTCGGCCAAGAAGAGAAGAACGAACCGATACGGCCAATTCGACCAGTGAAGCGAGCGAGTTTGGCGAGAGAAACGGCATG
GTTGAATACCGAAAAGGTCATGATCTGTATAGATCGGAATGAAGAAGAAGAAAAAATAGAGAGAGCAATTTTACCCTCTGGTTCTTCCCATTACAATAAACTCCTGCTAT
GAAGTTACTTCGATTCAGTTGGATTTGGCGGGAATTCGAGAAGCCATGGAATCGAGCTCTATCATTAGAAGATATAAATAAAAAAAAGGCCCGAATGTCTCTCCACCTCT
CTCTCCAAACACATCTCCGCTTTTCTCTCCGCCCAATTCTGACATTAATTACTAAATCCAACCGCCCTCTCTCTCTCTCTTTCTCTGATAACTCGGTGAGGAGAGACAGA
GAAAAAGAAGATTTCGAGGTTTGGAAGAGGGAGAAGGCGAAGACGAAGCTCTGAGGTTCATCCATGGAGTCAATTGATGGATTAACCTCAACCAATTACAAGGCGGGATC
TGTCTCCAGCCTCCAAATGGCCATTTCATCAGTGTTTTCTAGGTGGGACGGCCTTCAAATGGCCATTGAAAACCAATGGGGAGGTCGCGACTCTCACCAGAAATCTCTGA
ATCTCGCCTCTGATGTCTTCTCTTGGTTCTCTCAATCCAAACCTCCTTTATACGTGGAAGATCTGGAAAATTTGCTCCATGAAACCCTGTTGCTCTCCTTCAACACCGAG
ATCGAAGATGGCAGCATCGAACAGGTCCAGTACTTCGGCGGTCCATCAAAGGCGTCAAGCCTTCTTTCTCTTCCCGTTGTGCGGCGGCAGGAACCTTTTACTCGACTTCC
TATGCTTTGGTTCGTTCGTCAACCATTTCAGATGTCGGGGGATCCTGTGGATACTGAAGTTCTTGAGGATACAAATGGCTGCACGCCTAGGGCGAACAAAAATGAACTGA
TCCTTAGGCCAGTTTCTCAAGATGAATCTGGGGAGGGCTTGCCATATGCTCCTGAAAATTGGCCCAATCCTGGTGATAACTGGAGTTGGAGGGTGGGGAAGAGAGTTGCT
ATAACTGGCCATTTTCTGGATAGGTACCTTTATTCTCCTCGTGGTATTGGCACTTCTGAGAACTCAGCTCGTAAAGGGCAGGGTTTTGCAAGCAAGCTTTCAGTTGAAAG
ATATATCCAGTCTGAGTTCCCTAATGTAGACATTGATGCATTTTTTGCCTCATTCAGTTGGAGGATACCAGCAAAAAAGTCATCTTTTGCGCAAGGTATTCGAGTAAAGC
AAATTCCTTGCCCTCTGCCCTCAAAAGAGATGGAAGAATGCTCGGCATCTGAGTCCCAGATTGATAGAGTGGGTTGCAAGGCTGGAAATAAGAACTGTAATAGTTTATCT
GTTGCTGAAAATCCATCTTCGTTAAAATCCATGTCCTGTGATATTTGCTGCAGTGAACCTCGGTTTTGCCGTGATTGCTGCTGTATACTTTGCAGCAAGATTATAGACAC
AACCACGGAAAGCTATAGCTACATAAAATGTAAAGCAGTGGTGGGTGATGGTTATATTTGTGGACATCATGCTCATATAAAATGTGGTCTTAAATCGTATACAGCAGGGA
CAGTTGGAGGAAGCATTGGATTGGATGCTGAGTATTATTGTCGACGTTGTGATGCCAGAACGGATTTGGTATCACATGTAGAAAGATTTTTGCAGTCGTGTCAATCAGCT
GACTGTCTAGATGATATTGAGGAGATCTTCAGCCTTGGTTTCCGCATTTTGCGTGGTTCGCACAAAATGAGAGCAAAGGAGTTGTTAAGACATATTGAATTGAACATTGA
AAAGCTTAAAACTGGGGCTTGCTTGGAAGAGATTTGGAAGATGGAGGAAGACAGCTCAGCGAATTGCACTGATGCCCCTGATAATGCTGATTCTAGAGATGGTTCTCATG
ACACTTCAGACTCCAATATAAGCTCAGAATGGACTATGTCCACCCCTTTTGATCATTGGATTGAGTCCCTAAAACTTGAAGACGAGATTGATCAGGTTTTGCAGGGACTG
AAAAGATCACAAGAGTTCGAGTATAATTTAGCAGAAGAAAAGCTTCTATTACATAAAAATTATCTACATAATCTCTTTCAGCAACTTGAAAATGAACTCAGACATCAAAC
ATCATCAACGGGACAAAATGCCGTAACAAACAGAGTGGACCAAATAAAACAAGAAGTAAAGAGACTCAAGAGAATGGAAAAGGTTGCTGATGGATTTGGAATGACTCCGA
AAGATATCCTCAAGGAGGACTTCGATTTGGATGTTCAATAGAGACATGGGTGCGAAAATATGATGTCTCACAAAATTTCACTGAACTTTGTTGGTTCATTTAGCCTTAGT
GGGTTTTTGTAGTTTTTACTGTGTATCATATGGCTTCACATGAGGCTGTGTGTATGATATCGAGATTTTACTTGGTTTATGAAGATAGCTGGATTCAGGAAGCAAAATAC
TGAAGCTAAGCAGTTGCGGAGCTGCCAGAAGGAATGTAGAGTAGAGATATTTTGGTCCATTGGAAAGTGGAAACTAACCCTCTGCAACGAGTTTTCACGATTGCTTTTTT
TGGCTTCTGTGGAGCTCAGTAGGGGATCCAGTCTGTCTGGTTCAGACTCCTTATCACTACATGCAGAAGAGAGGTACTTTCTTTTGATTACAATGCTAAAATCAGAACAT
ATTTGATCCCCCCCCCC

Protein sequence

Show/hide protein sequence

MESIDGLTSTNYKAGSVSSLQMAISSVFSRWDGLQMAIENQWGGRDSHQKSLNLASDVFSWFSQSKPPLYVEDLENLLHETLLLSFNTEIEDGSIEQVQYFGGPSKASSL
LSLPVVRRQEPFTRLPMLWFVRQPFQMSGDPVDTEVLEDTNGCTPRANKNELILRPVSQDESGEGLPYAPENWPNPGDNWSWRVGKRVAITGHFLDRYLYSPRGIGTSEN
SARKGQGFASKLSVERYIQSEFPNVDIDAFFASFSWRIPAKKSSFAQGIRVKQIPCPLPSKEMEECSASESQIDRVGCKAGNKNCNSLSVAENPSSLKSMSCDICCSEPR
FCRDCCCILCSKIIDTTTESYSYIKCKAVVGDGYICGHHAHIKCGLKSYTAGTVGGSIGLDAEYYCRRCDARTDLVSHVERFLQSCQSADCLDDIEEIFSLGFRILRGSH
KMRAKELLRHIELNIEKLKTGACLEEIWKMEEDSSANCTDAPDNADSRDGSHDTSDSNISSEWTMSTPFDHWIESLKLEDEIDQVLQGLKRSQEFEYNLAEEKLLLHKNY
LHNLFQQLENELRHQTSSTGQNAVTNRVDQIKQEVKRLKRMEKVADGFGMTPKDILKEDFDLDVQ

Lsi05G016080 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome