CuGenDBv2

Gene ID	Tan0002582
Organism	Trichosanthes anguina (Snake gourd v1)
Description	30S ribosomal protein S1, chloroplastic
Genome location	LG06:80107033..80113975
RNA-Seq Expression	Tan0002582
Synteny	Tan0002582
Gene Ontology terms	GO:0006412 - translation (biological process) GO:0022627 - cytosolic small ribosomal subunit (cellular component) GO:0003729 - mRNA binding (molecular function) GO:0003735 - structural constituent of ribosome (molecular function)
InterPro domains	IPR003029 - S1 domain IPR012340 - Nucleic acid-binding, OB-fold IPR022967 - RNA-binding domain, S1

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022138847.1 30S ribosomal protein S1, chloroplastic-like isoform X1 [Momordica charantia]

1.0e-175

84.65

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKES--LKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLA
        M+SLAH++      PLS  RLSVSS +W+RFS KES   K +ALPVV  S+AAS TPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH+ L+
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKES--LKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLA

Query:  NYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI
        NYDFVSELGTKVKGTVF TDA+GALVDTTAKGTAYLPI+EACILKI HVEEAGIYPGLEEEFVIIAE E DGSLILSLR +Q+GLAWERCRQLQAED VI
Subjt:  NYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVVG NKGGV VLVEGLRGFVPFSQI+AKSTAEELL+KELRLKFVEVDE+LSRLILSNCKA+ANSQAE RIGSVVTGTVQILK YGAFIDIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        H+SQIS NHISD+ TVL+PGD LKVMILSYD ERGRVSLSTK LEPTPGDMIHNPKLVFEKADEMAQ FRQRIAQAE MARVDLL  +PES
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

XP_023006590.1 30S ribosomal protein S1, chloroplastic-like isoform X1 [Cucurbita maxima]

1.2e-171

82.65

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        MSSLAHQLCGL+ SPLS T +S      KRFSP             +SAAASPTPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH++LANY
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI
        DFVSE+GTKVKGTVF TDANGALVDT+AKGTAYLP QEACI  I HVEEAGIYPGLEEEFVII   EQE +GSLILSLRSVQ+GLAWERCRQLQAED VI
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVV  NKGGVVVLVEGL+GFVPFSQI+AKSTAEELLNKEL LKFVEVDEKLSRL+LSN KA+A+SQ+E RIGSVVTG VQILKPYGAFIDIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPESL
        HVSQISQNHISDI  VLQPGDMLKVMILSYDR+RGR+SLSTKKLEP+PGDM+HNPKLVFEKADEMAQ FRQRIAQAE MAR +LL F+PE L
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPESL

XP_023006591.1 30S ribosomal protein S1, chloroplastic-like isoform X2 [Cucurbita maxima]

1.6e-171

82.61

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        MSSLAHQLCGL+ SPLS T +S      KRFSP             +SAAASPTPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH++LANY
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI
        DFVSE+GTKVKGTVF TDANGALVDT+AKGTAYLP QEACI  I HVEEAGIYPGLEEEFVII   EQE +GSLILSLRSVQ+GLAWERCRQLQAED VI
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVV  NKGGVVVLVEGL+GFVPFSQI+AKSTAEELLNKEL LKFVEVDEKLSRL+LSN KA+A+SQ+E RIGSVVTG VQILKPYGAFIDIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        HVSQISQNHISDI  VLQPGDMLKVMILSYDR+RGR+SLSTKKLEP+PGDM+HNPKLVFEKADEMAQ FRQRIAQAE MAR +LL F+PE+
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

XP_023547911.1 30S ribosomal protein S1, chloroplastic-like [Cucurbita pepo subsp. pepo]

3.5e-171

82.86

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        MSSLAHQLCGL+ SPLS T +S      KRFSP             +SAAASPTPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH  LANY
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEA--DGSLILSLRSVQFGLAWERCRQLQAEDAVI
        DFVSELGTKVKGTVF TDANGALVDT+AKGTAYLP QEACI  I HVEEAGIYPGLEEEFVII EQE   DGSLILSLRSVQ+GLAWERCRQLQAED VI
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEA--DGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KG VV  NKGGVVVLVEGL+GFVPFSQI+AKSTAEELLNKEL LKFVEVDEKLSRLILSN KA+A+SQ+E +IGSVVTG VQILKPYGAFIDIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        HVSQISQNHISDI  VLQPGDMLKVMILSYDR+RGR+SLSTKKLEP+PGDM+HNPKLVFEKADEMAQ FRQRIAQAE MAR +LL F+PE+
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

XP_038906593.1 30S ribosomal protein S1, chloroplastic-like [Benincasa hispida]

2.2e-173

84.52

Show/hide

Query:  MSSLAHQ-LCGLKC----SPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHS
        MSS AHQ  CGLK     SPLS  RLS SSWNW RF PKE    K LP+VS +AA+SP+PISNAQTKERLKLKQLFKEAYERCC +PMDGVSFTLEDFH+
Subjt:  MSSLAHQ-LCGLKC----SPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHS

Query:  TLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAED
         LA+YDFVSELGTKVKGTVFCT+ANGALVD T KGTAYLP QEACILKI HVEEAGIYPGLEEEF+IIAEQE    LILSLRSVQ+GLAWERCRQLQAED
Subjt:  TLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAED

Query:  AVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGIN
         VIKGKVVG  KGGVVVLVEGLRGFVPFSQI+AKSTAEELLNKELRLKFVEVDE+LSRLILSN KA+  SQAE RIGSVVTGTVQILKPYGAFIDIGGIN
Subjt:  AVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGIN

Query:  GLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        GLLHVSQISQNHI DI TVLQPGD+LKVMILSYD+ +GRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQ FRQRIAQAE MAR  LLG +PES
Subjt:  GLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CCC9 30S ribosomal protein S1, chloroplastic-like isoform X1

5.1e-176

84.65

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKES--LKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLA
        M+SLAH++      PLS  RLSVSS +W+RFS KES   K +ALPVV  S+AAS TPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH+ L+
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKES--LKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLA

Query:  NYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI
        NYDFVSELGTKVKGTVF TDA+GALVDTTAKGTAYLPI+EACILKI HVEEAGIYPGLEEEFVIIAE E DGSLILSLR +Q+GLAWERCRQLQAED VI
Subjt:  NYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVVG NKGGV VLVEGLRGFVPFSQI+AKSTAEELL+KELRLKFVEVDE+LSRLILSNCKA+ANSQAE RIGSVVTGTVQILK YGAFIDIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        H+SQIS NHISD+ TVL+PGD LKVMILSYD ERGRVSLSTK LEPTPGDMIHNPKLVFEKADEMAQ FRQRIAQAE MARVDLL  +PES
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

A0A6J1H453 30S ribosomal protein S1, chloroplastic-like isoform X1

6.4e-171

82.4

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        MSSLAHQLCGL+ SPLS T +S      KRFSP             +SAAASPTPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH+ LANY
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEA--DGSLILSLRSVQFGLAWERCRQLQAEDAVI
        DFVSELGTKVKGTVF TDANGALVDT+AKGTAYLP QEACI  I HVEEAGIYPGLEEEFVII EQE   DGSLILSLRSVQ+GLAWERCRQLQAED VI
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEA--DGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVV  NKGGVVVLVEGL+GFVPFSQI+AKSTAEELLNKEL LKFVEVDEKL RLILSN KA+ +SQ+E RIGSVVTG VQILKPYGAF+DIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPESL
        HVSQISQNHI DI  VLQPGDMLKVMILSYDR+RGR+SLSTKKLEP+PGDM+HNPKLVFEKADEMAQ FRQRIAQAE MAR +LL F+PE L
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPESL

A0A6J1H681 30S ribosomal protein S1, chloroplastic-like isoform X2

8.4e-171

82.35

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        MSSLAHQLCGL+ SPLS T +S      KRFSP             +SAAASPTPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH+ LANY
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEA--DGSLILSLRSVQFGLAWERCRQLQAEDAVI
        DFVSELGTKVKGTVF TDANGALVDT+AKGTAYLP QEACI  I HVEEAGIYPGLEEEFVII EQE   DGSLILSLRSVQ+GLAWERCRQLQAED VI
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEA--DGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVV  NKGGVVVLVEGL+GFVPFSQI+AKSTAEELLNKEL LKFVEVDEKL RLILSN KA+ +SQ+E RIGSVVTG VQILKPYGAF+DIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        HVSQISQNHI DI  VLQPGDMLKVMILSYDR+RGR+SLSTKKLEP+PGDM+HNPKLVFEKADEMAQ FRQRIAQAE MAR +LL F+PE+
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

A0A6J1KY62 30S ribosomal protein S1, chloroplastic-like isoform X2

7.6e-172

82.61

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        MSSLAHQLCGL+ SPLS T +S      KRFSP             +SAAASPTPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH++LANY
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI
        DFVSE+GTKVKGTVF TDANGALVDT+AKGTAYLP QEACI  I HVEEAGIYPGLEEEFVII   EQE +GSLILSLRSVQ+GLAWERCRQLQAED VI
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVV  NKGGVVVLVEGL+GFVPFSQI+AKSTAEELLNKEL LKFVEVDEKLSRL+LSN KA+A+SQ+E RIGSVVTG VQILKPYGAFIDIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        HVSQISQNHISDI  VLQPGDMLKVMILSYDR+RGR+SLSTKKLEP+PGDM+HNPKLVFEKADEMAQ FRQRIAQAE MAR +LL F+PE+
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

A0A6J1L0J3 30S ribosomal protein S1, chloroplastic-like isoform X1

5.8e-172

82.65

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        MSSLAHQLCGL+ SPLS T +S      KRFSP             +SAAASPTPISNAQTKERLKLKQLFKEAYERCC TPMDGVSFTLEDFH++LANY
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI
        DFVSE+GTKVKGTVF TDANGALVDT+AKGTAYLP QEACI  I HVEEAGIYPGLEEEFVII   EQE +GSLILSLRSVQ+GLAWERCRQLQAED VI
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIA--EQEADGSLILSLRSVQFGLAWERCRQLQAEDAVI

Query:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL
        KGKVV  NKGGVVVLVEGL+GFVPFSQI+AKSTAEELLNKEL LKFVEVDEKLSRL+LSN KA+A+SQ+E RIGSVVTG VQILKPYGAFIDIGG+NGLL
Subjt:  KGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLL

Query:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPESL
        HVSQISQNHISDI  VLQPGDMLKVMILSYDR+RGR+SLSTKKLEP+PGDM+HNPKLVFEKADEMAQ FRQRIAQAE MAR +LL F+PE L
Subjt:  HVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPESL

SwissProt top hits

e value

%identity

Alignment

O33698 30S ribosomal protein S1

1.4e-42

34.75

Show/hide

Query:  EDFHSTLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQ
        +DF   L      S+ G  V+G V     +GA +D   K  A+LP +EA +  +  + EA +    E EF++I +Q  DG + +SLR++    AW R  +
Subjt:  EDFHSTLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQ

Query:  LQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQA-ERRIGSVVTGTVQILKPYGAFI
        LQ     ++ KV G NKGGV   +EGLR F+P S +  K   + L  K L + F+EV+    +L+LS  +A   +   E  +G ++ G V  LKP+G F+
Subjt:  LQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQA-ERRIGSVVTGTVQILKPYGAFI

Query:  DIGGINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRI
        D+GG   LL ++QISQ  ++D+G + + GD ++ ++++ D  +GR+SLSTK LE  PG+++ N   +   A + A+  R+++
Subjt:  DIGGINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRI

P29344 30S ribosomal protein S1, chloroplastic

1.3e-152

72.82

Show/hide

Query:  MSSLAHQLC-GLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLAN
        M+SLA QL  GL+C PLS + LS      K FSPK +LK +  P+VS  A      +SNAQT+ER KLKQLF++AYERC   PM+GVSFT++DFH+ L  
Subjt:  MSSLAHQLC-GLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLAN

Query:  YDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVIK
        YDF SE+G++VKGTVFCTDANGALVD TAK +AYLP+ EACI +I +VEEAGI PG+ EEFVII E EAD SLILSLR +Q+ LAWERCRQLQAED V+K
Subjt:  YDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVIK

Query:  GKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLLH
        GK+VG NKGGVV LVEGLRGFVPFSQI++KS+AEELL KE+ LKFVEVDE+ SRL++SN KA+A+SQA+  IGSVVTGTVQ LKPYGAFIDIGGINGLLH
Subjt:  GKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLLH

Query:  VSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        VSQIS + +SDI TVLQPGD LKVMILS+DRERGRVSLSTKKLEPTPGDMI NPKLVFEKA+EMAQ FRQRIAQAE MAR D+L F+PES
Subjt:  VSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

P46228 30S ribosomal protein S1

1.2e-73

47.64

Show/hide

Query:  PMDGVSFTLEDFHSTLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQF
        P   + FT EDF + L  YD+    G  V GTVF  +  GAL+D  AK  A+LP+QE  I ++   EE  + P    EF I++++  DG L LS+R +++
Subjt:  PMDGVSFTLEDFHSTLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQF

Query:  GLAWERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAER-RIGSVVTGTVQ
          AWER RQLQ EDA ++ +V   N+GG +V +EGLRGF+P S I+ +   E+L+ +EL LKF+EVDE  +RL+LS+ +A+   +  R  +G VV G V+
Subjt:  GLAWERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAER-RIGSVVTGTVQ

Query:  ILKPYGAFIDIGGINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEE
         +KPYGAFIDIGG++GLLH+S+IS +HI    +V    D +KVMI+  D ERGR+SLSTK+LEP PGDM+ NP++V+EKA+EMA  +R+++ Q  E
Subjt:  ILKPYGAFIDIGGINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEE

P73530 30S ribosomal protein S1 homolog A

7.3e-71

48.63

Show/hide

Query:  VSFTLEDFHSTLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAW
        + FTLEDF + L  YD+    G  V GTVF  ++ GAL+D  AK  AY+PIQE  I ++   EE  + P    EF I+ ++  DG L LS+R +++  AW
Subjt:  VSFTLEDFHSTLANYDFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAW

Query:  ERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAE-RRIGSVVTGTVQILKP
        ER RQLQAEDA ++  V   N+GG +V +EGLRGF+P S I+A+   E+L+ ++L LKF+EVDE+ +RL+LS+ +A+   +     +  VV G+V+ +KP
Subjt:  ERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAE-RRIGSVVTGTVQILKP

Query:  YGAFIDIGGINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQ-RIAQAE
        YGAFIDIGG++GLLH+S+IS +HI    +V    D +KVMI+  D ERGR+SLSTK+LEP PG M+ +  LV E ADEMA+ FRQ R+A+A+
Subjt:  YGAFIDIGGINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQ-RIAQAE

Q93VC7 30S ribosomal protein S1, chloroplastic

3.0e-141

67.35

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        M+SLA Q  GL+CSPLS      SS    R + K   ++K+  V     AA    +S+ QTKERL+LK++F++AYERC  +PM+GV+FT++DF + +  Y
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVIKG
        DF SE+GT+VKGTVF TDANGALVD +AK +AYL +++ACI +I HVEEAGI PG+ EEFVII E E+D SL+LSLR++Q+ LAWERCRQLQAED ++K 
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVIKG

Query:  KVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLLHV
        KV+G NKGG+V LVEGLRGFVPFSQI++K+ AEELL KE+ LKFVEVDE+ ++L+LSN KAVA+SQA+  IGSVV G VQ LKPYGAFIDIGGINGLLHV
Subjt:  KVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLLHV

Query:  SQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        SQIS + +SDI TVLQPGD LKVMILS+DR+RGRVSLSTKKLEPTPGDMI NPKLVFEKA+EMAQ FRQRIAQAE MAR D+L F+PES
Subjt:  SQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

Arabidopsis top hits

e value

%identity

Alignment

AT1G71720.1 Nucleic acid-binding proteins superfamily

8.3e-22

31.28

Show/hide

Query:  PGLEEEFVIIAE---QEADGSLILSLRSVQFGLAWERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAK----STAEELLNKELRLKFVE
        P +E   V+ AE   +   G  +LS R     +AW R RQ++  +  I+ K+   N GG++  +EGLR F+P  ++  K    +  +E + +   ++   
Subjt:  PGLEEEFVIIAE---QEADGSLILSLRSVQFGLAWERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAK----STAEELLNKELRLKFVE

Query:  VDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIG--GINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEP
        ++E  + LILS  + VA  +   R G+++ GTV  + PYGA + +G    +GLLH+S I++  I  +  VLQ  + +KV+++       ++SLS   LE 
Subjt:  VDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIG--GINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEP

Query:  TPGDMIHNPKLVFEKADEMAQNFRQRI
         PG  I + + VF +A+EMA+ +R+++
Subjt:  TPGDMIHNPKLVFEKADEMAQNFRQRI

AT3G23700.1 Nucleic acid-binding proteins superfamily

6.6e-19

Show/hide

Query:  WERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEE-----------LLNKELRLKFVEVDEKLSRLILSNCKAVANSQAER-RIG
        W+  +         +G+V G N GG+++    L GF+P+ Q++   + +E           L+  +L +K V+ DE+  +LILS   A+    ++   +G
Subjt:  WERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEE-----------LLNKELRLKFVEVDEKLSRLILSNCKAVANSQAER-RIG

Query:  SVVTGTVQILKPYGAFIDIG------GINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTP
         V  G V  ++ YGAFI +        + GL+HVS++S +++ D+  VL+ GD ++V++ + D+E+ R++LS K+LE  P
Subjt:  SVVTGTVQILKPYGAFIDIG------GINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTP

AT4G29060.1 elongation factor Ts family protein

3.3e-10

38.16

Show/hide

Query:  GSVVTGTVQILKPYGAFIDIGGI-NGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTP
        G+  TG V+ ++P+GAF+D G   +GL+HVSQ+S N + D+ +V+  G  +KV ++  D E  R+SL+ ++ +  P
Subjt:  GSVVTGTVQILKPYGAFIDIGGI-NGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTP

AT4G29060.2 elongation factor Ts family protein

3.3e-10

38.16

Show/hide

Query:  GSVVTGTVQILKPYGAFIDIGGI-NGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTP
        G+  TG V+ ++P+GAF+D G   +GL+HVSQ+S N + D+ +V+  G  +KV ++  D E  R+SL+ ++ +  P
Subjt:  GSVVTGTVQILKPYGAFIDIGGI-NGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTP

AT5G30510.1 ribosomal protein S1

2.1e-142

67.35

Show/hide

Query:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY
        M+SLA Q  GL+CSPLS      SS    R + K   ++K+  V     AA    +S+ QTKERL+LK++F++AYERC  +PM+GV+FT++DF + +  Y
Subjt:  MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANY

Query:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVIKG
        DF SE+GT+VKGTVF TDANGALVD +AK +AYL +++ACI +I HVEEAGI PG+ EEFVII E E+D SL+LSLR++Q+ LAWERCRQLQAED ++K 
Subjt:  DFVSELGTKVKGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVIKG

Query:  KVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLLHV
        KV+G NKGG+V LVEGLRGFVPFSQI++K+ AEELL KE+ LKFVEVDE+ ++L+LSN KAVA+SQA+  IGSVV G VQ LKPYGAFIDIGGINGLLHV
Subjt:  KVVGENKGGVVVLVEGLRGFVPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLLHV

Query:  SQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES
        SQIS + +SDI TVLQPGD LKVMILS+DR+RGRVSLSTKKLEPTPGDMI NPKLVFEKA+EMAQ FRQRIAQAE MAR D+L F+PES
Subjt:  SQISQNHISDIGTVLQPGDMLKVMILSYDRERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPES

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCTCATTGGCGCATCAACTTTGTGGGTTGAAGTGTTCCCCTCTTTCTTTTACGCGACTTTCGGTTTCGAGTTGGAATTGGAAGCGCTTTTCTCCGAAGGAAAGCCT
CAAGTCTAAAGCGCTTCCAGTAGTTTCACTTTCAGCTGCAGCTTCCCCTACTCCCATTTCCAATGCGCAGACCAAAGAGCGCCTTAAACTCAAGCAACTCTTCAAAGAAG
CTTATGAACGCTGCTGTGCTACCCCCATGGATGGTGTCTCCTTCACCCTTGAGGACTTCCATTCCACTCTTGCAAATTATGACTTCGTTTCTGAACTCGGAACCAAGGTT
AAAGGTACTGTTTTCTGTACCGATGCTAATGGGGCACTAGTTGATACTACTGCAAAGGGAACTGCATACTTGCCTATCCAAGAGGCATGCATTCTTAAAATAAGTCACGT
AGAAGAAGCAGGCATATATCCTGGTCTAGAAGAGGAGTTTGTAATTATTGCTGAACAGGAAGCTGATGGTAGCTTAATTCTGAGCTTGAGAAGTGTCCAGTTTGGCCTTG
CTTGGGAGCGATGCAGACAACTCCAAGCTGAGGATGCTGTTATTAAGGGTAAGGTTGTTGGTGAAAACAAAGGGGGAGTAGTTGTTCTTGTGGAAGGCCTTAGAGGCTTT
GTTCCTTTCTCTCAGATAGCAGCAAAATCAACTGCAGAGGAGCTGCTTAATAAAGAGTTACGTCTGAAGTTTGTGGAGGTCGATGAAAAACTATCTCGGTTAATCCTAAG
TAACTGCAAGGCAGTCGCCAATAGCCAGGCAGAGCGAAGAATTGGATCAGTAGTTACTGGAACTGTGCAGATTCTGAAACCGTATGGAGCCTTCATTGACATTGGTGGAA
TTAATGGTCTTCTTCATGTTAGTCAAATAAGTCAAAATCACATATCAGATATTGGAACTGTTCTTCAACCAGGAGATATGCTAAAGGTCATGATTTTGAGCTATGACCGC
GAGAGAGGCCGTGTTAGTCTTTCTACCAAGAAATTGGAACCGACTCCTGGAGACATGATTCACAATCCAAAGCTTGTTTTTGAGAAGGCAGATGAGATGGCTCAGAACTT
CAGGCAAAGAATAGCTCAAGCAGAAGAAATGGCTCGTGTAGACCTTCTTGGTTTTCGGCCTGAGAGTTTATGGATGAAGAATGATTCTGCCGATTTATGA

mRNA sequence

Show/hide mRNA sequence

GCCGAAAGCAAATTCGCTGAAGCAGAAGCTCGAGAGAGAGAGAGATGAGCTCATTGGCGCATCAACTTTGTGGGTTGAAGTGTTCCCCTCTTTCTTTTACGCGACTTTCG
GTTTCGAGTTGGAATTGGAAGCGCTTTTCTCCGAAGGAAAGCCTCAAGTCTAAAGCGCTTCCAGTAGTTTCACTTTCAGCTGCAGCTTCCCCTACTCCCATTTCCAATGC
GCAGACCAAAGAGCGCCTTAAACTCAAGCAACTCTTCAAAGAAGCTTATGAACGCTGCTGTGCTACCCCCATGGATGGTGTCTCCTTCACCCTTGAGGACTTCCATTCCA
CTCTTGCAAATTATGACTTCGTTTCTGAACTCGGAACCAAGGTTAAAGGTACTGTTTTCTGTACCGATGCTAATGGGGCACTAGTTGATACTACTGCAAAGGGAACTGCA
TACTTGCCTATCCAAGAGGCATGCATTCTTAAAATAAGTCACGTAGAAGAAGCAGGCATATATCCTGGTCTAGAAGAGGAGTTTGTAATTATTGCTGAACAGGAAGCTGA
TGGTAGCTTAATTCTGAGCTTGAGAAGTGTCCAGTTTGGCCTTGCTTGGGAGCGATGCAGACAACTCCAAGCTGAGGATGCTGTTATTAAGGGTAAGGTTGTTGGTGAAA
ACAAAGGGGGAGTAGTTGTTCTTGTGGAAGGCCTTAGAGGCTTTGTTCCTTTCTCTCAGATAGCAGCAAAATCAACTGCAGAGGAGCTGCTTAATAAAGAGTTACGTCTG
AAGTTTGTGGAGGTCGATGAAAAACTATCTCGGTTAATCCTAAGTAACTGCAAGGCAGTCGCCAATAGCCAGGCAGAGCGAAGAATTGGATCAGTAGTTACTGGAACTGT
GCAGATTCTGAAACCGTATGGAGCCTTCATTGACATTGGTGGAATTAATGGTCTTCTTCATGTTAGTCAAATAAGTCAAAATCACATATCAGATATTGGAACTGTTCTTC
AACCAGGAGATATGCTAAAGGTCATGATTTTGAGCTATGACCGCGAGAGAGGCCGTGTTAGTCTTTCTACCAAGAAATTGGAACCGACTCCTGGAGACATGATTCACAAT
CCAAAGCTTGTTTTTGAGAAGGCAGATGAGATGGCTCAGAACTTCAGGCAAAGAATAGCTCAAGCAGAAGAAATGGCTCGTGTAGACCTTCTTGGTTTTCGGCCTGAGAG
TTTATGGATGAAGAATGATTCTGCCGATTTATGATGGCCACCCTTCATCACGATTACATCCAATCCCTTGGTATTGACACTTAGCCTGGAATAATTGTTTGTATTTATTC
TCACATAGAATTTGTAGTTGCCTTGTATATTTCGAGAAAGTAATCATGTAGTGTAGCTGATGTTTATAATTTTAAGAGTCCTAATGTTATATTCCTCTAATTTGGTGATA
GGCTCCTCGAAACAAAATTCTCACTTTTATAAAAGGGCCACCCAATGTAAAGGCCTAAGCTTGCCAGATTCTAAACTGACATTTATACCCTTGTTTGGCCCAATAGATTG
CCTTTCCTTATCTTGATCTTAAATACCCAATTGGTTCTAATGAAGAATAATCTGAAAATGATATCAACCAGATTTAGCTTTTCCAACAAAACGTGTTTATATATGACCAT
CCAACTATGTTTAGCTTATTAGAAGCTGCCATTAATGAAAGAAATGATGTTTCTTTTGAAATTGTGTACTAATATACCATAGTTTTACTCGTATTTGATGTTGGATGAAA
TTACTTGGGAAAAAGTGCAGAATCGTATGTATAATAATTCAAAATAACAACCTTCACAGAATGGAATACTGAGCTGTAGTAGAAGACAAGGTATTTGTAGGTTGTATTCT
GCAAATAAAACACACATTTGGATGCCGTTTTGCTCAGAGGGAGAATTTCCAGAAAGCTAAGGTGATTGAACCGTGTGGGGCATCTTGTTCTTCAAATGATTCTTGTTTTC
ATTATCATTGAATTTTAAATTGCATATACAGGAATCGAATCGTCTGAACAAAAGGAGGTTTCCTTTTCCCTTTTTTTATATATATATA

Protein sequence

Show/hide protein sequence

MSSLAHQLCGLKCSPLSFTRLSVSSWNWKRFSPKESLKSKALPVVSLSAAASPTPISNAQTKERLKLKQLFKEAYERCCATPMDGVSFTLEDFHSTLANYDFVSELGTKV
KGTVFCTDANGALVDTTAKGTAYLPIQEACILKISHVEEAGIYPGLEEEFVIIAEQEADGSLILSLRSVQFGLAWERCRQLQAEDAVIKGKVVGENKGGVVVLVEGLRGF
VPFSQIAAKSTAEELLNKELRLKFVEVDEKLSRLILSNCKAVANSQAERRIGSVVTGTVQILKPYGAFIDIGGINGLLHVSQISQNHISDIGTVLQPGDMLKVMILSYDR
ERGRVSLSTKKLEPTPGDMIHNPKLVFEKADEMAQNFRQRIAQAEEMARVDLLGFRPESLWMKNDSADL

Tan0002582 (gene) of Snake gourd v1 genome