CuGenDBv2

Gene ID	CsGy6G023630
Organism	Cucumis sativus L. var. sativus cv. Gy14 (Cucumber (Gy14) v2.1)
Description	DNA-binding protein S1FA
Genome location	Gy14Chr6:23730977..23735257
RNA-Seq Expression	CsGy6G023630
Synteny	CsGy6G023630
Gene Ontology terms	GO:0006355 - regulation of transcription, DNA-templated (biological process) GO:0005634 - nucleus (cellular component) GO:0016021 - integral component of membrane (cellular component) GO:0003677 - DNA binding (molecular function)
InterPro domains	IPR006779 - DNA binding protein S1FA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004143239.1 DNA-binding protein S1FA [Cucumis sativus]

6.78e-56

100

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_008449267.1 PREDICTED: DNA-binding protein S1FA-like [Cucumis melo]

1.13e-54

98.88

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRM NVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_022962636.1 DNA-binding protein S1FA-like [Cucurbita moschata]

3.65e-51

91.01

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRMGNVIR+ +ARGFNPGLIVLLVVGGLL AFL GNYALY+YAQKTLPPK+KKPVSKKKMKRERLKQG+SAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_022972581.1 DNA-binding protein S1FA-like [Cucurbita maxima]

8.61e-50

89.89

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRMGNVIRD +ARGFNPGLIVLLVVGGLL AFL GNYALY+YAQ TLP K+KKPVSKKKMKRERLKQG+SAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_038881351.1 DNA-binding protein S1FA-like [Benincasa hispida]

7.64e-53

94.38

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRMGNVIRD +ARGFNPGLIVLLVVGGLL AFL GNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQG+SAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KEM3 DNA-binding protein S1FA

3.28e-56

100

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A1S3BLN5 DNA-binding protein S1FA-like

5.46e-55

98.88

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRM NVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A5A7TZ88 DNA-binding protein S1FA-like

5.46e-55

98.88

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRM NVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A6J1HDT2 DNA-binding protein S1FA-like

1.76e-51

91.01

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRMGNVIR+ +ARGFNPGLIVLLVVGGLL AFL GNYALY+YAQKTLPPK+KKPVSKKKMKRERLKQG+SAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A6J1I6D0 DNA-binding protein S1FA-like

4.17e-50

89.89

Show/hide

Query:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MEDDFDFGDKVPPAVNRMGNVIRD +ARGFNPGLIVLLVVGGLL AFL GNYALY+YAQ TLP K+KKPVSKKKMKRERLKQG+SAPGE
Subjt:  MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

SwissProt top hits

e value

%identity

Alignment

P42552 DNA-binding protein S1FA

2.4e-22

76.47

Show/hide

Query:  IRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        + + EA+G NPGLIVLLV+GGLL  FLVGN+ LY YAQK LPPKKKKP+SKKKMKRERLKQGV+ PGE
Subjt:  IRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

P42553 DNA-binding protein S1FA1

2.0e-21

71.62

Show/hide

Query:  NRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        ++  N+I +   +G NPG IVLLVV  LL  F VGNYALYMYAQKTLPP+KKKPVSKKK+KRE+LKQGVSAPGE
Subjt:  NRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

Q42337 DNA-binding protein S1FA2

7.7e-21

Show/hide

Query:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        EA+G NPGLIVLLV+GGLL  FL+ NY +YMYAQK LPP+KKKP+SKKK+KRE+LKQGV  PGE
Subjt:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

Q7XLX6 DNA-binding protein S1FA2

4.5e-21

72.86

Show/hide

Query:  NVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        NV+ +   +G NPG+IVL+VV   L  F VGNYALY+YAQKTLPP+KKKPVSKKKMKRE+LKQGVSAPGE
Subjt:  NVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

Q93VI0 DNA-binding protein S1FA3

1.3e-20

Show/hide

Query:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        E++G NPGLIVLLV+GGLL  FLVGN+ LY YAQK LPP+KKKPVSKKKMK+E++KQGV  PGE
Subjt:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

Arabidopsis top hits

e value

%identity

Alignment

AT2G37120.1 S1FA-like DNA-binding protein

5.5e-22

Show/hide

Query:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        EA+G NPGLIVLLV+GGLL  FL+ NY +YMYAQK LPP+KKKP+SKKK+KRE+LKQGV  PGE
Subjt:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

AT3G09735.1 S1FA-like DNA-binding protein

9.3e-22

Show/hide

Query:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        E++G NPGLIVLLV+GGLL  FLVGN+ LY YAQK LPP+KKKPVSKKKMK+E++KQGV  PGE
Subjt:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

AT3G53370.1 S1FA-like DNA-binding protein

1.6e-21

76.56

Show/hide

Query:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        EA+G NPGLIVLLVVGG L  FL+ NY LY+YAQK LPP+KKKPVSKKK+KRE+LKQGV  PGE
Subjt:  EARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

AT3G53370.2 S1FA-like DNA-binding protein

2.2e-07

75.76

Show/hide

Query:  YAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE
        +A K LPP+KKKPVSKKK+KRE+LKQGV  PGE
Subjt:  YAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGATGATTTCGACTTCGGCGACAAGGTTCCGCCGGCCGTCAACCGCATGGGGAATGTGATTAGAGATGGAGAAGCAAGAGGATTCAACCCAGGACTGATT
GTGCTGCTTGTAGTTGGTGGGTTGCTATTTGCATTTCTTGTTGGGAATTATGCTCTCTACATGTATGCGCAGAAAACACTCCCCCCAAAAAAGAAGAAACCAGTT
TCCAAAAAGAAGATGAAGAGGGAGAGATTGAAGCAAGGTGTCTCTGCACCTGGAGAGTAG

mRNA sequence

Show/hide mRNA sequence

TATATACTTCTTTTTTAATATAGTTTATGTACTCTTTCTTATGTTTGATTTTGAAGGTATAATTGGTAGAATTGTGGTTTTAAAGTATAAATTGATATTTGTAAA
AACAATAAACAGAACGGCGTCGTTTGAAACCCCCATGGGCGGAAATATCGTAAATCCACTGACTATCCGCCATTTTCATATCTTCGTTCCTTTTGTATTTTTTCT
CGAAGCTTCGTCAGTTCATCGTTTTGGTACATAACTTCAACACACCAGCTCTCTCCCATTCTCAATTTCAGCCATGGAAGATGATTTCGACTTCGGCGACAAGGT
TCCGCCGGCCGTCAACCGCATGGGGAATGTGATTAGAGATGGAGAAGCAAGAGGATTCAACCCAGGACTGATTGTGCTGCTTGTAGTTGGTGGGTTGCTATTTGC
ATTTCTTGTTGGGAATTATGCTCTCTACATGTATGCGCAGAAAACACTCCCCCCAAAAAAGAAGAAACCAGTTTCCAAAAAGAAGATGAAGAGGGAGAGATTGAA
GCAAGGTGTCTCTGCACCTGGAGAGTAGAAGTGTAGTGGTAGACTTCTCTTATGTTTTGTATGCCTGTCCCTGATTTGGTTGAACTAACAAGTTCTACCAAATGA
ATTTCAATGTTTGAAGAGTTGTTTTGCCTATGTTGTTAAGTTGGTTAGAATCTGAACATATAAGTAGAAGTTTATTGTCGCTTTGTATCCTTAGAGATGAGAAAT
AATAACAACATAGTTTATGTGGTATATTTTGATCAAATGCTAACCTTTTGGTGCCCTTCCTAAGATTTTCTTATCCACATTGTCTTATTAAATTAAAAAAAATAA
TAATAAAAGCTCAAAATCCTAACACACATAAAAGTAAGTAAACATTATGGCATTTGAAAATTAAAATTGACACTCAATATAATAAACTGAACATATTACGATATG
ATTACAGAAAGTAGTATTTCGTACAGAACAAGTGCTTTAGCCCATAGGGGACCAAAGGGGTTGGTGGTTTAAATCTCTTTATCCCATTTGTCCTATTTTTTTTAA
TAAAAAAAGTACACAAAATTAGTATGATCACATGCAAGTTTAGATTCTGCCACTTTTTGAGTTGGCTGCTATCACATGCAAGTTAGTCACACACGTATCGATAAG
ATTTCCAAAAAAAGGCACTGTCTTCCCTCTCCCAGATGGAAGAGCAGAGGCCTTCGTGTCCCCCTCCAAGCTTCCAAGATGAAATTTAGTCTTGGAAACATTTAT
ACTATCTTACCCACCTTCAGTTTGTTGCTATTCAAATGTTTGAATCCGAATGATATAATATAACCAAAGAAACATACAAATCGTAACTCAGAATTCAAACTAAAA
GAAATAGAGTTGGTTCTTGTGGCCATGAAACTTCAACACATTCTATACATAAAAGAACAATATTATCCACAAATATGATATGCCGTCTCATTCAGACAAAACCTT
GTCAAAATATTTTCCCCTTTGAAAGCTTAACATATGGGTCATCAACCCCCAATACATTGCAGATCAACAGCAAGATGCCACTACATGTAACATGAAAGAGTTAGG
AGGAGGAGGATCTCAGACTCCACGCCCCATGGACTGTTCTCCAGGTGGGATCATGACTAACACAGGACGAGCATTGAAACCTGGGTGGGGCATCCTCCGACGAAG
TTCACGACCTTCCTGGCAAAGTGCACACGTGTGACAGAAGACATGAGTTGCAAAGTCACAAACAGATTCACAGTGCTCACGTTGAACTTCATCTTCAACACAGAG
TCCGCAACAGCCACATGACCTATGAAGTGCCTCGCAGTTACCCTGCTCATAATAAAAAAAGGGATACAATTTATAAACTCTCCTATTAATTGAATTGAAACGTAA
CCACATTTTTTGCATCAAATAAATAGGTTCTTCAATGATGACCATGAACAATGCCCCCATAGTAGCTATTGTGAGGTAAAAGCAAAAGTCATCCGTCTCATTTTA
AGTCATAAGCCAACACAATGCATTAGTTCGCAGATATTCAGAGACAATAATAGATTATGGGTACAGGGTATCAAAGGAGTAGGTTTAACTTGCCTCCAAATTGAA
CATTCTACGAATAGCTGTACGAGTAGGATATGTAAACCATGGAGCCAGACAGTTCCAACCAAAGAAAGAGGTTCCAATTAAGTAGAGACCAGAATATGACATGCA
ATGGTTTGCAAAAGTCCCAGGAGTAGAAGACACAACTCTCTCTGCATTTGTTCCATACAGAATGCAAGGAGCCACACTTCCAAGAAGACCTACACAAACAGAGAT
TGTCAGTCACTTTGTTTTAGTTTCTCTAAATTCATTTCAACTTTTACCCATACTGATCCCTTTTCTATATGAAAATCTGAGTCCCTAATTCTCTCTGTAATCGAA
GTAGAAACCTAGGAGTGAACAGAAATCCCTCCCTGATAAAAAAAAGTTAACAGTAATACCCTCCACATTGAAGAGAAATCAAGAGAAACATGCCAACCAAGAAAA
TACAAGGATAGATAAGAATTTCTTTTGTTATTGTAATTCAAGCCATCTGACACCCAGGATTAGAATGGTTATTTATTGGAAGATTAAGGATTAGGCATAAGACTT
TTGAATTCTATGTAAAATATACATTGGAAACTTGATTATTGAAACCAATTATAAAGGCTGTGATTATGGTCACAAAACTCAGGCAAACAATCTTCAATGCCAAAC
CACCCATACAAGTTACAGCATGGTGTTAGAGACCAATAAATTCTTCATAGCCCAGATCTTATCTGAAACAAGTTATAGCATATTAAGATGTCGCATGCTTATATC
AAATATCCAATCTTCCGGAAAAAATTAGAGAGAAGATTTGAAAAGCCCAAATGCCATCCATTTGATCATTTCAGATTAATTTCCTCGTTAAGCAATAAAAAAATA
AATGGGATCAGTGGCCCATCGAATTCAAATTAATGAGAATTTTCATAATGAACAGTCAAGAAAAAAGAGATTCCCCTTCAGACGCAATCCCTAATCGCTGAAAAA
TCAGCAGAGTCTCAAACTCCAAAACCAGGGATAAAGAAGAATCACAGAACCCCAAAACCTAAGAATCCACCACCTTAAAAATCAATTCCAATAGAGAGGAAGAGA
GAGAGAGA

Protein sequence

Show/hide protein sequence

MEDDFDFGDKVPPAVNRMGNVIRDGEARGFNPGLIVLLVVGGLLFAFLVGNYALYMYAQKTLPPKKKKPVSKKKMKRERLKQGVSAPGE

CsGy6G023630 (gene) of Cucumber (Gy14) v2.1 genome