CuGenDBv2

Gene ID	Tan0019757
Organism	Trichosanthes anguina (Snake gourd v1)
Description	DNA-binding protein S1FA
Genome location	LG08:71321522..71323858
RNA-Seq Expression	Tan0019757
Synteny	Tan0019757
Gene Ontology terms	GO:0006355 - regulation of transcription, DNA-templated (biological process) GO:0005634 - nucleus (cellular component) GO:0016021 - integral component of membrane (cellular component) GO:0003677 - DNA binding (molecular function)
InterPro domains	IPR006779 - DNA binding protein S1FA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8651038.1 hypothetical protein Csa_000825 [Cucumis sativus]

3.4e-30

93.59

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNV+ND+EAKGFNP LIVLLLV GLLLIFL+GNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_004137812.1 DNA-binding protein S1FA [Cucumis sativus]

3.4e-30

93.59

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNV+ND+EAKGFNP LIVLLLV GLLLIFL+GNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_008442666.1 PREDICTED: DNA-binding protein S1FA-like [Cucumis melo]

9.9e-30

93.59

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNV+NDVEAKGFNP LIVLLLV GLLL FL+GNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_023005220.1 DNA-binding protein S1FA-like isoform X1 [Cucurbita maxima]

1.5e-30

96.15

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNVMNDV AKGFNPGL+VLLLV GLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

XP_038905724.1 DNA-binding protein S1FA-like [Benincasa hispida]

2.6e-30

94.87

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNV+NDVEAKGFNP LIVLLLV GLLLIFL+GNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LAW3 DNA-binding protein S1FA

1.6e-30

93.59

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNV+ND+EAKGFNP LIVLLLV GLLLIFL+GNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A1S3B680 DNA-binding protein S1FA-like

4.8e-30

93.59

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNV+NDVEAKGFNP LIVLLLV GLLL FL+GNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A6J1GGV1 DNA-binding protein S1FA-like isoform X2

6.3e-30

94.87

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGK NVMNDV AKGFNPGL+VLLLV GLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A6J1IZV9 DNA-binding protein S1FA-like

1.4e-29

92.31

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNV+NDVEAKG NP LIVLLLV GLLLIFL+GNYALYLYAQKNLPPKKKKPVSKKKMKR+RLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

A0A6J1KWU8 DNA-binding protein S1FA-like isoform X1

7.4e-31

96.15

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        MASANGKGNVMNDV AKGFNPGL+VLLLV GLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

SwissProt top hits

e value

%identity

Alignment

P42551 DNA-binding protein S1FA1

8.7e-21

79.69

Show/hide

Query:  EAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        EAKG NPGLIVLL+V G LL+FLI NY LY+YAQKNLPP+KKKPVSKKK+KRE+LKQGV  PGE
Subjt:  EAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

P42552 DNA-binding protein S1FA

2.5e-23

79.41

Show/hide

Query:  MNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        +N+VEAKG NPGLIVLL++ GLLL FL+GN+ LY YAQKNLPPKKKKP+SKKKMKRERLKQGV+ PGE
Subjt:  MNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

Q42337 DNA-binding protein S1FA2

1.5e-20

66.67

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        M+S    G  +  VEAKG NPGLIVLL++ GLL+ FLI NY +Y+YAQKNLPP+KKKP+SKKK+KRE+LKQGV  PGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

Q7XLX6 DNA-binding protein S1FA2

1.1e-20

Show/hide

Query:  ANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        A+   NV+ +   KG NPG+IVL++V+  LL+F +GNYALY+YAQK LPP+KKKPVSKKKMKRE+LKQGVSAPGE
Subjt:  ANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

Q93VI0 DNA-binding protein S1FA3

1.5e-20

73.85

Show/hide

Query:  VEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        +E+KG NPGLIVLL++ GLLL FL+GN+ LY YAQKNLPP+KKKPVSKKKMK+E++KQGV  PGE
Subjt:  VEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

Arabidopsis top hits

e value

%identity

Alignment

AT2G37120.1 S1FA-like DNA-binding protein

1.1e-21

66.67

Show/hide

Query:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        M+S    G  +  VEAKG NPGLIVLL++ GLL+ FLI NY +Y+YAQKNLPP+KKKP+SKKK+KRE+LKQGV  PGE
Subjt:  MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

AT3G09735.1 S1FA-like DNA-binding protein

1.1e-21

73.85

Show/hide

Query:  VEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        +E+KG NPGLIVLL++ GLLL FL+GN+ LY YAQKNLPP+KKKPVSKKKMK+E++KQGV  PGE
Subjt:  VEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

AT3G53370.1 S1FA-like DNA-binding protein

6.2e-22

79.69

Show/hide

Query:  EAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        EAKG NPGLIVLL+V G LL+FLI NY LY+YAQKNLPP+KKKPVSKKK+KRE+LKQGV  PGE
Subjt:  EAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

AT3G53370.2 S1FA-like DNA-binding protein

6.7e-08

78.79

Show/hide

Query:  YAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE
        +A KNLPP+KKKPVSKKK+KRE+LKQGV  PGE
Subjt:  YAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTTCAGCCAATGGCAAGGGAAATGTGATGAATGATGTTGAAGCAAAAGGATTCAATCCAGGGCTAATTGTACTTCTTCTTGTTAGTGGGTTGCTGCTGATTTTCCT
CATAGGGAACTATGCACTTTACTTATATGCACAGAAGAATCTCCCTCCCAAGAAGAAAAAGCCAGTATCTAAAAAGAAGATGAAGAGGGAAAGACTGAAGCAAGGAGTGT
CTGCACCTGGAGAGTAA

mRNA sequence

Show/hide mRNA sequence

GTCGTACGTGAGCCCATTACGATGAAAAGAGCGGCCCATAGAAATCGCGGGACTCGGGTGGACCGAATCGCCGATTTATATGAATCTTCTCCTTTTTCTTAGATCTCGCT
GACATTTTTCCGTCAACGCTTCACCGCCGATCTGATCCGTACAATTTCCTATATTCAGGATCTTCCTGCCGGCCGATCTATCCGGCTCTAAGTTGTAGTCATGGCTTCAG
CCAATGGCAAGGGAAATGTGATGAATGATGTTGAAGCAAAAGGATTCAATCCAGGGCTAATTGTACTTCTTCTTGTTAGTGGGTTGCTGCTGATTTTCCTCATAGGGAAC
TATGCACTTTACTTATATGCACAGAAGAATCTCCCTCCCAAGAAGAAAAAGCCAGTATCTAAAAAGAAGATGAAGAGGGAAAGACTGAAGCAAGGAGTGTCTGCACCTGG
AGAGTAAAAAAAACCCAAGAAAAAATATTCAACCTCCCAAGGTTTCCTTCTCTGTAGAACGTTTTGATTTTCAAAAATTTTCCTTCATAGACTGCCTAGAAAGTTGTTAC
AGTTGTTTATTTCTTTTATCTACTGTTTTAACTCTTCAGAAATCGAACTTGATTGTGAGTTTTTAGCTCATATTACATTACATGGGCTCTTTTCTCAAGGTTCCATTGAC
TCTTTTCTACTTATTCCCTTCTTTTTGGTACACACCAGAAAGATTTCTGTTTCTCCATCTTTAAACAGCCTTAACTCAGTCCCTTTTACTGTTAGAATCTTTTCTTTTTT
TGCCTTTAATCTTTCAATAAATGGTGGGGTTAGATTGTAGACTCTACAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGATTGCATGGTTGAGTGATGGATCTGTGTAAC
TCTCTGTTTAGAAGGTACAAAACACTCTTTTCAACAGGAAGACACTCATAAATTTGTCACAAGGAACATGTAGATTGTAGAGTCAACTAAGGAAAAGACATGGTTCTTCA
AGGGGCCATTACTTGTTTGAATCACGTGGAACACTAGAGAACATTGAAGGCCAGAAAAGCTTTCCTTTTACTGAAGCAAGTAAGTCATCTTGTCCCCTTGTGTTTTTGTG
GGATTCATTGTTTTCAAGTCTCGATCAATATAATTGTGAATTCTGTCCAAACAGGCAATGCTGATATAAAACACTCAGCTTTTAAGCCTTTTACTATTTTGTTATGTTGG
CTTCTAGCTCAGTTGCTTGCTTTGCTATACTCCCGCAGGCAAGTCAGTGGCTTTTGATATGGGCAAAAGCAGCCCATTTTTGCTTTTAACATTACTTGTGGTGAAGTCAC
AGTACCTGATTTCATTAAATTTAGGTTGTGTGTATTTGTGTTTTGTTGGAATGGTAGATGGGGGACTAAATTCTTGGCTTGTTTTATTTATATATTGTCATCTTGTTTAA
GTACCTCGGCATAGTTCAAATGACTAAGATATATATTGTCGACCAAGATGTTTGAGGTTCGAATCTCCACTCTACATGGTGTTGCCTAAAGAGC

Protein sequence

Show/hide protein sequence

MASANGKGNVMNDVEAKGFNPGLIVLLLVSGLLLIFLIGNYALYLYAQKNLPPKKKKPVSKKKMKRERLKQGVSAPGE

Tan0019757 (gene) of Snake gourd v1 genome