CuGenDBv2

Gene ID	Sed0025179
Organism	Sechium edule (Chayote v1)
Description	transcription factor SCREAM2-like isoform X1
Genome location	LG03:2138423..2140236
RNA-Seq Expression	Sed0025179
Synteny	Sed0025179
Gene Ontology terms	GO:0006355 - regulation of transcription, DNA-templated (biological process) GO:0005634 - nucleus (cellular component) GO:0003700 - DNA-binding transcription factor activity (molecular function) GO:0005488 - binding (molecular function) GO:0043565 - sequence-specific DNA binding (molecular function) GO:0046983 - protein dimerization activity (molecular function)
InterPro domains	IPR036638 - Helix-loop-helix DNA-binding domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022939238.1 uncharacterized protein LOC111445214 isoform X2 [Cucurbita moschata]

6.0e-58

82.28

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE NNA+LH  LQLLRSITNSHA NKASIIVDASKYI+ELK KVERLNQDIST   S      HPMQVTVE+L KGFSINVFSEKSCQGLLVSIL+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        FE+L LNV+EARVSCTD+FQLQAI EIEEQGEEAI+AQ VKEAVVQAIK WSQSGEQD
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

XP_022964712.1 uncharacterized protein LOC111464709 isoform X1 [Cucurbita moschata]

2.7e-58

81.01

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE   A LHEKLQLLRSITNSHA NK SIIVDASKYI+ELK KVERLNQDI+T  + N  H +HPMQVTVE LVKGFSINVFSEKSCQGLLVSIL+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        FE+L LNV+EARVSCTDTFQLQA  EIEEQGEEA++AQ VKEAVV+AIKSWSQ+GEQD
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

XP_023551077.1 uncharacterized protein LOC111809011 isoform X2 [Cucurbita pepo subsp. pepo]

3.5e-58

82.28

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE NNA+LH  LQLLRSITNSHA NKASIIVDASKYI+ELK KVERLNQDIST   S      HPMQVTVE+L KGFSINVFSEKSCQGLLVSIL+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        FE+L LNV+EARVSCTD+FQLQAI EIEEQGEEAI+AQ VKEAVVQAIK WSQSGEQD
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

XP_038884496.1 uncharacterized protein LOC120075304 isoform X1 [Benincasa hispida]

1.2e-58

82.82

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQDISTNSLSNH----HHHHHPMQVTVETLVKGFSINVFSEKSCQGLLV
        MVSRE   A LHEKLQLLRSITNSHAQ NKASIIVDASKYI+ELK KVERLNQDIST   S H     H + PMQVTVE LVKGFSINVFSEKSCQGLLV
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQDISTNSLSNH----HHHHHPMQVTVETLVKGFSINVFSEKSCQGLLV

Query:  SILQVFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        SIL+VFE+L LNVIEARVSCTDTFQLQAI EIEE+GEEAI+AQ VKEAVVQAIKSW QSGEQD
Subjt:  SILQVFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

XP_038884497.1 uncharacterized protein LOC120075304 isoform X2 [Benincasa hispida]

3.2e-59

82.72

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNH----HHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVS
        MVSRE   A LHEKLQLLRSITNSHA NKASIIVDASKYI+ELK KVERLNQDIST   S H     H + PMQVTVE LVKGFSINVFSEKSCQGLLVS
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNH----HHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVS

Query:  ILQVFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        IL+VFE+L LNVIEARVSCTDTFQLQAI EIEE+GEEAI+AQ VKEAVVQAIKSW QSGEQD
Subjt:  ILQVFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

TrEMBL top hits

e value

%identity

Alignment

A0A6J1FG89 uncharacterized protein LOC111445214 isoform X1

1.1e-57

82.39

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQ
        MVSRE NNA+LH  LQLLRSITNSHAQ NKASIIVDASKYI+ELK KVERLNQDIST   S      HPMQVTVE+L KGFSINVFSEKSCQGLLVSIL+
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQ

Query:  VFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
         FE+L LNV+EARVSCTD+FQLQAI EIEEQGEEAI+AQ VKEAVVQAIK WSQSGEQD
Subjt:  VFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

A0A6J1FL41 uncharacterized protein LOC111445214 isoform X2

2.9e-58

82.28

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE NNA+LH  LQLLRSITNSHA NKASIIVDASKYI+ELK KVERLNQDIST   S      HPMQVTVE+L KGFSINVFSEKSCQGLLVSIL+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        FE+L LNV+EARVSCTD+FQLQAI EIEEQGEEAI+AQ VKEAVVQAIK WSQSGEQD
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

A0A6J1HIH6 uncharacterized protein LOC111464709 isoform X1

1.3e-58

81.01

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE   A LHEKLQLLRSITNSHA NK SIIVDASKYI+ELK KVERLNQDI+T  + N  H +HPMQVTVE LVKGFSINVFSEKSCQGLLVSIL+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        FE+L LNV+EARVSCTDTFQLQA  EIEEQGEEA++AQ VKEAVV+AIKSWSQ+GEQD
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

A0A6J1JV46 uncharacterized protein LOC111487778 isoform X1

1.3e-58

81.01

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE   A LHEKLQLLRSITNSHA NK SIIVDASKYI+ELK KVERLNQDI+T  + N  H +HPMQVTVE LVKGFSINVFSEKSCQGLLVSIL+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        FE+L LNV+EARVSCTDTFQLQA  EIEEQGEEA++AQ VKEAVV+AIKSWSQ+GEQD
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

A0A6J1K013 uncharacterized protein LOC111489817 isoform X2

4.9e-58

81.65

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE NNA LH  LQLLRSITNSHA NKASIIVDASKYI+ELK KVERLNQDIST   S      HPMQVTVE+L KGFSINVFSEKSCQGLLVSIL+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD
        FE+L LNV+EARVSCTD+FQLQAI EIEE+GEEAI+AQ VKEAVVQAIK WSQSGEQD
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G29270.1 unknown protein

1.0e-07

29.37

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITN--SHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSIL
        MV+ E        K   L+++T+       ++ +I +A  YI  LK ++E L ++     ++     H   +V VE + + F + + S +  +  LV+IL
Subjt:  MVSRELNNATLHEKLQLLRSITN--SHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSIL

Query:  QVFEDLRLNVIEARVSCTDTFQLQAI
        + FE++ LNV +AR SC D+F ++AI
Subjt:  QVFEDLRLNVIEARVSCTDTFQLQAI

AT2G40435.1 BEST Arabidopsis thaliana protein match is: transcription regulators (TAIR:AT3G56220.1)

1.9e-38

57.52

Show/hide

Query:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV
        MVSRE    +L EK QLLRSITNSHA+N  SII+DASKYI++LK KVER NQD +    S+         VTVETL KGF INVFS K+  G+LVS+L+ 
Subjt:  MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQV

Query:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQ
        FED+ LNV+EAR SCTD+F L A+G   E GE  ++A+ VK+AV  AI+SW +
Subjt:  FEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQ

AT3G56220.1 transcription regulators

3.4e-35

54.19

Show/hide

Query:  MVSRE-LNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQ
        MVSRE    ++L EK  LLRSIT+SHA+++ SIIVDASKYIK+LK KVE++N   ++          +PM VTVETL KGF I V S K+  G+LV +L+
Subjt:  MVSRE-LNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQ

Query:  VFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQS
         FEDL L+V+EARVSCTDTF L AIG       + I+A+ VK+AV +AI++WS S
Subjt:  VFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQS

AT5G10570.1 basic helix-loop-helix (bHLH) DNA-binding superfamily protein

1.1e-04

29.66

Show/hide

Query:  LHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQD---ISTNS-LSNHHHHHHPMQVTVETLVKGFSINVFSEKSC---QGLLVSILQVFE
        L+++L LLRSI     + ++ SI+ DA  Y+KEL  K+ +L +D   + +NS LS    +   ++ +++  V    +N   +  C    GL+VS +   E
Subjt:  LHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQD---ISTNS-LSNHHHHHHPMQVTVETLVKGFSINVFSEKSC---QGLLVSILQVFE

Query:  DLRLNVIEARVSCTDTFQLQA-IGEIEEQGEEAINAQVVKEAVVQ
         L L + +  +SC   F LQA   E+ EQ    + ++  K+A+++
Subjt:  DLRLNVIEARVSCTDTFQLQA-IGEIEEQGEEAINAQVVKEAVVQ

AT5G65640.1 beta HLH protein 93

6.9e-04

28.48

Show/hide

Query:  LHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPM-----QVTVETLVKG---FSINVFSEKS-----CQ---GL
        L+++L +LRSI    ++ ++ SI+ DA  Y+KEL  K+ +L  +      SN+ HH             E LV+    F I+   E +     C    GL
Subjt:  LHEKLQLLRSITNSHAQ-NKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPM-----QVTVETLVKG---FSINVFSEKS-----CQ---GL

Query:  LVSILQVFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAV
        L+S +   E L L + +  +SC   F LQA      +  + I ++ +K+A+
Subjt:  LVSILQVFEDLRLNVIEARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTTCTAGAGAGCTCAACAATGCAACTCTTCATGAAAAGCTTCAATTACTTCGCTCTATTACCAACTCTCATGCTCAAAACAAGGCTTCAATTATAGTGGATGCATC
AAAATATATCAAGGAGCTAAAACACAAAGTAGAAAGATTGAATCAAGACATATCAACCAACTCACTTTCTAATCATCATCATCATCATCATCCCATGCAGGTTACAGTGG
AAACCCTAGTAAAGGGATTTTCTATAAATGTATTTTCAGAGAAAAGCTGCCAAGGTCTCCTTGTCTCAATATTACAAGTCTTTGAAGACCTGAGGCTTAATGTTATTGAA
GCTAGGGTTTCTTGTACTGACACTTTCCAATTACAAGCCATTGGAGAAATTGAGGAACAAGGAGAAGAAGCCATTAATGCTCAAGTTGTAAAAGAAGCAGTAGTTCAAGC
TATAAAGAGCTGGAGTCAAAGCGGTGAACAAGATTAA

mRNA sequence

Show/hide mRNA sequence

GGGGAAAGCTAGCAAACAGAAGATATCATATATAGATTTGAGAGCTCATATTATGATGCCCCTTATAAAAACACACTCTCACAGAAATTTTTGCAGAGTGAAAATTAAGA
ACAAAAAAGAAAAAAGAAAAAAAAGAAGATATATTTGAATCCATGGTTTCTAGAGAGCTCAACAATGCAACTCTTCATGAAAAGCTTCAATTACTTCGCTCTATTACCAA
CTCTCATGCTCAAAACAAGGCTTCAATTATAGTGGATGCATCAAAATATATCAAGGAGCTAAAACACAAAGTAGAAAGATTGAATCAAGACATATCAACCAACTCACTTT
CTAATCATCATCATCATCATCATCCCATGCAGGTTACAGTGGAAACCCTAGTAAAGGGATTTTCTATAAATGTATTTTCAGAGAAAAGCTGCCAAGGTCTCCTTGTCTCA
ATATTACAAGTCTTTGAAGACCTGAGGCTTAATGTTATTGAAGCTAGGGTTTCTTGTACTGACACTTTCCAATTACAAGCCATTGGAGAAATTGAGGAACAAGGAGAAGA
AGCCATTAATGCTCAAGTTGTAAAAGAAGCAGTAGTTCAAGCTATAAAGAGCTGGAGTCAAAGCGGTGAACAAGATTAA

Protein sequence

Show/hide protein sequence

MVSRELNNATLHEKLQLLRSITNSHAQNKASIIVDASKYIKELKHKVERLNQDISTNSLSNHHHHHHPMQVTVETLVKGFSINVFSEKSCQGLLVSILQVFEDLRLNVIE
ARVSCTDTFQLQAIGEIEEQGEEAINAQVVKEAVVQAIKSWSQSGEQD

Sed0025179 (gene) of Chayote v1 genome