CuGenDBv2

Gene ID	Tan0017987
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Sequence-specific DNA binding transcription factors
Genome location	LG07:11800749..11802071
RNA-Seq Expression	Tan0017987
Synteny	Tan0017987
Gene Ontology terms	NA
InterPro domains	IPR044822 - Myb/SANT-like DNA-binding domain 4

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6605907.1 hypothetical protein SDJN03_03224, partial [Cucurbita argyrosperma subsp. sororia]

3.4e-228

91.06

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE
        MDSSGLGGGFL+GN GLLDLESPIRRHQQTQL+N SLTHRHHL MM+T EGDHQ +GIMDTK LG KD+SMTFTKGK      VTNN+NTSEEDEPSFTE
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE

Query:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DG+CTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW
        SCRVVENPALMDSMPHLSSK KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILPV NFSKGNN+ EEADDSDSDSDESDNEDDH+PEENRLW
Subjt:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW

Query:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL
        PAESRGRDK SADDGPLWS T+AQNEFEGQIDVFLSDP K QWERRDWIKKQM+QLQEQC+SFQAQS ELEKQRFKWLRYCSKK+RDLER+RLENERM++
Subjt:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL

Query:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG
        DNERRVLQLKQKEMELEFKRSDSSF PTLGIDRIQG
Subjt:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG

XP_022957960.1 uncharacterized protein LOC111459338 [Cucurbita moschata]

6.9e-229

91.28

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE
        MDSSGLGGGFL+GN GLLDLESPIRRHQQTQL+N SLTHRHHL MM+T EGDHQS+GIMDTK LG KD+SMTFTKGK      VTNN+NTSEEDEPSFTE
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE

Query:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DG+CTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW
        SCRVVENPALMDSMPHLSSK KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILPV NFSKGNN+ EEADDSDSDSDESDNEDDH+PEENRLW
Subjt:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW

Query:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL
        PAESRGRDK SADDGPLWS T+AQNEFEGQIDVFLSDP K QWERRDWIKKQM+QLQEQC+SFQAQS ELEKQRFKWLRYCSKK+RDLER+RLENERM++
Subjt:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL

Query:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG
        DNERRVLQLKQKEMELEFKRSDSSF PTLGIDRIQG
Subjt:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG

XP_022995089.1 uncharacterized protein LOC111490737 [Cucurbita maxima]

3.4e-228

90.6

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE
        MDSSGLGGGFL+GN GLLDLESPIRRHQQTQL+N SLTHRHHL MM+T EGDHQS+GIMDTK +G KD+SMTFTKGK      VTNN+NTSEEDEPSFTE
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE

Query:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DG+CTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW
        SCRVVENPALMDSMPHLSSK KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILPV NFS+GNN+ EEADDSDSDSDESDNEDDH+PEENRLW
Subjt:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW

Query:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL
        PA+SRGRDK SADDGPLWSNT+AQNE EGQIDVFLSDP K QWERRDWIKKQM+QLQEQC+SFQAQS ELEKQRFKWLRYCSKK+RDLER+RLENERM++
Subjt:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL

Query:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG
        DNERRVLQLKQKEMELEFKRSDSSF PTLGIDRIQG
Subjt:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG

XP_023534092.1 uncharacterized protein LOC111795758 [Cucurbita pepo subsp. pepo]

7.6e-228

90.83

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE
        MDSSGLGGGFL+GN GLLDLESPIRRHQQTQL+N SLTHRHHL MM+T E DHQS+GIMDTK LG KD+SMTFTKGK      VTNN+NTSEEDEPSFTE
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE

Query:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DG+CT+FLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW
        SCRVVENPALMDSMPHLSSK KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILPV NFSKGNN+ EEADDSDSDSDESDNEDDH+PEENRLW
Subjt:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW

Query:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL
        PAESRGRDK SADDGPLWS T+AQNEFEGQIDVFLSDP K QWERRDWIKKQM+QLQEQC+SFQAQS ELEKQRFKWLRYCSKK+RDLER+RLENERM++
Subjt:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL

Query:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG
        DNERRVLQLKQKEMELEFKRSDSSF PTLGIDRIQG
Subjt:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG

XP_038901508.1 uncharacterized protein LOC120088355 [Benincasa hispida]

2.3e-224

87.47

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE
        MDSSGLGGGFL+GN GL+DLESPIRR Q+TQLVNPSLTHRHHLNMMSTFEGDH S+G +DTKSLGQKD+ M F KGK      +TNNN TSEEDEPSFTE
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE

Query:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DG+C EFLKGKKGSPWQRMKWTD+IVRLLIAVVACVGDDGEAG GSKRKSGILQKKGKWK +SKIM+SKGCHVSPQQCEDKFNDLNKRYKRLNDI+G+GT
Subjt:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENR
        SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILPVANFSKGNN+ +EA+DSDSDSD  ESDNEDDH P ENR
Subjt:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENR

Query:  LWPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERM
        LWP+ESRGRDKVSADDGPLWSN+ A+NEFEG+IDVFLSDP KSQWERRDW++KQM+QLQEQC +FQAQSVELEKQRFKWLRYCSKKNRDLER RLENERM
Subjt:  LWPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERM

Query:  RLDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH
        +LDNERRVLQLKQKEMELE KR DSSF PTLGIDRIQGREQ+DLGRH
Subjt:  RLDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BM36 uncharacterized protein LOC103491522

4.2e-216

85.43

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTN----NNNTSEEDEPSFTED
        MDSSGLGGGFL+GN GLLDLESPIRR Q+TQLVNPSLT RH LNMMS FEGDHQSIGI+D+KSLGQKD+ M F +GK + +    NN TSEEDEPS+TED
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTN----NNNTSEEDEPSFTED

Query:  GDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGTS
        G+C+EFLKGKKGSPWQRMKWTD+IVRLLIAVVACVGDDGEAGMGSKRKSGIL KKGKW+ VSKIM SKGCHVSPQQCEDKFNDLNKRYKRLNDILG+GTS
Subjt:  GDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGTS

Query:  CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENRL
        CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILP ANFSKGNN+ EEA+DSDSDSD  ESDNEDDH P ENRL
Subjt:  CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENRL

Query:  WPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMR
        W +ESRGRDKVSADDGPLWSN+  +NEFEGQIDVFLSDP KSQWER+ WIKKQM+QLQEQC SFQAQSVELEKQRFKWLRYCSKKNRDLER RLENERM+
Subjt:  WPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMR

Query:  LDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH
        LDNE+RVLQLK+KEMELE KRSDS+  P L  DRIQGREQ+DLG H
Subjt:  LDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH

A0A5A7TE21 Stress response protein nst1 isoform X1

4.2e-216

85.43

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTN----NNNTSEEDEPSFTED
        MDSSGLGGGFL+GN GLLDLESPIRR Q+TQLVNPSLT RH LNMMS FEGDHQSIGI+D+KSLGQKD+ M F +GK + +    NN TSEEDEPS+TED
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTN----NNNTSEEDEPSFTED

Query:  GDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGTS
        G+C+EFLKGKKGSPWQRMKWTD+IVRLLIAVVACVGDDGEAGMGSKRKSGIL KKGKW+ VSKIM SKGCHVSPQQCEDKFNDLNKRYKRLNDILG+GTS
Subjt:  GDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGTS

Query:  CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENRL
        CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILP ANFSKGNN+ EEA+DSDSDSD  ESDNEDDH P ENRL
Subjt:  CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENRL

Query:  WPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMR
        W +ESRGRDKVSADDGPLWSN+  +NEFEGQIDVFLSDP KSQWER+ WIKKQM+QLQEQC SFQAQSVELEKQRFKWLRYCSKKNRDLER RLENERM+
Subjt:  WPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMR

Query:  LDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH
        LDNE+RVLQLK+KEMELE KRSDS+  P L  DRIQGREQ+DLG H
Subjt:  LDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH

A0A5D3BB81 Stress response protein nst1 isoform X1

1.9e-216

85.65

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTN----NNNTSEEDEPSFTED
        MDSSGLGGGFL+GN GLLDLESPIRR Q+TQLVNPSLT RH LNMMS FEGDHQSIGI+D+KSLGQKD+ M F +GK + +    NN TSEEDEPS+TED
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTN----NNNTSEEDEPSFTED

Query:  GDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGTS
        G+C+EFLKGKKGSPWQRMKWTD+IVRLLIAVVACVGDDGEAGMGSKRKSGIL KKGKWK VSKIM SKGCHVSPQQCEDKFNDLNKRYKRLNDILG+GTS
Subjt:  GDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGTS

Query:  CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENRL
        CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILP ANFSKGNN+ EEA+DSDSDSD  ESDNEDDH P ENRL
Subjt:  CRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSD--ESDNEDDHFPEENRL

Query:  WPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMR
        W +ESRGRDKVSADDGPLWSN+  +NEFEGQIDVFLSDP KSQWER+ WIKKQM+QLQEQC SFQAQSVELEKQRFKWLRYCSKKNRDLER RLENERM+
Subjt:  WPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMR

Query:  LDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH
        LDNE+RVLQLK+KEMELE KRSDS+  P L  DRIQGREQ+DLG H
Subjt:  LDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH

A0A6J1H0P0 uncharacterized protein LOC111459338

3.3e-229

91.28

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE
        MDSSGLGGGFL+GN GLLDLESPIRRHQQTQL+N SLTHRHHL MM+T EGDHQS+GIMDTK LG KD+SMTFTKGK      VTNN+NTSEEDEPSFTE
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE

Query:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DG+CTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW
        SCRVVENPALMDSMPHLSSK KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILPV NFSKGNN+ EEADDSDSDSDESDNEDDH+PEENRLW
Subjt:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW

Query:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL
        PAESRGRDK SADDGPLWS T+AQNEFEGQIDVFLSDP K QWERRDWIKKQM+QLQEQC+SFQAQS ELEKQRFKWLRYCSKK+RDLER+RLENERM++
Subjt:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL

Query:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG
        DNERRVLQLKQKEMELEFKRSDSSF PTLGIDRIQG
Subjt:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG

A0A6J1K4Q0 uncharacterized protein LOC111490737

1.7e-228

90.6

Show/hide

Query:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE
        MDSSGLGGGFL+GN GLLDLESPIRRHQQTQL+N SLTHRHHL MM+T EGDHQS+GIMDTK +G KD+SMTFTKGK      VTNN+NTSEEDEPSFTE
Subjt:  MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKT-----VTNNNNTSEEDEPSFTE

Query:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DG+CTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW
        SCRVVENPALMDSMPHLSSK KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVD QGKILPV NFS+GNN+ EEADDSDSDSDESDNEDDH+PEENRLW
Subjt:  SCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLW

Query:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL
        PA+SRGRDK SADDGPLWSNT+AQNE EGQIDVFLSDP K QWERRDWIKKQM+QLQEQC+SFQAQS ELEKQRFKWLRYCSKK+RDLER+RLENERM++
Subjt:  PAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRL

Query:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG
        DNERRVLQLKQKEMELEFKRSDSSF PTLGIDRIQG
Subjt:  DNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G21200.1 sequence-specific DNA binding transcription factors

3.9e-81

41.96

Show/hide

Query:  MDSSGLGGGFL---AGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTNNNNTSEEDEPSFTE--
        MD +   GG +   A + G  DL+  +R H Q  +   +  HRH+ N     EG   ++    T    Q        + K     N+ S++DEPSFTE  
Subjt:  MDSSGLGGGFL---AGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTNNNNTSEEDEPSFTE--

Query:  -DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRG
         DG   E  +  KGSPWQR+KWTD +V+LLI  V+ +GDD      S+RK  +LQKKGKWK VSK+M  +G HVSPQQCEDKFNDLNKRYK+LND+LGRG
Subjt:  -DGDCTEFLKGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRG

Query:  TSCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNND--------LEEADDSDSDSDESDNEDD
        TSC+VVENPAL+DS+ +L+ K KDDVRKI+SSKHLFY+EMC+YHNG  +    D+ LQ + L +A  S+ ++D        +E+ DD D D D   +E D
Subjt:  TSCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNND--------LEEADDSDSDSDESDNEDD

Query:  HFPEENRLW------------PAESRGRDKVSADDG--PLWSNTAAQNEFE------GQIDVFL--SDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVE
         + E++  +                + R  +S +DG  P   N+   N+         Q DV    ++  ++   ++ W++ + +QL+EQ +  Q + +E
Subjt:  HFPEENRLW------------PAESRGRDKVSADDG--PLWSNTAAQNEFE------GQIDVFL--SDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVE

Query:  LEKQRFKWLRYCSKKNRDLERVRLENERMRLDNERRVLQLKQKEMELE
        LEKQRF+W R+  K++++LER+R+ENERM+L+N+R  L+LKQ+E+ +E
Subjt:  LEKQRFKWLRYCSKKNRDLERVRLENERMRLDNERRVLQLKQKEMELE

AT1G76870.1 BEST Arabidopsis thaliana protein match is: sequence-specific DNA binding transcription factors (TAIR:AT1G21200.1)

3.5e-61

38.89

Show/hide

Query:  TVTNNNNTSEEDEPSFTEDGDCTEFL-----KGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQ
        T+   +N  +  + S +ED +          K K+ SPWQR+KW D +V+L+I  ++ +G+D     GS +K  +LQKKGKW+ VSK+M  +G HVSPQQ
Subjt:  TVTNNNNTSEEDEPSFTEDGDCTEFL-----KGKKGSPWQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQ

Query:  CEDKFNDLNKRYKRLNDILGRGTSCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEE--
        CEDKFNDLNKRYK+LN++LGRGTSC VVENP+L+D + +L+ K KD+VR+I+SSKHLFY+EMC+YHNG  +    D  +Q  +  +   S+ ++D +E  
Subjt:  CEDKFNDLNKRYKRLNDILGRGTSCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEE--

Query:  ---ADDSDSDSDESDNEDDHFPEENRLWPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEK
            +D D D D  ++ D    +       +S+  + V   +         +++ +    + L D  K+   +R  I+ + ++L+ + +  QA+ +ELE+
Subjt:  ---ADDSDSDSDESDNEDDHFPEENRLWPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEK

Query:  QRFKWLRYCSKKNRDLERVRLENERMRLDNERRVLQLKQKEM
        Q+FKW  +  ++ + L ++R+ENERM+L+NER  L+LK+ E+
Subjt:  QRFKWLRYCSKKNRDLERVRLENERMRLDNERRVLQLKQKEM

AT3G10040.1 sequence-specific DNA binding transcription factors

4.7e-66

39.95

Show/hide

Query:  EEDEPSFTEDGDCTEFLKGKKG----SPWQRMKWTDDIVRLLIAVVACVGDDGEAGMG----SKRKS----------GILQKKGKWKMVSKIMISKGCHV
        +ED  S +  G   E   G  G    S W RMKWTD +VRLLI  V  +GD  EAG+     +K+K+          G+LQKKGKWK VS+ M+ KG  V
Subjt:  EEDEPSFTEDGDCTEFLKGKKG----SPWQRMKWTDDIVRLLIAVVACVGDDGEAGMG----SKRKS----------GILQKKGKWKMVSKIMISKGCHV

Query:  SPQQCEDKFNDLNKRYKRLNDILGRGTSCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNG----------------QTIP------GC
        SPQQCEDKFNDLNKRYKR+NDILG+G +CRVVEN  L++SM HL+ K KD+V+K+L+SKHLF++EMCAYHN                  +IP       C
Subjt:  SPQQCEDKFNDLNKRYKRLNDILGRGTSCRVVENPALMDSMPHLSSKAKDDVRKILSSKHLFYKEMCAYHNG----------------QTIP------GC

Query:  QDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLWPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKK
              GK+  +A   +   ++E     DS+S+  ++E++   ++ R+  A  R R++ ++                      + D  KS WE+++WI++
Subjt:  QDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLWPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFLSDPAKSQWERRDWIKK

Query:  QMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRLDNERRVLQLKQKEMEL-EFKRSDSSFEPT
        +M++++E+ I ++ + VE+EKQR KW+RY SKK R++E+ +L+N+R RL+ ER +L L++ E+EL E + S +  +P+
Subjt:  QMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRLDNERRVLQLKQKEMEL-EFKRSDSSFEPT

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATAGTTCAGGTCTGGGAGGTGGATTTCTGGCAGGAAATAGGGGGCTACTAGATCTGGAGTCTCCTATTCGAAGACATCAACAGACCCAATTGGTCAATCCCTCATT
GACACACCGACATCACTTGAACATGATGAGCACTTTTGAAGGCGATCACCAATCCATTGGGATTATGGACACGAAAAGCTTGGGACAGAAAGATATTTCGATGACCTTTA
CTAAAGGGAAAACCGTCACAAACAACAATAACACGAGTGAAGAAGATGAGCCTAGTTTTACTGAGGATGGTGACTGCACTGAGTTTTTGAAGGGCAAAAAGGGTTCCCCA
TGGCAGAGAATGAAGTGGACAGATGACATTGTGAGGCTTCTCATAGCAGTGGTTGCTTGTGTGGGTGATGACGGTGAGGCTGGAATGGGCTCGAAGAGAAAATCTGGAAT
TTTGCAAAAGAAGGGAAAATGGAAAATGGTGTCAAAGATTATGATAAGTAAGGGGTGTCATGTTTCTCCCCAGCAGTGTGAGGACAAATTTAATGACTTAAACAAAAGAT
ACAAGAGATTGAACGATATTCTTGGGAGGGGAACCAGTTGTAGGGTTGTGGAGAACCCTGCACTTATGGACTCAATGCCTCACCTCTCAAGTAAAGCCAAGGATGATGTC
AGAAAAATATTGAGCTCAAAACACTTGTTTTATAAGGAAATGTGTGCTTACCATAATGGACAAACAATTCCTGGTTGCCAGGATGTTGATTTACAAGGTAAGATTTTACC
TGTTGCAAATTTCTCCAAAGGAAATAATGATTTAGAAGAGGCTGATGACAGTGATAGTGACAGTGATGAATCAGATAATGAAGATGATCACTTTCCTGAGGAAAATAGAT
TATGGCCGGCTGAATCTCGTGGCAGGGATAAAGTGAGTGCAGATGATGGTCCACTTTGGTCAAACACTGCTGCACAAAATGAATTTGAAGGTCAAATTGATGTTTTTCTT
TCGGATCCAGCAAAGTCCCAATGGGAGCGTAGAGATTGGATTAAAAAACAGATGGTACAACTTCAGGAGCAATGTATCAGCTTCCAGGCTCAATCTGTTGAACTTGAGAA
ACAACGTTTCAAATGGTTAAGATATTGCAGTAAGAAAAATAGGGATTTGGAGAGAGTGAGGCTTGAAAATGAGAGGATGAGGCTAGATAATGAGCGAAGAGTACTGCAAC
TGAAGCAGAAGGAAATGGAACTGGAGTTCAAAAGGTCTGATTCATCCTTCGAGCCAACCCTTGGCATTGATAGAATTCAAGGGAGAGAGCAAATTGATTTGGGTAGGCAT
TAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDSSGLGGGFLAGNRGLLDLESPIRRHQQTQLVNPSLTHRHHLNMMSTFEGDHQSIGIMDTKSLGQKDISMTFTKGKTVTNNNNTSEEDEPSFTEDGDCTEFLKGKKGSP
WQRMKWTDDIVRLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKMVSKIMISKGCHVSPQQCEDKFNDLNKRYKRLNDILGRGTSCRVVENPALMDSMPHLSSKAKDDV
RKILSSKHLFYKEMCAYHNGQTIPGCQDVDLQGKILPVANFSKGNNDLEEADDSDSDSDESDNEDDHFPEENRLWPAESRGRDKVSADDGPLWSNTAAQNEFEGQIDVFL
SDPAKSQWERRDWIKKQMVQLQEQCISFQAQSVELEKQRFKWLRYCSKKNRDLERVRLENERMRLDNERRVLQLKQKEMELEFKRSDSSFEPTLGIDRIQGREQIDLGRH

Tan0017987 (gene) of Snake gourd v1 genome