; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Clc07G16560 (gene) of Watermelon (cordophanus) v2 genome

Gene IDClc07G16560
OrganismCitrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Descriptiontranscription factor bHLH128-like
Genome locationClcChr07:31088436..31095703
RNA-Seq ExpressionClc07G16560
SyntenyClc07G16560
Gene Ontology termsGO:0006357 - regulation of transcription by RNA polymerase II (biological process)
GO:0005634 - nucleus (cellular component)
GO:0000978 - RNA polymerase II proximal promoter sequence-specific DNA binding (molecular function)
GO:0000981 - DNA-binding transcription factor activity, RNA polymerase II-specific (molecular function)
GO:0046983 - protein dimerization activity (molecular function)
InterPro domainsIPR011598 - Myc-type, basic helix-loop-helix (bHLH) domain
IPR036638 - Helix-loop-helix DNA-binding domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAE8649128.1 hypothetical protein Csa_014981 [Cucumis sativus]1.7e-16992.7Show/hide
Query:  MASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSSTAAALHRSYGINDLA
        M+SAHGGA     GLTRYGSAPGS LTTAVDSVIG+RQPDSAATLR PPSFG HYFSSADSSVVESSRKVVQSSSTSNDLKSSS+TAAAL+RSYG NDLA
Subjt:  MASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSSTAAALHRSYGINDLA

Query:  LGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFVEAANSSSNGLQSNT
        LGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLT+  GGGGNG GRLKSQMSF+GQDNSLSQISE+SESFVEAANS SNGLQSNT
Subjt:  LGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFVEAANSSSNGLQSNT

Query:  NSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRTRI
        NSTHSF P SAFAMDSSWDTS+NSIVF  PHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPED+VPCKIRAKRGCATHPRSIAERERRTRI
Subjt:  NSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRTRI

Query:  SGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        SGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
Subjt:  SGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

XP_004152076.1 transcription factor bHLH128 isoform X2 [Cucumis sativus]2.1e-17592.7Show/hide
Query:  MYQSTSSSSSTQKSMASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSST
        MYQSTSSSSS+QKSM+SAHGGA     GLTRYGSAPGS LTTAVDSVIG+RQPDSAATLR PPSFG HYFSSADSSVVESSRKVVQSSSTSNDLKSSS+T
Subjt:  MYQSTSSSSSTQKSMASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSST

Query:  AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFV
        AAAL+RSYG NDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLT+  GGGGNG GRLKSQMSF+GQDNSLSQISE+SESFV
Subjt:  AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFV

Query:  EAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCAT
        EAANS SNGLQSNTNSTHSF P SAFAMDSSWDTS+NSIVF  PHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPED+VPCKIRAKRGCAT
Subjt:  EAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCAT

Query:  HPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        HPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
Subjt:  HPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

XP_031739984.1 transcription factor bHLH128 isoform X1 [Cucumis sativus]5.2e-17492.45Show/hide
Query:  MYQSTSSSSSTQKSMASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSST
        MYQSTSSSSS+QKSM+SAHGGA     GLTRYGSAPGS LTTAVDSVIG+RQPDSAATLR PPSFG HYFSSADSSVVESSRKVVQSSSTSNDLKSSS+T
Subjt:  MYQSTSSSSSTQKSMASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSST

Query:  AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPN-GGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESF
        AAAL+RSYG NDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPN GGFSLT+  GGGGNG GRLKSQMSF+GQDNSLSQISE+SESF
Subjt:  AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPN-GGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESF

Query:  VEAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCA
        VEAANS SNGLQSNTNSTHSF P SAFAMDSSWDTS+NSIVF  PHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPED+VPCKIRAKRGCA
Subjt:  VEAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCA

Query:  THPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        THPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
Subjt:  THPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

XP_038899818.1 transcription factor bHLH128-like isoform X1 [Benincasa hispida]3.3e-17691.05Show/hide
Query:  MYQSTSSSSSTQKSMASAH-----------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDL
        MYQSTSSSSS+QKSM SAH           GG GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSS DSSVVESSRKVVQSSSTSNDL
Subjt:  MYQSTSSSSSTQKSMASAH-----------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDL

Query:  KSSSST------AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLS
        KSSSST      AAAL+RSYG NDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLT+GGGGNG+GRLKSQMSF+GQDNSLS
Subjt:  KSSSST------AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLS

Query:  QISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFS-LPQTTLEMAAVERLLQIPEDAVPC
        QISEMSESFVEAANS SNGLQSNTNSTHSFGPSAFAMDSSW+TSNNSIVFG PHAKRSKHHSDADFFT LESQ   LPQTTLEMAAVERLLQIPED+VPC
Subjt:  QISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFS-LPQTTLEMAAVERLLQIPEDAVPC

Query:  KIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        KIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
Subjt:  KIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

XP_038899826.1 transcription factor bHLH128-like isoform X2 [Benincasa hispida]5.4e-17991.82Show/hide
Query:  MYQSTSSSSSTQKSMASAH-----------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDL
        MYQSTSSSSS+QKSM SAH           GG GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSS DSSVVESSRKVVQSSSTSNDL
Subjt:  MYQSTSSSSSTQKSMASAH-----------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDL

Query:  KSSSST------AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLS
        KSSSST      AAAL+RSYG NDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLT+GGGGNG+GRLKSQMSF+GQDNSLS
Subjt:  KSSSST------AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLS

Query:  QISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCK
        QISEMSESFVEAANS SNGLQSNTNSTHSFGPSAFAMDSSW+TSNNSIVFG PHAKRSKHHSDADFFT LESQFSLPQTTLEMAAVERLLQIPED+VPCK
Subjt:  QISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCK

Query:  IRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        IRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
Subjt:  IRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

TrEMBL top hitse value%identityAlignment
A0A0A0KZ44 BHLH domain-containing protein1.0e-17592.7Show/hide
Query:  MYQSTSSSSSTQKSMASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSST
        MYQSTSSSSS+QKSM+SAHGGA     GLTRYGSAPGS LTTAVDSVIG+RQPDSAATLR PPSFG HYFSSADSSVVESSRKVVQSSSTSNDLKSSS+T
Subjt:  MYQSTSSSSSTQKSMASAHGGA-----GLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSST

Query:  AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFV
        AAAL+RSYG NDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLT+  GGGGNG GRLKSQMSF+GQDNSLSQISE+SESFV
Subjt:  AAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTI--GGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFV

Query:  EAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCAT
        EAANS SNGLQSNTNSTHSF P SAFAMDSSWDTS+NSIVF  PHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPED+VPCKIRAKRGCAT
Subjt:  EAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCAT

Query:  HPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        HPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
Subjt:  HPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

A0A1S4DZV8 LOW QUALITY PROTEIN: transcription factor bHLH1282.8e-16588.8Show/hide
Query:  MYQSTSSSSSTQKSMASAH---GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSSTAA
        MYQSTSSSSS+QKSM+SAH    G GLTRYGSAPGS LTTAVDSVIGSRQPDSAATLRGPPSFG HYFSSADSSVVESSRKVVQSSSTSNDLKSSS+T  
Subjt:  MYQSTSSSSSTQKSMASAH---GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSSTAA

Query:  ALHRSYGINDLALGDFSTGRNF--NSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGV-------GRLKSQMSFSGQDNSLSQISEM
        AL+RSYG NDLALG F  G NF  NSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLT+GGGG+G        GRLK+QMSF+GQDNSLSQISE+
Subjt:  ALHRSYGINDLALGDFSTGRNF--NSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGV-------GRLKSQMSFSGQDNSLSQISEM

Query:  SESFVEAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSK-HHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRA
        SESFVEAANS SNGLQSNTNSTHSF P SAFAMDSSWDTS+NSIVF  PHAKRSK HHSDADFF+GLESQFSLPQTTLEMAAVERLLQIPED+VPCKIRA
Subjt:  SESFVEAANSSSNGLQSNTNSTHSFGP-SAFAMDSSWDTSNNSIVFGGPHAKRSK-HHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRA

Query:  KRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKEC
        KRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKEC
Subjt:  KRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKEC

A0A6J1EWR4 transcription factor bHLH128-like9.7e-14280.77Show/hide
Query:  MYQSTSSSSSTQKSMASAH-GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSS-SSTAAA
        MYQSTSSSSS+  SM S+H GG GLTRYGSAPGSLL +AVDSVIG R PDS A LR PPSFGGH+FSSA+SSVVESSRKVVQSSSTS+DLKSS ++ AAA
Subjt:  MYQSTSSSSSTQKSMASAH-GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSS-SSTAAA

Query:  LHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFVEAANS
        L RSYGI+DLAL DFST R+FNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAE  GGFSLT GGGG G+GRLKSQ+SFSG  +S+SQ+S MSES VE    
Subjt:  LHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFVEAANS

Query:  SSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSK-HHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSI
                 +S+HSF P+AFAMD SWDTS NSI F  PH KRSK  HSD DFFTGL+SQFSLPQT+ EMA VERLLQIPED+VPCKIRAKRGCATHPRSI
Subjt:  SSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSK-HHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSI

Query:  AERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKEC
        AERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKEC
Subjt:  AERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKEC

A0A6J1GTJ6 transcription factor bHLH128-like isoform X35.0e-13875.87Show/hide
Query:  MYQSTSSSSSTQKSMASAH-----------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDL
        MYQS SSSSS+QK MASA+            G GLTRYGSAPGSLLT+AVDSVIGSR PDS ++LR PPSF GHYFSSADSS                 L
Subjt:  MYQSTSSSSSTQKSMASAH-----------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDL

Query:  KSSSSTAAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMS
        K+SSSTAAA  RSYGI+DLALGDFST RNFNSNGGQSS SSPLVRQ+SSPAGFLGHLSVAE NGGFSLT+GGGGNG+GRLKSQ+  +GQD SLSQISEM+
Subjt:  KSSSSTAAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMS

Query:  ESFVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRG
        ESF+EAANSS+NGL           PS F MDSSWDTSNNSIVFG PHAK S+HH DA+FFT LESQFS+PQTTLEMA VERLL IPE + PCKIRAKRG
Subjt:  ESFVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRG

Query:  CATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        CATHPRSIAERERRTRISGKLKKLQ+LVPNMDKQTSYSDMLDLAVQHIKGLQ+QIQ LNKE E+CTCG+KECL
Subjt:  CATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

A0A6J1IUI2 transcription factor bHLH128-like isoform X22.6e-13976.82Show/hide
Query:  MYQSTSSSSSTQKSMASAH---------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKS
        MYQS SSSSS+QK MASA+         GG GLTRYGSAPGSLLT+AVDSVIGSR PDS ++LR PPSF GHYFSSADSS                 LKS
Subjt:  MYQSTSSSSSTQKSMASAH---------GGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKS

Query:  SSSTAAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMSES
        SSSTAAA+ RSYGI+DLALGDFST RNFNSNGGQSSSSSPLVRQ+SSPAGFLGHLSVAE NGGFSLT+GGGGN +GRLKSQ+  +GQD SLSQISEMSE 
Subjt:  SSSTAAALHRSYGINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMSES

Query:  FVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCA
        F+EAANSS+NGL           PS F MDS WDTSNNSIVFG PHAK S+HH DA+FFT LESQFS+PQTTLEMA VERLLQIPE + PCKIRAKRGCA
Subjt:  FVEAANSSSNGLQSNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCA

Query:  THPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL
        THPRSIAERERRTRISGKLKKLQ+LVPNMDKQTSYSDMLDLAVQHIKGLQ+QIQ LNKE E+CTCG+KECL
Subjt:  THPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKECL

SwissProt top hitse value%identityAlignment
Q66GR3 Transcription factor bHLH1303.8e-2635.52Show/hide
Query:  GAGLTRYGSAPGSLLTTAV-DSVIGSRQPDSAATLRGPPSFGGHYFSS--ADSSVVESSRKVVQSSST---SNDLKSSSSTAAALH---RSYGI-NDLAL
        G+GL R+ SAP S+L   V D  IG       +         G   S    D S V  +   V  ++T      L+ SS      H   +S GI N + L
Subjt:  GAGLTRYGSAPGSLLTTAV-DSVIGSRQPDSAATLRGPPSFGGHYFSS--ADSSVVESSRKVVQSSST---SNDLKSSSSTAAALH---RSYGI-NDLAL

Query:  GDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEM-SESFVEAANSSSNGL------
          F    N ++   +S+    L+RQ SSPAG   +LS                NG G +++ M++   + S S  + +     + +   SS G+      
Subjt:  GDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEM-SESFVEAANSSSNGL------

Query:  ---QSNTNSTHSFGPSAFAMDSS---WDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQ---TTLEMAAVERLLQIPEDAVPCKIRAKRGCATHP
           ++N   +H   PS+F  + S    +  ++  +F G     S +         L    SLP+   T  +M +V++ LQ+ +D+VPCKIRAKRGCATHP
Subjt:  ---QSNTNSTHSFGPSAFAMDSS---WDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQ---TTLEMAAVERLLQIPEDAVPCKIRAKRGCATHP

Query:  RSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE
        RSIAER RRTRIS +++KLQELVPNMDKQT+ SDMLDLAV +IK LQ Q + LN    NC C +KE
Subjt:  RSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE

Q8H102 Transcription factor bHLH1286.0e-6448.04Show/hide
Query:  MYQSTSSSSSTQKSMASAHGGAGLTRYGSAPGSLLTTAVDSVIG---SRQPDSAATLRGPPSFGGHYFS-SADSSVVESSRKVVQSSSTS-------NDL
        MYQS+SS+SS+ +  +S  GG GL RYGSAPGS L + VD VIG   S   D         +F G++F+ +ADSS + S       +++S       N+ 
Subjt:  MYQSTSSSSSTQKSMASAHGGAGLTRYGSAPGSLLTTAVDSVIG---SRQPDSAATLRGPPSFGGHYFS-SADSSVVESSRKVVQSSSTS-------NDL

Query:  KSSSSTAAALHRSY-GINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHL-------SVAEPNGGFSLTIG-GGGNGVGRLKSQMSFSGQDN
         ++S+    L RSY G N+++       ++ +  GG SS S  L RQRSSPA F  +L       S+ +P   +S   G  GG G  RLKSQ+SF+  D 
Subjt:  KSSSSTAAALHRSY-GINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHL-------SVAEPNGGFSLTIG-GGGNGVGRLKSQMSFSGQDN

Query:  SLSQISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAF--AMDSSWDTSNNSIVFGGPH-AKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPE
        SL++I+E++E+ V            +  S HSF  ++F  A   SWD  + SI F     +KRSK     D  +GL SQ+SLP  T  M  ++  +Q+PE
Subjt:  SLSQISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAF--AMDSSWDTSNNSIVFGGPH-AKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPE

Query:  DAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE
        D+VPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQ+LVPNMDKQTSYSDMLDLAVQHIKGLQ+Q+Q L K+ ENCTCG  E
Subjt:  DAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE

Q9C690 Transcription factor bHLH1221.2e-2439.58Show/hide
Query:  LVRQRSSPAGFLGHLSVAEPNGGFSLTIGG-GGNGVGRLKSQMSFS---------GQDNSLSQISEMSESFVEAANSSSNGLQSNTNS---THSFGPSAF
        L R  SSPAG    + V         ++GG GG+ V    +  + S             ++S ISE     V+     S+ L   T S     SFG    
Subjt:  LVRQRSSPAGFLGHLSVAEPNGGFSLTIGG-GGNGVGRLKSQMSFS---------GQDNSLSQISEMSESFVEAANSSSNGLQSNTNS---THSFGPSAF

Query:  AMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVP
        A  SS  T+      GG    ++K    A     L    SLP++   ++ +E+LL    D++PCKIRAKRGCATHPRSIAER RRT+IS +++KLQ+LVP
Subjt:  AMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVP

Query:  NMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGS
        NMD QT+ +DMLDLAVQ+IK LQ Q++ L +    C C S
Subjt:  NMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGS

Q9M0R0 Transcription factor bHLH814.6e-2436.16Show/hide
Query:  GDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHL------SVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFVEAANSSSNGLQ
        GD   GR     GG   S S L R RS+PA +L  L         +PN G +  + G  N +   +    F      + Q       F    ++ ++ L 
Subjt:  GDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHL------SVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFVEAANSSSNGLQ

Query:  SNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIP---------------EDAVPCKIRAKRG
         +     SFG     + +++D  + +I    P +KRS+          +E+ FS P+ T +M   +   Q+P               ED+V  ++RAKRG
Subjt:  SNTNSTHSFGPSAFAMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIP---------------EDAVPCKIRAKRG

Query:  CATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE
        CATHPRSIAER RRTRIS +++KLQELVPNMDKQT+ +DML+ AV+++K LQ QIQ+L +E + CTC  KE
Subjt:  CATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE

Q9ZW81 Transcription factor bHLH1292.0e-5157.68Show/hide
Query:  FNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNG-GFSLTI------GGGGNGVGRLKSQMSFSG------QDNSLSQISEMSESFVEAANSSSNGLQS
        F+SN   +SSSS L R RSSPAGF       +PNG GFSL        GGG  G  RLKS++ FS       + NSL +ISE     VEAA ++ NG+ S
Subjt:  FNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNG-GFSLTI------GGGGNGVGRLKSQMSFSG------QDNSLSQISEMSESFVEAANSSSNGLQS

Query:  NTNSTHSFGPSAFAMDSSWDTSNNSIVFG-GPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRT
           S+ SFG +     ++WD S++ I F      KRSK   ++DFFT LE+Q+S+PQTTLEMA +E L+ IPED+VPC+ RAKRG ATHPRSIAERERRT
Subjt:  NTNSTHSFGPSAFAMDSSWDTSNNSIVFG-GPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRT

Query:  RISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQ
        RISGKLKKLQELVPNMDKQTSY+DMLDLAV+HIKGLQ+Q++
Subjt:  RISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQ

Arabidopsis top hitse value%identityAlignment
AT1G05805.1 basic helix-loop-helix (bHLH) DNA-binding superfamily protein4.2e-6548.04Show/hide
Query:  MYQSTSSSSSTQKSMASAHGGAGLTRYGSAPGSLLTTAVDSVIG---SRQPDSAATLRGPPSFGGHYFS-SADSSVVESSRKVVQSSSTS-------NDL
        MYQS+SS+SS+ +  +S  GG GL RYGSAPGS L + VD VIG   S   D         +F G++F+ +ADSS + S       +++S       N+ 
Subjt:  MYQSTSSSSSTQKSMASAHGGAGLTRYGSAPGSLLTTAVDSVIG---SRQPDSAATLRGPPSFGGHYFS-SADSSVVESSRKVVQSSSTS-------NDL

Query:  KSSSSTAAALHRSY-GINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHL-------SVAEPNGGFSLTIG-GGGNGVGRLKSQMSFSGQDN
         ++S+    L RSY G N+++       ++ +  GG SS S  L RQRSSPA F  +L       S+ +P   +S   G  GG G  RLKSQ+SF+  D 
Subjt:  KSSSSTAAALHRSY-GINDLALGDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHL-------SVAEPNGGFSLTIG-GGGNGVGRLKSQMSFSGQDN

Query:  SLSQISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAF--AMDSSWDTSNNSIVFGGPH-AKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPE
        SL++I+E++E+ V            +  S HSF  ++F  A   SWD  + SI F     +KRSK     D  +GL SQ+SLP  T  M  ++  +Q+PE
Subjt:  SLSQISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAF--AMDSSWDTSNNSIVFGGPH-AKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPE

Query:  DAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE
        D+VPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQ+LVPNMDKQTSYSDMLDLAVQHIKGLQ+Q+Q L K+ ENCTCG  E
Subjt:  DAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE

AT1G51140.1 basic helix-loop-helix (bHLH) DNA-binding superfamily protein8.6e-2639.58Show/hide
Query:  LVRQRSSPAGFLGHLSVAEPNGGFSLTIGG-GGNGVGRLKSQMSFS---------GQDNSLSQISEMSESFVEAANSSSNGLQSNTNS---THSFGPSAF
        L R  SSPAG    + V         ++GG GG+ V    +  + S             ++S ISE     V+     S+ L   T S     SFG    
Subjt:  LVRQRSSPAGFLGHLSVAEPNGGFSLTIGG-GGNGVGRLKSQMSFS---------GQDNSLSQISEMSESFVEAANSSSNGLQSNTNS---THSFGPSAF

Query:  AMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVP
        A  SS  T+      GG    ++K    A     L    SLP++   ++ +E+LL    D++PCKIRAKRGCATHPRSIAER RRT+IS +++KLQ+LVP
Subjt:  AMDSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVP

Query:  NMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGS
        NMD QT+ +DMLDLAVQ+IK LQ Q++ L +    C C S
Subjt:  NMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGS

AT2G42280.1 basic helix-loop-helix (bHLH) DNA-binding superfamily protein2.7e-2735.52Show/hide
Query:  GAGLTRYGSAPGSLLTTAV-DSVIGSRQPDSAATLRGPPSFGGHYFSS--ADSSVVESSRKVVQSSST---SNDLKSSSSTAAALH---RSYGI-NDLAL
        G+GL R+ SAP S+L   V D  IG       +         G   S    D S V  +   V  ++T      L+ SS      H   +S GI N + L
Subjt:  GAGLTRYGSAPGSLLTTAV-DSVIGSRQPDSAATLRGPPSFGGHYFSS--ADSSVVESSRKVVQSSST---SNDLKSSSSTAAALH---RSYGI-NDLAL

Query:  GDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEM-SESFVEAANSSSNGL------
          F    N ++   +S+    L+RQ SSPAG   +LS                NG G +++ M++   + S S  + +     + +   SS G+      
Subjt:  GDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEM-SESFVEAANSSSNGL------

Query:  ---QSNTNSTHSFGPSAFAMDSS---WDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQ---TTLEMAAVERLLQIPEDAVPCKIRAKRGCATHP
           ++N   +H   PS+F  + S    +  ++  +F G     S +         L    SLP+   T  +M +V++ LQ+ +D+VPCKIRAKRGCATHP
Subjt:  ---QSNTNSTHSFGPSAFAMDSS---WDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQ---TTLEMAAVERLLQIPEDAVPCKIRAKRGCATHP

Query:  RSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE
        RSIAER RRTRIS +++KLQELVPNMDKQT+ SDMLDLAV +IK LQ Q + LN    NC C +KE
Subjt:  RSIAERERRTRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGSKE

AT2G43140.1 basic helix-loop-helix (bHLH) DNA-binding superfamily protein1.4e-5257.68Show/hide
Query:  FNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNG-GFSLTI------GGGGNGVGRLKSQMSFSG------QDNSLSQISEMSESFVEAANSSSNGLQS
        F+SN   +SSSS L R RSSPAGF       +PNG GFSL        GGG  G  RLKS++ FS       + NSL +ISE     VEAA ++ NG+ S
Subjt:  FNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNG-GFSLTI------GGGGNGVGRLKSQMSFSG------QDNSLSQISEMSESFVEAANSSSNGLQS

Query:  NTNSTHSFGPSAFAMDSSWDTSNNSIVFG-GPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRT
           S+ SFG +     ++WD S++ I F      KRSK   ++DFFT LE+Q+S+PQTTLEMA +E L+ IPED+VPC+ RAKRG ATHPRSIAERERRT
Subjt:  NTNSTHSFGPSAFAMDSSWDTSNNSIVFG-GPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRT

Query:  RISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQ
        RISGKLKKLQELVPNMDKQTSY+DMLDLAV+HIKGLQ+Q++
Subjt:  RISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQ

AT2G43140.2 basic helix-loop-helix (bHLH) DNA-binding superfamily protein1.9e-5757.25Show/hide
Query:  FNSNGGQSSSSSPLVRQRSSPAGFLG-HL-------SVAEPNGGFSLTIGGGGNGVGRLKSQMSFSG------QDNSLSQISEMSESFVEAANSSSNGLQ
        F+SN   +SSSS L R RSSPAGF   HL       S+  PNGG+    GGG  G  RLKS++ FS       + NSL +ISE     VEAA ++ NG+ 
Subjt:  FNSNGGQSSSSSPLVRQRSSPAGFLG-HL-------SVAEPNGGFSLTIGGGGNGVGRLKSQMSFSG------QDNSLSQISEMSESFVEAANSSSNGLQ

Query:  SNTNSTHSFGPSAFAMDSSWDTSNNSIVFG-GPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERR
        S   S+ SFG +     ++WD S++ I F      KRSK   ++DFFT LE+Q+S+PQTTLEMA +E L+ IPED+VPC+ RAKRG ATHPRSIAERERR
Subjt:  SNTNSTHSFGPSAFAMDSSWDTSNNSIVFG-GPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERR

Query:  TRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGS
        TRISGKLKKLQELVPNMDKQTSY+DMLDLAV+HIKGLQ+Q++ L K +E CTCG+
Subjt:  TRISGKLKKLQELVPNMDKQTSYSDMLDLAVQHIKGLQNQIQKLNKEVENCTCGS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTACCAATCAACTTCTTCCTCTTCTTCCACTCAGAAATCCATGGCCTCCGCCCACGGCGGCGCCGGTCTCACTCGGTACGGTTCCGCGCCTGGATCTCTCCTGACCAC
GGCGGTCGATTCCGTGATTGGAAGTCGGCAACCGGACTCCGCCGCCACGCTCCGGGGGCCGCCGTCGTTCGGCGGCCACTACTTCTCCTCCGCCGATTCCTCCGTCGTGG
AGTCGTCAAGGAAGGTAGTTCAGTCGTCGTCTACTTCCAACGATCTGAAATCATCGTCGTCCACCGCCGCCGCCTTGCATAGGTCATACGGAATCAACGATTTGGCGTTA
GGGGATTTCTCGACGGGTAGAAATTTCAATAGCAATGGTGGTCAATCCTCTTCCTCTTCGCCGTTGGTTCGCCAGAGAAGCTCGCCGGCTGGATTTCTCGGCCATCTCTC
CGTTGCCGAACCAAACGGAGGGTTTTCATTGACAATAGGAGGTGGTGGAAATGGAGTAGGAAGACTAAAGTCTCAAATGAGCTTCAGTGGGCAGGATAATTCACTTTCCC
AAATCTCTGAAATGAGTGAAAGTTTTGTGGAGGCAGCCAATTCCTCAAGCAATGGCCTTCAAAGCAACACCAATTCCACACATTCTTTTGGCCCCTCTGCCTTTGCTATG
GACTCTTCATGGGACACCTCCAATAATTCCATTGTCTTTGGTGGCCCTCATGCTAAAAGATCCAAGCACCATTCCGATGCCGACTTCTTCACTGGCCTCGAGTCTCAATT
TAGCCTGCCACAAACAACTCTAGAAATGGCAGCTGTGGAGAGGTTGCTTCAAATTCCTGAAGATGCTGTTCCTTGTAAGATTCGAGCCAAGCGTGGCTGTGCTACTCACC
CTCGGAGTATTGCCGAACGGGAGAGAAGAACTAGAATCAGTGGAAAATTGAAGAAACTTCAAGAGCTTGTTCCCAACATGGATAAGCAAACAAGCTATTCAGACATGTTG
GACTTGGCAGTGCAGCATATCAAAGGTCTTCAAAATCAAATTCAGAAGCTTAACAAAGAAGTTGAGAATTGCACCTGTGGAAGCAAAGAATGCTTATAA
mRNA sequenceShow/hide mRNA sequence
CCATTTACTTTTCTCTTTCCCCAATCTCTATCTCTCTTTCCATTTCATTCTGTTCAAACCCAAATATCAAAACAAAAATACACAGATCCAAATCCAAATCCCCCATATGT
ACCAATCAACTTCTTCCTCTTCTTCCACTCAGAAATCCATGGCCTCCGCCCACGGCGGCGCCGGTCTCACTCGGTACGGTTCCGCGCCTGGATCTCTCCTGACCACGGCG
GTCGATTCCGTGATTGGAAGTCGGCAACCGGACTCCGCCGCCACGCTCCGGGGGCCGCCGTCGTTCGGCGGCCACTACTTCTCCTCCGCCGATTCCTCCGTCGTGGAGTC
GTCAAGGAAGGTAGTTCAGTCGTCGTCTACTTCCAACGATCTGAAATCATCGTCGTCCACCGCCGCCGCCTTGCATAGGTCATACGGAATCAACGATTTGGCGTTAGGGG
ATTTCTCGACGGGTAGAAATTTCAATAGCAATGGTGGTCAATCCTCTTCCTCTTCGCCGTTGGTTCGCCAGAGAAGCTCGCCGGCTGGATTTCTCGGCCATCTCTCCGTT
GCCGAACCAAACGGAGGGTTTTCATTGACAATAGGAGGTGGTGGAAATGGAGTAGGAAGACTAAAGTCTCAAATGAGCTTCAGTGGGCAGGATAATTCACTTTCCCAAAT
CTCTGAAATGAGTGAAAGTTTTGTGGAGGCAGCCAATTCCTCAAGCAATGGCCTTCAAAGCAACACCAATTCCACACATTCTTTTGGCCCCTCTGCCTTTGCTATGGACT
CTTCATGGGACACCTCCAATAATTCCATTGTCTTTGGTGGCCCTCATGCTAAAAGATCCAAGCACCATTCCGATGCCGACTTCTTCACTGGCCTCGAGTCTCAATTTAGC
CTGCCACAAACAACTCTAGAAATGGCAGCTGTGGAGAGGTTGCTTCAAATTCCTGAAGATGCTGTTCCTTGTAAGATTCGAGCCAAGCGTGGCTGTGCTACTCACCCTCG
GAGTATTGCCGAACGGGAGAGAAGAACTAGAATCAGTGGAAAATTGAAGAAACTTCAAGAGCTTGTTCCCAACATGGATAAGCAAACAAGCTATTCAGACATGTTGGACT
TGGCAGTGCAGCATATCAAAGGTCTTCAAAATCAAATTCAGAAGCTTAACAAAGAAGTTGAGAATTGCACCTGTGGAAGCAAAGAATGCTTATAACATCTGGAATTATTG
GGAGTTGGAAATATATGAATTCTACCTCAAATTTTGCCTTTTTTTTTTTAAATTAAAAAAAAA
Protein sequenceShow/hide protein sequence
MYQSTSSSSSTQKSMASAHGGAGLTRYGSAPGSLLTTAVDSVIGSRQPDSAATLRGPPSFGGHYFSSADSSVVESSRKVVQSSSTSNDLKSSSSTAAALHRSYGINDLAL
GDFSTGRNFNSNGGQSSSSSPLVRQRSSPAGFLGHLSVAEPNGGFSLTIGGGGNGVGRLKSQMSFSGQDNSLSQISEMSESFVEAANSSSNGLQSNTNSTHSFGPSAFAM
DSSWDTSNNSIVFGGPHAKRSKHHSDADFFTGLESQFSLPQTTLEMAAVERLLQIPEDAVPCKIRAKRGCATHPRSIAERERRTRISGKLKKLQELVPNMDKQTSYSDML
DLAVQHIKGLQNQIQKLNKEVENCTCGSKECL