CuGenDBv2

Gene ID	MC02g0094
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	Sequence-specific DNA binding transcription factor
Genome location	MC02:1014638..1024471
RNA-Seq Expression	MC02g0094
Synteny	MC02g0094
Gene Ontology terms	NA
InterPro domains	IPR044822 - Myb/SANT-like DNA-binding domain 4

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6605907.1 hypothetical protein SDJN03_03224, partial [Cucurbita argyrosperma subsp. sororia]

7.30e-269

86.24

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRRHQQTQL+N SLTH HHL  M+T EGDHQ +GI+DTK  G KDL  TF KGKAIA+G  TNN+NTSEEDEPSFTE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGEC+EF KGKKGSPWQRMKWTDDIV+LLIAVVACVGDDGEAGMGSKRKSGILQKKGKWK VSKIMISKG HVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW
        SC VVENPALMDSM  LS+K KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPV NFSKGNNESEEAD+SD + DESDNEDDH P EN LW
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW

Query:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL
         AESRGR+K S DDGPLWS + AQNEFEGQIDVFLSDPTK QWERRDWIKKQML LQEQ VSFQAQ+ ELEKQRFKWLRYCSKKSRDLER RLENER+K+
Subjt:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL

Query:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG
        DNERRVLQLKQKE ELEFKRSDSS GPTLGIDRIQG
Subjt:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG

XP_022957960.1 uncharacterized protein LOC111459338 [Cucurbita moschata]

2.51e-270

86.47

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRRHQQTQL+N SLTH HHL  M+T EGDHQS+GI+DTK  G KDL  TF KGKAIA+G  TNN+NTSEEDEPSFTE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGEC+EF KGKKGSPWQRMKWTDDIV+LLIAVVACVGDDGEAGMGSKRKSGILQKKGKWK VSKIMISKG HVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW
        SC VVENPALMDSM  LS+K KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPV NFSKGNNESEEAD+SD + DESDNEDDH P EN LW
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW

Query:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL
         AESRGR+K S DDGPLWS + AQNEFEGQIDVFLSDPTK QWERRDWIKKQML LQEQ VSFQAQ+ ELEKQRFKWLRYCSKKSRDLER RLENER+K+
Subjt:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL

Query:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG
        DNERRVLQLKQKE ELEFKRSDSS GPTLGIDRIQG
Subjt:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG

XP_022995089.1 uncharacterized protein LOC111490737 [Cucurbita maxima]

1.02e-269

86.01

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRRHQQTQL+N SLTH HHL  M+T EGDHQS+GI+DTK  G KDL  TF KGKAIA+G  TNN+NTSEEDEPSFTE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGEC+EF KGKKGSPWQRMKWTDDIV+LLIAVVACVGDDGEAGMGSKRKSGILQKKGKWK VSKIMISKG HVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW
        SC VVENPALMDSM  LS+K KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPV NFS+GNNESEEAD+SD + DESDNEDDH P EN LW
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW

Query:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL
         A+SRGR+K S DDGPLWSN+ AQNE EGQIDVFLSDPTK QWERRDWIKKQML LQEQ VSFQAQ+ ELEKQRFKWLRYCSKKSRDLER RLENER+K+
Subjt:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL

Query:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG
        DNERRVLQLKQKE ELEFKRSDSS GPTLGIDRIQG
Subjt:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG

XP_023534092.1 uncharacterized protein LOC111795758 [Cucurbita pepo subsp. pepo]

5.88e-269

86.01

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRRHQQTQL+N SLTH HHL  M+T E DHQS+GI+DTK  G KDL  TF KGKAIA+G  TNN+NTSEEDEPSFTE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGEC++F KGKKGSPWQRMKWTDDIV+LLIAVVACVGDDGEAGMGSKRKSGILQKKGKWK VSKIMISKG HVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW
        SC VVENPALMDSM  LS+K KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPV NFSKGNNESEEAD+SD + DESDNEDDH P EN LW
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW

Query:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL
         AESRGR+K S DDGPLWS + AQNEFEGQIDVFLSDPTK QWERRDWIKKQML LQEQ VSFQAQ+ ELEKQRFKWLRYCSKKSRDLER RLENER+K+
Subjt:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL

Query:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG
        DNERRVLQLKQKE ELEFKRSDSS GPTLGIDRIQG
Subjt:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG

XP_038901508.1 uncharacterized protein LOC120088355 [Benincasa hispida]

9.01e-274

85.01

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGL+DLESPIRR Q+TQLVNPSLTH HHLN MSTFEGDH S+G VDTKS GQKDLL  F KGKAIA+G  TNNN TSEEDEPSFTE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGEC EF KGKKGSPWQRMKWTD+IV+LLIAVVACVGDDGEAG GSKRKSGILQKKGKWKT+SKIM+SKG HVSPQQCEDKFNDLNKRYKRLNDI+G+GT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDD--ESDNEDDHCPVENG
        SC VVENPALMDSM  LS+KAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPVANFSKGNNES+EA++SD + D  ESDNEDDH PVEN 
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDD--ESDNEDDHCPVENG

Query:  LWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERL
        LW +ESRGR+K+S DDGPLWSNSVA+NEFEG+IDVFLSDPTKSQWERRDW++KQML LQEQ  +FQAQ+VELEKQRFKWLRYCSKK+RDLERARLENER+
Subjt:  LWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERL

Query:  KLDNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH
        KLDNERRVLQLKQKE ELE KR DSS GPTLGIDRIQGRE +DLGRH
Subjt:  KLDNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KX12 Uncharacterized protein

7.55e-262

83.37

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRR Q+TQLVNPSLT  H LN M+ FEGDHQSIGI+D+KS GQKDLL  F +GKAIA+G  TNN  TSEEDEPS+TE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGECSEF KGKKGSPWQRMKWTD+IV+LLIAVVACVGDDGEAGMGSKRKSGIL KKGKWKTVSKIM SKG HVSPQQCEDKFNDLNKRYKRLNDILG+GT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW
        SC VVENPALMDSM  LS+KAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPVANFSKGNNESE++D SD +  ESDNEDDH PVEN LW
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW

Query:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL
         +ESRGR+K+S DDGPLWSNSV +NEFEGQIDVFLSDPTKS WER+ WIKKQML LQEQ  SFQAQ+VELEKQRFKWLRYCSKK+RDLERARLENER+KL
Subjt:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL

Query:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH
        DNE+RVLQLK+KE ELE KRSD ++GP L IDRIQGRE +DLG H
Subjt:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH

A0A5A7TE21 Stress response protein nst1 isoform X1

8.44e-262

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRR Q+TQLVNPSLT  H LN MS FEGDHQSIGI+D+KS GQKDLL  F +GKAIA+   TNN  TSEEDEPS+TE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGECSEF KGKKGSPWQRMKWTD+IV+LLIAVVACVGDDGEAGMGSKRKSGIL KKGKW+TVSKIM SKG HVSPQQCEDKFNDLNKRYKRLNDILG+GT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDD--ESDNEDDHCPVENG
        SC VVENPALMDSM  LS+KAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILP ANFSKGNNESEEA++SD + D  ESDNEDDH P EN 
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDD--ESDNEDDHCPVENG

Query:  LWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERL
        LW +ESRGR+K+S DDGPLWSNSV +NEFEGQIDVFLSDPTKSQWER+ WIKKQML LQEQ  SFQAQ+VELEKQRFKWLRYCSKK+RDLERARLENER+
Subjt:  LWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERL

Query:  KLDNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH
        KLDNE+RVLQLK+KE ELE KRSDS++GP L  DRIQGRE +DLG H
Subjt:  KLDNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH

A0A5D3BB81 Stress response protein nst1 isoform X1

2.95e-262

83.22

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRR Q+TQLVNPSLT  H LN MS FEGDHQSIGI+D+KS GQKDLL  F +GKAIA+   TNN  TSEEDEPS+TE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGECSEF KGKKGSPWQRMKWTD+IV+LLIAVVACVGDDGEAGMGSKRKSGIL KKGKWKTVSKIM SKG HVSPQQCEDKFNDLNKRYKRLNDILG+GT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDD--ESDNEDDHCPVENG
        SC VVENPALMDSM  LS+KAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILP ANFSKGNNESEEA++SD + D  ESDNEDDH P EN 
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDD--ESDNEDDHCPVENG

Query:  LWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERL
        LW +ESRGR+K+S DDGPLWSNSV +NEFEGQIDVFLSDPTKSQWER+ WIKKQML LQEQ  SFQAQ+VELEKQRFKWLRYCSKK+RDLERARLENER+
Subjt:  LWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERL

Query:  KLDNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH
        KLDNE+RVLQLK+KE ELE KRSDS++GP L  DRIQGRE +DLG H
Subjt:  KLDNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHIDLGRH

A0A6J1H0P0 uncharacterized protein LOC111459338

1.21e-270

86.47

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRRHQQTQL+N SLTH HHL  M+T EGDHQS+GI+DTK  G KDL  TF KGKAIA+G  TNN+NTSEEDEPSFTE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGEC+EF KGKKGSPWQRMKWTDDIV+LLIAVVACVGDDGEAGMGSKRKSGILQKKGKWK VSKIMISKG HVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW
        SC VVENPALMDSM  LS+K KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPV NFSKGNNESEEAD+SD + DESDNEDDH P EN LW
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW

Query:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL
         AESRGR+K S DDGPLWS + AQNEFEGQIDVFLSDPTK QWERRDWIKKQML LQEQ VSFQAQ+ ELEKQRFKWLRYCSKKSRDLER RLENER+K+
Subjt:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL

Query:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG
        DNERRVLQLKQKE ELEFKRSDSS GPTLGIDRIQG
Subjt:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG

A0A6J1K4Q0 uncharacterized protein LOC111490737

4.93e-270

86.01

Show/hide

Query:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE
        MDSSG+G GFLS  GGLLDLESPIRRHQQTQL+N SLTH HHL  M+T EGDHQS+GI+DTK  G KDL  TF KGKAIA+G  TNN+NTSEEDEPSFTE
Subjt:  MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE

Query:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT
        DGEC+EF KGKKGSPWQRMKWTDDIV+LLIAVVACVGDDGEAGMGSKRKSGILQKKGKWK VSKIMISKG HVSPQQCEDKFNDLNKRYKRLNDILGRGT
Subjt:  DGECSEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGT

Query:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW
        SC VVENPALMDSM  LS+K KDDVRKILSSKHLFYKEMCAYHNGQTIPGCQD+DFQGKILPV NFS+GNNESEEAD+SD + DESDNEDDH P EN LW
Subjt:  SCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLW

Query:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL
         A+SRGR+K S DDGPLWSN+ AQNE EGQIDVFLSDPTK QWERRDWIKKQML LQEQ VSFQAQ+ ELEKQRFKWLRYCSKKSRDLER RLENER+K+
Subjt:  VAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKL

Query:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG
        DNERRVLQLKQKE ELEFKRSDSS GPTLGIDRIQG
Subjt:  DNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G21200.1 sequence-specific DNA binding transcription factors

6.8e-81

43.31

Show/hide

Query:  SGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE---DGEC
        SG  S GG   DL+  +R H Q  +   +  H H+ N     EG   ++    T    Q   ++   + KA         N+ S++DEPSFTE   DG  
Subjt:  SGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTE---DGEC

Query:  SEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGTSCMV
        +E  +  KGSPWQR+KWTD +VKLLI  V+ +GDD      S+RK  +LQKKGKWK+VSK+M  +G HVSPQQCEDKFNDLNKRYK+LND+LGRGTSC V
Subjt:  SEFFKGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGTSCMV

Query:  VENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEA----------DESDGEDDESDN-EDDH-
        VENPAL+DS+  L++K KDDVRKI+SSKHLFY+EMC+YHNG  +    DL  Q + L +A  S+ +++++++          ++ DG+ DE D  E+ H 
Subjt:  VENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEA----------DESDGEDDESDN-EDDH-

Query:  ----CPVEN--GLWVAESRGRNKLSGDDG--PLWSNSVAQNEFE-GQIDVFLSDPTKSQWE-------RRDWIKKQMLHLQEQSVSFQAQAVELEKQRFK
            C V +  G      + R  LS +DG  P   NS+  N+    QI    +D  +   E       ++ W++ + L L+EQ +  Q + +ELEKQRF+
Subjt:  ----CPVEN--GLWVAESRGRNKLSGDDG--PLWSNSVAQNEFE-GQIDVFLSDPTKSQWE-------RRDWIKKQMLHLQEQSVSFQAQAVELEKQRFK

Query:  WLRYCSKKSRDLERARLENERLKLDNERRVLQLKQKETELE
        W R+  K+ ++LER R+ENER+KL+N+R  L+LKQ+E  +E
Subjt:  WLRYCSKKSRDLERARLENERLKLDNERRVLQLKQKETELE

AT1G76870.1 BEST Arabidopsis thaliana protein match is: sequence-specific DNA binding transcription factors (TAIR:AT1G21200.1)

6.0e-61

41.33

Show/hide

Query:  TNNNNTSEEDEPSFTEDGECSEFF-----KGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCE
        T +NN  +  + S +ED E          K K+ SPWQR+KW D +VKL+I  ++ +G+D     GS +K  +LQKKGKW++VSK+M  +G HVSPQQCE
Subjt:  TNNNNTSEEDEPSFTEDGECSEFF-----KGKKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCE

Query:  DKFNDLNKRYKRLNDILGRGTSCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADES
        DKFNDLNKRYK+LN++LGRGTSC VVENP+L+D +  L+ K KD+VR+I+SSKHLFY+EMC+YHNG  +    D   Q  +  +   S+ +++++E  + 
Subjt:  DKFNDLNKRYKRLNDILGRGTSCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADES

Query:  DGE--DDESDNEDDH------CPVENGLWVAESRGRNKL----SGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQA
          E  DD+ D E+DH       P++    + +S+    +     G D P    S  Q +    I +   D  K+   +R  I+ + L L+ + +  QA+ 
Subjt:  DGE--DDESDNEDDH------CPVENGLWVAESRGRNKL----SGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQA

Query:  VELEKQRFKWLRYCSKKSRDLERARLENERLKLDNERRVLQLKQKE
        +ELE+Q+FKW  +  ++ + L + R+ENER+KL+NER  L+LK+ E
Subjt:  VELEKQRFKWLRYCSKKSRDLERARLENERLKLDNERRVLQLKQKE

AT3G10040.1 sequence-specific DNA binding transcription factors

2.2e-63

41.85

Show/hide

Query:  KKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMG----SKRKS----------GILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDIL
        +K S W RMKWTD +V+LLI  V  +GD  EAG+     +K+K+          G+LQKKGKWK+VS+ M+ KG  VSPQQCEDKFNDLNKRYKR+NDIL
Subjt:  KKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMG----SKRKS----------GILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDIL

Query:  GRGTSCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHN------------------GQTIPGCQDLDFQ----GKILPVANFSKGNNESE
        G+G +C VVEN  L++SM  L+ K KD+V+K+L+SKHLF++EMCAYHN                     IP  Q   F     GK+  +A       E E
Subjt:  GRGTSCMVVENPALMDSMAQLSNKAKDDVRKILSSKHLFYKEMCAYHN------------------GQTIPGCQDLDFQ----GKILPVANFSKGNNESE

Query:  EADESD-GEDDESDNEDDHCPVENGLWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQ
        E  ESD  ED ES+ E+            E+R + ++          S A      +    + D  KS WE+++WI+++ML ++E+ + ++ + VE+EKQ
Subjt:  EADESD-GEDDESDNEDDHCPVENGLWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQIDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQ

Query:  RFKWLRYCSKKSRDLERARLENERLKLDNERRVLQLKQKETEL-EFKRSDSSLGPT
        R KW+RY SKK R++E+A+L+N+R +L+ ER +L L++ E EL E + S + + P+
Subjt:  RFKWLRYCSKKSRDLERARLENERLKLDNERRVLQLKQKETEL-EFKRSDSSLGPT

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

mRNA sequence

Show/hide mRNA sequence

ATGGATAGTTCAGGTATGGGAAGTGGATTTCTGTCGGCAGGTGGGGGTCTATTAGATCTGGAGTCTCCCATCCGAAGACATCAACAGACCCAATTGGTCAATCCCTCTTT
GACACACCATCATCACTTGAACAGGATGAGTACTTTTGAAGGTGATCACCAATCGATTGGGATTGTGGACACGAAAAGTTTCGGACAGAAAGATTTATTGACGACCTTCG
CAAAAGGGAAAGCTATTGCCACTGGTAATGCCACGAACAACAATAATACGAGTGAAGAAGATGAGCCTAGTTTCACAGAGGACGGTGAGTGCTCTGAATTTTTTAAGGGT
AAAAAGGGCTCTCCATGGCAGAGAATGAAGTGGACAGATGACATTGTAAAGCTTCTCATAGCCGTGGTTGCTTGTGTGGGTGATGACGGTGAGGCTGGGATGGGCTCCAA
GAGAAAATCTGGAATATTGCAAAAGAAGGGCAAATGGAAAACAGTGTCGAAGATTATGATAAGTAAGGGGCGTCATGTATCTCCACAGCAGTGTGAGGATAAGTTCAATG
ACTTGAACAAAAGATACAAGAGATTGAACGATATACTTGGGAGGGGAACCAGTTGTATGGTTGTGGAGAACCCTGCACTCATGGATTCAATGGCTCAGCTCTCAAATAAA
GCCAAGGATGATGTCAGAAAAATATTAAGCTCAAAGCACTTGTTTTATAAGGAAATGTGTGCTTACCATAATGGACAAACAATTCCTGGTTGCCAGGACCTTGATTTCCA
AGGTAAAATTTTACCTGTTGCGAATTTCTCCAAAGGTAATAATGAGTCAGAAGAGGCTGATGAAAGTGACGGTGAGGATGATGAGTCAGATAATGAAGATGATCACTGTC
CTGTTGAAAATGGATTATGGGTGGCTGAGTCACGTGGTAGAAATAAACTGAGTGGAGATGATGGTCCTCTGTGGTCAAACTCAGTTGCACAAAATGAATTTGAAGGTCAA
ATTGATGTCTTTCTTTCAGATCCTACGAAGTCCCAATGGGAGCGCAGAGATTGGATTAAAAAACAGATGCTACATCTTCAGGAGCAATCTGTCAGCTTCCAGGCTCAAGC
TGTCGAACTTGAGAAACAACGTTTCAAATGGTTAAGATATTGCAGTAAGAAGAGTAGGGATTTGGAGAGAGCGAGGCTTGAAAATGAGAGGTTGAAACTAGATAATGAGC
GGAGAGTACTGCAACTGAAGCAGAAGGAAACGGAATTGGAATTCAAAAGGTCTGATTCATCCTTGGGTCCAACCCTTGGCATTGATAGAATTCAGGGAAGAGAGCATATT
GATTTGGGTAGACATTGAAAGCACACAAAAAGGTCATTCATGTTTTGGACCTGTTGTGATGCACGAGATTTTGCTGATCATTGTGGAACAAAACCTTTAAGCCAAATGCA
TGTTAGCATGCTAAACCTTGTAAGCATGTCACTACTTTTATGTTATTTTAGGCTCTCCCTTTTCTTCTTTTTGGCCTTTGGAACTTTCTGCTGTAAAGCTCAATGATTAA
TGTCAAGTGGTTCAGCTTCCAACAAAGTTTTCGTTCGAAGTGCATCCATAGCTTTCTCAAGGATATAAATTTGTGTGGTTATATGGATTTACGTTAACATGCCAGTCTGG
TTGAACTACTTAGTCTGAACTGAAAGACAATATCGAAGCCCTTACTCCATTTGTTGGATCATCTCAGATTCTCAATTTTGGAGATCGCAGACCACTAAAGCTATCAACGA
GAGAGAGAGAGGGAGACTTCCATTGGAAAGTGATTGGACGACAAAATCATGGCGATGGATGAACTCCCCTTTCTAGCAATTCTCTTCTCGGATGCTCAGCTCATTCGCTT
TATTGTAAAAGAAAAGCTCTCAAATTATGAGCTCTCGAGTCTCAAATATGAACCATACTCAGAAACACAGTTGAGCTGAAGTTATTTGGAAATTTCTTCAATTTTGAGAT
TACACACACGCAGAACCAGAAGCCGAAAGAGGAAGCTACAACTGCGCATCCTCTTCAATGGCGGTTTCCTTTCTTTCGGAGTGGCTCTAGGACAGGAACTTTACTGGCGT
TAGACATAAATTGTCTGCTTGAAGTTTTGTCAAGAATGGGTTTGCAGAATTTTCAGGACAAGTTAATTAAAATGAGCTGGAACACGAGCATGGAGGTTAATTGCATGAAT
AATAGTTACCCTTACAGCACAGCTGGAAGCTTTATGGAATACTTTGAAGGTCTTACATATGAACACGTGAATTTCATTTTTTCCGGTGCCTCACATTCTCAGGAGACTGT
TTATCCATCCACTAATTCAAGTTACTATAAGTTTGGGCATTCTGATTCTTGGAGCAGTTCATACTTTGATGCTCAATCATCTGAGGTACTAGGTCATGAGTCCACTGTTG
ATGAACATAGGAGGCCGCAGGACTTCTCGACATTACCGAATGAACAGAGTTCAGGAAATAGAGCGTGGGAAGAAAATGCCAATCCCAATATGTCCAGCAACACCAACACC
ATGGAATGTAAGGATTGAGTTCTGTGTCATTTCAACTTTCCATGAAACAGAATTTAGATATTAAGTGCTAATGTTCTATAAAACCACATGTTGTGAAGAGTATAATTAAT
GACTCTCTGTTTTGATTTTTAGTCTCTTATTTTTTCTCTGTTCCTGAATTGAGGTATTTGTTGAGAAAAAGCAGTTGGTGTCATCAATTTTCAGGCATTGGCAACCTTCA
TCTTCATGATCGCTATTGAGGGCATTCTTTTTGCTAATATAGTGCATTTTTGGCATATTTGAAAACTATAATGGTTATATTGGTCTATGGTTTTCTTATGACACAGATAT
CAAATGAAAGTTAAATGTTGCCGAAAAATTGGCTTTAGGCATGTTAGTTATTTACTGGGATGACTTATTCGATGCAACAAATTGAATGTAGGGTGCTTCAACGAGTATCT
TGTAAATGAGATACATTCACCATCCATTGATATACATGTTCTACCATATTTCAATGTTAACTTGCAACCACTGGGTGAACCACTTTATATTTAGCAAGTACTATCCGGAG
TAGAATTAACTTGCTGCTAGGTAGAGTGTTAAAGGTATATATGAAATCTAACAACCAAAATTTTTCCTCTTGGCTTCCTTCTGATCCAATTAAAATGTTACTGAAAATTT
TTTTCTAGTTCCCAACTTTAACTATTCTCCATTGCTTTTTCAGGCCCACGTAGGCATCCAAATTATCAAGAGTATCAGACTATTTGGCAAGATATTGTTGATCCAGATAA
CATGACTTATGAGGAATTACTAGATTTAGGCGAGACAGTTGGAACTCATAATCGAGGCCTTCCACAAGAACTGATTGCGTTGCTTCCAGTATCAAAGTATAAATGTGGGT
TTTTCTTGATGAAGAAATCACGAAATGAAAGGTGTGTGATATGCCAGATGGAATACAAACGTGGAGATCAGAGGATCACTCTACCGTGCAAACACAGGTACCATACCTGT
TGCGGGACTAAGTGGCTCAGTATCAACAAGGCTTGCCCCATTTGCTACACTGAAGTTTTCGGTGGCACTTCAAAGCGTTAAAGAAGCTATTAATATCATGAGAAAGGGAA
ACCTTTAAAAGGTTTGGAGTCTTCCTTTCTGAAGATATTGACTTCGTTTCCTTGCTCATTTTCTACTTTGTACGATCTTCGTATGAGGTTAAAGAATAAGAGAAGTGCTG
GACTTATACACACATAATTATAGAGCAGAGAGTAGAATTTGATTGATTTTGAGATCGATTTGGATTTTATTTTTTCAACTTGGGGAACCACGACGACTTGGTTTTGCCTC
TGCCTATTACACATCTTTATATTATTAGTTGGAGAGCATAACTGGGGAAAATGGTCAAAGCTCAAATCCAATGCATTTGGCTCATCGTGCTTCATGGTAGAAGCTACTGA
GCGAATCTTTTTCCCTTTTCTTCCCCTCCGCAAGTTCAGGTAGCAGGTAATGATATATAGAAAATCATCTTTTAGTACATTGAAATTGTCTTTTTTAATTTCCAATCTTA
GAAAAATGAATAGATATCATTTATCGTTGAG

Protein sequence

Show/hide protein sequence

MDSSGMGSGFLSAGGGLLDLESPIRRHQQTQLVNPSLTHHHHLNRMSTFEGDHQSIGIVDTKSFGQKDLLTTFAKGKAIATGNATNNNNTSEEDEPSFTEDGECSEFFKG
KKGSPWQRMKWTDDIVKLLIAVVACVGDDGEAGMGSKRKSGILQKKGKWKTVSKIMISKGRHVSPQQCEDKFNDLNKRYKRLNDILGRGTSCMVVENPALMDSMAQLSNK
AKDDVRKILSSKHLFYKEMCAYHNGQTIPGCQDLDFQGKILPVANFSKGNNESEEADESDGEDDESDNEDDHCPVENGLWVAESRGRNKLSGDDGPLWSNSVAQNEFEGQ
IDVFLSDPTKSQWERRDWIKKQMLHLQEQSVSFQAQAVELEKQRFKWLRYCSKKSRDLERARLENERLKLDNERRVLQLKQKETELEFKRSDSSLGPTLGIDRIQGREHI
DLGRH

MC02g0094 (gene) of Bitter gourd (Dali-11) v1 genome