CuGenDBv2

Gene ID	CmoCh01G020190
Organism	Cucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Description	Nucleic acid-binding, OB-fold containing protein
Genome location	Cmo_Chr01:14196808..14199239
RNA-Seq Expression	CmoCh01G020190
Synteny	CmoCh01G020190
Gene Ontology terms	GO:0006352 - DNA-templated transcription, initiation (biological process) GO:0005736 - RNA polymerase I complex (cellular component) GO:0003899 - DNA-directed 5'-3' RNA polymerase activity (molecular function)
InterPro domains	IPR036898 - RNA polymerase Rpb7-like, N-terminal domain superfamily IPR045113 - RNA polymerase Rpb7-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7037901.1 rpa43, partial [Cucurbita argyrosperma subsp. argyrosperma]

8.9e-119

98.7

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL
        VIVLGFASAVITDEDIR+EFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGS TRSRKKTRDND+ESL
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL

Query:  LQDSVATDVNALLLNNDHQSKTKKQKTSRIS
        LQDSVATDVNALLLNNDHQSKTKKQKTSRIS
Subjt:  LQDSVATDVNALLLNNDHQSKTKKQKTSRIS

XP_022940043.1 uncharacterized protein LOC111445794 isoform X1 [Cucurbita moschata]

5.2e-119

99.57

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES
        VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT RSRKKTRDNDRES
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES

Query:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS
        LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS
Subjt:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS

XP_022940045.1 uncharacterized protein LOC111445794 isoform X2 [Cucurbita moschata]

2.1e-120

100

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL
        VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL

Query:  LQDSVATDVNALLLNNDHQSKTKKQKTSRIS
        LQDSVATDVNALLLNNDHQSKTKKQKTSRIS
Subjt:  LQDSVATDVNALLLNNDHQSKTKKQKTSRIS

XP_022982463.1 uncharacterized protein LOC111481277 isoform X2 [Cucurbita maxima]

2.4e-116

98.67

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLR+LGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL
        VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRA+KHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKK RDNDRESL
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL

Query:  LQDSVATDVNALLLNNDHQSKTKKQK
        LQDSVATDVNALLLNNDHQSKTKKQK
Subjt:  LQDSVATDVNALLLNNDHQSKTKKQK

XP_023523351.1 uncharacterized protein LOC111787571 [Cucurbita pepo subsp. pepo]

4.9e-117

98.28

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES
        VIVLGFASAVITDEDIR+EFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT RSRKK RD DRES
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES

Query:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS
        LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS
Subjt:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D5Y9 uncharacterized protein LOC111016757

4.3e-111

92.24

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLV+YVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAY+A I DKSAKILSGVHPYFGVT+KAKLLLFSPKPNMLLEGKVVKLRQES+H
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES
        VIVLGFASA ITDEDIR+EFKHRTKH EEMFVSRA+KHHVIKVGTM+RFLVKSFDEEILHISGSLVPSHTGSIH LEKNS+EGSVT R RKKTRDN+ ES
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES

Query:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS
        LLQDSVATDVNAL+LNNDHQSKTKKQKTSRIS
Subjt:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS

A0A6J1FN75 uncharacterized protein LOC111445794 isoform X1

2.5e-119

99.57

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES
        VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT RSRKKTRDNDRES
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES

Query:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS
        LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS
Subjt:  LLQDSVATDVNALLLNNDHQSKTKKQKTSRIS

A0A6J1FPG3 uncharacterized protein LOC111445794 isoform X2

1.0e-120

100

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL
        VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL

Query:  LQDSVATDVNALLLNNDHQSKTKKQKTSRIS
        LQDSVATDVNALLLNNDHQSKTKKQKTSRIS
Subjt:  LQDSVATDVNALLLNNDHQSKTKKQKTSRIS

A0A6J1IWP0 uncharacterized protein LOC111481277 isoform X1

2.9e-115

98.24

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLR+LGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES
        VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRA+KHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT RSRKK RDNDRES
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVT-RSRKKTRDNDRES

Query:  LLQDSVATDVNALLLNNDHQSKTKKQK
        LLQDSVATDVNALLLNNDHQSKTKKQK
Subjt:  LLQDSVATDVNALLLNNDHQSKTKKQK

A0A6J1J4W1 uncharacterized protein LOC111481277 isoform X2

1.2e-116

98.67

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDANLVIYVHPSKSKKVSQAVLR+LGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL
        VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRA+KHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKK RDNDRESL
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESL

Query:  LQDSVATDVNALLLNNDHQSKTKKQK
        LQDSVATDVNALLLNNDHQSKTKKQK
Subjt:  LQDSVATDVNALLLNNDHQSKTKKQK

SwissProt top hits

e value

%identity

Alignment

O43036 DNA-directed RNA polymerase I subunit rpa43

7.3e-07

25.15

Show/hide

Query:  NLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYE-ANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIHVIVLGFAS
        +L + + P  S+    A+   + +M+L    R  G++LAY+    ++KSAK++    P+  + ++  +L+FSPK    LEGK+  +    I +++LG  +
Subjt:  NLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYE-ANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIHVIVLGFAS

Query:  AVITDEDIRNEFKH-RTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEE--ILHISGSLVPS
        A I  + I  ++        EE    + N  ++++ G  + F+V     E  +  + G+L  S
Subjt:  AVITDEDIRNEFKH-RTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEE--ILHISGSLVPS

Arabidopsis top hits

e value

%identity

Alignment

AT1G75670.1 DNA-directed RNA polymerases

1.7e-59

56.48

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLK+S+A L+I++HPS+S+ V Q + REL ++L +++E F+GVLLAY+A +  K AKIL+G+HPYFGV +  +LLLF PKP   +EGK+VK+  ESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTR
        VIVLGF++AVITD DIR EFK+R + GE  FVSR++K H +K+GTM+R  V+SFDEE++HI+GSL+P +TG +  LEK S E   T    K R
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTR

AT1G75670.2 DNA-directed RNA polymerases

1.7e-59

56.48

Show/hide

Query:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLK+S+A L+I++HPS+S+ V Q + REL ++L +++E F+GVLLAY+A +  K AKIL+G+HPYFGV +  +LLLF PKP   +EGK+VK+  ESIH
Subjt:  MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTR
        VIVLGF++AVITD DIR EFK+R + GE  FVSR++K H +K+GTM+R  V+SFDEE++HI+GSL+P +TG +  LEK S E   T    K R
Subjt:  VIVLGFASAVITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAGGGGCTTAAGGTTTCCGACGCCAATTTGGTTATCTACGTTCACCCGTCCAAAAGTAAGAAGGTTTCGCAAGCGGTGCTCCGAGAGCTCGGCGCTATGCTTCTGAA
ATTTGACGAAAGGTTTGAAGGTGTCCTACTGGCTTATGAGGCCAATATTATTGATAAAAGTGCGAAGATTCTATCTGGAGTGCATCCATATTTTGGTGTGACAATAAAGG
CAAAGCTATTACTTTTCTCTCCGAAGCCGAACATGCTTTTAGAGGGAAAGGTGGTGAAGCTTAGGCAAGAATCAATCCATGTTATTGTCTTGGGTTTTGCTTCTGCTGTA
ATAACCGATGAAGACATTCGCAATGAATTCAAGCATAGAACAAAACATGGAGAAGAAATGTTTGTCAGCAGAGCTAACAAGCACCATGTGATAAAGGTTGGGACAATGGT
ACGATTTTTGGTGAAGAGTTTTGATGAGGAAATATTGCACATCTCTGGATCTCTAGTTCCATCTCACACAGGGAGCATCCATTGCTTGGAGAAAAATTCAGTTGAAGGTT
CAGTAACTAGGAGTAGAAAGAAGACGAGAGATAACGACAGAGAATCATTGTTGCAAGATAGTGTTGCCACTGATGTAAATGCACTTCTCTTGAACAATGACCATCAATCT
AAAACCAAAAAACAAAAAACTAGCAGAATATCTTGA

mRNA sequence

Show/hide mRNA sequence

GGGTCACATACGCTCGATTGTGTTTCTTCTCGCTGCTTTTACCTTGCTTCGAGCTTATTCTTCTTCTTCTCCTCCTTCTTTCGCTCGCCGTTTCAATGGAGGGGCTTAAG
GTTTCCGACGCCAATTTGGTTATCTACGTTCACCCGTCCAAAAGTAAGAAGGTTTCGCAAGCGGTGCTCCGAGAGCTCGGCGCTATGCTTCTGAAATTTGACGAAAGGTT
TGAAGGTGTCCTACTGGCTTATGAGGCCAATATTATTGATAAAAGTGCGAAGATTCTATCTGGAGTGCATCCATATTTTGGTGTGACAATAAAGGCAAAGCTATTACTTT
TCTCTCCGAAGCCGAACATGCTTTTAGAGGGAAAGGTGGTGAAGCTTAGGCAAGAATCAATCCATGTTATTGTCTTGGGTTTTGCTTCTGCTGTAATAACCGATGAAGAC
ATTCGCAATGAATTCAAGCATAGAACAAAACATGGAGAAGAAATGTTTGTCAGCAGAGCTAACAAGCACCATGTGATAAAGGTTGGGACAATGGTACGATTTTTGGTGAA
GAGTTTTGATGAGGAAATATTGCACATCTCTGGATCTCTAGTTCCATCTCACACAGGGAGCATCCATTGCTTGGAGAAAAATTCAGTTGAAGGTTCAGTAACTAGGAGTA
GAAAGAAGACGAGAGATAACGACAGAGAATCATTGTTGCAAGATAGTGTTGCCACTGATGTAAATGCACTTCTCTTGAACAATGACCATCAATCTAAAACCAAAAAACAA
AAAACTAGCAGAATATCTTGAAGATTGCTAATTGTCATACAACATAGATCGTTTTTGTATCAGGGTGATGATGATTCAAATCAGAGATCCTCGTTGTTTTCCCATTGCAA
GATATGCTTGGGAAAGAGATGCACCTTTCACTTGGGAATATCTGACGTGACATCACATTATATCAGGGTGTAGATAAATGCAGTTTCCCATCTTTGTAATTGTCTTCTAA
GTAGCCCAAATCCTTGTTTTATGGGCTTTAGCTCTAGTAGACATTAGTGAGCAAATGATTTTTGTTTAGTCCAATGTGCATTAGGTAAGGATAGGGGGAGGACAGATGTT
ATCAACCTAGACTTCCCTAAAAAACTGTGAGTTTTTGATATTATATTTCTTAGTTTCATTCAGAATCAGACACACCACAAAAAACAACACCACAACCAGACCGTTTGTTT
GTCAATCATTATAAGGAGGATATGATTTGGGTTTTGCAAGTACATTCTATTTGCACCGTTGACTTATATGATTGCCACTATATCCCTC

Protein sequence

Show/hide protein sequence

MEGLKVSDANLVIYVHPSKSKKVSQAVLRELGAMLLKFDERFEGVLLAYEANIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIHVIVLGFASAV
ITDEDIRNEFKHRTKHGEEMFVSRANKHHVIKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHCLEKNSVEGSVTRSRKKTRDNDRESLLQDSVATDVNALLLNNDHQS
KTKKQKTSRIS

CmoCh01G020190 (gene) of Cucurbita moschata (Rifu) v1 genome