CuGenDBv2

Gene ID	Tan0006405
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Nucleic acid-binding, OB-fold containing protein
Genome location	LG01:115705991..115708600
RNA-Seq Expression	Tan0006405
Synteny	Tan0006405
Gene Ontology terms	GO:0006352 - DNA-templated transcription, initiation (biological process) GO:0005736 - RNA polymerase I complex (cellular component) GO:0003899 - DNA-directed 5'-3' RNA polymerase activity (molecular function)
InterPro domains	IPR036898 - RNA polymerase Rpb7-like, N-terminal domain superfamily IPR045113 - RNA polymerase Rpb7-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022148351.1 uncharacterized protein LOC111016757 [Momordica charantia]

9.6e-113

90.52

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN+++YVHPSKSKKVSQAVLRELGAMLLKFDE+FEGVLLAY+AKI DKSAKILSGVHPYFGVT+KAKLLLFSPKPNMLLEGKVVKLRQES+H
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASA ITDEDIRDEFKHRTKH +EMFVSRAHKHHV+KVGTM+RFLVKSFDEEILHISGSLVPSHTGSIHWLEKNS+EGSVT+R RKKTRDN+GES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS
        LLQDSVAT+VNAL+LN+DHQ+KTKKQKTSR S
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS

XP_022940043.1 uncharacterized protein LOC111445794 isoform X1 [Cucurbita moschata]

1.2e-112

93.53

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLRELGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIR+EFKHRTKHG+EMFVSRA+KHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVT+RSRKKTRDND ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS
        LLQDSVAT+VNALLLN+DHQ+KTKKQKTSR S
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS

XP_022940045.1 uncharacterized protein LOC111445794 isoform X2 [Cucurbita moschata]

3.1e-111

93.53

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLRELGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIR+EFKHRTKHG+EMFVSRA+KHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVT RSRKKTRDND ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS
        LLQDSVAT+VNALLLN+DHQ+KTKKQKTSR S
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS

XP_022982461.1 uncharacterized protein LOC111481277 isoform X1 [Cucurbita maxima]

1.4e-111

93.83

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLR+LGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIR+EFKHRTKHG+EMFVSRAHKHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVTNRSRKK RDND ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQK
        LLQDSVAT+VNALLLN+DHQ+KTKKQK
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQK

XP_023523351.1 uncharacterized protein LOC111787571 [Cucurbita pepo subsp. pepo]

2.1e-112

93.53

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLRELGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIRDEFKHRTKHG+EMFVSRA+KHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVTNRSRKK RD D ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS
        LLQDSVAT+VNALLLN+DHQ+KTKKQKTSR S
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D5Y9 uncharacterized protein LOC111016757

4.6e-113

90.52

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN+++YVHPSKSKKVSQAVLRELGAMLLKFDE+FEGVLLAY+AKI DKSAKILSGVHPYFGVT+KAKLLLFSPKPNMLLEGKVVKLRQES+H
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASA ITDEDIRDEFKHRTKH +EMFVSRAHKHHV+KVGTM+RFLVKSFDEEILHISGSLVPSHTGSIHWLEKNS+EGSVT+R RKKTRDN+GES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS
        LLQDSVAT+VNAL+LN+DHQ+KTKKQKTSR S
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS

A0A6J1FN75 uncharacterized protein LOC111445794 isoform X1

6.0e-113

93.53

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLRELGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIR+EFKHRTKHG+EMFVSRA+KHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVT+RSRKKTRDND ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS
        LLQDSVAT+VNALLLN+DHQ+KTKKQKTSR S
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS

A0A6J1FPG3 uncharacterized protein LOC111445794 isoform X2

1.5e-111

93.53

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLRELGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIR+EFKHRTKHG+EMFVSRA+KHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVT RSRKKTRDND ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS
        LLQDSVAT+VNALLLN+DHQ+KTKKQKTSR S
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQKTSRKS

A0A6J1IWP0 uncharacterized protein LOC111481277 isoform X1

6.7e-112

93.83

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLR+LGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIR+EFKHRTKHG+EMFVSRAHKHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVTNRSRKK RDND ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQK
        LLQDSVAT+VNALLLN+DHQ+KTKKQK
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQK

A0A6J1J4W1 uncharacterized protein LOC111481277 isoform X2

6.3e-110

93.39

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLKVSDAN++IYVHPSKSKKVSQAVLR+LGAMLLKFDE+FEGVLLAYEA IIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES
        VIVLGFASAVITDEDIR+EFKHRTKHG+EMFVSRAHKHHV+KVGTMVRFLVKSFDEEILHISGSLVPSHTGSIH LEKNSVEGSVT RSRKK RDND ES
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGES

Query:  LLQDSVATEVNALLLNDDHQTKTKKQK
        LLQDSVAT+VNALLLN+DHQ+KTKKQK
Subjt:  LLQDSVATEVNALLLNDDHQTKTKKQK

SwissProt top hits

e value

%identity

Alignment

O43036 DNA-directed RNA polymerase I subunit rpa43

8.1e-06

23.93

Show/hide

Query:  NMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYE-AKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIHVIVLGFAS
        ++ + + P  S+    A+   + +M+L    +  G++LAY+  + ++KSAK++    P+  + ++  +L+FSPK    LEGK+  +    I +++LG  +
Subjt:  NMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYE-AKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIHVIVLGFAS

Query:  AVITDEDI-RDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEE--ILHISGSLVPS
        A I  + I +D         +E    + +  ++L+ G  + F+V     E  +  + G+L  S
Subjt:  AVITDEDI-RDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEE--ILHISGSLVPS

Arabidopsis top hits

e value

%identity

Alignment

AT1G75670.1 DNA-directed RNA polymerases

9.7e-63

56.7

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLK+S+A ++I++HPS+S+ V Q + REL ++L +++E F+GVLLAY+A +  K AKIL+G+HPYFGV +  +LLLF PKP   +EGK+VK+  ESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTR
        VIVLGF++AVITD DIR+EFK+R + G+  FVSR+HK H LK+GTM+R  V+SFDEE++HI+GSL+P +TG + WLEK S E   T+R  K+ +
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTR

AT1G75670.2 DNA-directed RNA polymerases

9.7e-63

56.7

Show/hide

Query:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH
        MEGLK+S+A ++I++HPS+S+ V Q + REL ++L +++E F+GVLLAY+A +  K AKIL+G+HPYFGV +  +LLLF PKP   +EGK+VK+  ESIH
Subjt:  MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIH

Query:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTR
        VIVLGF++AVITD DIR+EFK+R + G+  FVSR+HK H LK+GTM+R  V+SFDEE++HI+GSL+P +TG + WLEK S E   T+R  K+ +
Subjt:  VIVLGFASAVITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAGGGGCTAAAGGTTTCGGACGCCAATATGATTATTTACGTTCACCCATCGAAAAGTAAGAAGGTTTCGCAAGCGGTGCTTCGGGAGCTTGGTGCTATGCTTCTGAA
ATTTGATGAAAAATTTGAAGGTGTGCTACTGGCTTATGAGGCCAAAATTATTGATAAAAGTGCGAAGATTCTATCTGGAGTACATCCCTATTTTGGCGTGACAATAAAGG
CAAAGCTATTACTTTTCTCTCCAAAACCAAACATGCTTTTAGAGGGAAAGGTGGTGAAGCTTAGGCAAGAATCGATCCATGTTATTGTCTTAGGTTTTGCTTCTGCTGTA
ATAACCGATGAAGACATTCGCGATGAATTCAAGCATAGAACAAAACATGGAGATGAAATGTTTGTCAGCAGAGCTCACAAGCACCATGTGTTAAAGGTTGGGACGATGGT
ACGATTTTTGGTGAAGAGCTTTGATGAGGAAATATTGCATATCTCTGGATCTCTAGTTCCATCTCACACGGGGAGCATCCATTGGTTGGAGAAGAATTCAGTTGAAGGTT
CGGTAACTAATAGGAGTAGAAAGAAGACGAGAGATAACGACGGAGAATCATTGTTGCAGGATAGTGTTGCCACTGAAGTAAATGCACTTCTCTTGAACGATGACCATCAA
ACTAAAACGAAAAAACAAAAAACTAGCAGAAAATCTTGA

mRNA sequence

Show/hide mRNA sequence

TGTTAATAGACGTTCGTTGTTTTTAACTTCTTCGAGCTCTTTCTTCTCCGGCCGCTGCGGATTCTCCTCCTCCTTGTTTCGGTCGTCGTTTCAATGGAGGGGCTAAAGGT
TTCGGACGCCAATATGATTATTTACGTTCACCCATCGAAAAGTAAGAAGGTTTCGCAAGCGGTGCTTCGGGAGCTTGGTGCTATGCTTCTGAAATTTGATGAAAAATTTG
AAGGTGTGCTACTGGCTTATGAGGCCAAAATTATTGATAAAAGTGCGAAGATTCTATCTGGAGTACATCCCTATTTTGGCGTGACAATAAAGGCAAAGCTATTACTTTTC
TCTCCAAAACCAAACATGCTTTTAGAGGGAAAGGTGGTGAAGCTTAGGCAAGAATCGATCCATGTTATTGTCTTAGGTTTTGCTTCTGCTGTAATAACCGATGAAGACAT
TCGCGATGAATTCAAGCATAGAACAAAACATGGAGATGAAATGTTTGTCAGCAGAGCTCACAAGCACCATGTGTTAAAGGTTGGGACGATGGTACGATTTTTGGTGAAGA
GCTTTGATGAGGAAATATTGCATATCTCTGGATCTCTAGTTCCATCTCACACGGGGAGCATCCATTGGTTGGAGAAGAATTCAGTTGAAGGTTCGGTAACTAATAGGAGT
AGAAAGAAGACGAGAGATAACGACGGAGAATCATTGTTGCAGGATAGTGTTGCCACTGAAGTAAATGCACTTCTCTTGAACGATGACCATCAAACTAAAACGAAAAAACA
AAAAACTAGCAGAAAATCTTGAAGACTGCTAATTATCACACAACACAGATCGTTTTTGCATCAGGGTGTTGATGATTCAAAGCAGAGATCCTCATTGTTTTCCTATTGTA
AGAAATGCTTGGGAGAGAGACGCACCTTTCACTTGGGAATATCACCTCAACTTTGATAATGACATAACATTATATCAGGGTATGGATAAATGCAGCTTCCCATTTTTGTA
ACTGTCAAGAAGAAATAGCCCAAATCCATGTATTATGGGCTTAGGCCCAATAGACATTGGTGAGTGAATGATTTTTTCCAGCCCAAATCTTGAGTTCAATATGCAGTAGG
TAGAGAAGAAAGAGATGACAGATGTCATCAACCTAGACTTTCTGAAAAATGATATGAGATTTGGACATTATATTTCTTAATTTCATTCAAAATCACACACAACACAAAAC
AACACCACACCAGACCGTTGGTTTGTCAATCATTATAATGAGGATATGATTTGGGTTTCGCAAGTACACTCGATTTGCACCGTTGAC

Protein sequence

Show/hide protein sequence

MEGLKVSDANMIIYVHPSKSKKVSQAVLRELGAMLLKFDEKFEGVLLAYEAKIIDKSAKILSGVHPYFGVTIKAKLLLFSPKPNMLLEGKVVKLRQESIHVIVLGFASAV
ITDEDIRDEFKHRTKHGDEMFVSRAHKHHVLKVGTMVRFLVKSFDEEILHISGSLVPSHTGSIHWLEKNSVEGSVTNRSRKKTRDNDGESLLQDSVATEVNALLLNDDHQ
TKTKKQKTSRKS

Tan0006405 (gene) of Snake gourd v1 genome