CuGenDBv2

Gene ID	ClCG05G011880
Organism	Citrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
Description	conserved peptide upstream open reading frame 9
Genome location	CG_Chr05:14785565..14791355
RNA-Seq Expression	ClCG05G011880
Synteny	ClCG05G011880
Gene Ontology terms	NA
InterPro domains	IPR012511 - S-adenosyl-l-methionine decarboxylase leader peptide

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8650573.1 hypothetical protein Csa_010068 [Cucumis sativus]

1.9e-22

100

Show/hide

Query:  ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
Subjt:  ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

KAG6581173.1 hypothetical protein SDJN03_21175, partial [Cucurbita argyrosperma subsp. sororia]

1.0e-23

60.16

Show/hide

Query:  GFLGFRSPPLTHLIGFNWRKGTKAKGFSVLTGSPIFTFRIYWVSSLFKIISFISVEASLISFWGATSICAANDLMESKGGKKKSSSSSSSKSLFYEAPLG
        GF  FRS PL HLI F+ R+  + KGF    G  +F   +++V        FI                 ANDLMESKGGKKK SSSSSSKSLFYEAPLG
Subjt:  GFLGFRSPPLTHLIGFNWRKGTKAKGFSVLTGSPIFTFRIYWVSSLFKIISFISVEASLISFWGATSICAANDLMESKGGKKKSSSSSSSKSLFYEAPLG

Query:  YSIEDVRPHGGIKKFRSAAYSNCVRKPS
        YSIEDVRPHGGIKKFRSAAYSNCVRKPS
Subjt:  YSIEDVRPHGGIKKFRSAAYSNCVRKPS

KAG6607040.1 Uridine kinase-like protein 2, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia]

1.4e-20

98.28

Show/hide

Query:  NDLMESKGGKKK-SSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        NDLMESKGGKKK SSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
Subjt:  NDLMESKGGKKK-SSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

KAG7017910.1 hypothetical protein SDJN02_19776, partial [Cucurbita argyrosperma subsp. argyrosperma]

5.3e-20

52.21

Show/hide

Query:  GFNWRKGTKAKG-FSVLTGSPIFTFRIYWVSSLFKIISFISVEASLISFWGATS---------------------ICAANDLMESKGGKKKSSSSSSSKS
        GF+ +  TK++  F +L    +F+   + V  L  +   + +   L+SF+ A S                     +  ANDLMESKGGKKK SSSSSSKS
Subjt:  GFNWRKGTKAKG-FSVLTGSPIFTFRIYWVSSLFKIISFISVEASLISFWGATS---------------------ICAANDLMESKGGKKKSSSSSSSKS

Query:  LFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        LFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
Subjt:  LFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

QHO12318.1 uncharacterized protein DS421_15g505930 [Arachis hypogaea]

4.0e-20

94.74

Show/hide

Query:  NDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        NDLMESKGGKK SSSSSSSKSLFYEAPLGYSIEDVRP+GGIKKFRSAAYSNC RKPS
Subjt:  NDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LAP2 Uncharacterized protein

9.4e-23

100

Show/hide

Query:  ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
Subjt:  ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

A0A444FD06 Uncharacterized protein

1.3e-19

60.19

Show/hide

Query:  PIF-TFRIYWVSSLFKIISFISVE----------ASLISFWGATSICA--ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAY
        P+F  F +Y V  ++ + S I +            SLI   G  S+ A   N+LMESKGGKKKSSSSSSS SL YEAPLGYSIEDVRPHGGIKKF++AAY
Subjt:  PIF-TFRIYWVSSLFKIISFISVE----------ASLISFWGATSICA--ANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAY

Query:  SNCVRKPS
        SNCVRKPS
Subjt:  SNCVRKPS

A0A5J5AL23 Uncharacterized protein

5.7e-20

63.27

Show/hide

Query:  FTFRIY-----WVSSLFKIISFISVEASLISFWGATSICAANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        F FR +     W+   FK +  IS    +I  + +  +   NDLMESKGGKKK   SSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNC RKPS
Subjt:  FTFRIY-----WVSSLFKIISFISVEASLISFWGATSICAANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

A0A6A5NYN2 Uncharacterized protein

1.7e-19

91.23

Show/hide

Query:  NDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        NDLMESKGGKKKSSSSSS  SLFYEAPLGYSIEDVRP+GGI+KFRSAAYSNC RKPS
Subjt:  NDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

A0A6A6MF36 Uncharacterized protein

1.3e-19

94.74

Show/hide

Query:  NDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        NDLMESKGGKKK   SSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
Subjt:  NDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G02468.1 conserved peptide upstream open reading frame 9

4.0e-18

Show/hide

Query:  LMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        +MESKGGKKKSSSSS   SLFYEAPLGYSIEDVRP+GGIKKF+S+ YSNC ++PS
Subjt:  LMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

AT3G25572.1 conserved peptide upstream open reading frame 11

1.5e-17

81.48

Show/hide

Query:  MESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        ME+KGGKKKSS+SSS  SLF+EAPL YSIEDVRP+GGIKKFRSAAYSN   KPS
Subjt:  MESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

AT5G15948.1 conserved peptide upstream open reading frame 10

2.4e-15

74.07

Show/hide

Query:  MESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS
        MESK G KKSSS+S   SL YEAPLGYSIEDVRP GGIKKF+S+ YSNC ++PS
Subjt:  MESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPHGGIKKFRSAAYSNCVRKPS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

mRNA sequence

Show/hide mRNA sequence

ATGGGGTTTCTCGGGTTTCGTTCTCCGCCGCTAACGCATTTAATCGGATTTAATTGGAGAAAGGGTACTAAGGCAAAGGGTTTCTCGGTGTTAACTGGTTCACCCATTTT
TACATTTCGTATTTATTGGGTTTCCAGTCTTTTTAAAATTATTTCCTTCATTTCGGTTGAGGCTTCTCTGATTTCATTTTGGGGTGCTACCTCTATCTGTGCAGCGAATG
ATTTAATGGAGTCAAAAGGTGGTAAGAAGAAGTCTAGTAGTAGTAGTAGTAGTAAATCCCTTTTCTACGAAGCTCCCCTCGGATACAGCATTGAAGACGTGCGACCACAC
GGTGGAATCAAGAAGTTCAGATCTGCTGCTTACTCCAACTGCGTTCGAAAGCCATCCTGAGTTCTGCTGAATTCCGTTTACCCTGCGCCCCGAGATCTTTAGTTTCTTTA
TAATTTTTAGTCTGTCTTTTTTCTTCGGTACTCTCTACTTTCCTCGTTCTCTCGTTCAGTCTCTCGACATTATTAGCTTCCTTTTAAGAAAAGATGACGTTTCCAACCTC
TGCTATCGGATTTGAAGGCTATGAAAAGAGGCTCGAAGTATCATTCTTCGAGCCAAGCGTTTTTGCTGACCCTAGGGGCATGGGTCTCCGTGCGCTGTCAAAAGCACAAC
TGGATGAAATTCTGACATTAGCTGAGTGCACCATTGTCGACTCTTTGTCAAATGACTATCTTGATTCGTATGTCCTTTCAGAGTCGAGCCTCTTTGTGTACCCATACAAG
TTCATCATCAAAACCTGCGGCACTACTAAGCTGCTTCTCTCTATCCCAGCTCTGTTGAAGTTGGCTGATTCTCTGTCTCTTACTGTGAAGTGTGTGAGGTACACTCGTGG
CAGCTTTATCTTTCCTGGTGCCCAGTCTTTTCCCCATCGCAGCTTCTCTGAGGAAGTTGCCGTCCTTGATGGCTATTTGGCCAAGCTTGGCCTCAAAGGCTCTGCTATTG
TGATGGGAAGTCCTGATGAAACAAGGAAATGGCACGTTTATTCTGCCTGTGCCAACATGGGGAGTCAAAGTAACAACCCTGTTTATACCCTGGAAATGTGCATGACTGGC
TTAGACAAGGAGAAGGCATCTGTCTTCTTCAAAACAGATGCAAGTTCTGCTGCTGCGATGACTGAAAATTCTGGTATTAGGAAAATCCTTCCAAAATCTGAAATATGTGA
TTTCGAGTTCGACCCTTGTGGTTATTCCATGAATGCCATTGAAGGAGATGCAGAGTCTACAATCCATGTTACTCCAGAAGATGGGTTTAGTTATGCAAGCTTTGAAGCAG
CTGGTTATGACTTCGACGACATAAATCTGTCTAAGCTGATTGTGAGGGTGCTGGCATGCTTCCAGCCTTCTGATTTTTCTGTTGCCCTCCATTCAGATCTCGTTGGTGAG
AATCTGGAAGATTTACTCTGCCTGGAATTGAAGGGTTACGAGGGTGGTGAGAAGAGCTGTGAAATGCTGGGGGAAAATGGAACCGTTATCTACCAGAGCTTTGTGAAGAC
CGGAGGAGATTATGCCTCATCTCCAAGGTCAACCCTGTTGAAATGTTGTTGGAGCGAGGACGAGAAGGACGAGGAAGTTGGGAAGTATTAGAACTTTTATCAACTTCTGC
TTGCTTTTTTTATCTTTACTAGTAATGAATAATAAACAAAGAAGTATCTTGGGGGTCATATTCTGAAAAAAAAAAAAAATTAAGCTGCCTTTGGTGTGTTTATGCAGCAT
ATTAGTTCTTTCTTAAGTGTCTTGTGTTTTCTTTTCGTCATTGTTGGAGTCAATTTTCATTCTGCGAATAATTCCCCGAGGGGGGAATCCTGTTGGATTCTGGAAGTCTG
TCTTCTGTTATGGTTTTGCATCATATTATTTTATGATGAAACGTATCGATCGTATTTTGTTATTTTAATCAAGACTTTGGTTTTTTGGAATGATGTACTTTTGATCTTGC
TTTATTTATGTAATCATGGCATCTGGATGATGTGCAGATTTCAGCTTTCTTTTTTCCTTCTGCTTTCTATATATAATAATTATGAATAGTACTGTGGAAGGGTGGAGAGT
ACAGAATGACAGGCCAACTATTGTGAAAAGAGGTTAATAATGAGGGGAAAAGGGAGGGAAGGAGATGTTGGAGATCTTTGGAGAAGAAGTGCTATTTGGCCGTCGAGTCT
GCCAAAAAGTTATAATTTCCAACATTTTGAAGAATGCTTGGTTTTCTAAATTAGTGAGAACTTGAGAAGTACATCAACTCTTGATTGTGGTACAAGTTTTAGCCCTGCGA
TATGGAAGCAGCGGTGCAAATGGCACTTGGAATTATTGAAGCTGCAGGTGGGGAGTTATATTGCAAATATATACTGTAAAACAATGGTGGAATGGAAAGGTGAAATCATC
ATTGCAGAAAGGGGACAAAATGTTGTGGAGTTGACTCATTCAGATGAATGGAAATACTTTTTCCTAGCCAAAAAGTGAATTCCTATCCAAAATGTGAATTTTTAGAGAGT
GCTTTTGACTTTCAGTACTCCTAATATACCATTGCTTAAATTACACATTTTGGAAGAATTAGCAAATAGTTAGGACCTTAGAAACAAAAGTGGAGTCCTTCTGCTGGCAA
GGTAGCGCATTTCAAAGGAGGACTTGAGCCGACTTTGCTTCTTTTCTAGCTCGGTTTCTTGGATTACCTTGAGGGAGGATGACACCTCGACCTCAATAGTAAAACATCTT
CCAAACTATATACAGTGAAAATGGTGTTGTCCTAATTGATGTGCAAACTGATGTTTGATGACCATGTAATACAAAAGGTAACATCTCATGCCAATTGTTATGATTGACAG
TTATATTCTTGATAATTTTCTTGATATTTTAGTTTGTCGTCCCACTACTCCATTCATTTTAGGGCGATCAGAATAGAGTTGTAGTGTCTAATTTTGGATTGAGTACATAA
TTATTATTCAAGTTCAGTGATGATACGTTTCGGCACATATAATCCTTATGAACTTGACAATACCTTGTTTGGGTGACACTCTTGTATGAGGCAGTTTCTTACCCATTTTG
TAAGATAGTTAATGGCTACTAAATTGAATTGGTGACCATTTGATGCCTTTTGCTCAATGGCTACTAAGCTGGAGCATGTACTTTATTTGTATATATTTTGCATTTGTGAC
ATTTTCTTAATTCGATCCGACACGTAAAGCTTGTCTTGGCATCATGTGTCCGCTTGTATGTGTCCCATAGACTCCTTCGTGTACTTTTTCTAGAATTCTCTTGGCTTCTG
AAGCTTCAACACATCTTAGAAGAGTCATATGTATAACGTTTCTTCGTTAAAAAAGTAACTCATGACCAACTTTCTGATAGTGCACTTACTATTTTCAAATGCTCCCTATA
GATATTCTCGATGTGTATGTAGTGTTTAATGTCATGATATGAGAGCTTTTCATTGGGTTCAAGAATGTAGTATGTTGGTGCTTCACGCTATGCAATTTTTATATACTAGA
TTGATTCATTGTAAGCCGCATTAAATATGGCCGACAAAGTGGTCCATGTATCTGCAATCTGGTTATTTTCATGTAGGACATATTTGTGTGTGATTCAAAGGTTTGGGCCA
ATTATCGGATGTACTTGATGTTAGTACTACCATAATATCTTCATCTAGAAATTCAAATTTCATTGGCTTACATTTTTCAACTAGTAATTAGTTAGTAAATCGACGATTGC
AGCCTCGTTTATGGTTTTTCTATTGACATAGACAATATTGTACTTAGATAGTAATACTTGCCATCTAGTTTCTCCTAGACGAAGATGACTTTTCGAAAATGTACTTTATA
AGATCCATTTTTTAGATAAACCATGTAGTACAGAATATACTGTATTAATCTTTAAGCTGCCCACGCTAAGGCACAACTTGCTTTTTTTCCAATAACGAGTATTTTTACTA
ATAATTTGTGAACTTTTTACTCAAATAAAAATCAACTTGCCCCTCCCTTCCTATAGAGTCGTTTTACCCCTATACATATTCCATTTAGATCTCCTTTATCATTAAGTATA
GGATTAACGGTTGTCTTGGAGTTGGTGGGACAAGTATTAGAGGGCTTCGTAAATGATCTTTGATTTTATCGAAAGCTCTTTGGCAATCTTTGTTCCAACAACATAGCGCA
CCCTTGCAAAGGAGTCTTAATATTGGCTTGCATGTTTGAGTGTGGTGTGAAATAAATCATGTGATGTAATTTAGTCTCCCCATGAAACTTCTAATTTCCATTTGGATTTT
TGATGGCTTTAAATTCACTATTGCCTTGATTTTGTTTGGGTTGACTTTGATTCTCCCTTGACTAACGATGAAACTCAACAATTCTAAACAATACTCTGAATATGCACTTT
GCTACTTTTGCAATCTCTTGAAAAGTATGCAAAGGGTAACTATATGCTTTTCTCCGGGTTTAGACTTTCCTATCATATCATCAAAATAACTTCAATTTTTTTTTTGCATC
AAGTCATGAAATAACGTAAGAATAGTTTTTTGGTAA

Protein sequence

Show/hide protein sequence

MGFLGFRSPPLTHLIGFNWRKGTKAKGFSVLTGSPIFTFRIYWVSSLFKIISFISVEASLISFWGATSICAANDLMESKGGKKKSSSSSSSKSLFYEAPLGYSIEDVRPH
GGIKKFRSAAYSNCVRKPS

ClCG05G011880 (gene) of Watermelon (Charleston Gray) v2.5 genome