CuGenDBv2

Gene ID	CcUC09G167500
Organism	Citrullus colocynthis (Watermelon (PI 537277) v1)
Description	Polyketide_cyc domain-containing protein
Genome location	CicolChr09:4090921..4097311
RNA-Seq Expression	CcUC09G167500
Synteny	CcUC09G167500
Gene Ontology terms	NA
InterPro domains	IPR023393 - START-like domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_008461396.1 PREDICTED: uncharacterized protein LOC103499992 isoform X1 [Cucumis melo]

5.6e-87

78.57

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MSIA L  NSTPNSL L H SIRRRNGILFMAIPT RSINSRS SLP+LVFKIPR SS RSRNPI PRLKFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PT NQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLLQRGL+SFA FAKKYQTA
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

XP_022148316.1 uncharacterized protein LOC111016984 isoform X3 [Momordica charantia]

4.5e-89

87.5

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MS AA+ CNS PNS NL+H SI+RRNG+L MAIPT RSINS+S SLPELVF+IPRGS  RS NP FPR+KFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVKPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRSFAKFAKKYQTA
        REAIPKWMPFISSVKPTLNQKIHWRSLEGLPNRGVVRFYPKG SSCLVELTVSYEVPPLLSPVASALQPLLERLL+RGL SFA FAKKYQTA
Subjt:  REAIPKWMPFISSVKPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRSFAKFAKKYQTA

XP_022960550.1 uncharacterized protein LOC111461253 [Cucurbita moschata]

6.1e-86

75.89

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MS+AAL CNS PN+LNL+H SIRR NG+LFMAIPT RSINSRSLSLP+L+F+IPR SS   RNPI PR+KFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLL+RGL SFA FAKKYQTA
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

XP_023514604.1 uncharacterized protein LOC111778852 [Cucurbita pepo subsp. pepo]

2.8e-86

75.89

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MS+AAL CNS PN+LNL+H SIRR NG+LFMAIPT R+INSRSLSLP+L+F+IPRGSS   RNPI PR+KFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLL+RGL SFA FAKKYQTA
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

XP_038898800.1 uncharacterized protein LOC120086302 [Benincasa hispida]

3.6e-86

78.12

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        M+IAAL CNSTPNS  LTH SIRRRNGILFMAIPTCRSI+SRSLSLPELVFKIPR SS R RNPI P LK VSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PT NQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLLQRGL+SFA FAKKYQT+
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

TrEMBL top hits

e value

%identity

Alignment

A0A1S3CEM7 uncharacterized protein LOC103499992 isoform X1

2.7e-87

78.57

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MSIA L  NSTPNSL L H SIRRRNGILFMAIPT RSINSRS SLP+LVFKIPR SS RSRNPI PRLKFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PT NQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLLQRGL+SFA FAKKYQTA
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

A0A6J1D2J2 uncharacterized protein LOC111016984 isoform X1

2.1e-84

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MS AA+ CNS PNS NL+H SI+RRNG+L MAIPT RSINS+S SLPELVF+IPRGS  RS NP FPR+KFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PTLNQKIHWRSLEGLPNRGVVRFYPKG SSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLL+RGL SFA FAKKYQTA
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

A0A6J1D507 uncharacterized protein LOC111016984 isoform X3

2.2e-89

87.5

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MS AA+ CNS PNS NL+H SI+RRNG+L MAIPT RSINS+S SLPELVF+IPRGS  RS NP FPR+KFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVKPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRSFAKFAKKYQTA
        REAIPKWMPFISSVKPTLNQKIHWRSLEGLPNRGVVRFYPKG SSCLVELTVSYEVPPLLSPVASALQPLLERLL+RGL SFA FAKKYQTA
Subjt:  REAIPKWMPFISSVKPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRSFAKFAKKYQTA

A0A6J1H9D8 uncharacterized protein LOC111461253

3.0e-86

75.89

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MS+AAL CNS PN+LNL+H SIRR NG+LFMAIPT RSINSRSLSLP+L+F+IPR SS   RNPI PR+KFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLL+RGL SFA FAKKYQTA
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

A0A6J1KR05 uncharacterized protein LOC111497878

1.5e-85

75.45

Show/hide

Query:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD
        MS+AAL CNS PN+LNL+H SIRR NG+LFMAIPT RSIN RSLSLP+L+F+IPR SS   RNPI PR+KFVSPVMEWQ+CTAKMEVDIPASVAYKCYSD
Subjt:  MSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSD

Query:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
        REAIPKWMPFISSVK                                PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ
Subjt:  REAIPKWMPFISSVK--------------------------------PTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQ

Query:  PLLERLLQRGLRSFAKFAKKYQTA
        PLLERLL+RGL SFA FAKKYQTA
Subjt:  PLLERLLQRGLRSFAKFAKKYQTA

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G02470.1 Polyketide cyclase/dehydrase and lipid transport superfamily protein

2.4e-35

41.75

Show/hide

Query:  RNGILFMAIPTCRSINS----RSLSLPELVFKIPRGSSN-----RSRNP--IFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSDREAIPKWMPFISS
        R+ + F  IP   ++ S     S S P ++  +   S+N      S N   I    K   PVM+WQD T KM VD PASVAYK Y+DRE  PKWMPF+SS
Subjt:  RNGILFMAIPTCRSINS----RSLSLPELVFKIPRGSSN-----RSRNP--IFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSDREAIPKWMPFISS

Query:  V--------------------------------KPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRS
        V                                +P  ++KIHWRS+EG  NRG VRF+P+GPSSCLVE++ SYEVP   +PVA A++P +E++++ GL  
Subjt:  V--------------------------------KPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRS

Query:  FAKFAK
        FA F K
Subjt:  FAKFAK

AT1G02470.2 Polyketide cyclase/dehydrase and lipid transport superfamily protein

5.8e-34

41.55

Show/hide

Query:  RNGILFMAIPTCRSINS----RSLSLPELVFKIPRGSSN-----RSRNP--IFPRLKFVSPVMEWQDCT-AKMEVDIPASVAYKCYSDREAIPKWMPFIS
        R+ + F  IP   ++ S     S S P ++  +   S+N      S N   I    K   PVM+WQD T  KM VD PASVAYK Y+DRE  PKWMPF+S
Subjt:  RNGILFMAIPTCRSINS----RSLSLPELVFKIPRGSSN-----RSRNP--IFPRLKFVSPVMEWQDCT-AKMEVDIPASVAYKCYSDREAIPKWMPFIS

Query:  SV--------------------------------KPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLR
        SV                                +P  ++KIHWRS+EG  NRG VRF+P+GPSSCLVE++ SYEVP   +PVA A++P +E++++ GL 
Subjt:  SV--------------------------------KPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLR

Query:  SFAKFAK
         FA F K
Subjt:  SFAKFAK

AT1G02475.1 Polyketide cyclase/dehydrase and lipid transport superfamily protein

3.4e-42

48.02

Show/hide

Query:  MSIAALACNSTPNSLNLT--HPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRG----SSNRSRNP--IFPRLKFVSPVMEWQDCTAKMEVDIPAS
        MS+ A+  N T N L+ T   P+I+          P C      S SL  L  K   G    SS+ SR    I P+ +  S  MEWQDC+ KMEVD+P S
Subjt:  MSIAALACNSTPNSLNLT--HPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKIPRG----SSNRSRNP--IFPRLKFVSPVMEWQDCTAKMEVDIPAS

Query:  VAYKCYSDREAIPKWMPFISSV--------------------------------KPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLL
        VAY  Y DRE+ PKWMPFISSV                                +PT NQKIHWRSLEGLPN+G VRF+PKGPSSC+VELTVSYEVP LL
Subjt:  VAYKCYSDREAIPKWMPFISSV--------------------------------KPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLL

Query:  SPVASALQPLLERLLQRGLRSFAKFAK
        +PVAS L+P +E LL+ GL  FA  AK
Subjt:  SPVASALQPLLERLLQRGLRSFAKFAK

AT4G01883.1 Polyketide cyclase / dehydrase and lipid transport protein

4.8e-36

48.54

Show/hide

Query:  PRGSSNRS-RNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSDREAIPKWMPFISSVK--------------------------------PTLNQ
        P  S+NRS ++ +F R      +MEWQ+C  KM+V++P SVAY  YS+RE+IPKWM FISSVK                                P  NQ
Subjt:  PRGSSNRS-RNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSDREAIPKWMPFISSVK--------------------------------PTLNQ

Query:  KIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRSFAKFAKKYQT
        KIHW SLEGLPN+G VRF+P GPSSC VELT +YEVP LL P A+ALQPL++ L++  L  FA+ AK  +T
Subjt:  KIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPPLLSPVASALQPLLERLLQRGLRSFAKFAKKYQT

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTTGTGCAAGAACAGCCTCCGAAAATCTCTCTTTCCAGAGCCACAATATTATCAAAGGGCTGTTCTTGCAGTTTGGTGCAACTCAAATCTCCGCTCCAACT
CTCTTTAGTGTCCCCTTGCTGTTTTCTTCTTCACTAATCCAAAATCCCACTATGTCAATTGCAGCACTCGCCTGCAATTCCACTCCAAACTCTCTCAATCTCACT
CATCCATCGATCAGAAGGAGAAATGGCATCTTGTTCATGGCGATTCCCACTTGCAGAAGCATCAATTCGAGGTCACTCTCTCTACCCGAGCTCGTCTTCAAGATC
CCACGTGGTTCTTCGAACCGCAGCAGAAACCCCATTTTCCCTCGACTTAAGTTCGTCTCCCCTGTGATGGAATGGCAGGATTGCACGGCTAAGATGGAAGTTGAC
ATACCTGCTTCGGTTGCCTATAAATGCTACTCAGATCGTGAAGCTATTCCCAAATGGATGCCATTCATTTCATCTGTGAAGCCGACCCTAAATCAAAAAATTCAT
TGGCGGTCACTTGAAGGTCTTCCAAACAGAGGTGTTGTACGATTTTACCCAAAGGGCCCCTCATCTTGCCTCGTAGAATTGACAGTCTCCTATGAAGTTCCTCCT
CTTTTGTCTCCAGTGGCCTCTGCACTGCAACCTCTGCTTGAGAGACTACTTCAACGAGGTCTTAGAAGCTTTGCCAAGTTTGCCAAGAAATACCAAACGGCTTGA

mRNA sequence

Show/hide mRNA sequence

AAATAATAAAAAAAATCCAAAGTCAATTATTGAACAAAAGATTTAACTAATTATGGTTTGTGCAAGAACAGCCTCCGAAAATCTCTCTTTCCAGAGCCACAATAT
TATCAAAGGGCTGTTCTTGCAGTTTGGTGCAACTCAAATCTCCGCTCCAACTCTCTTTAGTGTCCCCTTGCTGTTTTCTTCTTCACTAATCCAAAATCCCACTAT
GTCAATTGCAGCACTCGCCTGCAATTCCACTCCAAACTCTCTCAATCTCACTCATCCATCGATCAGAAGGAGAAATGGCATCTTGTTCATGGCGATTCCCACTTG
CAGAAGCATCAATTCGAGGTCACTCTCTCTACCCGAGCTCGTCTTCAAGATCCCACGTGGTTCTTCGAACCGCAGCAGAAACCCCATTTTCCCTCGACTTAAGTT
CGTCTCCCCTGTGATGGAATGGCAGGATTGCACGGCTAAGATGGAAGTTGACATACCTGCTTCGGTTGCCTATAAATGCTACTCAGATCGTGAAGCTATTCCCAA
ATGGATGCCATTCATTTCATCTGTGAAGCCGACCCTAAATCAAAAAATTCATTGGCGGTCACTTGAAGGTCTTCCAAACAGAGGTGTTGTACGATTTTACCCAAA
GGGCCCCTCATCTTGCCTCGTAGAATTGACAGTCTCCTATGAAGTTCCTCCTCTTTTGTCTCCAGTGGCCTCTGCACTGCAACCTCTGCTTGAGAGACTACTTCA
ACGAGGTCTTAGAAGCTTTGCCAAGTTTGCCAAGAAATACCAAACGGCTTGAAGACTCGATTACTGTTTTATGGTTGCTGAACTCTTCAATCTGTTGTTACAAAT
GAGAGATTTTAGAGCAAGCAATCACGCTCATTGGCATCCACTGTTATCCAGCCATCTTTGCAAGCTACAAAGAGCCTGTGCAGAGAGACTGCAGTATCTTAAGTT
CCGCTGCTGTGGTCGTGGAGAATTGCCAGGATGGAAACTGGAGAAGCAAACAACAACAACAGTGAGGTTGTCGAATGAGTCTAGTCGCAAAGCCTGAAGGACGAG
GTCTCGAGCACACCGCTCAGGGTCATCATGACGTTGAAGCCCCTGTCGAACTACATTGACTGCTTGTTGGCTCGACATCACGTCCCAAATCCCATCACAGGCTAT
GATCAAGAACTCATCCTCTTCTGTAAGCACCACCTGCCTGCATTCTGGTTCTGCAATGAGAGGCGAAGGAGAACCATCAGGGAGCTTCATGTCCCAATCCCCCAA
TGCCCTGGAAACCGATAAAACGCCGTTGAGATAGCCACCATCAACAAAGCCACCCAACTCTTCTACCCGTTGCTTCTCTGGAGAATAAACTGGCCGGTGGTCTTG
AGACATATCTACTGCCTCCCCATTCCGGCTGAGAACAGCTCGGCAATCTCCAGCATTCGCCACCATTAAATGCCTTCCAAGCACAAGAGCTGTCAGGGCCGTCGT
CCCGGATGAACTACTGACACTGGAATCATCAGCCAGAGCTCGATCAGCTAGAAGAAATGCTTTTCGGAGACAATTTTCTATCTCCTCCGGCAAGACTTCACCAAT
ATCTGGAATTTGAGGAAAACTAACATCCTCAAAAAAGAGTCTAAGAACATTCTTTCTGATATAAGCTGCTGCTTCAGGACCTCCATGTCCATCGAATACCTGATC
AACAAATTCAACAGATCAAACTCCCACTCAGATCACAACAACAATCATCCACCATACTATACAAAGAAGACAACTCAAAAACAAAGGACTCAGAATCTCACCCCA
TAGAAAGCACTTGGCTTGGGAAACTTAAAGAGCGATCCTAAATGTGAAGACAAATCATCTATCCTTATATGTTCATCTTCCATGTATCTCCTAGGGCCAATATCA
GCAAAGCTCCCCGACCGGAGGCTCGGAAATTCCCTTCCATTCTCCGTATCGACGTCGGAATCTGGAATTTTCTGCATGGGTTTAATATCCTGAAGAAAGAAATAT
CATAAAACTCAGACGCACACAACAAAAGAACTCAAAATCATCCTTCCAAGAGACTAAACCCCAAAATTCCCTAAATCGAACCCGATCACTACAGTAACAAGTTCA
TAACGATCACTGTTTCTTACCCTAAATCAAAGGCTGAATTTCAGAAGAACAAAAGCCCATAAGAAGAAGAAGAAGAAGAACATACCGATTGAGAACTGGAACAAA
CAGATTCGGAAGCACGAACACGATTGAGAGTCGGATCAATCGAAATCCCACCATCGATGGACTCAATTTCATCCACGAGATGAGTCTCTTTACCGAAATACGGGA
CCTCCAAAACCGGGAGGCTCTTCGAACAAACAACAACCTCAGCTTCAGCCACCATTTTTACATTTACCAAAGAATCAGATTCTTCAACAGAGAGATCAAAATCGT
TATAATCAGAAGAAGGGCAAGTCGGAATTTGAATTGGAATTGCAATTGCGATTGGGTTTGGAAACGTTTTTTCTTTCTTTGTTCAGGAAATTTAGAATGTTGATC
AGAAAAATTTCTGATCAAGTCGGCGATGAAGAAGAATATATAGTGGAGCCGCCGCGGGTGAGAGTGAATTCGTGGAAGGAGACGGAGCACGTAACGCCGTTATCG
GGACTTGTCCGCGAACACACGTTAACGTTTTCACGTCGACGCGTGGCAGGTTTTTTTTCCTTCTTTTTTAATGTTGCTGAAATTACCGAAATAGCCTTCCTTTGA
ACTGCGTTGACTTTTTTTGGGGTCTTTTTCTATTTTTTTTTATTTTTTTATTTTTTCTTTTTATTTGAAGGGGAGCAAGTTATTGGGTTGGAGTGACGTAGGATC
ATGGGTCTAGTAGCTGTAGACTTTTCTAGCGACTTAATAGAAGCTTCTCTCTCTTTTTTTTTTTTTTTTTTTCGACCCTTACAGACGTGGAAATTAAGCTATTTT
ATGATTTGTTTTTGTTTTTTAAAAAAAGTTTGTTGGTTGTTTGTTCATACCATTAAATTATTGAGAAGTGAGGGTAGGAATTTGAGATGTGGAAGGGAAGGGAAT
ATATTGATATAAATTAAGGAATTGTGTGAAAAATATTATTATTATTATTTATATTATTTGGAGAAATATAGGGTTTAAGTTGTTATAGAGTATTTCACAAGTTAG
AGAAATTGAGATGGGTTAGAGAAAAGAGGATAAGCTAAAGATAGAATGAAGTGAAGAAGGAGATTGAAAAAATAAAGTTATGTGAAATTATAAGTTAATTTTGTG
TTTAATAGGACTGTAAAGTTTATACTTTCAATTTTTTATACAATATATTTATGATGTTTTTTTTTTTCTTTTTCTAAATGTTAAATGAGTCAAAGATTTATTAAA
CACAAAATTAAAAATTTAGGATGTCATATTTAATAAATATTTGTTTTTAAAAAATATGGTTATAAAGCAGGAAAAGGAAAAAATGTGATAAAGAATCTGTAAATT
GAAATAAAAATGTATGGATATAATTAGTCTTAGAAGTTAGAAGATATGTTACAAAAAATGAGGTCTTTTTATAAGAGAAAATCAATATAGATTAAGATCACATAA
GCAATTATTTAAGGAGTGTGGTGGAATTACGTGTCAAAGTTGGCCGACGATTGGATGGCTTCAGACGCGGTTCCAATAAAATTGTGGGATTATTGCCACGTGTCA
CGAAGACATTGGTTTCTTATTGTACTGTACCTTTAGTCCAATTTTTGAAACAGTGTATCCATTATTATTGAG

Protein sequence

Show/hide protein sequence

MVCARTASENLSFQSHNIIKGLFLQFGATQISAPTLFSVPLLFSSSLIQNPTMSIAALACNSTPNSLNLTHPSIRRRNGILFMAIPTCRSINSRSLSLPELVFKI
PRGSSNRSRNPIFPRLKFVSPVMEWQDCTAKMEVDIPASVAYKCYSDREAIPKWMPFISSVKPTLNQKIHWRSLEGLPNRGVVRFYPKGPSSCLVELTVSYEVPP
LLSPVASALQPLLERLLQRGLRSFAKFAKKYQTA

CcUC09G167500 (gene) of Watermelon (PI 537277) v1 genome