CuGenDBv2

Gene ID	Clc05G06390
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	Mitochondrial intermediate peptidase
Genome location	ClcChr05:4704516..4726820
RNA-Seq Expression	Clc05G06390
Synteny	Clc05G06390
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6582303.1 hypothetical protein SDJN03_22305, partial [Cucurbita argyrosperma subsp. sororia]

1.0e-86

68.52

Show/hide

Query:  NRSSAMAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSR
        +RSS M  A   L  VL SKQN LTI+EAN+LQTC SKAVRD+TFG L+GGGVT A        V    +  A  L     F RSL+S VD ILALDGSR
Subjt:  NRSSAMAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSR

Query:  MQKELANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNA
        MQKELANI+VT+Y N+PRTMQ I KHF+YEEVFDDSTLDRPK   RYRNFFS D+ HAQRT+ ND  +N+HGN HHDSSNRDS+  Q DSYG+PDDKGNA
Subjt:  MQKELANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNA

Query:  LEFKPVLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
         EF PVL K G DAATADPL+ IFGTL +EEEIQHSSAS+PSPKSH RS+RYNRRHRR  +TMPT+FEHV
Subjt:  LEFKPVLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

XP_022956077.1 uncharacterized protein LOC111457878 [Cucurbita moschata]

1.6e-87

69.43

Show/hide

Query:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL
        M  A   L  VL SKQN LTI+EAN+LQTC SKAVRD+TFG L+GGGVT A        V    +  A  L     F RSL+S VD ILALDGSRMQKEL
Subjt:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL

Query:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP
        ANI+VT+Y N+PRTMQHI KHF+YEEVFDDSTLDRPK   RYRNFFS D+ HAQRT+ ND  +N+HGN HHDSSNRDS+  QSDSYG+PDDKGNA EF P
Subjt:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP

Query:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        VL K G DAATADPL+ IFGTL +EEEIQHSSAS+PSPKSH RS+RYNRRHRR  +TMPT+FEHV
Subjt:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

XP_022980008.1 uncharacterized protein LOC111479542 [Cucurbita maxima]

3.9e-86

69.06

Show/hide

Query:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL
        M  A   L  VL SKQN LTI+EAN+LQTC SKAVRD+TFG L+GGGVT A        V    +  A  L     F RSL+S VD ILALDGSRMQKEL
Subjt:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL

Query:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP
        ANI+VT+  N+PRTMQHI KHF+YEEVFDDSTLDRPK   RYRNFFS D+ HAQR + ND  +N+HGN HHDSSNRDS+  QSDSYGEPDDKGNA EF P
Subjt:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP

Query:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        VL K G DAATADPL+ IFGTL +EEEIQHSSAS+PSPKSH RS+RYNRRHRR  +TMPT+FEHV
Subjt:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

XP_023527180.1 uncharacterized protein LOC111790494 isoform X1 [Cucurbita pepo subsp. pepo]

2.7e-87

69.06

Show/hide

Query:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL
        M  A   L  VL SKQN LTI+EAN+LQTC SKAVRD+TFG L+GGGVT A        V    +  A  L     F RSL+S VD ILALDGSRMQKEL
Subjt:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL

Query:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP
        ANI+VT+Y N+PRTMQHI KHF+YEEVFDDSTLDRPK   RYRNFFS D+ HAQRT+ ND  +N+HGN HHDSSNRDS+  QSDSYG+PDDKGNA EF P
Subjt:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP

Query:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        VL K G DAATADPL+ IFGT+ +EEEIQHSSAS+PSPKSH RS+RYNRRHRR  +TMPT+FEHV
Subjt:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

XP_038878005.1 uncharacterized protein LOC120070209 isoform X1 [Benincasa hispida]

6.9e-91

71.54

Show/hide

Query:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL
        M  A  HL  VL SKQN LTI+EANLLQTC SKAVRD+T GGL+GGGVT A        +    +  A  L     F  SL S VD ILAL GSRMQKEL
Subjt:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL

Query:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP
        ANI+VTRY N+PR MQ I KHFYYEEVFDDSTLDRPK   R RNFFS D+ HAQRT DND  +N+HGNSHHDSSNRDSSAYQSDSYG+PDDKGNALE KP
Subjt:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP

Query:  VLIKRGTDAATADPLNCIFGTLAK--EEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        VL K GTDA T DPL+CIFGTLA+  EEEIQHSSAS+PSPKSHSRSRRYNRRHR+  +TMPTNFEHV
Subjt:  VLIKRGTDAATADPLNCIFGTLAK--EEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

TrEMBL top hits

e value

%identity

Alignment

A0A0A0L4T1 Uncharacterized protein

1.3e-82

65.82

Show/hide

Query:  VAEFSNRSSAMAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLAVCSGRN--------MEAEGLHSATYFCRSLNSSVDDILA
        V  F ++SS M      L +VL SK N LTI+EA LLQTC SKAVRD+TFGG+LGGG+T A     N        + A  L     F RSLNS VD ILA
Subjt:  VAEFSNRSSAMAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLAVCSGRN--------MEAEGLHSATYFCRSLNSSVDDILA

Query:  LDGSRMQKELANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPD
        LDGSRMQKELANI+VTRY N+P  MQ+I KHFYYEEVFDDST DRPK   RYRNFFS D+ H+QRT+ ND+  NVH NSH     RDSSAYQ DSYG+PD
Subjt:  LDGSRMQKELANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPD

Query:  DKGNALEFKPVLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        D GNA EFKPVL K GTDAATADPL+CIFGTLA++EEIQ+S+ S PSPK HSRSRRYNRRHR+D  T  TNFEHV
Subjt:  DKGNALEFKPVLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

A0A1S3AWL2 uncharacterized protein LOC103483703 isoform X1

7.0e-81

67.83

Show/hide

Query:  LHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLAVCSGRNM--------EAEGLHSATYFCRSLNSSVDDILALDGSRMQKELANIIVTR
        L +VL SK N LTI+EA LLQTC SKAVRD+TFGG+LGGG+T A     N          A  L     F RSLNS VD IL+LDGSRMQKELANI+VTR
Subjt:  LHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLAVCSGRNM--------EAEGLHSATYFCRSLNSSVDDILALDGSRMQKELANIIVTR

Query:  YPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKPVLIKRGT
        Y N+PR MQ+I KHF+YEEVFDDST DRPK   RYRNFFS D+ H+QRT+ ND+  NVH NSH     RDSSA+Q DSYG+ DDKGNA EFKPVL K GT
Subjt:  YPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKPVLIKRGT

Query:  DAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        D+ATADPL+CIFGTLA+EEEIQHS+ S PSPK HSRSRRYNRRHR+D +T PTNFE+V
Subjt:  DAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

A0A6J1C8I6 uncharacterized protein LOC111009363 isoform X1

6.6e-79

66.54

Show/hide

Query:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL
        M  A   L  VL SKQN LTI+EA LLQTC SKAVRD+TFG L GGGVT A        +    +  A  L     F RSLNS VD ILALDGSRMQKEL
Subjt:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL

Query:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP
        ANI+VT+Y N+PRTMQHI KHFYYE+VFDDSTLDRP+   RYRNFFS D+ H QRT+DND   N+HGNSHH SSN DS++ Q+ SY EPDDKGNALEFKP
Subjt:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP

Query:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKT
        VL K GTD ATADPL+C+FG LAK EEIQHS++S  + KSHSRSRRY+RRHRR  +T
Subjt:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKT

A0A6J1GVC2 uncharacterized protein LOC111457878

7.7e-88

69.43

Show/hide

Query:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL
        M  A   L  VL SKQN LTI+EAN+LQTC SKAVRD+TFG L+GGGVT A        V    +  A  L     F RSL+S VD ILALDGSRMQKEL
Subjt:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL

Query:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP
        ANI+VT+Y N+PRTMQHI KHF+YEEVFDDSTLDRPK   RYRNFFS D+ HAQRT+ ND  +N+HGN HHDSSNRDS+  QSDSYG+PDDKGNA EF P
Subjt:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP

Query:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        VL K G DAATADPL+ IFGTL +EEEIQHSSAS+PSPKSH RS+RYNRRHRR  +TMPT+FEHV
Subjt:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

A0A6J1IXZ4 uncharacterized protein LOC111479542

1.9e-86

69.06

Show/hide

Query:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL
        M  A   L  VL SKQN LTI+EAN+LQTC SKAVRD+TFG L+GGGVT A        V    +  A  L     F RSL+S VD ILALDGSRMQKEL
Subjt:  MAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLA--------VCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKEL

Query:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP
        ANI+VT+  N+PRTMQHI KHF+YEEVFDDSTLDRPK   RYRNFFS D+ HAQR + ND  +N+HGN HHDSSNRDS+  QSDSYGEPDDKGNA EF P
Subjt:  ANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFS-DIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKP

Query:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV
        VL K G DAATADPL+ IFGTL +EEEIQHSSAS+PSPKSH RS+RYNRRHRR  +TMPT+FEHV
Subjt:  VLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G05430.1 unknown protein

3.3e-06

27.68

Show/hide

Query:  AAFIHLHHVLMSK--QNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLAVCS--------GRNMEAEGLHSATYF-------CRSLNSSVDDILALDG
        AA   L  VL SK  Q  +T +E+  + +C  KA+    F   +GGG+T  V           R   A G+ ++T+         +   SS+D IL+ D 
Subjt:  AAFIHLHHVLMSK--QNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLAVCS--------GRNMEAEGLHSATYF-------CRSLNSSVDDILALDG

Query:  SRMQKELANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFSDIVHAQ---RTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDD
        +RMQKEL N++V          Q + KHFY E V+ D   D+P+   R R  F++I  +        +  N N   N  H   +  S A ++    + + 
Subjt:  SRMQKELANIIVTRYPNNPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFSDIVHAQ---RTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDD

Query:  KGNALEFKPVLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSR-SRRYNRRHRRDKKTMPTN
         GN+            + A  D L+ +FG     E I     S  + K+ +R  +R  RR R   +   TN
Subjt:  KGNALEFKPVLIKRGTDAATADPLNCIFGTLAKEEEIQHSSASNPSPKSHSR-SRRYNRRHRRDKKTMPTN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

mRNA sequence

Show/hide mRNA sequence

ATGGATCTCACCGTGGATCTGACAAGCAGCCATAAGGGATCCCCAAATAATAGCATTAGGAGCAAATGGCATTGCCTCAATCACCTCAAGAGCTTCTCTCAGAAGATTTG
CACGGCCAAAGAGAGCCTCTTGAGGGCAGTCACTCTCTGTATAGCCAGAAATCATTGCGCTCCAACATATCAAGTCCTTCTCTACCATCTGATCAAACACGTAGCGAGCT
TCTCCAATCTGTCCACCTTTTGCAAGCCCAGAAACCATGGCAGTCGAAACAACCATGTTCTTGGGGGAAATCTTTTCATAGAAATCCCAAGCCAAGTCCATGGAGCCACA
GCTCGCATACATTGTGATGAGAGCACTTTACTACTAGAATTGGCCACAATATCCATGAGCAACAACATTAGCTTCATACCCATCAATCATGATGCTCCAAGCAACGACAT
CCCTGTGAGACATTTTATCAAACACCAACCGAGCTTCCATTATCCGTCCACAGGCTGCGTACATTCTAACCAAACCCGTCTCCACAAATGGGTCCGACCCAAATCCCAAC
TTCGACGCGAGCCCATGAATCTCCATCCCCGTTCTCAAGGAAAGATTCCTCGAAGCAGCTTTCAACAGCGGAGGGAAGCAGTACCTATCCAAACTCAGACCCTCCGCCCT
CATCTTCTCGTATACAAAAAGCAGACGGGTCTTGGGCTGGGGAATTTGATCAAACACAGAGAGGGCATAGTCGAGGCTAGGCGAGAGAGCACAAGAGGAAAGAATAAGTT
CAAAAAGAAGGGAATTGGAATCACAGCGTTCGAGTTTGGAGCGAAGGATTTGAGCGTGGACTTGTTTGAGGTGGAAGAGGCTGGAGGCGGAGGAGAGAGCGGCGGAGAGA
GCGGTGGGTCTGGTGGGGAAATCGGAATGCAGAGCAATGGTGGTGGTGAGGTGGATGGGGAAAATGGAGGGAAATATCAGGACGAAGACGTTGAATTCTTATACGTCGCG
GAGTTTAGTAATCGGAGCTCCGCCATGGCCGCAGCTTTCATTCATCTTCATCATGTTCTCATGTCCAAACAGAACGATTTGACGATCGATGAAGCAAATTTGCTCCAAAC
GTGTGTGTCTAAGGCTGTTCGAGATTATACCTTTGGAGGACTCCTTGGAGGTGGCGTCACATTGGCAGTTTGCTCTGGCAGGAACATGGAGGCTGAAGGTCTCCACTCGG
CTACATATTTTTGCAGGTCCCTAAATTCAAGTGTCGATGATATTCTTGCACTGGATGGAAGTAGGATGCAAAAGGAATTGGCAAATATTATAGTGACGAGGTATCCCAAT
AATCCTCGTACCATGCAGCACATATTCAAGCATTTTTATTATGAGGAAGTATTTGACGATTCAACCTTGGACCGGCCAAAAAGAATGTTGCGTTATCGAAATTTCTTTAG
TGATATTGTTCATGCTCAGAGGACGAATGACAATGACCATAACGAAAACGTGCATGGAAACTCCCACCATGACTCATCCAACCGTGATTCCAGTGCCTACCAGAGTGATT
CCTATGGTGAGCCTGATGACAAAGGAAATGCCCTTGAGTTCAAGCCAGTCCTTATTAAGCGTGGCACCGATGCTGCGACCGCGGACCCTCTAAATTGTATTTTTGGTACT
TTGGCCAAAGAAGAAGAAATTCAACACTCCAGTGCCTCTAATCCATCTCCCAAATCTCACTCTCGCAGCAGAAGATACAATCGTCGGCATCGAAGAGATAAGAAGACAAT
GCCAACAAACTTTGAACATGTGTAACTTCAGGTTCTCTATCAATGCTAAGAAGATTTTATTTTCTCATTTGAAGAAATAAAAAGAGACATTTTTGCTATCCAAAGATGCC
ATAGCCATCCATAGTGCAGAGACAGTGCTCATGAGGCAGTTGTGTGGTGGTTGTTGAAATGGAAGAGCCATATTTCAGAGAACACAATAGTGGTTGAAGGTAGGACATTC
CAGTCTTTTCTCCATTTGCTTAATTCTCTAACATCCTCAGGAAGATTCGTGGGGAAAAATCTTTCATCATCCAGACCGTGTGGCGTGTTGAAGGCCTTACACAAGAAAGA
CGACTGGGATTACGCGTCAAGAATGAACGAGCTCGAAATCAACACCACCGCCGCCATGAAGGTCCACCCATTGCCGAGGAAGCGCAATATCGCCGTCAGGAATAACCCCA
CTTCGAGAAACTCTCTTGAAGATCAATCCCTTCTGAACAACCACAAGAAACTCAGGAGATTACCTCATATCTTCAGTCGGGTCCTTGAGCTTCCGTTTCGATCTGATGCG
GATGTTTTGGTGGAGGAAAATCCCGATTGTTTCCGATTCATTGCTGAAACTGACGGTAACATTAGCGATGGAGTAAGAGCTCATGCTGTGGAAATCCATCCTGGGGTTAT
TAAGATCGTTGTCCGTGAGAATGAATCGTTGGAAATGTCAATGGATGAGCTCGAATTGGACATGTGGAGGTTTCGGCTACCGGAGACGACGCGACCGGAGCTTGCGAGTG
CGGCGTTTGTTGATGGAGAGCTTATAGTTACTGTTCCAAAGGGGAATGAGGAAGAGAATTCTGAAGATGGTGGAGGAGATATCTGGGGAGATGGGAACGAGAGCTTCAGA
GATGAAATGGAAGGTCGGCTTGTTCTTTTTTAGGGACTCAATCCAATGATCAAAAGGGGTGGACATAGTCCATTCTGAGCTTATAATGGAGTCTGAAGTGTCATGAGAAC
CTTCTGTAGAATCAGCATTATCAGGCAAGAGTACGGAAGATTGATGGTGAAAATGGCTGTTGAACATACTAAATAGTTGGCAGGTTATATACATTAACCACTTTAGAGAC
ATTGTTTCTAAGAAGAGTTTGTTCGAGTATGTAGACTAATCAGACCCTCAAGTGATGAAATGAAATCTTTCTCCATAGTTATCAAGGGAGGGATTTGACAAAAAAATATT
GCCAGTGCAATTAACTGAGCCCCTAATAAATGGTATTACAATTTCTCGTGCTCATACCACTGCGAACTTATCCATACTATTTGATTTGAAGAAAAATTACCAGTGCAATT
CGCTGAGCTGTCTTCCTCCATCTTCCAAATCTCTTCCAAGCAAGTCCCAGATTTAAGCTGAAGCAAGCATTCAAAGTCAAATAGCATGGTAAAGTTCACAGAGCACATAG
GATATTGTAAAATTATTTAGTACTTGTAGAAAATACCAGTATTACCTTTTCAATGTTCAATTCAATATTTCTAAACAGCTCCTTTGCTCTCATTTTGTGTGAACCACGCA
AAATGCAGAAACCAAGGCTTAAGATCTCCTCAATATCATCTCGACAGTCAGCTGATTGACATGACTGCAAAAATCTTTCTACATGTGATACCAAATCCGTTCTGGCATCA
CAACGTCGACAATAATACTCAGCATCCAATCCAATGCTTCCTCCAACTGTCCCAGCTGTATATGATTTAAGACCACATTTTATATGAGCATGATGTCCACAAATATAACC
ATCACCCACCACTGCTTTACATTTTATGTAGCTATAACTTTCTGTGGTCGTGTCTATAATCTTGCTGCATAGTATACAGCAGCAATCACGGCAAAACCGAGGTTCGCTGC
AGCAAATATCACAGGACATGGATTTTAATGAAGATGGATTCTCTGCAACAGATAAACTATTACAGTTCTTATTTCCAGCCTTGCAACCCACTCTATCAATCTGGGACTCA
GATGCAGAGCATTCTTCCATCTCTTTTGAAGGTAGAGGGCATGAAATTTGTTTTACTTGAATACCTTGCGCTAAAGATGACTTTTTTGCTGGTATCTTCCAACTGAATGA
GGCAAAAAATGCATCAATGTCTGCATTGGGAAACTCAGACTGGATATATCTTTCAACTGAAAGCTTGCTTGCAAAACCATGCCCTTTACGAGCTGAGTTCTCAGAAGTGC
CAATACCACGAGGAGAATAAAGGTACCTATCCAGAAAATGGCCAGTTATAGCAACTCTCTTCCCCACCCTCCAACTCCAGTTATCACCAGGATTGGGCCAATTTTCAGGA
GCATATGGCAAGCCCTCCCCAGATTCATCTTGAGAAACTGGCCTAAGGATCAGTTCATTTTTCTTCGCCCTAGGTGTACAGCCATTTGTATCCTCAAGAACTTTAGTCTC
CACAGGATCCCCCGACATCTCGCTCGAAGAATTTAATAAGACATCCAGAGAACTTTAGGGTTTTCTCTGTCCAGTAGTCGTCTCTTAATGTTGTAGAGAAACTAGAGAGA
ATGAGAAAGTAGAGAGATTAAGCAGATGAATTTTTTCGCGGGAATGAGAAGATGCTGCACAAGAACGAATGCCGAAGCATAGGAAATCGAGAAAAAGGTTCTTTCCGCCG
CACAACGGGAAGAAAAAGGAGGCTCGACGCCTTTGATGGACCGACGAAGTACTGGACCTGAAGGCCCAATACGATAGGTCCAACTGATCAATGGATTTTTGTTTTTGTTT
TTTGTTTTTTAAATATTTACACACAAAAAAAAGTGAAC

Protein sequence

Show/hide protein sequence

MDLTVDLTSSHKGSPNNSIRSKWHCLNHLKSFSQKICTAKESLLRAVTLCIARNHCAPTYQVLLYHLIKHVASFSNLSTFCKPRNHGSRNNHVLGGNLFIEIPSQVHGAT
ARIHCDESTLLLELATISMSNNISFIPINHDAPSNDIPVRHFIKHQPSFHYPSTGCVHSNQTRLHKWVRPKSQLRREPMNLHPRSQGKIPRSSFQQRREAVPIQTQTLRP
HLLVYKKQTGLGLGNLIKHREGIVEARRESTRGKNKFKKKGIGITAFEFGAKDLSVDLFEVEEAGGGGESGGESGGSGGEIGMQSNGGGEVDGENGGKYQDEDVEFLYVA
EFSNRSSAMAAAFIHLHHVLMSKQNDLTIDEANLLQTCVSKAVRDYTFGGLLGGGVTLAVCSGRNMEAEGLHSATYFCRSLNSSVDDILALDGSRMQKELANIIVTRYPN
NPRTMQHIFKHFYYEEVFDDSTLDRPKRMLRYRNFFSDIVHAQRTNDNDHNENVHGNSHHDSSNRDSSAYQSDSYGEPDDKGNALEFKPVLIKRGTDAATADPLNCIFGT
LAKEEEIQHSSASNPSPKSHSRSRRYNRRHRRDKKTMPTNFEHV

Clc05G06390 (gene) of Watermelon (cordophanus) v2 genome