CuGenDBv2

Gene ID	Clc04G03375
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	Ulp1-like peptidase
Genome location	ClcChr04:10597558..10599234
RNA-Seq Expression	Clc04G03375
Synteny	Clc04G03375
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0008234 - cysteine-type peptidase activity (molecular function)
InterPro domains	IPR003653 - Ulp1 protease family, C-terminal catalytic domain IPR038765 - Papain-like cysteine peptidase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_038874902.1 uncharacterized protein LOC120067405 [Benincasa hispida]

2.9e-11

39.18

Show/hide

Query:  KVAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDL
        + A  WE ED Y D+V G   +    W++VDFVY++ N   HW+++A+D+  GHI ++DSL SY     LV +   L  T+ SL  +C+++  K DL
Subjt:  KVAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDL

XP_038875042.1 uncharacterized protein LOC120067568 [Benincasa hispida]

2.9e-11

44.05

Show/hide

Query:  DFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDL
        D+V+G   +    WS+VDFVY++ N  QHW+L+A ++N   + ++DSL S  S + L  F  PL YTLPSL  +C+L   KPD+
Subjt:  DFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDL

XP_038881126.1 uncharacterized protein LOC120072727 [Benincasa hispida]

2.2e-11

44.83

Show/hide

Query:  AKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCN
        A VWE E+ Y+D+V+G   +    WS+VDFVY++ N  QHW+L+A D+N G + ++DSL S  S ++L     PL YTL SL  +C+
Subjt:  AKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCN

XP_038899753.1 uncharacterized protein LOC120086987 [Benincasa hispida]

3.3e-15

41.84

Show/hide

Query:  KVAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDLS
        + A  WE ED Y ++V+G   +    W++VDF+Y++ N  +HWI++A+D+N GHI ++DSL SY     LV +  PL  T+PSL  +C+++  K DLS
Subjt:  KVAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDLS

XP_038902498.1 uncharacterized protein LOC120089158 [Benincasa hispida]

2.6e-12

27.3

Show/hide

Query:  ISLPPLPIGPPPHRAYPSSIHNPTTLLPSQPAKKVILKVKGEHTVKGEPTVKPVKIEPKNKKGEERKWTSRKRKSSQPYTPPIEATKGATKLQRYIQLGE
        ++ PP P  PPP    P    +PT  LP      +       H          V +E + K        +RKRK+   YTPPIE  K  TK ++ +++ +
Subjt:  ISLPPLPIGPPPHRAYPSSIHNPTTLLPSQPAKKVILKVKGEHTVKGEPTVKPVKIEPKNKKGEERKWTSRKRKSSQPYTPPIEATKGATKLQRYIQLGE

Query:  RPTDRPLV----------------------------MTEFMIWLTSENMGPHKPGTGILFRRNHMTKELSIPYS---CSFDGSSFPDRKYVHTSTP-RCP
         P DRP +                            + E + W+  EN         I        +EL+ P S   C      F   K      P  C 
Subjt:  RPTDRPLV----------------------------MTEFMIWLTSENMGPHKPGTGILFRRNHMTKELSIPYS---CSFDGSSFPDRKYVHTSTP-RCP

Query:  MTYWYSP---KSTWGTQLVPCHTLQNKEKV-AKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLV
          +   P    S   ++      ++NK  + A V   ++   D+V+G   +    W +VDF+Y++ N  QHW+LVA D+N G + ++DSL S  S + L 
Subjt:  MTYWYSP---KSTWGTQLVPCHTLQNKEKV-AKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLV

Query:  QFFSPLRYTLPSLCEFCNLNNLKPDL
         F   L YTLPSL  +C+L   KPD+
Subjt:  QFFSPLRYTLPSLCEFCNLNNLKPDL

TrEMBL top hits

e value

%identity

Alignment

A0A5A7T796 Ulp1-like peptidase

2.3e-06

31.87

Show/hide

Query:  QNKEKVAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFN-YKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCE
        Q KE     W++E   +D+V+G + + +  W+ VD++YS FN +  HW+L+ +D+    + ++DSLLS  S+ ++     P+R  +P+L +
Subjt:  QNKEKVAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFN-YKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCE

A0A6J1CPP7 uncharacterized protein LOC111013439

2.7e-07

37.35

Show/hide

Query:  VAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSL
        +   W++    M+ VLG  ++  P W  VDFVY   + + HW+LVAI++N   IL+YDSL S+      ++   PL + +PSL
Subjt:  VAKVWEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSL

A0A6J1D492 uncharacterized protein LOC111016890

3.3e-05

30.93

Show/hide

Query:  WEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNY-KQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDLSPAP
        W +E+    +V G +S+H   WS+ D VY+  N    HW+++ ID+  G I ++DSL +     +L +   P+   LP+L     + +++PDL   P
Subjt:  WEKEDCYMDFVLGLESEHQPGWSEVDFVYSSFNY-KQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDLSPAP

A0A6J1DN69 uncharacterized protein LOC111022140

3.2e-08

43.59

Show/hide

Query:  MDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNL
        MD VLG   +  P W +VD VYS    + HW+LVAID+    I +YDSL  ++S+  L+    PL +T+PSL   C L
Subjt:  MDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNL

A0A6J1DRI2 uncharacterized protein LOC111022515

2.7e-07

41.03

Show/hide

Query:  MDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNL
        MD VLG   +  P W +VD VYS    + HW+LV ID+    I +YD L  ++S+  L+    PL +T+PSL   C L
Subjt:  MDFVLGLESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNL

SwissProt top hits

e value

%identity

Alignment

O46598 Hepatitis A virus cellular receptor 1

6.1e-04

32.54

Show/hide

Query:  ITIPRPTESTTPLPTEVTTLLPTKPTI--ALPFESTTPLLFETTTPLPTEAVFTESITPPTHEAIFPTETTLPTKPCLPTKTSLP--IIPTISLP-----
        +T   PT +T P+ T + T LPT  T+   LP  +T P    TTT LPT      + T PT   + PT TTLPT   LPT T+LP   +PT++LP     
Subjt:  ITIPRPTESTTPLPTEVTTLLPTKPTI--ALPFESTTPLLFETTTPLPTEAVFTESITPPTHEAIFPTETTLPTKPCLPTKTSLP--IIPTISLP-----

Query:  ------PLPIGPPPHRAYPSSIHNPTTLLPSQPAKKVILKVKGEHTVKGEP-TVKPVKIEPKNKKGEER
              P+    P     P++   PTT + S       L ++    V   P + +P +  P    G  R
Subjt:  ------PLPIGPPPHRAYPSSIHNPTTLLPSQPAKKVILKVKGEHTVKGEP-TVKPVKIEPKNKKGEER

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCAGTCAGACCTGCGACATATAAGGTTTGACATGACTGAGATGATGGCTGGCATACAGACTATGATCAGCTTACTCAGGTCTTTCTGTCAGATCACCATCCCACGCCC
TACCGAGTCCACCACCCCACTCCCCACCGAGGTCACCACCCTACTCCCCACTAAGCCCACCATTGCACTCCCGTTCGAGTCCACTACCCCACTCCTGTTCGAGACCACCA
CCCCACTCCCCACTGAGGCAGTTTTTACCGAGTCCATAACCCCTCCGACCCACGAGGCCATCTTTCCCACTGAGACCACCCTTCCCACCAAGCCATGTCTCCCCACTAAG
ACATCCCTTCCCATCATTCCCACCATTTCACTTCCTCCACTACCCATCGGCCCACCCCCTCATCGAGCATATCCCTCTAGCATTCATAATCCCACCACTTTGCTCCCCTC
ACAACCGGCTAAGAAGGTCATACTAAAGGTAAAAGGGGAGCACACGGTGAAAGGAGAGCCTACGGTGAAGCCGGTTAAGATTGAGCCAAAGAACAAGAAGGGGGAGGAAC
GAAAGTGGACTAGTAGGAAGAGAAAGTCGTCCCAACCGTACACCCCTCCAATCGAGGCAACAAAGGGGGCGACTAAGCTGCAACGATACATTCAACTAGGGGAACGCCCC
ACTGATAGGCCGCTTGTCATGACGGAGTTCATGATATGGCTGACGAGCGAGAATATGGGTCCTCATAAGCCGGGCACAGGCATACTCTTTCGAAGAAACCACATGACGAA
GGAACTCTCGATTCCATATTCATGTTCCTTCGACGGAAGTTCATTTCCAGATAGGAAATATGTGCACACTAGTACACCACGTTGCCCCATGACATATTGGTATTCACCTA
AATCTACATGGGGAACACAGCTTGTTCCATGCCATACATTGCAAAACAAGGAAAAAGTTGCAAAAGTATGGGAAAAAGAGGATTGCTATATGGATTTCGTGCTGGGGTTG
GAATCGGAACACCAGCCGGGATGGTCAGAGGTTGATTTCGTCTATAGCTCCTTCAACTACAAGCAACATTGGATACTGGTGGCGATAGACGTCAACCTCGGCCACATCCT
CCTATACGACTCCCTTCTATCATACGTCTCGTCGAGGGACCTAGTACAGTTTTTTTCGCCACTGCGCTACACTCTTCCTTCCCTATGTGAATTCTGCAATCTGAATAATT
TGAAGCCTGATCTTTCGCCCGCTCCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MQSDLRHIRFDMTEMMAGIQTMISLLRSFCQITIPRPTESTTPLPTEVTTLLPTKPTIALPFESTTPLLFETTTPLPTEAVFTESITPPTHEAIFPTETTLPTKPCLPTK
TSLPIIPTISLPPLPIGPPPHRAYPSSIHNPTTLLPSQPAKKVILKVKGEHTVKGEPTVKPVKIEPKNKKGEERKWTSRKRKSSQPYTPPIEATKGATKLQRYIQLGERP
TDRPLVMTEFMIWLTSENMGPHKPGTGILFRRNHMTKELSIPYSCSFDGSSFPDRKYVHTSTPRCPMTYWYSPKSTWGTQLVPCHTLQNKEKVAKVWEKEDCYMDFVLGL
ESEHQPGWSEVDFVYSSFNYKQHWILVAIDVNLGHILLYDSLLSYVSSRDLVQFFSPLRYTLPSLCEFCNLNNLKPDLSPAP

Clc04G03375 (gene) of Watermelon (cordophanus) v2 genome