CuGenDBv2

Gene ID	MC04g0024
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	ATP-dependent zinc metalloprotease
Genome location	MC04:179394..184564
RNA-Seq Expression	MC04g0024
Synteny	MC04g0024
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0016020 - membrane (cellular component) GO:0004176 - ATP-dependent peptidase activity (molecular function) GO:0004222 - metalloendopeptidase activity (molecular function) GO:0005524 - ATP binding (molecular function)
InterPro domains	IPR037219 - Peptidase M41-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004139896.1 uncharacterized protein LOC101213430 [Cucumis sativus]

4.08e-259

90.32

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERL--QRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS
        MAI SPPKL ISSS    Q F + I FHF QK P GI ++FHLER   QRLL L RALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEP+ DSA A S
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERL--QRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS

Query:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT
        APSA+RN RLSGWERDWEVLDTCLNADDMKLVANAY FL+DRGFLPNFGKCRNIVLEGRRDVTPSVLE +TGL+V+KLSPKKWGLSGSS YALIAFLGGT
Subjt:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT

Query:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
        SFLLS+DIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
Subjt:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG

Query:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL
        RLDGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSIC+LLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKA+ESGSSLSVVIRKIEDAL
Subjt:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL

Query:  STN
        STN
Subjt:  STN

XP_008447096.1 PREDICTED: uncharacterized protein LOC103489633 isoform X1 [Cucumis melo]

8.61e-261

90.57

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLER--LQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS
        MAI SPPKL ISSS L  Q F + I FHF QK P GI +HFHL+R   QRLL L RALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEP+NDSA A S
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLER--LQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS

Query:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT
        APSA+ N RLSGWERDWEVLDTCLNADDMKLVANAY FL+DRGFLPNFGKCRNIVLEG+RDVTPSVLES+TGL+V+KLSPKKWGLSGSS YALIAFLGGT
Subjt:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT

Query:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
        SFLLS+DIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
Subjt:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG

Query:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL
        RLDGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKA+ESGSSLSVVIR+IEDAL
Subjt:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL

Query:  STN
        STN
Subjt:  STN

XP_022147989.1 uncharacterized protein LOC111016783 [Momordica charantia]

4.07e-293

100

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP
        MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP

Query:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF
        SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF
Subjt:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF

Query:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
        LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
Subjt:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL

Query:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST
        DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST
Subjt:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST

Query:  NG
        NG
Subjt:  NG

XP_022969425.1 uncharacterized protein LOC111468437 isoform X1 [Cucurbita maxima]

4.06e-256

89.53

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP
        M+I SPPKL IS S L FQ F   + FHF QK   GI  HFHL+R QRLL LPRA+REWQ+YEEAVKRKDLAEALRFLESF R+SAIEP NDSA ADSAP
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP

Query:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF
        SAL NPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEG RDVTPSVLES+TGL+V+KLSPKKWGLSGSS YALIA LGGTSF
Subjt:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF

Query:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
        LLS+DIDIRPNL ALLGLAFLDSILLGGTCLAQISS WPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
Subjt:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL

Query:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST
        DGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSIC+LLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIR++E+ALST
Subjt:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST

Query:  N
        N
Subjt:  N

XP_038888049.1 uncharacterized protein LOC120077976 isoform X1 [Benincasa hispida]

8.29e-261

90.52

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP
        MA+ SPPKL ISSS L FQ   + I F+F QK P GI +HF+LER QRLL L RAL EWQDYEEAVKRKDLAEALRFLESFDRDSAIEP+NDSA A SAP
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP

Query:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF
        SAL NPRLSGWERDWEVLDTCLNADDMKLVA+AYGFLRDRGFLPNFGK RNIVLEGRRDVTPSVLES+TGL+V+KLSPKKWG+SGSS YALIAFLGGTSF
Subjt:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF

Query:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
        LLS+DIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMAS+LAEGRL
Subjt:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL

Query:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST
        DGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQ AVKALESGSSLSVVIR+IEDALST
Subjt:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST

Query:  N
        N
Subjt:  N

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K7I5 Uncharacterized protein

1.98e-259

90.32

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERL--QRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS
        MAI SPPKL ISSS    Q F + I FHF QK P GI ++FHLER   QRLL L RALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEP+ DSA A S
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERL--QRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS

Query:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT
        APSA+RN RLSGWERDWEVLDTCLNADDMKLVANAY FL+DRGFLPNFGKCRNIVLEGRRDVTPSVLE +TGL+V+KLSPKKWGLSGSS YALIAFLGGT
Subjt:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT

Query:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
        SFLLS+DIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
Subjt:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG

Query:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL
        RLDGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSIC+LLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKA+ESGSSLSVVIRKIEDAL
Subjt:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL

Query:  STN
        STN
Subjt:  STN

A0A1S3BH83 uncharacterized protein LOC103489633 isoform X1

4.17e-261

90.57

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLER--LQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS
        MAI SPPKL ISSS L  Q F + I FHF QK P GI +HFHL+R   QRLL L RALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEP+NDSA A S
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLER--LQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS

Query:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT
        APSA+ N RLSGWERDWEVLDTCLNADDMKLVANAY FL+DRGFLPNFGKCRNIVLEG+RDVTPSVLES+TGL+V+KLSPKKWGLSGSS YALIAFLGGT
Subjt:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT

Query:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
        SFLLS+DIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
Subjt:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG

Query:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL
        RLDGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKA+ESGSSLSVVIR+IEDAL
Subjt:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL

Query:  STN
        STN
Subjt:  STN

A0A5A7U732 Uncharacterized protein

4.17e-261

90.57

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLER--LQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS
        MAI SPPKL ISSS L  Q F + I FHF QK P GI +HFHL+R   QRLL L RALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEP+NDSA A S
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLER--LQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADS

Query:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT
        APSA+ N RLSGWERDWEVLDTCLNADDMKLVANAY FL+DRGFLPNFGKCRNIVLEG+RDVTPSVLES+TGL+V+KLSPKKWGLSGSS YALIAFLGGT
Subjt:  APSALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGT

Query:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
        SFLLS+DIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG
Subjt:  SFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEG

Query:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL
        RLDGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKA+ESGSSLSVVIR+IEDAL
Subjt:  RLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL

Query:  STN
        STN
Subjt:  STN

A0A6J1D1P2 uncharacterized protein LOC111016783

1.97e-293

100

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP
        MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP

Query:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF
        SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF
Subjt:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF

Query:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
        LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
Subjt:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL

Query:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST
        DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST
Subjt:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST

Query:  NG
        NG
Subjt:  NG

A0A6J1HZW5 uncharacterized protein LOC111468437 isoform X1

1.97e-256

89.53

Show/hide

Query:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP
        M+I SPPKL IS S L FQ F   + FHF QK   GI  HFHL+R QRLL LPRA+REWQ+YEEAVKRKDLAEALRFLESF R+SAIEP NDSA ADSAP
Subjt:  MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAP

Query:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF
        SAL NPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEG RDVTPSVLES+TGL+V+KLSPKKWGLSGSS YALIA LGGTSF
Subjt:  SALRNPRLSGWERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSF

Query:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
        LLS+DIDIRPNL ALLGLAFLDSILLGGTCLAQISS WPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL
Subjt:  LLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRL

Query:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST
        DGTSFDRYCM+LFAGIAAEALVYGEAEGGENDENLFRSIC+LLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIR++E+ALST
Subjt:  DGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALST

Query:  N
        N
Subjt:  N

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G56180.1 unknown protein

2.1e-145

65.59

Show/hide

Query:  SPPKLQISSSSLYFQPFRHQISFHF--LQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAPSA
        SPP L+  S S     F  QI F    +Q    G  R   L R       P ALREW++YE+AVKRKDLA ALRFL+S + D   + V     A      
Subjt:  SPPKLQISSSSLYFQPFRHQISFHF--LQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAPSA

Query:  LRNPRLSG-----WERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGG
            +LSG      ERDW+VLD CLNADDM+LV +A+ FL++RG L NFGK  +IVLEG R+VTP+VL+S+TGL+VTKLSPKKWGLSG SS AL A LGG
Subjt:  LRNPRLSG-----WERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGG

Query:  TSFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAE
         S+LLS++ID+RPNL  +LGLA+LDS+ LGGTCLAQ+S YWPP++RRI+VHEAGHLL AYLMGCPIRGVILDP+VAMQMG+QGQAGTQFWD+KM S +AE
Subjt:  TSFLLSRDIDIRPNLLALLGLAFLDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAE

Query:  GRLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDA
        GRL G+SFDRY M+LFAGIAAEALVYGEAEGGENDENLFRSI +LL+PPLSVAQMSNQARW+VLQSYNLLKWHK AH+ AV+AL+ GS LS+VIR+IE+A
Subjt:  GRLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDA

Query:  LSTN
        +S++
Subjt:  LSTN

AT2G21960.1 unknown protein

1.1e-21

35.33

Show/hide

Query:  LAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRLDGTSFDRYCMILFAGIAAEALVYGEAEGGE
        ++  S+++P Y+ RI  HEA H L AYL+G PI G  LD          G+      DE++A  +  G+LD    DR   +  AG+AAE L Y +  G  
Subjt:  LAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRLDGTSFDRYCMILFAGIAAEALVYGEAEGGE

Query:  NDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDA
         D    +      QP +S  Q  N  RWAVL S +LLK +K  H+  + A+   +S+   I+ IE A
Subjt:  NDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDA

AT5G27290.1 unknown protein

1.0e-19

34.38

Show/hide

Query:  YRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQM--GIQGQAGTQFWDEKMASNLAEGRLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRS
        Y  R++ HEAGH L AYL+G   RG  L  + A+Q    +  QAG+ F D +    +  G++  T  +R+  I  AG+A E L+YG AEGG +D +    
Subjt:  YRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQM--GIQGQAGTQFWDEKMASNLAEGRLDGTSFDRYCMILFAGIAAEALVYGEAEGGENDENLFRS

Query:  ICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL
        +   L    +  +  +Q RW+VL +  LL+ H+ A     +A+  G S+   I+ IED++
Subjt:  ICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDAL

AT5G27290.2 unknown protein

3.7e-09

36.9

Show/hide

Query:  YRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQM--GIQGQAGTQFWDEKMASNLAEGRLDGTSFDRYCMILFAGIAAEALV
        Y  R++ HEAGH L AYL+G   RG  L  + A+Q    +  QAG+ F D +    +  G++  T  +R+  I  AG+A E L+
Subjt:  YRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQM--GIQGQAGTQFWDEKMASNLAEGRLDGTSFDRYCMILFAGIAAEALV

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTATCCCGAGTCCTCCCAAACTCCAGATTTCCTCTTCTTCTCTCTATTTCCAACCTTTTCGGCACCAAATTTCCTTCCATTTCCTGCAAAAAACCCCTCGTGGAAT
CACTAGACATTTCCATTTAGAACGCCTTCAGCGTCTCCTCCATCTGCCCAGAGCTCTTCGTGAATGGCAAGACTACGAAGAGGCAGTGAAGCGCAAGGACCTCGCAGAAG
CTCTTAGGTTTCTCGAGTCCTTTGACAGAGATAGCGCAATCGAACCCGTTAATGATTCAGCCGCTGCTGATTCAGCTCCGTCCGCTCTTCGAAATCCACGGTTGTCTGGC
TGGGAGCGGGACTGGGAGGTACTCGACACTTGTTTGAATGCGGATGATATGAAGCTTGTTGCCAATGCTTATGGGTTTCTCAGGGATAGAGGATTTTTGCCCAATTTTGG
AAAATGCAGGAACATTGTTTTGGAGGGTCGAAGAGACGTCACACCATCTGTGTTGGAATCTTCGACTGGATTACAAGTGACCAAGTTGTCTCCAAAGAAGTGGGGTCTTT
CAGGCAGCTCTAGTTACGCTTTGATTGCCTTTCTTGGTGGAACATCATTTCTGCTCTCACGGGACATTGATATTAGGCCGAACCTTTTGGCACTGCTGGGGCTTGCATTT
TTGGACTCTATCCTCCTTGGTGGTACGTGTCTAGCGCAAATCTCTAGCTATTGGCCACCATATAGGCGTCGAATCCTTGTACATGAAGCTGGACATCTACTGACTGCTTA
TCTCATGGGTTGCCCAATTCGTGGAGTTATTTTGGATCCAATTGTTGCCATGCAAATGGGGATACAGGGACAGGCAGGTACCCAGTTTTGGGATGAAAAAATGGCAAGCA
ACCTTGCTGAAGGACGTTTGGATGGTACTTCTTTTGACAGGTACTGCATGATCCTTTTTGCGGGCATTGCAGCTGAAGCTCTTGTTTACGGTGAAGCAGAGGGTGGAGAG
AATGATGAAAATTTGTTTAGAAGTATCTGCATTCTTTTGCAACCGCCACTATCTGTTGCGCAGATGTCAAATCAAGCAAGGTGGGCTGTTCTACAATCTTACAATCTGCT
GAAGTGGCACAAACATGCACACCAAGTTGCCGTTAAAGCTTTGGAAAGTGGAAGCAGTCTCAGTGTTGTAATTAGGAAAATCGAGGATGCTTTGTCAACCAATGGATGA

mRNA sequence

Show/hide mRNA sequence

GGTCTGTTCGGATTGCATAAACAAACATTGTTGAATTTTATCTACCAAACCGGGCCGTATTTGCTTCGTTATGGAAGAGCAAAATGCGAAGGGTGAATAATAAGAAATCA
GTCAATCACAAATTAATCTAAATCCACCAGATCCAGATGAAGAACGAATCTAAACCCAAGTGGTAAACGTACCAGAATTAGAGCCCTGTATCTATCTCTATCTATGCTTC
ACCACCACCAGGATTATCCACAGAATGAGCCGAGCAGAGGAACAATATATAGGTTTGAACCACTGCACATCGCCCACAGTCACACAACAACTCCAGATGGTTGAAAGTTG
AGAAACAGTTGATGAGAAGTAAAAAGCCAATATCCATCACTAAAACTAAATCAATCCTTATCCAGATTGGTTTACAAGCGAAGTAATATGATGGAACATTTAGACATGCT
CGCTCAGGAGCCACGAGTTGACAGGAAGAGCCAGCAGCTGCAGCGTTGTTGGTTGATTTGATTTGAATGTCTGCCTTCTATTTCTACCACCGCAACCGGTCGGTTATGGC
CTTATGGACCAAAACGACACATCGTTCCATGGTCCACGGCCCCTTAACTTAACCCAGTCCTTCGTGTAAAAGTAAAACTCCTCTATTTTGACGAGTTCCCCAGATTCTCA
AAAACTCCACTTTTGCACCTACTCCGTCTCATGGCTATCCCGAGTCCTCCCAAACTCCAGATTTCCTCTTCTTCTCTCTATTTCCAACCTTTTCGGCACCAAATTTCCTT
CCATTTCCTGCAAAAAACCCCTCGTGGAATCACTAGACATTTCCATTTAGAACGCCTTCAGCGTCTCCTCCATCTGCCCAGAGCTCTTCGTGAATGGCAAGACTACGAAG
AGGCAGTGAAGCGCAAGGACCTCGCAGAAGCTCTTAGGTTTCTCGAGTCCTTTGACAGAGATAGCGCAATCGAACCCGTTAATGATTCAGCCGCTGCTGATTCAGCTCCG
TCCGCTCTTCGAAATCCACGGTTGTCTGGCTGGGAGCGGGACTGGGAGGTACTCGACACTTGTTTGAATGCGGATGATATGAAGCTTGTTGCCAATGCTTATGGGTTTCT
CAGGGATAGAGGATTTTTGCCCAATTTTGGAAAATGCAGGAACATTGTTTTGGAGGGTCGAAGAGACGTCACACCATCTGTGTTGGAATCTTCGACTGGATTACAAGTGA
CCAAGTTGTCTCCAAAGAAGTGGGGTCTTTCAGGCAGCTCTAGTTACGCTTTGATTGCCTTTCTTGGTGGAACATCATTTCTGCTCTCACGGGACATTGATATTAGGCCG
AACCTTTTGGCACTGCTGGGGCTTGCATTTTTGGACTCTATCCTCCTTGGTGGTACGTGTCTAGCGCAAATCTCTAGCTATTGGCCACCATATAGGCGTCGAATCCTTGT
ACATGAAGCTGGACATCTACTGACTGCTTATCTCATGGGTTGCCCAATTCGTGGAGTTATTTTGGATCCAATTGTTGCCATGCAAATGGGGATACAGGGACAGGCAGGTA
CCCAGTTTTGGGATGAAAAAATGGCAAGCAACCTTGCTGAAGGACGTTTGGATGGTACTTCTTTTGACAGGTACTGCATGATCCTTTTTGCGGGCATTGCAGCTGAAGCT
CTTGTTTACGGTGAAGCAGAGGGTGGAGAGAATGATGAAAATTTGTTTAGAAGTATCTGCATTCTTTTGCAACCGCCACTATCTGTTGCGCAGATGTCAAATCAAGCAAG
GTGGGCTGTTCTACAATCTTACAATCTGCTGAAGTGGCACAAACATGCACACCAAGTTGCCGTTAAAGCTTTGGAAAGTGGAAGCAGTCTCAGTGTTGTAATTAGGAAAA
TCGAGGATGCTTTGTCAACCAATGGATGAAAAGTGGAAACAACAACATATGCGTTTCATTTCTCTTCACGTCCCTGTGGAAGGTAATTACTCGGATGCAGGGGTAGCAGT
CTTACTGATTAATAAGCGGGGTAATAATATATCAGTTCGAGAGTCACAGTCTCTTCCTTCAATCATGTCGGCTACCTGCTTATTGGCCAGTTCTTTCGAGGATATGTGTG
TTCAATGCCCACGTTTTGAATCTTAGGAAAAAGTGACACTGGCTGGAAGGTAGAGCATTAAAGGAGTTAATCATGAAACTTGACTCAGATTAGACTTTTGTTGTGTATAA
CCTTCACTTCTCTGCTGCACCGCAGTTTCAAATTTCCGAAACTTTCCTTGCCTGAAATCTTTTCCTGGCAGTTCTCTACACTGCCCATATATAGAATAGAGTGAGTGAGT
TACACACAAAAGGCCAACCTTGCCCATCTATCGTCTATTCCATGTACTTAATTTGGTTGAAGACTTTGTATATATGGCAGAATTCCTCCTGTAAGCCACCGGTTTACCTG
GCTTTGTATTGCAGAAATGACATCATAATGCATTTTTGCTGTGTTAGATCACTGTGCATTTTGTTTCAGAATGGGACAGTTCCTTGCTTGTGAACATAAGGGCATCCAAT
TGAATTATTTATTCTGATGAGGATCTAAAATTAGCATATTTCAATCACTTAAGCTCCATCAAAATGATGAAACCCATATTTTCATCTGGATCAAAACCATCGTTCCAATG
TACCAATAAGGGCATATTCATGGTCTCTGCGCCAGGATGAACACGTCAAAGCGGTTACCTCATATTGCAGCATAAGCAGGACTGACTTAAAGTCGCTGGATTTAGTGGTG
GATTTGTTATCTGCGGCACACCAAATCCTTTTGGAAGATTGGCCTTTCAAAAAAGGTGTTCTTTTGAAATAGCGACCCTTCATGGATAACATGGTGACTACTGACTGATG
GATTAGGTGCAAGACTTAAAAGTTGAATTAGTTGGCCTAAACTTTTGACAGAGTGAGCAAGTTATTTGTATAAGGTACATTTTTGAAAGAGTCGGCCTTTTCAATTCATG
ATGAAGACTAGAATTATTTTCTGCGCTGCGGTATGCTTGGCCTTCCTAGTTGTTATTCTTTTGGCTCTGCTTTCGCCGGTCCCCAACAAAAAGCAGTCGAAGCACGGCAG
AAAACCATCGTGGGCGGACCTGTCCCTCTACATTCAGCAGCCACATTCTACAGGAAATGCTAAATCTAACAATATGCAGCCCGTACCAAGATCCGATTCTGGGGTTTTCG
TATTCCTACGAACGCTCACGGAGGGACCTGAGAACACTTCCCGGATTGTTGGAAATGCTCGAGGTTTCATTATTCCTAACGAACAGTTTGCTCATTCTTCATTCAATGTC
ATCTATCTCAGTTTCGACACACCGGAATATTCAGGCAGCCTGAGCGTGCACGCCAAGCATATTGGACATGAGAATAGAGAACTGGCGGTGGTAGGGGGGACAGGTTCTTT
TGCTTTTGCACAAGGGATAGCTATTTTTCTACAGACAGATGGGCAGGCATCTGTTACAGATACAACTTATCATTTAAAGCTTCAACTTCAATTCCCCAAATGACAGTGCA
AAGTAGTCCCACATGCTTCTTTCTTTTGTGATATATAAAGCACAATTTTGTGTACCAATGGGGATGCATGACCATGTTCCTCGTCATTCCAGTTGTAAAAACTGCTTGGC
TAAGACATGCTTTGGTATTCAATAATTATATGGCCATGGGTTGCTCCTAAATACACACTGCATACGTTTCGCAGCATCTGGAACTTGAGATGCCATTGATTATTTGTTTA
TTTATTTTAATTATTTTTAGTTTTCTGCCTCAAACTGTTTTTAGTAATATGATGAAGTAACTGACTTTGTTACAATGAACCCTTTTGACAACTGGTTTATATCCATGATG
G

Protein sequence

Show/hide protein sequence

MAIPSPPKLQISSSSLYFQPFRHQISFHFLQKTPRGITRHFHLERLQRLLHLPRALREWQDYEEAVKRKDLAEALRFLESFDRDSAIEPVNDSAAADSAPSALRNPRLSG
WERDWEVLDTCLNADDMKLVANAYGFLRDRGFLPNFGKCRNIVLEGRRDVTPSVLESSTGLQVTKLSPKKWGLSGSSSYALIAFLGGTSFLLSRDIDIRPNLLALLGLAF
LDSILLGGTCLAQISSYWPPYRRRILVHEAGHLLTAYLMGCPIRGVILDPIVAMQMGIQGQAGTQFWDEKMASNLAEGRLDGTSFDRYCMILFAGIAAEALVYGEAEGGE
NDENLFRSICILLQPPLSVAQMSNQARWAVLQSYNLLKWHKHAHQVAVKALESGSSLSVVIRKIEDALSTNG

MC04g0024 (gene) of Bitter gourd (Dali-11) v1 genome