CuGenDBv2

Gene ID	MC02g0294
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	classical arabinogalactan protein 1-like
Genome location	MC02:2672401..2674616
RNA-Seq Expression	MC02g0294
Synteny	MC02g0294
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6605547.1 hypothetical protein SDJN03_02864, partial [Cucurbita argyrosperma subsp. sororia]

2.71e-55

69.06

Show/hide

Query:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP
        MAKSVAFCCLLL FV++ ++   SLE P++V       PSPSP+SAADSPP+PSP PFPHAP++SP ESPL SPPAPPPSDL      TPSPSP+  PSP
Subjt:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP

Query:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        SP PAPS   DSD   S+A+GG  E+   SKGGMNGGKKAGIA GVIAA CFVG+GGIVYKKRQ+NIRRSQ+G+AARSSFL
Subjt:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

XP_022140708.1 classical arabinogalactan protein 1-like [Momordica charantia]

4.18e-103

100

Show/hide

Query:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP
        MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP
Subjt:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP

Query:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
Subjt:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

XP_022995398.1 lysine-rich arabinogalactan protein 18-like [Cucurbita maxima]

4.71e-56

70.17

Show/hide

Query:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP
        MAKSVAFCCLLL FV++ ++   SLE P++V       PSPSP+SAADSPP+PSP PFPHAP++SP ESPL SPPAPPPSDL      TPSPSP+  PSP
Subjt:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP

Query:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        SP PAPS   DSD   S+A+GG  E+  ASKGGMNGGKKAGIA GVIAA CFVGIGGIVYKKRQ+NIRRSQ+G+AARSSFL
Subjt:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

XP_023534499.1 alpha carbonic anhydrase 8-like [Cucurbita pepo subsp. pepo]

1.27e-53

68.51

Show/hide

Query:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP
        MAKSVAF CLLL FV++ ++   SLE P++V       PSPSP+SAADSPP+PSP PFPHAP++SP ESPL SPPAPPPSDL      TPSPSP+  PSP
Subjt:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP

Query:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        SP PAPS   DSD   S+A+GG  E+   SKGGMNGGKKAGIA GVIAA CFVG+GGIVYKKRQ+NIRRSQ+G+AARSSFL
Subjt:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

XP_038901486.1 early nodulin-20-like isoform X1 [Benincasa hispida]

5.91e-54

70.22

Show/hide

Query:  MAKSVAFCCLL-LFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPT
        MAKS+ FC LL +FVSL INV+ SLE L    P    PSPSP+S  +SPPLPSP PFPHAP++SP ESPL+SPPAPPPSDL      T SPSPSPSPSP+
Subjt:  MAKSVAFCCLL-LFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPT

Query:  PAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        P+PSP  DSD S S +SGG  +S  ASKGGM GGKKAGIA GVIAA  FVGIGG VYKKRQ+NIRRSQYG+AARSSFL
Subjt:  PAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CIM1 classical arabinogalactan protein 1-like

2.02e-103

100

Show/hide

Query:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP
        MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP
Subjt:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP

Query:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
Subjt:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

A0A6J1FYT3 alpha carbonic anhydrase 8-like

2.65e-49

65.54

Show/hide

Query:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP
        MAK +AFCC LL    L+NV  SLE  +   P     SP P+SAA  PPL SP PFPHAP++SP ESPL+SPPAPPPSDL     P+PSP+  PSPS  P
Subjt:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP

Query:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        APSP  D D   S+++ G  ES  +SKGGMNGGKKAGIA GVIAA CFVGIGGIVYKKRQ+NIRRSQYG+AARSSFL
Subjt:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

A0A6J1H149 lysine-rich arabinogalactan protein 18-like

8.69e-54

68.16

Show/hide

Query:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSP
        MAKSVAFCCLLL FV++ ++   SLE P++V       PSPSP+SAADSPP+PSP PFPHAP++SP ESPL SPPAPP SDL     P PSP+  PSPSP
Subjt:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSP

Query:  TPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
         PAPS   DSD   S+A+GG  E+   SKGGMNGGKKAGIA GVIAA CFVG+GGIVYKKRQ+NIRRSQ+G+AARSSFL
Subjt:  TPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

A0A6J1JA87 proline-rich receptor-like protein kinase PERK12

8.70e-48

63.84

Show/hide

Query:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP
        MAK +AFCC LL    L+NV  SLE  +   P+       P+SA   PPL SP PFPH P++SP ESPL+SPPAPPPSDL     P+PSP+  PSPSP  
Subjt:  MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTP

Query:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        AP+P  DSD   S+++ G VES  +SKGGMNGGKKAGIA GVIAA CFVGIGGIVYKKRQ+NIRRSQYG+AARSSFL
Subjt:  APSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

A0A6J1K7T9 lysine-rich arabinogalactan protein 18-like

2.28e-56

70.17

Show/hide

Query:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP
        MAKSVAFCCLLL FV++ ++   SLE P++V       PSPSP+SAADSPP+PSP PFPHAP++SP ESPL SPPAPPPSDL      TPSPSP+  PSP
Subjt:  MAKSVAFCCLLL-FVSLLINVTVSLE-PLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPS--PSP

Query:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        SP PAPS   DSD   S+A+GG  E+  ASKGGMNGGKKAGIA GVIAA CFVGIGGIVYKKRQ+NIRRSQ+G+AARSSFL
Subjt:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G28440.1 proline-rich family protein

3.4e-07

37.02

Show/hide

Query:  DVTAPAGGSPSP---SPQSAADSPPLPSPAPFPHAPSASPPESPLNSP--------PAPPP---------SDLPPRPAPTPSPS-------PSPS----P
        +V +P   S SP   SPQ  + SP   SP P   +P A+ P+SP +SP        P+PPP         S   P PAP P+PS       P P     P
Subjt:  DVTAPAGGSPSP---SPQSAADSPPLPSPAPFPHAPSASPPESPLNSP--------PAPPP---------SDLPPRPAPTPSPS-------PSPS----P

Query:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL
        SP P+P      D+  S A+G E+        GM+G +KAGIA G I  V  + IG +VYKKR++N+ R++Y       FL
Subjt:  SPTPAPSPNRDSDVSKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

AT3G45230.1 hydroxyproline-rich glycoprotein family protein

6.3e-14

52.35

Show/hide

Query:  SPSPSPQSAADSPPLPSPAPFPHAPSASPPESPL--NSPPAPPPSDLP-PRPAPTPSPSP-------SPSPSPTPAPSPNRDSDVSKSVASGGEVES-GA
        SP+PSP   ADSP + +  P       SP ESP+  +SPP P     P P PA +PS SP       SPS S +P+PSP   SDV+ S  +G E E   +
Subjt:  SPSPSPQSAADSPPLPSPAPFPHAPSASPPESPL--NSPPAPPPSDLP-PRPAPTPSPSP-------SPSPSPTPAPSPNRDSDVSKSVASGGEVES-GA

Query:  ASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAAR
         S GGM+GGKK G+AFG IAAVC VG+ G VYKKRQ NIRRS+YG AAR
Subjt:  ASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAAR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

mRNA sequence

Show/hide mRNA sequence

ATGGCGAAATCCGTTGCATTCTGTTGCCTTCTTCTGTTCGTTTCGCTGTTGATCAATGTCACTGTCTCTTTGGAACCACTCGATGTGACTGCGCCGGCGGGTGGTTCGCC
TTCTCCGTCCCCTCAATCTGCCGCCGATTCTCCTCCACTGCCCTCCCCGGCCCCATTCCCCCACGCTCCTTCCGCCTCTCCACCGGAGTCGCCTTTGAACTCTCCTCCTG
CGCCTCCGCCCTCAGATCTTCCTCCCCGTCCGGCTCCGACGCCTTCTCCTTCTCCTTCTCCTTCTCCGTCCCCGACTCCTGCTCCTTCGCCTAACAGAGACAGCGATGTC
AGTAAGAGCGTCGCCAGTGGCGGTGAAGTGGAATCGGGAGCAGCCTCCAAAGGCGGGATGAACGGAGGCAAGAAGGCTGGAATTGCATTTGGAGTGATTGCCGCAGTGTG
TTTCGTCGGAATTGGAGGAATCGTGTACAAGAAGCGCCAAAACAACATTCGCCGATCTCAGTACGGGGACGCCGCTAGGTCTTCCTTCCTATGAGGATCAAAATGGAGAC
GGAAGCTATGGTTCAGAGAAGTCGCAACCTAAACTCATTGTACACGCAACAATATACACTCCCTGCATCAAAAAATCATGTATCCCGTAGGCCAACTCCGTTTCGACTTA
ATTTCTGCTTGATGTTTCTGAGTTTCCGCCAACTGTAGGATGCTGGCGGGGAATGGCATTGTGTAGTGAACTTATAGCTATGAATGGTCGTATTGGTTGCGCTATTCTCT
GAGGGTCAAGGCGCTGTTGTGTTGAAGGTAGCCCCCATCGTCTTCTCCATCTTAAAAATTCAACGGTAATTGAACTTCCGCTCATGACAATGCCAAACCCAGTTAATGTA
GCCAGTACAATGGCCAGAACTGCTTGGACACCAACCTGTAAACCATTCTAAAGATCAATCTCCAACATCAAAATAAGTCTGCTACTGGGCTTATTTGTACAAGGCATCCT
ATTGTTAATTCAGCAGCAAAATGAAGATATATTAGGTTTTAGTTTTCAGATAATGCCATTCGATAAATGATCCAAAAGAATACGAGCTGTGGATTGTAAAACTCAATCCC
TGCTAACAAATGTCCACTATGGATAATATCAATAGGAAAAAAAAAGATAGATTTATCTCTTACCACGGAGTAAAATATGTGCGAGAAGAGAACCACCATGGCAAATTGTA
CTGTTGCATACACCCATATGAATCTTCTCTTCACTGCAAACGAAATTTTTTGTTCAGGGGTACTGAAGTAAACTAACTGTCTATAATAGCAACAAACTGTCACAGAAGAA
TCCCAAAGTCTACCAAATCAAGACAGTTTCAGCCAAGTCAGGATTGACTGAACTCTATGTTTCAGGCTTATTGAATATTAGTGCAATGTGATAGATTAGCAAATATGAGT
TGAATCCTCA

Protein sequence

Show/hide protein sequence

MAKSVAFCCLLLFVSLLINVTVSLEPLDVTAPAGGSPSPSPQSAADSPPLPSPAPFPHAPSASPPESPLNSPPAPPPSDLPPRPAPTPSPSPSPSPSPTPAPSPNRDSDV
SKSVASGGEVESGAASKGGMNGGKKAGIAFGVIAAVCFVGIGGIVYKKRQNNIRRSQYGDAARSSFL

MC02g0294 (gene) of Bitter gourd (Dali-11) v1 genome