CuGenDBv2

Gene ID	MC05g1226
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	Hydroxyproline-rich glycoprotein family protein
Genome location	MC05:16515187..16516038
RNA-Seq Expression	MC05g1226
Synteny	MC05g1226
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0043818.1 protein YLS9 [Cucumis melo var. makuwa]

4.34e-128

69.15

Show/hide

Query:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN
        MASSS DQQSQSKA +PP PP  SSA NNPPP+YPPP++GYPP   H GY PAMGYP    P         PPYN Y YAQAPPAAYY+  QNY A  ++
Subjt:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN

Query:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV
        AGF+RGIV+ALIL+V ++TLSSIITWI+LRPE+P+FKV+SFSV NFNISK NYSG+W+A+V V+NPN KLN+N ERIQSFVD+K++TLAMS+ DPFFLDV
Subjt:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV

Query:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV
        EKS +M+V+L SSSPDDPGNW + E+K+GRERA GTV FNLRF AWTTFR+GSWWTRRV+MR+ CED+KL F GPAA  A ++AD H KTCSV V
Subjt:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV

XP_008442912.1 PREDICTED: uncharacterized protein LOC103486674 [Cucumis melo]

2.13e-132

69.15

Show/hide

Query:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN
        MASSS DQQSQSKA +PP PP  SSA NNPPP+YPPP++GYPP   H GY PAMGYP    P         PPYN Y YAQAPPAAYY+  QNY A  ++
Subjt:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN

Query:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV
        AGF+RGIV+ALIL+V ++TLSSIITWI+LRPE+P+FKV+SFSV NFNISK NYSG+W+A+V V+NPN KLN+N ERIQSFVD+K++TLAMS+ DPFFLDV
Subjt:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV

Query:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV
        EKS +M+V+L SSSPDDPGNW + E+K+GRERA GTV FNLRF AWTTFR+GSWWTRRV+MR+ CED+KL F GPAA  A ++AD H KTCSV V
Subjt:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV

XP_011652032.1 uncharacterized protein LOC105434983 [Cucumis sativus]

1.98e-129

68.15

Show/hide

Query:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVNA
        MASSS DQQSQSKA +PP PP  SSA NNPPP+YPPP++GYPP    GY PAMGYP    P         PPYN Y YAQAPPAAYY+  QNY A+ V+A
Subjt:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVNA

Query:  GFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVE
        GF+RGIV+ALIL+V ++TLSSIITWI+LRP+IP+FKV+SFSV NFNISK NYSG+W  ++ VENPN KL +N ERIQSFV++KE+TLAMS+ DPFF+DVE
Subjt:  GFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVE

Query:  KSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV
        KS++MRV+L SSSPDDPGNW + E+K+G+E+A+GTV FNLRF AWT FRSGSWWTRR++M++FCEDLKLAF GPAA    ++AD+H KTCSV
Subjt:  KSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV

XP_023539989.1 uncharacterized protein LOC111800503 [Cucurbita pepo subsp. pepo]

1.87e-118

64.34

Show/hide

Query:  MASSSGDQQSQSKA--GEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHG--QNYPAEPVNAGFIRGI
        MASSS +QQS+SK+   +P  PP   SAA+NPPPIYPPP++GYPP PHPGYPPA G     A PPYNGYAYAQAPPAAYYH   QNY  EP +A FIRGI
Subjt:  MASSSGDQQSQSKA--GEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHG--QNYPAEPVNAGFIRGI

Query:  VSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTKMR
        V+ALI++V+L+ LSSIITWI+LRPEIP F+V++  V NFNISKSNYSG+W A + V+NPN+KLNL F+RIQ FV +K++TLAMSF DPFFL VE++  MR
Subjt:  VSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTKMR

Query:  VRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV
        VR  SSSPDDPGNW + E+K+G+E+A   VGFNLRF  WTTF+SGSWWTR VI+R+FC+DLK+ F  P + +  F A  H   C+V
Subjt:  VRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV

XP_038905898.1 uncharacterized protein LOC120091828 [Benincasa hispida]

1.01e-125

67.47

Show/hide

Query:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYP---HYGAPP------PYNGYAYAQAPPAAYYHG-QNYPAEPVNA
        MASSS D QSQSKA +PP  P  S A NNPPP+YPPP++GYPP     YPPAMGYP   H G PP      PYN Y YAQAPPAAYY+  QNY AE VN 
Subjt:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYP---HYGAPP------PYNGYAYAQAPPAAYYHG-QNYPAEPVNA

Query:  GFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVE
        GF+RGIV+ALIL V ++TLSSI+TWI+LRPEIP+F+++SFSV NFNISKSNYSG+W+  + V+NPN +LN+N ER+QSFVD+K++TLAMS+GDPFFLDVE
Subjt:  GFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVE

Query:  KSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV
        KS +MRV+L SSSPDDPG+WA+ EDK+G+E+A GTV FNLRF+AWTTFR GSWWTRRV++R+FCEDLKL FAGPAA    +  + +PK CSV
Subjt:  KSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LGS8 Uncharacterized protein

9.47e-131

68.15

Show/hide

Query:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVNA
        MASSS DQQSQSKA +PP PP  SSA NNPPP+YPPP++GYPP    GY PAMGYP    P         PPYN Y YAQAPPAAYY+  QNY A+ V+A
Subjt:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVNA

Query:  GFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVE
        GF+RGIV+ALIL+V ++TLSSIITWI+LRP+IP+FKV+SFSV NFNISK NYSG+W  ++ VENPN KL +N ERIQSFV++KE+TLAMS+ DPFF+DVE
Subjt:  GFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVE

Query:  KSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV
        KS++MRV+L SSSPDDPGNW + E+K+G+E+A+GTV FNLRF AWT FRSGSWWTRR++M++FCEDLKLAF GPAA    ++AD+H KTCSV
Subjt:  KSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV

A0A1S3B6W4 uncharacterized protein LOC103486674

1.03e-132

69.15

Show/hide

Query:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN
        MASSS DQQSQSKA +PP PP  SSA NNPPP+YPPP++GYPP   H GY PAMGYP    P         PPYN Y YAQAPPAAYY+  QNY A  ++
Subjt:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN

Query:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV
        AGF+RGIV+ALIL+V ++TLSSIITWI+LRPE+P+FKV+SFSV NFNISK NYSG+W+A+V V+NPN KLN+N ERIQSFVD+K++TLAMS+ DPFFLDV
Subjt:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV

Query:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV
        EKS +M+V+L SSSPDDPGNW + E+K+GRERA GTV FNLRF AWTTFR+GSWWTRRV+MR+ CED+KL F GPAA  A ++AD H KTCSV V
Subjt:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV

A0A5A7TLT1 Protein YLS9

2.10e-128

69.15

Show/hide

Query:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN
        MASSS DQQSQSKA +PP PP  SSA NNPPP+YPPP++GYPP   H GY PAMGYP    P         PPYN Y YAQAPPAAYY+  QNY A  ++
Subjt:  MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP-HPGYPPAMGYPHYGAP---------PPYNGYAYAQAPPAAYYHG-QNYPAEPVN

Query:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV
        AGF+RGIV+ALIL+V ++TLSSIITWI+LRPE+P+FKV+SFSV NFNISK NYSG+W+A+V V+NPN KLN+N ERIQSFVD+K++TLAMS+ DPFFLDV
Subjt:  AGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDV

Query:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV
        EKS +M+V+L SSSPDDPGNW + E+K+GRERA GTV FNLRF AWTTFR+GSWWTRRV+MR+ CED+KL F GPAA  A ++AD H KTCSV V
Subjt:  EKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV

A0A6J1FNP1 uncharacterized protein LOC111447106

7.49e-116

62.85

Show/hide

Query:  MASSSGDQQSQSKA----GEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHG--QNYPAEPVNAGFIR
        MASSS +QQS+SK+     +P  PP   SAA+NP PIYPPP++GYPP PHPGYPPA G     A PPYNGYAYAQAPPAAYYH   QNY  EP +A FIR
Subjt:  MASSSGDQQSQSKA----GEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHG--QNYPAEPVNAGFIR

Query:  GIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTK
        GIV+ALI++V+L+ L+SIITWI+LRPEIP F+V++  V NFNISKSNYSG+W A + V+NPN+KLNL F+RIQ FV +K++TLAMSF DPFFL VE++  
Subjt:  GIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTK

Query:  MRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV
        MRVR  SSSPDDPGNW + E+K+G+E+A   V FNLRF  WTTF+SGSWWTR VI+R+FC+DLK+ F  P + +  F A  H   C+V
Subjt:  MRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV

A0A6J1L2Y7 uncharacterized protein LOC111498631

2.83e-115

62.94

Show/hide

Query:  MASSSGDQQSQSKA--GEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHG--QNYPAEPVNAGFIRGI
        MASSS +QQS+SK+   +P  PP   SAA+NPPPIYPPP++GYPP PHPGYPPA G     A PPYNGYAYAQAPP AYYH   QNY  EP +A  IRGI
Subjt:  MASSSGDQQSQSKA--GEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHG--QNYPAEPVNAGFIRGI

Query:  VSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTKMR
        V+ALI++V+L+ LSSIITWI+LRPEIP F+V++  V NFNISKSNYSG+W A + V+NPN+KLNL F+RIQ FV +K++TLAMSF DPFFL VE++  MR
Subjt:  VSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTKMR

Query:  VRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV
        VR  SSSPDDPG+W + E+K+G+E+A   V FNLRF  WTTF+SGSWWTR VI+R+FC+DLK+ F  P + +  F A  H   C+V
Subjt:  VRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G27260.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

3.1e-18

30.2

Show/hide

Query:  PSVGYP-----PGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHGQNYPAEPVNAGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFS
        P+ GYP     P P    PP  GYP+     P  G AY       YY  Q  P     A  IR +       +LLL L   I ++++RP++P   + S S
Subjt:  PSVGYP-----PGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHGQNYPAEPVNAGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFS

Query:  VGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTKMRVRLISSSPDDPGNWAD--IEDKMGRERAA-GTVGF
        V NFN+S +  SG W+  +   NPN K++L++E     + +   +L+ +   PF    +  T +   L  S     G + D  + D +G+ER+  G V F
Subjt:  VGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTKMRVRLISSSPDDPGNWAD--IEDKMGRERAA-GTVGF

Query:  NLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVY
        +LR +++ TFR G++  RR +  ++C+D+ +     ++ + K V  S  K C  Y
Subjt:  NLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVY

AT3G52460.1 hydroxyproline-rich glycoprotein family protein

2.3e-42

38.69

Show/hide

Query:  SSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP---HPGYPPAMGYPHYGAPP---------PYNGYAYAQAPPAAYYHGQNYPAE-----
        S  ++++Q K      P ++S    N PP  PPP    PP P      YPP MGYP Y  PP         PY  Y YAQAPPA+YY G +YPA+     
Subjt:  SSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGP---HPGYPPAMGYPHYGAPP---------PYNGYAYAQAPPAAYYHGQNYPAE-----

Query:  --PVNAGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDF-----KEHTLAM
          P ++GF+RGI + LI++V+LL +S+ ITW++LRP+IP+F V +FSV NFN++   +S  W A + +EN N KL   F+RIQ  V       ++  LA 
Subjt:  --PVNAGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDF-----KEHTLAM

Query:  SFGDPFFLDVEKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKT
        +F  P F++ +KS  +   L +   + P   + + D+M +ER  GTV F+LR   W TF++  W  R   +++FC  LK+ F G +   A  V    P  
Subjt:  SFGDPFFLDVEKSTKMRVRLISSSPDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKT

Query:  CSVYV
        C VYV
Subjt:  CSVYV

AT5G22870.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

4.7e-11

23.91

Show/hide

Query:  PAEPV-NAGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNY-SGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSF
        PA+P+     I  I   ++ ++ +  +  +ITW+  +P+   + VE+ SV NFN++  N+ S +++  +   NPN ++++ +  ++ FV FK+ TLA   
Subjt:  PAEPV-NAGFIRGIVSALILVVLLLTLSSIITWIMLRPEIPIFKVESFSVGNFNISKSNY-SGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSF

Query:  GDPFFLDVEKSTKMRVRLISSS-PDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGP
         +PF        ++   LI+ +      N  D+      + + G +GF +   A   F+ G W +     +I C  + ++ + P
Subjt:  GDPFFLDVEKSTKMRVRLISSS-PDDPGNWADIEDKMGRERAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTTCTTCGTCGGGGGATCAACAATCTCAATCCAAGGCCGGTGAGCCACCGTCCCCTCCGCGGTCCTCCTCCGCCGCCAACAACCCCCCACCCATCTACCCTCCGCC
GTCCGTCGGCTACCCTCCGGGGCCCCACCCGGGCTACCCGCCGGCAATGGGGTACCCCCATTACGGGGCCCCGCCGCCGTACAACGGCTACGCGTACGCCCAGGCCCCTC
CGGCGGCGTACTACCACGGGCAGAATTACCCGGCGGAGCCGGTGAACGCGGGATTCATCCGCGGGATTGTGTCGGCCCTGATTCTGGTGGTGCTGTTGCTGACCCTGAGC
AGCATAATCACGTGGATCATGCTCCGACCCGAGATCCCAATCTTCAAAGTGGAATCCTTCTCGGTGGGGAATTTCAACATCTCGAAATCGAATTACTCCGGCAGCTGGGA
GGCGGCGGTGGGGGTGGAGAATCCGAACCGGAAACTGAATCTGAATTTCGAGCGGATCCAGAGCTTCGTGGATTTCAAAGAACACACGCTGGCGATGTCGTTTGGGGACC
CGTTTTTCCTGGACGTGGAGAAGAGCACCAAAATGCGGGTGAGATTGATCTCGAGCAGCCCCGATGATCCCGGGAATTGGGCCGACATAGAGGACAAGATGGGCCGGGAG
CGGGCCGCCGGAACTGTGGGCTTCAATTTGAGATTCTTGGCCTGGACCACTTTCCGGTCTGGGTCATGGTGGACCAGGCGGGTCATTATGAGGATTTTCTGTGAGGATTT
GAAGCTTGCCTTCGCCGGACCCGCCGCACGCGACGCCAAGTTCGTCGCCGATTCCCACCCCAAGACTTGTTCCGTTTATGTC

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASSSGDQQSQSKAGEPPSPPRSSSAANNPPPIYPPPSVGYPPGPHPGYPPAMGYPHYGAPPPYNGYAYAQAPPAAYYHGQNYPAEPVNAGFIRGIVSALILVVLLLTLS
SIITWIMLRPEIPIFKVESFSVGNFNISKSNYSGSWEAAVGVENPNRKLNLNFERIQSFVDFKEHTLAMSFGDPFFLDVEKSTKMRVRLISSSPDDPGNWADIEDKMGRE
RAAGTVGFNLRFLAWTTFRSGSWWTRRVIMRIFCEDLKLAFAGPAARDAKFVADSHPKTCSVYV

MC05g1226 (gene) of Bitter gourd (Dali-11) v1 genome