CuGenDBv2

Gene ID	Tan0015025
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Hydroxyproline-rich glycoprotein family protein
Genome location	LG08:66064987..66066094
RNA-Seq Expression	Tan0015025
Synteny	Tan0015025
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0043818.1 protein YLS9 [Cucumis melo var. makuwa]

2.7e-112

72.91

Show/hide

Query:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP
        MASSS+DQQSQSK+TD  P HP SAGNN PP+YPPPT+GYP      GY PAMGYPPAPHP YPPA G YPP  YNAY    AQAPPAAYY+N PQNYR 
Subjt:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP

Query:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF
          ++ GF+RGIV ALILLV +MTLSSIITWIILRPE+P F+VDSFSV+NFNISK NYSGNWDA+V VQNPN KLN++ ERIQSFVD+K NTLA S+ADPF
Subjt:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF

Query:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV
        FLDVEK  QM+VKLTSSSPDDPGNW +TE+ + +ERATG VSFNLRFFAWTTFR+GSWWTRRVVMRV CED+K+VF  PA+ +  + AD + K C+VLV
Subjt:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV

XP_008442912.1 PREDICTED: uncharacterized protein LOC103486674 [Cucumis melo]

2.7e-112

72.91

Show/hide

Query:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP
        MASSS+DQQSQSK+TD  P HP SAGNN PP+YPPPT+GYP      GY PAMGYPPAPHP YPPA G YPP  YNAY    AQAPPAAYY+N PQNYR 
Subjt:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP

Query:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF
          ++ GF+RGIV ALILLV +MTLSSIITWIILRPE+P F+VDSFSV+NFNISK NYSGNWDA+V VQNPN KLN++ ERIQSFVD+K NTLA S+ADPF
Subjt:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF

Query:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV
        FLDVEK  QM+VKLTSSSPDDPGNW +TE+ + +ERATG VSFNLRFFAWTTFR+GSWWTRRVVMRV CED+K+VF  PA+ +  + AD + K C+VLV
Subjt:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV

XP_011652032.1 uncharacterized protein LOC105434983 [Cucumis sativus]

1.7e-111

71.04

Show/hide

Query:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPE
        MASSS+DQQSQSK+TD  P HP SAGNN PP+YPPPT+GYP    HGY PAMGYPP P PGYPPAPG YPP  YN Y    AQAPPAAYY+N PQNYR +
Subjt:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPE

Query:  PVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFF
         V+ GF+RGIVTALILLV +MTLSSIITWI+LRP+IP F+VDSFSV+NFNISK NYSGNW+ ++ V+NPN KL ++ ERIQSFV++K+NTLA S+ADPFF
Subjt:  PVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFF

Query:  LDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVL
        +DVEK SQMRVKLTSSSPDDPGNW +TE+ + +E+A+G VSFNLRFFAWT FRSGSWWTRR+VM+VFCEDLK+ F  PA+ +G + AD + K C+VL
Subjt:  LDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVL

XP_022983003.1 uncharacterized protein LOC111481675 [Cucurbita maxima]

3.6e-109

71.75

Show/hide

Query:  MASSSDDQ---QSQSKSTDPTH--PPSAGNNHPPIYPPPTMGYP---HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY------SN
        MASSS DQ   QSQSK TDP    PPSAGNN PPIYPPPT+GYP   HGYPPAMGYPPAPHPGYPPAPG YPP  YNAYAY   QAPPAAYY      +N
Subjt:  MASSSDDQ---QSQSKSTDPTH--PPSAGNNHPPIYPPPTMGYP---HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY------SN

Query:  GPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLA
         PQ YR E    GF+RGI  AL+LLVV+MT+SSIITWIILRPEIP F+VDSFSVANFNISKSNYSG WD  V VQNPN KLNLHFERI+SFVD+ DNT+A
Subjt:  GPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLA

Query:  TSFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFR--SGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGN
        TSF+DPFFLD+EK  QM VK+TSSSPDDPGNW QTE+ +++ERATG VSF LR  AWTTFR  SGS WTRRV++RVFCEDLK+VF T  + +G +S   +
Subjt:  TSFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFR--SGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGN

Query:  PKDCAVLV
        PK C VLV
Subjt:  PKDCAVLV

XP_038905898.1 uncharacterized protein LOC120091828 [Benincasa hispida]

1.9e-113

73.83

Show/hide

Query:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPE
        MASSSDD QSQSK+TD  P  PPSAGNN PP+YPPPT+GYP    H YPPAMGYPPAPHPGYPPAPG YPP  YN Y    AQAPPAAYY+N  QNYR E
Subjt:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPE

Query:  PVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFF
         VNTGF+RGIVTALIL V +MTLSSI+TWIILRPEIP FR+DSFSV NFNISKSNYSGNWD  + VQNPN +LN++ ER+QSFVD+KDNTLA S+ DPFF
Subjt:  PVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFF

Query:  LDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV
        LDVEK  QMRVKLTSSSPDDPG+WA+TE  + +E+ATG VSFNLRF AWTTFR GSWWTRRVV+RVFCEDLK+VF  PA+    +S + NPK C+VL+
Subjt:  LDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LGS8 Uncharacterized protein

8.4e-112

71.04

Show/hide

Query:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPE
        MASSS+DQQSQSK+TD  P HP SAGNN PP+YPPPT+GYP    HGY PAMGYPP P PGYPPAPG YPP  YN Y    AQAPPAAYY+N PQNYR +
Subjt:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPE

Query:  PVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFF
         V+ GF+RGIVTALILLV +MTLSSIITWI+LRP+IP F+VDSFSV+NFNISK NYSGNW+ ++ V+NPN KL ++ ERIQSFV++K+NTLA S+ADPFF
Subjt:  PVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFF

Query:  LDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVL
        +DVEK SQMRVKLTSSSPDDPGNW +TE+ + +E+A+G VSFNLRFFAWT FRSGSWWTRR+VM+VFCEDLK+ F  PA+ +G + AD + K C+VL
Subjt:  LDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVL

A0A1S3B6W4 uncharacterized protein LOC103486674

1.3e-112

72.91

Show/hide

Query:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP
        MASSS+DQQSQSK+TD  P HP SAGNN PP+YPPPT+GYP      GY PAMGYPPAPHP YPPA G YPP  YNAY    AQAPPAAYY+N PQNYR 
Subjt:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP

Query:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF
          ++ GF+RGIV ALILLV +MTLSSIITWIILRPE+P F+VDSFSV+NFNISK NYSGNWDA+V VQNPN KLN++ ERIQSFVD+K NTLA S+ADPF
Subjt:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF

Query:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV
        FLDVEK  QM+VKLTSSSPDDPGNW +TE+ + +ERATG VSFNLRFFAWTTFR+GSWWTRRVVMRV CED+K+VF  PA+ +  + AD + K C+VLV
Subjt:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV

A0A5A7TLT1 Protein YLS9

1.3e-112

72.91

Show/hide

Query:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP
        MASSS+DQQSQSK+TD  P HP SAGNN PP+YPPPT+GYP      GY PAMGYPPAPHP YPPA G YPP  YNAY    AQAPPAAYY+N PQNYR 
Subjt:  MASSSDDQQSQSKSTD--PTHPPSAGNNHPPIYPPPTMGYP-----HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRP

Query:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF
          ++ GF+RGIV ALILLV +MTLSSIITWIILRPE+P F+VDSFSV+NFNISK NYSGNWDA+V VQNPN KLN++ ERIQSFVD+K NTLA S+ADPF
Subjt:  EPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPF

Query:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV
        FLDVEK  QM+VKLTSSSPDDPGNW +TE+ + +ERATG VSFNLRFFAWTTFR+GSWWTRRVVMRV CED+K+VF  PA+ +  + AD + K C+VLV
Subjt:  FLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV

A0A6J1F415 uncharacterized protein LOC111442188

3.3e-108

71.34

Show/hide

Query:  MASSSDDQ---QSQSKSTDPTH--PPSAGNNHPPIYPPPTMGYP---HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY-----SNG
        MASSS DQ   QSQSK TDP    PPSAGNN PPIYPPPT+GYP   HGYPPAMGYPPAPHPGYPPAPG YPP  YNAYAY   QAPPAAYY     +N 
Subjt:  MASSSDDQ---QSQSKSTDPTH--PPSAGNNHPPIYPPPTMGYP---HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY-----SNG

Query:  PQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLAT
        PQ YR E    GF+RGI  AL+LLVV+MT+SSIITWIILRPEIP F+VDSFSV NFNISKSNYSG WD  V VQNPN KLNLHFERI+SFVD+ DNT+AT
Subjt:  PQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLAT

Query:  SFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFR--SGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNP
        SF+DPFFLD+EK  QM+VK+TSSSPDDPGNWAQTE+ +++ER TG VSF LR  AWTTFR  SGS WTRRV++RVFCEDLK+VF T  + +G +S     
Subjt:  SFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFR--SGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNP

Query:  KDCAVLV
        K C VLV
Subjt:  KDCAVLV

A0A6J1J6I9 uncharacterized protein LOC111481675

1.8e-109

71.75

Show/hide

Query:  MASSSDDQ---QSQSKSTDPTH--PPSAGNNHPPIYPPPTMGYP---HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY------SN
        MASSS DQ   QSQSK TDP    PPSAGNN PPIYPPPT+GYP   HGYPPAMGYPPAPHPGYPPAPG YPP  YNAYAY   QAPPAAYY      +N
Subjt:  MASSSDDQ---QSQSKSTDPTH--PPSAGNNHPPIYPPPTMGYP---HGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY------SN

Query:  GPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLA
         PQ YR E    GF+RGI  AL+LLVV+MT+SSIITWIILRPEIP F+VDSFSVANFNISKSNYSG WD  V VQNPN KLNLHFERI+SFVD+ DNT+A
Subjt:  GPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLA

Query:  TSFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFR--SGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGN
        TSF+DPFFLD+EK  QM VK+TSSSPDDPGNW QTE+ +++ERATG VSF LR  AWTTFR  SGS WTRRV++RVFCEDLK+VF T  + +G +S   +
Subjt:  TSFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFR--SGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGN

Query:  PKDCAVLV
        PK C VLV
Subjt:  PKDCAVLV

SwissProt top hits

e value

%identity

Alignment

Q9SJ52 NDR1/HIN1-like protein 10

3.7e-08

24.06

Show/hide

Query:  NAYAYAQAQAPPA--AYYSNGPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAA--VAVQNPN
        N   Y  +  PPA   YY  G             +   V  +I L+V++ ++++I W+I+RP    F V   S+  F+ +  +    ++ A  V V+NPN
Subjt:  NAYAYAQAQAPPA--AYYSNGPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAA--VAVQNPN

Query:  RKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQMRVKLTSSSPDDPGN-----WAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMR
        +++ L+++RI++   ++    +T    PF+       Q     T  +P   G       A   + ++ ER +G+ +  ++F     F+ G    RR+  +
Subjt:  RKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQMRVKLTSSSPDDPGN-----WAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMR

Query:  VFCEDLKVVFPT
        V C+DL++   T
Subjt:  VFCEDLKVVFPT

Q9ZVD2 NDR1/HIN1-like protein 13

3.9e-05

26.83

Show/hide

Query:  VTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNI-SKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQM
        + A+ +L+VL  +S  + ++I RPE P + ++ FSV+  N+ S S  S +++  V  +N N K+ +++E+  S   + ++   ++   P F    K   +
Subjt:  VTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNI-SKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQM

Query:  RVKLTSSSPDDPGNWAQTEQNMDKERATGI----VSFNLRFFAWTTFRSGSWWTRRVVMRVFCE
         VKL  S     G+  Q    M KE    +    V F L+  A    + GS  T  +++ V C+
Subjt:  RVKLTSSSPDDPGNWAQTEQNMDKERATGI----VSFNLRFFAWTTFRSGSWWTRRVVMRVFCE

Arabidopsis top hits

e value

%identity

Alignment

AT2G27260.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

5.4e-18

31.52

Show/hide

Query:  PTMGYPHGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPEP-VNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPT
        P  GYP+ YP      P P    PP  G   PAA  AY            Y N    Y P+P      IR +       ++L+ L   I ++I+RP++P 
Subjt:  PTMGYPHGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPEP-VNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPT

Query:  FRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERAT-
          ++S SV+NFN+S +  SG WD  +  +NPN K++LH+E     + +   +L+ +   PF  D  K  Q  V  T S      +  +   ++ KER+  
Subjt:  FRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQTEQNMDKERAT-

Query:  GIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDC
        G V F+LR  ++ TFR G++  RR V  V+C+D+ V  P     +G     G+ K C
Subjt:  GIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDC

AT2G35980.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

2.7e-09

24.06

Show/hide

Query:  NAYAYAQAQAPPA--AYYSNGPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAA--VAVQNPN
        N   Y  +  PPA   YY  G             +   V  +I L+V++ ++++I W+I+RP    F V   S+  F+ +  +    ++ A  V V+NPN
Subjt:  NAYAYAQAQAPPA--AYYSNGPQNYRPEPVNTGFIRGIVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAA--VAVQNPN

Query:  RKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQMRVKLTSSSPDDPGN-----WAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMR
        +++ L+++RI++   ++    +T    PF+       Q     T  +P   G       A   + ++ ER +G+ +  ++F     F+ G    RR+  +
Subjt:  RKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQMRVKLTSSSPDDPGN-----WAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMR

Query:  VFCEDLKVVFPT
        V C+DL++   T
Subjt:  VFCEDLKVVFPT

AT3G52460.1 hydroxyproline-rich glycoprotein family protein

2.4e-42

40.48

Show/hide

Query:  QQSQSKSTDPTHPPSAGNNHPPIYPPPTMGYPHGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY-SNGPQNYRP---EPVNTGFIRG
        Q S+     P  PP      P   PPP       YPP MGYP    P  PP    YP A Y  Y Y  AQAPPA+YY S+ P    P    P ++GF+RG
Subjt:  QQSQSKSTDPTHPPSAGNNHPPIYPPPTMGYPHGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYY-SNGPQNYRP---EPVNTGFIRG

Query:  IVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDF-----KDNTLATSFADPFFLDVE
        I T LI+LVVL+ +S+ ITW++LRP+IP F V++FSV+NFN++   +S  W A + ++N N KL  +F+RIQ  V       +D  LAT+F  P F++ +
Subjt:  IVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDF-----KDNTLATSFADPFFLDVE

Query:  KGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV
        K   +   LT+   + P   +     M KER TG V+F+LR   W TF++  W  R   ++VFC  LKV F    S NGA      P  C V V
Subjt:  KGSQMRVKLTSSSPDDPGNWAQTEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV

AT4G19200.1 proline-rich family protein

1.8e-05

58.62

Show/hide

Query:  HPPSAGNNHPPIYPPPTMGYP--HGYPPAMGYPPAPHP----GYPPAPGGYPPAAYNA
        H P A   +PP   PP  GYP   GYPPA GYPP  +P    GYPPAPGGYPPA Y A
Subjt:  HPPSAGNNHPPIYPPPTMGYP--HGYPPAMGYPPAPHP----GYPPAPGGYPPAAYNA

AT5G22870.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family

1.4e-10

24.46

Show/hide

Query:  IVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNY-SGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQ
        I   ++ L+ +  +  +ITW+  +P+   + V++ SV NFN++  N+ S  +   +   NPN ++++++  ++ FV FKD TLA    +PF        Q
Subjt:  IVTALILLVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNY-SGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQ

Query:  MRVKLTSSSPDDPGNWAQTEQN---MDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTP-ASVNGAFSAD
        +   L +       N A ++ N   +  + + G + F +   A   F+ G W +     ++ C  + V    P  S N +  AD
Subjt:  MRVKLTSSSPDDPGNWAQTEQN---MDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTP-ASVNGAFSAD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCTCTTCATCGGACGATCAACAATCCCAATCGAAATCGACGGACCCAACTCATCCGCCGTCCGCCGGAAACAACCACCCTCCGATTTACCCACCTCCGACTATGGG
GTACCCACATGGGTACCCTCCGGCGATGGGGTACCCTCCAGCCCCCCATCCAGGGTACCCTCCAGCGCCAGGGGGGTACCCCCCAGCTGCTTACAACGCCTACGCCTACG
CCCAAGCCCAAGCCCCTCCGGCCGCCTATTACAGCAACGGACCCCAAAATTACAGGCCGGAGCCCGTCAACACCGGCTTCATCCGCGGCATTGTGACCGCCTTAATCCTT
CTGGTCGTTCTAATGACCCTCTCCAGCATCATCACCTGGATCATCCTCCGACCTGAAATCCCAACGTTCAGAGTCGATTCCTTCTCCGTCGCCAATTTCAACATCTCCAA
ATCGAATTACTCCGGCAACTGGGACGCCGCTGTCGCCGTCCAAAATCCCAACCGCAAACTCAACCTCCATTTCGAACGGATCCAGAGCTTCGTGGACTTCAAGGACAACA
CGCTAGCCACGTCTTTTGCGGACCCATTTTTTCTTGATGTGGAAAAAGGCAGCCAAATGCGGGTGAAATTGACATCCAGTAGCCCTGATGATCCCGGTAATTGGGCCCAG
ACAGAGCAGAACATGGACAAAGAAAGGGCCACCGGAATTGTGAGTTTCAATTTGAGATTCTTTGCTTGGACCACTTTCCGATCTGGGTCTTGGTGGACTAGGCGCGTTGT
TATGAGAGTGTTTTGTGAGGATTTGAAGGTCGTCTTCCCCACCCCCGCCTCCGTTAATGGCGCCTTCTCCGCCGACGGCAACCCCAAGGATTGTGCAGTCCTCGTCTAG

mRNA sequence

Show/hide mRNA sequence

TTCTCTCTCTCTCTCTCTCTCTTTCTCTCTCTCTCCAAATCCAAAAACACAGAGAGAGAGAAAAACAAAATGGCCTCTTCATCGGACGATCAACAATCCCAATCGAAATC
GACGGACCCAACTCATCCGCCGTCCGCCGGAAACAACCACCCTCCGATTTACCCACCTCCGACTATGGGGTACCCACATGGGTACCCTCCGGCGATGGGGTACCCTCCAG
CCCCCCATCCAGGGTACCCTCCAGCGCCAGGGGGGTACCCCCCAGCTGCTTACAACGCCTACGCCTACGCCCAAGCCCAAGCCCCTCCGGCCGCCTATTACAGCAACGGA
CCCCAAAATTACAGGCCGGAGCCCGTCAACACCGGCTTCATCCGCGGCATTGTGACCGCCTTAATCCTTCTGGTCGTTCTAATGACCCTCTCCAGCATCATCACCTGGAT
CATCCTCCGACCTGAAATCCCAACGTTCAGAGTCGATTCCTTCTCCGTCGCCAATTTCAACATCTCCAAATCGAATTACTCCGGCAACTGGGACGCCGCTGTCGCCGTCC
AAAATCCCAACCGCAAACTCAACCTCCATTTCGAACGGATCCAGAGCTTCGTGGACTTCAAGGACAACACGCTAGCCACGTCTTTTGCGGACCCATTTTTTCTTGATGTG
GAAAAAGGCAGCCAAATGCGGGTGAAATTGACATCCAGTAGCCCTGATGATCCCGGTAATTGGGCCCAGACAGAGCAGAACATGGACAAAGAAAGGGCCACCGGAATTGT
GAGTTTCAATTTGAGATTCTTTGCTTGGACCACTTTCCGATCTGGGTCTTGGTGGACTAGGCGCGTTGTTATGAGAGTGTTTTGTGAGGATTTGAAGGTCGTCTTCCCCA
CCCCCGCCTCCGTTAATGGCGCCTTCTCCGCCGACGGCAACCCCAAGGATTGTGCAGTCCTCGTCTAGAATTATCATGTTTCCTGGGTAAATACCCTTCTTCTTTCTTGT
TTGATAATGACTGAGACTGAATAGGCCAAAAGATTTTTGTGTTTGTGTTCTAATTTTGTTTTTGTCAGCCAAGTAGGCGTTGAGTGTGGCCTTGATGAAGGAGGAGGATA
CAGCAGAG

Protein sequence

Show/hide protein sequence

MASSSDDQQSQSKSTDPTHPPSAGNNHPPIYPPPTMGYPHGYPPAMGYPPAPHPGYPPAPGGYPPAAYNAYAYAQAQAPPAAYYSNGPQNYRPEPVNTGFIRGIVTALIL
LVVLMTLSSIITWIILRPEIPTFRVDSFSVANFNISKSNYSGNWDAAVAVQNPNRKLNLHFERIQSFVDFKDNTLATSFADPFFLDVEKGSQMRVKLTSSSPDDPGNWAQ
TEQNMDKERATGIVSFNLRFFAWTTFRSGSWWTRRVVMRVFCEDLKVVFPTPASVNGAFSADGNPKDCAVLV

Tan0015025 (gene) of Snake gourd v1 genome