CuGenDBv2

Gene ID	MC04g0565
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	late embryogenesis abundant protein-related / LEA protein-related
Genome location	MC04:4922467..4925116
RNA-Seq Expression	MC04g0565
Synteny	MC04g0565
Gene Ontology terms	NA
InterPro domains	IPR009646 - Root cap

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6571952.1 hypothetical protein SDJN03_28680, partial [Cucurbita argyrosperma subsp. sororia]

3.51e-243

62.14

Show/hide

Query:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP
        S F++LVPL V V + VM +ATPPGIA NPSHA+CKIKKYKHCYNL HVCPKFCPDQCTVECASCKPICGGDA+ PPEDDPTPATPSPPS   + YYSPP
Subjt:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP

Query:  PP-----STPPVNPNP--------PT------TPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPS
        PP     S PP  P P        PT      +PP NP PPSTPP   YPP   NPP++PP +PN          PPT  TPS PPASPNPPSTPP +  
Subjt:  PP-----STPPVNPNP--------PT------TPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPS

Query:  PPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTN
          S PP N NPPS+PP +PNPP                    PSTP ++PNPPSTPPT     S PP + NPPSTPPTSPNPP+ + P+SPNP  TPPT+
Subjt:  PPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTN

Query:  PYPPAEPNPPATPSVNPNPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNP-SPSTPNSPSLSPPPQTPSE
         YPP   NPP+    NPNPP        P S PP NPNPPS P                         NPPSTPP SPNP +PSTP++P           
Subjt:  PYPPAEPNPPATPSVNPNPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNP-SPSTPNSPSLSPPPQTPSE

Query:  TPSSPSTNTPPQPQPSPPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQ
                                P  S PPGN   P+ + PPSSS GAAK+ VRCKN NYPQCYNM+HTCPSACP GC+VDCVTCKPVCHCDRPGAVCQ
Subjt:  TPSSPSTNTPPQPQPSPPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQ

Query:  DPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQ
        DPRFIGGDGITFYFHG+KD+DFCLVSD NLHINAH IGKRNP+L RDFTWVQSLGIL + H++ I AQKT  WDDS+DRL +A++  PVALPES GSQWQ
Subjt:  DPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQ

Query:  YPDENPTISVVRLAPANQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKE
        +P ENPT+ +VRL  AN VMVEAKG+FRITAKVVPITE+DSR+H+YGI + DSFAHLD+GFKFF LS  V+GVLGQTYG  YVS VNLKAAMPVMGREKE
Subjt:  YPDENPTISVVRLAPANQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKE

Query:  FKTSSLFAADCAVARFGASGG
        F+TSSLFAADCAVARFG+ GG
Subjt:  FKTSSLFAADCAVARFGASGG

KAG7020632.1 hypothetical protein SDJN02_17318, partial [Cucurbita argyrosperma subsp. argyrosperma]

2.69e-248

62.64

Show/hide

Query:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP
        S F++LVPL V V + VM +ATPPGIA NPSHA+CKIKKYKHCYNL HVCPKFCPDQCTVECASCKPICGGDA+ PPEDDPTPATPSPPS   + YYSPP
Subjt:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP

Query:  PP-----STPPVNPNP--------PT------TPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPS
        PP     S PP  P P        PT      +PP NP PPSTPP   YPP   NPP++PP +PN          PPT  TPS PPASPNPPSTPP +  
Subjt:  PP-----STPPVNPNP--------PT------TPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPS

Query:  PPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPP--STPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPT
          S PP N NPPS+PP +PNPP                +P+ PSTPP++PNPP  S PP + NPPS+PPTSPNPP+        PSTP ++PNP  TPPT
Subjt:  PPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPP--STPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPT

Query:  NPYPPAEPNPPATPSV----------NPNPPSTPPTSP--NPPSTPPVNPNPP--STPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNP-SPST
        + YPP   NPP+TP            NPNPPSTPPT    NPPS    NPNPP  S PP NP+PP               ++PNPPSTPPTSPNP +PST
Subjt:  NPYPPAEPNPPATPSV----------NPNPPSTPPTSP--NPPSTPPVNPNPP--STPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNP-SPST

Query:  PNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVT
        P++P                                   P  S PPGN   P+ + PPSSS GAAK+ VRCKN NYPQCYNM+HTCPSACP GC+VDCVT
Subjt:  PNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVT

Query:  CKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVN
        CKPVCHCDRPGAVCQDPRFIGGDGITFYFHG+KD+DFCLVSD NLHINAH IGKRNP+L RDFTWVQSLGIL + H++ I AQKTA WDDS+DRL +A++
Subjt:  CKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVN

Query:  GQPVALPESGGSQWQYPDENPTISVVRLAPANQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSR
          PVALPES GSQWQ+P ENPT+ +VRL  AN VMVEAKG+FRITAKVVPITE+DSR+H+YGI + DSFAHLD+GFKFF LS  V+GVLGQTYG  YVS 
Subjt:  GQPVALPESGGSQWQYPDENPTISVVRLAPANQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSR

Query:  VNLKAAMPVMGREKEFKTSSLFAADCAVARFGASGG
        VNLKAAMPVMGREKEF+TSSLFAADCAVARFG+ GG
Subjt:  VNLKAAMPVMGREKEFKTSSLFAADCAVARFGASGG

XP_022147747.1 formin-like protein 20 [Momordica charantia]

0.0

99.86

Show/hide

Query:  MACSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYY
        MACSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYY
Subjt:  MACSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYY

Query:  SPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPP
        SPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPP
Subjt:  SPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPP

Query:  ANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNP
        ANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNP
Subjt:  ANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNP

Query:  NPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPP
        NPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPP
Subjt:  NPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPP

Query:  PSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKK
        PSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKK
Subjt:  PSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKK

Query:  DRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQ
        DRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQ
Subjt:  DRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQ

Query:  VMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGA
        VMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEF+TSSLFAADCAVARFGA
Subjt:  VMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGA

Query:  SGGSGYEA
        SGGSGYEA
Subjt:  SGGSGYEA

XP_022952949.1 basic proline-rich protein [Cucurbita moschata]

8.66e-245

63.69

Show/hide

Query:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP
        S F++LVPL V V +  M +ATPPGIA NPSHA+CKIKKYKHCYNL HVCPKFCPDQCTVECASCKPICGGDA+ PPEDDPTPATPSPPS   + YYSPP
Subjt:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP

Query:  PPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPANP
        PP    V P+PP                   P+EP P  +PP    +P TP  +P+PPTNPTP         PSTPP +    S PP N NPPS+PP +P
Subjt:  PPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPANP

Query:  NPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNP
        NPP                +P+ PSTPPASPNPPSTPPT     S PP + NPPS+PPTSPNPP+ + P++PNP  TPPT+ YPP   NPP+TP  +PNP
Subjt:  NPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNP

Query:  PSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNP-SPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS
        P+        PSTP  +PNPPSTPPT+  PP  + PP  P PPP S PP +PNPPSTPPTSPNP +PSTP++P                           
Subjt:  PSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNP-SPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS

Query:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
                P  S PPGN   P+ + PPSSSAGAAK+ VRCKN NYPQCYNM+HTCPSACP GC+VDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
Subjt:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG

Query:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA
        +KD+DFCLVSD NLHINAH IGKRNP+L RDFTWVQSLGIL + H++ I AQKTA WDDS+DRL +A++  PVALPES GSQWQ+P ENPTI +VRL  A
Subjt:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA

Query:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF
        N VMVEAKG+FRITAKVVPITE+DSR+H+YGI + DSFAHLD+GFKFF LS  V+GVLGQTYG  YVS VNLKAAMPVMGREKEF+TSSLFAADCAVARF
Subjt:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF

Query:  GASGG
        G+ GG
Subjt:  GASGG

XP_022972442.1 mucin-2 [Cucurbita maxima]

5.91e-246

63.79

Show/hide

Query:  CSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSP
        CS F++LVPL V V + VM +ATPPGIA NPSHA+CKIKKYKHCYNL HVCPKFCPDQCTVECASCKPICGGDAN PPEDDPTPATPSPPS   + YYSP
Subjt:  CSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSP

Query:  PPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPAN
        PPP    V P+PP                   P+EP P  +PP    +P TP  +P+PPTNPTP         PSTPP +    S PP N NPPS+PP +
Subjt:  PPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPAN

Query:  PNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPN
        PNPP                +P+ PSTPPA+PNPPS+PPT     S PP + NPPS+PPTSPNPP+ + P++PNP  TPPT+ YPP   NPP+TP  +PN
Subjt:  PNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPN

Query:  PPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS
        PP+        PSTP  NPNPPSTPPT+  PP  + PP  P PPP S PP +PNPPSTP          P++P  SP P TPS TPS+P T+        
Subjt:  PPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS

Query:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
                   S PPGN   P+ + PPSSS GAAK+ VRCKN NYPQCYNM+HTCPSACP GC+VDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
Subjt:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG

Query:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA
        +KD+DFCLVSD NLHINAH IGKRNP+L RDFTWVQSLGIL + H++ I AQKTA WDDS+DRL +A+N  PVALPES GSQWQ+P ENPT+ +VRL  A
Subjt:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA

Query:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF
        N VMVEAKG+FRITAKVVPITE+DSR+H+YGI + DSFAHLD+GFKFF LS  V+GVLGQTYG  YVS VNLKAAMPVMGREKEF+TSSLFAADCAVA+F
Subjt:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF

Query:  GASGGSG
        G  GG G
Subjt:  GASGGSG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K2J8 Uncharacterized protein

1.19e-210

56.95

Show/hide

Query:  VVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGG---DANTPPEDDPTP-------------ATPSPPS----
        V+V + VMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCP+QC VECASCKPICG    DAN PPED PTP              TPSPP+    
Subjt:  VVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGG---DANTPPEDDPTP-------------ATPSPPS----

Query:  ----------------------PPSETYYSPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNP----PTNPTPS
                              PP     SPPPP TP  +P PP TP  +P PP TP  SP PP  P+P   PP  P+  P PPV P+P    P  P+PS
Subjt:  ----------------------PPSETYYSPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNP----PTNPTPS

Query:  MPPA-----SPNPPSTPPANPSPPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPT
         PP      SP PP TP  +P PP TP  +P PP TP  +P PP TP   P PPP  P  SP PP TP  SP PP TP  SP PP TP  SP PP TP  
Subjt:  MPPA-----SPNPPSTPPANPSPPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPT

Query:  SPNPPSTP----PASPNPHPTPPTNPYPPAEPNPPATPSVNPNPPSTPPTSPNPPSTP------PVNPNPPSTPPTNPSPPEIPPVKPYP----------
        SP PP TP    P +P+P P PP  P P   P PP TPS +P PP TP  SP PP TP      PV P+P   PP  PSP   PPV P P          
Subjt:  SPNPPSTP----PASPNPHPTPPTNPYPPAEPNPPATPSVNPNPPSTPPTSPNPPSTP------PVNPNPPSTPPTNPSPPEIPPVKPYP----------

Query:  -PPST----------PPASPNPPSTPPT----SPNPS-----PSTPNSPSLSPPPQT----PSETPS---SPSTN----TPPQPQPSPP-----------
         PP+T          PPA+PNPP +PPT    SP P      PS P  P++SPPP      PSE P+   SP TN    TPP+  P+PP           
Subjt:  -PPST----------PPASPNPPSTPPT----SPNPS-----PSTPNSPSLSPPPQT----PSETPS---SPSTN----TPPQPQPSPP-----------

Query:  -PSQPASPPR---SAPPGNAGEPT-------ASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGG
         P+ P++PP    ++PP N   P        AS+PPSSSAGA K+ VRCKN  YPQCYNM+H CPSACP GC+VDCVTCKPVCHCDRPGAVCQDPRF+GG
Subjt:  -PSQPASPPR---SAPPGNAGEPT-------ASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGG

Query:  DGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPT
        DGITFYFHGKKD+DFCLVSD NLHINAH IGKRNP+LKRDFTW++SL IL + H++ I AQKT  WDDS+DRL + ++  P+ALP S GSQ Q+P ENPT
Subjt:  DGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPT

Query:  ISVVRLAPANQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLF
        + +VRLA  N VMVEAKG+FRITAKVVPIT++DSRIHNYGI + DSFAHLD+GFKFF LS++V+GVLGQTYG  YVS +N+KAAM VMGR KEF+TSSLF
Subjt:  ISVVRLAPANQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLF

Query:  AADCAVARFGASG
        AADCAV+RFG  G
Subjt:  AADCAVARFGASG

A0A5A7SMM6 Proline-rich protein 36-like

2.57e-216

61.08

Show/hide

Query:  VVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGG---DANTPPEDDPTPATPSPPSPPSETYYSPPPPSTPPV
        V+V + VM E TPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCP+QC VECASCKPICG    DAN PPED+ TPA      PPS+TYYSPPPP    V
Subjt:  VVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGG---DANTPPEDDPTPATPSPPSPPSETYYSPPPPSTPPV

Query:  NPNPPTTPPANPNPPSTPPA-SPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPA-SPNPPSTPPANPSPPSTPP-ANPNPPSTPPANPNPPA
         P+PP +   NP+P  +PP  SP P               +P TP  +P PP + TPS PP  SP PP T        STPP AN NPP +PP N  P  
Subjt:  NPNPPTTPPANPNPPSTPPA-SPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPA-SPNPPSTPPANPSPPSTPP-ANPNPPSTPPANPNPPA

Query:  TPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNPP--ST
         PP       + PP++P PP+    SP PP T        STPP+          +PNPP +PP +  P P PPT+  PP+ P PP   +V+P PP  ST
Subjt:  TPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNPP--ST

Query:  PPT-SPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPN-PSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPPPSQ
        PP+ +PNPP++PP N +PPSTPP NP+PPE        PPSTPP +PN PSTPP++PN PSP+ P+    SPP  TPS  PS+P+      P P+PP   
Subjt:  PPT-SPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPN-PSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPPPSQ

Query:  PASPPRSAP--PGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKKD
        P SPP + P  P     P AS+PPSSSAGA K  VRCKNVNYPQCYNM+H CPSACP GC+VDCVTCKPVCHCDRPGAVCQDPR +GGDGITFYFHGKKD
Subjt:  PASPPRSAP--PGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKKD

Query:  RDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQV
        +DFCLVSD NLHINAH IGKRNP+LKRDFTWVQSL IL + H++ I AQKT  WDDS+DRL + ++  P+ALP S GSQ Q+P ENPTI++VRLA  N V
Subjt:  RDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQV

Query:  MVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGAS
        MVEAKG+FRITAKVVPIT++DSRIHNYGI + DSFAHLD+GFKFF LSD+V+GVLGQTYG  YVS +N+KAAM VMGR +EF+TSSLFAADCAV+RFG +
Subjt:  MVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGAS

Query:  GGSG
        GG G
Subjt:  GGSG

A0A6J1D382 formin-like protein 20

0.0

99.86

Show/hide

Query:  MACSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYY
        MACSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYY
Subjt:  MACSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYY

Query:  SPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPP
        SPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPP
Subjt:  SPPPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPP

Query:  ANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNP
        ANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNP
Subjt:  ANPNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNP

Query:  NPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPP
        NPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPP
Subjt:  NPPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPP

Query:  PSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKK
        PSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKK
Subjt:  PSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKK

Query:  DRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQ
        DRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQ
Subjt:  DRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQ

Query:  VMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGA
        VMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEF+TSSLFAADCAVARFGA
Subjt:  VMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGA

Query:  SGGSGYEA
        SGGSGYEA
Subjt:  SGGSGYEA

A0A6J1GN96 basic proline-rich protein

4.19e-245

63.69

Show/hide

Query:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP
        S F++LVPL V V +  M +ATPPGIA NPSHA+CKIKKYKHCYNL HVCPKFCPDQCTVECASCKPICGGDA+ PPEDDPTPATPSPPS   + YYSPP
Subjt:  SAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPP

Query:  PPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPANP
        PP    V P+PP                   P+EP P  +PP    +P TP  +P+PPTNPTP         PSTPP +    S PP N NPPS+PP +P
Subjt:  PPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPANP

Query:  NPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNP
        NPP                +P+ PSTPPASPNPPSTPPT     S PP + NPPS+PPTSPNPP+ + P++PNP  TPPT+ YPP   NPP+TP  +PNP
Subjt:  NPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNP

Query:  PSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNP-SPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS
        P+        PSTP  +PNPPSTPPT+  PP  + PP  P PPP S PP +PNPPSTPPTSPNP +PSTP++P                           
Subjt:  PSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNP-SPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS

Query:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
                P  S PPGN   P+ + PPSSSAGAAK+ VRCKN NYPQCYNM+HTCPSACP GC+VDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
Subjt:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG

Query:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA
        +KD+DFCLVSD NLHINAH IGKRNP+L RDFTWVQSLGIL + H++ I AQKTA WDDS+DRL +A++  PVALPES GSQWQ+P ENPTI +VRL  A
Subjt:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA

Query:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF
        N VMVEAKG+FRITAKVVPITE+DSR+H+YGI + DSFAHLD+GFKFF LS  V+GVLGQTYG  YVS VNLKAAMPVMGREKEF+TSSLFAADCAVARF
Subjt:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF

Query:  GASGG
        G+ GG
Subjt:  GASGG

A0A6J1I4T7 mucin-2

2.86e-246

63.79

Show/hide

Query:  CSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSP
        CS F++LVPL V V + VM +ATPPGIA NPSHA+CKIKKYKHCYNL HVCPKFCPDQCTVECASCKPICGGDAN PPEDDPTPATPSPPS   + YYSP
Subjt:  CSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSP

Query:  PPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPAN
        PPP    V P+PP                   P+EP P  +PP    +P TP  +P+PPTNPTP         PSTPP +    S PP N NPPS+PP +
Subjt:  PPPSTPPVNPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPAN

Query:  PNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPN
        PNPP                +P+ PSTPPA+PNPPS+PPT     S PP + NPPS+PPTSPNPP+ + P++PNP  TPPT+ YPP   NPP+TP  +PN
Subjt:  PNPPATPPVKPYPPPSMPPASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPS-TPPASPNPHPTPPTNPYPPAEPNPPATPSVNPN

Query:  PPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS
        PP+        PSTP  NPNPPSTPPT+  PP  + PP  P PPP S PP +PNPPSTP          P++P  SP P TPS TPS+P T+        
Subjt:  PPSTPPTSPNPPSTPPVNPNPPSTPPTNPSPP--EIPPVKPYPPP-STPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPS

Query:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
                   S PPGN   P+ + PPSSS GAAK+ VRCKN NYPQCYNM+HTCPSACP GC+VDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG
Subjt:  PPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHG

Query:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA
        +KD+DFCLVSD NLHINAH IGKRNP+L RDFTWVQSLGIL + H++ I AQKTA WDDS+DRL +A+N  PVALPES GSQWQ+P ENPT+ +VRL  A
Subjt:  KKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPA

Query:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF
        N VMVEAKG+FRITAKVVPITE+DSR+H+YGI + DSFAHLD+GFKFF LS  V+GVLGQTYG  YVS VNLKAAMPVMGREKEF+TSSLFAADCAVA+F
Subjt:  NQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARF

Query:  GASGGSG
        G  GG G
Subjt:  GASGGSG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G19430.1 late embryogenesis abundant protein-related / LEA protein-related

7.4e-114

46.33

Show/hide

Query:  TPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPPPPSTPPVNPNPPTTPPANPNP
        TPPGIA NPSHATCKIKKYKHCYNL HVCPKFCPD C VECASCKPICG     PP   P        S   +  Y+PP P  PPV+P PPT        
Subjt:  TPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPPPPSTPPVNPNPPTTPPANPNP

Query:  PSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASP
        PS P  SP PP  P PP   P+ P+  PTPPV+P PPT PTPS+P  SP PP +PP              PP+  P+ P+P  TPPV P PPP+  P+ P
Subjt:  PSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMPPASP

Query:  NPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNPPSTPPTSPNPPSTPPVNPNPPS
        +P  TPP         PT P P   PP SP PP+  P+ P+PP          PTPPT       P+ P+ P V P PP+  P+ P+PP   P  P PPS
Subjt:  NPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNPPSTPPTSPNPPSTPPVNPNPPS

Query:  TPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPPPSQPASPPRSAPPGNAGEPTASSP
         P  + SPP +PP                                                                                      P
Subjt:  TPPTNPSPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPPPSQPASPPRSAPPGNAGEPTASSP

Query:  PSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNP
              A  K+VRCK    P CY + +TCP+ CP  C+VDCVTCKPVC+CD+PG+VCQDPRFIGGDG+TFYFHGKKD +FCL+SD NLHINAH IGKR  
Subjt:  PSSSAGAAKKKVRCKNVNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNP

Query:  NLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQW-QYPDENPTISVVRL-APANQVMVEAKGIFRITAKVVPITEQD
         + RDFTWVQS+ IL   H++++GA KTA WDDSVDR+AV+ +G  ++LP+  G++W   P   P +SV R+    N + VE +G+ +ITA+VVPIT +D
Subjt:  NLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQW-QYPDENPTISVVRL-APANQVMVEAKGIFRITAKVVPITEQD

Query:  SRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGASGGS
        SRIH Y + ++D  AHLDLGFKF  LSD V GVLGQTY   YVSRV +   MPVMG ++EF+T+ LFA DC+ ARF  +G S
Subjt:  SRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGASGGS

AT5G54370.1 Late embryogenesis abundant (LEA) protein-related

5.4e-64

43.97

Show/hide

Query:  VRCKNVNYPQCYNMVHTCPSACPAG---------CEVDC--VTCKPVC-----HCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLI
        V C N  Y +CY     CP  CP+          C  DC   TCK  C     +C+RPG+ C DPRFIGGDGI FYFHGK + +F LVSDS+L IN   I
Subjt:  VRCKNVNYPQCYNMVHTCPSACPAG---------CEVDC--VTCKPVC-----HCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLI

Query:  GKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQVMVEAKGIFRITAKVVPIT
        G R     RDFTW+Q+LG L + ++  + A KTA+WD+ +D L  + +GQ +++PE   S W  P  N  I + R++  N V+V  K    I   VVP+T
Subjt:  GKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQVMVEAKGIFRITAKVVPIT

Query:  EQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGAS
        ++D RIH+Y +  +D FAHL++ F+FF+LS +V G+LG+TY P++ +      AMPV+G E  FKTSSL + DC    F  S
Subjt:  EQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGAS

AT5G60520.1 Late embryogenesis abundant (LEA) protein-related

2.6e-66

43.84

Show/hide

Query:  GAAKKKVRCKNVNYPQCYNMVHTCPSACP----------AGCEVDC-----VTCK-PVCHCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLH
        G+ +++V+C  +    C   + TCP  CP            C +DC     VTCK    +C+  G++C DPRF+GGDG+ FYFHG KD +F +VSD NL 
Subjt:  GAAKKKVRCKNVNYPQCYNMVHTCPSACP----------AGCEVDC-----VTCK-PVCHCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLH

Query:  INAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQVMVEAKGIFRITA
        INAH IG R     RDFTWVQ+  ++ D H + I A+K A+WDDSVD L V  NG+ V +P  G ++W+   +   + V R    N V V   GI +I  
Subjt:  INAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQKTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQVMVEAKGIFRITA

Query:  KVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGASGGSG
        +V PI +++ R+H Y + K+D+FAHL+  FKFF+LSD V GVLG+TY P YVS V     MP+MG E +++T SLF+  C V RF    G G
Subjt:  KVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTYGPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGASGGSG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTTGTTCTGCTTTTCAGCTTCTTGTGCCACTGGCTGTGGTCGTGGCGATGGCGGTGATGGTGGAGGCGACGCCGCCGGGGATTGCTAACAATCCGAGCCATGCAAC
GTGCAAGATTAAGAAGTATAAACATTGTTATAATTTGGTTCATGTTTGTCCTAAGTTTTGCCCTGATCAATGTACTGTTGAATGTGCCTCTTGTAAGCCTATATGTGGTG
GTGATGCCAATACTCCTCCGGAGGATGATCCCACTCCGGCCACCCCCTCGCCGCCATCTCCTCCTTCTGAGACTTATTACTCGCCCCCACCTCCGTCAACACCTCCGGTG
AACCCCAACCCTCCGACAACACCTCCAGCAAATCCCAACCCTCCATCAACCCCTCCAGCGAGTCCCTACCCACCGGCGGAACCCAACCCTCCAGCAACACCTCCAGCAAA
TCCCAATTCTCCACCAACGCCCCCGGTGAATCCCAACCCCCCAACAAACCCTACTCCTTCAATGCCTCCGGCAAGTCCAAACCCCCCGTCAACGCCACCTGCGAATCCCA
GCCCTCCATCAACGCCACCAGCGAATCCCAACCCTCCATCAACGCCACCAGCGAATCCCAACCCTCCCGCAACGCCTCCCGTGAAACCTTACCCTCCTCCTTCAATGCCT
CCGGCAAGTCCCAACCCTCCTTCAACCCCTCCGGCAAGTCCCAACCCTCCTTCGACGCCTCCGACGAGTCCCAACCCACCTTCGACGCCTCCGACGAGTCCCAACCCACC
TTCGACGCCTCCGACGAGTCCCAACCCGCCTTCGACGCCTCCGGCGAGTCCCAACCCTCATCCAACCCCTCCAACAAATCCCTACCCACCGGCAGAACCCAACCCTCCAG
CAACGCCCTCGGTGAATCCAAACCCTCCATCAACGCCTCCAACGAGTCCAAACCCTCCGTCAACACCTCCGGTGAATCCCAACCCTCCATCAACACCACCAACGAATCCC
AGCCCTCCGGAAATACCTCCCGTGAAACCTTACCCTCCTCCTTCAACACCTCCAGCGAGTCCCAACCCTCCTTCAACACCTCCGACGAGTCCCAACCCATCACCATCCAC
TCCAAATTCTCCATCACTGTCGCCTCCTCCACAGACGCCATCAGAAACTCCTAGCTCCCCAAGTACTAACACTCCTCCCCAGCCGCAGCCTTCTCCACCACCATCTCAGC
CAGCTTCCCCACCACGATCAGCTCCTCCTGGTAATGCTGGGGAACCAACAGCTTCATCTCCACCATCTTCTTCGGCCGGTGCAGCAAAAAAGAAAGTCAGATGCAAAAAT
GTGAATTATCCTCAATGTTATAACATGGTTCACACTTGTCCCAGCGCCTGCCCTGCTGGATGTGAAGTCGATTGCGTTACTTGCAAACCTGTCTGCCATTGTGACAGACC
AGGAGCAGTATGTCAAGACCCACGTTTCATCGGCGGCGACGGCATCACCTTCTACTTCCACGGCAAGAAAGATCGAGATTTCTGCCTGGTTTCAGATTCCAACCTCCACA
TCAACGCCCATCTGATCGGAAAACGAAACCCCAACTTAAAAAGAGACTTCACATGGGTCCAATCCCTCGGAATCCTCATCGACGGTCACCAGATCTTCATCGGAGCCCAA
AAAACCGCCGCCTGGGACGATTCTGTTGACCGCCTCGCCGTCGCCGTGAACGGCCAGCCGGTGGCCCTCCCTGAATCCGGAGGCAGCCAGTGGCAGTACCCCGACGAAAA
TCCGACCATCTCCGTCGTCCGGCTGGCTCCGGCGAACCAGGTGATGGTGGAAGCGAAGGGGATTTTCAGAATCACGGCCAAGGTGGTTCCGATAACGGAACAGGATTCGC
GGATTCACAACTATGGAATAACGAAAGAGGATTCGTTTGCCCACTTGGATTTGGGGTTCAAATTTTTCTCGCTGAGCGATGAAGTGAGCGGCGTGTTAGGGCAAACGTAC
GGCCCTGAGTATGTGAGTCGCGTAAATCTGAAGGCGGCAATGCCGGTGATGGGGAGGGAGAAGGAGTTCAAAACGTCGAGCCTGTTCGCGGCGGACTGCGCGGTGGCAAG
ATTTGGCGCCAGCGGTGGCAGCGGCTATGAGGCG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MACSAFQLLVPLAVVVAMAVMVEATPPGIANNPSHATCKIKKYKHCYNLVHVCPKFCPDQCTVECASCKPICGGDANTPPEDDPTPATPSPPSPPSETYYSPPPPSTPPV
NPNPPTTPPANPNPPSTPPASPYPPAEPNPPATPPANPNSPPTPPVNPNPPTNPTPSMPPASPNPPSTPPANPSPPSTPPANPNPPSTPPANPNPPATPPVKPYPPPSMP
PASPNPPSTPPASPNPPSTPPTSPNPPSTPPTSPNPPSTPPTSPNPPSTPPASPNPHPTPPTNPYPPAEPNPPATPSVNPNPPSTPPTSPNPPSTPPVNPNPPSTPPTNP
SPPEIPPVKPYPPPSTPPASPNPPSTPPTSPNPSPSTPNSPSLSPPPQTPSETPSSPSTNTPPQPQPSPPPSQPASPPRSAPPGNAGEPTASSPPSSSAGAAKKKVRCKN
VNYPQCYNMVHTCPSACPAGCEVDCVTCKPVCHCDRPGAVCQDPRFIGGDGITFYFHGKKDRDFCLVSDSNLHINAHLIGKRNPNLKRDFTWVQSLGILIDGHQIFIGAQ
KTAAWDDSVDRLAVAVNGQPVALPESGGSQWQYPDENPTISVVRLAPANQVMVEAKGIFRITAKVVPITEQDSRIHNYGITKEDSFAHLDLGFKFFSLSDEVSGVLGQTY
GPEYVSRVNLKAAMPVMGREKEFKTSSLFAADCAVARFGASGGSGYEA

MC04g0565 (gene) of Bitter gourd (Dali-11) v1 genome