CuGenDBv2

Gene ID	Spg028937
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Filamentous hemagglutinin
Genome location	scaffold5:15650209..15656370
RNA-Seq Expression	Spg028937
Synteny	Spg028937
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0053895.1 Filamentous hemagglutinin [Cucumis melo var. makuwa]

5.0e-226

80.51

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSSELSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL
        HIFELEDNIFGEIP+P VK                           VAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRL
Subjt:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL

Query:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGA
        N SLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS +ENLYV LSNERGSTMDAPT+VQSSVLMAIG 
Subjt:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGA

Query:  NL--TKQRLKQLAQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHH---HHHHHHHQHHHHHHHDAAY
        NL  +KQRLKQLA TITNSHSGNLGLNNT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHH   HHHHHHH HHH+HH  AAY
Subjt:  NL--TKQRLKQLAQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHH---HHHHHHHQHHHHHHHDAAY

Query:  SPSPGIEEHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVL
        SPSPG EEHKHAPKNGVSSAPEAGSSPME PTS++RNYEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASSPLSGVVL
Subjt:  SPSPGIEEHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVL

Query:  SSVQPPDKGSRHAENFERSAPSVLAPQFSCEY-------IMSSLILTLF
        S+VQPP+ GS HAENFERS+PSVL PQFSCEY       I+S LIL  F
Subjt:  SSVQPPDKGSRHAENFERSAPSVLAPQFSCEY-------IMSSLILTLF

XP_004136773.3 uncharacterized protein LOC101213172 isoform X1 [Cucumis sativus]

3.6e-224

86.17

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVG SSSELSDRNV +RCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHA KPV FL+ 
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSLGGPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS +ENLYV LSNERGST+DAPT+VQSSVLMAIG NL  +KQRLKQLA TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMES
        NT+FGKVKQVRL S LNH+LGGGG+ARSPSPAPLPHSHH+ HHHHHHHHHHHHHHHH  HHHHHH DAAYSPSPG EEHKHAPKNGVSSAPEAGSSPME 
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMES

Query:  PTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS
        PTS++RNYEATPPA +YG KRS TK+RKH+ LGPIPSPSS P SPYLRVG P PVSDS+SASSPLSGVVLS+VQPP+ GS HAENFERS+PSVL PQFS
Subjt:  PTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS

XP_008443610.1 PREDICTED: uncharacterized protein LOC103487165 [Cucumis melo]

1.6e-227

83.33

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSSELSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS +ENLYV LSNERGSTMDAPT+VQSSVLMAIG NL  +KQRLKQLA TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHH-----------------------DAAYSPSPGIE
        NT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHHHHHHHHH HHHHHHH                        AAYSPSPG E
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHH-----------------------DAAYSPSPGIE

Query:  EHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD
        EHKHAPKNGVSSAPEAGSSPME PTS++RNYEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASSPLSGVVLS+VQPP+
Subjt:  EHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD

Query:  KGSRHAENFERSAPSVLAPQFS
         GS HAENFERS+PSVL PQFS
Subjt:  KGSRHAENFERSAPSVLAPQFS

XP_022147793.1 TSC22 domain family protein 1-like isoform X1 [Momordica charantia]

1.7e-213

82.7

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGK++EEQPLPVG+SSSELSD NV SRCG G     RRLIAVRCVFFLLLSAAVF+SA FWLPPFLS GDWPDR+LDSAYRDH+IVASFHAWKPVSFL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HI ELEDNIFGEIPVPFVKV ILSLQSLGG N+TKIVFAVDPD KYSK+P TSQSLIK  FET+ INE PL L A+LFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNFDDLTSQLRSGLHLS +ENLYV LSN RGST+DAPTI+QSSVLMAIG N +K+RLKQLAQTIT+SHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMESPT
        IFGKVKQVRLSSVLNH+L GG +ARSP+P+PLPHSHH+HHHHHHHHHHHHHH     HHHHHHHDA+YSPSPG EEH H P NGVSSAP  GS+P+ESPT
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMESPT

Query:  SKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS
         K+RN EATPPACQYG KRSST+VRK  +LGPI S SSPP SPY RVG P PVS S+SASSPLS VVLS+VQPPDKGSRHAENFER APSVL  QFS
Subjt:  SKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS

XP_022983747.1 uncharacterized protein LOC111482272 isoform X2 [Cucurbita maxima]

2.2e-213

81.32

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSSELSD  V SRCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD++ DS YRDH+IVA F A KPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPFVKVA+LSLQSLGG N+T I+F+VDPD KYSK+P TSQSLIK TFETLVIN+ PLRLNASLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNF+DLTSQLRSGL LS +ENLYV LSNERGSTM APTIVQSSVLMAIG N + QRLKQLAQTITNSHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS-------HHNHHHHHH-----HHHHHHHHHHHHQHHHHHHH-----DAAYSPSPGIEEHKHAPKN
        +FGKVKQVRLSSVLNH+L  GG ARSPSPAPLPHS       HH+HHHHHH     HHHHHHHHHHHH HHHHHHH     DAAYSPSPG EEHKHAPKN
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS-------HHNHHHHHH-----HHHHHHHHHHHHQHHHHHHH-----DAAYSPSPGIEEHKHAPKN

Query:  GVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN
        G+SSAPEAGSSP+ESP SK+RNYEATPP  +YG K  STKVRK S+LG IPSPSSPP SPYLRVGLP PV+ S+SASSPL GV LS+VQPP+KG      
Subjt:  GVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN

Query:  FERSAPSVLAPQFS
         +RSAPSVL PQFS
Subjt:  FERSAPSVLAPQFS

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LHD1 Uncharacterized protein

6.2e-222

84.57

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVG SSSELSDRNV +RCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHA KPV FL+ 
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSLGGPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS +ENLYV LSNERGST+DAPT+VQSSVLMAIG NL  +KQRLKQLA TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMES
        NT+FGKVKQVRL S LNH+LGGGG+ARSPSPAPLPHSHH+ HHHHHHHH          HHHHHH DAAYSPSPG EEHKHAPKNGVSSAPEAGSSPME 
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMES

Query:  PTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS
        PTS++RNYEATPPA +YG KRS TK+RKH+ LGPIPSPSS P SPYLRVG P PVSDS+SASSPLSGVVLS+VQPP+ GS HAENFERS+PSVL PQFS
Subjt:  PTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS

A0A1S3B8E9 uncharacterized protein LOC103487165

7.5e-228

83.33

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSSELSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS +ENLYV LSNERGSTMDAPT+VQSSVLMAIG NL  +KQRLKQLA TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLAQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHH-----------------------DAAYSPSPGIE
        NT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHHHHHHHHH HHHHHHH                        AAYSPSPG E
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHH-----------------------DAAYSPSPGIE

Query:  EHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD
        EHKHAPKNGVSSAPEAGSSPME PTS++RNYEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASSPLSGVVLS+VQPP+
Subjt:  EHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD

Query:  KGSRHAENFERSAPSVLAPQFS
         GS HAENFERS+PSVL PQFS
Subjt:  KGSRHAENFERSAPSVLAPQFS

A0A5A7UJM2 Filamentous hemagglutinin

2.4e-226

80.51

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSSELSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL
        HIFELEDNIFGEIP+P VK                           VAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRL
Subjt:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL

Query:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGA
        N SLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS +ENLYV LSNERGSTMDAPT+VQSSVLMAIG 
Subjt:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGA

Query:  NL--TKQRLKQLAQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHH---HHHHHHHQHHHHHHHDAAY
        NL  +KQRLKQLA TITNSHSGNLGLNNT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHH   HHHHHHH HHH+HH  AAY
Subjt:  NL--TKQRLKQLAQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHH---HHHHHHHQHHHHHHHDAAY

Query:  SPSPGIEEHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVL
        SPSPG EEHKHAPKNGVSSAPEAGSSPME PTS++RNYEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASSPLSGVVL
Subjt:  SPSPGIEEHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVL

Query:  SSVQPPDKGSRHAENFERSAPSVLAPQFSCEY-------IMSSLILTLF
        S+VQPP+ GS HAENFERS+PSVL PQFSCEY       I+S LIL  F
Subjt:  SSVQPPDKGSRHAENFERSAPSVLAPQFSCEY-------IMSSLILTLF

A0A6J1D2A3 TSC22 domain family protein 1-like isoform X1

8.1e-214

82.7

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGK++EEQPLPVG+SSSELSD NV SRCG G     RRLIAVRCVFFLLLSAAVF+SA FWLPPFLS GDWPDR+LDSAYRDH+IVASFHAWKPVSFL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HI ELEDNIFGEIPVPFVKV ILSLQSLGG N+TKIVFAVDPD KYSK+P TSQSLIK  FET+ INE PL L A+LFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNFDDLTSQLRSGLHLS +ENLYV LSN RGST+DAPTI+QSSVLMAIG N +K+RLKQLAQTIT+SHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMESPT
        IFGKVKQVRLSSVLNH+L GG +ARSP+P+PLPHSHH+HHHHHHHHHHHHHH     HHHHHHHDA+YSPSPG EEH H P NGVSSAP  GS+P+ESPT
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMESPT

Query:  SKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS
         K+RN EATPPACQYG KRSST+VRK  +LGPI S SSPP SPY RVG P PVS S+SASSPLS VVLS+VQPPDKGSRHAENFER APSVL  QFS
Subjt:  SKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFS

A0A6J1J074 uncharacterized protein LOC111482272 isoform X2

1.1e-213

81.32

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSSELSD  V SRCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD++ DS YRDH+IVA F A KPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPFVKVA+LSLQSLGG N+T I+F+VDPD KYSK+P TSQSLIK TFETLVIN+ PLRLNASLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNF+DLTSQLRSGL LS +ENLYV LSNERGSTM APTIVQSSVLMAIG N + QRLKQLAQTITNSHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS-------HHNHHHHHH-----HHHHHHHHHHHHQHHHHHHH-----DAAYSPSPGIEEHKHAPKN
        +FGKVKQVRLSSVLNH+L  GG ARSPSPAPLPHS       HH+HHHHHH     HHHHHHHHHHHH HHHHHHH     DAAYSPSPG EEHKHAPKN
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS-------HHNHHHHHH-----HHHHHHHHHHHHQHHHHHHH-----DAAYSPSPGIEEHKHAPKN

Query:  GVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN
        G+SSAPEAGSSP+ESP SK+RNYEATPP  +YG K  STKVRK S+LG IPSPSSPP SPYLRVGLP PV+ S+SASSPL GV LS+VQPP+KG      
Subjt:  GVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN

Query:  FERSAPSVLAPQFS
         +RSAPSVL PQFS
Subjt:  FERSAPSVLAPQFS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G10790.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT3G56590.2)

3.8e-38

33.03

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGC-CVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLE
        M K  +E  L +   + +L +     R  G  C   F RL+ +RC+  L+LS A+ LSAIFWL P  S  ++  ++  +   +  + ASF   KPVS + 
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGC-CVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLE

Query:  NHIFELEDNIFGEIPVP-FVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPP
         H  ++E +I   I +    KV +LSL   G  N T + FAV P     ++   S SL++ +F  L    + L+L  S FG  + F+VLKFPGGIT+ P 
Subjt:  NHIFELEDNIFGEIPVP-FVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPP

Query:  QSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLN
        + A +   A + F+ T+  SI  +Q   D L       L L  +E+++ +L+N++GST+  P   Q  V   +   L  QRL    Q I  S + NLGL+
Subjt:  QSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAP
          +FG+VK +  S+ L+  +       +P+P P
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAP

AT3G10810.1 zinc finger (C3HC4-type RING finger) family protein

2.7e-89

46.35

Show/hide

Query:  MGKSDEEQPLPV--GVSSSELSDRNVVSRCGGGGCCVF-RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSF
        MGK++++  L V  G ++ + + RN  +RC   GCC +    +  +C+F LLLS A+FLSA+F L PF    D  D +LD  +R H IVASF   +  SF
Subjt:  MGKSDEEQPLPV--GVSSSELSDRNVVSRCGGGGCCVF-RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSF

Query:  LENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIP
        L  +  +L+++IF E+    +KV IL+++     NITK+VF +DPD  Y ++   S S IK  FE+++IN++ L+L  SLFG T LFEVLKFPGGIT+IP
Subjt:  LENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIP

Query:  PQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGL
        PQSAF LQ  +I FNFTLNYSI+QIQ+NF+ L SQL++GL+L+ +ENLYV LSN  GST+  PT V SSVL+ +G + +  RLKQL  TIT S S NLGL
Subjt:  PQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGL

Query:  NNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPME
        NNTIFGKVKQVRLSS L ++     S +SPSP+P PHS    HHHHHHHHHHHHHHHHH HHHHHHH+              +PK     APE       
Subjt:  NNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPME

Query:  SPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDS--MSASSPLSGVVLS-SVQPPDKGSRHAENFERSAPSVLAP
        +P   ++   + PP C  G +    + R      P P+PS+  P   L    PI  + S  +  S+PL  VV + + QPP    R     E + P    P
Subjt:  SPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDS--MSASSPLSGVVLS-SVQPPDKGSRHAENFERSAPSVLAP

Query:  QFSCEYI
        Q S   I
Subjt:  QFSCEYI

AT3G56590.1 hydroxyproline-rich glycoprotein family protein

1.8e-96

46.79

Show/hide

Query:  MGKSD-EEQPLPVGVSSSELSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG    CC        ++RCV  L  SAAVFLSA+FWLPPFL + D  D  LD  ++DH IVASF   K
Subjt:  MGKSD-EEQPLPVGVSSSELSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK

Query:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI
        P+SF+E+++ +LE++I  EI  P  KV +L+L+ LG  N T ++FA+DP+ + SK+P+  +SLIK  FETLV  +   RL  SLFG    FEVLKFPGGI
Subjt:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI

Query:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSG
        T+IPPQ  F LQ AQ+ FNFTLN+SIYQIQ NF++L SQL+ G++L+ +ENLY+ LSN RGST+  PTIV SSVL+  G++    RLKQLAQTIT+SHS 
Subjt:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSG

Query:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGS
        NLGLN+T+FGKVKQVRLSS+L H+     ++ +PSP+P P +              H + HHH HHHHHHH+ A  PS               S P  G 
Subjt:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGS

Query:  SPMESPTSKQRNYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS
        +P  +PT         PP C Y  +R        H    P P+P    P P      P P   ++  SSPL  VV + + PP K S  +E     +PS
Subjt:  SPMESPTSKQRNYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS

AT3G56590.2 hydroxyproline-rich glycoprotein family protein

1.8e-96

46.79

Show/hide

Query:  MGKSD-EEQPLPVGVSSSELSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG    CC        ++RCV  L  SAAVFLSA+FWLPPFL + D  D  LD  ++DH IVASF   K
Subjt:  MGKSD-EEQPLPVGVSSSELSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK

Query:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI
        P+SF+E+++ +LE++I  EI  P  KV +L+L+ LG  N T ++FA+DP+ + SK+P+  +SLIK  FETLV  +   RL  SLFG    FEVLKFPGGI
Subjt:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI

Query:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSG
        T+IPPQ  F LQ AQ+ FNFTLN+SIYQIQ NF++L SQL+ G++L+ +ENLY+ LSN RGST+  PTIV SSVL+  G++    RLKQLAQTIT+SHS 
Subjt:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSG

Query:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGS
        NLGLN+T+FGKVKQVRLSS+L H+     ++ +PSP+P P +              H + HHH HHHHHHH+ A  PS               S P  G 
Subjt:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGS

Query:  SPMESPTSKQRNYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS
        +P  +PT         PP C Y  +R        H    P P+P    P P      P P   ++  SSPL  VV + + PP K S  +E     +PS
Subjt:  SPMESPTSKQRNYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGAAGAGCGACGAAGAACAGCCGCTGCCGGTTGGAGTGAGTTCCTCTGAGCTTTCTGACCGGAATGTGGTGAGTCGATGCGGCGGCGGTGGGTGCTGTGTGTTTCG
TAGACTGATTGCGGTGAGATGTGTCTTCTTTCTGCTACTGTCGGCGGCTGTGTTTCTTTCTGCTATCTTTTGGCTGCCGCCGTTCCTCTCTTATGGTGATTGGCCGGATC
GGAGTCTTGATTCTGCTTATAGAGATCATGATATAGTAGCAAGTTTTCATGCTTGGAAGCCAGTTTCTTTTCTGGAAAACCATATTTTTGAGCTTGAGGATAACATTTTT
GGAGAAATACCCGTACCTTTTGTCAAGGTGGCAATCCTATCACTACAATCATTAGGTGGACCAAACATAACAAAAATTGTTTTTGCAGTAGATCCTGATGTCAAGTATTC
AAAAGTTCCCTCAACTTCTCAAAGTTTAATCAAGGGAACCTTTGAAACATTGGTTATAAATGAAGCACCTCTCAGATTGAATGCATCATTATTTGGCAATACATCCTTAT
TTGAGGTGTTGAAATTTCCTGGAGGAATAACTATAATTCCTCCTCAGAGTGCATTTCTTCTGCAGACAGCACAGATCGATTTCAACTTTACGTTAAATTATTCTATTTAT
CAAATTCAAGTGAATTTTGATGATCTTACCAGCCAGCTGAGGTCAGGATTACATCTATCTCATCATGAGAATTTATATGTCAGACTATCAAATGAAAGAGGTTCAACAAT
GGATGCCCCCACTATTGTTCAGTCATCTGTTCTGATGGCAATTGGGGCTAATTTAACGAAACAAAGGCTAAAACAATTGGCTCAAACCATCACAAATTCTCATTCAGGAA
ACCTTGGCCTGAACAACACTATATTTGGTAAGGTCAAGCAAGTTCGTCTTTCATCGGTACTAAACCACACTCTTGGTGGAGGTGGAAGTGCACGGTCACCTTCGCCTGCT
CCTCTGCCTCATTCTCACCACAACCACCACCACCACCATCACCACCACCACCACCACCATCACCACCATCACCACCACCAACACCATCACCACCACCACCATGATGCTGC
GTATTCACCAAGTCCTGGAATAGAGGAGCACAAACATGCACCGAAGAATGGGGTCTCATCTGCTCCTGAAGCTGGTTCATCCCCAATGGAAAGTCCCACTTCAAAGCAAA
GAAACTATGAAGCAACTCCGCCTGCTTGTCAATATGGATGTAAAAGATCTTCAACAAAAGTCAGAAAACACTCATATTTAGGCCCTATTCCTTCACCAAGCAGTCCTCCA
CCATCACCATACTTACGAGTAGGCCTGCCAATACCTGTCTCTGATTCAATGTCTGCTTCAAGTCCACTGTCAGGGGTAGTTCTATCTAGTGTACAGCCTCCAGATAAAGG
CAGCAGACATGCAGAAAATTTTGAAAGAAGTGCCCCTTCAGTTTTAGCACCACAATTTTCTTGTGAGTATATAATGTCATCCCTCATTCTCACATTATTTCACAGCTTGT
TTACCTTGACTTTCTCTTCATCAGGAGACTTTTCCTTTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGKSDEEQPLPVGVSSSELSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLENHIFELEDNIF
GEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIY
QIQVNFDDLTSQLRSGLHLSHHENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLAQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPA
PLPHSHHNHHHHHHHHHHHHHHHHHHQHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEAGSSPMESPTSKQRNYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPP
PSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFSCEYIMSSLILTLFHSLFTLTFSSSGDFSF

Spg028937 (gene) of Sponge gourd (cylindrica) v1 genome