CuGenDBv2

Gene ID	Lag0026287
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Filamentous hemagglutinin
Genome location	chr10:33980626..33987490
RNA-Seq Expression	Lag0026287
Synteny	Lag0026287
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0053895.1 Filamentous hemagglutinin [Cucumis melo var. makuwa]

1.7e-217

80.74

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL
        HIFELEDNIFGEIP+P VK                           VAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRL
Subjt:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL

Query:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGA
        N SLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYV LSNERGSTMDAPT+VQSSVLMAIG 
Subjt:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGA

Query:  NL--TKQRLKQLTQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
        NL  +KQRLKQL  TITNSHSGNLGLNNT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHHHH HHHHHHHHHHH+HH H   
Subjt:  NL--TKQRLKQLTQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH

Query:  HHHDAAYSPSPGIEEHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASS
            AAYSPSPG EEHKHAPKNGVSSAPEA SSPME PTS++R YEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASS
Subjt:  HHHDAAYSPSPGIEEHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASS

Query:  PLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFSYEES
        PLSGVVLS+VQPP+ GS HAENFERS+PSVL PQFS E S
Subjt:  PLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFSYEES

XP_004136773.3 uncharacterized protein LOC101213172 isoform X1 [Cucumis sativus]

1.1e-216

84.09

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVG SSS+LSDRNV +RCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHA KPV FL+ 
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSLGGPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYV LSNERGST+DAPT+VQSSVLMAIG NL  +KQRLKQL  TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSA
        NT+FGKVKQVRL S LNH+LGGGG+ARSPSPAPLPHS            HHH HHHHHHHHHHHHHHHHHHHHHH DAAYSPSPG EEHKHAPKNGVSSA
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSA

Query:  PEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSA
        PEA SSPME PTS++R YEATPPA +YG KRS TK+RKH+ LGPIPSPSS P SPYLRVG P PVSDS+SASSPLSGVVLS+VQPP+ GS HAENFERS+
Subjt:  PEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSA

Query:  PSVLAPQFS
        PSVL PQFS
Subjt:  PSVLAPQFS

XP_008443610.1 PREDICTED: uncharacterized protein LOC103487165 [Cucumis melo]

7.3e-224

84.67

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYV LSNERGSTMDAPT+VQSSVLMAIG NL  +KQRLKQL  TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-------------HHHDAAYSPSPGIE
        NT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH             HH  AAYSPSPG E
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-------------HHHDAAYSPSPGIE

Query:  EHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD
        EHKHAPKNGVSSAPEA SSPME PTS++R YEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASSPLSGVVLS+VQPP+
Subjt:  EHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD

Query:  KGSRHAENFERSAPSVLAPQFS
         GS HAENFERS+PSVL PQFS
Subjt:  KGSRHAENFERSAPSVLAPQFS

XP_022934949.1 uncharacterized protein LOC111441963 [Cucurbita moschata]

2.3e-209

82.68

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSD  V SRCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD++ DS YRDH+IVA F A KPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPFVKVA+LSLQSLGG N+T I+F+VDPD KYSK+P TSQSLIK TFETLVIN+ PLRLNASLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNFDDLTSQLRSGL LS YENLYV LSNERGSTM APTIVQSSVLMAIG N + QRLKQL QTITNSHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPE
        +FGKVKQVRLSSVLNH+L  GG ARSPSPAPLPHS H HHHHHHHHHHHHHH HHHHHHHHHHHHHHHHHHHH DA YSPSPG EEHK+APKNG+SSAPE
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPE

Query:  ASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS
        A SSP+ESP SK+R YEATPP  +YG K  S KVRK S+LG I SPSSPP SPYLRVGLP PV+ S+SASSPL GV LS+VQPP+KG       +RSAPS
Subjt:  ASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS

Query:  VLAPQFSY
        VL PQFS+
Subjt:  VLAPQFSY

XP_022983747.1 uncharacterized protein LOC111482272 isoform X2 [Cucurbita maxima]

4.6e-210

82.33

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSD  V SRCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD++ DS YRDH+IVA F A KPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPFVKVA+LSLQSLGG N+T I+F+VDPD KYSK+P TSQSLIK TFETLVIN+ PLRLNASLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNF+DLTSQLRSGL LS YENLYV LSNERGSTM APTIVQSSVLMAIG N + QRLKQL QTITNSHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS--HHNHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN
        +FGKVKQVRLSSVLNH+L  GG ARSPSPAPLPHS  HH HHHHHHHHHHH     HHHHHHHHHHHHHHHHHHHH HHH DAAYSPSPG EEHKHAPKN
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS--HHNHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN

Query:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN
        G+SSAPEA SSP+ESP SK+R YEATPP  +YG K  STKVRK S+LG IPSPSSPP SPYLRVGLP PV+ S+SASSPL GV LS+VQPP+KG      
Subjt:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN

Query:  FERSAPSVLAPQFSY
         +RSAPSVL PQFS+
Subjt:  FERSAPSVLAPQFSY

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LHD1 Uncharacterized protein

3.5e-216

82.51

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVG SSS+LSDRNV +RCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHA KPV FL+ 
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSLGGPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYV LSNERGST+DAPT+VQSSVLMAIG NL  +KQRLKQL  TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSA
        NT+FGKVKQVRL S LNH+LGGGG+ARSPSPAPLPHS                    HHH HHHHHHHHHHHHHH DAAYSPSPG EEHKHAPKNGVSSA
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSA

Query:  PEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSA
        PEA SSPME PTS++R YEATPPA +YG KRS TK+RKH+ LGPIPSPSS P SPYLRVG P PVSDS+SASSPLSGVVLS+VQPP+ GS HAENFERS+
Subjt:  PEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSA

Query:  PSVLAPQFS
        PSVL PQFS
Subjt:  PSVLAPQFS

A0A1S3B8E9 uncharacterized protein LOC103487165

3.5e-224

84.67

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P VKVAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRLN SLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN
        AFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYV LSNERGSTMDAPT+VQSSVLMAIG NL  +KQRLKQL  TITNSHSGNLGLN
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANL--TKQRLKQLTQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-------------HHHDAAYSPSPGIE
        NT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH             HH  AAYSPSPG E
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-------------HHHDAAYSPSPGIE

Query:  EHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD
        EHKHAPKNGVSSAPEA SSPME PTS++R YEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASSPLSGVVLS+VQPP+
Subjt:  EHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPD

Query:  KGSRHAENFERSAPSVLAPQFS
         GS HAENFERS+PSVL PQFS
Subjt:  KGSRHAENFERSAPSVLAPQFS

A0A5A7UJM2 Filamentous hemagglutinin

8.4e-218

80.74

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSDRNV +RCGGGGC   R+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPDR +DSAYRDHDIVASFHAWKPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL
        HIFELEDNIFGEIP+P VK                           VAILSLQSL GPN+TKIVFAVD D KYSK+P TSQSLIK TFETLVINE PLRL
Subjt:  HIFELEDNIFGEIPVPFVK---------------------------VAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRL

Query:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGA
        N SLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQI FNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYV LSNERGSTMDAPT+VQSSVLMAIG 
Subjt:  NASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGA

Query:  NL--TKQRLKQLTQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
        NL  +KQRLKQL  TITNSHSGNLGLNNT+FGKVKQVRL S LNH+LGGGG+A SPSPAPLPHSHH+HHHHHHHHHHHHH HHHHHHHHHHH+HH H   
Subjt:  NL--TKQRLKQLTQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH

Query:  HHHDAAYSPSPGIEEHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASS
            AAYSPSPG EEHKHAPKNGVSSAPEA SSPME PTS++R YEATPPA +YG KRSSTK+RK  +LGPIPSPSS PPSPYLRVGLP PVSDS+SASS
Subjt:  HHHDAAYSPSPGIEEHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASS

Query:  PLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFSYEES
        PLSGVVLS+VQPP+ GS HAENFERS+PSVL PQFS E S
Subjt:  PLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFSYEES

A0A6J1F409 uncharacterized protein LOC111441963

1.1e-209

82.68

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSD  V SRCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD++ DS YRDH+IVA F A KPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPFVKVA+LSLQSLGG N+T I+F+VDPD KYSK+P TSQSLIK TFETLVIN+ PLRLNASLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNFDDLTSQLRSGL LS YENLYV LSNERGSTM APTIVQSSVLMAIG N + QRLKQL QTITNSHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPE
        +FGKVKQVRLSSVLNH+L  GG ARSPSPAPLPHS H HHHHHHHHHHHHHH HHHHHHHHHHHHHHHHHHHH DA YSPSPG EEHK+APKNG+SSAPE
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPE

Query:  ASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS
        A SSP+ESP SK+R YEATPP  +YG K  S KVRK S+LG I SPSSPP SPYLRVGLP PV+ S+SASSPL GV LS+VQPP+KG       +RSAPS
Subjt:  ASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPS

Query:  VLAPQFSY
        VL PQFS+
Subjt:  VLAPQFSY

A0A6J1J074 uncharacterized protein LOC111482272 isoform X2

2.2e-210

82.33

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN
        MGKS+EEQPLPVGVSSS+LSD  V SRCGGGGC   RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD++ DS YRDH+IVA F A KPV FL+N
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLEN

Query:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPFVKVA+LSLQSLGG N+T I+F+VDPD KYSK+P TSQSLIK TFETLVIN+ PLRLNASLFGNTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT
        AFLLQTAQI FNFTLNYSIYQIQVNF+DLTSQLRSGL LS YENLYV LSNERGSTM APTIVQSSVLMAIG N + QRLKQL QTITNSHSGNLGLNNT
Subjt:  AFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNT

Query:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS--HHNHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN
        +FGKVKQVRLSSVLNH+L  GG ARSPSPAPLPHS  HH HHHHHHHHHHH     HHHHHHHHHHHHHHHHHHHH HHH DAAYSPSPG EEHKHAPKN
Subjt:  IFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHS--HHNHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN

Query:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN
        G+SSAPEA SSP+ESP SK+R YEATPP  +YG K  STKVRK S+LG IPSPSSPP SPYLRVGLP PV+ S+SASSPL GV LS+VQPP+KG      
Subjt:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAEN

Query:  FERSAPSVLAPQFSY
         +RSAPSVL PQFS+
Subjt:  FERSAPSVLAPQFSY

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G10790.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT3G56590.2)

7.0e-39

33.63

Show/hide

Query:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGC-CVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLE
        M K  +E  L +   +  L +     R  G  C   F RL+ +RC+  L+LS A+ LSAIFWL P  S  ++  ++  +   +  + ASF   KPVS + 
Subjt:  MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGC-CVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLE

Query:  NHIFELEDNIFGEIPVP-FVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPP
         H  ++E +I   I +    KV +LSL   G  N T + FAV P     ++   S SL++ +F  L    + L+L  S FG  + F+VLKFPGGIT+ P 
Subjt:  NHIFELEDNIFGEIPVP-FVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPP

Query:  QSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLN
        + A +   A + F+ T+  SI  +Q   D L       L L  YE+++ +L+N++GST+  P   Q  V   +   L  QRL   TQ I  S + NLGL+
Subjt:  QSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLN

Query:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAP
          +FG+VK +  S+ L+  +       +P+P P
Subjt:  NTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAP

AT3G10810.1 zinc finger (C3HC4-type RING finger) family protein

1.4e-84

46.94

Show/hide

Query:  MGKSDEEQPLPV--GVSSSQLSDRNVVSRCGGGGCCVF-RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSF
        MGK++++  L V  G ++   + RN  +RC   GCC +    +  +C+F LLLS A+FLSA+F L PF    D  D +LD  +R H IVASF   +  SF
Subjt:  MGKSDEEQPLPV--GVSSSQLSDRNVVSRCGGGGCCVF-RRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSF

Query:  LENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIP
        L  +  +L+++IF E+    +KV IL+++     NITK+VF +DPD  Y ++   S S IK  FE+++IN++ L+L  SLFG T LFEVLKFPGGIT+IP
Subjt:  LENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIP

Query:  PQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGL
        PQSAF LQ  +I FNFTLNYSI+QIQ+NF+ L SQL++GL+L+ YENLYV LSN  GST+  PT V SSVL+ +G + +  RLKQLT TIT S S NLGL
Subjt:  PQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGL

Query:  NNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSS
        NNTIFGKVKQVRLSS L ++     S +SPSP+P PHS H+HHHHHHHHHHHHHHH+HHHHHHH+                SP                 
Subjt:  NNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSS

Query:  APEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDS--MSASSPLSGVVLS-SVQPP
        APE S     +P   ++   + PP C  G +    + R      P P+PS+  P   L    PI  + S  +  S+PL  VV + + QPP
Subjt:  APEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDS--MSASSPLSGVVLS-SVQPP

AT3G56590.1 hydroxyproline-rich glycoprotein family protein

8.4e-93

45.47

Show/hide

Query:  MGKSD-EEQPLPVGVSSSQLSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG    CC        ++RCV  L  SAAVFLSA+FWLPPFL + D  D  LD  ++DH IVASF   K
Subjt:  MGKSD-EEQPLPVGVSSSQLSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK

Query:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI
        P+SF+E+++ +LE++I  EI  P  KV +L+L+ LG  N T ++FA+DP+ + SK+P+  +SLIK  FETLV  +   RL  SLFG    FEVLKFPGGI
Subjt:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI

Query:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSG
        T+IPPQ  F LQ AQ+ FNFTLN+SIYQIQ NF++L SQL+ G++L+ YENLY+ LSN RGST+  PTIV SSVL+  G++    RLKQL QTIT+SHS 
Subjt:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSG

Query:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN
        NLGLN+T+FGKVKQVRLSS+L H+     ++ +PSP+P P +H   HHH HHHHHHH                            +P P +         
Subjt:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN

Query:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAE
           S P    +P  +PT         PP C Y  +R        H    P P+P    P P      P P   ++  SSPL  VV + + PP K S  +E
Subjt:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAE

Query:  NFERSAPS
             +PS
Subjt:  NFERSAPS

AT3G56590.2 hydroxyproline-rich glycoprotein family protein

8.4e-93

45.47

Show/hide

Query:  MGKSD-EEQPLPVGVSSSQLSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG    CC        ++RCV  L  SAAVFLSA+FWLPPFL + D  D  LD  ++DH IVASF   K
Subjt:  MGKSD-EEQPLPVGVSSSQLSDRNVVSRCGGGG----CCV--FRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWK

Query:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI
        P+SF+E+++ +LE++I  EI  P  KV +L+L+ LG  N T ++FA+DP+ + SK+P+  +SLIK  FETLV  +   RL  SLFG    FEVLKFPGGI
Subjt:  PVSFLENHIFELEDNIFGEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGI

Query:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSG
        T+IPPQ  F LQ AQ+ FNFTLN+SIYQIQ NF++L SQL+ G++L+ YENLY+ LSN RGST+  PTIV SSVL+  G++    RLKQL QTIT+SHS 
Subjt:  TIIPPQSAFLLQTAQIDFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSG

Query:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN
        NLGLN+T+FGKVKQVRLSS+L H+     ++ +PSP+P P +H   HHH HHHHHHH                            +P P +         
Subjt:  NLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPAPLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKN

Query:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAE
           S P    +P  +PT         PP C Y  +R        H    P P+P    P P      P P   ++  SSPL  VV + + PP K S  +E
Subjt:  GVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKR-SSTKVRKHSYLGPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAE

Query:  NFERSAPS
             +PS
Subjt:  NFERSAPS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGAAGAGCGACGAAGAACAGCCGCTGCCGGTTGGAGTGAGTTCCTCTCAGCTTTCTGACCGGAATGTGGTGAGTCGATGCGGCGGCGGTGGGTGCTGTGTGTTTCG
TAGACTGATTGCGGTGAGATGTGTCTTCTTTCTGCTACTGTCGGCGGCTGTGTTTCTTTCTGCTATCTTTTGGCTGCCGCCGTTCCTCTCTTATGGTGATTGGCCGGATC
GGAGTCTTGATTCTGCTTACAGAGATCATGATATAGTAGCAAGTTTTCATGCTTGGAAGCCAGTTTCTTTTCTCGAAAACCATATTTTTGAGCTTGAGGATAACATTTTT
GGAGAAATACCCGTACCTTTTGTCAAGGTGGCAATCCTATCACTACAATCATTAGGTGGACCAAACATAACAAAAATTGTTTTTGCAGTAGATCCTGATGTCAAGTATTC
AAAAGTTCCCTCAACTTCTCAAAGTTTAATCAAGGGAACCTTCGAAACATTGGTTATAAATGAAGCACCTCTCAGATTGAATGCATCATTATTTGGCAATACATCCTTAT
TTGAGGTGTTGAAATTTCCTGGAGGAATAACTATAATTCCTCCTCAGAGTGCATTTCTTCTGCAGACAGCACAGATCGATTTCAACTTTACGTTAAATTATTCTATTTAT
CAAATTCAAGTGAATTTTGATGATCTTACCAGCCAGCTGAGGTCAGGATTACATCTATCTTATTATGAGAATTTATATGTCAGGCTATCGAATGAAAGAGGTTCAACAAT
GGATGCCCCCACTATTGTTCAGTCATCTGTTCTGATGGCAATTGGGGCTAATTTAACGAAACAAAGGCTAAAACAATTGACACAAACCATCACAAATTCTCATTCAGGAA
ACCTTGGCCTGAACAACACTATATTTGGTAAGGTCAAGCAAGTTCGTCTTTCATCGGTACTAAACCACACTCTTGGTGGAGGTGGAAGTGCACGGTCACCTTCGCCTGCT
CCTCTGCCTCATTCTCACCACAATCACCACCATCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCACCA
CCACCACCACCACCACCACCATGATGCTGCGTATTCACCAAGTCCTGGAATAGAGGAGCACAAACATGCACCGAAGAATGGGGTCTCATCTGCTCCTGAAGCTAGTTCAT
CCCCAATGGAAAGTCCCACTTCAAAGCAAAGAACCTATGAAGCAACTCCACCTGCTTGTCAATATGGATGTAAAAGATCTTCAACAAAAGTCAGAAAACACTCTTATTTA
GGCCCTATTCCTTCACCAAGCAGTCCTCCACCATCACCATACTTACGAGTAGGCCTGCCAATACCTGTCTCTGATTCAATGTCTGCTTCAAGTCCACTGTCAGGGGTAGT
TCTATCTAGTGTACAGCCTCCAGATAAAGGCAGCAGACATGCAGAAAATTTTGAAAGAAGTGCCCCTTCAGTTTTAGCACCACAATTTTCTTATGAAGAAAGTTTTGGAA
GATGCATTTTTCCAGGTCAAAGCCACAGAGGTGGCAGGCCTTTGGTTCGCTGGAACGTGTGGGTCGCTGCGTCACTGGCTGAGGGAAAACGAGACGTCGTCGGCGCGAAG
TCGTGCAGCTTGCCGGAGAGAAAGAGAAGAACGGAAAGGGAAGGGGCTGGAGTCGCGTTCTATCACCGAAGAAGAGCCCAAGGCTGTCTGTGCGCACGAGGAAGGAGGAA
GAGAGAGAGAGTTGCCGCCGCTGCTGTCGGAGTTTGCTCGCCGATCGAGACCTCGCTGAAGAAGAATAACTACGAGGAGGAGGTAGTGAACTGTAGGAGAAAACTCGCAT
GGGGGGAGGGGTTGACGGCGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGKSDEEQPLPVGVSSSQLSDRNVVSRCGGGGCCVFRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDRSLDSAYRDHDIVASFHAWKPVSFLENHIFELEDNIF
GEIPVPFVKVAILSLQSLGGPNITKIVFAVDPDVKYSKVPSTSQSLIKGTFETLVINEAPLRLNASLFGNTSLFEVLKFPGGITIIPPQSAFLLQTAQIDFNFTLNYSIY
QIQVNFDDLTSQLRSGLHLSYYENLYVRLSNERGSTMDAPTIVQSSVLMAIGANLTKQRLKQLTQTITNSHSGNLGLNNTIFGKVKQVRLSSVLNHTLGGGGSARSPSPA
PLPHSHHNHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHDAAYSPSPGIEEHKHAPKNGVSSAPEASSSPMESPTSKQRTYEATPPACQYGCKRSSTKVRKHSYL
GPIPSPSSPPPSPYLRVGLPIPVSDSMSASSPLSGVVLSSVQPPDKGSRHAENFERSAPSVLAPQFSYEESFGRCIFPGQSHRGGRPLVRWNVWVAASLAEGKRDVVGAK
SCSLPERKRRTEREGAGVAFYHRRRAQGCLCARGRRKRERVAAAAVGVCSPIETSLKKNNYEEEVVNCRRKLAWGEGLTA

Lag0026287 (gene) of Sponge gourd (AG-4) v1 genome