CuGenDBv2

Gene ID	Tan0006791
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Filamentous hemagglutinin
Genome location	LG08:41283058..41288114
RNA-Seq Expression	Tan0006791
Synteny	Tan0006791
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004136773.3 uncharacterized protein LOC101213172 isoform X1 [Cucumis sativus]

1.4e-225

82.03

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVG SSSELSDRNVE+RCGGGGC  IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPD  +DS YRDH+IVASFHA KP  FL+ 
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P +KVAILSLQSL GPN+TKIVFAVD D KYSKIPPTSQSLIK+TFETLVINEPPLRLN SLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN
        AFLLQTA+IYFNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYVSL+NERGST+DAPT+VQSSVLMAIGTN  SSKQRLKQLA TI +SHSGNLGLN
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN

Query:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVE
        NT+FGKVKQVRLS LNHSL GGG+A+SPSP PL HSHHH HHH     HHHHH+HHHHHHHHHHH+ D AYSPSPG EEHKHAPKNGVS AP+AGSSP+E
Subjt:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVE

Query:  SPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFS
         PTS+KRNY AT PA +YG KRS TK+RK  +LGPIPSP SSPSSPY RVG+ A      SASSPLSGVVLS  QPPN GS HAENF+RS+PSVLPPQFS
Subjt:  SPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFS

Query:  SSVGVHVYTIRWTLLLFLLVWHI
        S+ GV VYTI+WTL LFLL+WH+
Subjt:  SSVGVHVYTIRWTLLLFLLVWHI

XP_008443610.1 PREDICTED: uncharacterized protein LOC103487165 [Cucumis melo]

7.3e-230

80.51

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVGVSSSELSDRNVE+RCGGGGC  IR+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPD  +DS YRDH+IVASFHAWKP  FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P +KVAILSLQSL GPN+TKIVFAVD D KYSKIPPTSQSLIK+TFETLVINEPPLRLN SLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN
        AFLLQTA+IYFNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYVSL+NERGSTMDAPT+VQSSVLMAIGTN  SSKQRLKQLA TI +SHSGNLGLN
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN

Query:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH---------------------DVAYSPSPGIEE
        NT+FGKVKQVRLS LNHSL GGG+A SPSP PL HSHHHHHHH HHH HHHHH+HHHHHHHHHHH+H                       AYSPSPG EE
Subjt:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH---------------------DVAYSPSPGIEE

Query:  HKHAPKNGVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNK
        HKHAPKNGVS AP+AGSSP+E PTS+KRNY AT PA +YG KRSSTK+RKQ HLGPIPSP SSP SPY RVG  A      SASSPLSGVVLS  QPPN 
Subjt:  HKHAPKNGVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNK

Query:  GSRHAENFDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI
        GS HAENF+RS+PSVLPPQFSS+  V VYTI+WTL LFLLVWH+
Subjt:  GSRHAENFDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI

XP_022147793.1 TSC22 domain family protein 1-like isoform X1 [Momordica charantia]

9.9e-219

81.57

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGK++EEQPLPVG+SSSELSD NV SRCG     GIRRLIAVRCVFFLLLSAAVF+SA FWLPPFLS GDWPD ALDS YRDHEIVASFHAWKP SFL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HI ELEDNIFGEIPVPF+KV ILSLQSL G N+TKIVFAVDPD KYSKIPPTSQSLIK+ FET+ INEPPL L A+LF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT
        AFLLQTA+IYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLS YENLYVSL+N RGST+DAPTI+QSSVLMAIGTNSSK+RLKQLA+TI  SHSGNLGLNNT
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT

Query:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVES
        IFGKVKQVRL SVLNHSL+GG +A+SP+P+PL HSHHHHH       HHHHH+HHHHHHHHHHH+HD +YSPSPG EEH H P NGVS AP  GS+PVES
Subjt:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVES

Query:  PTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFSS
        PT KKRN  AT PACQYG KRSST+VRK+ HLGPI S SS PSSPYFRVG  A      SASSPLS VVLS  QPP+KGSRHAENF+R APSVLP QFSS
Subjt:  PTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFSS

Query:  SVGVHVYTIRWTLLLFLLVWH
        SVGV VYTIRWTLLLFLLVWH
Subjt:  SVGVHVYTIRWTLLLFLLVWH

XP_022983747.1 uncharacterized protein LOC111482272 isoform X2 [Cucurbita maxima]

3.1e-220

80.45

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVGVSSSELSD  V+SRCGGGGC  IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD A DSTYRDHEIVA F A KP  FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPF+KVA+LSLQSL G N+T I+F+VDPD KYSKIPPTSQSLIK+TFETLVIN+PPLRLNASLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT
        AFLLQTA+IYFNFTLNYSIYQIQVNF+DLTSQLRSGL LSRYENLYVSL+NERGSTM APTIVQSSVLMAIGTNSS QRLKQLA+TI +SHSGNLGLNNT
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT

Query:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHS---------HHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH------DVAYSPSPGIEEHKHAPKN
        +FGKVKQVRL SVLNHSL+ GG A+SPSP PL HS         HHHHHHHQHHH HHHHH+HHHHHHHHHHH+H      D AYSPSPG EEHKHAPKN
Subjt:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHS---------HHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH------DVAYSPSPGIEEHKHAPKN

Query:  GVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAEN
        G+S AP+AGSSPVESP SKKRNY AT P  +YG K  STKVRK+SHLG IPSPSS PSSPY RVG  A      SASSPL GV LS  QPP KG      
Subjt:  GVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAEN

Query:  FDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI
         DRSAPSVLPPQFS SVGV V+TIRWTL LFL+VWH+
Subjt:  FDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI

XP_023528289.1 uncharacterized protein LOC111791252 [Cucurbita pepo subsp. pepo]

2.2e-218

80.6

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVGVSSSELSD  V+SRCGGGGC  IRRLIAVRCVFFLLLSAAVFLSA+FWLPPFLSYGDWPD A D TYRDHEIVA F A KP  FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPF+KVA+LSLQSL G N+T I+F+VDPD KYSKIPPTSQSLIK+TFETLVIN+PPLRLNASLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT
        AFLLQTA+IYFNFTLNYSI+QIQVNFDDLTSQLRSGL LSRYENLYVSL+NERGSTM APTIVQSSVLMAIGTNSS QRLKQLA+TI +SHSGNLGLNNT
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT

Query:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPL----SHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH-----DVAYSPSPGIEEHKHAPKNGVSYAP
        +FGKVKQVRL SVLNHSL+ GG A+SPSP PL     H HHHHHHHQHHH HHHHH+HHHHHHHHHHH+H     D AYSPSP  EEHKHAPKNG+S AP
Subjt:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPL----SHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH-----DVAYSPSPGIEEHKHAPKNGVSYAP

Query:  DAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAP
        +AGSSPVESP SKKRNY AT P  +YG K  STKVRK+SHLG IPSPSS PSSPY RVG  A      SASSPL GV LS  QPP KG       DRSAP
Subjt:  DAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAP

Query:  SVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI
        SVLPPQFS SVGV V+TIRWTL LFL+VWH+
Subjt:  SVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LHD1 Uncharacterized protein

1.1e-223

80.88

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVG SSSELSDRNVE+RCGGGGC  IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPD  +DS YRDH+IVASFHA KP  FL+ 
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P +KVAILSLQSL GPN+TKIVFAVD D KYSKIPPTSQSLIK+TFETLVINEPPLRLN SLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN
        AFLLQTA+IYFNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYVSL+NERGST+DAPT+VQSSVLMAIGTN  SSKQRLKQLA TI +SHSGNLGLN
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN

Query:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVE
        NT+FGKVKQVRLS LNHSL GGG+A+SPSP PL HSHHH HH            HHHHHHHHHHH+ D AYSPSPG EEHKHAPKNGVS AP+AGSSP+E
Subjt:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVE

Query:  SPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFS
         PTS+KRNY AT PA +YG KRS TK+RK  +LGPIPSP SSPSSPY RVG+ A      SASSPLSGVVLS  QPPN GS HAENF+RS+PSVLPPQFS
Subjt:  SPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFS

Query:  SSVGVHVYTIRWTLLLFLLVWHI
        S+ GV VYTI+WTL LFLL+WH+
Subjt:  SSVGVHVYTIRWTLLLFLLVWHI

A0A1S3B8E9 uncharacterized protein LOC103487165

3.5e-230

80.51

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVGVSSSELSDRNVE+RCGGGGC  IR+LIAVRCVFFLLLSAAVFLSAIFWLPPFLSYG+WPD  +DS YRDH+IVASFHAWKP  FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIP+P +KVAILSLQSL GPN+TKIVFAVD D KYSKIPPTSQSLIK+TFETLVINEPPLRLN SLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN
        AFLLQTA+IYFNFTLNYSIYQIQVNFDDL+SQLRSGL LS YENLYVSL+NERGSTMDAPT+VQSSVLMAIGTN  SSKQRLKQLA TI +SHSGNLGLN
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTN--SSKQRLKQLARTIKSSHSGNLGLN

Query:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH---------------------DVAYSPSPGIEE
        NT+FGKVKQVRLS LNHSL GGG+A SPSP PL HSHHHHHHH HHH HHHHH+HHHHHHHHHHH+H                       AYSPSPG EE
Subjt:  NTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH---------------------DVAYSPSPGIEE

Query:  HKHAPKNGVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNK
        HKHAPKNGVS AP+AGSSP+E PTS+KRNY AT PA +YG KRSSTK+RKQ HLGPIPSP SSP SPY RVG  A      SASSPLSGVVLS  QPPN 
Subjt:  HKHAPKNGVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSP-SSPSSPYFRVGRSAA---DYSASSPLSGVVLSGAQPPNK

Query:  GSRHAENFDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI
        GS HAENF+RS+PSVLPPQFSS+  V VYTI+WTL LFLLVWH+
Subjt:  GSRHAENFDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI

A0A6J1D2A3 TSC22 domain family protein 1-like isoform X1

4.8e-219

81.57

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGK++EEQPLPVG+SSSELSD NV SRCG     GIRRLIAVRCVFFLLLSAAVF+SA FWLPPFLS GDWPD ALDS YRDHEIVASFHAWKP SFL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HI ELEDNIFGEIPVPF+KV ILSLQSL G N+TKIVFAVDPD KYSKIPPTSQSLIK+ FET+ INEPPL L A+LF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT
        AFLLQTA+IYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLS YENLYVSL+N RGST+DAPTI+QSSVLMAIGTNSSK+RLKQLA+TI  SHSGNLGLNNT
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT

Query:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVES
        IFGKVKQVRL SVLNHSL+GG +A+SP+P+PL HSHHHHH       HHHHH+HHHHHHHHHHH+HD +YSPSPG EEH H P NGVS AP  GS+PVES
Subjt:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVES

Query:  PTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFSS
        PT KKRN  AT PACQYG KRSST+VRK+ HLGPI S SS PSSPYFRVG  A      SASSPLS VVLS  QPP+KGSRHAENF+R APSVLP QFSS
Subjt:  PTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFSS

Query:  SVGVHVYTIRWTLLLFLLVWH
        SVGV VYTIRWTLLLFLLVWH
Subjt:  SVGVHVYTIRWTLLLFLLVWH

A0A6J1F409 uncharacterized protein LOC111441963

2.4e-218

80.91

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVGVSSSELSD  V+SRCGGGGC  IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD A DSTYRDHEIVA F A KP  FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPF+KVA+LSLQSL G N+T I+F+VDPD KYSKIPPTSQSLIK+TFETLVIN+PPLRLNASLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT
        AFLLQTA+IYFNFTLNYSIYQIQVNFDDLTSQLRSGL LSRYENLYVSL+NERGSTM APTIVQSSVLMAIGTNSS QRLKQLA+TI +SHSGNLGLNNT
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT

Query:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHS-----HHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH--DVAYSPSPGIEEHKHAPKNGVSYAPDA
        +FGKVKQVRL SVLNHSL+ GG A+SPSP PL HS     HHHHHHH HHH HHHHH+HHHHHHHHHHH+H  D  YSPSPG EEHK+APKNG+S AP+A
Subjt:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHS-----HHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH--DVAYSPSPGIEEHKHAPKNGVSYAPDA

Query:  GSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSV
        GSSPVESP SKKRNY AT P  +YG K  S KVRK+SHLG I SPSS PSSPY RVG  A      SASSPL GV LS  QPP KG       DRSAPSV
Subjt:  GSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSV

Query:  LPPQFSSSVGVHVYTIRWTLLLFLLVWHI
        LPPQFS SVGV V+TIRWTL LFL+VWH+
Subjt:  LPPQFSSSVGVHVYTIRWTLLLFLLVWHI

A0A6J1J074 uncharacterized protein LOC111482272 isoform X2

1.5e-220

80.45

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN
        MGKS+EEQPLPVGVSSSELSD  V+SRCGGGGC  IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPD A DSTYRDHEIVA F A KP  FL+N
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLEN

Query:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS
        HIFELEDNIFGEIPVPF+KVA+LSLQSL G N+T I+F+VDPD KYSKIPPTSQSLIK+TFETLVIN+PPLRLNASLF NTSLFEVLKFPGGITIIPPQS
Subjt:  HIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQS

Query:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT
        AFLLQTA+IYFNFTLNYSIYQIQVNF+DLTSQLRSGL LSRYENLYVSL+NERGSTM APTIVQSSVLMAIGTNSS QRLKQLA+TI +SHSGNLGLNNT
Subjt:  AFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNT

Query:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHS---------HHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH------DVAYSPSPGIEEHKHAPKN
        +FGKVKQVRL SVLNHSL+ GG A+SPSP PL HS         HHHHHHHQHHH HHHHH+HHHHHHHHHHH+H      D AYSPSPG EEHKHAPKN
Subjt:  IFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHS---------HHHHHHHQHHHPHHHHHNHHHHHHHHHHHNH------DVAYSPSPGIEEHKHAPKN

Query:  GVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAEN
        G+S AP+AGSSPVESP SKKRNY AT P  +YG K  STKVRK+SHLG IPSPSS PSSPY RVG  A      SASSPL GV LS  QPP KG      
Subjt:  GVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSS-PSSPYFRVGRSA---ADYSASSPLSGVVLSGAQPPNKGSRHAEN

Query:  FDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI
         DRSAPSVLPPQFS SVGV V+TIRWTL LFL+VWH+
Subjt:  FDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G10790.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT3G56590.2)

5.0e-35

32.93

Show/hide

Query:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGC-CGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYR-DHEIVASFHAWKPASFL
        M K  +E  L +   + +L +     R  G  C     RL+ +RC+  L+LS A+ LSAIFWL P  S  ++     D T + +  + ASF   KP S +
Subjt:  MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGC-CGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYR-DHEIVASFHAWKPASFL

Query:  ENHIFELEDNIFGEIPVP-FIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIP
          H  ++E +I   I +    KV +LSL      N T + FAV P     +I   S SL++ +F  L      L+L  S F   + F+VLKFPGGIT+ P
Subjt:  ENHIFELEDNIFGEIPVP-FIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIP

Query:  PQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGL
         + A +   A + F+ T+  SI  +Q   D L       L L  YE+++  LTN++GST+  P   Q  V   +      QRL    + I++S + NLGL
Subjt:  PQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGL

Query:  NNTIFGKVKQVRLSV-LNHSLTGGGSAQSPSPTP
        +  +FG+VK +  S  L+  +       +P+PTP
Subjt:  NNTIFGKVKQVRLSV-LNHSLTGGGSAQSPSPTP

AT3G10810.1 zinc finger (C3HC4-type RING finger) family protein

2.2e-91

46.69

Show/hide

Query:  MGKSDEEQPLPV--GVSSSELSDRNVESRCGGGGCC-GIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASF
        MGK++++  L V  G ++ + + RN  +RC   GCC  I   +  +C+F LLLS A+FLSA+F L PF    D  D  LD  +R H IVASF   + ASF
Subjt:  MGKSDEEQPLPV--GVSSSELSDRNVESRCGGGGCC-GIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASF

Query:  LENHIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIP
        L  +  +L+++IF E+    IKV IL+++  D  NITK+VF +DPD  Y +I P S S IK+ FE+++IN+  L+L  SLF  T LFEVLKFPGGIT+IP
Subjt:  LENHIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIP

Query:  PQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGL
        PQSAF LQ  +I FNFTLNYSI+QIQ+NF+ L SQL++GL+L+ YENLYVSL+N  GST+  PT V SSVL+ +GT++S  RLKQL  TI  S S NLGL
Subjt:  PQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGL

Query:  NNTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPV
        NNTIFGKVKQVRLS    + +   S +SPSP+P  HS HHHHHH     HHHHH+HHHHH+HHHHH+H+++   +P +                   SPV
Subjt:  NNTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPV

Query:  ESPT---SKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSSPSSPYFRVGRSAADYSA--------SSPLSGVVLS-GAQPPNKGSRHAENFDRSA
         SP    S+KR   A  P C  G +    + R Q    P P+PS+  +P+ ++  S A  SA        S+PL  VV +  AQPP    R     + + 
Subjt:  ESPT---SKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSSPSSPYFRVGRSAADYSA--------SSPLSGVVLS-GAQPPNKGSRHAENFDRSA

Query:  PSVLPPQFSSSVGVHVYTIRWTLLLFLLV
        P    PQ SSS    +  + W +LL L+V
Subjt:  PSVLPPQFSSSVGVHVYTIRWTLLLFLLV

AT3G56590.1 hydroxyproline-rich glycoprotein family protein

8.7e-88

45.69

Show/hide

Query:  MGKSD-EEQPLPVGVSSSELSDRNVESRCGGGG-----CCG-IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG     CC  I    ++RCV  L  SAAVFLSA+FWLPPFL + D  D  LD  ++DH IVASF   K
Subjt:  MGKSD-EEQPLPVGVSSSELSDRNVESRCGGGG-----CCG-IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWK

Query:  PASFLENHIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGI
        P SF+E+++ +LE++I  EI  P  KV +L+L+ L   N T ++FA+DP+ + SKIP   +SLIK  FETLV  +   RL  SLF     FEVLKFPGGI
Subjt:  PASFLENHIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGI

Query:  TIIPPQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSG
        T+IPPQ  F LQ A++ FNFTLN+SIYQIQ NF++L SQL+ G++L+ YENLY++L+N RGST+  PTIV SSVL+  G++S   RLKQLA+TI SSHS 
Subjt:  TIIPPQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSG

Query:  NLGLNNTIFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDA
        NLGLN+T+FGKVKQVRL S+L HS     ++ +PSP+P               P  H + HHH HHHHHHH      +P P +              P  
Subjt:  NLGLNNTIFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDA

Query:  GSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPS------SPSSPYFRVGRSAADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAP
        G +P  +PT K        P C Y  +R         H  P P+P+       P +P     R  A    SSPL  VV +   PP+K S  +E     +P
Subjt:  GSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPS------SPSSPYFRVGRSAADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAP

Query:  SVLPPQFSSS
        S  P    SS
Subjt:  SVLPPQFSSS

AT3G56590.2 hydroxyproline-rich glycoprotein family protein

6.0e-89

45.7

Show/hide

Query:  MGKSD-EEQPLPVGVSSSELSDRNVESRCGGGG-----CCG-IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG     CC  I    ++RCV  L  SAAVFLSA+FWLPPFL + D  D  LD  ++DH IVASF   K
Subjt:  MGKSD-EEQPLPVGVSSSELSDRNVESRCGGGG-----CCG-IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWK

Query:  PASFLENHIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGI
        P SF+E+++ +LE++I  EI  P  KV +L+L+ L   N T ++FA+DP+ + SKIP   +SLIK  FETLV  +   RL  SLF     FEVLKFPGGI
Subjt:  PASFLENHIFELEDNIFGEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGI

Query:  TIIPPQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSG
        T+IPPQ  F LQ A++ FNFTLN+SIYQIQ NF++L SQL+ G++L+ YENLY++L+N RGST+  PTIV SSVL+  G++S   RLKQLA+TI SSHS 
Subjt:  TIIPPQSAFLLQTAEIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSG

Query:  NLGLNNTIFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDA
        NLGLN+T+FGKVKQVRL S+L HS     ++ +PSP+P               P  H + HHH HHHHHHH      +P P +              P  
Subjt:  NLGLNNTIFGKVKQVRL-SVLNHSLTGGGSAQSPSPTPLSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDA

Query:  GSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPS------SPSSPYFRVGRSAADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAP
        G +P  +PT K        P C Y  +R         H  P P+P+       P +P     R  A    SSPL  VV +   PP+K S  +E     +P
Subjt:  GSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPS------SPSSPYFRVGRSAADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAP

Query:  SVLPPQFSSSVG
        S  P   S+S+G
Subjt:  SVLPPQFSSSVG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGGAAGAGCGACGAAGAACAGCCGCTGCCGGTTGGAGTGAGTTCCTCTGAGCTTTCTGACCGGAATGTGGAGAGCCGATGCGGCGGCGGCGGGTGCTGTGGGATTCG
TAGACTGATTGCGGTGAGATGCGTCTTCTTTCTGCTACTGTCGGCGGCTGTGTTTCTTTCTGCTATCTTTTGGCTGCCGCCGTTCCTCTCTTACGGAGATTGGCCGGATC
CGGCTCTTGATTCTACTTATAGAGATCATGAAATAGTAGCAAGTTTTCATGCTTGGAAGCCAGCTTCTTTTCTGGAAAACCATATTTTTGAGCTTGAGGATAACATTTTT
GGAGAAATACCCGTACCTTTTATTAAGGTGGCCATCCTCTCACTACAATCATTAGATGGACCAAACATAACAAAAATTGTTTTTGCGGTAGATCCTGATGTCAAGTATTC
AAAAATTCCCCCAACTTCTCAAAGTTTAATAAAGGATACCTTTGAGACTTTGGTTATAAATGAACCACCTCTCAGATTGAATGCATCCTTATTCGCCAATACATCCTTAT
TCGAGGTGTTGAAATTTCCTGGAGGAATAACTATAATTCCTCCTCAGAGTGCATTTCTTCTGCAGACGGCAGAGATCTATTTCAACTTCACGTTAAATTATTCTATTTAT
CAAATTCAAGTGAATTTCGATGATCTTACCAGCCAGCTGAGGTCAGGATTACATCTATCTCGTTATGAGAATTTATATGTTAGCCTAACAAACGAAAGAGGTTCAACAAT
GGATGCTCCCACTATTGTTCAGTCATCTGTTCTGATGGCAATTGGGACCAATTCATCAAAACAAAGGCTAAAACAATTGGCTCGAACCATAAAAAGTTCTCATTCAGGAA
ACCTTGGCTTGAACAACACTATATTTGGAAAGGTCAAACAAGTTCGTCTTTCGGTCCTAAACCATTCACTTACTGGTGGGGGAAGTGCACAGTCACCTTCGCCTACCCCT
CTGTCTCATTCTCACCACCACCACCACCACCATCAACATCACCACCCCCACCACCATCACCACAACCACCACCACCACCACCACCACCATCACCACCACAACCATGATGT
TGCATATTCACCAAGTCCTGGCATAGAGGAGCACAAACATGCACCAAAGAACGGGGTCTCATATGCTCCCGATGCAGGTTCATCCCCAGTGGAAAGTCCTACTTCAAAGA
AAAGAAACTATGGAGCAACTCTGCCTGCTTGTCAATATGGATGTAAAAGGTCGTCAACAAAAGTCAGAAAACAATCTCATTTAGGCCCTATTCCTTCACCAAGCAGTCCT
TCATCACCATACTTTCGAGTAGGCAGGTCAGCAGCTGATTATTCTGCTTCAAGTCCACTGTCAGGGGTAGTTCTATCTGGTGCACAACCTCCAAATAAAGGCAGCAGACA
TGCAGAAAATTTTGACAGAAGTGCCCCTTCAGTTTTACCACCACAGTTTTCTTCTTCTGTAGGTGTTCATGTTTATACAATTCGATGGACACTTTTGCTGTTTCTTCTTG
TATGGCATATATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGKSDEEQPLPVGVSSSELSDRNVESRCGGGGCCGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSYGDWPDPALDSTYRDHEIVASFHAWKPASFLENHIFELEDNIF
GEIPVPFIKVAILSLQSLDGPNITKIVFAVDPDVKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFANTSLFEVLKFPGGITIIPPQSAFLLQTAEIYFNFTLNYSIY
QIQVNFDDLTSQLRSGLHLSRYENLYVSLTNERGSTMDAPTIVQSSVLMAIGTNSSKQRLKQLARTIKSSHSGNLGLNNTIFGKVKQVRLSVLNHSLTGGGSAQSPSPTP
LSHSHHHHHHHQHHHPHHHHHNHHHHHHHHHHHNHDVAYSPSPGIEEHKHAPKNGVSYAPDAGSSPVESPTSKKRNYGATLPACQYGCKRSSTKVRKQSHLGPIPSPSSP
SSPYFRVGRSAADYSASSPLSGVVLSGAQPPNKGSRHAENFDRSAPSVLPPQFSSSVGVHVYTIRWTLLLFLLVWHI

Tan0006791 (gene) of Snake gourd v1 genome