CuGenDBv2

Gene ID	CaUC10G193920
Organism	Citrullus amarus (Watermelon (USVL246-FR2) v1)
Description	Polynucleotidyl transferase, ribonuclease H-like superfamily protein
Genome location	Ciama_Chr10:28862571..28871383
RNA-Seq Expression	CaUC10G193920
Synteny	CaUC10G193920
Gene Ontology terms	GO:0006139 - nucleobase-containing compound metabolic process (biological process) GO:0016021 - integral component of membrane (cellular component) GO:0003676 - nucleic acid binding (molecular function) GO:0008408 - 3'-5' exonuclease activity (molecular function)
InterPro domains	IPR002562 - 3'-5' exonuclease domain IPR012337 - Ribonuclease H-like superfamily IPR036397 - Ribonuclease H superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0053895.1 Filamentous hemagglutinin [Cucumis melo var. makuwa]

2.5e-250

88.09

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVGVSSSELSDRNVE RCGGGGCS IR+LIAVRCVFFLLLSAAVFLSAIFWLPPFLS GNWPDRPIDSAYRDH+IVASFHAWKPVPF++N
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIP+P VKVSSSVSCF WLD S+FW FD IL  NQV ILSLQSL GPNVTKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVINEPPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        N SLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDL+SQLRSGL LSPYENLYVSLSN+RGST+ +PT+VQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH------HNQDAAY
        N  SSKQRLKQLA TITNSHSGNLGLNNTVFGKVKQVRL S LNHSLGGGG+A SPSPAPLPHSHHHHHHHHHHHHHHHH HHHHHH      H+Q AAY
Subjt:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH------HNQDAAY

Query:  SPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVL
        SPSPGTEEHKHA KNGVSSAPEAGSSP+E PT+ KRNYEATPPAF+YGYKRSS K+RKQ HLGPIPS SS P SP+LRVGLPAPVSDSISASSPLSGVVL
Subjt:  SPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVL

Query:  SSVQSPNTGGGHAENFERSPPSVLPPQFS
        S+VQ PNTG GHAENFERS PSVLPPQFS
Subjt:  SSVQSPNTGGGHAENFERSPPSVLPPQFS

XP_004136773.3 uncharacterized protein LOC101213172 isoform X1 [Cucumis sativus]

2.2e-230

84.35

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVG SSSELSDRNVE RCGGGGCS IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLS GNWPDRP+DSAYRDH+IVASFHA KPVPF++ 
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIP+P VKV+                           ILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVINEPPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        N SLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDL+SQLRSGL LSPYENLYVSLSN+RGSTI +PT+VQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHH-HHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPG
        N  SSKQRLKQLA TITNSHSGNLGLNNTVFGKVKQVRL S LNHSLGGGG+ARSPSPAPLPHSHHH HHHHHHHHHHHHH+HHHHHHH++DAAYSPSPG
Subjt:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHH-HHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPG

Query:  TEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQS
        TEEHKHA KNGVSSAPEAGSSP+E PT+ KRNYEATPPAF+YGYKRS  K+RK  +LGPIPS SS P SP+LRVG PAPVSDSISASSPLSGVVLS+VQ 
Subjt:  TEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQS

Query:  PNTGGGHAENFERSPPSVLPPQFS
        PNTG GHAENFERS PSVLPPQFS
Subjt:  PNTGGGHAENFERSPPSVLPPQFS

XP_008443610.1 PREDICTED: uncharacterized protein LOC103487165 [Cucumis melo]

5.3e-232

81.24

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVGVSSSELSDRNVE RCGGGGCS IR+LIAVRCVFFLLLSAAVFLSAIFWLPPFLS GNWPDRPIDSAYRDH+IVASFHAWKPVPF++N
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIP+P VKV+                           ILSLQSL GPNVTKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVINEPPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        N SLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDL+SQLRSGL LSPYENLYVSLSN+RGST+ +PT+VQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH-------------
        N  SSKQRLKQLA TITNSHSGNLGLNNTVFGKVKQVRL S LNHSLGGGG+A SPSPAPLPHSHHHHHHHHHHHHHHHH+HHHHHH             
Subjt:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH-------------

Query:  -------------HNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVG
                     H+Q AAYSPSPGTEEHKHA KNGVSSAPEAGSSP+E PT+ KRNYEATPPAF+YGYKRSS K+RKQ HLGPIPS SS P SP+LRVG
Subjt:  -------------HNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVG

Query:  LPAPVSDSISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFS
        LPAPVSDSISASSPLSGVVLS+VQ PNTG GHAENFERS PSVLPPQFS
Subjt:  LPAPVSDSISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFS

XP_022983747.1 uncharacterized protein LOC111482272 isoform X2 [Cucurbita maxima]

1.1e-213

77.02

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVGVSSSELSD  V+ RCGGGGC  IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLS G+WPD+  DS YRDHEIVA F A KPVPF++N
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIPVPFVKV+                           +LSLQSLGG NVT I+F+VD DAKYSKIPPTSQSLIK+TFETLVIN+PPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        NASLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNF+DLTSQLRSGL LS YENLYVSLSN+RGST+ +PTIVQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  NSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSH--------------------HHHHHHHHHHHHHHHYH
        NSS QRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSL  GG ARSPSPAPLPHSH                    HHHHHHHHHHHHHHH+H
Subjt:  NSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSH--------------------HHHHHHHHHHHHHHHYH

Query:  HHHHHHNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDS
        HHH HH+QDAAYSPSPGTEEHKHA KNG+SSAPEAGSSPVESP + KRNYEATPP F+YGYK  S KVRK+SHLG IPS SSPP SP+LRVGLPAPV+ S
Subjt:  HHHHHHNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDS

Query:  ISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFSWGI
        ISASSPL GV LS+VQ P  G       +RS PSVLPPQFS+ +
Subjt:  ISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFSWGI

XP_038904490.1 uncharacterized protein LOC120090859 [Benincasa hispida]

3.2e-213

78.31

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQ LPVGVSSSELSDRNVE RCGGGGCSGIRRLIAVRCVFFLLLS AVFLSAIFWLPPFLS GNWPDRP+DSAYRDHEIVASFHAWKP P +EN
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIPVPFVKV+                           ILSLQSLGGPN TKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVIN+PPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        NASLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSN+RGST+H+PTIVQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  NSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPGTEE
        NSSKQRLKQLAQTITNSHS NLGLNNT+FGKVKQVRLSSVLNHSLGGGGSAR                                               E
Subjt:  NSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPGTEE

Query:  HKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQSPNT
         +H LKNGVSSAPEAGSSPVESPT+  RNYEATPPAFQYGYKRSSRKVRKQ+HLGPIPS SS P SP+LRVGLPAPVSDSISASSPLSGVVLS+VQ PN+
Subjt:  HKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQSPNT

Query:  GGGHAENFERSPPSVLPPQFS
        G  HAENF  S PSVLPPQFS
Subjt:  GGGHAENFERSPPSVLPPQFS

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LHD1 Uncharacterized protein

2.5e-227

83.17

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVG SSSELSDRNVE RCGGGGCS IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLS GNWPDRP+DSAYRDH+IVASFHA KPVPF++ 
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIP+P VKV+                           ILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVINEPPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        N SLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDL+SQLRSGL LSPYENLYVSLSN+RGSTI +PT+VQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPGT
        N  SSKQRLKQLA TITNSHSGNLGLNNTVFGKVKQVRL S LNHSLGGGG+ARSPSPAPLPHSHHH HHHHHHHHHHHH+H       +DAAYSPSPGT
Subjt:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPGT

Query:  EEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQSP
        EEHKHA KNGVSSAPEAGSSP+E PT+ KRNYEATPPAF+YGYKRS  K+RK  +LGPIPS SS P SP+LRVG PAPVSDSISASSPLSGVVLS+VQ P
Subjt:  EEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQSP

Query:  NTGGGHAENFERSPPSVLPPQFS
        NTG GHAENFERS PSVLPPQFS
Subjt:  NTGGGHAENFERSPPSVLPPQFS

A0A1S3B8E9 uncharacterized protein LOC103487165

2.6e-232

81.24

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVGVSSSELSDRNVE RCGGGGCS IR+LIAVRCVFFLLLSAAVFLSAIFWLPPFLS GNWPDRPIDSAYRDH+IVASFHAWKPVPF++N
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIP+P VKV+                           ILSLQSL GPNVTKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVINEPPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        N SLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDL+SQLRSGL LSPYENLYVSLSN+RGST+ +PT+VQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH-------------
        N  SSKQRLKQLA TITNSHSGNLGLNNTVFGKVKQVRL S LNHSLGGGG+A SPSPAPLPHSHHHHHHHHHHHHHHHH+HHHHHH             
Subjt:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH-------------

Query:  -------------HNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVG
                     H+Q AAYSPSPGTEEHKHA KNGVSSAPEAGSSP+E PT+ KRNYEATPPAF+YGYKRSS K+RKQ HLGPIPS SS P SP+LRVG
Subjt:  -------------HNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVG

Query:  LPAPVSDSISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFS
        LPAPVSDSISASSPLSGVVLS+VQ PNTG GHAENFERS PSVLPPQFS
Subjt:  LPAPVSDSISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFS

A0A5A7UJM2 Filamentous hemagglutinin

1.2e-250

88.09

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVGVSSSELSDRNVE RCGGGGCS IR+LIAVRCVFFLLLSAAVFLSAIFWLPPFLS GNWPDRPIDSAYRDH+IVASFHAWKPVPF++N
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIP+P VKVSSSVSCF WLD S+FW FD IL  NQV ILSLQSL GPNVTKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVINEPPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        N SLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDL+SQLRSGL LSPYENLYVSLSN+RGST+ +PT+VQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH------HNQDAAY
        N  SSKQRLKQLA TITNSHSGNLGLNNTVFGKVKQVRL S LNHSLGGGG+A SPSPAPLPHSHHHHHHHHHHHHHHHH HHHHHH      H+Q AAY
Subjt:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHH------HNQDAAY

Query:  SPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVL
        SPSPGTEEHKHA KNGVSSAPEAGSSP+E PT+ KRNYEATPPAF+YGYKRSS K+RKQ HLGPIPS SS P SP+LRVGLPAPVSDSISASSPLSGVVL
Subjt:  SPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVL

Query:  SSVQSPNTGGGHAENFERSPPSVLPPQFS
        S+VQ PNTG GHAENFERS PSVLPPQFS
Subjt:  SSVQSPNTGGGHAENFERSPPSVLPPQFS

A0A5D3DPD6 Filamentous hemagglutinin

2.0e-213

77.63

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVGVSSSELSDRNVE RCGGGGCS IR+LIAVRCVFFLLLSAAVFLSAIFWLPPFLS GNWPDRPIDSAYRDH+IVASFHAWKPVPF++N
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIP+P VKV+                           ILSLQSL GPNVTKIVFAVDSDAKYSKIPPTSQSLIK+TFETLVINEPPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        N SLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNFDDL+SQLRSGL LSPYENLYVSLSN+RGST+ +PT+VQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPGT
        N  SSKQRLKQLA TITNSHSGNLGLNNTVFGKVKQVRL S LNHSLGGGG+A                                            PGT
Subjt:  N--SSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPGT

Query:  EEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQSP
        EEHKHA KNGVSSAPEAGSSP+E PT+ KRNYEATPPAF+YGYKRSS K+RKQ HLGPIPS SS P SP+LRVGLPAPVSDSISASSPLSGVVLS+VQ P
Subjt:  EEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQSP

Query:  NTGGGHAENFERSPPSVLPPQFS
        NTG GHAENFERS PSVLPPQFS
Subjt:  NTGGGHAENFERSPPSVLPPQFS

A0A6J1J074 uncharacterized protein LOC111482272 isoform X2

5.4e-214

77.02

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN
        MGKSEEEQPLPVGVSSSELSD  V+ RCGGGGC  IRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLS G+WPD+  DS YRDHEIVA F A KPVPF++N
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMEN

Query:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL
        HIFELEDNIFGEIPVPFVKV+                           +LSLQSLGG NVT I+F+VD DAKYSKIPPTSQSLIK+TFETLVIN+PPLRL
Subjt:  HIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRL

Query:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT
        NASLFGNTSLF+VLKFPGGITIIPPQSAF LQ AQIYFNFTLNYSIYQIQVNF+DLTSQLRSGL LS YENLYVSLSN+RGST+ +PTIVQSSVLMAIGT
Subjt:  NASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGT

Query:  NSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSH--------------------HHHHHHHHHHHHHHHYH
        NSS QRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSL  GG ARSPSPAPLPHSH                    HHHHHHHHHHHHHHH+H
Subjt:  NSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSH--------------------HHHHHHHHHHHHHHHYH

Query:  HHHHHHNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDS
        HHH HH+QDAAYSPSPGTEEHKHA KNG+SSAPEAGSSPVESP + KRNYEATPP F+YGYK  S KVRK+SHLG IPS SSPP SP+LRVGLPAPV+ S
Subjt:  HHHHHHNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDS

Query:  ISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFSWGI
        ISASSPL GV LS+VQ P  G       +RS PSVLPPQFS+ +
Subjt:  ISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFSWGI

SwissProt top hits

e value

%identity

Alignment

Q84LH3 Werner Syndrome-like exonuclease

4.3e-19

39.22

Show/hide

Query:  VGLDIEWRPNNRSYDNP--VATLQLCI-GRRCLILQLIHTPEIPKSLFEFLENESYTFVGVGIDEDAEKLTCDYGLKVGKRVDLRNLAESVTGRGDLKNA
        VGLDIEWRP+ R    P  VAT+Q+C+    C ++ + H+  IP+SL   +E+ +   VG+GID D+ KL  DYG+ +    DL +LA    G GD K  
Subjt:  VGLDIEWRPNNRSYDNP--VATLQLCI-GRRCLILQLIHTPEIPKSLFEFLENESYTFVGVGIDEDAEKLTCDYGLKVGKRVDLRNLAESVTGRGDLKNA

Query:  GLKRLGKEVLGKEIEKPKRVTLSRWDQQWLTLNQVKYACIDAFFSFEIGRFLQ
        GL  L + ++ KE+ KP R+ L  W+   L+  Q++YA  DA+ S+ + + L+
Subjt:  GLKRLGKEVLGKEIEKPKRVTLSRWDQQWLTLNQVKYACIDAFFSFEIGRFLQ

Q9VGN7 Exonuclease 3'-5' domain-containing protein 2

7.2e-14

38.1

Show/hide

Query:  IVGLDIEWRPNNRSYDNPVATLQLCIGR-RCLILQLIHTPEIPKSLFEFLENESYTFVGVGIDEDAEKLTCDYGLKVGKRVDLRNLAESVTGRGDLKNAG
        ++G D EW     S   PVA LQL   R  C + +L H  +IP+ L E LE++S   VGV   EDA KL+ DYG+ V   +DLR L   + G    K  G
Subjt:  IVGLDIEWRPNNRSYDNPVATLQLCIGR-RCLILQLIHTPEIPKSLFEFLENESYTFVGVGIDEDAEKLTCDYGLKVGKRVDLRNLAESVTGRGDLKNAG

Query:  LKRLGKEVLGKEIEKPKRVTLSRWDQQWLTLNQVKYACIDAFFSFEI
        L +L K  L   ++K  R+  S W+ + L   Q+ YA  DA  +  I
Subjt:  LKRLGKEVLGKEIEKPKRVTLSRWDQQWLTLNQVKYACIDAFFSFEI

Arabidopsis top hits

e value

%identity

Alignment

AT1G10790.1 BEST Arabidopsis thaliana protein match is: hydroxyproline-rich glycoprotein family protein (TAIR:AT3G56590.2)

2.2e-34

31.2

Show/hide

Query:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGC-SGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFME
        M K  +E  L +   + +L +     R  G  C S   RL+ +RC+  L+LS A+ LSAIFWL P  S   +  +   +   +  + ASF   KPV  + 
Subjt:  MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGC-SGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFME

Query:  NHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLR
         H  ++E +I   I                           + + ++V +LSL   G  N T + FAV       +I   S SL++ +F  L      L+
Subjt:  NHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLR

Query:  LNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIG
        L  S FG  + F+VLKFPGGIT+ P + A     A + F+ T+  SI  +Q   D L       L L PYE+++  L+NK+GSTI  P   Q  V   + 
Subjt:  LNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIG

Query:  TNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAP
             QRL    Q I  S + NLGL+  VFG+VK +  S+ L+  +       +P+P P
Subjt:  TNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAP

AT3G10810.1 zinc finger (C3HC4-type RING finger) family protein

4.8e-90

45.87

Show/hide

Query:  MGKSEEEQPLPV--GVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFM
        MGK+E++  L V  G ++ + + RN   RC  G C  I   +  +C+F LLLS A+FLSA+F L PF  D    D  +D  +R H IVASF   +   F+
Subjt:  MGKSEEEQPLPV--GVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFM

Query:  ENHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPL
          +  +L+++IF E+    +KV+                           IL+++     N+TK+VF +D D  Y +I P S S IK+ FE+++IN+  L
Subjt:  ENHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPL

Query:  RLNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAI
        +L  SLFG T LF+VLKFPGGIT+IPPQSAFPLQ  +I FNFTLNYSI+QIQ+NF+ L SQL++GL+L+PYENLYVSLSN  GST+  PT V SSVL+ +
Subjt:  RLNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAI

Query:  GTNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHS--HHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSP
        GT++S  RLKQL  TIT S S NLGLNNT+FGKVKQVRLSS L +S     S +SPSP+P PHS  HHHHHHHHHHHHHHHH HHHHHHHN     SP  
Subjt:  GTNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHS--HHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSP

Query:  GTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEA--TPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDS----ISASSPLSGV
                       APE   SPV SP  ++    A   PP    G +   ++ R Q    P P+ S+   +P  ++  PAP+S +    +  S+PL  V
Subjt:  GTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEA--TPPAFQYGYKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDS----ISASSPLSGV

Query:  VLSSVQSP
        V +    P
Subjt:  VLSSVQSP

AT3G12410.1 Polynucleotidyl transferase, ribonuclease H-like superfamily protein

2.1e-21

31.6

Show/hide

Query:  DSHNLFDVTFDSEEPILTLLTTSPSMVDDWISETL---AIRTPPLIVGLDIEW---------RPNN--------RSY-DNPVATLQLCIGRRCLILQLIH
        ++H  + V F  +E I+T +T   S++  WI   L      + PL+VG+ ++W         RPNN        R Y DNP   LQLC+G RCLI+QL +
Subjt:  DSHNLFDVTFDSEEPILTLLTTSPSMVDDWISETL---AIRTPPLIVGLDIEW---------RPNN--------RSY-DNPVATLQLCIGRRCLILQLIH

Query:  TPEIPKSLFEFLENESYTFVGVGIDEDAEKLT-CDYGLKVGKRVDLRNLAESVTGRGDLKNAGLKRLGKEVLGKE-IEKPKRVTLSRWDQQWLTLNQVKY
          ++P +L  FL +   TFVGV   +DA KL  C + L++G+ +D+R       GR  ++ +  + + +E +G + +     +++S W    L L+Q+  
Subjt:  TPEIPKSLFEFLENESYTFVGVGIDEDAEKLT-CDYGLKVGKRVDLRNLAESVTGRGDLKNAGLKRLGKEVLGKE-IEKPKRVTLSRWDQQWLTLNQVKY

Query:  ACIDAFFSFEIG
        A +DA+   ++G
Subjt:  ACIDAFFSFEIG

AT3G56590.1 hydroxyproline-rich glycoprotein family protein

3.7e-90

44.61

Show/hide

Query:  MGKSE-EEQPLPVGVSSSELSDRNVEGRCGGGG------CSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG      C  I    ++RCV  L  SAAVFLSA+FWLPPFL   +  D  +D  ++DH IVASF   K
Subjt:  MGKSE-EEQPLPVGVSSSELSDRNVEGRCGGGG------CSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWK

Query:  PVPFMENHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVI
        P+ FME+++ +LE++I  EI  P  K                           VV+L+L+ LG  N T ++FA+D + + SKIP   +SLIK  FETLV 
Subjt:  PVPFMENHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVI

Query:  NEPPLRLNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSS
         +   RL  SLFG    F+VLKFPGGIT+IPPQ  FPLQ AQ+ FNFTLN+SIYQIQ NF++L SQL+ G++L+ YENLY++LSN RGST+  PTIV SS
Subjt:  NEPPLRLNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSS

Query:  VLMAIGTNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYS
        VL+  G++S   RLKQLAQTIT+SHS NLGLN+TVFGKVKQVRLSS+L HS     ++ +PSP+P P +H + HHH HHHHHHH               +
Subjt:  VLMAIGTNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYS

Query:  PSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLG---PIPSRSSP-PLSPFLRVGLPAPV-SDSISASSPLS
        P P              S P  G +P  +PT +       PP   Y  +R         H     P P RS P P +P      PAP    +I  SSPL 
Subjt:  PSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLG---PIPSRSSP-PLSPFLRVGLPAPV-SDSISASSPLS

Query:  GVVLSSVQSPNTGGGHAENFERSPPSVLP
         VV + +  P+     +E      PS  P
Subjt:  GVVLSSVQSPNTGGGHAENFERSPPSVLP

AT3G56590.2 hydroxyproline-rich glycoprotein family protein

2.8e-90

44.4

Show/hide

Query:  MGKSE-EEQPLPVGVSSSELSDRNVEGRCGGGG------CSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWK
        MGK+  EEQ LP  VS    S RN     GGGG      C  I    ++RCV  L  SAAVFLSA+FWLPPFL   +  D  +D  ++DH IVASF   K
Subjt:  MGKSE-EEQPLPVGVSSSELSDRNVEGRCGGGG------CSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWK

Query:  PVPFMENHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVI
        P+ FME+++ +LE++I  EI  P  K                           VV+L+L+ LG  N T ++FA+D + + SKIP   +SLIK  FETLV 
Subjt:  PVPFMENHIFELEDNIFGEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVI

Query:  NEPPLRLNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSS
         +   RL  SLFG    F+VLKFPGGIT+IPPQ  FPLQ AQ+ FNFTLN+SIYQIQ NF++L SQL+ G++L+ YENLY++LSN RGST+  PTIV SS
Subjt:  NEPPLRLNASLFGNTSLFKVLKFPGGITIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSS

Query:  VLMAIGTNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYS
        VL+  G++S   RLKQLAQTIT+SHS NLGLN+TVFGKVKQVRLSS+L HS     ++ +PSP+P P +H + HHH HHHHHHH               +
Subjt:  VLMAIGTNSSKQRLKQLAQTITNSHSGNLGLNNTVFGKVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYS

Query:  PSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLG---PIPSRSSP-PLSPFLRVGLPAPV-SDSISASSPLS
        P P              S P  G +P  +PT +       PP   Y  +R         H     P P RS P P +P      PAP    +I  SSPL 
Subjt:  PSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYGYKRSSRKVRKQSHLG---PIPSRSSP-PLSPFLRVGLPAPV-SDSISASSPLS

Query:  GVVLSSVQSPNTGGGHAENFERSPPSVLPPQFSWGI
         VV + +  P+     +E      PS  P   S  I
Subjt:  GVVLSSVQSPNTGGGHAENFERSPPSVLPPQFSWGI

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGAAAGAGTGAAGAAGAACAGCCGCTGCCGGTTGGAGTGAGCTCCTCTGAGCTTTCTGACCGGAATGTGGAGGGCAGATGCGGCGGCGGTGGGTGCTCTGGGATTCG
TAGACTGATTGCGGTGAGATGTGTCTTCTTCCTGTTATTATCGGCGGCTGTGTTTCTTTCTGCTATTTTTTGGCTGCCACCGTTCCTTTCCGATGGAAATTGGCCGGATC
GGCCTATTGATTCTGCTTATAGAGATCATGAAATAGTAGCAAGTTTTCATGCTTGGAAGCCAGTTCCTTTTATGGAAAACCATATTTTTGAGCTTGAGGATAACATTTTT
GGAGAAATACCCGTACCATTTGTCAAGGTATCCAGTTCAGTTTCTTGTTTCCTCTGGCTTGATGTGTCACATTTTTGGTCGTTTGATCAAATACTCTCTTTTAACCAGGT
GGTTATCCTCTCACTACAATCATTAGGTGGACCAAACGTAACAAAAATTGTTTTTGCGGTAGATTCTGATGCAAAGTATTCAAAAATTCCCCCAACATCTCAAAGTTTAA
TCAAGGATACCTTTGAAACATTGGTTATAAATGAACCTCCTCTGAGATTGAATGCATCATTATTTGGCAATACATCCTTATTCAAGGTGTTGAAATTTCCTGGAGGAATA
ACTATTATTCCTCCTCAGAGTGCATTTCCTCTGCAGGCGGCACAGATCTATTTCAACTTCACATTAAATTATTCTATTTATCAAATTCAAGTGAATTTTGATGATCTTAC
CAGCCAGTTGAGGTCAGGATTACATCTATCTCCTTATGAGAATTTGTATGTTAGCCTATCGAACAAAAGAGGTTCAACAATACATTCCCCCACTATTGTCCAGTCATCTG
TTCTGATGGCAATTGGGACTAACTCATCGAAACAAAGGCTAAAACAGTTGGCTCAAACCATCACAAATTCTCATTCAGGAAACCTTGGCCTGAACAACACTGTATTTGGT
AAGGTCAAGCAGGTGCGTCTTTCATCAGTCCTAAACCACTCTCTTGGTGGTGGTGGCAGTGCTCGGTCACCTTCACCTGCGCCTCTGCCTCATTCTCACCACCACCACCA
CCATCACCACCACCATCACCACCATCACCACCATTACCACCATCACCACCACCACCACAATCAGGATGCTGCATACTCACCTAGTCCTGGAACAGAGGAGCACAAACATG
CACTGAAGAATGGGGTCTCATCTGCTCCCGAAGCTGGTTCATCTCCAGTGGAAAGTCCAACTGCAAATAAAAGAAACTATGAAGCTACTCCGCCTGCTTTTCAATATGGA
TATAAGAGGTCTTCAAGAAAAGTCAGAAAACAATCTCATTTAGGCCCTATTCCTTCTCGAAGCAGTCCTCCATTGTCACCATTCTTACGAGTAGGCCTGCCAGCACCTGT
TTCTGATTCTATTTCTGCTTCAAGTCCACTGTCAGGTGTAGTTCTATCTAGTGTACAGTCTCCAAATACAGGCGGTGGACATGCAGAAAATTTTGAAAGAAGTCCCCCTT
CAGTCTTACCACCTCAATTTTCTTGGGGAATTGTATATTTGGTTTTGGTTAGAATTACACAGAGGCAAAAGGCTGCAACTGTTACAGTTTCTGATGGAAAATCAAGCAAG
TTGGGAGATGCATTTTTCCAGGTCAAAGTCACAGAGGTGGCAGGCCTTTGTTCCTTCTTCTTCTCTGCCATGGCGATCACCATCGTTGACCATCAAGTTCCCTCCGATTC
CCACAATTTGTTCGACGTAACTTTCGATTCCGAGGAGCCAATTCTCACTCTTCTCACCACTTCACCATCCATGGTAGATGATTGGATATCCGAAACCCTCGCCATTCGAA
CTCCACCTCTCATCGTCGGCCTCGACATCGAATGGCGCCCTAATAATCGGTCCTACGACAACCCCGTCGCCACCTTGCAACTCTGCATCGGCCGCCGCTGCCTGATTCTG
CAACTGATCCACACACCTGAGATCCCTAAATCTCTGTTCGAGTTTCTGGAAAACGAATCCTACACATTCGTAGGAGTGGGAATCGACGAGGATGCTGAAAAGCTCACCTG
TGATTACGGATTGAAAGTGGGGAAGAGAGTGGATCTGAGGAATTTGGCTGAGAGTGTAACGGGAAGAGGAGATTTGAAGAATGCGGGATTGAAGAGATTGGGGAAAGAGG
TTTTGGGGAAAGAGATTGAAAAGCCGAAGAGGGTGACGCTGAGTAGATGGGATCAACAGTGGCTTACTCTTAATCAGGTTAAGTATGCTTGTATTGATGCCTTTTTTTCG
TTTGAGATTGGAAGGTTTTTGCAATCTTCATCCTATTAA

mRNA sequence

Show/hide mRNA sequence

GAATTTGGTTCTGGGTTTGCGGTGGATTAGCTCCACGAGCTGTAATGGGTGAAGATAATTCAGACCCAATTGAGGGAGGTGACAATGGAGGTTATTAACCCCACTTCACA
TGCATTGCTTCCATGGGAAAGAGTGAAGAAGAACAGCCGCTGCCGGTTGGAGTGAGCTCCTCTGAGCTTTCTGACCGGAATGTGGAGGGCAGATGCGGCGGCGGTGGGTG
CTCTGGGATTCGTAGACTGATTGCGGTGAGATGTGTCTTCTTCCTGTTATTATCGGCGGCTGTGTTTCTTTCTGCTATTTTTTGGCTGCCACCGTTCCTTTCCGATGGAA
ATTGGCCGGATCGGCCTATTGATTCTGCTTATAGAGATCATGAAATAGTAGCAAGTTTTCATGCTTGGAAGCCAGTTCCTTTTATGGAAAACCATATTTTTGAGCTTGAG
GATAACATTTTTGGAGAAATACCCGTACCATTTGTCAAGGTATCCAGTTCAGTTTCTTGTTTCCTCTGGCTTGATGTGTCACATTTTTGGTCGTTTGATCAAATACTCTC
TTTTAACCAGGTGGTTATCCTCTCACTACAATCATTAGGTGGACCAAACGTAACAAAAATTGTTTTTGCGGTAGATTCTGATGCAAAGTATTCAAAAATTCCCCCAACAT
CTCAAAGTTTAATCAAGGATACCTTTGAAACATTGGTTATAAATGAACCTCCTCTGAGATTGAATGCATCATTATTTGGCAATACATCCTTATTCAAGGTGTTGAAATTT
CCTGGAGGAATAACTATTATTCCTCCTCAGAGTGCATTTCCTCTGCAGGCGGCACAGATCTATTTCAACTTCACATTAAATTATTCTATTTATCAAATTCAAGTGAATTT
TGATGATCTTACCAGCCAGTTGAGGTCAGGATTACATCTATCTCCTTATGAGAATTTGTATGTTAGCCTATCGAACAAAAGAGGTTCAACAATACATTCCCCCACTATTG
TCCAGTCATCTGTTCTGATGGCAATTGGGACTAACTCATCGAAACAAAGGCTAAAACAGTTGGCTCAAACCATCACAAATTCTCATTCAGGAAACCTTGGCCTGAACAAC
ACTGTATTTGGTAAGGTCAAGCAGGTGCGTCTTTCATCAGTCCTAAACCACTCTCTTGGTGGTGGTGGCAGTGCTCGGTCACCTTCACCTGCGCCTCTGCCTCATTCTCA
CCACCACCACCACCATCACCACCACCATCACCACCATCACCACCATTACCACCATCACCACCACCACCACAATCAGGATGCTGCATACTCACCTAGTCCTGGAACAGAGG
AGCACAAACATGCACTGAAGAATGGGGTCTCATCTGCTCCCGAAGCTGGTTCATCTCCAGTGGAAAGTCCAACTGCAAATAAAAGAAACTATGAAGCTACTCCGCCTGCT
TTTCAATATGGATATAAGAGGTCTTCAAGAAAAGTCAGAAAACAATCTCATTTAGGCCCTATTCCTTCTCGAAGCAGTCCTCCATTGTCACCATTCTTACGAGTAGGCCT
GCCAGCACCTGTTTCTGATTCTATTTCTGCTTCAAGTCCACTGTCAGGTGTAGTTCTATCTAGTGTACAGTCTCCAAATACAGGCGGTGGACATGCAGAAAATTTTGAAA
GAAGTCCCCCTTCAGTCTTACCACCTCAATTTTCTTGGGGAATTGTATATTTGGTTTTGGTTAGAATTACACAGAGGCAAAAGGCTGCAACTGTTACAGTTTCTGATGGA
AAATCAAGCAAGTTGGGAGATGCATTTTTCCAGGTCAAAGTCACAGAGGTGGCAGGCCTTTGTTCCTTCTTCTTCTCTGCCATGGCGATCACCATCGTTGACCATCAAGT
TCCCTCCGATTCCCACAATTTGTTCGACGTAACTTTCGATTCCGAGGAGCCAATTCTCACTCTTCTCACCACTTCACCATCCATGGTAGATGATTGGATATCCGAAACCC
TCGCCATTCGAACTCCACCTCTCATCGTCGGCCTCGACATCGAATGGCGCCCTAATAATCGGTCCTACGACAACCCCGTCGCCACCTTGCAACTCTGCATCGGCCGCCGC
TGCCTGATTCTGCAACTGATCCACACACCTGAGATCCCTAAATCTCTGTTCGAGTTTCTGGAAAACGAATCCTACACATTCGTAGGAGTGGGAATCGACGAGGATGCTGA
AAAGCTCACCTGTGATTACGGATTGAAAGTGGGGAAGAGAGTGGATCTGAGGAATTTGGCTGAGAGTGTAACGGGAAGAGGAGATTTGAAGAATGCGGGATTGAAGAGAT
TGGGGAAAGAGGTTTTGGGGAAAGAGATTGAAAAGCCGAAGAGGGTGACGCTGAGTAGATGGGATCAACAGTGGCTTACTCTTAATCAGGTTAAGTATGCTTGTATTGAT
GCCTTTTTTTCGTTTGAGATTGGAAGGTTTTTGCAATCTTCATCCTATTAA

Protein sequence

Show/hide protein sequence

MGKSEEEQPLPVGVSSSELSDRNVEGRCGGGGCSGIRRLIAVRCVFFLLLSAAVFLSAIFWLPPFLSDGNWPDRPIDSAYRDHEIVASFHAWKPVPFMENHIFELEDNIF
GEIPVPFVKVSSSVSCFLWLDVSHFWSFDQILSFNQVVILSLQSLGGPNVTKIVFAVDSDAKYSKIPPTSQSLIKDTFETLVINEPPLRLNASLFGNTSLFKVLKFPGGI
TIIPPQSAFPLQAAQIYFNFTLNYSIYQIQVNFDDLTSQLRSGLHLSPYENLYVSLSNKRGSTIHSPTIVQSSVLMAIGTNSSKQRLKQLAQTITNSHSGNLGLNNTVFG
KVKQVRLSSVLNHSLGGGGSARSPSPAPLPHSHHHHHHHHHHHHHHHHYHHHHHHHNQDAAYSPSPGTEEHKHALKNGVSSAPEAGSSPVESPTANKRNYEATPPAFQYG
YKRSSRKVRKQSHLGPIPSRSSPPLSPFLRVGLPAPVSDSISASSPLSGVVLSSVQSPNTGGGHAENFERSPPSVLPPQFSWGIVYLVLVRITQRQKAATVTVSDGKSSK
LGDAFFQVKVTEVAGLCSFFFSAMAITIVDHQVPSDSHNLFDVTFDSEEPILTLLTTSPSMVDDWISETLAIRTPPLIVGLDIEWRPNNRSYDNPVATLQLCIGRRCLIL
QLIHTPEIPKSLFEFLENESYTFVGVGIDEDAEKLTCDYGLKVGKRVDLRNLAESVTGRGDLKNAGLKRLGKEVLGKEIEKPKRVTLSRWDQQWLTLNQVKYACIDAFFS
FEIGRFLQSSSY

CaUC10G193920 (gene) of Watermelon (USVL246-FR2) v1 genome