CuGenDBv2

Gene ID	Clc03G04670
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	serine/arginine repetitive matrix protein 1-like
Genome location	ClcChr03:4559643..4562515
RNA-Seq Expression	Clc03G04670
Synteny	Clc03G04670
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6573173.1 hypothetical protein SDJN03_27060, partial [Cucurbita argyrosperma subsp. sororia]

2.6e-75

52.02

Show/hide

Query:  VLRGIISPPRFRSSPREGRS-HNNATINPPSKPT----SKKPNNHNNPN--RSQRKETQLTAT-RPTKSNNVNTSSKNTSRINPSTKPTSKLVSS-----
        ++RGIISPPR RSSPRE R  +NN   NPPS+P      ++P    NPN  R+ RKE Q T   RPTK  +    S N  RI+PS +P SKL  S     
Subjt:  VLRGIISPPRFRSSPREGRS-HNNATINPPSKPT----SKKPNNHNNPN--RSQRKETQLTAT-RPTKSNNVNTSSKNTSRINPSTKPTSKLVSS-----

Query:  NPSHKKLENNSTTKI-------HPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPN---------PYSPAQFA--TLHDLDV
        +P+ +KL+  +  K         P+K   P  SKSN KG  A GSGSRS+ S A KP+   K    + R G  N          YS   +   TL D DV
Subjt:  NPSHKKLENNSTTKI-------HPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPN---------PYSPAQFA--TLHDLDV

Query:  LDQLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQ--SNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEY
          +L + S+D KDLA+IVLH     ES+ S+T EE  S   +N SRMFQIYKEIASH Q NSSITSY TKL+ALW+EL  +  D P+CSCG  TEK SE 
Subjt:  LDQLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQ--SNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEY

Query:  MERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLHQHQFDQ
        +ERE+VMQFL+GLNDSYS +C QIL   PFPTVEKA  AI+REEKRREL+ +LE VA KVIQNNWL    QN HS NGDN +     VD  NL   + DQ
Subjt:  MERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLHQHQFDQ

Query:  NLVTSFPIDPLLTDLGSPVRC
        N   S PI+PLL DLGSPVRC
Subjt:  NLVTSFPIDPLLTDLGSPVRC

XP_022954810.1 serine/arginine repetitive matrix protein 1-like [Cucurbita moschata]

1.2e-75

51.67

Show/hide

Query:  VLRGIISPPRFRSSPREGRS-HNNATINPPSKPT----SKKPNNHNNPN--RSQRKETQLTAT-RPTKSNNVNTSSKNTSRINPSTKPTSKLVSS-----
        ++RGIISPPR RSSPRE R  +NN   NPPS+P      ++P    NPN  R+ RKE Q T   RPTK  +    S N  RI+PS +P SKL  S     
Subjt:  VLRGIISPPRFRSSPREGRS-HNNATINPPSKPT----SKKPNNHNNPN--RSQRKETQLTAT-RPTKSNNVNTSSKNTSRINPSTKPTSKLVSS-----

Query:  NPSHKKLEN----NSTTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPN---------PYSPAQFA--TLHDLDVLDQ
        +P+ +KL+      +TT+    + T+P +  S   G+ A GSGSRS+ S A KP+   K    + R G  N          YS   +   TL D DV  +
Subjt:  NPSHKKLEN----NSTTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPN---------PYSPAQFA--TLHDLDVLDQ

Query:  LQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQ--SNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMER
        L + S+D KDLA+IVLH     ES+ S+TKEE  S   +N SRMFQIYKEIASH Q NSSITSY TKL+ALW+EL  +  D P+CSCG  TEK SE +ER
Subjt:  LQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQ--SNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMER

Query:  ERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLHQHQFDQNLV
        E+VMQFL+GLNDSYS +C QIL   PFPTVEKA  AI+REEKRREL+ +LE VA KVIQNNWL    QN HS NGDN +     VD  NL   + DQN  
Subjt:  ERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLHQHQFDQNLV

Query:  TSFPIDPLLTDLGSPVRC
         S PI+PLL DLGSPVRC
Subjt:  TSFPIDPLLTDLGSPVRC

XP_038895285.1 GATA zinc finger domain-containing protein 11-like isoform X1 [Benincasa hispida]

1.8e-108

64.85

Show/hide

Query:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKETQLTATRPTKSNNVN--TSSKNTSRINPSTKPTSKLVSSNP--------
        MV+RGI+SPPR + S     S+N A     SKP        N  +++ R+ET+ T  RPTK+NN N  +S+ NTSRINPS K TSKLVSS P        
Subjt:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKETQLTATRPTKSNNVN--TSSKNTSRINPSTKPTSKLVSSNP--------

Query:  SHKKLENNSTTKI--HPSK---------RTRPT-SSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNP------YSPAQFATLHDLDVLD
          KKL+ NSTTKI   PS          +TRPT +SK NVK  IA  SGSRSELSSAG      K+KYF SR GSPN       YS   +ATLHDL V D
Subjt:  SHKKLENNSTTKI--HPSK---------RTRPT-SSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNP------YSPAQFATLHDLDVLD

Query:  QLQRFSID----GKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEY
        QLQR SID    GKDLA +VLH     ESMGSDTKE S SQSNDSRMFQIYKEIA HRQENSSITSYFTKLEALW+ELATF TDL QCSCGG TEKLSEY
Subjt:  QLQRFSID----GKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEY

Query:  MERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAH-SNNGDNYDGVQGLVD-SNNLHQHQF
        MERE+VMQFLVGLNDSYSK+CNQIL++ PFPT+EKAY A+IREEK REL+  LE+VA KVIQNNWLDLQNQNAH SNNGDN DGVQ LVD SN+LH+ QF
Subjt:  MERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAH-SNNGDNYDGVQGLVD-SNNLHQHQF

Query:  DQNL
        DQ L
Subjt:  DQNL

XP_038895286.1 hybrid signal transduction histidine kinase L-like isoform X2 [Benincasa hispida]

3.3e-110

65.5

Show/hide

Query:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKETQLTATRPTKSNNVN--TSSKNTSRINPSTKPTSKLVSSNP--------
        MV+RGI+SPPR + S     S+N A     SKP        N  +++ R+ET+ T  RPTK+NN N  +S+ NTSRINPS K TSKLVSS P        
Subjt:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKETQLTATRPTKSNNVN--TSSKNTSRINPSTKPTSKLVSSNP--------

Query:  SHKKLENNSTTKI--HPSK---------RTRPT-SSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNP------YSPAQFATLHDLDVLD
          KKL+ NSTTKI   PS          +TRPT +SK NVK  IA  SGSRSELSSAG      K+KYF SR GSPN       YS   +ATLHDL V D
Subjt:  SHKKLENNSTTKI--HPSK---------RTRPT-SSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNP------YSPAQFATLHDLDVLD

Query:  QLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMERE
        QLQR SIDGKDLA +VLH     ESMGSDTKE S SQSNDSRMFQIYKEIA HRQENSSITSYFTKLEALW+ELATF TDL QCSCGG TEKLSEYMERE
Subjt:  QLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMERE

Query:  RVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAH-SNNGDNYDGVQGLVD-SNNLHQHQFDQNL
        +VMQFLVGLNDSYSK+CNQIL++ PFPT+EKAY A+IREEK REL+  LE+VA KVIQNNWLDLQNQNAH SNNGDN DGVQ LVD SN+LH+ QFDQ L
Subjt:  RVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAH-SNNGDNYDGVQGLVD-SNNLHQHQFDQNL

XP_038895287.1 hybrid signal transduction histidine kinase L-like isoform X3 [Benincasa hispida]

2.0e-107

Show/hide

Query:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKETQLTATRPTKSNNVN--TSSKNTSRINPSTKPTSKLVSSNP--------
        MV+RGI+SPPR + S     S+N A     SKP        N  +++ R+ET+ T  RPTK+NN N  +S+ NTSRINPS K TSKLVSS P        
Subjt:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKETQLTATRPTKSNNVN--TSSKNTSRINPSTKPTSKLVSSNP--------

Query:  SHKKLENNSTTKI--HPSK---------RTRPT-SSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNP------YSPAQFATLHDLDVLD
          KKL+ NSTTKI   PS          +TRPT +SK NVK  IA  SGSRSELSSAG      K+KYF SR GSPN       YS   +ATLHDL V D
Subjt:  SHKKLENNSTTKI--HPSK---------RTRPT-SSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNP------YSPAQFATLHDLDVLD

Query:  QLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMERE
        QLQR SID  DLA +VLH     ESMGSDTKE S SQSNDSRMFQIYKEIA HRQENSSITSYFTKLEALW+ELATF TDL QCSCGG TEKLSEYMERE
Subjt:  QLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMERE

Query:  RVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAH-SNNGDNYDGVQGLVD-SNNLHQHQFDQNL
        +VMQFLVGLNDSYSK+CNQIL++ PFPT+EKAY A+IREEK REL+  LE+VA KVIQNNWLDLQNQNAH SNNGDN DGVQ LVD SN+LH+ QFDQ L
Subjt:  RVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAH-SNNGDNYDGVQGLVD-SNNLHQHQFDQNL

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LRE6 Uncharacterized protein

1.3e-32

36.31

Show/hide

Query:  RGIISPPRFRSSPREGRSHNNATINPPSKPTSKK-PNNHNNPNRSQRKETQLTATRPTKSNNVNTSSKNTSRINPSTKPT------SKLVSSNPS---HK
        RGI+ P R + SP+     N   I+P +K ++KK P    N   S + + Q  AT P  + N    +  T    P   PT      +K     PS   H 
Subjt:  RGIISPPRFRSSPREGRSHNNATINPPSKPTSKK-PNNHNNPNRSQRKETQLTATRPTKSNNVNTSSKNTSRINPSTKPT------SKLVSSNPS---HK

Query:  KLENNSTTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNPYSPAQFATLHDL-DVLDQLQRFSIDGKDLASIV----
         L +N +       +    SS S +     I + + ++      PT+   D        + +P+SP    + HD+ D L  LQR S +GKDL  I+    
Subjt:  KLENNSTTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNPYSPAQFATLHDL-DVLDQLQRFSIDGKDLASIV----

Query:  LHESMGSDTKEESYSQSNDSRM--FQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMERERVMQFLVGLNDSYSKMCNQ
        + + MGS+ ++E  S  N S +   QIY++IASHRQ N S+  YF KL+ LWN++  ++++    S  G+    SE  ER++V+QF +GLND YS +C+Q
Subjt:  LHESMGSDTKEESYSQSNDSRM--FQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMERERVMQFLVGLNDSYSKMCNQ

Query:  ILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYD-GVQGLVDSN
        IL+  PFPTVE+AY  IIREEKRREL  AL TVA +VIQ+++     QN  SNNGDN + G+   +D++
Subjt:  ILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYD-GVQGLVDSN

A0A6J1C5Z8 uncharacterized protein LOC111008588

3.5e-73

47.07

Show/hide

Query:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKET----QLTATRPTKSNNVNTSSKNTSRINPSTKPTSKLVSS---NP---
        M LRG+ISPPR RSSPR+ R HNN   NPPS+P    P         Q  +T      TATR TK        K+  RI PS KPT+ +V S   NP   
Subjt:  MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKET----QLTATRPTKSNNVNTSSKNTSRINPSTKPTSKLVSS---NP---

Query:  -SHKKLENNSTTKIHPSK----RTRPTSSKSNV-----------------KGEIAIGSGSRSELSSAGKPTAI------AKDKYFDSRYGSPNPYSPAQF
         + KKL+  +T KI  +K    RT+P   ++ V                 K  IAI S SRS+  +A    +          ++ D +  + +PYS   +
Subjt:  -SHKKLENNSTTKIHPSK----RTRPTSSKSNV-----------------KGEIAIGSGSRSELSSAGKPTAI------AKDKYFDSRYGSPNPYSPAQF

Query:  ATLHDLDVLDQLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVT
          L D  + + LQR SIDGKDLASI+LH     ES+GSDT EES+ QSN  R+FQIYK+IASHRQENSS+TSYFTKL+ LW+EL T++ D+PQC   G  
Subjt:  ATLHDLDVLDQLQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVT

Query:  EKLSEYMERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLH
        EKLS ++ERE+VMQFL+GLN+SYS +C QIL+  PFPT+EKAY  IIREEKR EL+ +LE VA KV++N WL    QN  S+NG + DG+   V+ N   
Subjt:  EKLSEYMERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLH

Query:  QHQFDQNLVTSFPIDPLLTDLGSPVRC
            D   + SFP + LL DLGSPVRC
Subjt:  QHQFDQNLVTSFPIDPLLTDLGSPVRC

A0A6J1C6Z1 uncharacterized protein LOC111008978

1.0e-32

35.07

Show/hide

Query:  RGIISPPR-FRSSPREGRSHN-NATINPPSKPTSKK---PNNHNNPNRSQRKETQLTATRPTKSNNVNTSSKNTSRINPSTKPTSKLVSSNPSHKKLENN
        RG+ISPPR F  SP    + + +  ++   +PT+     P++H  P R++  + + TA +            + +  N STK T+K+ SS PS   +   
Subjt:  RGIISPPR-FRSSPREGRSHN-NATINPPSKPTSKK---PNNHNNPNRSQRKETQLTATRPTKSNNVNTSSKNTSRINPSTKPTSKLVSSNPSHKKLENN

Query:  STTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNPY------------------SPAQFATLHDLDVLDQLQRFSID
        +  +I   +   P S  +  K + A    S +  +S      +   K+FDS + S   +                    A    L    +   L + S D
Subjt:  STTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNPY------------------SPAQFATLHDLDVLDQLQRFSID

Query:  ------------------GKDLASIVLHES-----MGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVT
                          GK +A+IVL E+     +GS+TK+E  SQSNDS +FQIYK  ASHRQ++SS+TSYF KL+ LW++L  + +DLPQC   G  
Subjt:  ------------------GKDLASIVLHES-----MGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVT

Query:  EKLSEYMERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEK
        +KLSE++ERE+V+QFLVGLNDSYS + +QIL   P PTVEKAY+  I+EEK+R L + L+ + +K
Subjt:  EKLSEYMERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEK

A0A6J1C7L7 uncharacterized protein LOC111008986

2.7e-41

43.91

Show/hide

Query:  RGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNR-SQRKETQLTATRPTKSNNVNTSSKNTSRINPSTKPTSKLVSSNPSHKKLEN-NSTT
        RG+ISPP+ R S  E  S NNA  NPPS P        +   R    K+ Q T T+PT  +N   ++KN+S       P+ +  +  P++    N NSTT
Subjt:  RGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNR-SQRKETQLTATRPTKSNNVNTSSKNTSRINPSTKPTSKLVSSNPSHKKLEN-NSTT

Query:  KIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNPYSPAQFATLHDLDVLDQLQRFSIDGKDLASIV-----LHESMGSD
        K+  +K T  TS  SNV G      G    L S    ++     + D+   +           +    V++QLQ+ SIDGK  A +V     + ES+G  
Subjt:  KIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNPYSPAQFATLHDLDVLDQLQRFSIDGKDLASIV-----LHESMGSD

Query:  TKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQ-CSCGGVTEKLSEYMERERVMQFLVGLNDSYSKMCNQILITPPFPT
        TKEE   QSN  R+ +IYK+IASHRQ NSSITSYFTKLE LW EL T+ +DLPQ CS     +K S+ +ERE+VMQFLVGLNDSYS +C+QIL+  PFPT
Subjt:  TKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQ-CSCGGVTEKLSEYMERERVMQFLVGLNDSYSKMCNQILITPPFPT

Query:  VEKAYYAIIREE
        VEKAY  II +E
Subjt:  VEKAYYAIIREE

A0A6J1GTG4 serine/arginine repetitive matrix protein 1-like

5.7e-76

51.67

Show/hide

Query:  VLRGIISPPRFRSSPREGRS-HNNATINPPSKPT----SKKPNNHNNPN--RSQRKETQLTAT-RPTKSNNVNTSSKNTSRINPSTKPTSKLVSS-----
        ++RGIISPPR RSSPRE R  +NN   NPPS+P      ++P    NPN  R+ RKE Q T   RPTK  +    S N  RI+PS +P SKL  S     
Subjt:  VLRGIISPPRFRSSPREGRS-HNNATINPPSKPT----SKKPNNHNNPN--RSQRKETQLTAT-RPTKSNNVNTSSKNTSRINPSTKPTSKLVSS-----

Query:  NPSHKKLEN----NSTTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPN---------PYSPAQFA--TLHDLDVLDQ
        +P+ +KL+      +TT+    + T+P +  S   G+ A GSGSRS+ S A KP+   K    + R G  N          YS   +   TL D DV  +
Subjt:  NPSHKKLEN----NSTTKIHPSKRTRPTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPN---------PYSPAQFA--TLHDLDVLDQ

Query:  LQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQ--SNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMER
        L + S+D KDLA+IVLH     ES+ S+TKEE  S   +N SRMFQIYKEIASH Q NSSITSY TKL+ALW+EL  +  D P+CSCG  TEK SE +ER
Subjt:  LQRFSIDGKDLASIVLH-----ESMGSDTKEESYSQ--SNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMER

Query:  ERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLHQHQFDQNLV
        E+VMQFL+GLNDSYS +C QIL   PFPTVEKA  AI+REEKRREL+ +LE VA KVIQNNWL    QN HS NGDN +     VD  NL   + DQN  
Subjt:  ERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLDLQNQNAHSNNGDNYDGVQGLVDSNNLHQHQFDQNLV

Query:  TSFPIDPLLTDLGSPVRC
         S PI+PLL DLGSPVRC
Subjt:  TSFPIDPLLTDLGSPVRC

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G21280.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162); Has 707 Blast hits to 705 proteins in 25 species: Archae - 0; Bacteria - 0; Metazoa - 4; Fungi - 0; Plants - 703; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink).

2.7e-09

26.22

Show/hide

Query:  YFDSRYGSPNPYSPAQFATLHDLDVLDQLQRFSIDGKDLASIVLHES---MGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELA
        + D     P+P+SP          ++      S+  K L S++  E+   M  D +   +    D +++Q+ + +A+ RQ   S+  YF KL  +W EL+
Subjt:  YFDSRYGSPNPYSPAQFATLHDLDVLDQLQRFSIDGKDLASIVLHES---MGSDTKEESYSQSNDSRMFQIYKEIASHRQENSSITSYFTKLEALWNELA

Query:  TFNTDLPQCSCGG----VTEKLSEYMERERVMQFLVG--LNDSYSKMCNQILITPPFPTVEKAY
         +   +P+C CGG     T++  E  E+E+  +FL+G  LN  +  +  +I+   P P++ +A+
Subjt:  TFNTDLPQCSCGG----VTEKLSEYMERERVMQFLVG--LNDSYSKMCNQILITPPFPTVEKAY

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTGTTAAGAGGAATTATCAGTCCCCCAAGATTCCGATCTTCTCCCAGAGAAGGCAGATCTCACAATAATGCAACCATCAATCCACCTTCCAAACCCACTTCAAAGAA
ACCAAACAATCATAATAATCCCAACCGAAGCCAAAGAAAAGAAACCCAACTCACTGCTACCCGTCCAACCAAAAGCAACAACGTTAATACATCTTCAAAAAATACTTCAC
GAATCAACCCTTCAACAAAACCCACTTCAAAGCTCGTATCTTCAAATCCTAGCCACAAGAAATTAGAAAACAATTCAACTACTAAAATCCACCCATCAAAACGGACGCGA
CCGACGTCTTCAAAGAGCAATGTAAAAGGGGAGATTGCGATTGGTTCTGGTTCAAGATCTGAGCTTTCTTCTGCTGGGAAACCAACGGCCATTGCTAAGGATAAATATTT
TGATTCTCGATATGGGTCTCCTAACCCTTATTCGCCTGCACAGTTTGCTACTCTGCACGATCTTGACGTTCTTGATCAGTTACAACGTTTTTCTATCGACGGTAAAGATC
TTGCAAGCATTGTCCTTCATGAATCAATGGGATCGGATACAAAGGAAGAAAGTTATTCTCAAAGCAATGATTCGAGAATGTTTCAAATTTACAAGGAAATTGCATCTCAT
CGTCAAGAAAACTCATCCATTACATCTTACTTCACAAAGCTCGAGGCATTATGGAATGAACTCGCCACCTTCAATACCGATTTGCCTCAATGTTCTTGCGGTGGTGTAAC
TGAAAAGCTAAGTGAGTATATGGAGAGAGAAAGGGTTATGCAATTTCTTGTGGGACTAAACGATTCTTATTCCAAAATGTGCAACCAAATCCTTATTACCCCTCCATTTC
CAACGGTGGAGAAAGCCTATTATGCAATTATTCGAGAAGAAAAACGTAGGGAATTGCTTGCTGCATTAGAAACTGTTGCGGAAAAAGTAATTCAAAACAATTGGCTTGAT
CTTCAGAATCAGAATGCTCATTCCAACAATGGTGATAACTATGATGGTGTTCAAGGATTAGTTGATAGTAATAATCTTCACCAGCACCAATTTGATCAAAATCTAGTTAC
AAGCTTCCCCATTGACCCATTGCTAACAGACCTTGGATCTCCTGTGCGATGCTAA

mRNA sequence

Show/hide mRNA sequence

GCTCATTATACAATTAGATAATTAAATTGAGATGTAGCTCAAAGTCTTGAATGGGTTGGGTAATTTTCAGAAAGCAAAAACCACTGAGTAAAGCTAGAGAGAGCATCTGT
CACTAATAGCTCTCAGCTAAGCAAGGGAGAAAAGAAATGGTGTTAAGAGGAATTATCAGTCCCCCAAGATTCCGATCTTCTCCCAGAGAAGGCAGATCTCACAATAATGC
AACCATCAATCCACCTTCCAAACCCACTTCAAAGAAACCAAACAATCATAATAATCCCAACCGAAGCCAAAGAAAAGAAACCCAACTCACTGCTACCCGTCCAACCAAAA
GCAACAACGTTAATACATCTTCAAAAAATACTTCACGAATCAACCCTTCAACAAAACCCACTTCAAAGCTCGTATCTTCAAATCCTAGCCACAAGAAATTAGAAAACAAT
TCAACTACTAAAATCCACCCATCAAAACGGACGCGACCGACGTCTTCAAAGAGCAATGTAAAAGGGGAGATTGCGATTGGTTCTGGTTCAAGATCTGAGCTTTCTTCTGC
TGGGAAACCAACGGCCATTGCTAAGGATAAATATTTTGATTCTCGATATGGGTCTCCTAACCCTTATTCGCCTGCACAGTTTGCTACTCTGCACGATCTTGACGTTCTTG
ATCAGTTACAACGTTTTTCTATCGACGGTAAAGATCTTGCAAGCATTGTCCTTCATGAATCAATGGGATCGGATACAAAGGAAGAAAGTTATTCTCAAAGCAATGATTCG
AGAATGTTTCAAATTTACAAGGAAATTGCATCTCATCGTCAAGAAAACTCATCCATTACATCTTACTTCACAAAGCTCGAGGCATTATGGAATGAACTCGCCACCTTCAA
TACCGATTTGCCTCAATGTTCTTGCGGTGGTGTAACTGAAAAGCTAAGTGAGTATATGGAGAGAGAAAGGGTTATGCAATTTCTTGTGGGACTAAACGATTCTTATTCCA
AAATGTGCAACCAAATCCTTATTACCCCTCCATTTCCAACGGTGGAGAAAGCCTATTATGCAATTATTCGAGAAGAAAAACGTAGGGAATTGCTTGCTGCATTAGAAACT
GTTGCGGAAAAAGTAATTCAAAACAATTGGCTTGATCTTCAGAATCAGAATGCTCATTCCAACAATGGTGATAACTATGATGGTGTTCAAGGATTAGTTGATAGTAATAA
TCTTCACCAGCACCAATTTGATCAAAATCTAGTTACAAGCTTCCCCATTGACCCATTGCTAACAGACCTTGGATCTCCTGTGCGATGCTAAGAAATTTCAGGATTAGTTG
GAGTTGTCAAACTATTAAGCATCATGGGTGAGAGACTTCACATTGAAAAAACTTAGCCTCCACAACAAGTGAGTAGGAACTTTTGTATTTTGTAGCTTGTTTATGTGGTT
CATAGGATATTAGAATTGAGATTCACTTATTTCTTAAATGCAATATAAATTGTTTGAATACAAATAAACTACGCCAAGAATTGAATAGGAATCTTAATTTTTAGTATAGA
AGTAAGTTTGCTTTTGTTCTCATCATTGTGTAATTAGTTTAATTTTTGGCAATGGCCTATGCACATTTTCATTACTCAATTGTTGTTGGATGTGAGATAAACACATCATT
TCTTTCTCAAA

Protein sequence

Show/hide protein sequence

MVLRGIISPPRFRSSPREGRSHNNATINPPSKPTSKKPNNHNNPNRSQRKETQLTATRPTKSNNVNTSSKNTSRINPSTKPTSKLVSSNPSHKKLENNSTTKIHPSKRTR
PTSSKSNVKGEIAIGSGSRSELSSAGKPTAIAKDKYFDSRYGSPNPYSPAQFATLHDLDVLDQLQRFSIDGKDLASIVLHESMGSDTKEESYSQSNDSRMFQIYKEIASH
RQENSSITSYFTKLEALWNELATFNTDLPQCSCGGVTEKLSEYMERERVMQFLVGLNDSYSKMCNQILITPPFPTVEKAYYAIIREEKRRELLAALETVAEKVIQNNWLD
LQNQNAHSNNGDNYDGVQGLVDSNNLHQHQFDQNLVTSFPIDPLLTDLGSPVRC

Clc03G04670 (gene) of Watermelon (cordophanus) v2 genome