; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Spg026064 (gene) of Sponge gourd (cylindrica) v1 genome

Gene IDSpg026064
OrganismLuffa cylindrica (Sponge gourd (cylindrica) v1)
DescriptionLINE-1 retrotransposable element ORF2 protein
Genome locationscaffold7:572538..590593
RNA-Seq ExpressionSpg026064
SyntenySpg026064
Gene Ontology termsGO:0110165 - cellular anatomical structure (cellular component)
InterPro domainsIPR025558 - Domain of unknown function DUF4283
IPR036691 - Endonuclease/exonuclease/phosphatase superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
CAN75028.1 hypothetical protein VITISV_026823 [Vitis vinifera]3.3e-6033.18Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        ++I  +LD W++  LS GGR+TL  S LS +P Y++S F MP  V +K+ERL + FLW G    K +HL RW+ V KP   GG G+G +  RNLALL KW
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKD-H
         WRY RE  +LW +V+ SI+G +   W  +  V  S R PW  I++V+++F  +  + +GNG RI FW D W  D P  ++YP LFR+    N S+    
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKD-H

Query:  WDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF-----------NY------------------WLPIH----
              LWN++F   L + EI D + LM   +   +S    D+R+W L +SGL+SVKS F           N+                  WL  H    
Subjt:  WDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF-----------NY------------------WLPIH----

Query:  -------------LYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRI
                     L    C+       +   L   C      W +L  + K+ WV  +S    +     G        +LW     A+   +W+ERN +I
Subjt:  -------------LYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRI

Query:  FHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA
        F D +      ++S    AS W   SK F G  +  I L+W A
Subjt:  FHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA

CAN82685.1 hypothetical protein VITISV_000485 [Vitis vinifera]4.3e-6035.35Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ ++FLW G+   K +HL RWE VS+P   GG G G +  RN+ALL KW
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW
         WR+ RE   LW KV+ SI+G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C ++  L+R+  + N +V +  
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW

Query:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF----NYWLPIHLYTKKCL---KLFGRLNALRELIFFCWGK
             L WN++F   L + EI   Q+LM+  +    S   +DSR WSL +SGL+SVKS F        PI     K L   K+  ++ AL  ++    GK
Subjt:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF----NYWLPIHLYTKKCL---KLFGRLNALRELIFFCWGK

Query:  LLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW
        L  +  L WV  +SF+  +     G         LW      +   +W ERN RIF D        ++     ++ W S S  F G  +  + LNW
Subjt:  LLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW

KAA0035739.1 hypothetical protein E6C27_scaffold403G00100 [Cucumis melo var. makuwa]1.6e-6737.21Show/hide
Query:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE
        +++F  EG   SK+N L  W +VS P   GG G+GG+K  N ALLAKWGWRY +E  +LW +V++SIHG+  ++W T GK G SLRSPW+NI++ W+  +
Subjt:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE

Query:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY
        +LASF LGNG RI F +D WV + P   ++  LFRIA  P  S           W ++F   L++EEI++FQ L+   +   V    D R WS+E+ G +
Subjt:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY

Query:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL
        S KSL  +                            W+                PI++    C         L  +  +C      W ++ S+F L W  
Subjt:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL

Query:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA
        D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A L A++WCSL K F  +SIQDICLNW A
Subjt:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA

RVX11253.1 putative ribonuclease H protein [Vitis vinifera]3.3e-6035.52Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ + FLW G    K +HL RWE +S+P   GG G G    RN+ALL KW
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW
         WR++RE   LW KV+ SI+G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C +Y  L+R+ S+ N +V +  
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW

Query:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLFNYWL-----PIHLYTKKCL---KLFGRLNALRELIFFCWG
             L WN +F   L + +I   Q+LM+  N  ++S   SDSR WSL +SG +SVKS F Y L     P+     K L   K+  ++ AL  L+    G
Subjt:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLFNYWL-----PIHLYTKKCL---KLFGRLNALRELIFFCWG

Query:  KLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW
        K++ +  + WV  +S +  +     G         LW      +   +W ERN RIF D        ++  R  +S W S ++ F G  +  + LNW
Subjt:  KLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW

TYK21876.1 hypothetical protein E5676_scaffold494G00090 [Cucumis melo var. makuwa]2.9e-6435.99Show/hide
Query:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE
        +++F  EG   SK+N L  W +VS     GG G+GG+K  N ALLAKWGWRY +E  +LW +V++SIHG+  ++W T GK G SLRS W+NI++ W+  +
Subjt:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE

Query:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY
        +LASF LGNG RI F +D WV + P   ++  LF IA  P              W ++F   L++EEI++FQ L+   +   V    D R WS+E+ G +
Subjt:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY

Query:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL
        S KSL  +                            W+                PI++    C         L  +  +C      W ++ S+F L W  
Subjt:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL

Query:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEAFI
        D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A L A++WCSL K F  +SIQDICLNW  F+
Subjt:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEAFI

TrEMBL top hitse value%identityAlignment
A0A438JQM5 Putative ribonuclease H protein1.6e-6035.52Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ + FLW G    K +HL RWE +S+P   GG G G    RN+ALL KW
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW
         WR++RE   LW KV+ SI+G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C +Y  L+R+ S+ N +V +  
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW

Query:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLFNYWL-----PIHLYTKKCL---KLFGRLNALRELIFFCWG
             L WN +F   L + +I   Q+LM+  N  ++S   SDSR WSL +SG +SVKS F Y L     P+     K L   K+  ++ AL  L+    G
Subjt:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLFNYWL-----PIHLYTKKCL---KLFGRLNALRELIFFCWG

Query:  KLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW
        K++ +  + WV  +S +  +     G         LW      +   +W ERN RIF D        ++  R  +S W S ++ F G  +  + LNW
Subjt:  KLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW

A0A5A7T2Y0 zf-RVT domain-containing protein8.0e-6837.21Show/hide
Query:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE
        +++F  EG   SK+N L  W +VS P   GG G+GG+K  N ALLAKWGWRY +E  +LW +V++SIHG+  ++W T GK G SLRSPW+NI++ W+  +
Subjt:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE

Query:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY
        +LASF LGNG RI F +D WV + P   ++  LFRIA  P  S           W ++F   L++EEI++FQ L+   +   V    D R WS+E+ G +
Subjt:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY

Query:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL
        S KSL  +                            W+                PI++    C         L  +  +C      W ++ S+F L W  
Subjt:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL

Query:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA
        D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A L A++WCSL K F  +SIQDICLNW A
Subjt:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA

A0A5D3DE60 zf-RVT domain-containing protein1.4e-6435.99Show/hide
Query:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE
        +++F  EG   SK+N L  W +VS     GG G+GG+K  N ALLAKWGWRY +E  +LW +V++SIHG+  ++W T GK G SLRS W+NI++ W+  +
Subjt:  IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFE

Query:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY
        +LASF LGNG RI F +D WV + P   ++  LF IA  P              W ++F   L++EEI++FQ L+   +   V    D R WS+E+ G +
Subjt:  NLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLY

Query:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL
        S KSL  +                            W+                PI++    C         L  +  +C      W ++ S+F L W  
Subjt:  SVKSLFNY----------------------------WL----------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL

Query:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEAFI
        D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A L A++WCSL K F  +SIQDICLNW  F+
Subjt:  DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEAFI

A5AY60 Reverse transcriptase domain-containing protein2.1e-6035.35Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ ++FLW G+   K +HL RWE VS+P   GG G G +  RN+ALL KW
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW
         WR+ RE   LW KV+ SI+G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C ++  L+R+  + N +V +  
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHW

Query:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF----NYWLPIHLYTKKCL---KLFGRLNALRELIFFCWGK
             L WN++F   L + EI   Q+LM+  +    S   +DSR WSL +SGL+SVKS F        PI     K L   K+  ++ AL  ++    GK
Subjt:  DGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF----NYWLPIHLYTKKCL---KLFGRLNALRELIFFCWGK

Query:  LLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW
        L  +  L WV  +SF+  +     G         LW      +   +W ERN RIF D        ++     ++ W S S  F G  +  + LNW
Subjt:  LLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW

A5BUT3 Reverse transcriptase domain-containing protein1.6e-6033.18Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        ++I  +LD W++  LS GGR+TL  S LS +P Y++S F MP  V +K+ERL + FLW G    K +HL RW+ V KP   GG G+G +  RNLALL KW
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKD-H
         WRY RE  +LW +V+ SI+G +   W  +  V  S R PW  I++V+++F  +  + +GNG RI FW D W  D P  ++YP LFR+    N S+    
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKD-H

Query:  WDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF-----------NY------------------WLPIH----
              LWN++F   L + EI D + LM   +   +S    D+R+W L +SGL+SVKS F           N+                  WL  H    
Subjt:  WDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EFSDSRIWSLENSGLYSVKSLF-----------NY------------------WLPIH----

Query:  -------------LYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRI
                     L    C+       +   L   C      W +L  + K+ WV  +S    +     G        +LW     A+   +W+ERN +I
Subjt:  -------------LYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRI

Query:  FHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA
        F D +      ++S    AS W   SK F G  +  I L+W A
Subjt:  FHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEA

SwissProt top hitse value%identityAlignment
P0C2F6 Putative ribonuclease H protein At1g657506.2e-2531.6Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        +++  ++  WR   LS  GRLTL  +VLSS+P++ MS+ L+P  +++++++L ++FLW  +   K  HL +W +V  P   GG GV   K+ N AL++K 
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWI----NISKVWKQ----FENLASFKL----GNGSRIAFWLDSWVVDLPFCLKYPSLFRI
        GWR ++E +SLW  V++         +H    VG    S W+    + S  W+       ++ S  +    G+G +I FW D WV   P  L+  +  R 
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWI----NISKVWKQ----FENLASFKL----GNGSRIAFWLDSWVVDLPFCLKYPSLFRI

Query:  ASLPNASVKDHW
                KD W
Subjt:  ASLPNASVKDHW

Arabidopsis top hitse value%identityAlignment
AT1G30470.1 SIT4 phosphatase-associated family protein5.7e-1056.45Show/hide
Query:  SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL
        S + EVH+NAA +LC + R+A  GL+ K+SS S    L++H LEDSRP SVL+NSLSV  SL
Subjt:  SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL

AT1G30470.2 SIT4 phosphatase-associated family protein5.7e-1056.45Show/hide
Query:  SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL
        S + EVH+NAA +LC + R+A  GL+ K+SS S    L++H LEDSRP SVL+NSLSV  SL
Subjt:  SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL

AT1G30470.3 SIT4 phosphatase-associated family protein5.7e-1056.45Show/hide
Query:  SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL
        S + EVH+NAA +LC + R+A  GL+ K+SS S    L++H LEDSRP SVL+NSLSV  SL
Subjt:  SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL

AT2G28360.1 SIT4 phosphatase-associated family protein6.6e-0642.22Show/hide
Query:  NEPDVVQQDLQISVLEMGCSASACSEVHSNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL
        N PDV++      +LEM           S+  EV +NAA  LCAITR A   L+ K+SS  FV  +  HA+EDS   S L++SL+V  SL
Subjt:  NEPDVVQQDLQISVLEMGCSASACSEVHSNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSL

AT3G24255.1 RNA-directed DNA polymerase (reverse transcriptase)-related family protein4.7e-1225.58Show/hide
Query:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW
        +KI+ ++ +W   +LS  GRL L +SV+ S+  ++MS+F +P   + +++ +  SFLW G   +       W  V  P   GG G+  LK  N       
Subjt:  DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKW

Query:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSW
                                  W  SG   L     W  I K            + NGS  +FW D+W
Subjt:  GWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSW


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTATTTTGTTGAAGATACGTGCGAGAAGCAGTTGATTTCTTTGTTCATCTCCTTTTTACAGTGGTTTGAAAATGTTCTAGTTGAGGTACTACAAAATCCTGTTTCTTC
TTTCTTTCATAAAAAAAGTAAGGAAGAATTTGGAGTCATTAGATTGATTAAGTTCTTTTCAAACAATGAATGGTTCTTTGAATGTGTTGTATGGCCTTCCACGGGTGGGA
GAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGCTGGTATGTATTTTGGGAAATGATTAGGGATTTTATCCACAAAATTCACCCTTCTGAAAATCAGCCAATT
CAGCCATTGTTGAGTAATTTGAAGGGTCATTTGGTTCCAGATAAAACTTCAAAAGGTCATGTTTCTTCTAATTCTTATGCTGAAGTTGTTAAGAGTGGTGTTTTGATGAA
GAAATCATTCTCCTTGGAAAATTCAGTTAGAAATGTTCGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTTAAATCTTCAGTCTTGG
CCAATCCTTTTATGGATGATAAAGCTTTGATTCTGGTGGCTGATTGTAGTTTGGACCCTTATGTGAATGGTAAGTGGAAGCAATTTGGGAACCTCCATTTGAAATTGGAA
TTTTGGTCCTCTGAGGTTCATTCACAGCCAAAATTTATAAAAAGTTATGGAGGTTGGATTGCAATAAAAGAACCTTTGGATTTGTGGCGCCGGGACTCCTTTGAAGCTAT
TGGAAAGAACCTTGGTGGGTTGATTGGTAATAAGTGTGAACTCTCTTTAAGATTTGGGGATATTAATGCACTAGATGATAGAAATTTGAATTTTGATTCAAGCAAAAGGT
TATCTGTTGATGACTTTTCAAATACCCTAGACGTAATTAGGGTCAGGCAAGCTTTATTGGATGCTGATTTGATTCTTGGCAATGAAGGGGAAAGGATGAATGAATTGCCT
TCATGTTCTCGCCTATTTAAAGGCTGGCTGCCTTCAAGTTTAAGGCATAATATACATTTTGATTTGATTCCTACCTACGGCTACATCACAAAGGGTGCTTTGCTGCATGA
TGAGGGCATTAATAATGTTGGTTGTATGGGTTTTAATGATAGCAATCAAGAGATGGATCCTATTCTCTCTCCTTTTAAAGTTATTAATAATTATAATTGCACCAGCCCTA
AGGAATTCCAGCCGCCATTGTCTGTTGATTATTCTCCCAAAAGTATTAATGTTAGCATTGGAAAAGTGTGTAACCAGCAGACAGCTCCCAAAAGTATTAATGATAGCATT
GAAAAAGTGTGCAATCAGCAAGCAGCTTCAAAGACTTACGCTGGCTGTAATGATCCTCCTCCCAAGATGATTAATGATACTAGTTTATGGCCTTCCACGGGTGGGAGAAG
GTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGATGGTGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTTAGTTAGAAATGATAAGTTTGTTAATAAGG
AAGTTTACTGGGTTCAAAAGAACTGGGATATGCTGAAAATAGATTTGGAAAGCTCTCTTGTTGTTTCTAGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTC
CTTGAGGATTTCTTCAAATCTTCAGTCTTGATCAATCCTTTTATGGATGATAAAGCTTTGATTCAAGTGGCTGATTGTAGTTTGGATCCTTCTGTGAATGGTAAGTGGAA
ACTATTCGGGAACCTTCATTTGAAATTGGAATTTTGGTCCTCTGATTTTCATTCCCAGCCAAAATTTATAAAAAGTTATGGAGGATGGATTGCAATAAAAAATTTACCTT
TGGATTTGTGGCACCGGGACTCCTTTGAAGCTATTGGAAAAAACCTTGGTGGGTTGGTTAGTATTTCTTCCAAGACTCTCAATTTATTGGATTGTTCGGAAGCTTTTATT
GAAGTAGAAATTTTTTTTTGTGGATTTATCCCTGCTGATATTCATGTTAAGATTGGCAATAAATGTGAATTTTCTTTAAGATTTGGGGATATTAAGGCACTAGATGATAG
AAATTTGAACTTTGTTTCAAGTAGAAGGTTATCTGTTGATGACTTTTCAAATTCCTATGTTATTAGGATCAGGCAAGCTGTTTTGGATGATGATTTGATTCTGGGCAATG
AAGAAGAAAGGATGAATGAATTGCCTTCTTGTTCTCGGTCTCAGGGAAAAATTAATGAGGTGTTGGGTTCTCCAAAGGGTGCTTTGTTGCATGAAGAGGGCATTAATAAC
ATTGGTTGTATGGGCTTTAATGATAGCACTCAAGAAATGGATCCTATTCTCTCTCCTTTTAATGTTATTAATGATAATATTTCCACCAGCCCTAAGGAAGTCCAGCAGCC
ACTGCCTATTGATTATTCTCCTAAAAATATTAATGCTAGCATTGGAAAAGTGGGTAATCAGCCAGCAGCTTCCGTAAGTATTATTAATAGCATTGAAAATGATTATTCTC
CTACAAATATTAATGCTAGTATTGGAAAAGTGGCAGACAGCTTTAAAGGGGTTCGATTAGTGAAGCAGTTTAATGCCAACGTTTCAGAAATTAGTGAAGCATTAACTGAA
GGAGAATTGCATGAGTCCCAGAATTTATTATTCACGCCTATTCATGATCCACCTTTGGTTTTGAAGACTTGTAATGAAGATGGTTTGGAAGATAAGGAACAGATTGTTTC
TAAGGCTCTAAAGAAACAATATGAATCTTTTCCTCTTTATTATTCTCATAGGAAAAATGAAAAGACAGCAATTTTGGATTCAATTCCTATTAATTCCAATTATAACCCCG
ACGTGATTGAAGAATCTTGTTCTCAATTTTTGCTGCCTGCTTTGAATCAGACTAAGTGTTGTCAAACTGATCTTAAGGAATTTTCAAATTCCACAGCCTCCAATCAATTC
ATTCTCTCAAATATTCAATCTCACCCTTCTTTATCAAAGGGAGTTTTTCTTCCTTCATCCAAAGTGGTGAGTATTAGTGCCGAGGCTAAAAATCAGTTTTTGAATGATGA
AAACAATGAATTATTGGAGGAAGACTCTTTTGCATTGGCTTTAAATCGGATTTTCCAGAACAATGAAGCTGTTTCTGGAGTTCAGATGAATGTTTGTGAGGATTCGGCAA
CACCTTTAGTTTGTCCCAAGCAAATTTCCTCTCTTTTAGGCGATTGTGACATTCAATTGAAGGAGATTCAGTCTTTTTTACCCTCTGTTACTAACAACATTCATCATTGG
GAGGAAGTTAATGGGGAGTTGGTTATCTCAAAGGACACCTCGGTGCATGAAGAAAGAATTAATTGTGATGGCTGTAATGATCCTCCACCCAAGATAATCAATGATGATAG
TTGTAAGGTGATTAATGAATTTCAGCAGATTTCTAGTGAGAAAGATCAAGTTAATGAGGCGTTGGGGTTTCCAAAAGATGCTTCATTGCATGATAAGAGTTTTAATCATG
TTGGTTGTAAAGGTTTGGATAACAGCTTTAATGAGCCGGATGTTGTTCAGCAGGATCTTCAAATATCAGTGCTGGAAATGGGTTGTTCAGCTTCAGCTTGTTCAGAAGTT
CATTCTAATGCAGCAGAAGTTCATTCTAATGCAGCAGGATTACTTTGTGCTATTACTCGATTTGCTCTTCTTGGTCTTTCGGCTAAAATTTCCAGCACAAGTTTTGTAGA
AAGTTTGGTTCGCCATGCCTTAGAAGATTCTCGTCCAACGTCTGTTTTAATAAACTCGTTATCAGTGGTTAGATCCTTGGAGGCTATCTACTGGATGATCTTTTGTATAC
TCCGGCCAAATTGCCCTTGGATATTCTGTTTCAGCAACTATGGAGGCAGTGGATGGCAGTCAGCATGTACTCATTTAATTGCTGCAACAAAGGCTTCGAGATCTTCAAAT
GTCAATTCTGGAAATGGTTTGTTTCAGGGTAAGGAATTTAAGGAATCTTCTGTTCAAAATCCAAGGGGGAGTGAGGTTTTCGTAAGAGATATTGGTAGATCCTCCAACCA
TAGTATTCATTCACCGGTGGATTCAGATGATGAGTCTACGGTTAGTGTAAGCAGTGAGGATTCTGATCAGTTGGTAGATAAAGAGGATTGTGTGGAATTATTTTCAGAAG
ATCAAATTGTCTTCCAAAGCGGTTGTTTGATCCTTCCTTACTCAATTATGAAGATTGTTAAGTGGAATACCAGGGGTCTCGGTGATAAGTCTAAAAGGGTGGCTTTGAAG
AAATTCCTTCAGAACATTTGCCCTGATTTAGTCTTAATTCAGGAGACTAAACAAGCTGCAATTGATTTGAGATTCATTAAATCCTTATGGAGTTCCAAGGAAATCCGCTC
GACTTTTGTGGAAGCCTATGGAAGATCTAGAGGCGGGTTCTTTTATGTGGGGTCCATCTCCTTTCAGGTTTTACAACAGCTGGCTTTCTCATCTCTAGGATGGGCTGGTT
TTGTTATTAGTTCTAAATTCAAAAATTTAAAAGCAGCTATCAAGAAGTGGTTTGCAGATTTTAAAGCTTGCAGAAAAAGTAAAGAGAAAAGTTTGCTTTCTGAACTTGAA
TTCTTTGATGCCAAGGCTGAAAGTTCTCTTTTATCTGACACTGAGATTGATATTTGGCTGGCTATCAAAGGGGAGATTATGGGATTATATATGTCGGATGAAAGAAATTT
AATTCAGAAGAGTCATCGGTTTCTACCTTCTAATTTATCTTGGGATACTATTTCTGCTGGTCAAAACATAGCCCTTTCGGCTCCTTTTTCTGTTGAAGAAATTAGGGCGA
CTTTGCAGTGGTTATCCGAAAAAGATCTCATTTTGGCAGCCAGTGATGATAAAATTCAGAAAAAGCTTGATAGATGGAGGCGTTTTAATTTATCTAGAGGCGGGAGATTG
ACTTTGTGCAATTCAGTTTTATCAAGTATTCCGTTATATTATATGTCTTCTTTTCTCATGCCTCCTAAAGTTGTTTCAAAAGTGGAACGGTTAATAAAGTCGTTTTTATG
GGAAGGAAGTAATGGATCCAAGTTAAATCACTTGGCTCGTTGGGAGCAAGTTTCAAAACCTCTCTTGAGTGGAGGTTTCGGTGTTGGAGGCTTGAAAAATAGAAATTTGG
CTCTTCTTGCTAAATGGGGTTGGAGATATATGAGAGAGCCTGATTCGTTATGGTGTAAAGTTGTTAAAAGTATTCATGGGCAGAATTGTTATAATTGGCACACTTCTGGT
AAGGTCGGCCTGAGTCTTCGAAGTCCTTGGATTAATATTTCTAAGGTATGGAAGCAATTTGAGAATCTAGCTTCTTTCAAACTTGGTAATGGTTCTAGAATAGCCTTTTG
GCTTGACTCTTGGGTTGTAGATCTTCCTTTTTGTTTAAAATATCCTAGTTTGTTTCGGATAGCTTCTCTTCCAAACGCCTCCGTTAAAGACCATTGGGATGGGGAGACTC
TTTTATGGAATATTTCCTTTTGTTGGCTCTTAAAAGAGGAAGAAATTTCTGATTTTCAGCAGTTGATGGCATGTTTCAATGGTGCCATAGTATCTGAGTTTTCAGATTCA
CGCATTTGGTCCCTCGAGAATTCGGGATTGTATTCGGTGAAGTCTCTTTTTAACTATTGGCTGCCTATTCATCTATACACAAAGAAGTGTTTAAAGCTCTTTGGAAGACT
AAATGCCCTAAGAGAATTAATATTCTTTTGTTGGGGGAAGTTATTGTCTATTTTCAAGCTTCAATGGGTATTGGATCAGTCATTCAAAGGAAATGTGCAGCAGCTTTTAA
TTGGTCCATCAGTTAAGTCGGTTTCTAATTTGCTGTGGTCTAATGGTGTCAAAGCCGTCTTTTTAGAAATTTGGTTTGAAAGGAATCAGAGAATTTTCCATGATATTTCT
CTTCCTTGGTTGGGTCGTTTCAATTCTGCACGGCTCAAAGCTTCGTCTTGGTGTTCTTTGTCCAAGCTTTTCCCAGGATTCTCCATTCAAGATATTTGCCTCAATTGGGA
AGCTTTCATTTTTCCGTCTTAG
mRNA sequenceShow/hide mRNA sequence
ATGTATTTTGTTGAAGATACGTGCGAGAAGCAGTTGATTTCTTTGTTCATCTCCTTTTTACAGTGGTTTGAAAATGTTCTAGTTGAGGTACTACAAAATCCTGTTTCTTC
TTTCTTTCATAAAAAAAGTAAGGAAGAATTTGGAGTCATTAGATTGATTAAGTTCTTTTCAAACAATGAATGGTTCTTTGAATGTGTTGTATGGCCTTCCACGGGTGGGA
GAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGCTGGTATGTATTTTGGGAAATGATTAGGGATTTTATCCACAAAATTCACCCTTCTGAAAATCAGCCAATT
CAGCCATTGTTGAGTAATTTGAAGGGTCATTTGGTTCCAGATAAAACTTCAAAAGGTCATGTTTCTTCTAATTCTTATGCTGAAGTTGTTAAGAGTGGTGTTTTGATGAA
GAAATCATTCTCCTTGGAAAATTCAGTTAGAAATGTTCGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTTAAATCTTCAGTCTTGG
CCAATCCTTTTATGGATGATAAAGCTTTGATTCTGGTGGCTGATTGTAGTTTGGACCCTTATGTGAATGGTAAGTGGAAGCAATTTGGGAACCTCCATTTGAAATTGGAA
TTTTGGTCCTCTGAGGTTCATTCACAGCCAAAATTTATAAAAAGTTATGGAGGTTGGATTGCAATAAAAGAACCTTTGGATTTGTGGCGCCGGGACTCCTTTGAAGCTAT
TGGAAAGAACCTTGGTGGGTTGATTGGTAATAAGTGTGAACTCTCTTTAAGATTTGGGGATATTAATGCACTAGATGATAGAAATTTGAATTTTGATTCAAGCAAAAGGT
TATCTGTTGATGACTTTTCAAATACCCTAGACGTAATTAGGGTCAGGCAAGCTTTATTGGATGCTGATTTGATTCTTGGCAATGAAGGGGAAAGGATGAATGAATTGCCT
TCATGTTCTCGCCTATTTAAAGGCTGGCTGCCTTCAAGTTTAAGGCATAATATACATTTTGATTTGATTCCTACCTACGGCTACATCACAAAGGGTGCTTTGCTGCATGA
TGAGGGCATTAATAATGTTGGTTGTATGGGTTTTAATGATAGCAATCAAGAGATGGATCCTATTCTCTCTCCTTTTAAAGTTATTAATAATTATAATTGCACCAGCCCTA
AGGAATTCCAGCCGCCATTGTCTGTTGATTATTCTCCCAAAAGTATTAATGTTAGCATTGGAAAAGTGTGTAACCAGCAGACAGCTCCCAAAAGTATTAATGATAGCATT
GAAAAAGTGTGCAATCAGCAAGCAGCTTCAAAGACTTACGCTGGCTGTAATGATCCTCCTCCCAAGATGATTAATGATACTAGTTTATGGCCTTCCACGGGTGGGAGAAG
GTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGATGGTGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTTAGTTAGAAATGATAAGTTTGTTAATAAGG
AAGTTTACTGGGTTCAAAAGAACTGGGATATGCTGAAAATAGATTTGGAAAGCTCTCTTGTTGTTTCTAGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTC
CTTGAGGATTTCTTCAAATCTTCAGTCTTGATCAATCCTTTTATGGATGATAAAGCTTTGATTCAAGTGGCTGATTGTAGTTTGGATCCTTCTGTGAATGGTAAGTGGAA
ACTATTCGGGAACCTTCATTTGAAATTGGAATTTTGGTCCTCTGATTTTCATTCCCAGCCAAAATTTATAAAAAGTTATGGAGGATGGATTGCAATAAAAAATTTACCTT
TGGATTTGTGGCACCGGGACTCCTTTGAAGCTATTGGAAAAAACCTTGGTGGGTTGGTTAGTATTTCTTCCAAGACTCTCAATTTATTGGATTGTTCGGAAGCTTTTATT
GAAGTAGAAATTTTTTTTTGTGGATTTATCCCTGCTGATATTCATGTTAAGATTGGCAATAAATGTGAATTTTCTTTAAGATTTGGGGATATTAAGGCACTAGATGATAG
AAATTTGAACTTTGTTTCAAGTAGAAGGTTATCTGTTGATGACTTTTCAAATTCCTATGTTATTAGGATCAGGCAAGCTGTTTTGGATGATGATTTGATTCTGGGCAATG
AAGAAGAAAGGATGAATGAATTGCCTTCTTGTTCTCGGTCTCAGGGAAAAATTAATGAGGTGTTGGGTTCTCCAAAGGGTGCTTTGTTGCATGAAGAGGGCATTAATAAC
ATTGGTTGTATGGGCTTTAATGATAGCACTCAAGAAATGGATCCTATTCTCTCTCCTTTTAATGTTATTAATGATAATATTTCCACCAGCCCTAAGGAAGTCCAGCAGCC
ACTGCCTATTGATTATTCTCCTAAAAATATTAATGCTAGCATTGGAAAAGTGGGTAATCAGCCAGCAGCTTCCGTAAGTATTATTAATAGCATTGAAAATGATTATTCTC
CTACAAATATTAATGCTAGTATTGGAAAAGTGGCAGACAGCTTTAAAGGGGTTCGATTAGTGAAGCAGTTTAATGCCAACGTTTCAGAAATTAGTGAAGCATTAACTGAA
GGAGAATTGCATGAGTCCCAGAATTTATTATTCACGCCTATTCATGATCCACCTTTGGTTTTGAAGACTTGTAATGAAGATGGTTTGGAAGATAAGGAACAGATTGTTTC
TAAGGCTCTAAAGAAACAATATGAATCTTTTCCTCTTTATTATTCTCATAGGAAAAATGAAAAGACAGCAATTTTGGATTCAATTCCTATTAATTCCAATTATAACCCCG
ACGTGATTGAAGAATCTTGTTCTCAATTTTTGCTGCCTGCTTTGAATCAGACTAAGTGTTGTCAAACTGATCTTAAGGAATTTTCAAATTCCACAGCCTCCAATCAATTC
ATTCTCTCAAATATTCAATCTCACCCTTCTTTATCAAAGGGAGTTTTTCTTCCTTCATCCAAAGTGGTGAGTATTAGTGCCGAGGCTAAAAATCAGTTTTTGAATGATGA
AAACAATGAATTATTGGAGGAAGACTCTTTTGCATTGGCTTTAAATCGGATTTTCCAGAACAATGAAGCTGTTTCTGGAGTTCAGATGAATGTTTGTGAGGATTCGGCAA
CACCTTTAGTTTGTCCCAAGCAAATTTCCTCTCTTTTAGGCGATTGTGACATTCAATTGAAGGAGATTCAGTCTTTTTTACCCTCTGTTACTAACAACATTCATCATTGG
GAGGAAGTTAATGGGGAGTTGGTTATCTCAAAGGACACCTCGGTGCATGAAGAAAGAATTAATTGTGATGGCTGTAATGATCCTCCACCCAAGATAATCAATGATGATAG
TTGTAAGGTGATTAATGAATTTCAGCAGATTTCTAGTGAGAAAGATCAAGTTAATGAGGCGTTGGGGTTTCCAAAAGATGCTTCATTGCATGATAAGAGTTTTAATCATG
TTGGTTGTAAAGGTTTGGATAACAGCTTTAATGAGCCGGATGTTGTTCAGCAGGATCTTCAAATATCAGTGCTGGAAATGGGTTGTTCAGCTTCAGCTTGTTCAGAAGTT
CATTCTAATGCAGCAGAAGTTCATTCTAATGCAGCAGGATTACTTTGTGCTATTACTCGATTTGCTCTTCTTGGTCTTTCGGCTAAAATTTCCAGCACAAGTTTTGTAGA
AAGTTTGGTTCGCCATGCCTTAGAAGATTCTCGTCCAACGTCTGTTTTAATAAACTCGTTATCAGTGGTTAGATCCTTGGAGGCTATCTACTGGATGATCTTTTGTATAC
TCCGGCCAAATTGCCCTTGGATATTCTGTTTCAGCAACTATGGAGGCAGTGGATGGCAGTCAGCATGTACTCATTTAATTGCTGCAACAAAGGCTTCGAGATCTTCAAAT
GTCAATTCTGGAAATGGTTTGTTTCAGGGTAAGGAATTTAAGGAATCTTCTGTTCAAAATCCAAGGGGGAGTGAGGTTTTCGTAAGAGATATTGGTAGATCCTCCAACCA
TAGTATTCATTCACCGGTGGATTCAGATGATGAGTCTACGGTTAGTGTAAGCAGTGAGGATTCTGATCAGTTGGTAGATAAAGAGGATTGTGTGGAATTATTTTCAGAAG
ATCAAATTGTCTTCCAAAGCGGTTGTTTGATCCTTCCTTACTCAATTATGAAGATTGTTAAGTGGAATACCAGGGGTCTCGGTGATAAGTCTAAAAGGGTGGCTTTGAAG
AAATTCCTTCAGAACATTTGCCCTGATTTAGTCTTAATTCAGGAGACTAAACAAGCTGCAATTGATTTGAGATTCATTAAATCCTTATGGAGTTCCAAGGAAATCCGCTC
GACTTTTGTGGAAGCCTATGGAAGATCTAGAGGCGGGTTCTTTTATGTGGGGTCCATCTCCTTTCAGGTTTTACAACAGCTGGCTTTCTCATCTCTAGGATGGGCTGGTT
TTGTTATTAGTTCTAAATTCAAAAATTTAAAAGCAGCTATCAAGAAGTGGTTTGCAGATTTTAAAGCTTGCAGAAAAAGTAAAGAGAAAAGTTTGCTTTCTGAACTTGAA
TTCTTTGATGCCAAGGCTGAAAGTTCTCTTTTATCTGACACTGAGATTGATATTTGGCTGGCTATCAAAGGGGAGATTATGGGATTATATATGTCGGATGAAAGAAATTT
AATTCAGAAGAGTCATCGGTTTCTACCTTCTAATTTATCTTGGGATACTATTTCTGCTGGTCAAAACATAGCCCTTTCGGCTCCTTTTTCTGTTGAAGAAATTAGGGCGA
CTTTGCAGTGGTTATCCGAAAAAGATCTCATTTTGGCAGCCAGTGATGATAAAATTCAGAAAAAGCTTGATAGATGGAGGCGTTTTAATTTATCTAGAGGCGGGAGATTG
ACTTTGTGCAATTCAGTTTTATCAAGTATTCCGTTATATTATATGTCTTCTTTTCTCATGCCTCCTAAAGTTGTTTCAAAAGTGGAACGGTTAATAAAGTCGTTTTTATG
GGAAGGAAGTAATGGATCCAAGTTAAATCACTTGGCTCGTTGGGAGCAAGTTTCAAAACCTCTCTTGAGTGGAGGTTTCGGTGTTGGAGGCTTGAAAAATAGAAATTTGG
CTCTTCTTGCTAAATGGGGTTGGAGATATATGAGAGAGCCTGATTCGTTATGGTGTAAAGTTGTTAAAAGTATTCATGGGCAGAATTGTTATAATTGGCACACTTCTGGT
AAGGTCGGCCTGAGTCTTCGAAGTCCTTGGATTAATATTTCTAAGGTATGGAAGCAATTTGAGAATCTAGCTTCTTTCAAACTTGGTAATGGTTCTAGAATAGCCTTTTG
GCTTGACTCTTGGGTTGTAGATCTTCCTTTTTGTTTAAAATATCCTAGTTTGTTTCGGATAGCTTCTCTTCCAAACGCCTCCGTTAAAGACCATTGGGATGGGGAGACTC
TTTTATGGAATATTTCCTTTTGTTGGCTCTTAAAAGAGGAAGAAATTTCTGATTTTCAGCAGTTGATGGCATGTTTCAATGGTGCCATAGTATCTGAGTTTTCAGATTCA
CGCATTTGGTCCCTCGAGAATTCGGGATTGTATTCGGTGAAGTCTCTTTTTAACTATTGGCTGCCTATTCATCTATACACAAAGAAGTGTTTAAAGCTCTTTGGAAGACT
AAATGCCCTAAGAGAATTAATATTCTTTTGTTGGGGGAAGTTATTGTCTATTTTCAAGCTTCAATGGGTATTGGATCAGTCATTCAAAGGAAATGTGCAGCAGCTTTTAA
TTGGTCCATCAGTTAAGTCGGTTTCTAATTTGCTGTGGTCTAATGGTGTCAAAGCCGTCTTTTTAGAAATTTGGTTTGAAAGGAATCAGAGAATTTTCCATGATATTTCT
CTTCCTTGGTTGGGTCGTTTCAATTCTGCACGGCTCAAAGCTTCGTCTTGGTGTTCTTTGTCCAAGCTTTTCCCAGGATTCTCCATTCAAGATATTTGCCTCAATTGGGA
AGCTTTCATTTTTCCGTCTTAG
Protein sequenceShow/hide protein sequence
MYFVEDTCEKQLISLFISFLQWFENVLVEVLQNPVSSFFHKKSKEEFGVIRLIKFFSNNEWFFECVVWPSTGGRRFIQVPAGLNKKGWYVFWEMIRDFIHKIHPSENQPI
QPLLSNLKGHLVPDKTSKGHVSSNSYAEVVKSGVLMKKSFSLENSVRNVRLMAHYSWKEVKLVLEDFFKSSVLANPFMDDKALILVADCSLDPYVNGKWKQFGNLHLKLE
FWSSEVHSQPKFIKSYGGWIAIKEPLDLWRRDSFEAIGKNLGGLIGNKCELSLRFGDINALDDRNLNFDSSKRLSVDDFSNTLDVIRVRQALLDADLILGNEGERMNELP
SCSRLFKGWLPSSLRHNIHFDLIPTYGYITKGALLHDEGINNVGCMGFNDSNQEMDPILSPFKVINNYNCTSPKEFQPPLSVDYSPKSINVSIGKVCNQQTAPKSINDSI
EKVCNQQAASKTYAGCNDPPPKMINDTSLWPSTGGRRFIQVPAGLNKKGWCGVLMKKSFSLENLVRNDKFVNKEVYWVQKNWDMLKIDLESSLVVSRLMAHYSWKEVKLV
LEDFFKSSVLINPFMDDKALIQVADCSLDPSVNGKWKLFGNLHLKLEFWSSDFHSQPKFIKSYGGWIAIKNLPLDLWHRDSFEAIGKNLGGLVSISSKTLNLLDCSEAFI
EVEIFFCGFIPADIHVKIGNKCEFSLRFGDIKALDDRNLNFVSSRRLSVDDFSNSYVIRIRQAVLDDDLILGNEEERMNELPSCSRSQGKINEVLGSPKGALLHEEGINN
IGCMGFNDSTQEMDPILSPFNVINDNISTSPKEVQQPLPIDYSPKNINASIGKVGNQPAASVSIINSIENDYSPTNINASIGKVADSFKGVRLVKQFNANVSEISEALTE
GELHESQNLLFTPIHDPPLVLKTCNEDGLEDKEQIVSKALKKQYESFPLYYSHRKNEKTAILDSIPINSNYNPDVIEESCSQFLLPALNQTKCCQTDLKEFSNSTASNQF
ILSNIQSHPSLSKGVFLPSSKVVSISAEAKNQFLNDENNELLEEDSFALALNRIFQNNEAVSGVQMNVCEDSATPLVCPKQISSLLGDCDIQLKEIQSFLPSVTNNIHHW
EEVNGELVISKDTSVHEERINCDGCNDPPPKIINDDSCKVINEFQQISSEKDQVNEALGFPKDASLHDKSFNHVGCKGLDNSFNEPDVVQQDLQISVLEMGCSASACSEV
HSNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSLEAIYWMIFCILRPNCPWIFCFSNYGGSGWQSACTHLIAATKASRSSN
VNSGNGLFQGKEFKESSVQNPRGSEVFVRDIGRSSNHSIHSPVDSDDESTVSVSSEDSDQLVDKEDCVELFSEDQIVFQSGCLILPYSIMKIVKWNTRGLGDKSKRVALK
KFLQNICPDLVLIQETKQAAIDLRFIKSLWSSKEIRSTFVEAYGRSRGGFFYVGSISFQVLQQLAFSSLGWAGFVISSKFKNLKAAIKKWFADFKACRKSKEKSLLSELE
FFDAKAESSLLSDTEIDIWLAIKGEIMGLYMSDERNLIQKSHRFLPSNLSWDTISAGQNIALSAPFSVEEIRATLQWLSEKDLILAASDDKIQKKLDRWRRFNLSRGGRL
TLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSG
KVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDS
RIWSLENSGLYSVKSLFNYWLPIHLYTKKCLKLFGRLNALRELIFFCWGKLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDIS
LPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEAFIFPS