; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Chy9G164090 (gene) of Cucumber (hystrix) v1 genome

Gene IDChy9G164090
OrganismCucumis hystrix (Cucumber (hystrix) v1)
DescriptionRNase H domain-containing protein
Genome locationchrH09:9207569..9217076
RNA-Seq ExpressionChy9G164090
SyntenyChy9G164090
Gene Ontology termsGO:0090502 - RNA phosphodiester bond hydrolysis, endonucleolytic (biological process)
GO:0003676 - nucleic acid binding (molecular function)
GO:0004523 - RNA-DNA hybrid ribonuclease activity (molecular function)
InterPro domainsIPR002156 - Ribonuclease H domain
IPR012337 - Ribonuclease H-like superfamily
IPR036397 - Ribonuclease H superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_004143798.1 uncharacterized protein LOC101210930 isoform X1 [Cucumis sativus]3.74e-25496.7Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSN+YWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPP+ESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFH GDTSLTGET GQDAIKKRSREAIV ENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIH
        GSTVLTPT K PTRKHIK+EDSIVS S+SSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLKSALKKGFTRIH
Subjt:  GSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIH

Query:  VQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
        VQGDSKLVCMQVQGLWKAK+ENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
Subjt:  VQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

XP_008465682.1 PREDICTED: uncharacterized protein LOC103503315 isoform X1 [Cucumis melo]7.92e-24392.41Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNC SQVSTYTRVIFRRTNLVFAASTSIHGCSN YW+S+FHNVAVK TALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDC AQIGSSICDLPVSVFKGHSLPKD+EEYLAS+GLKNALYTIKAADMRPDLFGSL PCTFHDGD SLTGET GQDAIKKRSREAIVSENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVLTPTS-----KYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG
        GS+VLTPTS     + PTRKHIK+EDSIVS  +SSN ESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLK ALKKG
Subjt:  GSTVLTPTS-----KYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG

Query:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
        FTRIHVQGDSKLVCMQVQGLWKAKNEN+SELCNEV KLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
Subjt:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

XP_008465683.1 PREDICTED: uncharacterized protein LOC103503315 isoform X2 [Cucumis melo]9.94e-23192.05Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNC SQVSTYTRVIFRRTNLVFAASTSIHGCSN YW+S+FHNVAVK TALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDC AQIGSSICDLPVSVFKGHSLPKD+EEYLAS+GLKNALYTIKAADMRPDLFGSL PCTFHDGD SLTGET GQDAIKKRSREAIVSENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVLTPTS-----KYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG
        GS+VLTPTS     + PTRKHIK+EDSIVS  +SSN ESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLK ALKKG
Subjt:  GSTVLTPTS-----KYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG

Query:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR
        FTRIHVQGDSKLVCMQVQGLWKAKNEN+SELCNEV KLKNKFLSFEVNHVLR
Subjt:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR

XP_008465684.1 PREDICTED: uncharacterized protein LOC103503315 isoform X3 [Cucumis melo]8.57e-23192.05Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNC SQVSTYTRVIFRRTNLVFAASTSIHGCSN YW+S+FHNVAVK TALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDC AQIGSSICDLPVSVFKGHSLPKD+EEYLAS+GLKNALYTIKAADMRPDLFGSL PCTFHDGD SLTGET GQDAIKKRSREAIVSENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVLTPTS-----KYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG
        GS+VLTPTS     + PTRKHIK+EDSIVS  +SSN ESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLK ALKKG
Subjt:  GSTVLTPTS-----KYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG

Query:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR
        FTRIHVQGDSKLVCMQVQGLWKAKNEN+SELCNEV KLKNKFLSFEVNHVLR
Subjt:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR

XP_011655308.1 uncharacterized protein LOC101210930 isoform X2 [Cucumis sativus]1.64e-24296.28Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSN+YWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPP+ESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFH GDTSLTGET GQDAIKKRSREAIV ENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIH
        GSTVLTPT K PTRKHIK+EDSIVS S+SSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLKSALKKGFTRIH
Subjt:  GSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIH

Query:  VQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHL
        VQGDSKLVCMQVQGLWKAK+ENMSELCNEVTKLKNKFLSFEVNHVLR L
Subjt:  VQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHL

TrEMBL top hitse value%identityAlignment
A0A0A0KTZ9 RNase H domain-containing protein1.1e-19896.7Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSN+YWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPP+ESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFH GDTSLTGET GQDAIKKRSREAIV ENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIH
        GSTVLTPT K PTRKHIK+EDSIVS S+SSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLKSALKKGFTRIH
Subjt:  GSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIH

Query:  VQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
        VQGDSKLVCMQVQGLWKAK+ENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
Subjt:  VQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

A0A1S3CPG2 uncharacterized protein LOC103503315 isoform X36.2e-18192.05Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNC SQVSTYTRVIFRRTNLVFAASTSIHGCSN YW+S+FHNVAVK TALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDC AQIGSSICDLPVSVFKGHSLPKD+EEYLAS+GLKNALYTIKAADMRPDLFGSL PCTFHDGD SLTGET GQDAIKKRSREAIVSENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG
        GS+VL     TPTS+ PTRKHIK+EDSIV  S+SSN ESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLK ALKKG
Subjt:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG

Query:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR
        FTRIHVQGDSKLVCMQVQGLWKAKNEN+SELCNEV KLKNKFLSFEVNHVLR
Subjt:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR

A0A1S3CPT7 uncharacterized protein LOC103503315 isoform X14.3e-19092.41Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNC SQVSTYTRVIFRRTNLVFAASTSIHGCSN YW+S+FHNVAVK TALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDC AQIGSSICDLPVSVFKGHSLPKD+EEYLAS+GLKNALYTIKAADMRPDLFGSL PCTFHDGD SLTGET GQDAIKKRSREAIVSENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG
        GS+VL     TPTS+ PTRKHIK+EDSIV  S+SSN ESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLK ALKKG
Subjt:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG

Query:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
        FTRIHVQGDSKLVCMQVQGLWKAKNEN+SELCNEV KLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
Subjt:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

A0A1S3CQX0 uncharacterized protein LOC103503315 isoform X26.2e-18192.05Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNC SQVSTYTRVIFRRTNLVFAASTSIHGCSN YW+S+FHNVAVK TALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDC AQIGSSICDLPVSVFKGHSLPKD+EEYLAS+GLKNALYTIKAADMRPDLFGSL PCTFHDGD SLTGET GQDAIKKRSREAIVSENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG
        GS+VL     TPTS+ PTRKHIK+EDSIV  S+SSN ESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLK ALKKG
Subjt:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG

Query:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR
        FTRIHVQGDSKLVCMQVQGLWKAKNEN+SELCNEV KLKNKFLSFEVNHVLR
Subjt:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLR

A0A5A7TCE2 RNase H family protein, putative isoform 24.3e-19092.41Show/hide
Query:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
        MNC SQVSTYTRVIFRRTNLVFAASTSIHGCSN YW+S+FHNVAVK TALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD
Subjt:  MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGD

Query:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV
        VVGVYKSFSDC AQIGSSICDLPVSVFKGHSLPKD+EEYLAS+GLKNALYTIKAADMRPDLFGSL PCTFHDGD SLTGET GQDAIKKRSREAIVSENV
Subjt:  VVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENV

Query:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG
        GS+VL     TPTS+ PTRKHIK+EDSIV  S+SSN ESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRA+LLGLK ALKKG
Subjt:  GSTVL-----TPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKG

Query:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
        FTRIHVQGDSKLVCMQVQGLWKAKNEN+SELCNEV KLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
Subjt:  FTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

SwissProt top hitse value%identityAlignment
P54162 14.7 kDa ribonuclease H-like protein5.7e-0630.65Show/hide
Query:  DGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLS
        DGAS GNPG +G G  ++ H+G         +G+ TN  AE+ A++ G+K    +G+  +  + DS +V  +   L   KN        E+ +LK  F  
Subjt:  DGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLS

Query:  FEVNHVLRHLNSEADAQANLALTL
        F +  +    N +AD  A  A+ L
Subjt:  FEVNHVLRHLNSEADAQANLALTL

P64956 Uncharacterized protein Mb2253c3.2e-1742.64Show/hide
Query:  LEFDGASKGNPGQAGAGAVLRAHDGS-VICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKN
        +E DG S+GNPG AG GAV+   D S V+   ++ +G ATNNVAEYR ++ GL  A+K G T   V  DSKLV  Q+ G WK K+ ++ +L  +   L +
Subjt:  LEFDGASKGNPGQAGAGAVLRAHDGS-VICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKN

Query:  KFLSFEVNHVLRHLNSEADAQANLALTLA
        +F       V R  N+ AD  AN A+  A
Subjt:  KFLSFEVNHVLRHLNSEADAQANLALTLA

P9WLH4 Uncharacterized protein MT22873.2e-1742.64Show/hide
Query:  LEFDGASKGNPGQAGAGAVLRAHDGS-VICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKN
        +E DG S+GNPG AG GAV+   D S V+   ++ +G ATNNVAEYR ++ GL  A+K G T   V  DSKLV  Q+ G WK K+ ++ +L  +   L +
Subjt:  LEFDGASKGNPGQAGAGAVLRAHDGS-VICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKN

Query:  KFLSFEVNHVLRHLNSEADAQANLALTLA
        +F       V R  N+ AD  AN A+  A
Subjt:  KFLSFEVNHVLRHLNSEADAQANLALTLA

P9WLH5 Bifunctional protein Rv2228c3.2e-1742.64Show/hide
Query:  LEFDGASKGNPGQAGAGAVLRAHDGS-VICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKN
        +E DG S+GNPG AG GAV+   D S V+   ++ +G ATNNVAEYR ++ GL  A+K G T   V  DSKLV  Q+ G WK K+ ++ +L  +   L +
Subjt:  LEFDGASKGNPGQAGAGAVLRAHDGS-VICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKN

Query:  KFLSFEVNHVLRHLNSEADAQANLALTLA
        +F       V R  N+ AD  AN A+  A
Subjt:  KFLSFEVNHVLRHLNSEADAQANLALTLA

Q9HSF6 Ribonuclease HI1.6e-1640.65Show/hide
Query:  FDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFL
        FDGAS+GNPG A  G VL + DG ++    + +G ATNN AEY A++  L++A   GF  I ++GDS+LV  Q+ G W   + ++        +L   F 
Subjt:  FDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFL

Query:  SFEVNHVLRHLNSEADAQANLAL
         + + HV R  N  ADA AN AL
Subjt:  SFEVNHVLRHLNSEADAQANLAL

Arabidopsis top hitse value%identityAlignment
AT1G24090.1 RNase H family protein1.8e-7944.68Show/hide
Query:  MNCFSQVSTYTRV-IFRRTNLVFAASTSIHGCSNSYWTSSFHNV----AVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFV
        MNC S   +Y  + + +R++ V          S+  W   F  +     +K  A+ S+     +  YS+R      K  S +        ++ E   FFV
Subjt:  MNCFSQVSTYTRV-IFRRTNLVFAASTSIHGCSNSYWTSSFHNV----AVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFV

Query:  VRKGDVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHD--------GDTSLTGETPGQDAI
        VRKGDV+G+YK  SDCQAQ+GSS+ DLPVSV+KG+SLPKDTEEYL+SVGLK  LY+++A+D++ D+FG+L PC F +         +   T ET  +D  
Subjt:  VRKGDVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHD--------GDTSLTGETPGQDAI

Query:  KKRSREAIVSENVGSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLG
        K +   A +S +            P  K  K+E S        + E+CF+EFDGASKGNPG +GA AVL+  DGS+ICR+R+GLGIATNN AEY A++LG
Subjt:  KKRSREAIVSENVGSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLG

Query:  LKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTL
        LK A++KG+  I V+GDSKLVCMQ++G WK  +E +++L  E   L NK +SFE++HVLR+LN++AD QANLA+ L
Subjt:  LKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTL

AT3G01410.1 Polynucleotidyl transferase, ribonuclease H-like superfamily protein1.6e-7249.48Show/hide
Query:  MESEMGDFFVVRKGDVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQD
        ME E   F++VRKGD++GVY+S S+CQ Q GSS+    +SV+KG+  PK  E+ L+S G+KNAL+++ A+ ++ D FG L PC      +S  GE+  + 
Subjt:  MESEMGDFFVVRKGDVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQD

Query:  AIKKRSREAIVSENVGSTVLTPTSKYPTRKHIKMEDSIVSRSISS--------NRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNN
        +  KR       +++GS      S  P +K +K+E+ ++ R  SS          +SC +EFDGASKGNPG+AGAGAVLRA D SV+  LREG+G ATNN
Subjt:  AIKKRSREAIVSENVGSTVLTPTSKYPTRKHIKMEDSIVSRSISS--------NRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNN

Query:  VAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
        VAEYRA+LLGL+SAL KGF  +HV GDS LVCMQVQG WK  +  M+ELC +  +L N F +F++ H+ R  NSEAD QAN A+ LA
Subjt:  VAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

AT3G01410.2 Polynucleotidyl transferase, ribonuclease H-like superfamily protein1.6e-7249.48Show/hide
Query:  MESEMGDFFVVRKGDVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQD
        ME E   F++VRKGD++GVY+S S+CQ Q GSS+    +SV+KG+  PK  E+ L+S G+KNAL+++ A+ ++ D FG L PC      +S  GE+  + 
Subjt:  MESEMGDFFVVRKGDVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQD

Query:  AIKKRSREAIVSENVGSTVLTPTSKYPTRKHIKMEDSIVSRSISS--------NRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNN
        +  KR       +++GS      S  P +K +K+E+ ++ R  SS          +SC +EFDGASKGNPG+AGAGAVLRA D SV+  LREG+G ATNN
Subjt:  AIKKRSREAIVSENVGSTVLTPTSKYPTRKHIKMEDSIVSRSISS--------NRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNN

Query:  VAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
        VAEYRA+LLGL+SAL KGF  +HV GDS LVCMQVQG WK  +  M+ELC +  +L N F +F++ H+ R  NSEAD QAN A+ LA
Subjt:  VAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

AT5G51080.1 RNase H family protein9.5e-7342.47Show/hide
Query:  MNCFSQVSTY-TRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKG
        MN FS+  +Y + V+FR+++ V          S+  W   F+  ++K++   +  S   + CYS+R      K +  S  +      + E   FFVVRKG
Subjt:  MNCFSQVSTY-TRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKG

Query:  DVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSEN
        D+VG+YK   DCQAQ+GSS+ D PVSV+KG+SL KDTEE L++VGLK  LY  +A D++ D+FG+L PC F D                           
Subjt:  DVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSEN

Query:  VGSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRI
               P++     K  ++E      S  ++ E+C +EFDGASKGNPG +GA AVL+  DGS+I ++R+GLGIATNN AEY  ++LGLK A++KG+T+I
Subjt:  VGSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRI

Query:  HVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
         V+ DSKLVCMQ++G WK  +E +S+L  E  +L +K LSFE++HVLR LNS+AD QAN+A  L+
Subjt:  HVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA

AT5G51080.2 RNase H family protein9.5e-7342.47Show/hide
Query:  MNCFSQVSTY-TRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKG
        MN FS+  +Y + V+FR+++ V          S+  W   F+  ++K++   +  S   + CYS+R      K +  S  +      + E   FFVVRKG
Subjt:  MNCFSQVSTY-TRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKG

Query:  DVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSEN
        D+VG+YK   DCQAQ+GSS+ D PVSV+KG+SL KDTEE L++VGLK  LY  +A D++ D+FG+L PC F D                           
Subjt:  DVVGVYKSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSEN

Query:  VGSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRI
               P++     K  ++E      S  ++ E+C +EFDGASKGNPG +GA AVL+  DGS+I ++R+GLGIATNN AEY  ++LGLK A++KG+T+I
Subjt:  VGSTVLTPTSKYPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRI

Query:  HVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA
         V+ DSKLVCMQ++G WK  +E +S+L  E  +L +K LSFE++HVLR LNS+AD QAN+A  L+
Subjt:  HVQGDSKLVCMQVQGLWKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLA


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAACTGCTTCTCCCAAGTCTCTACCTATACTCGCGTCATTTTCAGAAGGACCAATCTTGTTTTTGCGGCTTCAACCTCCATTCATGGCTGCTCTAATTCCTAC
TGGACCTCATCCTTTCACAATGTTGCTGTAAAGACTACTGCTTTAGACTCCTTGTGTTCCAGATTCGGTCTACGGTGCTATTCCACTCGAAAACCCCGAAAACCC
CGAAAGCCCACTTCTCCTTCACCCAAGTTGGATTCTGAACCTCCCATGGAATCAGAGATGGGCGACTTCTTTGTCGTTCGAAAAGGGGATGTTGTTGGAGTCTAT
AAAAGTTTTAGTGATTGTCAGGCGCAAATTGGATCTTCGATATGTGATCTTCCTGTTAGTGTGTTTAAAGGACACTCATTACCAAAAGACACTGAGGAATATCTT
GCTTCCGTTGGGCTTAAGAACGCTCTGTACACTATTAAAGCTGCAGATATGAGACCTGATCTTTTCGGTTCACTCGCGCCTTGCACTTTTCATGATGGAGATACC
TCTCTTACAGGTGAGACTCCTGGCCAGGATGCCATAAAGAAGAGATCAAGAGAGGCTATTGTATCAGAAAATGTTGGGTCAACTGTTTTAACTCCTACATCAAAA
TATCCCACGAGGAAACATATCAAGATGGAAGATTCCATTGTGTCCCGTTCAATATCCTCCAACCGCGAATCTTGCTTTCTAGAATTTGATGGTGCCTCAAAAGGA
AATCCTGGACAAGCCGGGGCAGGAGCTGTTCTGCGAGCTCATGATGGGAGTGTGATATGTCGACTGCGTGAAGGTCTAGGTATAGCAACCAATAACGTTGCTGAA
TATCGAGCTGTTCTTTTAGGGTTGAAGTCTGCACTGAAGAAAGGGTTCACTAGGATTCACGTCCAAGGTGACTCCAAACTTGTCTGTATGCAGGTTCAAGGTTTA
TGGAAAGCAAAAAATGAAAACATGTCTGAGTTATGTAATGAAGTTACGAAGCTGAAGAATAAATTTCTCTCTTTCGAGGTCAATCATGTACTAAGGCATCTAAAC
TCAGAAGCCGATGCTCAAGCGAACTTGGCTCTCACTTTAGCTG
mRNA sequenceShow/hide mRNA sequence
ATGAACTGCTTCTCCCAAGTCTCTACCTATACTCGCGTCATTTTCAGAAGGACCAATCTTGTTTTTGCGGCTTCAACCTCCATTCATGGCTGCTCTAATTCCTAC
TGGACCTCATCCTTTCACAATGTTGCTGTAAAGACTACTGCTTTAGACTCCTTGTGTTCCAGATTCGGTCTACGGTGCTATTCCACTCGAAAACCCCGAAAACCC
CGAAAGCCCACTTCTCCTTCACCCAAGTTGGATTCTGAACCTCCCATGGAATCAGAGATGGGCGACTTCTTTGTCGTTCGAAAAGGGGATGTTGTTGGAGTCTAT
AAAAGTTTTAGTGATTGTCAGGCGCAAATTGGATCTTCGATATGTGATCTTCCTGTTAGTGTGTTTAAAGGACACTCATTACCAAAAGACACTGAGGAATATCTT
GCTTCCGTTGGGCTTAAGAACGCTCTGTACACTATTAAAGCTGCAGATATGAGACCTGATCTTTTCGGTTCACTCGCGCCTTGCACTTTTCATGATGGAGATACC
TCTCTTACAGGTGAGACTCCTGGCCAGGATGCCATAAAGAAGAGATCAAGAGAGGCTATTGTATCAGAAAATGTTGGGTCAACTGTTTTAACTCCTACATCAAAA
TATCCCACGAGGAAACATATCAAGATGGAAGATTCCATTGTGTCCCGTTCAATATCCTCCAACCGCGAATCTTGCTTTCTAGAATTTGATGGTGCCTCAAAAGGA
AATCCTGGACAAGCCGGGGCAGGAGCTGTTCTGCGAGCTCATGATGGGAGTGTGATATGTCGACTGCGTGAAGGTCTAGGTATAGCAACCAATAACGTTGCTGAA
TATCGAGCTGTTCTTTTAGGGTTGAAGTCTGCACTGAAGAAAGGGTTCACTAGGATTCACGTCCAAGGTGACTCCAAACTTGTCTGTATGCAGGTTCAAGGTTTA
TGGAAAGCAAAAAATGAAAACATGTCTGAGTTATGTAATGAAGTTACGAAGCTGAAGAATAAATTTCTCTCTTTCGAGGTCAATCATGTACTAAGGCATCTAAAC
TCAGAAGCCGATGCTCAAGCGAACTTGGCTCTCACTTTAGCTG
Protein sequenceShow/hide protein sequence
MNCFSQVSTYTRVIFRRTNLVFAASTSIHGCSNSYWTSSFHNVAVKTTALDSLCSRFGLRCYSTRKPRKPRKPTSPSPKLDSEPPMESEMGDFFVVRKGDVVGVY
KSFSDCQAQIGSSICDLPVSVFKGHSLPKDTEEYLASVGLKNALYTIKAADMRPDLFGSLAPCTFHDGDTSLTGETPGQDAIKKRSREAIVSENVGSTVLTPTSK
YPTRKHIKMEDSIVSRSISSNRESCFLEFDGASKGNPGQAGAGAVLRAHDGSVICRLREGLGIATNNVAEYRAVLLGLKSALKKGFTRIHVQGDSKLVCMQVQGL
WKAKNENMSELCNEVTKLKNKFLSFEVNHVLRHLNSEADAQANLALTLAX