; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0015337 (gene) of Snake gourd v1 genome

Gene IDTan0015337
OrganismTrichosanthes anguina (Snake gourd v1)
Description18S pre-ribosomal assembly protein gar2-related, putative isoform 2
Genome locationLG04:8473106..8477409
RNA-Seq ExpressionTan0015337
SyntenyTan0015337
Gene Ontology termsGO:0009786 - regulation of asymmetric cell division (biological process)
InterPro domainsIPR040378 - Protein BREAKING OF ASYMMETRY IN THE STOMATAL LINEAGE


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7032146.1 hypothetical protein SDJN02_06189, partial [Cucurbita argyrosperma subsp. argyrosperma]2.8e-20578.34Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEPVV HS+ASPKF+PKSFEC+NDALDSGGMKLEDHK+ T  LK +E A+H N             +GLDD N++ EVK FV  LTNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGS-SVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS
        LYMEKSIVECQLPELIVCYKEN CNIVKDICID+GVPSRDKLLCGS S+DEKAVC ILPPE+DWKDELAR  E+ DMFA DDSEHSESFG  DSPK  D 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGS-SVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS

Query:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG
        +DLARTPEAEYDV YFTDNDILNLPMTDL  ES+KPL  NKNEP+PQSEQVF+ETTSLEVPVLACVAEESYS  +E IS   +  LA    EEPKNS S 
Subjt:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG

Query:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN
         DISYNSK+D GNITFDFNS ASTASDGLE CDNG LNSSAPSTSASVDC DT SSSN LASADKCQ  C+D SSNPKRVEYEDL R+EYED+ KAEVGN
Subjt:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN

Query:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
        S ++ VSSQVQHGVGE S SSMV LGSL+SNSGRIGYSGSIS RSDSSTTST SFAFPILQSEWNSSPVRMAKAD+KHL+K RGW+QG+LCCRF
Subjt:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

XP_008446468.1 PREDICTED: uncharacterized protein LOC103489197 isoform X1 [Cucumis melo]1.4e-20477.28Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEP+VCHSNASPKFVPKSFEC+ND L+SGGMKLED KE TS LKG+  A HNN AAD WV  KR+CL LDDFNDY +VK FVSPL NS KVDL EEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK
        LYMEKSIVECQLPELIVCYKENICNIVKDICID+G P RDKL CGSS+DE+ VC+I PP KDWKDE   E ++RDMFA DDSEHSESFG+ DSP  CDSK
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK

Query:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN
        DLA TPEAEYDVAYFTDND   +PMTDL  ESLKPL  NK +PHPQSEQV +ETT  EVPVLA VA+ES+ + +E  S S T A      E+PKNS S N
Subjt:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN

Query:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS
         +SYNSKVD GNITFDFNSLA TASDGLERCDNGDLNSSAPSTSASV C++T +SSNPLASADK + QCH+TSSNPKRVEYEDL R+EYED+ K EVGN 
Subjt:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS

Query:  VNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
         +H VSS+VQ GVGETSF S+ PLGSLMSNSGRIGYSGSIS RSDSSTTSTRSFAFPILQ+EWNSSPVRMAK DRKHLQKHRGW+ GILCCRF
Subjt:  VNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

XP_022956433.1 uncharacterized protein LOC111458170 isoform X1 [Cucurbita moschata]8.2e-20578.14Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEPVV HS+ASPKF+PKSFEC+NDALDSGGMKLEDHK+ T  LK +E A+H N             +GLDD N++ EVK FV  +TNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS
        LYMEKSIVECQLPELIVCYKEN CNIVKDICID+GVPSRDKLLCG SS+DEKAVC ILPPE+DWKDELAR  E+ DMFA DDSEHSESFG  DSPK  D 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS

Query:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG
        +DLARTPEAEYDV YFTDNDILNLPMTDL  ES+KPL  NKNEP+PQSEQVF+ETTSLEVPVLACVAEESYS  +E IS   +  LA    EEPKNS S 
Subjt:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG

Query:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN
         DISYNSK+D GNITFDFNS ASTASDGLE CDNG LNSSAPSTSASVDC D SSSSN LASADKCQ  C+D SSNPKRVEYEDL R+EYED+ KAEVGN
Subjt:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN

Query:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
        S ++ VSSQVQHGVGE S SSMV LGSL+SNSGRIGYSGSIS RSDSSTTST SFAFPILQSEWNSSPVRMAKAD+KHL+K RGW+QG+LCCRF
Subjt:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

XP_038892052.1 uncharacterized protein LOC120081347 isoform X1 [Benincasa hispida]9.9e-21980.32Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEP+V HSNASP+FVPKSFEC+NDA++SGGMKLED KE TS LKG+E A+HNN AAD WV  KR+CL LDDFN+Y EVK FVSPLTNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK
        LYMEKS VECQLPELIVCYKENICNIVKDICID+GVPSRDKLLCGSS+DEK VC+ILPP   WKD+L RE EKRD++A DDSEHSESFGN DSPK  DS 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK

Query:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN
        DL RTPEAEYDVAYFTDND   +PMTD   ESLKPL  NK EPHP+SEQVF+ETTSLEVPVLACVAEES+S  +E IS STT ALA   PEE KNS S N
Subjt:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN

Query:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS
        D+SYNSKVD GNITFDFNSLASTASDGLE CDN DLN+SAPSTSASV CQ+T SSSNPLASADKCQ QCHDTS+NPK VEYEDL RLEYED+ K EVGN 
Subjt:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS

Query:  VNHPVSSQVQHG----------VGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILC
         +H VSSQVQHG          +GETSFSSMVPLGSLMSNSG IGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADR+HL+KHRGW+QGILC
Subjt:  VNHPVSSQVQHG----------VGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILC

Query:  CRF
        CRF
Subjt:  CRF

XP_038892056.1 uncharacterized protein LOC120081347 isoform X2 [Benincasa hispida]2.5e-20677.89Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEP+V HSNASP+FVPKSFEC+NDA++SGGMKLED KE TS LKG+E A+HNN AAD WV  KR+CL LDDFN+Y EVK FVSPLTNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK
        LYMEKS VECQLPELIVCYKENICNIVKDICID+GVPSRDKLLCGSS+DEK VC+ILPP   WKD+L RE EKRD++A DDSEHSESFGN DSPK  DS 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK

Query:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN
        DL RTPEAEYDVAYFTDND   +PMTD   ESLKPL  NK EPHP+SEQVF+ETTSLEVPVLACVAEES+S  +E IS STT ALA   PEE KNS S N
Subjt:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN

Query:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS
        D+SYNSKVD GNITFDFNSLASTASDGLE CDN DLN+SAPSTSASV CQ+T SSSNPLASADKCQ QCHDTS+NPK VEYEDL RLEYED+ K EVGN 
Subjt:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS

Query:  VNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
         +H VSSQVQHG                      GYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADR+HL+KHRGW+QGILCCRF
Subjt:  VNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

TrEMBL top hitse value%identityAlignment
A0A1S3BFZ0 uncharacterized protein LOC103489197 isoform X16.8e-20577.28Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEP+VCHSNASPKFVPKSFEC+ND L+SGGMKLED KE TS LKG+  A HNN AAD WV  KR+CL LDDFNDY +VK FVSPL NS KVDL EEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK
        LYMEKSIVECQLPELIVCYKENICNIVKDICID+G P RDKL CGSS+DE+ VC+I PP KDWKDE   E ++RDMFA DDSEHSESFG+ DSP  CDSK
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDSK

Query:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN
        DLA TPEAEYDVAYFTDND   +PMTDL  ESLKPL  NK +PHPQSEQV +ETT  EVPVLA VA+ES+ + +E  S S T A      E+PKNS S N
Subjt:  DLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGN

Query:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS
         +SYNSKVD GNITFDFNSLA TASDGLERCDNGDLNSSAPSTSASV C++T +SSNPLASADK + QCH+TSSNPKRVEYEDL R+EYED+ K EVGN 
Subjt:  DISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNS

Query:  VNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
         +H VSS+VQ GVGETSF S+ PLGSLMSNSGRIGYSGSIS RSDSSTTSTRSFAFPILQ+EWNSSPVRMAK DRKHLQKHRGW+ GILCCRF
Subjt:  VNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

A0A6J1GWB6 uncharacterized protein LOC111458170 isoform X23.8e-20077.13Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEPVV HS+ASPKF+PKSFEC+NDALDSGGMKLEDHK+ T  LK +E A+H N             +GLDD N++ EVK FV  +TNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS
        LYMEKSIVECQLPELIVCYKEN CNIVKDICID+GVPSRDKLLCG SS+DEKAVC ILPPE+DWKDELAR  E+ DMFA DDSEHSESFG  DSPK  D 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS

Query:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG
        +DLARTPEAEYDV YFTDNDILNLPMTDL  ES+KPL  NKNEP+PQSEQV      LEVPVLACVAEESYS  +E IS   +  LA    EEPKNS S 
Subjt:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG

Query:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN
         DISYNSK+D GNITFDFNS ASTASDGLE CDNG LNSSAPSTSASVDC D SSSSN LASADKCQ  C+D SSNPKRVEYEDL R+EYED+ KAEVGN
Subjt:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN

Query:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
        S ++ VSSQVQHGVGE S SSMV LGSL+SNSGRIGYSGSIS RSDSSTTST SFAFPILQSEWNSSPVRMAKAD+KHL+K RGW+QG+LCCRF
Subjt:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

A0A6J1GWT7 uncharacterized protein LOC111458170 isoform X14.0e-20578.14Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEPVV HS+ASPKF+PKSFEC+NDALDSGGMKLEDHK+ T  LK +E A+H N             +GLDD N++ EVK FV  +TNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS
        LYMEKSIVECQLPELIVCYKEN CNIVKDICID+GVPSRDKLLCG SS+DEKAVC ILPPE+DWKDELAR  E+ DMFA DDSEHSESFG  DSPK  D 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS

Query:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG
        +DLARTPEAEYDV YFTDNDILNLPMTDL  ES+KPL  NKNEP+PQSEQVF+ETTSLEVPVLACVAEESYS  +E IS   +  LA    EEPKNS S 
Subjt:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG

Query:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN
         DISYNSK+D GNITFDFNS ASTASDGLE CDNG LNSSAPSTSASVDC D SSSSN LASADKCQ  C+D SSNPKRVEYEDL R+EYED+ KAEVGN
Subjt:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN

Query:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
        S ++ VSSQVQHGVGE S SSMV LGSL+SNSGRIGYSGSIS RSDSSTTST SFAFPILQSEWNSSPVRMAKAD+KHL+K RGW+QG+LCCRF
Subjt:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

A0A6J1GWU3 uncharacterized protein LOC111458170 isoform X36.8e-19776.11Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEPVV HS+ASPKF+PKSFEC+NDALDSGGMKLEDHK+ T  LK +E A+H N             +GLDD N++ EVK FV  +TNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS
        LYMEKSIVECQLPELIVCYKEN CNIVKDICID+GVPSRDKLLCG SS+DEKAVC ILPPE+DWKDELAR  E+ DMFA DDSEHSESFG  DSPK  D 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS

Query:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG
        +DLARTPEAEYDV YFTDNDILNLPMTDL  ES+KPL  NKNEP+PQSEQ           VLACVAEESYS  +E IS   +  LA    EEPKNS S 
Subjt:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG

Query:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN
         DISYNSK+D GNITFDFNS ASTASDGLE CDNG LNSSAPSTSASVDC D SSSSN LASADKCQ  C+D SSNPKRVEYEDL R+EYED+ KAEVGN
Subjt:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN

Query:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
        S ++ VSSQVQHGVGE S SSMV LGSL+SNSGRIGYSGSIS RSDSSTTST SFAFPILQSEWNSSPVRMAKAD+KHL+K RGW+QG+LCCRF
Subjt:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

A0A6J1IHW9 uncharacterized protein LOC111477604 isoform X11.0e-19776.11Show/hide
Query:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE
        EGEPVV HS+ASPKF+PKSFEC+NDALDSGGMKLEDHK+ T  LKG+E A+  N             +GLDD N++ EVK FV  LTNSSKVDLFEEDSE
Subjt:  EGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVSPLTNSSKVDLFEEDSE

Query:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS
        LYMEKSIVECQLPELIVCYKEN CNIVKDICID+GVPSRDKLLCG SS+DEKAVC ILPPE+DWKDELAR  E+ DMFA DDSEHSESFG  DSPK  D 
Subjt:  LYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCG-SSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPKLCDS

Query:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG
        ++LARTP+AEYDV Y TDND+LNLP+TDL  ES+KPL  NKNEP+PQSEQ           VLACVAEESYS  +EAI  S   A +    EEPKNS S 
Subjt:  KDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASG

Query:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN
         DISYNSK+D GNITFDFNS ASTASDGLE CDNGDLNSSAPSTSASVDC DT SSSN LASADKCQV C+D SSNPKRVEYEDL R+EYED+ KAEVGN
Subjt:  NDISYNSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGN

Query:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF
        S +H VSSQVQHGVGE S SSMV LGSL+SNSGRIGYSGSIS RSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD+KHL+K RGW+QG+LCCRF
Subjt:  SVNHPVSSQVQHGVGETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G13650.2 BEST Arabidopsis thaliana protein match is: 18S pre-ribosomal assembly protein gar2-related (TAIR:AT2G03810.4)8.4e-0632.68Show/hide
Query:  DLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKR------VEYEDLHRLEYEDVLKAEVGNSV--NHPVSSQVQHGVGETSFSSMVPLGS
        ++N  +      V    TS S   L   D   ++  D+ S P +       E    H    E   ++E  NS   N+ +   + +G GE SF        
Subjt:  DLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKR------VEYEDLHRLEYEDVLKAEVGNSV--NHPVSSQVQHGVGETSFSSMVPLGS

Query:  LMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQ
         ++  G +  S ++S+RSD   TS  SFA PILQSEWNSSPVRM KA+   L+
Subjt:  LMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQ

AT2G03810.1 18S pre-ribosomal assembly protein gar2-related1.4e-2931.26Show/hide
Query:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK
        ++D   YM+K++  C LPE++VCYKEN  +IVKDIC+DEGVP ++K L G              EKD      +     D+   D +        N +P 
Subjt:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK

Query:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN
               + T  AE  ++   D++  N   TD D E      ++  E    +E     T+S        V EE  +SP        T  L+P E E  +N
Subjt:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN

Query:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP
        S     IS ++                    ++  NI+ D +   S +   L+  +   L ++A  T      +         + +     + + T + P
Subjt:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP

Query:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD
        ++ E E+ H+          V NS      S  +   GETSFS+   V +   ++ SG I YSGS+S+RSD+STTS RSFAFPILQSEWNSSPVRMAKAD
Subjt:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD

Query:  RKHLQKHRGWKQGILCCRF
        ++  ++  GW+  +LCCRF
Subjt:  RKHLQKHRGWKQGILCCRF

AT2G03810.2 18S pre-ribosomal assembly protein gar2-related1.4e-2931.26Show/hide
Query:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK
        ++D   YM+K++  C LPE++VCYKEN  +IVKDIC+DEGVP ++K L G              EKD      +     D+   D +        N +P 
Subjt:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK

Query:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN
               + T  AE  ++   D++  N   TD D E      ++  E    +E     T+S        V EE  +SP        T  L+P E E  +N
Subjt:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN

Query:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP
        S     IS ++                    ++  NI+ D +   S +   L+  +   L ++A  T      +         + +     + + T + P
Subjt:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP

Query:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD
        ++ E E+ H+          V NS      S  +   GETSFS+   V +   ++ SG I YSGS+S+RSD+STTS RSFAFPILQSEWNSSPVRMAKAD
Subjt:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD

Query:  RKHLQKHRGWKQGILCCRF
        ++  ++  GW+  +LCCRF
Subjt:  RKHLQKHRGWKQGILCCRF

AT2G03810.3 18S pre-ribosomal assembly protein gar2-related1.4e-2931.26Show/hide
Query:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK
        ++D   YM+K++  C LPE++VCYKEN  +IVKDIC+DEGVP ++K L G              EKD      +     D+   D +        N +P 
Subjt:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK

Query:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN
               + T  AE  ++   D++  N   TD D E      ++  E    +E     T+S        V EE  +SP        T  L+P E E  +N
Subjt:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN

Query:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP
        S     IS ++                    ++  NI+ D +   S +   L+  +   L ++A  T      +         + +     + + T + P
Subjt:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP

Query:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD
        ++ E E+ H+          V NS      S  +   GETSFS+   V +   ++ SG I YSGS+S+RSD+STTS RSFAFPILQSEWNSSPVRMAKAD
Subjt:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD

Query:  RKHLQKHRGWKQGILCCRF
        ++  ++  GW+  +LCCRF
Subjt:  RKHLQKHRGWKQGILCCRF

AT2G03810.4 18S pre-ribosomal assembly protein gar2-related1.4e-2931.26Show/hide
Query:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK
        ++D   YM+K++  C LPE++VCYKEN  +IVKDIC+DEGVP ++K L G              EKD      +     D+   D +        N +P 
Subjt:  EEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSPK

Query:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN
               + T  AE  ++   D++  N   TD D E      ++  E    +E     T+S        V EE  +SP        T  L+P E E  +N
Subjt:  LCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKN

Query:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP
        S     IS ++                    ++  NI+ D +   S +   L+  +   L ++A  T      +         + +     + + T + P
Subjt:  SASGNDISYNS-------------------KVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNP

Query:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD
        ++ E E+ H+          V NS      S  +   GETSFS+   V +   ++ SG I YSGS+S+RSD+STTS RSFAFPILQSEWNSSPVRMAKAD
Subjt:  KRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVGETSFSS--MVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKAD

Query:  RKHLQKHRGWKQGILCCRF
        ++  ++  GW+  +LCCRF
Subjt:  RKHLQKHRGWKQGILCCRF


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCCGGTTTTGACTTTGGAACAGGAGAAAAAGCCCTCTGGGGTACACTTTCTGACATGATTGTCAGCCCCAGAAAAGAGGGTGAGCCCGTAGTTTGCCATTCAAATGC
TAGTCCCAAGTTTGTTCCCAAGTCTTTTGAATGCAATAATGATGCTCTTGATTCTGGTGGGATGAAGCTTGAAGATCATAAAGAACTTACAAGCCCTCTCAAAGGCAGCG
AGGTTGCCGATCACAATAATATTGCTGCAGATAGTTGGGTTCCAAATAAGCGTGATTGTTTAGGTCTTGATGATTTTAATGACTATGGTGAGGTTAAAGTCTTTGTGTCA
CCACTCACTAATTCTTCTAAAGTAGACTTGTTTGAGGAAGACTCGGAGTTATACATGGAAAAGAGTATTGTTGAATGTCAACTTCCTGAACTGATAGTTTGTTACAAAGA
AAATATTTGCAATATTGTTAAGGATATTTGTATCGACGAGGGAGTACCTTCTCGGGATAAGCTCTTGTGTGGTAGTAGTGTGGATGAGAAGGCTGTCTGTGCCATTCTCC
CTCCTGAGAAAGATTGGAAGGACGAGTTGGCAAGAGAACCGGAGAAAAGAGATATGTTTGCTTTAGATGATTCAGAGCATTCAGAATCTTTTGGCAATAATGATTCACCT
AAACTATGCGATTCCAAGGATTTGGCGAGAACACCTGAGGCAGAATATGATGTGGCATATTTTACGGACAATGATATACTAAATCTTCCAATGACAGACTTGGATGCAGA
GAGCTTAAAGCCATTGATCAAGAATAAGAACGAACCTCACCCTCAGTCTGAACAGGTTTTTATGGAAACTACGAGTTTGGAAGTCCCTGTTTTGGCATGTGTGGCTGAAG
AATCTTATAGTAGCCCCAAAGAAGCAATATCAGTATCCACTACTTTAGCTCTAGCACCTGAAGAGCCCGAAGAGCCCAAAAATAGCGCTTCTGGGAATGATATATCATAC
AATAGTAAAGTGGACAATGGAAACATTACTTTTGATTTTAATTCTTTAGCATCCACAGCTAGTGATGGACTGGAGCGTTGTGATAATGGTGACTTAAACTCTTCAGCTCC
TTCGACCAGTGCCTCAGTGGACTGCCAAGACACGAGCAGCAGCTCCAACCCTTTAGCTTCCGCTGACAAATGTCAAGTGCAGTGTCATGATACTAGTAGTAACCCCAAAC
GTGTGGAATATGAAGACTTGCATCGTCTGGAATATGAAGACGTACTGAAGGCAGAAGTTGGGAATTCTGTTAATCATCCAGTTTCAAGCCAAGTTCAACATGGCGTAGGT
GAAACGAGTTTCTCTTCTATGGTACCGTTGGGGAGTCTGATGTCTAATTCGGGTCGTATAGGGTACTCTGGCAGCATTTCTCTTCGGTCTGATAGCAGCACGACCAGCAC
CCGTTCCTTTGCCTTTCCCATATTACAATCCGAGTGGAATAGTAGTCCTGTTAGAATGGCTAAAGCTGATCGAAAGCATCTACAGAAGCATAGGGGTTGGAAGCAAGGCA
TTCTGTGCTGTAGATTCTAA
mRNA sequenceShow/hide mRNA sequence
ATGTCCGGTTTTGACTTTGGAACAGGAGAAAAAGCCCTCTGGGGTACACTTTCTGACATGATTGTCAGCCCCAGAAAAGAGGGTGAGCCCGTAGTTTGCCATTCAAATGC
TAGTCCCAAGTTTGTTCCCAAGTCTTTTGAATGCAATAATGATGCTCTTGATTCTGGTGGGATGAAGCTTGAAGATCATAAAGAACTTACAAGCCCTCTCAAAGGCAGCG
AGGTTGCCGATCACAATAATATTGCTGCAGATAGTTGGGTTCCAAATAAGCGTGATTGTTTAGGTCTTGATGATTTTAATGACTATGGTGAGGTTAAAGTCTTTGTGTCA
CCACTCACTAATTCTTCTAAAGTAGACTTGTTTGAGGAAGACTCGGAGTTATACATGGAAAAGAGTATTGTTGAATGTCAACTTCCTGAACTGATAGTTTGTTACAAAGA
AAATATTTGCAATATTGTTAAGGATATTTGTATCGACGAGGGAGTACCTTCTCGGGATAAGCTCTTGTGTGGTAGTAGTGTGGATGAGAAGGCTGTCTGTGCCATTCTCC
CTCCTGAGAAAGATTGGAAGGACGAGTTGGCAAGAGAACCGGAGAAAAGAGATATGTTTGCTTTAGATGATTCAGAGCATTCAGAATCTTTTGGCAATAATGATTCACCT
AAACTATGCGATTCCAAGGATTTGGCGAGAACACCTGAGGCAGAATATGATGTGGCATATTTTACGGACAATGATATACTAAATCTTCCAATGACAGACTTGGATGCAGA
GAGCTTAAAGCCATTGATCAAGAATAAGAACGAACCTCACCCTCAGTCTGAACAGGTTTTTATGGAAACTACGAGTTTGGAAGTCCCTGTTTTGGCATGTGTGGCTGAAG
AATCTTATAGTAGCCCCAAAGAAGCAATATCAGTATCCACTACTTTAGCTCTAGCACCTGAAGAGCCCGAAGAGCCCAAAAATAGCGCTTCTGGGAATGATATATCATAC
AATAGTAAAGTGGACAATGGAAACATTACTTTTGATTTTAATTCTTTAGCATCCACAGCTAGTGATGGACTGGAGCGTTGTGATAATGGTGACTTAAACTCTTCAGCTCC
TTCGACCAGTGCCTCAGTGGACTGCCAAGACACGAGCAGCAGCTCCAACCCTTTAGCTTCCGCTGACAAATGTCAAGTGCAGTGTCATGATACTAGTAGTAACCCCAAAC
GTGTGGAATATGAAGACTTGCATCGTCTGGAATATGAAGACGTACTGAAGGCAGAAGTTGGGAATTCTGTTAATCATCCAGTTTCAAGCCAAGTTCAACATGGCGTAGGT
GAAACGAGTTTCTCTTCTATGGTACCGTTGGGGAGTCTGATGTCTAATTCGGGTCGTATAGGGTACTCTGGCAGCATTTCTCTTCGGTCTGATAGCAGCACGACCAGCAC
CCGTTCCTTTGCCTTTCCCATATTACAATCCGAGTGGAATAGTAGTCCTGTTAGAATGGCTAAAGCTGATCGAAAGCATCTACAGAAGCATAGGGGTTGGAAGCAAGGCA
TTCTGTGCTGTAGATTCTAA
Protein sequenceShow/hide protein sequence
MSGFDFGTGEKALWGTLSDMIVSPRKEGEPVVCHSNASPKFVPKSFECNNDALDSGGMKLEDHKELTSPLKGSEVADHNNIAADSWVPNKRDCLGLDDFNDYGEVKVFVS
PLTNSSKVDLFEEDSELYMEKSIVECQLPELIVCYKENICNIVKDICIDEGVPSRDKLLCGSSVDEKAVCAILPPEKDWKDELAREPEKRDMFALDDSEHSESFGNNDSP
KLCDSKDLARTPEAEYDVAYFTDNDILNLPMTDLDAESLKPLIKNKNEPHPQSEQVFMETTSLEVPVLACVAEESYSSPKEAISVSTTLALAPEEPEEPKNSASGNDISY
NSKVDNGNITFDFNSLASTASDGLERCDNGDLNSSAPSTSASVDCQDTSSSSNPLASADKCQVQCHDTSSNPKRVEYEDLHRLEYEDVLKAEVGNSVNHPVSSQVQHGVG
ETSFSSMVPLGSLMSNSGRIGYSGSISLRSDSSTTSTRSFAFPILQSEWNSSPVRMAKADRKHLQKHRGWKQGILCCRF