; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh11G012490 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh11G012490
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
DescriptionPentatricopeptide repeat-containing protein
Genome locationCmo_Chr11:7919190..7925260
RNA-Seq ExpressionCmoCh11G012490
SyntenyCmoCh11G012490
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR011990 - Tetratricopeptide-like helical domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
CAE7583420.1 unnamed protein product [Symbiodinium natans]1.5e-0930.34Show/hide
Query:  TGASLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSIL
        T +S +  +ST        +   +   T   + SS  S +S TSSS  ST+S   S + TSS S +   SS S      +  +S T   S    S+ S  
Subjt:  TGASLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSIL

Query:  TNSLACGSFSKPLSESS--IRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITST--N
        + +    S +   S SS    TS   +S    ST+ S T   S SS  S S+ T S +  S+ S    +     S++       S  + +S   TST  +
Subjt:  TNSLACGSFSKPLSESS--IRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITST--N

Query:  SFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGSTVSV-TCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVS
        S    TSS  S     S  S  S + TT  S S   ST S  T S +TS  S   TT ++ S   S+ + TS +++S  S + T+  S +   S  S+ S
Subjt:  SFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGSTVSV-TCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVS

Query:  VTCSATTLFISFATTTDSSFSVGDSTVSVTSFA--------------TTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTV
         + S TT   S  +TT SS S   ST + TS +              TT+S S  +TT  S S   S  ++ S + ++TTS  SS+TTT +  S   ST 
Subjt:  VTCSATTLFISFATTTDSSFSVGDSTVSVTSFA--------------TTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTV

Query:  S---VTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTS-FISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTS
        S    TS +TT   S ++T+  S S   S  S+ S T ++T+S   S  +TT ++ S   ST S TS +T+S  S   +T  + S   S+ S + SSTT 
Subjt:  S---VTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTS-FISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTS

Query:  IISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSFSVG
          S + T+  S +   ST SS S + S T +  S   TT  S S   S  + TS+++TS  S + ++ ST    + S ++   S+  S + TT  S S  
Subjt:  IISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSFSVG

Query:  GSIVSVTSSATRSILSFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSS
         +  S +SS + +  S + T+ +S     S  + TS +T+S+   + T+S   ++    S  S TSS+T++  S   ++  S     S  S TS  ++SS
Subjt:  GSIVSVTSSATRSILSFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSS

Query:  GFFTETASIGCASFFGGSTDFS------GRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT
           T T+S   +S    ST  S           + S   S ST T+S +  S S   + SS    S+T
Subjt:  GFFTETASIGCASFFGGSTDFS------GRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT

KAG7022366.1 putative pentatricopeptide repeat-containing protein, partial [Cucurbita argyrosperma subsp. argyrosperma]4.7e-4348.13Show/hide
Query:  MPNSSPPSFSSTTSSDLYPKCGFAGQTLLLFSSASDDCGNL-------------------MHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEK-----
        MPNSSPPSFSSTTSS+LYPKCGFA QTLLLFSSASD CGNL                   MHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEK     
Subjt:  MPNSSPPSFSSTTSSDLYPKCGFAGQTLLLFSSASDDCGNL-------------------MHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEK-----

Query:  --------------VFEEMPVGNLVSLNSMIVG-----------------------------NPGYEHYACIVDL---LGRAEQ--------LNRAKRFI
                      V +E+ V NLV +N+ ++                               P Y  +  ++      GR E+        LNRAKRFI
Subjt:  --------------VFEEMPVGNLVSLNSMIVG-----------------------------NPGYEHYACIVDL---LGRAEQ--------LNRAKRFI

Query:  ELMPIKPEAELLDLYYVAYETGASLAFHASTPLPILKFHNI
        ELMPIKPEAELLDLYYVAYE  A +      P    K  ++
Subjt:  ELMPIKPEAELLDLYYVAYETGASLAFHASTPLPILKFHNI

ORY49598.1 hypothetical protein BCR33DRAFT_763325 [Rhizoclosmatium globosum]1.5e-0930.18Show/hide
Query:  SSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADN--SGTQVVSGFFLSSLSILTNSLACGSFSKPLSESSIRTSLVCSSFLRGS
        +S  S+T+ +++S+ +T S   S   T+S + +   SS S      S+    S T   S    S+ S+ T++ +  +     S +S+ T+   S     S
Subjt:  SSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADN--SGTQVVSGFFLSSLSILTNSLACGSFSKPLSESSIRTSLVCSSFLRGS

Query:  TNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAIT-----STNSFWEITSSDCSLFLRGSMDSLVSFAITTGC
        T  + T L + SS    ST T S    S  +    S     +++       +  + T+ + T     +T+S   +T+S  S    G+  S  S   T+  
Subjt:  TNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAIT-----STNSFWEITSSDCSLFLRGSMDSLVSFAITTGC

Query:  SFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTS
        S +   ST S + S +T+  S ++T+ ++ S   S  + +S +TTS  + + T+  + +   +  ST S+T ++TT   + +TT+ SS SV  S+ + T+
Subjt:  SFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTS

Query:  FATTSSIS---FATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTSFI
          TTSS S    ATTT  S +   S  ST S+T ++TTS +++ T++ +      ST SVT+ +TT   + ++TT  S S   S  ST S+T S++TS  
Subjt:  FATTSSIS---FATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTSFI

Query:  SFVTTTDSSFSVG--GSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFS
        S  TTT SS + G   ST +V++ +T+S  S +  T  +     ST S T +S+TS  S + TT  S S    T SS S T S TTS  S + T+G S S
Subjt:  SFVTTTDSSFSVG--GSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFS

Query:  VEG---------SIVSITSSATTSLISFAVTTGSTFPVVT--VSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMIS
                    S  S TS  TTS +S   TT ST    T   S TS   SS  S   ++  + S   S  S T+++T S+ + + T+ SS     S  S
Subjt:  VEG---------SIVSITSSATTSLISFAVTTGSTFPVVT--VSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMIS

Query:  ITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFG
         T+ ++TS+     T+S+   +    +  S T+SAT++  S    +  S  I  S  S T+  TTSS   T T+S   +S    +T  S     S S   
Subjt:  ITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFG

Query:  SFSTLTNSVAGCSFSGPLTESSIGPDSAT
        + ST T S +  S S   + SS    S++
Subjt:  SFSTLTNSVAGCSFSGPLTESSIGPDSAT

XP_021359479.1 uncharacterized threonine-rich GPI-anchored glycoprotein PJ4664.02-like [Mizuhopecten yessoensis]3.9e-1329.81Show/hide
Query:  IAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSILTNSLACGS--FSKPLSESSIRT
        +   +T   + S + S+TS  +S   S+ +  V+F++TS  SVT    S    ++  S  +S T  V+     S++ L  S+   S  FS   S +S  T
Subjt:  IAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSILTNSLACGS--FSKPLSESSIRT

Query:  SLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGG-------SSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFWEITSSDCSLFLRGS
          V SS    +T+++ + + S ++  + S++T S+          S  S++  SV    +S+    +      +TS A ++T+S     ++  +  +  S
Subjt:  SLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGG-------SSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFWEITSSDCSLFLRGS

Query:  MDSLVSFAITTGCSFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTV------SVTCSATTLFISF
        + S V+ ++T   + SV  S  S   S+ TS ++F++T+  TFSV   T SVTS + TS ++F+ T+  + SV  S+ S+V      SVT S T+  +S 
Subjt:  MDSLVSFAITTGCSFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTV------SVTCSATTLFISF

Query:  ATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTVSVTSLATTLPISFAATTCCSFSVGGS
         T++ +S      T SVTS  T +  S ATT+  S     +  S  S T S+ TS ++S  T+   FSV  S  +  + + T  ++ + T+  + SV  S
Subjt:  ATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTVSVTSLATTLPISFAATTCCSFSVGGS

Query:  IVSTV--SVTCSATTSFISFVTTTDSSFSVGGSTISVTSFATTSLISFV---IATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVS--
          S+V  SVT SATTS  S +T++++S +    T SVTS  T+S+ S V     +  + SV  S  S   SS TS I+ + T+  ++S+  S  SSV+  
Subjt:  IVSTV--SVTCSATTSFISFVTTTDSSFSVGGSTISVTSFATTSLISFV---IATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVS--

Query:  ----VTFSAT---TSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVV--TVSVTSFGISSLISFAITTGCSFSVGGSIVS-VTSSATRS
            VT S T   TS ++ ++T+  + SV  S+ SI +S+ TS ++ +VT+  T+ V   TVS  +  ++S ++ ++T+  + SV  S+ S VTSSAT S
Subjt:  ----VTFSAT---TSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVV--TVSVTSFGISSLISFAITTGCSFSVGGSIVS-VTSSATRS

Query:  ILSFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGCA---SFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFAT---TSSGFFTETA
        + S  +++ +S  +  S  S  +F  TSS   + T+S+  +   S       SVTSSAT+S+ S   +   S        S+TS  T   TSS  F+ T+
Subjt:  ILSFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGCA---SFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFAT---TSSGFFTETA

Query:  SIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESS
        S+  ++    ++  +    V+ S   S +    S+   S +  +T S+
Subjt:  SIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESS

XP_038840979.1 uncharacterized protein DDB_G0271670-like [Salvelinus namaycush]2.4e-1536.88Show/hide
Query:  LFLGGSKDALTSGAITSTNSFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFA
        +  GG +     G + ST SF   TSS  S     S  S  SF+ ++  S S   ST S   S+++   S + ++ ++FS   ST S TSF+T+S  S +
Subjt:  LFLGGSKDALTSGAITSTNSFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFA

Query:  ATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVG
         ++  S S      ST S T S+T+   SF+T+  +SFS   ST S TSF+T+ S SF+T++  S S      ST S T S+T+S  SS+T+  + FS  
Subjt:  ATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVG

Query:  DSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTSFISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTS
         ST S TS +T+   S + ++  SFS      ST S T S+T+S  S  T++ +SFS   ST S TSF+T+S            S   ST S T  ST+S
Subjt:  DSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTSFISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTS

Query:  IISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAV--TTGSTFPVVTVSVTSFGISSLISFAITTGCSFS
          SF+ ++  SFS   ST SS S + S +T   SF+ ++  SFS   S    TS +T+S  SF+   +T S+F   T S TSF  S   SF+ ++  SFS
Subjt:  IISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAV--TTGSTFPVVTVSVTSFGISSLISFAITTGCSFS

Query:  VGGSIVSVTSSATRSILSFAITA
           S  S TS +T S  SF+ ++
Subjt:  VGGSIVSVTSSATRSILSFAITA

TrEMBL top hitse value%identityAlignment
A0A0R1W8A9 Serine-rich adhesin, platelet-type9.9e-0727.7Show/hide
Query:  TGASLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSIL
        T  S++  AST   +    +  I+  ++   S S+  S+++ TS+S  ++ S  +S ++++S S +   S+ + +    SA  S +  V      S+S+ 
Subjt:  TGASLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSIL

Query:  TNSLACGSFSKPLSES-SIRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFW
         ++    S S  +S S S  TS   S+ +  ST+ S +   S S+  S+S  T +    S+      S+    S++       S  A TS +++++ S  
Subjt:  TNSLACGSFSKPLSES-SIRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFW

Query:  EITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGS-----TVSVTCSASTSLISFAITTGSTFSVGDSTVSV-TSFATTSPISFAATTCCSFSVGGSIVST
           S+  S+    S  +  S + +T  S S   S     ++S + SAS S  +    + ST ++  +++S  TS +T++ IS + +   S S+  S  ++
Subjt:  EITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGS-----TVSVTCSASTSLISFAITTGSTFSVGDSTVSV-TSFATTSPISFAATTCCSFSVGGSIVST

Query:  VSVTCSAT-TLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTS-FISSATTTDSFFSVGDSTVSVTSLATTLP
        +S + SA+ +  +S +T+   S S   ST +  S + ++S S +T+   S SV  S  +++SV+ SA+TS  IS++ +T +  SV  ST    S + +L 
Subjt:  VSVTCSAT-TLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTS-FISSATTTDSFFSVGDSTVSVTSLATTLP

Query:  ISFAATTCCSFSVGGSIVSTVSVTCSATTSFISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSI
         S +A+T  S S   S  ++ SV+ S T++ +S  T+  +S S+  ST +  S +T++  S  I+   S S   S  + T +ST++ +S + +T  S SI
Subjt:  ISFAATTCCSFSVGGSIVSTVSVTCSATTSFISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSI

Query:  GGSTVSSVSVTFSATTSLISFAITT-GCSFSVEGSIVSITS---SATTSLISFAVTTGSTFPVVTVSV-------TSFGISSLISFAITTGCSFSVGGSI
          ST +SVS + SA+TS  + A T+   S S   SI + TS   SA+TS  + A T+ ST   ++ S+       TS  IS+  S +I+   S S+  S+
Subjt:  GGSTVSSVSVTFSATTSLISFAITT-GCSFSVEGSIVSITS---SATTSLISFAVTTGSTFPVVTVSV-------TSFGISSLISFAITTGCSFSVGGSI

Query:  VSVTSSATRSILSFAITAGSSFPIGGSMISITSFAT----------TSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSIT
         + TS++T + +S +++A  S     S+ + TS +T          ++S  ++ +TS   ++    SI + TS++T++ LS + +A  S  I  S  + T
Subjt:  VSVTSSATRSILSFAITAGSSFPIGGSMISITSFAT----------TSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSIT

Query:  SFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT
        S + ++S   + +ASI  ++    ST  S     S S   S ST T++    S S   + S     SA+
Subjt:  SFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT

A0A1Y2CRD0 Chitin-binding type-3 domain-containing protein7.4e-1030.18Show/hide
Query:  SSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADN--SGTQVVSGFFLSSLSILTNSLACGSFSKPLSESSIRTSLVCSSFLRGS
        +S  S+T+ +++S+ +T S   S   T+S + +   SS S      S+    S T   S    S+ S+ T++ +  +     S +S+ T+   S     S
Subjt:  SSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADN--SGTQVVSGFFLSSLSILTNSLACGSFSKPLSESSIRTSLVCSSFLRGS

Query:  TNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAIT-----STNSFWEITSSDCSLFLRGSMDSLVSFAITTGC
        T  + T L + SS    ST T S    S  +    S     +++       +  + T+ + T     +T+S   +T+S  S    G+  S  S   T+  
Subjt:  TNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAIT-----STNSFWEITSSDCSLFLRGSMDSLVSFAITTGC

Query:  SFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTS
        S +   ST S + S +T+  S ++T+ ++ S   S  + +S +TTS  + + T+  + +   +  ST S+T ++TT   + +TT+ SS SV  S+ + T+
Subjt:  SFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTS

Query:  FATTSSIS---FATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTSFI
          TTSS S    ATTT  S +   S  ST S+T ++TTS +++ T++ +      ST SVT+ +TT   + ++TT  S S   S  ST S+T S++TS  
Subjt:  FATTSSIS---FATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTSFI

Query:  SFVTTTDSSFSVG--GSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFS
        S  TTT SS + G   ST +V++ +T+S  S +  T  +     ST S T +S+TS  S + TT  S S    T SS S T S TTS  S + T+G S S
Subjt:  SFVTTTDSSFSVG--GSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFS

Query:  VEG---------SIVSITSSATTSLISFAVTTGSTFPVVT--VSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMIS
                    S  S TS  TTS +S   TT ST    T   S TS   SS  S   ++  + S   S  S T+++T S+ + + T+ SS     S  S
Subjt:  VEG---------SIVSITSSATTSLISFAVTTGSTFPVVT--VSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMIS

Query:  ITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFG
         T+ ++TS+     T+S+   +    +  S T+SAT++  S    +  S  I  S  S T+  TTSS   T T+S   +S    +T  S     S S   
Subjt:  ITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFG

Query:  SFSTLTNSVAGCSFSGPLTESSIGPDSAT
        + ST T S +  S S   + SS    S++
Subjt:  SFSTLTNSVAGCSFSGPLTESSIGPDSAT

A0A256V9A3 Accessory Sec-dependent LPXTG-anchored adhesin (Fragment)2.9e-0628.43Show/hide
Query:  SDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSILTNSLACGSFSKPLSES-SIRTSLVCSSFLRG
        S S+  S ++  S+S  ++AS   S + ++S SV+   S+ +      S   S +   S    +S S  T++    S S   S S S  TS   S+    
Subjt:  SDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSILTNSLACGSFSKPLSES-SIRTSLVCSSFLRG

Query:  STNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSV
        ST+ S +  VS S+  S S  T +    S+ +    S     S++       S  A TS + +++ S    TS+  S     S  +  S +++   S SV
Subjt:  STNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSV

Query:  RGST---VSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTSF
          ST    S + SASTS  + A T+ ST +   ++ S ++ A+TS  S +A+T  S S   S  ST + T ++T+   S +T+  +S S   ST + TS 
Subjt:  RGST---VSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVSVTCSATTLFISFATTTDSSFSVGDSTVSVTSF

Query:  ATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSF-FSVGDSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTS-FISF
        +T++S S +T+   S S   S+ ++ S + SA+TS  +SA+T+ S   S   ST + TS +T+   S + +   S SV  S  +++S + SA+TS  +S 
Subjt:  ATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSF-FSVGDSTVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTS-FISF

Query:  VTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGS
         T+  +S S   ST + TS +T++  S   +   S S   ST + T +ST++  S + +   S S   ST +S S + SA+TS    A T+  + +   +
Subjt:  VTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGS

Query:  IVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMISITSFATTSSGFVTET
          S ++SA+TS  + A T+ ST    + S TS  +S+  S + +   S S   S+ +  S++T ++ S + +A +S     S  + TS +T++S   + +
Subjt:  IVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMISITSFATTSSGFVTET

Query:  TSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFS
        TS   ++    S  + TS++T++ +S + +A  S     S  + TS +T++S   + +AS+  ++    ST  S     S S   S S  T++    S S
Subjt:  TSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFS

Query:  GPLTESSIGPDSAT
           + S+    SA+
Subjt:  GPLTESSIGPDSAT

A0A3R9HS43 GRAM_POS_ANCHORING domain-containing protein3.8e-0627.37Show/hide
Query:  SLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSILTNS
        S +  AST   +    +   +  ++   S S+  S+++ TS+S  ++ S   S + ++S S +   S+ + V    SA  S +   S    +S S+  ++
Subjt:  SLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSSLSILTNS

Query:  LACGSFSKPLSESSIRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFWEITS
         A  S S   S +S  TS   S+    ST+ S +   S S   S S  T +    S+ +    SV    S++    +  S  A TS +++++ S    TS
Subjt:  LACGSFSKPLSESSIRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTSGAITSTNSFWEITS

Query:  SDCSLFLRGSMDSLVSFAITTGCSFSVRGS---TVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTS---PISFAATTCCSFSVGGSIVSTVSV-
        +  S     S  + VS + +   S SV  S   + S + SASTS  + A  + ST +   ++VS ++ A+TS     S +A+T  S S   S  ++ SV 
Subjt:  SDCSLFLRGSMDSLVSFAITTGCSFSVRGS---TVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTS---PISFAATTCCSFSVGGSIVSTVSV-

Query:  --TCSATTLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTS-FISSATTTDSFFSVGDSTVSVTSLATTLPIS
          T ++T+  +S +T+  +S SV  ST + TS + ++S S +T+   S S   S  ++VS + SA+TS  +S++T+  +  SV  ST + TS + +   S
Subjt:  --TCSATTLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTS-FISSATTTDSFFSVGDSTVSVTSLATTLPIS

Query:  FAATTCCSFSVGGSIVSTVSVTCSATTS-FISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIG
         + +   S S   S  ++VS + SA+TS  +S  T++ +S SV  ST + TS + ++  S   +   S S   ST + T +ST++  S + +   S S  
Subjt:  FAATTCCSFSVGGSIVSTVSVTCSATTS-FISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIG

Query:  GSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSIL
         S  +S S + SA+ S  + A T+  + + E +  S + SA+TS  + A  + ST    + SV S   S+  S +++   S S   S+ + TS++T + +
Subjt:  GSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSIL

Query:  SFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGCAS--FFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCAS
        S + +A +S  +  SM + TS + ++S   +   S+  +S      S+ + TS++T++ +S + +A  S  +  S  + TS + ++S   + +AS+  +S
Subjt:  SFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGCAS--FFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCAS

Query:  FFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT
            S   S  +  S S   S S  T++  G S S   + S+    SA+
Subjt:  FFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT

F0FS71 KxYKxGKxW signal domain protein2.9e-0627.25Show/hide
Query:  VAYETGASLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSS
        V+  T ASL+   S    I+   +  ++   +   S S+  S+++ TS+S  ++ S   S + ++S S +   S+ + V    SA  S +   S    +S
Subjt:  VAYETGASLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSADNSGTQVVSGFFLSS

Query:  LSILTNSLACGSFSKPLSES-------SIRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTS
         S+  ++ A  S S   S S       S  TS   S+ +  ST+ S +  VS S+  S S    +    S+ +    SV    S++    +  S  A TS
Subjt:  LSILTNSLACGSFSKPLSES-------SIRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALTS

Query:  GAITSTNSFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGST---VSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTS---PISFAATTCCS
         +++++ S    TS+  S     S  + VS + +   S SV  ST    S + SASTS  + A  + ST +   ++VS ++ A+TS     S +A+T  S
Subjt:  GAITSTNSFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGST---VSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTS---PISFAATTCCS

Query:  FSVGGSIVSTVSV---TCSATTLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTS-FISSATTTDSFFSVGDS
         S   S  ++ SV   T ++T+  +S +T+  +S SV  ST + TS + ++S S +T+   S S   S  ++VS + SA+TS  +S++T+T +  SV  S
Subjt:  FSVGGSIVSTVSV---TCSATTLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTS-FISSATTTDSFFSVGDS

Query:  TVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTS-FISFVTTTDSSFSVGGSTISVT----SFATTSLISFVIATGCSISVGGSTVSLTFSS
        T + TS + +   S + +   S S   S  ++VS + SA+TS  +S  T+  +S SV  ST + T    S +T++  S  ++   S S   S  + T +S
Subjt:  TVSVTSLATTLPISFAATTCCSFSVGGSIVSTVSVTCSATTS-FISFVTTTDSSFSVGGSTISVT----SFATTSLISFVIATGCSISVGGSTVSLTFSS

Query:  TTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSF
        T++ +S + +   S S+  ST +S S + SA+TS  + A  +  + +   + VS ++SA+TS    A T+ ST   V+ S      S+  S +++   S 
Subjt:  TTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSF

Query:  SVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGC--ASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSF
        S   S+ + TS++T + +S + +A +S  +  S  + TS + ++S   + + S+    ++    S+ + TS++T++ +S + +A  S  +  S  + TS 
Subjt:  SVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMISITSFATTSSGFVTETTSIGC--ASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSF

Query:  ATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT
        + ++S   + +AS+  ++    ST  S     S S   S S  T++    S S   + S+    SA+
Subjt:  ATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSAT

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G28690.1 Tetratricopeptide repeat (TPR)-like superfamily protein1.9e-1028.03Show/hide
Query:  SDDCGNLMHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG---------------------------------------
        S + G  +H  I K G +  + + S+L+DMYAKC  +  A +VF++M   N+ S  SMI G                                       
Subjt:  SDDCGNLMHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG---------------------------------------

Query:  -------------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPEAEL
                            P  EHYACIVDL+GRA  LN+A  F   MP +P++++
Subjt:  -------------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPEAEL

AT3G05340.1 Tetratricopeptide repeat (TPR)-like superfamily protein1.7e-1128.1Show/hide
Query:  GNLMHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG-------------------------------------------
        G  +H L+ K  F    FV + L++MY+KC D+  ++ VF  MP  N VS NSMI                                             
Subjt:  GNLMHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG-------------------------------------------

Query:  ---------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPEAEL
                        P  EHY CI+D+LGRA  L  AK FI+ +P+KP+ ++
Subjt:  ---------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPEAEL

AT3G11460.1 Pentatricopeptide repeat (PPR) superfamily protein1.1e-1030.56Show/hide
Query:  LIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMI----------VG---------------------------------------
        L+  +GF   VFV++A + MYA+C ++  A  VF+ MPV +LVS  +MI          +G                                       
Subjt:  LIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMI----------VG---------------------------------------

Query:  ---------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPE
                  PG EHY+C+VDLLGRA +L+ A  FIE MP++P+
Subjt:  ---------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPE

AT3G18970.1 mitochondrial editing factor 201.1e-1031.65Show/hide
Query:  DCGNLMHFLIWKHGF--HAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG---------------------------------------
        + G+L+H  I K GF    +VF+ +ALVDMY+KC  +  A  VFE M V N+ +  SM  G                                       
Subjt:  DCGNLMHFLIWKHGF--HAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG---------------------------------------

Query:  -------------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPEAELL
                            P  EHY CIVDLLG+A ++  A +FI  MPIKP+A LL
Subjt:  -------------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKPEAELL

AT4G14850.1 Pentatricopeptide repeat (PPR) superfamily protein8.6e-1130.72Show/hide
Query:  DCGNLMHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG-----------------------------------------
        + G  +H    K      +FV SALVDMY KC  +  +E+ F+EMP  NLV+ NS+I G                                         
Subjt:  DCGNLMHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVG-----------------------------------------

Query:  -------------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKP
                            PG EHY+CIVD+LGRA  + RA  FI+ MPI+P
Subjt:  -------------------NPGYEHYACIVDLLGRAEQLNRAKRFIELMPIKP


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCCCAACTCATCACCACCGTCTTTCTCTTCAACAACCTCCTCAGATTTGTACCCCAAATGTGGCTTTGCTGGCCAGACCTTGTTGCTATTCTCCTCTGCCTCAGATGA
CTGTGGGAATCTCATGCATTTTCTAATTTGGAAACATGGATTCCATGCTGAAGTTTTTGTTGCCAGTGCATTGGTCGATATGTATGCGAAATGTTGTGATATGTGCACTG
CTGAGAAGGTGTTTGAGGAAATGCCTGTAGGAAACCTTGTGTCTTTGAACTCTATGATTGTGGGTAACCCTGGATATGAACATTATGCGTGCATAGTTGACTTGCTTGGT
CGTGCTGAGCAGTTGAATAGAGCTAAGAGGTTTATAGAACTGATGCCTATCAAACCAGAGGCAGAGTTGCTTGATCTTTATTATGTTGCATATGAGACAGGCGCATCCCT
TGCATTCCATGCAAGTACGCCATTACCCATACTTAAGTTTCACAATATTGACATTGCCTTCGATTTGACAAAACCCTTTAGTGATTCTTCTTTACCGTCCTTGACTTCTG
TAACTTCAAGTTCTCGTTTTTCAACTGCTTCCGAACCTGTCTCTTTTGCTCTCACCTCCTCAGATTCAGTCACAGGAGAACCTTCATCTGGAAGCTTTGTGTTGCTGGGA
GGTTCAGCAGACAATTCTGGAACACAAGTTGTCTCTGGTTTCTTCCTCAGCTCTTTGTCTATACTGACAAATTCTTTAGCTTGTGGTTCCTTTTCTAAGCCCTTATCAGA
ATCTTCTATAAGAACCTCATTAGTCTGCTCTTCTTTCTTGAGAGGTTCAACGAATAAGTCTGGAACAAGACTTGTCTCTGGTTCCTCCCTTGGTTCATTGTCTACGCTGA
CACATTCTTTAGCTGGAGGCTCCTCTTTTAGTCTCTTACCAGATTCTGTCATTGGAAAACCTTCATCTGCCTGCCCGTTGTTCTTAGGAGGGTCAAAGGATGCACTAACC
TCTGGTGCTATAACTTCTACTAATTCTTTCTGGGAAATAACGTCATCTGATTGCTCCTTATTCTTGAGAGGCTCAATGGATTCACTTGTCTCTTTTGCTATCACTACCGG
ATGCTCATTTTCTGTTAGAGGTTCAACCGTTTCAGTAACTTGTTCTGCAAGCACCTCGCTTATCTCTTTTGCTATCACTACTGGTAGCACCTTTTCTGTTGGAGATTCAA
CCGTTTCAGTAACTTCTTTTGCGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATCGTTTCAACTGTTTCAGTAACTTGT
TCTGCAACCACATTATTTATCTCTTTTGCTACCACTACTGATAGCTCCTTTTCTGTTGGGGATTCAACCGTTTCAGTAACTTCTTTTGCGACCACCTCGTCCATTTCTTT
TGCTACCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATCGTTTCAACTGTTTCAGTAACTTGTTCTGCAACCACATCATTTATCTCTTCTGCTACCACTACTGATA
GCTTCTTTTCTGTTGGAGATTCAACCGTTTCGGTAACTTCTTTGGCGACCACCTTGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATC
GTTTCAACTGTTTCAGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGTTACCACTACTGATAGCTCCTTTTCTGTTGGAGGTTCAACCATTTCAGTAACTTCTTT
TGCGACCACCTCACTTATCTCTTTTGTTATCGCCACAGGTTGCTCCATTTCTGTTGGAGGTTCGACTGTTTCACTAACTTTTTCTTCAACAACCTCAATCATCTCTTTTG
CTATCACCACGGGTTGGTCCTTCTCTATTGGAGGTTCAACCGTTTCATCTGTCTCAGTAACTTTTTCTGCAACCACCTCGCTCATCTCTTTTGCTATCACTACTGGTTGC
TCCTTTTCTGTTGAAGGTTCAATCGTTTCAATAACTTCTTCTGCAACCACCTCACTTATCTCTTTTGCTGTCACTACTGGTAGCACCTTTCCCGTTGTAACTGTTTCAGT
AACTTCCTTTGGGATCAGCTCACTTATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGGAGGTTCAATTGTTTCAGTAACTTCTTCTGCTACCAGATCAATTC
TCTCATTTGCTATCACTGCTGGCAGCTCCTTTCCTATCGGAGGTTCAATGATTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTGTCACTGAAACAACCTCAATT
GGCTGCGCTTCTTTCTTTGGAGGTTCAATTGTTTCAGTAACTTCTTCTGCTACCGCATCAATTCTCTCTTTTGCTATCGCTGCTGGCTGCTCCTTTTGCATTGGAGGTTC
AAGGGTTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTTTCACTGAAACAGCCTCAATTGGCTGCGCTTCTTTCTTTGGTGGTTCTACAGATTTTTCTGGAAGAC
TAGTTGTCTCTGGTTCCTTCTTTGGCTCTTTCTCCACGCTTACAAACTCTGTAGCTGGTTGCTCTTTTTCTGGGCCCTTAACAGAGTCTTCTATAGGACCAGATTCAGCC
ACCTGA
mRNA sequenceShow/hide mRNA sequence
ATGCCCAACTCATCACCACCGTCTTTCTCTTCAACAACCTCCTCAGATTTGTACCCCAAATGTGGCTTTGCTGGCCAGACCTTGTTGCTATTCTCCTCTGCCTCAGATGA
CTGTGGGAATCTCATGCATTTTCTAATTTGGAAACATGGATTCCATGCTGAAGTTTTTGTTGCCAGTGCATTGGTCGATATGTATGCGAAATGTTGTGATATGTGCACTG
CTGAGAAGGTGTTTGAGGAAATGCCTGTAGGAAACCTTGTGTCTTTGAACTCTATGATTGTGGGTAACCCTGGATATGAACATTATGCGTGCATAGTTGACTTGCTTGGT
CGTGCTGAGCAGTTGAATAGAGCTAAGAGGTTTATAGAACTGATGCCTATCAAACCAGAGGCAGAGTTGCTTGATCTTTATTATGTTGCATATGAGACAGGCGCATCCCT
TGCATTCCATGCAAGTACGCCATTACCCATACTTAAGTTTCACAATATTGACATTGCCTTCGATTTGACAAAACCCTTTAGTGATTCTTCTTTACCGTCCTTGACTTCTG
TAACTTCAAGTTCTCGTTTTTCAACTGCTTCCGAACCTGTCTCTTTTGCTCTCACCTCCTCAGATTCAGTCACAGGAGAACCTTCATCTGGAAGCTTTGTGTTGCTGGGA
GGTTCAGCAGACAATTCTGGAACACAAGTTGTCTCTGGTTTCTTCCTCAGCTCTTTGTCTATACTGACAAATTCTTTAGCTTGTGGTTCCTTTTCTAAGCCCTTATCAGA
ATCTTCTATAAGAACCTCATTAGTCTGCTCTTCTTTCTTGAGAGGTTCAACGAATAAGTCTGGAACAAGACTTGTCTCTGGTTCCTCCCTTGGTTCATTGTCTACGCTGA
CACATTCTTTAGCTGGAGGCTCCTCTTTTAGTCTCTTACCAGATTCTGTCATTGGAAAACCTTCATCTGCCTGCCCGTTGTTCTTAGGAGGGTCAAAGGATGCACTAACC
TCTGGTGCTATAACTTCTACTAATTCTTTCTGGGAAATAACGTCATCTGATTGCTCCTTATTCTTGAGAGGCTCAATGGATTCACTTGTCTCTTTTGCTATCACTACCGG
ATGCTCATTTTCTGTTAGAGGTTCAACCGTTTCAGTAACTTGTTCTGCAAGCACCTCGCTTATCTCTTTTGCTATCACTACTGGTAGCACCTTTTCTGTTGGAGATTCAA
CCGTTTCAGTAACTTCTTTTGCGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATCGTTTCAACTGTTTCAGTAACTTGT
TCTGCAACCACATTATTTATCTCTTTTGCTACCACTACTGATAGCTCCTTTTCTGTTGGGGATTCAACCGTTTCAGTAACTTCTTTTGCGACCACCTCGTCCATTTCTTT
TGCTACCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATCGTTTCAACTGTTTCAGTAACTTGTTCTGCAACCACATCATTTATCTCTTCTGCTACCACTACTGATA
GCTTCTTTTCTGTTGGAGATTCAACCGTTTCGGTAACTTCTTTGGCGACCACCTTGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATC
GTTTCAACTGTTTCAGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGTTACCACTACTGATAGCTCCTTTTCTGTTGGAGGTTCAACCATTTCAGTAACTTCTTT
TGCGACCACCTCACTTATCTCTTTTGTTATCGCCACAGGTTGCTCCATTTCTGTTGGAGGTTCGACTGTTTCACTAACTTTTTCTTCAACAACCTCAATCATCTCTTTTG
CTATCACCACGGGTTGGTCCTTCTCTATTGGAGGTTCAACCGTTTCATCTGTCTCAGTAACTTTTTCTGCAACCACCTCGCTCATCTCTTTTGCTATCACTACTGGTTGC
TCCTTTTCTGTTGAAGGTTCAATCGTTTCAATAACTTCTTCTGCAACCACCTCACTTATCTCTTTTGCTGTCACTACTGGTAGCACCTTTCCCGTTGTAACTGTTTCAGT
AACTTCCTTTGGGATCAGCTCACTTATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGGAGGTTCAATTGTTTCAGTAACTTCTTCTGCTACCAGATCAATTC
TCTCATTTGCTATCACTGCTGGCAGCTCCTTTCCTATCGGAGGTTCAATGATTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTGTCACTGAAACAACCTCAATT
GGCTGCGCTTCTTTCTTTGGAGGTTCAATTGTTTCAGTAACTTCTTCTGCTACCGCATCAATTCTCTCTTTTGCTATCGCTGCTGGCTGCTCCTTTTGCATTGGAGGTTC
AAGGGTTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTTTCACTGAAACAGCCTCAATTGGCTGCGCTTCTTTCTTTGGTGGTTCTACAGATTTTTCTGGAAGAC
TAGTTGTCTCTGGTTCCTTCTTTGGCTCTTTCTCCACGCTTACAAACTCTGTAGCTGGTTGCTCTTTTTCTGGGCCCTTAACAGAGTCTTCTATAGGACCAGATTCAGCC
ACCTGA
Protein sequenceShow/hide protein sequence
MPNSSPPSFSSTTSSDLYPKCGFAGQTLLLFSSASDDCGNLMHFLIWKHGFHAEVFVASALVDMYAKCCDMCTAEKVFEEMPVGNLVSLNSMIVGNPGYEHYACIVDLLG
RAEQLNRAKRFIELMPIKPEAELLDLYYVAYETGASLAFHASTPLPILKFHNIDIAFDLTKPFSDSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLG
GSADNSGTQVVSGFFLSSLSILTNSLACGSFSKPLSESSIRTSLVCSSFLRGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACPLFLGGSKDALT
SGAITSTNSFWEITSSDCSLFLRGSMDSLVSFAITTGCSFSVRGSTVSVTCSASTSLISFAITTGSTFSVGDSTVSVTSFATTSPISFAATTCCSFSVGGSIVSTVSVTC
SATTLFISFATTTDSSFSVGDSTVSVTSFATTSSISFATTTCCSFSVGGSIVSTVSVTCSATTSFISSATTTDSFFSVGDSTVSVTSLATTLPISFAATTCCSFSVGGSI
VSTVSVTCSATTSFISFVTTTDSSFSVGGSTISVTSFATTSLISFVIATGCSISVGGSTVSLTFSSTTSIISFAITTGWSFSIGGSTVSSVSVTFSATTSLISFAITTGC
SFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGISSLISFAITTGCSFSVGGSIVSVTSSATRSILSFAITAGSSFPIGGSMISITSFATTSSGFVTETTSI
GCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLVVSGSFFGSFSTLTNSVAGCSFSGPLTESSIGPDSA
T