; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lag0041100 (gene) of Sponge gourd (AG-4) v1 genome

Gene IDLag0041100
OrganismLuffa acutangula AG-4 (Sponge gourd (AG-4) v1)
DescriptionB box-type domain-containing protein
Genome locationchr13:12014502..12016364
RNA-Seq ExpressionLag0041100
SyntenyLag0041100
Gene Ontology termsGO:0008270 - zinc ion binding (molecular function)
InterPro domainsIPR006734 - PLATZ transcription factor


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6599925.1 hypothetical protein SDJN03_05158, partial [Cucurbita argyrosperma subsp. sororia]4.1e-11788.21Show/hide
Query:  ELNPIYPPLPLRSCTGFSLSVQSPIGRIRYNYASFLVKRMETDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYH
        +LNPI PPLPL  CTGFSL  +  IGRI YNYAS LVKRMETDWLGTLLNTKFF  CDLHPNLRKNEKNKFCIDCSVSFCKNC VHDLHRQVHIWKYVYH
Subjt:  ELNPIYPPLPLRSCTGFSLSVQSPIGRIRYNYASFLVKRMETDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYH

Query:  EVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKT
        EVVRVQD E+YFRCSEIHTYKVNGEIS+HLNSRGQSVD K PK KSGGSCEDCGRYVQ PNRFCSIACKVSVNSKLKDQS  TIVS SPDFGNLSFKEKT
Subjt:  EVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKT

Query:  SAETNASELESTISIAESTGETKASPSSSRPRKRRRKDIPHRSPFF
        SAETNASELESTISIAES  ETKASPSSS+PRKRRRKD PHRSP F
Subjt:  SAETNASELESTISIAESTGETKASPSSSRPRKRRRKDIPHRSPFF

KAG7030608.1 hypothetical protein SDJN02_04645 [Cucurbita argyrosperma subsp. argyrosperma]2.0e-10887.77Show/hide
Query:  SLSVQSPIGRIRYNYASFLVKRMETDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEI
        S  V    G + YNYAS LVKRMETDWLGTLLNTKFF  CDLHPNLRKNEKNKFCIDCSVSFCKNC VHDLHRQVHIWKYVYHEVVRVQD E+YFRCSEI
Subjt:  SLSVQSPIGRIRYNYASFLVKRMETDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEI

Query:  HTYKVNGEISIHLNSRGQSVDTKSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAE
        HTYKVNGEIS+HLNSRGQSVD K PK KSGGSCEDCGRYVQ PNRFCSIACKVSVNSKLKDQS  TIVS SPDFGNLSFKEKTSAETNASELESTISIAE
Subjt:  HTYKVNGEISIHLNSRGQSVDTKSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAE

Query:  STGETKASPSSSRPRKRRRKDIPHRSPFF
        S  ETKASPSSS+PRKRRRKD PHRSP F
Subjt:  STGETKASPSSSRPRKRRRKDIPHRSPFF

XP_022942707.1 uncharacterized protein LOC111447662 [Cucurbita moschata]2.8e-10291.3Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        METDWLGTLLNTKFF  CDLHPNLRKNEKNKFCIDCSVSFCKNC VHDLHRQVHIWKYVYHEVVRVQD E+YFRCSEIHTYKVNGEIS+HLNSRGQSVD 
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI
        K PK KSGGSCEDCGRYVQ PNRFCSIACKVSVNSKLKDQS  TIVS SPDFGNLSFKEKTSAETNASELESTISIAES  ETKASPSSS+PRKRRRKD 
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI

Query:  PHRSPFF
        PHRSP F
Subjt:  PHRSPFF

XP_022996504.1 uncharacterized protein LOC111491731 [Cucurbita maxima]1.1e-10190.82Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        METDWLGTLLNTKFF  CDLHPNLRKNEKNKFCIDCSVSFCKNC VHDLHRQVHIWKYVYHEVVRVQD E+YFRCSEIHTYKVNGEIS+HLNSRGQSVD 
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI
        K PK KSGGSCEDCGRYVQ PNRFCSIACKVSVNSKLKDQS  TIVS SPDFGNLSFKEK SAETNASELESTISIAES  ETKASPSSS+PRKRRRKD 
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI

Query:  PHRSPFF
        PHRSP F
Subjt:  PHRSPFF

XP_023548890.1 uncharacterized protein LOC111807405 [Cucurbita pepo subsp. pepo]3.1e-10191.35Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        METDWLGTLLNTKFF  CDLHPNLRKNEKNKFCIDCSVSFCKNC VHDLHRQVHIWKYVYHEVVRVQD E+YFRCSEIHTYKVNGEIS+HLNSRGQSVD 
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASP-SSSRPRKRRRKD
        K PKTKSGGSCEDCGRYVQ PNRFCSIACKVSVNSKLKDQS  TIVS SPDFGNLSFKEKTSAETNASELESTISIAES  ETKASP SSS+PRKRRRKD
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASP-SSSRPRKRRRKD

Query:  IPHRSPFF
         PHRSP F
Subjt:  IPHRSPFF

TrEMBL top hitse value%identityAlignment
A0A0A0KL89 Uncharacterized protein1.1e-8374.52Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        ME++WLGTLLNTKF+T CDLHPNL +N+K++FCIDCSVSFCKNC +HDLHRQV+IWKYVY EVVRVQDME+YF CSEIH YKVNG++++H+NS GQSVDT
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKE-KTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKD
        KSPK KS   CE+CG+++ DP+RFCSIACKV VNSK+KD S GT+VS S D GNLSFK+ K S ETNASELESTISIAES  ETK S SS +PRKRR K 
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKE-KTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKD

Query:  IPHRSPFF
        IPHR+PFF
Subjt:  IPHRSPFF

A0A6J1D096 uncharacterized protein LOC111015876 isoform X12.5e-9685.51Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        METDW+GTLLNTKFFT CDLHP LRKNEKNKFCIDCS+SFCKNC VHDLHRQV+IWKYVYH+VVRVQDME++FRCSEIHTYKVNGE+S+HLNSR QSVDT
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNS-KLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKD
        KSPK KS GSCEDCGR+VQDP RFCS+ACKVSVNS K+K QS GTI+SPS DFGNLS+KE+TS ETNASELESTISIAES  E KASPSSSRPRKRRRK 
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNS-KLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKD

Query:  IPHRSPF
        IPHRSPF
Subjt:  IPHRSPF

A0A6J1D0E9 uncharacterized protein LOC111015876 isoform X21.3e-7674.4Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        METDW+GTLLNTKFFT CDLHP LRKNEKNKFCIDCS+SFCKNC VHDLHRQ                           TYKVNGE+S+HLNSR QSVDT
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNS-KLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKD
        KSPK KS GSCEDCGR+VQDP RFCS+ACKVSVNS K+K QS GTI+SPS DFGNLS+KE+TS ETNASELESTISIAES  E KASPSSSRPRKRRRK 
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNS-KLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKD

Query:  IPHRSPF
        IPHRSPF
Subjt:  IPHRSPF

A0A6J1FR06 uncharacterized protein LOC1114476621.4e-10291.3Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        METDWLGTLLNTKFF  CDLHPNLRKNEKNKFCIDCSVSFCKNC VHDLHRQVHIWKYVYHEVVRVQD E+YFRCSEIHTYKVNGEIS+HLNSRGQSVD 
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI
        K PK KSGGSCEDCGRYVQ PNRFCSIACKVSVNSKLKDQS  TIVS SPDFGNLSFKEKTSAETNASELESTISIAES  ETKASPSSS+PRKRRRKD 
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI

Query:  PHRSPFF
        PHRSP F
Subjt:  PHRSPFF

A0A6J1K8W8 uncharacterized protein LOC1114917315.2e-10290.82Show/hide
Query:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT
        METDWLGTLLNTKFF  CDLHPNLRKNEKNKFCIDCSVSFCKNC VHDLHRQVHIWKYVYHEVVRVQD E+YFRCSEIHTYKVNGEIS+HLNSRGQSVD 
Subjt:  METDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDT

Query:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI
        K PK KSGGSCEDCGRYVQ PNRFCSIACKVSVNSKLKDQS  TIVS SPDFGNLSFKEK SAETNASELESTISIAES  ETKASPSSS+PRKRRRKD 
Subjt:  KSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRKRRRKDI

Query:  PHRSPFF
        PHRSP F
Subjt:  PHRSPFF

SwissProt top hitse value%identityAlignment
Q1G3Q4 Protein RGF1 INDUCIBLE TRANSCRIPTION FACTOR 12.2e-2036.72Show/hide
Query:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCA-VHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP
        WL  L   KFF  C  H   +KNE+N  C+DC  S C +C   H  HR + + +YVYH+VVR++D+++   CS +  Y +N    + +  R Q+   K  
Subjt:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCA-VHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP

Query:  KTKSGGSCEDCGRYVQDPNRFCSIACKV
           +G  C  C R +Q+P   CS+ CKV
Subjt:  KTKSGGSCEDCGRYVQDPNRFCSIACKV

Arabidopsis top hitse value%identityAlignment
AT1G31040.1 PLATZ transcription factor family protein2.2e-2031.28Show/hide
Query:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNC-AVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP
        WL  L+   FF+ C +H   RK+EKN FC+ C +S C +C   H  H  + + +YVYH+VVR+ D+E+   CS +  Y +NG   I LN R Q     S 
Subjt:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNC-AVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP

Query:  KTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVS-PSPDF--------GNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRK
           S   C  C R +Q+P  FCS++CKV   S   D  +  +      DF        G+    E ++ E     L  +    +     K     S+ +K
Subjt:  KTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVS-PSPDF--------GNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRK

Query:  ---------------RRRKDIPHRSPF
                        RRK  PHR+PF
Subjt:  ---------------RRRKDIPHRSPF

AT1G32700.1 PLATZ transcription factor family protein1.3e-2032.69Show/hide
Query:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVS-FCKNC-AVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKS
        WL  LL  KFF  C LH +  K+E N +C+DC+    C  C + H  H  + I +  YH+V+RV +++++   + + TY +N    + LN R Q      
Subjt:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVS-FCKNC-AVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKS

Query:  PKTKSG--GSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRK--RRRK
        P+   G   +CE C R + D  RFCS+ CK+S  SK K +             NLS  + + + T+   L+    I  ++      P S+  R+  +RRK
Subjt:  PKTKSG--GSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTISIAESTGETKASPSSSRPRK--RRRK

Query:  DIPHRSPF
         IPHR+PF
Subjt:  DIPHRSPF

AT2G01818.1 PLATZ transcription factor family protein2.1e-3945.25Show/hide
Query:  KRMETDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCA-----VHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNS
        +R E  W+ TLLN++FF  C  H  LRKNEKN FCIDC+V  C++C       H LHR++ I KYVY +V+R+ +++ YF CSEI TYK+NGE +IHLNS
Subjt:  KRMETDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCA-----VHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNS

Query:  RGQSVDTK-SPKTKSGGSCEDCGRYVQD-PNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELE---STISIAESTGETKASPS
        R Q+ D + S K K+G SC  C RY+QD PN FCSI+CK+S  SK          SP  +   L  KE ++ E +  E +   S+++      E   S  
Subjt:  RGQSVDTK-SPKTKSGGSCEDCGRYVQD-PNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELE---STISIAESTGETKASPS

Query:  SSRPRKR--RRKDIPHRSPFF
        S RP  R  +RK I  RSPF+
Subjt:  SSRPRKR--RRKDIPHRSPFF

AT2G12646.1 PLATZ transcription factor family protein1.5e-2136.72Show/hide
Query:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCA-VHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP
        WL  L   KFF  C  H   +KNE+N  C+DC  S C +C   H  HR + + +YVYH+VVR++D+++   CS +  Y +N    + +  R Q+   K  
Subjt:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCA-VHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP

Query:  KTKSGGSCEDCGRYVQDPNRFCSIACKV
           +G  C  C R +Q+P   CS+ CKV
Subjt:  KTKSGGSCEDCGRYVQDPNRFCSIACKV

AT3G60670.1 PLATZ transcription factor family protein3.4e-2140.31Show/hide
Query:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNC-AVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP
        WL  LL  KFF  C  H + +KNEKN  CIDC ++ C +C + H  HR + I +YVY +V+RV+D  +   CS I  Y  N    + +N R QS   +  
Subjt:  WLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNC-AVHDLHRQVHIWKYVYHEVVRVQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSP

Query:  KTKSGGSCEDCGRYVQDPNRFCSIACKVS
           SG  C  C R +Q P  FC ++CK+S
Subjt:  KTKSGGSCEDCGRYVQDPNRFCSIACKVS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGCGCTGGCAATCCAACGAGCTCAATCCAATTTATCCGCCGCTTCCTCTGCGTTCTTGTACTGGTTTCAGCCTTTCAGTTCAGTCTCCAATCGGAAGAATCCGTTATAA
TTATGCGAGTTTTTTAGTGAAGAGAATGGAAACGGACTGGCTTGGTACGCTTTTGAATACGAAATTCTTCACTTGTTGCGATCTTCATCCTAATCTCCGGAAAAATGAGA
AAAATAAATTCTGCATTGATTGTAGTGTTAGCTTCTGCAAGAATTGTGCAGTCCATGATCTTCATCGGCAGGTTCATATCTGGAAATATGTCTATCATGAAGTTGTGCGC
GTTCAGGACATGGAGAGATACTTTCGCTGTTCAGAGATTCATACATATAAAGTCAATGGCGAAATTTCTATTCATCTAAATTCCCGTGGTCAATCCGTCGACACCAAATC
ACCAAAGACGAAGTCCGGTGGTTCTTGTGAAGATTGTGGTAGATATGTACAAGATCCCAATCGCTTCTGTTCAATCGCTTGCAAGGTTTCTGTGAACTCAAAGCTCAAAG
ACCAGAGCACGGGAACCATTGTATCTCCGAGCCCAGATTTCGGTAACTTATCGTTCAAGGAAAAAACCAGTGCAGAAACAAATGCAAGCGAATTGGAATCAACCATATCA
ATTGCAGAGTCCACAGGAGAGACCAAAGCTAGCCCTTCATCTTCACGACCAAGAAAACGCAGAAGGAAAGACATCCCTCACAGATCGCCATTCTTCTGA
mRNA sequenceShow/hide mRNA sequence
ATGCGCTGGCAATCCAACGAGCTCAATCCAATTTATCCGCCGCTTCCTCTGCGTTCTTGTACTGGTTTCAGCCTTTCAGTTCAGTCTCCAATCGGAAGAATCCGTTATAA
TTATGCGAGTTTTTTAGTGAAGAGAATGGAAACGGACTGGCTTGGTACGCTTTTGAATACGAAATTCTTCACTTGTTGCGATCTTCATCCTAATCTCCGGAAAAATGAGA
AAAATAAATTCTGCATTGATTGTAGTGTTAGCTTCTGCAAGAATTGTGCAGTCCATGATCTTCATCGGCAGGTTCATATCTGGAAATATGTCTATCATGAAGTTGTGCGC
GTTCAGGACATGGAGAGATACTTTCGCTGTTCAGAGATTCATACATATAAAGTCAATGGCGAAATTTCTATTCATCTAAATTCCCGTGGTCAATCCGTCGACACCAAATC
ACCAAAGACGAAGTCCGGTGGTTCTTGTGAAGATTGTGGTAGATATGTACAAGATCCCAATCGCTTCTGTTCAATCGCTTGCAAGGTTTCTGTGAACTCAAAGCTCAAAG
ACCAGAGCACGGGAACCATTGTATCTCCGAGCCCAGATTTCGGTAACTTATCGTTCAAGGAAAAAACCAGTGCAGAAACAAATGCAAGCGAATTGGAATCAACCATATCA
ATTGCAGAGTCCACAGGAGAGACCAAAGCTAGCCCTTCATCTTCACGACCAAGAAAACGCAGAAGGAAAGACATCCCTCACAGATCGCCATTCTTCTGA
Protein sequenceShow/hide protein sequence
MRWQSNELNPIYPPLPLRSCTGFSLSVQSPIGRIRYNYASFLVKRMETDWLGTLLNTKFFTCCDLHPNLRKNEKNKFCIDCSVSFCKNCAVHDLHRQVHIWKYVYHEVVR
VQDMERYFRCSEIHTYKVNGEISIHLNSRGQSVDTKSPKTKSGGSCEDCGRYVQDPNRFCSIACKVSVNSKLKDQSTGTIVSPSPDFGNLSFKEKTSAETNASELESTIS
IAESTGETKASPSSSRPRKRRRKDIPHRSPFF