; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

IVF0017023 (gene) of Melon (IVF77) v1 genome

Gene IDIVF0017023
OrganismCucumis melo ssp. agrestis cv. IVF77 (Melon (IVF77) v1)
DescriptionDUF4477 domain-containing protein
Genome locationchr06:1413095..1426747
RNA-Seq ExpressionIVF0017023
SyntenyIVF0017023
Gene Ontology termsGO:0015074 - DNA integration (biological process)
GO:0016021 - integral component of membrane (cellular component)
GO:0003676 - nucleic acid binding (molecular function)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0038723.1 uncharacterized protein E6C27_scaffold92G002690 [Cucumis melo var. makuwa]3.44e-13071.75Show/hide
Query:  ENLKRRKCAPSVTGDFSLEFVFFVSPIG--RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAI
        E+LKRRKC          ++ F    +G  R   +++  +  ++ EISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVV VFN VSSISKKKQVAAI
Subjt:  ENLKRRKCAPSVTGDFSLEFVFFVSPIG--RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAI

Query:  NQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMET
        NQEGIQ          VFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSA+ Y+KLQSF G DESEEGEA+QSN+KGL LM+T
Subjt:  NQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMET

Query:  TKNGLLTSPSGRVNDISMEDNT--EAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENP
        TKNGLL SPSGRVNDIS+EDNT  E KDGLIS VK SSKTFLPQEGSSL           K N KR AFVS+ LPK ITSG VGIQFNESKV+S+EKENP
Subjt:  TKNGLLTSPSGRVNDISMEDNT--EAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENP

Query:  FFSLLAGGKAKSSLF
        FFSLL GGKAKSSLF
Subjt:  FFSLLAGGKAKSSLF

XP_004140752.1 uncharacterized protein LOC101210672 [Cucumis sativus]2.00e-13371.43Show/hide
Query:  ENLKRRKCAPSVTGDFSLEFVFFVSPIG--RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAI
        E+LKRRKC          ++ F    +G  R   +MVEPIFKAATEISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVVSVFN VSSISKKKQV AI
Subjt:  ENLKRRKCAPSVTGDFSLEFVFFVSPIG--RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAI

Query:  NQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQE-HIGPDVSLATSAMRYRKLQSFFGGDESEEGE--------ANQSN
        NQE IQ          VFREFYPTNDE+VLLECIWEVDKFILKEK  E+ATKNQE HI PD SLATSAMRY+KL+SF G DESEE E        AN+SN
Subjt:  NQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQE-HIGPDVSLATSAMRYRKLQSFFGGDESEEGE--------ANQSN

Query:  EKGLDLMETTKNGLLTSPSGRVNDISMEDNTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVD
        EKGLDLM+TT NGLL SPSG VNDISMEDNTE KDGLIS VK +SKTFLPQEG+SL           KPN KRPAFVS+ LPK ITSG VGIQFNESKVD
Subjt:  EKGLDLMETTKNGLLTSPSGRVNDISMEDNTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVD

Query:  SLEKENPFFSLLAGGKAKSSLF
        S+EKENPFF+LL GGKAKSSLF
Subjt:  SLEKENPFFSLLAGGKAKSSLF

XP_008466256.1 PREDICTED: uncharacterized protein LOC103503723 isoform X1 [Cucumis melo]1.00e-13874.92Show/hide
Query:  ENLKRRKCAPSVTGDFSLEFVFFVSPIG--RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAI
        E+LKRRKC          ++ F    +G  R   +MVEPIFKAATEISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVV VFN VSSISKKKQVAAI
Subjt:  ENLKRRKCAPSVTGDFSLEFVFFVSPIG--RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAI

Query:  NQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMET
        NQEGIQ          VFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSA+ Y+KLQSF G DESEEGEA+QSN+KGL LM+T
Subjt:  NQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMET

Query:  TKNGLLTSPSGRVNDISMEDNT--EAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENP
        TKNGLL SPSGRVNDIS+EDNT  E KDGLIS VK SSKTFLPQEGSSL           K N KR AFVS+ LPK ITSG VGIQFNESKV+S+EKENP
Subjt:  TKNGLLTSPSGRVNDISMEDNT--EAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENP

Query:  FFSLLAGGKAKSSLF
        FFSLL GGKAKSSLF
Subjt:  FFSLLAGGKAKSSLF

XP_008466257.1 PREDICTED: uncharacterized protein LOC103503723 isoform X2 [Cucumis melo]7.91e-13879.65Show/hide
Query:  RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVL
        R   +MVEPIFKAATEISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVV VFN VSSISKKKQVAAINQEGIQ          VFREFYPTNDEFVL
Subjt:  RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVL

Query:  LECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVNDISMEDNT--EAKDGL
        LECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSA+ Y+KLQSF G DESEEGEA+QSN+KGL LM+TTKNGLL SPSGRVNDIS+EDNT  E KDGL
Subjt:  LECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVNDISMEDNT--EAKDGL

Query:  ISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF
        IS VK SSKTFLPQEGSSL           K N KR AFVS+ LPK ITSG VGIQFNESKV+S+EKENPFFSLL GGKAKSSLF
Subjt:  ISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF

XP_038905505.1 uncharacterized protein LOC120091509 [Benincasa hispida]1.60e-11365.38Show/hide
Query:  ENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQ
        E+LKRRK   S  G ++  F+  +    R   +MVEPIFKAATEISILLARTFF+ FCFVIL+ LARIRVLVQ ILLDVVSVFN VSSISKKKQV  INQ
Subjt:  ENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQ

Query:  EGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQE-HIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETT
        EGIQ          VFREFYPTNDEFVLLEC+WE DKFIL+EK QEVATKNQE H+GP+VSLA SA+RY+KL+SF   DESE+ +A+QSNEKGLDLM+ +
Subjt:  EGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQE-HIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETT

Query:  KNGLLTSPSGRVNDISMEDNTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFS
        K+ LL SP GRVNDI +ED      G I  V+ SSKTFLPQE SSL           K N KRPAFVS+  PK I S  VG QFNE+K D +EKE+PFF+
Subjt:  KNGLLTSPSGRVNDISMEDNTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFS

Query:  LLAGGKAKSSLF
        LL GGKAKSSLF
Subjt:  LLAGGKAKSSLF

TrEMBL top hitse value%identityAlignment
A0A0A0LBJ0 Uncharacterized protein1.1e-11272.46Show/hide
Query:  MGDSMGSTEVDNLQENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMV
        MGDSMGSTE   LQENLKRRKC     G ++  F+  +    R   +MVEPIFKAATEISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVVSVFN V
Subjt:  MGDSMGSTEVDNLQENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMV

Query:  SSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQ-EHIGPDVSLATSAMRYRKLQSFFGGDESEEGE-
        SSISKKKQV AINQE I          QVFREFYPTNDE+VLLECIWEVDKFILKEK  E+ATKNQ EHI PD SLATSAMRY+KL+SF G DESEE E 
Subjt:  SSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQ-EHIGPDVSLATSAMRYRKLQSFFGGDESEEGE-

Query:  -------ANQSNEKGLDLMETTKNGLLTSPSGRVNDISMEDNTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSG
               AN+SNEKGLDLM+TT NGLL SPSG VNDISMEDNTE KDGLIS VK +SKTFLPQEG+SL           KPN KRPAFVS+ LPK ITSG
Subjt:  -------ANQSNEKGLDLMETTKNGLLTSPSGRVNDISMEDNTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSG

Query:  VVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF
         VGIQFNESKVDS+EKENPFF+LL GGKAKSSLF
Subjt:  VVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF

A0A1S3CQT2 uncharacterized protein LOC103503723 isoform X11.9e-10975.4Show/hide
Query:  ENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQ
        E+LKRRKC     G ++  F+  +    R   +MVEPIFKAATEISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVV VFN VSSISKKKQVAAINQ
Subjt:  ENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQ

Query:  EGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTK
        EGI          QVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSA+ Y+KLQSF G DESEEGEA+QSN+KGL LM+TTK
Subjt:  EGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTK

Query:  NGLLTSPSGRVNDISMED--NTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFF
        NGLL SPSGRVNDIS+ED  NTE KDGLIS VK SSKTFLPQEGSSL           K N KR AFVS+ LPK ITSG VGIQFNESKV+S+EKENPFF
Subjt:  NGLLTSPSGRVNDISMED--NTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFF

Query:  SLLAGGKAKSSLF
        SLL GGKAKSSLF
Subjt:  SLLAGGKAKSSLF

A0A1S3CQU1 uncharacterized protein LOC103503723 isoform X21.4e-10779.65Show/hide
Query:  RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVL
        R   +MVEPIFKAATEISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVV VFN VSSISKKKQVAAINQEGI          QVFREFYPTNDEFVL
Subjt:  RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVL

Query:  LECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVNDISMED--NTEAKDGL
        LECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSA+ Y+KLQSF G DESEEGEA+QSN+KGL LM+TTKNGLL SPSGRVNDIS+ED  NTE KDGL
Subjt:  LECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVNDISMED--NTEAKDGL

Query:  ISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF
        IS VK SSKTFLPQEGSSL           K N KR AFVS+ LPK ITSG VGIQFNESKV+S+EKENPFFSLL GGKAKSSLF
Subjt:  ISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF

A0A5A7T6Z8 DUF4477 domain-containing protein2.6e-10372.2Show/hide
Query:  ENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQ
        E+LKRRKC     G ++  F+  +    R   +++  +  ++ EISILLARTFF  FCFVIL+ LARIRVLVQ ILLDVV VFN VSSISKKKQVAAINQ
Subjt:  ENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQ

Query:  EGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTK
        EGI          QVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSA+ Y+KLQSF G DESEEGEA+QSN+KGL LM+TTK
Subjt:  EGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTK

Query:  NGLLTSPSGRVNDISMED--NTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFF
        NGLL SPSGRVNDIS+ED  NTE KDGLIS VK SSKTFLPQEGSSL           K N KR AFVS+ LPK ITSG VGIQFNESKV+S+EKENPFF
Subjt:  NGLLTSPSGRVNDISMED--NTEAKDGLISLVKISSKTFLPQEGSSL-----------KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFF

Query:  SLLAGGKAKSSLF
        SLL GGKAKSSLF
Subjt:  SLLAGGKAKSSLF

A0A5D3E7Q6 Uncharacterized protein7.5e-9060.22Show/hide
Query:  MGDSMGSTEVDNLQENLKRRKCAPSVTGDFSLEFVFFVSPIGR--FYQRMVEPIFKAATEISILLARTFFSRFCFVIL----------------------
        MGDSM STE DNLQE L        +      + ++      R  FY R +  + +    +  +      S  CF ++                      
Subjt:  MGDSMGSTEVDNLQENLKRRKCAPSVTGDFSLEFVFFVSPIGR--FYQRMVEPIFKAATEISILLARTFFSRFCFVIL----------------------

Query:  ---SFLARIRVLVQL---ILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIG
           +F+ R+   V+L   ILLDVV VFN VSSISKKKQVAAINQEGI          QVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIG
Subjt:  ---SFLARIRVLVQL---ILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIG

Query:  PDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVNDISMED--NTEAKDGLISLVKISSKTFLPQEGSSL---------
        PDVSLATSA+ Y+KLQSF G DESEEGEA+QSN+KGL LM+TTKNGLL SPSGRVNDIS+ED  NTE KDGLIS VK SSKTFLPQEGSSL         
Subjt:  PDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVNDISMED--NTEAKDGLISLVKISSKTFLPQEGSSL---------

Query:  --KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF
          K N KR AFVS+ LPK ITSG VGIQFNESKV+S+EKENPFFSLL GGKAKSSLF
Subjt:  --KPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G50910.1 unknown protein2.2e-2537.61Show/hide
Query:  RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFV-
        R   +M EPI KAA+ IS LLAR+FF  F    L+ LAR+RVLVQ ILLD VSVFN V+S S KKQ   I Q+G+          +VFREFYP  +E V 
Subjt:  RFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVAAINQEGIQFLNFSPICLQVFREFYPTNDEFV-

Query:  LLECIWEVDKFILKEKIQ--EVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVN-DISMEDNTEAKD
        LL+C+W+ DK++L E +Q  E +   ++++  DV+   S ++Y+   S    D S    A+ S   G  + E++   +  + S + N  +  ED+   +D
Subjt:  LLECIWEVDKFILKEKIQ--EVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTSPSGRVN-DISMEDNTEAKD

Query:  GLISLVKISSKTFLPQEGSSLKPNLK
               +  +TF+   G  L P L+
Subjt:  GLISLVKISSKTFLPQEGSSLKPNLK


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGGGGATTCCATGGGTTCTACTGAAGTTGATAACCTTCAGGAGAATTTAAAACGGAGGAAATGTGCGCCTTCTGTCACAGGTGATTTTTCTCTTGAATTTGTCTTCTT
TGTATCACCCATTGGGAGATTTTATCAAAGGATGGTGGAGCCAATTTTTAAGGCAGCAACGGAGATATCCATCTTGCTTGCTCGAACATTTTTTTCAAGGTTTTGCTTTG
TAATCTTGTCATTTCTGGCACGTATTCGGGTGTTAGTTCAACTAATATTGCTCGACGTTGTTTCAGTATTCAACATGGTTTCATCTATCTCTAAAAAGAAGCAAGTAGCT
GCAATAAACCAGGAAGGAATTCAGTTTTTAAACTTTTCTCCAATCTGTTTACAAGTCTTTAGAGAGTTTTACCCAACGAATGATGAATTTGTCCTCTTAGAGTGTATTTG
GGAAGTAGACAAATTTATTTTGAAAGAGAAAATACAAGAAGTTGCAACTAAGAATCAAGAACATATTGGGCCTGATGTTTCTTTAGCCACTTCAGCTATGCGGTATCGGA
AACTTCAATCTTTTTTTGGAGGTGATGAATCGGAGGAGGGAGAGGCAAATCAAAGTAATGAGAAAGGTCTTGATCTAATGGAAACGACTAAGAATGGTTTACTAACAAGC
CCATCAGGAAGAGTTAATGATATATCTATGGAAGATAATACAGAAGCAAAAGACGGTTTGATCAGTCTGGTAAAGATTTCGAGCAAGACGTTCTTGCCCCAAGAAGGTAG
TTCTCTCAAACCAAACTTGAAGAGGCCAGCATTTGTTTCAATAGTACTTCCCAAATCGATTACATCTGGTGTAGTTGGAATTCAATTCAATGAAAGTAAAGTTGATAGTC
TGGAAAAAGAGAATCCATTTTTCTCTTTGCTCGCTGGTGGCAAAGCCAAAAGCAGTTTATTTTAA
mRNA sequenceShow/hide mRNA sequence
ATGGGGGATTCCATGGGTTCTACTGAAGTTGATAACCTTCAGGAGAATTTAAAACGGAGGAAATGTGCGCCTTCTGTCACAGGTGATTTTTCTCTTGAATTTGTCTTCTT
TGTATCACCCATTGGGAGATTTTATCAAAGGATGGTGGAGCCAATTTTTAAGGCAGCAACGGAGATATCCATCTTGCTTGCTCGAACATTTTTTTCAAGGTTTTGCTTTG
TAATCTTGTCATTTCTGGCACGTATTCGGGTGTTAGTTCAACTAATATTGCTCGACGTTGTTTCAGTATTCAACATGGTTTCATCTATCTCTAAAAAGAAGCAAGTAGCT
GCAATAAACCAGGAAGGAATTCAGTTTTTAAACTTTTCTCCAATCTGTTTACAAGTCTTTAGAGAGTTTTACCCAACGAATGATGAATTTGTCCTCTTAGAGTGTATTTG
GGAAGTAGACAAATTTATTTTGAAAGAGAAAATACAAGAAGTTGCAACTAAGAATCAAGAACATATTGGGCCTGATGTTTCTTTAGCCACTTCAGCTATGCGGTATCGGA
AACTTCAATCTTTTTTTGGAGGTGATGAATCGGAGGAGGGAGAGGCAAATCAAAGTAATGAGAAAGGTCTTGATCTAATGGAAACGACTAAGAATGGTTTACTAACAAGC
CCATCAGGAAGAGTTAATGATATATCTATGGAAGATAATACAGAAGCAAAAGACGGTTTGATCAGTCTGGTAAAGATTTCGAGCAAGACGTTCTTGCCCCAAGAAGGTAG
TTCTCTCAAACCAAACTTGAAGAGGCCAGCATTTGTTTCAATAGTACTTCCCAAATCGATTACATCTGGTGTAGTTGGAATTCAATTCAATGAAAGTAAAGTTGATAGTC
TGGAAAAAGAGAATCCATTTTTCTCTTTGCTCGCTGGTGGCAAAGCCAAAAGCAGTTTATTTTAA
Protein sequenceShow/hide protein sequence
MGDSMGSTEVDNLQENLKRRKCAPSVTGDFSLEFVFFVSPIGRFYQRMVEPIFKAATEISILLARTFFSRFCFVILSFLARIRVLVQLILLDVVSVFNMVSSISKKKQVA
AINQEGIQFLNFSPICLQVFREFYPTNDEFVLLECIWEVDKFILKEKIQEVATKNQEHIGPDVSLATSAMRYRKLQSFFGGDESEEGEANQSNEKGLDLMETTKNGLLTS
PSGRVNDISMEDNTEAKDGLISLVKISSKTFLPQEGSSLKPNLKRPAFVSIVLPKSITSGVVGIQFNESKVDSLEKENPFFSLLAGGKAKSSLF