; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Spg004204 (gene) of Sponge gourd (cylindrica) v1 genome

Gene IDSpg004204
OrganismLuffa cylindrica (Sponge gourd (cylindrica) v1)
DescriptionVQ motif-containing protein 22-like
Genome locationscaffold6:7156534..7157205
RNA-Seq ExpressionSpg004204
SyntenySpg004204
Gene Ontology termsNA
InterPro domainsIPR008889 - VQ
IPR039609 - VQ motif-containing protein 15/22


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6600438.1 VQ motif-containing protein 22, partial [Cucurbita argyrosperma subsp. sororia]1.3e-9081.25Show/hide
Query:  MSAPGDWLQFYHQNLPTTAA-PPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR
        MS+PGDWLQFYHQNL TTAA PPPSD PTSSAMIF +RVSDAT V  TTSA+++GSSAGNT     LNPEGRVGKP+RRRSRASRRTPTTLLNTDTTNFR
Subjt:  MSAPGDWLQFYHQNLPTTAA-PPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR

Query:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS
        AMVQQFTGGPT  F+ SISPNF LGF G+ QSNFGTPP AV+SPPS YLQPPQFYHSNPQPFMFPAAAHGG+F QR+S ARP N GVAGDGFLM SAVSS
Subjt:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS

Query:  QIPAAGASADSSNESNGGNGGLLF
        QIP  GASADSSN++N GNGG LF
Subjt:  QIPAAGASADSSNESNGGNGGLLF

XP_022943215.1 VQ motif-containing protein 22-like [Cucurbita moschata]7.6e-9181.25Show/hide
Query:  MSAPGDWLQFYHQNLPTTAAP-PPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR
        MS+PGDWLQFYHQNL TTAAP PPSD PTSSAMIF +RVSDAT V  TTSA+++GSSAGN      LNPEGRVGKP+RRRSRASRRTPTTLLNTDTTNFR
Subjt:  MSAPGDWLQFYHQNLPTTAAP-PPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR

Query:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS
        AMVQQFTGGPT  F+ SISPNF LGF G+ QSNFGTPPNAV+SPPS YLQPPQFYHSNPQPFMFPAAAHGG+F QR+S ARP N GVAGDGFLM SAVSS
Subjt:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS

Query:  QIPAAGASADSSNESNGGNGGLLF
        QIP  GASADSSN++N GNGG LF
Subjt:  QIPAAGASADSSNESNGGNGGLLF

XP_022982664.1 VQ motif-containing protein 22-like [Cucurbita maxima]7.1e-8979.82Show/hide
Query:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRA
        MS+PGDWLQFYHQNL TTA PPPSD PTSSA IF +RVSDAT V  TTSA+++GSSAGNT     LNPEGRVGKP+RRRSRASRRTPTTLLNTDTTNFRA
Subjt:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRA

Query:  MVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQ
        MVQQFTGGPT   + SISPNF LGF G+ QSNFGTPPNAV+SPPS YLQ PQFYHS+PQPFMFPAAAHGG+FLQR+S ARP N GVAGDGFLM SAVSSQ
Subjt:  MVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQ

Query:  IPAAGASADSSNESNGGNGGLLF
        IP  GASADSSN++N GNG  LF
Subjt:  IPAAGASADSSNESNGGNGGLLF

XP_023529552.1 VQ motif-containing protein 22-like [Cucurbita pepo subsp. pepo]5.8e-9180.8Show/hide
Query:  MSAPGDWLQFYHQNLPTTAA-PPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR
        MS+PGDWLQFYHQNL TTAA PPPSD PTSSAMIF +RVSDAT V  TTSA+++GSSAGNT     LNPEGRVGKP+RRRSRASRRTPTTLLNTDTTNFR
Subjt:  MSAPGDWLQFYHQNLPTTAA-PPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR

Query:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS
        AMVQQFTGGPT  F+ SISPNF LGF G+ QSNFGTPPNAV+SPPS YLQPPQFYHSNPQPFMFPAAAHGG+F+QR+S ARP N G  GDGFLM SAVSS
Subjt:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS

Query:  QIPAAGASADSSNESNGGNGGLLF
        QIP  GASADSSN++N GNGG LF
Subjt:  QIPAAGASADSSNESNGGNGGLLF

XP_038900813.1 VQ motif-containing protein 22 [Benincasa hispida]1.6e-8880Show/hide
Query:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRA
        MS  GDWLQFYHQNL +TAAPPPSDQ TS  MIF DRVSDAT V TTT       ++G TA ST LNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRA
Subjt:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRA

Query:  MVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYL--QPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVS
        MVQQFTGGPTPPF+ SISPNFSLGF G+RQSNF TPPNAV+SPPSGYL  QPPQFY+ NPQPF+FP  AHGG+FLQRLSA RP NGGV+GDGFL  SAV 
Subjt:  MVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYL--QPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVS

Query:  SQIPAAGASADSSNESNGGNGGLLF
        SQIP AGASA SSNESNGGNG LLF
Subjt:  SQIPAAGASADSSNESNGGNGGLLF

TrEMBL top hitse value%identityAlignment
A0A5A7TQ26 VQ motif-containing protein 22-like4.1e-8277.03Show/hide
Query:  GDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQ
        GDWLQFYHQNL +TA PPPS   TS  MIF DRVSDAT             ++ NT  ST LNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQ
Subjt:  GDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQ

Query:  FTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVS-PPSGYL--QPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQI
        FTGGPTPPF+ SISPNFSLGFGG+RQSNF T  NA +S PPSGYL  QPPQ Y+ NPQPF+FP AAHGG+FLQRLSA RP NGGVAGDGFL+ SAVSSQI
Subjt:  FTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVS-PPSGYL--QPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQI

Query:  PAAGASADSSNESNGGNGGLLF
        P AGASADSSNESNGGNG LLF
Subjt:  PAAGASADSSNESNGGNGGLLF

A0A5D3CX65 VQ motif-containing protein 22-like1.2e-8176.58Show/hide
Query:  GDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQ
        GDWLQFYHQNL +TA PPPS   TS  MIF DRVSDAT             ++ NT  ST LNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQ
Subjt:  GDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQ

Query:  FTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVS-PPSGYL--QPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQI
        FTGGPTPPF+ SISPNFSLGFGG+RQSNF T  NA +S PPSGYL  QPPQ Y+ NPQPF+FP  AHGG+FLQRLSA RP NGGVAGDGFL+ SAVSSQI
Subjt:  FTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVS-PPSGYL--QPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQI

Query:  PAAGASADSSNESNGGNGGLLF
        P AGASADSSNESNGGNG LLF
Subjt:  PAAGASADSSNESNGGNGGLLF

A0A6J1C3V2 VQ motif-containing protein 22-like9.7e-8476.5Show/hide
Query:  MSAPGDWLQFYHQNLPTTAA---PPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTN
        MS PGDWLQFYH NL  TAA   PPPS    +SAM+F DRVSDAT VATT++A  +GSSAGN   S  LNP+GRVGKPVRRRSRASRRTPTTLLNTDTTN
Subjt:  MSAPGDWLQFYHQNLPTTAA---PPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTN

Query:  FRAMVQQFTGGPTPPFSPSIS-----PNFSLGFGGVRQSNFGTPPNAVVS-PPSGYL-QPPQFYHSN-PQPFMFPAAAHGGEFLQRLSAARPVNGGVAGD
        FRAMVQQFTGGPTPPF+ SIS     PNFSLGFGG+RQSNFG  PN  +S PPSGYL Q PQFYH N P+PFMFPA AHGG+FLQRLSA RP NGGV  D
Subjt:  FRAMVQQFTGGPTPPFSPSIS-----PNFSLGFGGVRQSNFGTPPNAVVS-PPSGYL-QPPQFYHSN-PQPFMFPAAAHGGEFLQRLSAARPVNGGVAGD

Query:  GFLMNSAVSSQIPAAGASADSSNESNGGNGGLLF
        GFLM SAVSSQIP+AG SADSSNESN GNGGLLF
Subjt:  GFLMNSAVSSQIPAAGASADSSNESNGGNGGLLF

A0A6J1FXJ7 VQ motif-containing protein 22-like3.7e-9181.25Show/hide
Query:  MSAPGDWLQFYHQNLPTTAAP-PPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR
        MS+PGDWLQFYHQNL TTAAP PPSD PTSSAMIF +RVSDAT V  TTSA+++GSSAGN      LNPEGRVGKP+RRRSRASRRTPTTLLNTDTTNFR
Subjt:  MSAPGDWLQFYHQNLPTTAAP-PPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFR

Query:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS
        AMVQQFTGGPT  F+ SISPNF LGF G+ QSNFGTPPNAV+SPPS YLQPPQFYHSNPQPFMFPAAAHGG+F QR+S ARP N GVAGDGFLM SAVSS
Subjt:  AMVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSS

Query:  QIPAAGASADSSNESNGGNGGLLF
        QIP  GASADSSN++N GNGG LF
Subjt:  QIPAAGASADSSNESNGGNGGLLF

A0A6J1J579 VQ motif-containing protein 22-like3.4e-8979.82Show/hide
Query:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRA
        MS+PGDWLQFYHQNL TTA PPPSD PTSSA IF +RVSDAT V  TTSA+++GSSAGNT     LNPEGRVGKP+RRRSRASRRTPTTLLNTDTTNFRA
Subjt:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRA

Query:  MVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQ
        MVQQFTGGPT   + SISPNF LGF G+ QSNFGTPPNAV+SPPS YLQ PQFYHS+PQPFMFPAAAHGG+FLQR+S ARP N GVAGDGFLM SAVSSQ
Subjt:  MVQQFTGGPTPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQ

Query:  IPAAGASADSSNESNGGNGGLLF
        IP  GASADSSN++N GNG  LF
Subjt:  IPAAGASADSSNESNGGNGGLLF

SwissProt top hitse value%identityAlignment
Q9LIE6 VQ motif-containing protein 224.9e-1639.18Show/hide
Query:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPE-GRVGKPVRRRSRASRRTPTTLLNTDTTNFR
        M+ P +W QFY+ N                   F    + +T V TTT+          T+  + L+PE GRV KP RRRSRASRRTPTTLLNTDT+NFR
Subjt:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPE-GRVGKPVRRRSRASRRTPTTLLNTDTTNFR

Query:  AMVQQFTGGP----------TPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQP
        AMVQQ+TGGP          T  FS + S + S G        +   P+A + PP    +P  F  +N  P
Subjt:  AMVQQFTGGP----------TPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQP

Arabidopsis top hitse value%identityAlignment
AT1G35830.1 VQ motif-containing protein8.5e-0836.61Show/hide
Query:  PPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLN---------------PEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFT
        PP   P SS+  + D     T  ++++S++   +   N  +  +LN               P     +  R+R+RASRR PTT+L TDT+NFRAMVQ+FT
Subjt:  PPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLN---------------PEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFT

Query:  GGPTPPFSPSIS
        G P  PFS   S
Subjt:  GGPTPPFSPSIS

AT3G22160.1 VQ motif-containing protein3.5e-1739.18Show/hide
Query:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPE-GRVGKPVRRRSRASRRTPTTLLNTDTTNFR
        M+ P +W QFY+ N                   F    + +T V TTT+          T+  + L+PE GRV KP RRRSRASRRTPTTLLNTDT+NFR
Subjt:  MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPE-GRVGKPVRRRSRASRRTPTTLLNTDTTNFR

Query:  AMVQQFTGGP----------TPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQP
        AMVQQ+TGGP          T  FS + S + S G        +   P+A + PP    +P  F  +N  P
Subjt:  AMVQQFTGGP----------TPPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQP

AT4G15120.1 VQ motif-containing protein4.7e-1439.56Show/hide
Query:  TTTSASVLGSSAGNTAASTVLNPEG-RVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFTGGPTP-PFSPSISPNFSLGFGGVRQSNFGTPPNAVVSP
        TT +++V  ++   T+A + L+P+  RV KP RRRSRASRRTPTTL NTDT NFRAMVQQFTGGP+   F  S S  FSL            P   V S 
Subjt:  TTTSASVLGSSAGNTAASTVLNPEG-RVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFTGGPTP-PFSPSISPNFSLGFGGVRQSNFGTPPNAVVSP

Query:  PSGYLQ-PPQFYHS----NPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQIPAAGASADSSNESNGGNGG
        P  Y     Q  H+      +P+MF ++ +    +  LS        VA DGF+               A+ S E  GG GG
Subjt:  PSGYLQ-PPQFYHS----NPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQIPAAGASADSSNESNGGNGG

AT4G39720.1 VQ motif-containing protein5.0e-0832.95Show/hide
Query:  TAASTVLNPEGRVG--KPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFTGGPTPPFSPSIS------PNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQP-
        ++A++ L P   +G  K  ++RSRASRR PTT+L TDT+NFRAMVQ+FTG P PP   + S       N  LG      + + T  N ++ P +  L P 
Subjt:  TAASTVLNPEGRVG--KPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFTGGPTPPFSPSIS------PNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQP-

Query:  -PQFYHSNPQPFMFPAAAHGGEFLQRL-----SAARPVNGGVAGDGFLMNSAVSSQIPAAGASADSSNESNGGNGG
         P    S  Q +  P        LQ L     S  R       G G +   + +     A A+ + +   NG  GG
Subjt:  -PQFYHSNPQPFMFPAAAHGGEFLQRL-----SAARPVNGGVAGDGFLMNSAVSSQIPAAGASADSSNESNGGNGG

AT5G65170.1 VQ motif-containing protein3.5e-0934.78Show/hide
Query:  TTAAPP-----PSDQPTSSAMIF----VDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFTG
        TTA  P     P   P SS  +F    + +     P   TTS      +      +T  NP        ++RSR SRR PTT+L TDT+NFRAMVQ+FTG
Subjt:  TTAAPP-----PSDQPTSSAMIF----VDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFTG

Query:  GPTPPFS--PSISPNFSLGFGGVRQSNFGTP----PNAVVSPPS---GYLQPPQFYHSNPQ
         P+ PF+   S  P       G   S+   P    P+ ++SP +    YL P   YH + Q
Subjt:  GPTPPFS--PSISPNFSLGFGGVRQSNFGTP----PNAVVSPPS---GYLQPPQFYHSNPQ


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTCCGCTCCTGGCGATTGGCTTCAATTTTACCATCAAAATCTTCCCACCACGGCGGCGCCACCACCTTCCGATCAACCCACCTCCTCCGCCATGATCTTCGTCGATCG
AGTCTCTGACGCCACCCCCGTCGCCACCACTACCTCCGCCTCTGTCCTCGGGAGTTCCGCTGGAAACACCGCCGCTTCGACCGTCTTGAATCCCGAAGGTCGAGTCGGGA
AGCCGGTTCGCCGCCGCTCCAGGGCCTCGCGGCGGACTCCGACGACTCTGCTCAACACGGACACCACGAATTTCAGAGCGATGGTTCAGCAATTCACTGGCGGACCGACT
CCGCCTTTCTCCCCGTCGATTTCGCCTAATTTTTCGCTAGGGTTCGGCGGAGTTCGTCAATCAAATTTCGGCACTCCGCCGAACGCTGTGGTTTCTCCGCCGTCTGGTTA
CCTACAGCCGCCGCAGTTCTACCATTCGAACCCCCAGCCGTTCATGTTTCCGGCGGCCGCACACGGCGGCGAATTTCTGCAGAGGCTATCCGCGGCGAGGCCGGTTAATG
GTGGAGTCGCCGGAGACGGATTTCTGATGAACAGTGCGGTTTCTTCTCAAATTCCTGCCGCCGGAGCTTCTGCAGATTCCTCCAACGAGAGCAATGGCGGTAATGGTGGC
TTACTGTTCTGA
mRNA sequenceShow/hide mRNA sequence
ATGTCCGCTCCTGGCGATTGGCTTCAATTTTACCATCAAAATCTTCCCACCACGGCGGCGCCACCACCTTCCGATCAACCCACCTCCTCCGCCATGATCTTCGTCGATCG
AGTCTCTGACGCCACCCCCGTCGCCACCACTACCTCCGCCTCTGTCCTCGGGAGTTCCGCTGGAAACACCGCCGCTTCGACCGTCTTGAATCCCGAAGGTCGAGTCGGGA
AGCCGGTTCGCCGCCGCTCCAGGGCCTCGCGGCGGACTCCGACGACTCTGCTCAACACGGACACCACGAATTTCAGAGCGATGGTTCAGCAATTCACTGGCGGACCGACT
CCGCCTTTCTCCCCGTCGATTTCGCCTAATTTTTCGCTAGGGTTCGGCGGAGTTCGTCAATCAAATTTCGGCACTCCGCCGAACGCTGTGGTTTCTCCGCCGTCTGGTTA
CCTACAGCCGCCGCAGTTCTACCATTCGAACCCCCAGCCGTTCATGTTTCCGGCGGCCGCACACGGCGGCGAATTTCTGCAGAGGCTATCCGCGGCGAGGCCGGTTAATG
GTGGAGTCGCCGGAGACGGATTTCTGATGAACAGTGCGGTTTCTTCTCAAATTCCTGCCGCCGGAGCTTCTGCAGATTCCTCCAACGAGAGCAATGGCGGTAATGGTGGC
TTACTGTTCTGA
Protein sequenceShow/hide protein sequence
MSAPGDWLQFYHQNLPTTAAPPPSDQPTSSAMIFVDRVSDATPVATTTSASVLGSSAGNTAASTVLNPEGRVGKPVRRRSRASRRTPTTLLNTDTTNFRAMVQQFTGGPT
PPFSPSISPNFSLGFGGVRQSNFGTPPNAVVSPPSGYLQPPQFYHSNPQPFMFPAAAHGGEFLQRLSAARPVNGGVAGDGFLMNSAVSSQIPAAGASADSSNESNGGNGG
LLF