; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr025797 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr025797
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
DescriptionLate embryogenesis abundant protein
Genome locationtig00152936:3167955..3168602
RNA-Seq ExpressionSgr025797
SyntenySgr025797
Gene Ontology termsGO:0016021 - integral component of membrane (cellular component)
InterPro domainsIPR004864 - Late embryogenesis abundant protein, LEA_2 subgroup


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6575200.1 Late embryogenesis abundant protein, partial [Cucurbita argyrosperma subsp. sororia]2.1e-7472.6Show/hide
Query:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        MA+K+QARPLAP  H   SS++ +  LHLKRI+RRRFIK    I+ LL++ +V VI ILMFT+FQVKDPII+MN ISIT +ELING+IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPN+ASFKYSNTTTTLYI ET+IGEARGP GQAKA RT +MN+TI+I+ D+LL NLN  +SSGKL LRSFSR+PGRVKLLHI+RR+IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI N++IEDQ CKRKVK+
Subjt:  INIMNRTIEDQKCKRKVKL

KAG7013763.1 Late embryogenesis abundant protein, partial [Cucurbita argyrosperma subsp. argyrosperma]1.3e-7472.6Show/hide
Query:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        MA+K+QARPLAP  H   SS++ +  LHLKRI+RRRFIK    I+ LL++ +V VI ILMFT+FQVKDPII+MN ISIT +ELING+IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPN+ASFKYSNTTTTLYI ET+IGEARGP GQAKA RT +MN+TI+I+ D+LL NLN  +SSGKL LRSFSR+PGRVKLLHI+RR+IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI N++IEDQ CKRKVK+
Subjt:  INIMNRTIEDQKCKRKVKL

XP_008458164.1 PREDICTED: uncharacterized protein LOC103497685 [Cucumis melo]2.5e-7570.32Show/hide
Query:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        M  K+QA+PL PA    LSS+N ET LHLKRI+R+RFIKCC  I ALL++   V +IILMFT+FQ+KDPII+MN +SIT +ELIN +IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPNMASFKYSNTTTTL+I ET+IGE RGP G+AKA +T RMN+TIDI+AD++LSNLN  VS GK+ LRSFSRIPG+VKLLH+I R++VVKMNCT +
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI +++IEDQKCKRK+K+
Subjt:  INIMNRTIEDQKCKRKVKL

XP_011656360.1 uncharacterized protein LOC105435724 [Cucumis sativus]2.3e-7671.23Show/hide
Query:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        M +K+QA+PL PA  + LSS+N ET LHLKRI+R+RFIKCC  IVALL++   V +IILMFT+FQ+KDPII+MN +SIT +ELIN +IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPNMASFKYSNTTTTL+I ET+IGE RGPSG+AKA +T RMN+TIDI+AD++LSNLN  VS GK+ LRSFSRIPG+VKLLH I R++VVKMNCT +
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI +++IEDQKCKRK+K+
Subjt:  INIMNRTIEDQKCKRKVKL

XP_038875202.1 uncharacterized protein LOC120067718 [Benincasa hispida]2.9e-7972.6Show/hide
Query:  MAEKEQARPLAPAAHH-LSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAV-TVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        M +K+QA+PLAPA HH  SS+N ET+LHLKRI+RRRFIKCCG IV  L++  +  +IILMFT+FQ+KDP+I+MN +SIT +ELING IPKPG+N+SLTAD
Subjt:  MAEKEQARPLAPAAHH-LSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAV-TVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNL--NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPNMASFKYSNTTTTL+I ET+IGEARGP G+AKA RT RMN+TIDI+AD++LSNL  +VS GK+ LRSFSRIPGRVKLLH+I R++VVKMNCT +
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNL--NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI NR+IEDQ+CKRKVK+
Subjt:  INIMNRTIEDQKCKRKVKL

TrEMBL top hitse value%identityAlignment
A0A0A0KD33 LEA_2 domain-containing protein1.1e-7671.23Show/hide
Query:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        M +K+QA+PL PA  + LSS+N ET LHLKRI+R+RFIKCC  IVALL++   V +IILMFT+FQ+KDPII+MN +SIT +ELIN +IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPNMASFKYSNTTTTL+I ET+IGE RGPSG+AKA +T RMN+TIDI+AD++LSNLN  VS GK+ LRSFSRIPG+VKLLH I R++VVKMNCT +
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI +++IEDQKCKRK+K+
Subjt:  INIMNRTIEDQKCKRKVKL

A0A1S3C8G8 uncharacterized protein LOC1034976851.2e-7570.32Show/hide
Query:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        M  K+QA+PL PA    LSS+N ET LHLKRI+R+RFIKCC  I ALL++   V +IILMFT+FQ+KDPII+MN +SIT +ELIN +IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAA-HHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQA-VTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPNMASFKYSNTTTTL+I ET+IGE RGP G+AKA +T RMN+TIDI+AD++LSNLN  VS GK+ LRSFSRIPG+VKLLH+I R++VVKMNCT +
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI +++IEDQKCKRK+K+
Subjt:  INIMNRTIEDQKCKRKVKL

A0A2P5A832 Immunoglobulin-like fold containing protein2.8e-7266.21Show/hide
Query:  MAEKEQARPLAPAAHHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTADVS
        MAEKEQARPLAPAA   SS++++ +  LK+IRRR+FIKCCG I AL+++QAV +IIL+FTVF+VKDP+IKMN I++T +EL N   PKPGTN+SLTADVS
Subjt:  MAEKEQARPLAPAAHHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTADVS

Query:  VKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN----VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VKNPN+ASFKY NTTTTLY    ++GEARGP GQAK  RT RMNIT+DII D+L+S+ N    V SG L++ S+SRIPGRVK+L+II+RH+VVKMNCT+ 
Subjt:  VKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN----VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        +NI ++TI++QKCKRKV L
Subjt:  INIMNRTIEDQKCKRKVKL

A0A6J1H4K3 uncharacterized protein LOC1114603395.1e-7472.15Show/hide
Query:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        MA+K+QARPLAPA     SS++ +  LHLKRI+RRRFIK    I+ LL++ +V VI IL+FT+FQVKDPII+MN ISIT +ELING+IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPN+ASFKYSNTTTTLYI ET+IGEARGP GQAKA RT RMN+TI+I+ D+LL NLN  +SSGKL LRSFSR+PGRVK+LHI+RR+IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI N++IEDQ CKRKVK+
Subjt:  INIMNRTIEDQKCKRKVKL

A0A6J1L0R6 uncharacterized protein LOC1114993181.3e-7272.6Show/hide
Query:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD
        MA+K+QARPLA A     SS++ +  LHLK+I+R RFIK    I+ LLV+ +V VI ILMFT+FQVKDPII+MN ISIT +ELING+IPKPG+NVSLTAD
Subjt:  MAEKEQARPLAPAAH-HLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVI-ILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTAD

Query:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI
        VSVKNPN+ASFKYSNTTTTLYI ET+IGEARGP GQAKA RT RMN+TI+I+ D+LL NLN  +SSGKL LRSFSR+PGRVKLLHIIRR+IVVKMNCT  
Subjt:  VSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLN--VSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLI

Query:  INIMNRTIEDQKCKRKVKL
        INI N++IEDQ CKRKVK+
Subjt:  INIMNRTIEDQKCKRKVKL

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G64450.1 Glycine-rich protein family6.5e-0525.62Show/hide
Query:  KRIRRRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTADVSVKNPNMASFKYSNTTTTLYIKETMIGEA
        +R   R  +  C      L++  V ++++ FTVF+ KDP I +N + + +  + N        N S +  V+V+NPN A F + +++  L      +G  
Subjt:  KRIRRRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTADVSVKNPNMASFKYSNTTTTLYIKETMIGEA

Query:  RGPSGQAKAHRTSRMNITIDI
          P+G+  + R   M  T  +
Subjt:  RGPSGQAKAHRTSRMNITIDI

AT2G46150.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family8.1e-4845.29Show/hide
Query:  MAEKEQARPLAPAAHHLSSNNEETSLHLKRIRR-RRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGI--IPKPGTNVSLTA
        MA+ E  RPLAPA   +   ++E++ ++K   R R  IKC   + A  ++    V+ L+FTVF+VKDPIIKMNG+ +  ++ + G   +   GTN+S+  
Subjt:  MAEKEQARPLAPAAHHLSSNNEETSLHLKRIRR-RRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGI--IPKPGTNVSLTA

Query:  DVSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLNVS-----SGKLSLRSFSRIPGRVKLLHIIRRHIVVKMN
        DVSVKNPN ASFKYSNTTT +Y K T++GEA G  G+A+ HRTSRMN+T+DI+ D++LS+  +      SG +++ S++R+ G+VK++ I+++H+ VKMN
Subjt:  DVSVKNPNMASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLNVS-----SGKLSLRSFSRIPGRVKLLHIIRRHIVVKMN

Query:  CTLIINIMNRTIEDQKCKRKVKL
        CT+ +NI  + I+D  CK+K+ L
Subjt:  CTLIINIMNRTIEDQKCKRKVKL

AT3G05975.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family5.5e-1226.06Show/hide
Query:  RRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTADVSVKNPNMASFKYSNTTTTLYIKETMIGEARGPS
        +RR       I+ +L V  +T +IL   VF+ K PI++    ++  +     +  +   N +LT ++ +KNPN+A F+Y      +Y ++T++G    PS
Subjt:  RRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTADVSVKNPNMASFKYSNTTTTLYIKETMIGEARGPS

Query:  GQAKAHRTSRMNITIDIIADQLLSNL-----NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLIINIMNRTIEDQKCKRKVKL
            A  +  +   + +  D+ ++NL     +V  GK+ + + +++PG++ LL I +  +    +C L++   +  +EDQ C  K KL
Subjt:  GQAKAHRTSRMNITIDIIADQLLSNL-----NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLIINIMNRTIEDQKCKRKVKL

AT3G54200.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family7.7e-2230.52Show/hide
Query:  PLAPAAHHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQ-AVTVIILMFTVFQVKDPIIKMNGISITNVEL-INGIIPKPGTNVSLTADVSVKNPNM
        P  P A  + + +  T    K++RR+R  K C     LL++  A+ ++IL FT+F+ K P   ++ +++  ++  +N ++ K   N++L  D+S+KNPN 
Subjt:  PLAPAAHHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQ-AVTVIILMFTVFQVKDPIIKMNGISITNVEL-INGIIPKPGTNVSLTADVSVKNPNM

Query:  ASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNL----NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLIINIMNR
          F Y +++  L  +  +IGEA  P+ +  A +T  +NIT+ ++AD+LLS      +V +G + L +F ++ G+V +L I +  +    +C L I++ +R
Subjt:  ASFKYSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNL----NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLIINIMNR

Query:  TIEDQKCKRKVKL
         +  Q CK   KL
Subjt:  TIEDQKCKRKVKL

AT4G23610.1 Late embryogenesis abundant (LEA) hydroxyproline-rich glycoprotein family2.4e-1529.86Show/hide
Query:  KEQARPLAPAAHHLSSN--NEETSLHLKRIR----RRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISIT-NVELINGIIPKPGTNVSLT
        ++QA+PLAP      S+  +EE   H  R +    + + I CCG I +L ++ AVT I+L  TVF +  P + ++ IS     + +NG +     N +++
Subjt:  KEQARPLAPAAHHLSSN--NEETSLHLKRIR----RRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISIT-NVELINGIIPKPGTNVSLT

Query:  ADVSVKNPNMASFKYSNTTTTLYIKE-TMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNL-----NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVK
         ++S+ NPN A F   N   + Y  E  ++GE+   S    A RT +MN+T +I+  +LL++L     +++   + L+S   + GRVK + I R+ + ++
Subjt:  ADVSVKNPNMASFKYSNTTTTLYIKE-TMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNL-----NVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVK

Query:  MNCTLIINIMN
         +C + +   N
Subjt:  MNCTLIINIMN


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCTGAAAAGGAGCAAGCGCGACCACTTGCCCCAGCCGCCCACCATCTAAGCAGCAACAACGAGGAGACATCATTACACCTAAAGAGAATTCGACGAAGAAGATTCAT
AAAATGTTGTGGTTCCATCGTTGCCCTTCTTGTAGTACAAGCTGTGACAGTCATTATCTTGATGTTCACTGTGTTTCAAGTCAAAGATCCGATAATCAAGATGAACGGAA
TTTCAATCACCAACGTCGAGCTGATCAATGGCATCATCCCGAAGCCAGGAACCAATGTGTCGCTGACAGCGGACGTGTCTGTGAAAAACCCTAACATGGCGTCGTTCAAG
TATAGTAACACGACGACAACTCTATATATTAAGGAAACTATGATAGGGGAGGCCAGAGGGCCGTCAGGGCAGGCCAAGGCACATCGGACATCGCGGATGAACATCACCAT
CGACATCATTGCCGACCAACTCTTGTCGAACCTCAACGTCAGCTCCGGGAAGCTGAGCTTGAGAAGCTTTTCGAGGATTCCGGGGAGGGTGAAGCTGCTGCATATTATAA
GGAGACATATTGTCGTCAAAATGAACTGTACGTTGATTATCAATATCATGAACAGAACGATTGAGGATCAGAAATGCAAGAGGAAGGTGAAGCTGTAG
mRNA sequenceShow/hide mRNA sequence
ATGGCTGAAAAGGAGCAAGCGCGACCACTTGCCCCAGCCGCCCACCATCTAAGCAGCAACAACGAGGAGACATCATTACACCTAAAGAGAATTCGACGAAGAAGATTCAT
AAAATGTTGTGGTTCCATCGTTGCCCTTCTTGTAGTACAAGCTGTGACAGTCATTATCTTGATGTTCACTGTGTTTCAAGTCAAAGATCCGATAATCAAGATGAACGGAA
TTTCAATCACCAACGTCGAGCTGATCAATGGCATCATCCCGAAGCCAGGAACCAATGTGTCGCTGACAGCGGACGTGTCTGTGAAAAACCCTAACATGGCGTCGTTCAAG
TATAGTAACACGACGACAACTCTATATATTAAGGAAACTATGATAGGGGAGGCCAGAGGGCCGTCAGGGCAGGCCAAGGCACATCGGACATCGCGGATGAACATCACCAT
CGACATCATTGCCGACCAACTCTTGTCGAACCTCAACGTCAGCTCCGGGAAGCTGAGCTTGAGAAGCTTTTCGAGGATTCCGGGGAGGGTGAAGCTGCTGCATATTATAA
GGAGACATATTGTCGTCAAAATGAACTGTACGTTGATTATCAATATCATGAACAGAACGATTGAGGATCAGAAATGCAAGAGGAAGGTGAAGCTGTAG
Protein sequenceShow/hide protein sequence
MAEKEQARPLAPAAHHLSSNNEETSLHLKRIRRRRFIKCCGSIVALLVVQAVTVIILMFTVFQVKDPIIKMNGISITNVELINGIIPKPGTNVSLTADVSVKNPNMASFK
YSNTTTTLYIKETMIGEARGPSGQAKAHRTSRMNITIDIIADQLLSNLNVSSGKLSLRSFSRIPGRVKLLHIIRRHIVVKMNCTLIINIMNRTIEDQKCKRKVKL