; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Moc08g17780 (gene) of Bitter gourd (OHB3-1) v2 genome

Gene IDMoc08g17780
OrganismMomordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
DescriptionUnknown protein
Genome locationchr8:13463496..13464761
RNA-Seq ExpressionMoc08g17780
SyntenyMoc08g17780
Gene Ontology termsNA
InterPro domainsIPR005162 - Retrotransposon gag domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022151719.1 uncharacterized protein LOC111019634 [Momordica charantia]1.3e-13680.92Show/hide
Query:  IRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNL
        +RTQM +ME  Y+EM+ AAGARSRSENRV R D  EQRG HLGP ++  PE  E E YT QRGDLREHLNRKR SSLRKGQSPS SHR+SNQQAESS N 
Subjt:  IRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNL

Query:  V---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQ
        +   G+ITREEFDQL+ + DAQVEALKAKCE+K+ S +DGDLGESPFTSD+LEA IP KFK PT+KPYDG+KDPKDYVEVFEGLMDFQAA+DAIKCR FQ
Subjt:  V---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQ

Query:  IALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEV
        IALTGSARLWYRRLPARSISTYSQLR+EF+ QFSSRHYD+KTATHL TIRQKEGETLREYVTRFQE QLKVAHCSD SAMCYFLT LADE LTVKL EE 
Subjt:  IALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEV

Query:  PATFVEVLQKAKKVIDGQELLRTKT
        PATFVEVLQKAKK+IDGQELLRTKT
Subjt:  PATFVEVLQKAKKVIDGQELLRTKT

XP_022152033.1 uncharacterized protein LOC111019842 [Momordica charantia]1.6e-12191.37Show/hide
Query:  KRGSSLRKGQSPSRSHRSSNQQAESSRN---LVGIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGT
        +RGSSLRKGQSPSRSHRSSNQQAESS N     G+ITREEFDQLRG+LDAQVEALKAKCEQK+ SLNDGDLGESPFTSDVLEAPIP KFKAPTVKPYDG+
Subjt:  KRGSSLRKGQSPSRSHRSSNQQAESSRN---LVGIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGT

Query:  KDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKV
        +DPKDYVEVFEGLMDFQAASD IKCRAFQIALT SARLWYRRLPARSISTYSQLRREFLAQFSSRHYDK+TATHLATIRQKEGETLREYVTRFQE QLKV
Subjt:  KDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKV

Query:  AHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG
         HCSDDSAMCYFLTGLADEA TVKLGEE PATF EVLQKAKKVIDGQELLRTKTG
Subjt:  AHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG

XP_022155128.1 uncharacterized protein LOC111022267 [Momordica charantia]3.3e-11982.18Show/hide
Query:  DNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDV
        + E E YT QRGDLREHLNRKR SSLRKGQSPS SHR+SNQQAESS N +    +ITREEFDQL+ + DAQVEALKA CE+K+ S +DGDLGE PFT D+
Subjt:  DNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDV

Query:  LEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQ
        LEAPI PKFK PT+KPYDG+K+PKDYV+VFEGLM+FQAA+DAIKCRAFQIA TGSARLWYRRLPARSISTYSQLR+EF++QFSSR+YD+KTATHLATIRQ
Subjt:  LEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQ

Query:  KEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG
        K+GETLREYVTRFQE QLKVAHCSDDSAMCYFLTGLAD+ LTVKLGEE PATF EVLQKAKKVIDGQELLRTKTG
Subjt:  KEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG

XP_022156088.1 uncharacterized protein LOC111023060 [Momordica charantia]4.0e-11770.43Show/hide
Query:  MEAIRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESS
        MEA+RTQMR+ME  YN+M+  AGARSRS ++V   D  EQ   H  P +EE              GDLR+HLNRKR SS R  ++ +  H++SNQQAESS
Subjt:  MEAIRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESS

Query:  RNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCR
         N +   G+ITREEF+QL+ + DAQVEALK +CE+K+ + +DGDLGESPFTSD+LEA IPPKFK PT+K YDG+KDPKDYVEVFEGLMDFQAA+DAIKCR
Subjt:  RNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCR

Query:  AFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLG
        AFQIALTGSARLWYRRLPARSISTYSQLR+EF++QF SRHYD+KT THLATIRQKEG+TL+EY+TRFQE QLKV HCSDDS+MCYFLTGLADE  TVKLG
Subjt:  AFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLG

Query:  EEVPATFVEVLQKAKKVIDGQELLRTKT
        EE  ATF EVLQ  KK IDGQELLRTKT
Subjt:  EEVPATFVEVLQKAKKVIDGQELLRTKT

XP_022159327.1 uncharacterized protein LOC111025738 [Momordica charantia]5.5e-15170.52Show/hide
Query:  MVQPANSTNTTDRRTLAASDAHQREVGAAAVEGQGHDGLATEPLRRSAQITAPTLPPAHPRTSKATRGRGGTSKKDARGPAPAPASENFDALQREMEAIR
        MVQP +STNT DRR L A+D HQREVGA  VEGQ H+GL TEP  RSA+IT P L PAHP+  KA RGRGG S++   G APAP+ ENFDALQ+EMEA+R
Subjt:  MVQPANSTNTTDRRTLAASDAHQREVGAAAVEGQGHDGLATEPLRRSAQITAPTLPPAHPRTSKATRGRGGTSKKDARGPAPAPASENFDALQREMEAIR

Query:  TQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV-
        TQM +ME  YNEM+ A GA SRSE+R  R                             +RGDLR+HL+RKR SSLRKG+SPS SH++SNQQAESS N V 
Subjt:  TQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV-

Query:  --GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIA
          G+ITREEFDQL+ + DAQVE LKA+CE K  + +DGDLGESPFTSD+LEA IP KFK PT+KPYDG+KDPKDYVEVFEGLM FQAA+DAIK RAFQIA
Subjt:  --GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIA

Query:  LTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPA
        LT SARLWYRRLPARSISTYSQLR+EF +QFSSRHY++KTATHLATIRQKE ETLREYVT FQE QLKVAH SDDSA+CYFLT L DE LTVKLGEE PA
Subjt:  LTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPA

Query:  TFVEVLQKAKKVIDGQELLRTKTG
        TF EVLQKAKKVIDGQEL RTKTG
Subjt:  TFVEVLQKAKKVIDGQELLRTKTG

TrEMBL top hitse value%identityAlignment
A0A6J1DDS5 uncharacterized protein LOC1110198427.6e-12291.37Show/hide
Query:  KRGSSLRKGQSPSRSHRSSNQQAESSRN---LVGIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGT
        +RGSSLRKGQSPSRSHRSSNQQAESS N     G+ITREEFDQLRG+LDAQVEALKAKCEQK+ SLNDGDLGESPFTSDVLEAPIP KFKAPTVKPYDG+
Subjt:  KRGSSLRKGQSPSRSHRSSNQQAESSRN---LVGIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGT

Query:  KDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKV
        +DPKDYVEVFEGLMDFQAASD IKCRAFQIALT SARLWYRRLPARSISTYSQLRREFLAQFSSRHYDK+TATHLATIRQKEGETLREYVTRFQE QLKV
Subjt:  KDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKV

Query:  AHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG
         HCSDDSAMCYFLTGLADEA TVKLGEE PATF EVLQKAKKVIDGQELLRTKTG
Subjt:  AHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG

A0A6J1DDW5 uncharacterized protein LOC1110196346.4e-13780.92Show/hide
Query:  IRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNL
        +RTQM +ME  Y+EM+ AAGARSRSENRV R D  EQRG HLGP ++  PE  E E YT QRGDLREHLNRKR SSLRKGQSPS SHR+SNQQAESS N 
Subjt:  IRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNL

Query:  V---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQ
        +   G+ITREEFDQL+ + DAQVEALKAKCE+K+ S +DGDLGESPFTSD+LEA IP KFK PT+KPYDG+KDPKDYVEVFEGLMDFQAA+DAIKCR FQ
Subjt:  V---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQ

Query:  IALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEV
        IALTGSARLWYRRLPARSISTYSQLR+EF+ QFSSRHYD+KTATHL TIRQKEGETLREYVTRFQE QLKVAHCSD SAMCYFLT LADE LTVKL EE 
Subjt:  IALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEV

Query:  PATFVEVLQKAKKVIDGQELLRTKT
        PATFVEVLQKAKK+IDGQELLRTKT
Subjt:  PATFVEVLQKAKKVIDGQELLRTKT

A0A6J1DM55 uncharacterized protein LOC1110222671.6e-11982.18Show/hide
Query:  DNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDV
        + E E YT QRGDLREHLNRKR SSLRKGQSPS SHR+SNQQAESS N +    +ITREEFDQL+ + DAQVEALKA CE+K+ S +DGDLGE PFT D+
Subjt:  DNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDV

Query:  LEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQ
        LEAPI PKFK PT+KPYDG+K+PKDYV+VFEGLM+FQAA+DAIKCRAFQIA TGSARLWYRRLPARSISTYSQLR+EF++QFSSR+YD+KTATHLATIRQ
Subjt:  LEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQ

Query:  KEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG
        K+GETLREYVTRFQE QLKVAHCSDDSAMCYFLTGLAD+ LTVKLGEE PATF EVLQKAKKVIDGQELLRTKTG
Subjt:  KEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG

A0A6J1DPN4 uncharacterized protein LOC1110230601.9e-11770.43Show/hide
Query:  MEAIRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESS
        MEA+RTQMR+ME  YN+M+  AGARSRS ++V   D  EQ   H  P +EE              GDLR+HLNRKR SS R  ++ +  H++SNQQAESS
Subjt:  MEAIRTQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESS

Query:  RNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCR
         N +   G+ITREEF+QL+ + DAQVEALK +CE+K+ + +DGDLGESPFTSD+LEA IPPKFK PT+K YDG+KDPKDYVEVFEGLMDFQAA+DAIKCR
Subjt:  RNLV---GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCR

Query:  AFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLG
        AFQIALTGSARLWYRRLPARSISTYSQLR+EF++QF SRHYD+KT THLATIRQKEG+TL+EY+TRFQE QLKV HCSDDS+MCYFLTGLADE  TVKLG
Subjt:  AFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLG

Query:  EEVPATFVEVLQKAKKVIDGQELLRTKT
        EE  ATF EVLQ  KK IDGQELLRTKT
Subjt:  EEVPATFVEVLQKAKKVIDGQELLRTKT

A0A6J1DZJ1 uncharacterized protein LOC1110257382.7e-15170.52Show/hide
Query:  MVQPANSTNTTDRRTLAASDAHQREVGAAAVEGQGHDGLATEPLRRSAQITAPTLPPAHPRTSKATRGRGGTSKKDARGPAPAPASENFDALQREMEAIR
        MVQP +STNT DRR L A+D HQREVGA  VEGQ H+GL TEP  RSA+IT P L PAHP+  KA RGRGG S++   G APAP+ ENFDALQ+EMEA+R
Subjt:  MVQPANSTNTTDRRTLAASDAHQREVGAAAVEGQGHDGLATEPLRRSAQITAPTLPPAHPRTSKATRGRGGTSKKDARGPAPAPASENFDALQREMEAIR

Query:  TQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV-
        TQM +ME  YNEM+ A GA SRSE+R  R                             +RGDLR+HL+RKR SSLRKG+SPS SH++SNQQAESS N V 
Subjt:  TQMRSMEVTYNEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLV-

Query:  --GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIA
          G+ITREEFDQL+ + DAQVE LKA+CE K  + +DGDLGESPFTSD+LEA IP KFK PT+KPYDG+KDPKDYVEVFEGLM FQAA+DAIK RAFQIA
Subjt:  --GIITREEFDQLRGELDAQVEALKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIA

Query:  LTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPA
        LT SARLWYRRLPARSISTYSQLR+EF +QFSSRHY++KTATHLATIRQKE ETLREYVT FQE QLKVAH SDDSA+CYFLT L DE LTVKLGEE PA
Subjt:  LTGSARLWYRRLPARSISTYSQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPA

Query:  TFVEVLQKAKKVIDGQELLRTKTG
        TF EVLQKAKKVIDGQEL RTKTG
Subjt:  TFVEVLQKAKKVIDGQELLRTKTG

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGTTCAACCAGCGAACTCGACCAATACGACAGATCGAAGGACTCTGGCTGCCAGCGATGCCCACCAGAGAGAGGTCGGAGCAGCAGCAGTAGAGGGGCAAGGTCACGA
CGGCCTAGCAACGGAACCCCTCCGCAGGTCGGCACAGATCACCGCGCCTACCCTACCGCCTGCACACCCGAGGACGTCCAAGGCCACCCGTGGTCGAGGTGGGACCTCTA
AGAAGGACGCCCGGGGTCCAGCCCCGGCTCCAGCAAGCGAGAACTTTGATGCGCTCCAGAGAGAGATGGAGGCAATACGCACACAAATGCGCTCCATGGAGGTAACGTAT
AACGAAATGATGCTAGCTGCAGGCGCAAGGTCCCGATCTGAAAATCGAGTGACGCGCGTGGACGCACGCGAGCAAAGGGGTTCCCACCTCGGCCCAGCCGAGGAGGAACG
TCCCGAGGACAACGAGAGCGAGGGGTACACTCGCCAGAGGGGAGACCTCCGTGAGCATCTCAACAGAAAGAGAGGCTCGTCTCTCCGAAAAGGGCAGTCACCATCCCGCT
CACACAGGAGCTCCAACCAGCAGGCTGAATCCTCCCGCAATCTCGTAGGGATAATCACAAGGGAGGAGTTCGACCAGCTGAGGGGCGAGCTCGATGCTCAGGTGGAGGCC
TTAAAGGCCAAATGTGAGCAGAAAGACGATTCACTGAACGATGGCGACTTGGGAGAATCGCCCTTCACCTCGGACGTTTTGGAAGCACCAATCCCTCCGAAGTTCAAAGC
TCCTACCGTGAAGCCTTACGACGGGACGAAGGACCCCAAGGACTATGTTGAGGTCTTTGAAGGCCTCATGGACTTCCAAGCGGCATCAGACGCAATCAAATGCCGCGCCT
TTCAGATCGCACTTACTGGCAGCGCGCGATTGTGGTATCGGAGACTGCCGGCCAGGTCGATCTCGACTTACTCTCAGCTGAGAAGGGAGTTCCTTGCCCAGTTCTCTTCT
CGGCACTATGACAAAAAGACAGCGACCCATCTCGCCACCATCAGGCAGAAGGAGGGTGAGACACTGCGGGAATATGTCACCAGATTCCAGGAGTTGCAGTTGAAGGTCGC
ACACTGCTCCGATGACTCGGCCATGTGCTATTTCCTCACCGGTCTAGCCGACGAAGCCCTCACGGTGAAACTTGGGGAGGAGGTCCCGGCCACCTTCGTCGAGGTGCTTC
AGAAGGCGAAGAAAGTCATCGATGGACAGGAGCTCCTCCGAACCAAAACTGGCTGA
mRNA sequenceShow/hide mRNA sequence
ATGGTTCAACCAGCGAACTCGACCAATACGACAGATCGAAGGACTCTGGCTGCCAGCGATGCCCACCAGAGAGAGGTCGGAGCAGCAGCAGTAGAGGGGCAAGGTCACGA
CGGCCTAGCAACGGAACCCCTCCGCAGGTCGGCACAGATCACCGCGCCTACCCTACCGCCTGCACACCCGAGGACGTCCAAGGCCACCCGTGGTCGAGGTGGGACCTCTA
AGAAGGACGCCCGGGGTCCAGCCCCGGCTCCAGCAAGCGAGAACTTTGATGCGCTCCAGAGAGAGATGGAGGCAATACGCACACAAATGCGCTCCATGGAGGTAACGTAT
AACGAAATGATGCTAGCTGCAGGCGCAAGGTCCCGATCTGAAAATCGAGTGACGCGCGTGGACGCACGCGAGCAAAGGGGTTCCCACCTCGGCCCAGCCGAGGAGGAACG
TCCCGAGGACAACGAGAGCGAGGGGTACACTCGCCAGAGGGGAGACCTCCGTGAGCATCTCAACAGAAAGAGAGGCTCGTCTCTCCGAAAAGGGCAGTCACCATCCCGCT
CACACAGGAGCTCCAACCAGCAGGCTGAATCCTCCCGCAATCTCGTAGGGATAATCACAAGGGAGGAGTTCGACCAGCTGAGGGGCGAGCTCGATGCTCAGGTGGAGGCC
TTAAAGGCCAAATGTGAGCAGAAAGACGATTCACTGAACGATGGCGACTTGGGAGAATCGCCCTTCACCTCGGACGTTTTGGAAGCACCAATCCCTCCGAAGTTCAAAGC
TCCTACCGTGAAGCCTTACGACGGGACGAAGGACCCCAAGGACTATGTTGAGGTCTTTGAAGGCCTCATGGACTTCCAAGCGGCATCAGACGCAATCAAATGCCGCGCCT
TTCAGATCGCACTTACTGGCAGCGCGCGATTGTGGTATCGGAGACTGCCGGCCAGGTCGATCTCGACTTACTCTCAGCTGAGAAGGGAGTTCCTTGCCCAGTTCTCTTCT
CGGCACTATGACAAAAAGACAGCGACCCATCTCGCCACCATCAGGCAGAAGGAGGGTGAGACACTGCGGGAATATGTCACCAGATTCCAGGAGTTGCAGTTGAAGGTCGC
ACACTGCTCCGATGACTCGGCCATGTGCTATTTCCTCACCGGTCTAGCCGACGAAGCCCTCACGGTGAAACTTGGGGAGGAGGTCCCGGCCACCTTCGTCGAGGTGCTTC
AGAAGGCGAAGAAAGTCATCGATGGACAGGAGCTCCTCCGAACCAAAACTGGCTGA
Protein sequenceShow/hide protein sequence
MVQPANSTNTTDRRTLAASDAHQREVGAAAVEGQGHDGLATEPLRRSAQITAPTLPPAHPRTSKATRGRGGTSKKDARGPAPAPASENFDALQREMEAIRTQMRSMEVTY
NEMMLAAGARSRSENRVTRVDAREQRGSHLGPAEEERPEDNESEGYTRQRGDLREHLNRKRGSSLRKGQSPSRSHRSSNQQAESSRNLVGIITREEFDQLRGELDAQVEA
LKAKCEQKDDSLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGTKDPKDYVEVFEGLMDFQAASDAIKCRAFQIALTGSARLWYRRLPARSISTYSQLRREFLAQFSS
RHYDKKTATHLATIRQKEGETLREYVTRFQELQLKVAHCSDDSAMCYFLTGLADEALTVKLGEEVPATFVEVLQKAKKVIDGQELLRTKTG