CuGenDBv2

Gene ID	Moc06g19050
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Gag/pol protein
Genome location	chr6:14831122..14840354
RNA-Seq Expression	Moc06g19050
Synteny	Moc06g19050
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0004190 - aspartic-type endopeptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022151688.1 uncharacterized protein LOC111019603 [Momordica charantia]

2.0e-132

98.79

Show/hide

Query:  VNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNW
        + A+VALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNW
Subjt:  VNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNW

Query:  WDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYA
        WDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYA
Subjt:  WDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYA

Query:  EAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ
        EAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ
Subjt:  EAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ

XP_022155925.1 uncharacterized protein LOC111022925 [Momordica charantia]

2.1e-76

60.41

Show/hide

Query:  PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEAL
        P V  +V LL  ALQ L+DN+  AG AQ  QP +    Q E QFIRDF+R+GPP FNG SE+ T  EEW+RELEALY YLGCSD  KV+GAVFML+GEA+
Subjt:  PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEAL

Query:  NWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTT
        NWW+ VA  EDH N P+TW   KDLLY+YYFP T+++EK  EFL LTQ +L+VAQYE+KFTE SRF +  IPTE  KI +F+ GL + IKG + L+ PTT
Subjt:  NWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTT

Query:  YAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK
        YA A++ ALVMDK  +E+ Q QQ +G SSGVKRK    SSSQPS+
Subjt:  YAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

1.0e-83

73.58

Show/hide

Query:  GAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKD
        G  QA  P+     QSEA+FI+DF+RYGPPTF+GESE+AT VEEWIRELEALY YLGC DQ KVKGAVFMLRGEALNWWD VA  ED+ N PI W   K+
Subjt:  GAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKD

Query:  LLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQK
        LLYDYY+P+T+KD KE EFLHL Q TL VAQYE+KFTE SRFAL+LIPTEA KIKRFV+GL KGI+GP+DLQRPTTYAEA++GALVMDKDV  KA P  +
Subjt:  LLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQK

Query:  VGLSSGVKRKVP
        VG SSGVKRK P
Subjt:  VGLSSGVKRKVP

XP_022156546.1 uncharacterized protein LOC111023424 [Momordica charantia]

1.1e-85

59.93

Show/hide

Query:  RVVPQIPPATPQEGV-DPPAPPIGPRRRIVPPGPSTAPQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKA
        R+   + PA   E V DPP PPIG +  +VPP P  A Q             ALI+N+   G AQ   PR     QSEAQFI+DF+RYGPPTF G SE+A
Subjt:  RVVPQIPPATPQEGV-DPPAPPIGPRRRIVPPGPSTAPQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKA

Query:  TVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEF
        T+ EEW+RELEALY YLGC DQ KVKGAVFMLR EALNWWD VA  EDH N P+ W   K+LLYD+Y+ +T++D KE+EFLHL Q TL VAQYE+KFTE 
Subjt:  TVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEF

Query:  SRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ
        S FAL+LIPTEA KIKRFV+GL KGI+G +DLQRP TYAEA++G L+MDKDV  + QP  +VG S GVKRKVPP  + QP + +PQ+
Subjt:  SRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ

XP_022157413.1 uncharacterized protein LOC111024114 [Momordica charantia]

5.2e-80

60.07

Show/hide

Query:  EGVDPPAPPIGPRRRIVPPGPSTA----PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRE
        EG   P  P+    R+ PP P  A    PQVN QVALL  ALQ L+DN+  AG AQ  QPR+A   Q E QFIRDF+R+GPP FNG SE+ T  EEW+RE
Subjt:  EGVDPPAPPIGPRRRIVPPGPSTA----PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRE

Query:  LEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIP
        LEALY YLGCSD  KV+GAVFMLRGEA+NWW+ VA  EDHTN P+TW   KDLLY+YYFP T+++EK  EFL LTQ +L VAQYE+KFTE SRF +  IP
Subjt:  LEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIP

Query:  TEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK
        TE  KI +F+ GL   IKG + ++ PTTYA AI+ ALVMDK  +E+ Q QQ +G SSGVKRK    SSSQ S+
Subjt:  TEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DCW8 uncharacterized protein LOC111019603

9.8e-133

98.79

Show/hide

Query:  VNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNW
        + A+VALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNW
Subjt:  VNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNW

Query:  WDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYA
        WDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYA
Subjt:  WDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYA

Query:  EAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ
        EAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ
Subjt:  EAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ

A0A6J1DQB9 Reverse transcriptase

9.9e-77

56.63

Show/hide

Query:  PPATPQEGVDPPAPPIGPRRRIVPPGPSTA----PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVV
        P    +   DP   P+ P   +VPP P  A    PQVN QVALL  ALQ L+ N+  AG AQ  QPR+A   Q E QFIRDF+ +GPP FNG SE+ T  
Subjt:  PPATPQEGVDPPAPPIGPRRRIVPPGPSTA----PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVV

Query:  EEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRF
        EEW+RELEALY YLGCSD  KV+GAVFMLRGEA+NWW+ VA  EDH N P+TW   KDLLY+YYFP   ++EK +EFL LTQ +L VAQYE+KFTE SRF
Subjt:  EEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRF

Query:  ALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK
            +PTE  KI +F+ GL + IKG + L+ PTTYA A++ ALVMDK  +E+ Q QQ +G +SGVKRK    S+SQ S+
Subjt:  ALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK

A0A6J1DTA8 uncharacterized protein LOC111024114

2.5e-80

60.07

Show/hide

Query:  EGVDPPAPPIGPRRRIVPPGPSTA----PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRE
        EG   P  P+    R+ PP P  A    PQVN QVALL  ALQ L+DN+  AG AQ  QPR+A   Q E QFIRDF+R+GPP FNG SE+ T  EEW+RE
Subjt:  EGVDPPAPPIGPRRRIVPPGPSTA----PQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRE

Query:  LEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIP
        LEALY YLGCSD  KV+GAVFMLRGEA+NWW+ VA  EDHTN P+TW   KDLLY+YYFP T+++EK  EFL LTQ +L VAQYE+KFTE SRF +  IP
Subjt:  LEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIP

Query:  TEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK
        TE  KI +F+ GL   IKG + ++ PTTYA AI+ ALVMDK  +E+ Q QQ +G SSGVKRK    SSSQ S+
Subjt:  TEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSK

A0A6J1DUM2 uncharacterized protein LOC111023247

4.9e-84

73.58

Show/hide

Query:  GAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKD
        G  QA  P+     QSEA+FI+DF+RYGPPTF+GESE+AT VEEWIRELEALY YLGC DQ KVKGAVFMLRGEALNWWD VA  ED+ N PI W   K+
Subjt:  GAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKD

Query:  LLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQK
        LLYDYY+P+T+KD KE EFLHL Q TL VAQYE+KFTE SRFAL+LIPTEA KIKRFV+GL KGI+GP+DLQRPTTYAEA++GALVMDKDV  KA P  +
Subjt:  LLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQK

Query:  VGLSSGVKRKVP
        VG SSGVKRK P
Subjt:  VGLSSGVKRKVP

A0A6J1DVA0 uncharacterized protein LOC111023424

5.3e-86

59.93

Show/hide

Query:  RVVPQIPPATPQEGV-DPPAPPIGPRRRIVPPGPSTAPQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKA
        R+   + PA   E V DPP PPIG +  +VPP P  A Q             ALI+N+   G AQ   PR     QSEAQFI+DF+RYGPPTF G SE+A
Subjt:  RVVPQIPPATPQEGV-DPPAPPIGPRRRIVPPGPSTAPQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQSEAQFIRDFRRYGPPTFNGESEKA

Query:  TVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEF
        T+ EEW+RELEALY YLGC DQ KVKGAVFMLR EALNWWD VA  EDH N P+ W   K+LLYD+Y+ +T++D KE+EFLHL Q TL VAQYE+KFTE 
Subjt:  TVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFLHLTQRTLMVAQYEKKFTEF

Query:  SRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ
        S FAL+LIPTEA KIKRFV+GL KGI+G +DLQRP TYAEA++G L+MDKDV  + QP  +VG S GVKRKVPP  + QP + +PQ+
Subjt:  SRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQQ

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCGGCACACCCGTGCCGTCCGACACTGTCCTTGAGATTCCCATTCTCGAAGGAAGACGCCCAAGGTCTTGGTCTTGCAACGCTCGCCCACGCCATGACACAC
GCATGTGCCGTGAGGCGTGTACGTGCAAAGTGGCGAGGAGTCACTCGCCAACGTAGAGCGCACGGTCATGGCCCGGGGACCCAACTGGCCCCCACTGAGCTTGTC
ACCGACACCACCGACATCGCCTTCGCCTTGCATTCTGCATATGCCTTCTCTAGGCATTCTTGCGTACATCCATGGGGTGTGATAGGTGATGCACCATCCTCCTTG
GTCGCATCACAGCACTTCTCTCTCGACCCTCAACATGGCCTGACGGGCGACATATGCATGTCGCCACCACTTGTCCACTATGTGGGCGTCACAACCTACTCTCTA
CTAGATTATTGGGGTGGACCTCTGAGGTCCGGAAATGTTGGGTCACACTTACGAGGAGTTGTTAACATGTCTACTTCCATTATTGCACTCTTAGCCGCGCAAAGA
CTTAATGGCGAAAATTACAAACAATGGAAGTCAAACCTAAACACTATTCTCGTGATAGATGATCTTAGGTTCGTCTTGCAAGAGGATTGTCCTCAAGCTCCTGCG
CCTAACGTTATTGTGGCGGTGCGCAACGCCTATGATAGGTGGATCAAGGCCAATGACAAGGCCAAGGTCTACATCTTGGCGAGCATATCTGATGTGCTTGCCAAT
AAGCACGAGGACACGGTCACCGCTAAGGAGATCATGGACTTGCTGCAGAGCATGTCTGGACAACCGTCCTCACAGGCTCGACATGAAGCCCTTAAATTCGTTTAC
AACTCCCGCATGAAGGAGGGTTCATCAGTGCGAGAACACGTTCTCAACCTGATGAGTTTCCTGCCATTCCGCAGCAATGCGGTTATGAATATGCTGGAGTACACT
CTTACCACGCTCCTTAACGAGCTGCAGACCTACCAGTCTGCGCCCTCTTCTTCTGGAAGTAAGACTTTTAAGAAGAAGAAGGCTGTTGCTAAGGGGTCTAAACCT
GACTCAGCTGCTGCTGCCCAGAAAAGCAAGGTCAAGGTTGCAGAGAAAGAAAGTGTTTCCACTGCAACATGGACGGGCATTGGAAGCGCAACTGCCCAAAGTACT
TGGCCGAAAAGAAGAAAGCCAACGAAGGGAATTAGTTCCTGGAGGCAGCTTGACGCCGAAGAGATGACTCTTAAGGTCGGAACGGGAGAGGTCGTCTCAGCTGTG
GCGGATTGCTCCCACCAGCACGATCCCGAGACCCAAGAGGATAGCGAGGAAGACATAGTGGTGGTGTTCGAGGGAAAGTCGTTGAAGAAACGGGTAGTCCCTCAA
ATTCCTCCAGCAACCCCTCAAGAAGGGGTAGACCCTCCAGCTCCCCCTATAGGTCCTCGGAGAAGGATAGTTCCTCCAGGCCCCTCGACAGCCCCTCAAGTGAAT
GCTCAGGTGGCTTTACTGGGAAGAGCACTACAAGCATTAATTGACAATTCGATTGCAGCAGGTGCTGCTCAAGCCCTGCAACCTCGTCAAGCTCTGGCTCTTCAG
AGTGAAGCTCAGTTCATCAGGGACTTTAGGCGTTATGGACCCCCTACTTTTAATGGAGAAAGTGAGAAAGCTACAGTAGTGGAGGAGTGGATCAGGGAGTTGGAA
GCTTTATACACTTATCTAGGTTGCAGCGACCAACTTAAAGTCAAAGGTGCAGTATTTATGTTGAGAGGCGAAGCTCTAAATTGGTGGGATGTAGTAGCAACTGTA
GAAGACCATACAAATGAACCCATCACTTGGACAACGTCCAAAGATCTGCTTTACGATTATTACTTTCCGAAGACGATAAAAGATGAAAAAGAGATAGAGTTCCTT
CACCTCACTCAACGAACTTTGATGGTGGCTCAGTATGAGAAGAAGTTTACAGAATTCTCTCGTTTTGCTCTGGATCTAATCCCCACTGAGGCGAGGAAGATTAAA
AGGTTTGTTAGAGGTCTATGGAAAGGGATTAAGGGACCAATTGATCTTCAGCGGCCAACCACTTATGCGGAAGCAATTAAGGGTGCCTTGGTTATGGATAAGGAC
GTCATCGAAAAAGCTCAACCACAGCAGAAAGTCGGCTTATCCTCAGGAGTAAAAAGGAAGGTTCCTCCGATATCCTCTAGCCAACCTTCAAAAACCAGCCCTCAG
CAATAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MPAHPCRPTLSLRFPFSKEDAQGLGLATLAHAMTHACAVRRVRAKWRGVTRQRRAHGHGPGTQLAPTELVTDTTDIAFALHSAYAFSRHSCVHPWGVIGDAPSSL
VASQHFSLDPQHGLTGDICMSPPLVHYVGVTTYSLLDYWGGPLRSGNVGSHLRGVVNMSTSIIALLAAQRLNGENYKQWKSNLNTILVIDDLRFVLQEDCPQAPA
PNVIVAVRNAYDRWIKANDKAKVYILASISDVLANKHEDTVTAKEIMDLLQSMSGQPSSQARHEALKFVYNSRMKEGSSVREHVLNLMSFLPFRSNAVMNMLEYT
LTTLLNELQTYQSAPSSSGSKTFKKKKAVAKGSKPDSAAAAQKSKVKVAEKESVSTATWTGIGSATAQSTWPKRRKPTKGISSWRQLDAEEMTLKVGTGEVVSAV
ADCSHQHDPETQEDSEEDIVVVFEGKSLKKRVVPQIPPATPQEGVDPPAPPIGPRRRIVPPGPSTAPQVNAQVALLGRALQALIDNSIAAGAAQALQPRQALALQ
SEAQFIRDFRRYGPPTFNGESEKATVVEEWIRELEALYTYLGCSDQLKVKGAVFMLRGEALNWWDVVATVEDHTNEPITWTTSKDLLYDYYFPKTIKDEKEIEFL
HLTQRTLMVAQYEKKFTEFSRFALDLIPTEARKIKRFVRGLWKGIKGPIDLQRPTTYAEAIKGALVMDKDVIEKAQPQQKVGLSSGVKRKVPPISSSQPSKTSPQ
Q

Moc06g19050 (gene) of Bitter gourd (OHB3-1) v2 genome