CuGenDBv2

Gene ID	MC04g1121
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic
Genome location	MC04:19266679..19273292
RNA-Seq Expression	MC04g1121
Synteny	MC04g1121
Gene Ontology terms	GO:0010190 - cytochrome b6f complex assembly (biological process) GO:0009507 - chloroplast (cellular component) GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR021919 - Cofactor assembly of complex C subunit B, CCB1

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7016624.1 Protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic [Cucurbita argyrosperma subsp. argyrosperma]

1.86e-144

84.56

Show/hide

Query:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        A K LPSHL+PLPSP     SFS GDL P  C   PRT  RPQRSV VRVN EPL+A Q DH NSAF LA++VGYS ASYYTSLGLFVISVPGLWSLIKR
Subjt:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFV+EGESKKAP+Q AGEILSFFTRNNFQVTDRGETITFEG MVPSRGQAALLTFCTCISLASV LVLTITFPD GNNWFW+SSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASR+EEIKVKMIV E G L EIIVQGDDQQVE MRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

XP_022141475.1 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic [Momordica charantia]

4.77e-179

100

Show/hide

Query:  MALAATKLLPSHLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        MALAATKLLPSHLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
Subjt:  MALAATKLLPSHLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

XP_022938901.1 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic [Cucurbita moschata]

1.13e-145

84.94

Show/hide

Query:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        A K LPSHL+PLPSP     SFS GDL P  C   PRT  RPQRSV VRVN EPL+A Q DHHNSAF LA++VGYS ASYYTSLGLFVISVPGLWSLIKR
Subjt:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFV+EGESKKAP+Q AGEILSFFTRNNFQVTDRGETITFEG MVPSRGQAALLTFCTCISLASV LVLTITFPD GNNWFW+SSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASR+EEIKVKMIV E G L EIIVQGDDQQVE MRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

XP_022992736.1 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic [Cucurbita maxima]

7.57e-144

83.78

Show/hide

Query:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        A K LPSHL+PL SP     SFS GDL P  C  GPRT  RPQRS+ VRVN EPL+A Q D HNS F LA++VGYS ASYYTSLGLFVISVPGLWSLIKR
Subjt:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFV+EGESKKAP+Q AGEILSFFTRNNF+VTDRGETITFEG MVPSRGQAALLTFCTCISLASV LVLTITFPD GNNWFW+SSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASR+EEIKVKMIVAE G L EIIVQGDDQQVE MRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

XP_023550037.1 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic [Cucurbita pepo subsp. pepo]

3.37e-147

85.33

Show/hide

Query:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        A K+LPSHL+PLPSP     SFS GDL P  C  GPRT  RPQRSV VRVN EPL+A Q DHHNSAF LA++VGYS ASYYTSLGLFVISVPGLWSLIKR
Subjt:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFV+EGESKKAP+Q AGEILSFFTRNNFQVTDRGETITFEG MVPSRGQAALLTFCTCISLASV LVLTITFPD GNNWFW+SSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASR+EEIKVKMIV E G L EIIVQGDDQQVE MRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

TrEMBL top hits

e value

%identity

Alignment

A0A1S3CPE0 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic

4.11e-140

83.59

Show/hide

Query:  ATKLLPS-HLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKRSVK
        A KLLPS H +PLPS  SFS  DL P  C   PRT  +P RSVTV+VNAEPL+ALQ +H+NSAF LA++VGYSMASYYTSLGLFVISVPGLWSLIKRSVK
Subjt:  ATKLLPS-HLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKRSVK

Query:  SKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYW
        SKVVKKTFV+E ESKK P+QIAGEILSFFTRNNFQVT RGETITFEGAMVPSRGQAALLTFCTCISLASV LVLTITFPDFGNNWFW+SSLSPLAGAYYW
Subjt:  SKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYW

Query:  VKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        VKASR+EEIKVKMIV E G+L EIIVQGDDQQ++ MRKEL+LSEKGMVYVKGIFEQ
Subjt:  VKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

A0A5A7VG78 Protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1

2.89e-140

83.59

Show/hide

Query:  ATKLLPS-HLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKRSVK
        A KLLPS H +PLPS  SFS  DL P  C   PRT  +P RSVTV+VNAEPL+ALQ +H+NSAF LA++VGYSMASYYTSLGLFVISVPGLWSLIKRSVK
Subjt:  ATKLLPS-HLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKRSVK

Query:  SKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYW
        SKVVKKTFV+E ESKK P+QIAGEILSFFTRNNFQVT RGETITFEGAMVPSRGQAALLTFCTCISLASV LVLTITFPDFGNNWFW+SSLSPLAGAYYW
Subjt:  SKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYW

Query:  VKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        VKASR+EEIKVKMIV E G+L EIIVQGDDQQ++ MRKEL+LSEKGMVYVKGIFEQ
Subjt:  VKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

A0A6J1CI70 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic

2.31e-179

100

Show/hide

Query:  MALAATKLLPSHLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        MALAATKLLPSHLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
Subjt:  MALAATKLLPSHLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

A0A6J1FEF5 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic

5.45e-146

84.94

Show/hide

Query:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        A K LPSHL+PLPSP     SFS GDL P  C   PRT  RPQRSV VRVN EPL+A Q DHHNSAF LA++VGYS ASYYTSLGLFVISVPGLWSLIKR
Subjt:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFV+EGESKKAP+Q AGEILSFFTRNNFQVTDRGETITFEG MVPSRGQAALLTFCTCISLASV LVLTITFPD GNNWFW+SSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASR+EEIKVKMIV E G L EIIVQGDDQQVE MRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

A0A6J1JUD8 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic

3.66e-144

83.78

Show/hide

Query:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR
        A K LPSHL+PL SP     SFS GDL P  C  GPRT  RPQRS+ VRVN EPL+A Q D HNS F LA++VGYS ASYYTSLGLFVISVPGLWSLIKR
Subjt:  ATKLLPSHLHPLPSPK----SFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKR

Query:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA
        SVKSKVVKKTFV+EGESKKAP+Q AGEILSFFTRNNF+VTDRGETITFEG MVPSRGQAALLTFCTCISLASV LVLTITFPD GNNWFW+SSLSPLAGA
Subjt:  SVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGA

Query:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        YYWVKASR+EEIKVKMIVAE G L EIIVQGDDQQVE MRKELQLSEKGMVYVKGIFEQ
Subjt:  YYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

SwissProt top hits

e value

%identity

Alignment

Q9LSE4 Protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB1, chloroplastic

1.6e-79

78.17

Show/hide

Query:  NSAFFLAD-TVGYSMASYYTSLGLFVISVPGLWSLIKRSVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALL
        NS   + + T GYS+ASYYTSLGLFVISVPGLWSLIKRSVKSK+V+KTFV   + KK P Q+AGEILSFFTR NF +TDRGETITFEG MVPSRGQAALL
Subjt:  NSAFFLAD-TVGYSMASYYTSLGLFVISVPGLWSLIKRSVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALL

Query:  TFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        TFCTCISLASV LVLTIT PDFGNNWF+I  LSPLAG YYW KASR+EEIKVKM+V   G+L EI+VQGDD QVE MRKELQL+EKGMVYVKG+FE+
Subjt:  TFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

Arabidopsis top hits

e value

%identity

Alignment

AT3G26710.1 cofactor assembly of complex C

1.1e-80

78.17

Show/hide

Query:  NSAFFLAD-TVGYSMASYYTSLGLFVISVPGLWSLIKRSVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALL
        NS   + + T GYS+ASYYTSLGLFVISVPGLWSLIKRSVKSK+V+KTFV   + KK P Q+AGEILSFFTR NF +TDRGETITFEG MVPSRGQAALL
Subjt:  NSAFFLAD-TVGYSMASYYTSLGLFVISVPGLWSLIKRSVKSKVVKKTFVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALL

Query:  TFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ
        TFCTCISLASV LVLTIT PDFGNNWF+I  LSPLAG YYW KASR+EEIKVKM+V   G+L EI+VQGDD QVE MRKELQL+EKGMVYVKG+FE+
Subjt:  TFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYWVKASRREEIKVKMIVAEGGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTTTGGCAGCAACCAAGCTACTACCATCTCACCTCCATCCTCTTCCTTCCCCTAAATCCTTCTCCACCGGAGACCTACCTCCGCCGTCATGCCTCCCCGGACCTCG
CACTCTCGTCAGGCCGCAGAGATCGGTAACGGTGAGAGTCAATGCGGAGCCGCTCCTCGCTCTCCAATTGGACCACCACAACTCCGCCTTCTTCCTCGCTGACACCGTCG
GCTACTCCATGGCTAGCTACTACACTTCTCTCGGCCTCTTCGTCATCTCCGTCCCTGGCTTGTGGTCACTCATCAAGCGATCCGTCAAATCCAAGGTTGTGAAGAAGACA
TTCGTCGCCGAAGGAGAATCGAAGAAGGCGCCGAGCCAGATCGCCGGAGAGATCTTGTCATTCTTCACTCGCAACAACTTCCAAGTCACGGACAGAGGCGAAACCATAAC
ATTTGAAGGAGCGATGGTGCCGAGTCGAGGCCAAGCGGCATTGCTGACATTCTGTACTTGCATTAGCCTGGCCAGCGTCGCCCTCGTCCTCACCATAACTTTTCCAGATT
TCGGCAACAACTGGTTCTGGATTAGCAGCCTCAGTCCCCTAGCAGGAGCATATTACTGGGTGAAAGCATCAAGAAGGGAGGAGATAAAGGTCAAAATGATAGTTGCAGAA
GGTGGAAAGCTTGCAGAGATTATTGTTCAAGGAGATGACCAACAAGTAGAGCTTATGAGAAAGGAGCTTCAGTTGAGTGAAAAAGGCATGGTCTATGTCAAAGGCATTTT
TGAGCAATAA

mRNA sequence

Show/hide mRNA sequence

CTGACTTTCAACCATCATAATATGATTTAATGATCAATAAGGGTTCATGTAAATAGCAAATGACTTAGAGGATCAAACCATGATGGCCGCGCCTAACTATTTTTTACTCG
ATACTAATTTTGACCCTAATACCAACCCTTTACCCAACCCTAAATTTTTTTTCCAAAACAAAAAAAAAAAAGAGAGAGAGAGAGAGAAAGGGAGGGAGGGAGAGAGAGAG
ACCGTGTGAGTGAGTTTGGAGTTGGCTCGAGTGAAGCGAGCCTACCTTTGTGTGGGAAGGTAACGGCAACCACAAGATGAGGTAGCCGCGTCAGCCACCTCTCACTTCAC
AAACCAAACCTTTTTATCCTTTTCTTTTCTTCTGTCTTCTGCCTGTGGCTGTGGATGTGGCTGTCCCTCTTCTTCAGAAAAACTTACTCTCCATTTCTCTGCCGGACGGA
CACCTATGGCTTTGGCAGCAACCAAGCTACTACCATCTCACCTCCATCCTCTTCCTTCCCCTAAATCCTTCTCCACCGGAGACCTACCTCCGCCGTCATGCCTCCCCGGA
CCTCGCACTCTCGTCAGGCCGCAGAGATCGGTAACGGTGAGAGTCAATGCGGAGCCGCTCCTCGCTCTCCAATTGGACCACCACAACTCCGCCTTCTTCCTCGCTGACAC
CGTCGGCTACTCCATGGCTAGCTACTACACTTCTCTCGGCCTCTTCGTCATCTCCGTCCCTGGCTTGTGGTCACTCATCAAGCGATCCGTCAAATCCAAGGTTGTGAAGA
AGACATTCGTCGCCGAAGGAGAATCGAAGAAGGCGCCGAGCCAGATCGCCGGAGAGATCTTGTCATTCTTCACTCGCAACAACTTCCAAGTCACGGACAGAGGCGAAACC
ATAACATTTGAAGGAGCGATGGTGCCGAGTCGAGGCCAAGCGGCATTGCTGACATTCTGTACTTGCATTAGCCTGGCCAGCGTCGCCCTCGTCCTCACCATAACTTTTCC
AGATTTCGGCAACAACTGGTTCTGGATTAGCAGCCTCAGTCCCCTAGCAGGAGCATATTACTGGGTGAAAGCATCAAGAAGGGAGGAGATAAAGGTCAAAATGATAGTTG
CAGAAGGTGGAAAGCTTGCAGAGATTATTGTTCAAGGAGATGACCAACAAGTAGAGCTTATGAGAAAGGAGCTTCAGTTGAGTGAAAAAGGCATGGTCTATGTCAAAGGC
ATTTTTGAGCAATAATCATTCCTTGTTACCACTTCTCTACCTTTTTCTAGCAGTTCAAACTCAATTAGTAATCACTCCAACATTCCTCTGGAAAGAAAGCAAACAATTTT
GGAACTTGTACAACAATTTCCAAACACATGAATCATACAGATACGACATCAAAATTGAATGTTAATGTTCCCAGTTTCTCAACAGTATGGGTATCTCATCATCTAATCTA
TACCTTTCACTCATTCAGTCAAATTATTCAGATTCATTCATGCACCAAGCAATGACAGTTACAGTGTTCTCATTGCATAAAGATTTCAAAGGAATTTGAGGAGAAAAGAA
ACAAAACAGGTCTGCAAACAGATTCTTTGCCATTTATCTGCTTTTAAATAAAAATTGGGGGTCGCTCGGACCTCTGTATTACCTCGAAAAGAAGAGCTTGGTTTCTTAAC
CGATCAAAAGCTTGTTGTCCTCCAAAAAGGTGTAGGTGGGTACCTCCAAATTGTAGGGTGCTGGCCCTTTGCGGATCCTACCAGAAACATCGTAATGAGAACCATGGCAG
GGGCAAAACCACCCACCATAGTCTCCAGCATTTGGCAAGGGGATGCAACCGAGATGTGTGCAGACGCCAATCACGATAAGCCATTCTGGATTCTTAACTCTTTCTTCATC
CTGCTGTGGGTCACGAAGAGATCCAATGTCCACGCTATTTGCTAAGTTAATATCGTCCTCAGTTCGTCGCCTGATGAAAACTGGCTTTCCACGCCACTTGACAGTCACGG
TGGAACCAGGCTCGATGCTTGAGAGGTCAACCTCGAGCGAGGCCAGGGCAAGAACATCCTTACTGGCTGACATGCTAAGAACAAACTTGAGAACAAGGAGACGAATCAAG
GAAGCATAGACAAACCGACCACCTGACAAGACAAAATAAGCAAATGCACGCTTGCTAGGATCACCCGGAGGAAATCGCTCGTGATTGTAGTCGTCATAGACTATCTTTGA
AGAAGGGTTCTTAACAGCTGCTACAGTTGCAGGAATATCCATAATTAAGCTGTCCTCCTTCGTTGAGGTGAATGCATCAGAAGCAAAACCTAACAGAGAGTCATTTCCAT
AAAATCATGAAACCACGCCATGGTGGAAAGAAATAATCATGCATAAGGTGTTTAATCACAAATCAAAATTGAAAAGCAATCACCTAATCAATCATCTGGACAGAATGCAC
AAGATTTTGTAGTTTTTTAATTTAAAAAATGGTGCTTTTTTCTCACAATTTCTGTACTATATTTTTTACCTTCCTTAAAGAAACCTTTGAAATCTTCAGCCAAATTACTT
TTTTTTTTATATAAGAAACAATAATATTTCATTCAAAAAGAAGAGGAGCCCAAAAAAGGCAGAAAAACAGCCTAGAGGCAGAGGGTCGAGGTGGAAGTACAAAAACAAAA
TTAAAGCTTTTTAAAACTACTCTTTTTAGTTTTCACTTAAATTTTGAAAACATTTTTGAAAAGTATAAAACAAAACAAAGAAAGTGCTAGGTGGAATTAATATTTATAAG
ATTAATTTTCAAAAGCTAAAAGCTAAAACCAAGTGGTTATCAATCGGTAATTGATAAAGAACGATATAATTGCAATTTTTTGTTTAATAAGCATCAGATACAAAACCATT
TCCAGTGTGTTAATAGATTTCTTGCCACTATTTCTAACATTGTCAACTTTCATACAGAGATAGGAAGTAAAACTCCATAATTAGTAATGTACAAGTACATAGAGGAGAAT
TTACTATAACATTTGATTGTAAAACTAGTTGTGAATAAAGGAGGATCTGCAAAACCATCCATAACCAAAAAGGTCAGCCATAATGGCCAGTCAATTTTGCAAGATTGTAT
ACAAAACAACTGATAAGCAGTTCCACATTGGCATAAGCATCTTAAAAAATTTTGATCTGAATTAGTTGTTGTATTACTTAAACAAGTGGTTTCAATGTATATTACAGGGG
CTTAAAAGGTCAGCTCACAAGATAATAAAAGCATCATGAAATTGATCTTTCTCAATTTATGTTGCCTGATTTTTGGAGCAAATTTAAGGATTGTCTACGTTAGTTTAAGT
AAATTCATCTTCAGGGCCCAAGGAATAGGATTAAAGTTTTCCAATCTTTTAAAGTAGAAATGTCTTTACTTGGATTCTCCTCTTTGTCAAAGTTAATACAGTGGATATTC
TTCAAAAGAAAAACCCTTCTATGGTGTTTTTTCCTTCCATTTGCTCTCTGTCTGGAAAGTCTTGTGAGTTCCAGCAACATATGTTCTTTCGGTGCTCTTTTTCGACTACT
TGCTGGAGGCTTTTCTTCGAGATCTTTGAGGTTTCTTGAGTTTTTGATTTCGAAGTCGCAAAGAACGTTCATTCTCTGTTGATTGGCCTGTGTCTCGCGTCAAAGGCGGG
TCTTCTTTGGTGTAATGGAGTCAAAGCTGTGTTGTCTGATATTTGGTTCGAGAGAAATCAGAGGCTTTTCAAGAGGAAACGTCGAGATCCTCCTAGCAAAGTTTAAGGCT
TCCCAATGGTGTGCTCTTTCCAATGTTTTTGTTAATTACTCTCTGAGTATGATTTGTTCTAATTGGGAGGTTTTTATAACTCCCCCTTAGCTTTTGTTCTTTTTGCTTAG
TTTGTTGTTCTGTTTTCCGTTTTGTTTATTTTCTCACTACTTCGGAGGTTTGTATCATTGAACAATTTTCTGTTCCTTTTCATTAAATCAATGAAAAGTTTGTTTCTTGT
TCAAAAAAAAAGTAGAAACTTTGAAGTTATTTCATAAAGGATTATTTTTTCCTTTTGCATAAGAAATGGCATGATGCAGTTTTTCTAGGGGCACGGTTTGATTTTTTCTT
ATTCTAAATCTAATACTTCATTGTTTCATTCAAGTAAGAGGATCAATTATCCTCATACCTTCTTATACTTAATCTCAAACTAATTCATTAAAAATATTCTGATATAAAAA
TATAAAATACTGCAAGCTAAATCTTGTTTGCTCCCTTGGAAGGGATTCCTCCCACCTCCTGCCCCCTAGGCTGTTCTTTTTTGTGAATACAAAATCTCTTATTTCTTATA
ATAATAATAAAAAGAAAGAAAAATACAAGGGCTTAAACATAGTAGATAACAATTATACTCGCACTTTTATTAAGATGAAATGATGAAATGAAAGAAAAAACAAATGCCAT
ACAAAAAAACAAGCTTGACAAAAGAAGACCTGCCTATAGAAAGGATCTTCAATCCAAAAGAACAACTCTTAACTGATAATTACAAAAAATCTTTGATGCCGACACCACTT
GAAGGAATTAAATGTAATAATATCCCAAACTTTCTCCCAAGGCCTCTCAACCCCCTCTAGAATCTGCTATTCCTCTCAAGCAAAACATCCCACAACAGACATTCTCTATC
CCGAAAAGGAGGAAAAAGCTATAATCTGCCAGAACTATACTCTTTCAACAACAATAAACTATACCTCAACGCCCAACAAATAATCTGTTGATGGGGATTCCATATTGATA
TTGGTGAGTTTTTAAAAGAAACAATACATAACTTTCTAAGCACAGGAACTATGGGAAACGCTAAACTGAATAATTTTAATCTCCTTTAGAAAGGATGAGATATAACCTCA
CTCACGCCAAAACTTCTGTACTAGAAGAATCAGCAACAAAGTAGATGAATAATATCGTATAGTTTTCAGTGATTATAACATAAACGACAAAAAATAAAGCTAAAGTCTGA
AAATAAAACAGTGGAAGATTAAGAAATGAACGAAGAAGAAACAATTGCTTCGGTAAAGTGACATCGTTAAAACGCCCCGACGTAACAGTAATAACTATCACATTTTGAAA
TTATTTTCAAAACGAGAAACTAATATGCAAAAGCTGATCCAAAATAGACGATTCAATGAAGTTATACATCAATCACCATAAACAAGCCAGTCTTCGAATTTGAATCTGGT
AAGATTAGATTCAACATTTTGTTTAATAAAAATCCATATTTATTTATTTACTTCAACAATAGATTTCACGAAAACGCGTCACATATCGACAAAAACAAACCCTAAAAGAC
ACCATAAATCAACTGGGGGCAAGAACGACAAAAGCTCAGGACAAAAAAAAAAGTGACTCTAACCTCTGCAATTACGATCAAAGTGAAGACCGAAAGGGAAGGTGTTGAAG
GAGGCGACGGATCTGAAATCATTGGAAGG

Protein sequence

Show/hide protein sequence

MALAATKLLPSHLHPLPSPKSFSTGDLPPPSCLPGPRTLVRPQRSVTVRVNAEPLLALQLDHHNSAFFLADTVGYSMASYYTSLGLFVISVPGLWSLIKRSVKSKVVKKT
FVAEGESKKAPSQIAGEILSFFTRNNFQVTDRGETITFEGAMVPSRGQAALLTFCTCISLASVALVLTITFPDFGNNWFWISSLSPLAGAYYWVKASRREEIKVKMIVAE
GGKLAEIIVQGDDQQVELMRKELQLSEKGMVYVKGIFEQ

MC04g1121 (gene) of Bitter gourd (Dali-11) v1 genome