CuGenDBv2

Gene ID	MC06g0016
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	Rubredoxin-like domain-containing protein
Genome location	MC06:133933..140359
RNA-Seq Expression	MC06g0016
Synteny	MC06g0016
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component) GO:0005506 - iron ion binding (molecular function)
InterPro domains	IPR024934 - Rubredoxin-like domain IPR024935 - Rubredoxin domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004138023.1 uncharacterized protein LOC101207574 isoform X1 [Cucumis sativus]

2.30e-75

74.44

Show/hide

Query:  MASVSATSLRSFQLP---HSK---EDGGADRHSN-----SNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYN
        MAS+SA+SL SF LP   H K   EDGG DR+S      SNRL LKSSF SPLR     KIP L  Q S   AA+PKFS  MRVASKQAYICRDCGYIYN
Subjt:  MASVSATSLRSFQLP---HSK---EDGGADRHSN-----SNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYN

Query:  DRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        DRTPFDKLPDKYFCPVCGAPKRRFRPYEQ+V+KN NE DVRKARKAQIQ+DEA+G VLPIAAA+GIVALVGLYLYLNS +
Subjt:  DRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

XP_022134987.1 uncharacterized protein LOC111007102 [Momordica charantia]

6.35e-146

100

Show/hide

Query:  MSLVFWPKPQSLSPLPSLLFSSLIDSLLHFLFCLSSTLHPPMASVSATSLRSFQLPHSKEDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSG
        MSLVFWPKPQSLSPLPSLLFSSLIDSLLHFLFCLSSTLHPPMASVSATSLRSFQLPHSKEDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSG
Subjt:  MSLVFWPKPQSLSPLPSLLFSSLIDSLLHFLFCLSSTLHPPMASVSATSLRSFQLPHSKEDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSG

Query:  KIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALV
        KIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALV
Subjt:  KIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALV

Query:  GLYLYLNSVY
        GLYLYLNSVY
Subjt:  GLYLYLNSVY

XP_022927654.1 uncharacterized protein LOC111434474 [Cucurbita moschata]

2.27e-78

78.29

Show/hide

Query:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF
        MASVSATSLR FQLP   HSK   EDGGADRHS+   L LKSSFFSPLR      IP L  Q S  +AAAPK  +SMRVASKQAYICRDCGYIYNDRTPF
Subjt:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF

Query:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        +KLPDKYFCPVCGAPKRRFRPYEQSVTKN NE D RKARKAQIQ+DEA+G VLPIAAAVGIVALVGLYLYLN+ +
Subjt:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

XP_023531329.1 uncharacterized protein LOC111793604 [Cucurbita pepo subsp. pepo]

5.59e-79

78.86

Show/hide

Query:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF
        MASVSATSLR FQLP   HSK   EDGGADRHS+   L LKSSFFSPLR      IP L  Q S  +AAAPK  +SMRVASKQAYICRDCGYIYNDRTPF
Subjt:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF

Query:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        DKLPDKYFCPVCGAPKRRFRPYEQSVTKN NE D RKARKAQIQ+DEA+G VLPIAAAVGIVALVGLYLYLN+ +
Subjt:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

XP_038880712.1 uncharacterized protein LOC120072320 isoform X1 [Benincasa hispida]

4.21e-79

78.53

Show/hide

Query:  MASVSATSLRSFQLPH---SKEDGGADRHS-----NSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRT
        MASVSA+SL SF LP    SKEDGGADR+S      SNRL LKSSF SPLR     KIP   +Q S   AAAPKFS  MRVASKQAYICRDCGYIYNDRT
Subjt:  MASVSATSLRSFQLPH---SKEDGGADRHS-----NSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRT

Query:  PFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        PFDKLPDKYFCPVCGAPKRRFRPYEQSVTKN NE DVRKARKA+IQ+DEA+G VLPIAAAVGIVALVGLYLYLNSV+
Subjt:  PFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

TrEMBL top hits

e value

%identity

Alignment

A0A5A7UPF0 Rubredoxin family protein

1.11e-75

Show/hide

Query:  MASVSATSLRSFQLP---HSK---EDGGADRHSN-----SNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYN
        MASVSA+SL SF LP   H K   EDGG DR+S      SNRL LKSSF SPLR     KIP L  Q S   AA+PKFS  MRVASKQAYICRDCGYIYN
Subjt:  MASVSATSLRSFQLP---HSK---EDGGADRHSN-----SNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYN

Query:  DRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        DRTPFDKLPDKYFCPVCGAPKRRFRPYEQ+V KN NE D+RKARKAQIQ+DEA+G VLPIAAA+GIVALVGLYLYLNSV+
Subjt:  DRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

A0A6J1C1D8 uncharacterized protein LOC111007102

3.07e-146

100

Show/hide

Query:  MSLVFWPKPQSLSPLPSLLFSSLIDSLLHFLFCLSSTLHPPMASVSATSLRSFQLPHSKEDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSG
        MSLVFWPKPQSLSPLPSLLFSSLIDSLLHFLFCLSSTLHPPMASVSATSLRSFQLPHSKEDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSG
Subjt:  MSLVFWPKPQSLSPLPSLLFSSLIDSLLHFLFCLSSTLHPPMASVSATSLRSFQLPHSKEDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSG

Query:  KIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALV
        KIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALV
Subjt:  KIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALV

Query:  GLYLYLNSVY
        GLYLYLNSVY
Subjt:  GLYLYLNSVY

A0A6J1EIL7 uncharacterized protein LOC111434474

1.10e-78

78.29

Show/hide

Query:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF
        MASVSATSLR FQLP   HSK   EDGGADRHS+   L LKSSFFSPLR      IP L  Q S  +AAAPK  +SMRVASKQAYICRDCGYIYNDRTPF
Subjt:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF

Query:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        +KLPDKYFCPVCGAPKRRFRPYEQSVTKN NE D RKARKAQIQ+DEA+G VLPIAAAVGIVALVGLYLYLN+ +
Subjt:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

A0A6J1IG97 uncharacterized protein LOC111473110

1.10e-78

78.29

Show/hide

Query:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF
        MASVSATSLR FQLP   HSK   EDGGADRHS+   L LKSSFFSPLR      IP L  Q S  +AAAPK  +SMRVASKQAYICRDCGYIYNDRTPF
Subjt:  MASVSATSLRSFQLP---HSK---EDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPF

Query:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        +KLPDKYFCPVCGAPKRRFRPYEQSVTKN NE D RKARKAQIQ+DEA+G VLPIAAAVGIVALVGLYLYLN+ +
Subjt:  DKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

E5GBM0 Electron transporter

1.11e-75

Show/hide

Query:  MASVSATSLRSFQLP---HSK---EDGGADRHSN-----SNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYN
        MASVSA+SL SF LP   H K   EDGG DR+S      SNRL LKSSF SPLR     KIP L  Q S   AA+PKFS  MRVASKQAYICRDCGYIYN
Subjt:  MASVSATSLRSFQLP---HSK---EDGGADRHSN-----SNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYN

Query:  DRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY
        DRTPFDKLPDKYFCPVCGAPKRRFRPYEQ+V KN NE D+RKARKAQIQ+DEA+G VLPIAAA+GIVALVGLYLYLNSV+
Subjt:  DRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

SwissProt top hits

e value

%identity

Alignment

O26258 Probable rubredoxin

1.3e-05

37.7

Show/hide

Query:  SISMRVASKQAYICRDCGYIYNDR-----------TPFDKLPDKYFCPVCGAPKRRFRPYE
        +I   V++ + Y CR CGYIY+             TPF+ LP+ + CP CGA K+ F+P +
Subjt:  SISMRVASKQAYICRDCGYIYNDR-----------TPFDKLPDKYFCPVCGAPKRRFRPYE

P04170 Rubredoxin-1

3.3e-06

51.16

Show/hide

Query:  QAYICRDCGYIY----NDRTPFDKLPDKYFCPVCGAPKRRFRP
        Q Y+C  CGY Y    +D  PFD+LPD + CPVCG  K +F P
Subjt:  QAYICRDCGYIY----NDRTPFDKLPDKYFCPVCGAPKRRFRP

P24297 Rubredoxin

6.2e-05

Show/hide

Query:  YICRDCGYIYND-----------RTPFDKLPDKYFCPVCGAPKRRFRPYE
        ++C+ CGYIY++            T F++LPD + CP+CGAPK  F   E
Subjt:  YICRDCGYIYND-----------RTPFDKLPDKYFCPVCGAPKRRFRPYE

P58992 Rubredoxin-1

1.4e-04

Show/hide

Query:  AYICRDCGYIYNDR-----------TPFDKLPDKYFCPVCGAPKRRFRPY
        +++C +CGYIY+              PFDKLPD + CPVC  PK +F  +
Subjt:  AYICRDCGYIYNDR-----------TPFDKLPDKYFCPVCGAPKRRFRPY

Q9AL94 Rubredoxin

6.9e-04

39.22

Show/hide

Query:  YICRDCGYIY-----------NDRTPFDKLPDKYFCPVCGAPKRRFRPYEQ
        Y+C  CGYIY           N  T F+ +PD + CP+CG  K +F P E+
Subjt:  YICRDCGYIY-----------NDRTPFDKLPDKYFCPVCGAPKRRFRPYEQ

Arabidopsis top hits

e value

%identity

Alignment

AT5G17170.1 rubredoxin family protein

9.5e-09

32.71

Show/hide

Query:  QKSGKIAAAPKFSISMRVASK--QAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAV
        +K  K  A P+F   +    K    +IC DCG+IY     FD+ PD Y CP C APK+RF  Y+ +  K +                   G + PI   V
Subjt:  QKSGKIAAAPKFSISMRVASK--QAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAV

Query:  GIVALVG
        G++A +G
Subjt:  GIVALVG

AT5G51010.1 Rubredoxin-like superfamily protein

7.7e-43

72.17

Show/hide

Query:  LGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAA
        LG++KS   ++AP+F  SMRV+SKQAYICRDCGYIYNDRTPFDKLPD YFCPVC APKRRFR Y   V+KNVN+ DVRKARKA++QRDEAVG  LPI  A
Subjt:  LGSQKSGKIAAAPKFSISMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAA

Query:  VGIVALVGLYLYLNS
        VG++AL  LY Y+NS
Subjt:  VGIVALVGLYLYLNS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCTCTCGTTTTCTGGCCGAAGCCCCAATCTCTATCTCCCCTTCCTTCTCTTCTCTTCTCTTCTCTGATTGATTCTCTTCTTCACTTTCTTTTCTGTCTTAGCTCCAC
CCTCCACCCACCAATGGCTTCTGTTTCAGCTACTTCTCTCAGGAGCTTCCAGCTGCCACATTCTAAGGAAGACGGCGGCGCTGATCGGCACTCCAACTCCAACCGCTTGT
ATCTGAAATCGTCCTTCTTCTCTCCTTTACGCACTCCCTCCAACTCCAAGATTCCTCCTTTAGGGAGCCAAAAATCTGGTAAAATTGCAGCTGCACCCAAGTTCTCCATC
TCCATGCGCGTCGCCTCCAAGCAAGCCTATATCTGTCGTGATTGCGGGTACATTTACAATGATCGAACTCCTTTTGACAAATTGCCTGATAAGTATTTCTGTCCTGTCTG
TGGTGCTCCTAAGCGACGATTTAGACCTTATGAGCAATCCGTGACAAAAAATGTTAACGAACTCGATGTGAGGAAGGCGAGGAAGGCGCAGATTCAGAGAGATGAAGCTG
TTGGGAATGTGCTGCCTATTGCTGCTGCAGTTGGAATCGTGGCACTTGTAGGTTTATACTTGTACCTGAATAGCGTGTATTAG

mRNA sequence

Show/hide mRNA sequence

AAAAGGGTGAATGAGGAGTGAGTATTTTGGTTCGAGGGTGTTGGGTGTGTAGATAGGATCCGATAAAATTGATTGATTGTCCGCCACTCGTAGTCTGTATTCACTATTCG
CCCATGTCTCTCGTTTTCTGGCCGAAGCCCCAATCTCTATCTCCCCTTCCTTCTCTTCTCTTCTCTTCTCTGATTGATTCTCTTCTTCACTTTCTTTTCTGTCTTAGCTC
CACCCTCCACCCACCAATGGCTTCTGTTTCAGCTACTTCTCTCAGGAGCTTCCAGCTGCCACATTCTAAGGAAGACGGCGGCGCTGATCGGCACTCCAACTCCAACCGCT
TGTATCTGAAATCGTCCTTCTTCTCTCCTTTACGCACTCCCTCCAACTCCAAGATTCCTCCTTTAGGGAGCCAAAAATCTGGTAAAATTGCAGCTGCACCCAAGTTCTCC
ATCTCCATGCGCGTCGCCTCCAAGCAAGCCTATATCTGTCGTGATTGCGGGTACATTTACAATGATCGAACTCCTTTTGACAAATTGCCTGATAAGTATTTCTGTCCTGT
CTGTGGTGCTCCTAAGCGACGATTTAGACCTTATGAGCAATCCGTGACAAAAAATGTTAACGAACTCGATGTGAGGAAGGCGAGGAAGGCGCAGATTCAGAGAGATGAAG
CTGTTGGGAATGTGCTGCCTATTGCTGCTGCAGTTGGAATCGTGGCACTTGTAGGTTTATACTTGTACCTGAATAGCGTGTATTAGATCCAGTGGCCAGTGGGTGGCTCA
GTGCTTCTCACTATTATGTTATATTGATTTACATTCTATATGTATTTTTTCCACCCCCCAATTCAAAAACCTGGCATATTGCTATAACGTTGAGGCATGCAAGATTATTT
TTATATTAAATTGTTTCTTGAGACTTGAACATGTTAATTTGTGTTGAATGGGGTTTGATTCGGTAGTTAATTTGATGAATGAGGTGCACCACCAGGAAATGTGCTTCTAA
GGATGGTTAGTGAAGTGAGATTAGGATCTTGTGTGATTTGGAACTGAAAATTGGTGGTTGTTTTTTATTGTGATTTGTACAATAAATCTGAAACATGGATCAGGATCACG
TAACTCGAGGTGGAGGCGTGTTATCCAGAAATGACTTGAACAGTATAAGTGACCTTTGGGGTTGAGAGAATGGAGCTTCGTGAGAGGCACCTCGAATGGTGGCAAATGAA
AGGATATTACCATTACCATAAACTTGGCTCCAACCTCCAACCTGAGAAGTGAGACACAGGCCCAGGGGGAAATGCTTAATTCACAATCTCCAACCAAATCAGGACTCGGG
ACTCGGGACAAATACGGCTTACCTGCTTTCCATGGAACCAAGCTCCGTATGGAACACTCGTGTTCAGACCCAGCTCTGTTGCCAACCTGTGAACCAGCCGCCGACTTCCC
ATCAATGGAATTACCGAATCTTGATCTCCACTGAAACCAAAGAATTAGGTCCCTTTAATTTTAATGTATATGTACGGTTTGGTAACGCTCGTCAAATTGTAACCCTAACC
CACCTGTAAATCAAGACTCGTATGCCGGTTCTGACAAGTGACCCAACAATGGAGATGGTTGGTATTTCCAGGTTGAGTAGCTCATAGTCCAGAGCTCTGGTGTAATGTCA
TTGACAAGCAGTAATAGTCAATAGTCAATAGTCAGACTCAGAATTCAGAAATGAAAATCAAAGCAGAGTGGAATTACTCGCTGCAAACAGCCCACTTGTGGACTCCGACG
AGACGGGCATGAAGGGCCTTTTTCACATCCTCTCGGTTCAGATATTTAACAGTTTCATCTTCGATGCAAACATCTATCCTTTCTCGGACATGCTGCGGCTGTGGGCTTAA
GTACTTGGACTGTGAGAGCACTGAAGGAATGCAGACATCGAGAGTAACGTCATATTTGTCCACGAACTTACTGGTTTCTGTGTTGACTTGGGTCATCACCCGCAGACAAA
CCCCTGAGATTGAGTCTCTGTAGTACTCGCTAACATACCGGGAATAGTTACAAGCACATGTGAACAATCTGTAAGTGGAGTCTGATATCAGACCATGCGACCAAAAGAAC
TCCGCCCTTGAATTCAAGTCTGTCGCATATTCCATAACCGGATTCCCTAGCTGCACATCAAACACTTTCATTTTTCCCTTTCTTTTCTCTTCCACGCCACATAAAAACAA
AACTTACAGCAATTCCCTGCAGATTGAATAACTTTTCCTTCCTGTTCAACTCGGTCATAAGCCTCGCCAGCTGAGGAATGTAATGGCCTGGTATAATAAGGAAAAAGATT
TGGTTTTTCTCTTTTCTTTGGGGGGTTCCCATTGCAAGAGAGAGAGGGAGAAGGAGGAGAGAGAGAGAAAAAAGGGAGAAATGTCTTTTATCTGGGTACCTGCGTAACTC
TCTCCTGTTAGAAATAGATCTCTATGTTTGTAATGAGGGAATTTACTGAACCACCTTTGCAAGAATATGAGATTGTCTCTTGCTGAAGATAGCAACATGAAAAAACGTAG
GTTTGAAGCATGAATAAAAGACACAAGCATACAGCATGATTTGTGTTCTTTTTTAGCATTGACAAAAATACTGACTAAAACATAAGTAAATTTCTCAGTAATTTCTTTGC
CAAATCAATAATCATCTTCTGAAGAGAGAGAGAGAGAAGGGGTTGCGCTACCCTTGAACAGAAGGCAGAAGGGATGCAAAAATACCTGTGGCCTCGTCATCCATTGTCGC
ATGAGAGGCGCTATTATCAGCATAAGAGAACCCAACTCCTGCGGGTGTCTCTAAGTACAACATGTTTGCTTCTGAAATGATCAAATTTGAACTTGCTTTTACTGATCAGC
AGCTATATAATATCCAGCAAATATGGAGAAACTGGTGTAGTTGATATAGAAGTAGATACCTCGGTTCCAACTGTATTCATTTTTCACCAAAACCTCCCCGTTCGGCCTAA
AAGGTCCATTTTCTGAGAACGCCCCAACTCCAAGGGAAGAACAACCAGGGCCTGCAAGAAATCAGAAAAATGTCCTCCCTAACCAGTCAAGCAAGTTTGAAGGACTTGGA
ATTAAAGAAGGTAAGAAGGTAAGGAGTCAACACACCTCCATTAAGCCAGAGAACCAAAGGCTTGGAATCAGGGTCAGTTTCTGCTTCAACCAAGTAGTAAAACAGTGCTC
TCTGCTTTTGGTCATCTACATGAATGTAACCTGAAAACTGGTGAAACCCCACACGCGGCTGTCCAGGAAGGCTAGTGATCTTGTCAGAATGTGCAAAAGAGGAGCCAACC
TCCTTGCAAATGCAAAGATGAAGAATAAGAGCAGCCATTGTCGCGGCCTTCCATGTTGAAGAAAACATGGTTTAGACGGTGAGAGACAACTAAGACAAAAGGACCTAGAG
AAAGTGCTGTTTAAAATGCTGCTCGGTGGATGGGGGGTCGGCGTGGGGTACTAAATAAGCAGGCGATCTAATATTTAAACCGCCATCATACTTGAGCCTTATTACTTGGC
AGGCCTGATACAGAATAAAACTAATCAATTTTGCGATTTCTGTTCATATCCAATAGCATTATTTGGTAGGACACATCCAAAACATAAAAGATTGGTTTTTCGAAAATGAA
GAAACAAATGGAATATAAGGCTGCTTTATCAGAATTCAGAGCCCTGAAAGTGCTGTTATGATGTTTCCCTATCTTCTGTTCTCTAACAACAACAAAAAAGTGTCTCTCGT
GAGGCGTACATTGTAAAGTGGCTTTACACAAACTACTTTCCACTCTCAGAAATCAGTTGTACAGTTATTTGTAACACAAATTTCTATTAGATTTCAAGTATGGTATGATT
ATCTGACAGACTCTTGGGGGATTTTGAAGAATCTTGACAGGATTTTCAGGGGTTCTTTTTAGTTTTTCGAGGAGACAATTGGGTTTTCTTGTTCGACTTGTACTTCGCCT
ATAACTGCACTGCTCTACAGCCAAATAATAGGTTGTATCCCGACTTTCAAATGCTCCTTCAGGTTCAAATAAGATAATCTGGAAGGGAAGTGAGGGTGCGGGAAAGAATG
CCTTAATCTAATTATTGGTTATCATCAAGATCCACATGCTTGAACCAACCCCCCAATTTATGATAATGGTAATGGGGCCTCTCCCTCACTTCATATTTCATAATTCATAT
CATGCCTACTGGTAGCTTTAGTGTAGTAGGTGAGCTACCAAGAAGCAGCGGATCCAAACGAAACCATTTTCTCATTTGTTGTATAGCTATAGATGGAGACTTTACAGTGT
GTAGTGTAGTGTAGTGTAGGCCTTTGGACCACTCTGGAAAAGGTGCCAGTGGGGTTCCTCTGATTTGCTTAAATTGTGGCGCTCTACAAATAACACCAACCACCAAAATA
CAAAGCGACACACAGGTACCAATATCATTTTCCATACCATGCGCTTAACCCCCGGCCCCAACACACTCAATAATGCATTTTTTTATCATTTGAGTTTTAGAAATTGGATT
TTCATATCTACAACTACAATCACTTTGTTTCCGCCTTGCCTTCTCTCTTTCCGAGGCAAAAAGGTAGAGAGCTTTATCTTAAAAGAGACTCTATGCTTTGAAAAGCTTTG
GTTAGTAGGGCAGTAGCGTCAACTCCGGTCTCCACCACACCCCCACAATCCATGAAATTGACTGGTCGAGCCGCCCCTCGTCTCGAGAGGCACAAAATTAAACAATACAA
CACGACAAACTTCACATTGAGTTCTCTTCAAGTTCTAACAAAGCTGAAATGAATTACTTGCATCTCTTAGAACAGGTCCAATTTGGTTTTTGACTTCCTCAAGTAGAATG
TTGGTTTGGTTGAAAAAATCGTTTTTTGAGGAAACTACTCAACCGTGGGGTTAAGATTGGGGTTAACAACGAGGTCCTCGATCAAATCTGCAGCTTCTTGAACGGTGGTT
ATGTTCTGAGCGTTATCCTCCTCGATATTGATGTCAAATTCTTCCTCTAAGGCCATAATTATCTCCACCTGTCAGTTGATTGGTGTGAGCATAGAAAAGGGTAAGGCCGT
GGCCGTAAAGGTGGAGATGGATTACATACAAGGTCGAGGGAGTCGGCACCCAGAGCTAAGAACTTGGATTCAGGGGTGAGCTCTGATTCGGCAGGCAAGGCCAATTGTTT
CCTCACAACTGAACACACTTTATCAACTGTCTCTGGTTTTGCCTGCATTAATTCCACTTTTTAATACTTGCTTTGCCAATGGACACCACAATGTCAAACTAATTATTAAA
TAATTACCGCACAAGAGATACGGAGCTGGGATGTTCTCAGAACATGCAAACCATTCTTTCTCCATCCAAATTTCACACTTGAAATTCTTCTCACAACCTGCCACCATATA
CAAATGCATTCCACAACATTTTAACTTTGGCAAAAATCATATTTTAATTATAGGCTGGTTCAGAGAATACCTGGTTGATGTTGATCTTGGTGGGCGGGATTAGAGGTAGC
TGGAATCTCAGGCAAGAAGCTGAAAAGGAAGCCATTGTAATTATAAGAAGAAAGAGAGTTTAGTTATATGGAAAAGGCGAAACTGTATAAGGTGAAGGAGTTGGAAGGAG
AGGGAATGGATTGGATATGTAGCTGAGGTGAGTGAGAACTGAGGGATGAACGAGTGGTGCCCATTGCCTCTCCTTCATCAATTTCATCGATTCCTATCTACTTCTCACTT
CTCACTGGCCGAATTTTGACACACCCATCTCGTGGGCCCATTTTTTAAATATCGCTCTTCTTTTTTCTTTTAACAAAGTTCAACTAAAAATAGAATGCAA

Protein sequence

Show/hide protein sequence

MSLVFWPKPQSLSPLPSLLFSSLIDSLLHFLFCLSSTLHPPMASVSATSLRSFQLPHSKEDGGADRHSNSNRLYLKSSFFSPLRTPSNSKIPPLGSQKSGKIAAAPKFSI
SMRVASKQAYICRDCGYIYNDRTPFDKLPDKYFCPVCGAPKRRFRPYEQSVTKNVNELDVRKARKAQIQRDEAVGNVLPIAAAVGIVALVGLYLYLNSVY

MC06g0016 (gene) of Bitter gourd (Dali-11) v1 genome