CuGenDBv2

Gene ID	MC03g1222
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	Usp domain-containing protein
Genome location	MC03:18276151..18281741
RNA-Seq Expression	MC03g1222
Synteny	MC03g1222
Gene Ontology terms	NA
InterPro domains	IPR006016 - UspA IPR014729 - Rossmann-like alpha/beta/alpha sandwich fold

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022137469.1 uncharacterized protein LOC111008906 [Momordica charantia]

2.69e-140

100

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
        MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA

Query:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKKS
        SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKKS
Subjt:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKKS

Query:  RRRTL
        RRRTL
Subjt:  RRRTL

XP_022923726.1 uncharacterized protein LOC111431346 [Cucurbita moschata]

2.75e-107

79.15

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG--DKDGRKIAAMLREI
        MD+RKI V+VEDVEAARTALKW LNNLMRYGDLI LLHVFP+TRSKS +K RHLRL GYQLALSFKDLCT FPNTKVEI+VTEG  D++GRKIAA++REI
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG--DKDGRKIAAMLREI

Query:  GASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM------DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSA
        GAS LVVGLHD SFLYKMA+ +DDIARNF CKVLAIK +T   EE  K+KNV+VIAA        SSTNMDFSQIEIAKLQAPEI PQKIPYRICP+PSA
Subjt:  GASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM------DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSA

Query:  IIWRSKKSRRR
        IIWRSKKSR R
Subjt:  IIWRSKKSRRR

XP_023000727.1 uncharacterized protein LOC111495088 [Cucurbita maxima]

1.87e-107

79.52

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG-----DKDGRKIAAML
        MD+RKI V+VEDVEAARTALKW LNNLMRYGDLI LLHVF +TRSKS +K RHLRL GYQLALSFKDLCT FPNTKVEI+VTEG     D++GRKIAA++
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG-----DKDGRKIAAML

Query:  REIGASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMD--SSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAI
        REIGAS LVVGLHD SFLYKMA+ +DDIARNF CKVLAIK +T   EES K+KNV+VIAA D  SSTNMDFSQIEIAKLQAPEI PQKIPYRICP+PSAI
Subjt:  REIGASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMD--SSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAI

Query:  IWRSKKSRRR
        IWRSK+SR R
Subjt:  IWRSKKSRRR

XP_023519721.1 uncharacterized protein LOC111783074 [Cucurbita pepo subsp. pepo]

3.64e-107

79.43

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG---DKDGRKIAAMLRE
        MD+RKI V+VEDVEAARTALKW LNNLMRYGDLI LLHVFP+TRSKS +K RHLRL GYQLALSFKDLCT FPNTKVEI+VTEG   D++GRKIA ++RE
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG---DKDGRKIAAMLRE

Query:  IGASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM---DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAII
        IGAS LVVGLHD SFLYKMA+ +DDIARNF CKVLAIK +T   EE  K+KNV+VIAA     SSTNMDFSQIEIAKLQAPEI PQKIPYRICP+PSAII
Subjt:  IGASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM---DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAII

Query:  WRSKKSRRR
        WRSKKSR R
Subjt:  WRSKKSRRR

XP_038893894.1 uncharacterized protein LOC120082691 isoform X2 [Benincasa hispida]

1.49e-117

84.31

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
        MD+RKIAV+VEDVE ARTALKW LNNLMRYGDLI LLHVFPSTRSKS +K RH RLKGYQLAL+FKDLC  FPNTKVEI+VTEGD++GRKIAA+++EIG 
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA

Query:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAA-MDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKK
        S LVVGLH++SFLYKMAM +DD+AR FNCKVLAIKQA+TS EESHK+KNV+VIAA MDSSTNMDFSQIEIAKLQAPEILPQKIPYRICP+PSAIIWRSKK
Subjt:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAA-MDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKK

Query:  SRRR
        SRRR
Subjt:  SRRR

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LQQ9 Usp domain-containing protein

1.11e-105

77.45

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
        MD+RKI V+VEDVE ARTALKWALNNLMRYGDLI LLHVFPSTRSKS +K R+ RL GYQLAL+F+DLC  FPNTKVEIVVTEGD++GRKI A++REIGA
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA

Query:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM-DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKK
        S LVVGLH HSFLYKMAM ++D+ R FNCKVLAIKQAT + EES K+K+V+VIAA  + STNM+FSQIEIAKLQAPE+  QKIPYRICP+P AIIWRSKK
Subjt:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM-DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKK

Query:  SRRR
        S RR
Subjt:  SRRR

A0A5D3BIR9 UspA

1.27e-102

76.1

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
        MD+RKI V+VEDVE ARTALKWALNNLMRYGDLI LLHVFPSTRSKS +K R+ RL GYQLAL+F+DLC  FPNTKVEI+VTEGD++GRK AA++REIGA
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA

Query:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQAT-TSIEESHKSKNVQVIAAMDS-STNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSK
        S LVVGLH HSFLYKMAM ++D+ R FNCKVLAIKQAT T+ +ES K+KNV+VIAA  + STNM+FSQIEI KLQAPE   QKIPYRICP+P AIIWRS+
Subjt:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQAT-TSIEESHKSKNVQVIAAMDS-STNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSK

Query:  KSRRR
        KS RR
Subjt:  KSRRR

A0A6J1C7B3 uncharacterized protein LOC111008906

1.30e-140

100

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
        MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA

Query:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKKS
        SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKKS
Subjt:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKKS

Query:  RRRTL
        RRRTL
Subjt:  RRRTL

A0A6J1E7J0 uncharacterized protein LOC111431346

1.33e-107

79.15

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG--DKDGRKIAAMLREI
        MD+RKI V+VEDVEAARTALKW LNNLMRYGDLI LLHVFP+TRSKS +K RHLRL GYQLALSFKDLCT FPNTKVEI+VTEG  D++GRKIAA++REI
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG--DKDGRKIAAMLREI

Query:  GASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM------DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSA
        GAS LVVGLHD SFLYKMA+ +DDIARNF CKVLAIK +T   EE  K+KNV+VIAA        SSTNMDFSQIEIAKLQAPEI PQKIPYRICP+PSA
Subjt:  GASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAM------DSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSA

Query:  IIWRSKKSRRR
        IIWRSKKSR R
Subjt:  IIWRSKKSRRR

A0A6J1KNG3 uncharacterized protein LOC111495088

9.06e-108

79.52

Show/hide

Query:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG-----DKDGRKIAAML
        MD+RKI V+VEDVEAARTALKW LNNLMRYGDLI LLHVF +TRSKS +K RHLRL GYQLALSFKDLCT FPNTKVEI+VTEG     D++GRKIAA++
Subjt:  MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEG-----DKDGRKIAAML

Query:  REIGASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMD--SSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAI
        REIGAS LVVGLHD SFLYKMA+ +DDIARNF CKVLAIK +T   EES K+KNV+VIAA D  SSTNMDFSQIEIAKLQAPEI PQKIPYRICP+PSAI
Subjt:  REIGASALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMD--SSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAI

Query:  IWRSKKSRRR
        IWRSK+SR R
Subjt:  IWRSKKSRRR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G44760.1 Adenine nucleotide alpha hydrolases-like superfamily protein

1.1e-04

28.85

Show/hide

Query:  RKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAF-PNTKVEIVVTEGDKDGRKIAAMLREIGASA
        +++ V+V++   ++ A+ WAL +L   GDL+ LLHV       + +           LA S   LC A  P   VE +V +G K    + + ++++  S 
Subjt:  RKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAF-PNTKVEIVVTEGDKDGRKIAAMLREIGASA

Query:  LVVG
        LV+G
Subjt:  LVVG

AT1G48960.1 Adenine nucleotide alpha hydrolases-like superfamily protein

6.8e-60

55.77

Show/hide

Query:  DVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVF-PSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA
        DVR+I V+VED +AARTAL+WAL+NL+R GD+I+LLHV+ P  R K    AR LR  GY LALSF+++C +F NT  EI+V EGD DGR IA +++EIGA
Subjt:  DVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVF-PSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGA

Query:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIE-----ESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEI-LPQKIPYRICPNPSAII
        S L+VGLH +SFLY+ A++  D+ARNFNCKV+AIKQ +  +      + HK+      A  D  TN DFSQIEI+ LQ PEI  P K+PYR+CP+P AI+
Subjt:  SALVVGLHDHSFLYKMAMAQDDIARNFNCKVLAIKQATTSIE-----ESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEI-LPQKIPYRICPNPSAII

Query:  WRSKKSRR
        WR++  RR
Subjt:  WRSKKSRR

AT1G69080.1 Adenine nucleotide alpha hydrolases-like superfamily protein

6.6e-07

28.36

Show/hide

Query:  RKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKA-----------RHLRLKGYQLALSFKDLC-TAFPNTKVEIVVTEGDKDGRKI
        R+I V+V+    A+ AL W L++  +  D I+LLH   +  S+SG  A           +    +  +   + K +C    P  K E+V  +GD+ G  I
Subjt:  RKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKA-----------RHLRLKGYQLALSFKDLC-TAFPNTKVEIVVTEGDKDGRKI

Query:  AAMLREIGASALVVGLHDHSFLYKMAMAQDDIAR
            RE  AS LV+G       +++ M     AR
Subjt:  AAMLREIGASALVVGLHDHSFLYKMAMAQDDIAR

AT1G69080.2 Adenine nucleotide alpha hydrolases-like superfamily protein

2.3e-07

30.33

Show/hide

Query:  RKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGASAL
        R+I V+V+    A+ AL W L++  +  D I+LLH   +  S+SG  A   + +G   +        A    K E+V  +GD+ G  I    RE  AS L
Subjt:  RKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGASAL

Query:  VVGLHDHSFLYKMAMAQDDIAR
        V+G       +++ M     AR
Subjt:  VVGLHDHSFLYKMAMAQDDIAR

AT5G57035.1 U-box domain-containing protein kinase family protein

1.4e-04

26.72

Show/hide

Query:  AARTALKWALNNLMRYGDLIILLHVFPSTR---SKSGAK--------------ARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLRE
        A+R AL+W + N +   D ++L+HV P+     S SG+K               R LR +  Q+ + FK +C    + KVE ++ E     + +   + +
Subjt:  AARTALKWALNNLMRYGDLIILLHVFPSTR---SKSGAK--------------ARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLRE

Query:  IGASALVVGLHDHSFL
             LV+G    +FL
Subjt:  IGASALVVGLHDHSFL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATGTGAGGAAAATCGCGGTGATGGTGGAGGATGTCGAAGCAGCAAGAACGGCATTGAAATGGGCGCTCAACAATCTCATGCGCTATGGCGATTTGATTATTCTACT
CCATGTATTTCCCTCCACAAGATCCAAAAGCGGCGCCAAGGCTCGCCATCTCCGATTGAAGGGCTATCAATTAGCCCTCTCCTTCAAAGACCTCTGCACCGCCTTCCCCA
ATACAAAGGTAGAGATCGTCGTGACGGAAGGCGATAAAGATGGTAGAAAGATCGCAGCCATGCTCAGAGAGATTGGAGCTTCGGCTCTTGTTGTTGGCCTCCATGACCAT
AGCTTCCTCTACAAGATGGCTATGGCCCAAGATGACATAGCAAGGAATTTCAATTGCAAAGTTCTGGCAATCAAGCAAGCAACGACATCAATAGAAGAGTCACATAAAAG
CAAAAATGTGCAAGTAATAGCAGCTATGGACAGTTCAACCAACATGGACTTTTCTCAGATAGAGATTGCCAAATTACAAGCTCCTGAAATTCTTCCGCAGAAAATTCCAT
ACAGAATCTGCCCGAACCCTTCTGCGATTATATGGAGATCGAAGAAATCAAGAAGAAGGACTTTGTGA

mRNA sequence

Show/hide mRNA sequence

CACATAAAAAAGGTATTATAAGAAAAGATTTACATTTAATTGGGAGATCAATGCTTGATGTAAAGTCAGCTTTTATGATTTGAGAGAGAGCGTATCAATTTCAAATTATT
ATCATAAACCTAAAGCTTTGAAACTCTCTTCAATGGCAGGCGCGCGAGAGATTTGACAAAATTCATTCATAAACCTTCGGGAGGGAACAGAGGGTTATCTTTCCAGGGCG
GCCGAGGCCCACGAACACAGCAGAAATTCATATTTTAGACCCACGATCAGACCTCCCAAAAATGCCAAAAGTTGAAGGATCAACGTCGATTTAAAGACAGCAAAATCCCA
GTGGGAAACAGTACATAATTTCTCCGCTGTTCCTTTGGGGTCTGGAAATTAATTGCATTCCACAGTCGTCTCTCTGATTCTGAGTCCTCACCCGCCCCTCTCTCCATTGT
TCTTCCTCTAATTCGAGCCATGGCGACAACTGATTTACAGAAGTAGGGCTTCGATTGTATAGAGAAGGAGCCGGGGGCCATAATCGATGAGTTGTGAGTTTCTTTTCACA
AACTTCAACTCATAGAACAATCCTAGAGAGAGAGAGAGATATAGAGATGGATGTGAGGAAAATCGCGGTGATGGTGGAGGATGTCGAAGCAGCAAGAACGGCATTGAAAT
GGGCGCTCAACAATCTCATGCGCTATGGCGATTTGATTATTCTACTCCATGTATTTCCCTCCACAAGATCCAAAAGCGGCGCCAAGGCTCGCCATCTCCGATTGAAGGGC
TATCAATTAGCCCTCTCCTTCAAAGACCTCTGCACCGCCTTCCCCAATACAAAGGTAGAGATCGTCGTGACGGAAGGCGATAAAGATGGTAGAAAGATCGCAGCCATGCT
CAGAGAGATTGGAGCTTCGGCTCTTGTTGTTGGCCTCCATGACCATAGCTTCCTCTACAAGATGGCTATGGCCCAAGATGACATAGCAAGGAATTTCAATTGCAAAGTTC
TGGCAATCAAGCAAGCAACGACATCAATAGAAGAGTCACATAAAAGCAAAAATGTGCAAGTAATAGCAGCTATGGACAGTTCAACCAACATGGACTTTTCTCAGATAGAG
ATTGCCAAATTACAAGCTCCTGAAATTCTTCCGCAGAAAATTCCATACAGAATCTGCCCGAACCCTTCTGCGATTATATGGAGATCGAAGAAATCAAGAAGAAGGACTTT
GTGACAATTAAGGGACCCTCTTAATTTATCTCAAACTTCACTTCTCTAATATGGCTTGTTCTCTCTCTTTCCACAGCTTCTTAGATATTGAAAATAATGGAGTTTGCTCT
TTTTTTTCTTTTTTTTTTCTCTCTTTTTTTCTTTTTTCAAGGAGGTGTTGAGGTTGTCAACATATGCCCTACACACCAACACCCAACATAGATGAAAAAATGAACTGAAA
AGGTAATCCATTTGGTCTGATTTATATAGGTTTTGCAGGTTTTTTTGTATATATTTTTATAATTAATACCCTAATCTTGTTTCCTTGTATGCTCCGGGAATTTGATTTGA
TAACTTCTTTTATCTTCGTCTCTGTTTGAGAAACTTCTTTTTAGTTTCCTGTTTTGTGTAAGCAATTTTAATTTTAAAAATAAAAAACTAAAAGATTGCAGTGTTGTGTA
CAGACCATCGTGCCCTTTTCTTTTCTTTTCTTTTCTTTTTAACTAACGTTATTTATTAACAGTGATTTATTTTTTAATCTTGTGTTTTTAATTTCATAGCCTAATTTTAG
AAGCGTGCGTGTATTAAAAAACATGTTCTAGAAAAATATTGGTTAGGAATTCAAATATTTTTTTTTAGTAAAGAATTCAAATATGATTTAAAATGGTACAGTATCAAATT
AGCCTTGATCTCAAATAATGAATATAATAAATAATATTCCATATTATAATAGTATTATTAATTTATCATTAATTTTAAAAGTTCAATGATGTAAGTTCTTTAGAAAAATT
GGTTGTTTATATTATCACTTATTAGTATTAGTATCCAAATCTGGTTTGAATTATTTTCCGCTGACCTCATGTCCAATGGAAAGTTTATTTTATCGTGAATTTGAATGGAA
AGTTTATTTTATACCTGACCAATGGCCAGGTTGCCCGATGTTTTGAAAATTGAACTCTTCTCACAAATATAGAAAAATCAAGAGAATTCAATTTACAATTAAAAACATCT
TATATATACATATTTGAATAATTTACTATTTTTATCGATTTAAACATATAACTTCATGATAAGACATCAATTACCTAATATGAAGGTTGGATCCCCCACCCCGGTGAACT
AAAAAAAAATTACTGTTTGTCAACCAATATTAACATTCAAATATTCAAATATAGATTTATTGATATATGTTTTTTTGACTTTGATTCATTTTATAGTCTCTATATTATCA
AAATGGTTATTGTACTTTCAACTTTTGTTTGTTTTAATTACTATGTTTCTAAAATTTCCGTGAAAAAGTGACTAATTTGATCTTTATACATCGAAAAAACCATTAAATAC
AAATCGATGACTATGTTTAAAAAAATCAATATTAAATGTTACACCGAAATTATAATCGAAAGAAATAAAATAAAAGTACAGTTACAAAATAGTATTTAATCATACAATAA
ATTGTACCTATTTTAAAATGAATAATACTTACTCCTCGTTGTTGAGGATGAGTCTTGATCTAGAGAAAGAAATACAAAAATGATTTTTTTTTATTTTTTATTTTTTATGA
AAAGAGTGAATTAATCCTCACGGAGGTAAGTATTTTTCTTTTACAACAAACTTCACCAAACATACTAATTCTTGGGGATTTCATTGTCTGTGATGAGATAATTTTAGTAA
AGCGAATTCCTTTGACAATTGTTACTCTTGAGTAGACAAAACAAAACATAACATATTTTACATGCACAACAAAATTACTCTCACTCTGTACAAAAGAAACAGAAACTTGC
AAAACCAGGGCCAAAATAAAAACGAAGGCATATCCTATAATCCAATCACATCCTCAGGTGACGTACCTGAAATCACCCCCGCGTTACGTTAACCAATTGAAATCTGAAGC
TCCTTTTAGGTCTAATTCAGTATACCTGGCGATGGCCGGTTGCGAGATAGGAAGGCAGAGGACTGGCACGCGGCGACCGTGGAGGAACTTCGTTCAGCTGCTTCCCCTTA
CTATCGTAATAAATTACGCCCGAGAAATTCAACGGCTCACACTTATCCCCCATCAGGATCGCCTTCTGCCAGATTCCTCCGTCTCCCCACTCGTCTTCCGCATCGCATCC
GCCGCGCTTCGTCTTCTTGTTCTTGTTCTTCTGCATCAGCGTGATTGCCGTGTCGCTTATGCTCTTCAGGAACCGCTTCGGCCGGACCTGCGGCGATCGCAATTCTAGAC
GCGGAAATTGCTTCGATTTCAGCTTCGTCTGAAGCTTCTTCGACACTCTGTTCGCTTCCTTCGCACACAGAGCCACCAGAGTCGATAGCGAGATCAGCAAGGTCGCCGCC
GCCCGCTTCGGCGACGCCAGGACGGAGCCGGAGCCAGAGCCAGAGCCGCCGCGTTCCGGTGTGGCGTGGCCCATGATGCAGAAACCGGAAGCGGAAGGTAAACGAAATGC
GAAATCTGTTTGGGAGATTATTCGGATGAAGAAGATTTTGAATTTGGGAATTTTGGTGTGTATTTATATTGGGGAGTTTGTGGTCCTGGTCCTCGTGGGGTCTGCGACTG
CGCTACAGTTATATAGAAAGAAACGACGGCGTACAGCCTCAGTAGTTCACCGATATATGTTTTAAGTTTATTGAAGAAAAATGAGAGTTCGTTTTTGCGTTAAAAATACG
AGTCCACTTATTCATCTAGGGGCCAAATTTGAAGGCGTGACATAGTACGGAATCTATTTTTTATTTGGAAAAGGAATTGCGAATATAAATAATAAGTAAACAATTTTAGT
TTTGCAATCATAAAAAATTCAAATAAAAACTTT

Protein sequence

Show/hide protein sequence

MDVRKIAVMVEDVEAARTALKWALNNLMRYGDLIILLHVFPSTRSKSGAKARHLRLKGYQLALSFKDLCTAFPNTKVEIVVTEGDKDGRKIAAMLREIGASALVVGLHDH
SFLYKMAMAQDDIARNFNCKVLAIKQATTSIEESHKSKNVQVIAAMDSSTNMDFSQIEIAKLQAPEILPQKIPYRICPNPSAIIWRSKKSRRRTL

MC03g1222 (gene) of Bitter gourd (Dali-11) v1 genome