CuGenDBv2

Gene ID	Moc01g14910
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Ulp1-like peptidase
Genome location	chr1:9310994..9320651
RNA-Seq Expression	Moc01g14910
Synteny	Moc01g14910
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0008234 - cysteine-type peptidase activity (molecular function)
InterPro domains	IPR003653 - Ulp1 protease family, C-terminal catalytic domain IPR015410 - Domain of unknown function DUF1985 IPR038765 - Papain-like cysteine peptidase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022145823.1 uncharacterized protein LOC111015183 [Momordica charantia]

6.2e-96

95.26

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+NDRFP QATSMSHLSNVNRLIKDKLT DQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVA SSDDS+  LIGGNV TFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLD
        LWRLPGKVVQKKIGKNRLRRKYFNDEASM+LEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLD
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLD

XP_022152154.1 uncharacterized protein LOC111019943 [Momordica charantia]

4.1e-95

94.27

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+ND FP QATSMSHLSNVNRLIKDKLTADQLDMFRR TIFGRFVDLEMMFCSGVVHHFLSREV RSSDDSMSFLIGGN+LTFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWG
        LWRL GKVVQKKIGKNRLRRKYFN EASMLLEEFVEVYKQTDFEDDEDA KVTLILYTELVMM KSK KSKVDIDLYNQVDDLDYFNHLDWG
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWG

XP_022154873.1 uncharacterized protein LOC111022026 [Momordica charantia]

3.1e-79

82.56

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+NDRF  QATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREV  SSDDSMSFLIGGNVLTFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDV
        LWRLP                           EFVEVYKQTDFEDDEDAVKVTLILYTELVMM KSKSKSKVDIDLYNQVDDL+YFNHLDWGSDV
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDV

XP_022155155.1 uncharacterized protein LOC111022298 [Momordica charantia]

3.2e-124

95.4

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+ND FP QAT MSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVA SSD++MSFLIGGNVLTFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV
        LWRLPGK+VQKKIGKN LRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVK+TLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV

Query:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQV
        NGLKRAMNGKVALYKNKVRTNKKYLVKYSL GFPLAFQV
Subjt:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQV

XP_022157199.1 uncharacterized protein LOC111023969 [Momordica charantia]

1.1e-105

55.75

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        M+H L++ + DRFP Q TS+SHLS  N++I  KLT  QLDMFR+RTIFGRFVDL+MMFCS +VH+FL REV  +  D M F I G ++TFSK +F+L+TG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV
        LWR  G+V+QKK+ KNRLRR+YF D   + LEEF + YK+  F +D+DAVKV+LI YTE+VMMGK+K KS VD DLY QV+DLDYFN++DWG+ +W RT+
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV

Query:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQVWIYEVVPSLITPGVNRLSETAIPRIIRYSCSRVVDTKDLGEEVLGSAVLVISYPLVETELD
         GL+ AM  KV  YKNKV TNKK+ V+YSL GFP+AFQVW YE++PSL+  GVNRLS+TA+PRI RYSCS+ + +K L  +V  S+ L I++PLVE+E +
Subjt:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQVWIYEVVPSLITPGVNRLSETAIPRIIRYSCSRVVDTKDLGEEVLGSAVLVISYPLVETELD

Query:  KDYQRCPLDEREVVDLTAPGCSTSDSDDGHNPSPITDNLGDEDDLPLD
        + Y+  P D R  ++    G   SD DD        D+ G ++D   D
Subjt:  KDYQRCPLDEREVVDLTAPGCSTSDSDDGHNPSPITDNLGDEDDLPLD

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CX02 uncharacterized protein LOC111015183

3.0e-96

95.26

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+NDRFP QATSMSHLSNVNRLIKDKLT DQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVA SSDDS+  LIGGNV TFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLD
        LWRLPGKVVQKKIGKNRLRRKYFNDEASM+LEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLD
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLD

A0A6J1DF70 uncharacterized protein LOC111019943

2.0e-95

94.27

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+ND FP QATSMSHLSNVNRLIKDKLTADQLDMFRR TIFGRFVDLEMMFCSGVVHHFLSREV RSSDDSMSFLIGGN+LTFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWG
        LWRL GKVVQKKIGKNRLRRKYFN EASMLLEEFVEVYKQTDFEDDEDA KVTLILYTELVMM KSK KSKVDIDLYNQVDDLDYFNHLDWG
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWG

A0A6J1DLH1 uncharacterized protein LOC111022026

1.5e-79

82.56

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+NDRF  QATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREV  SSDDSMSFLIGGNVLTFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDV
        LWRLP                           EFVEVYKQTDFEDDEDAVKVTLILYTELVMM KSKSKSKVDIDLYNQVDDL+YFNHLDWGSDV
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDV

A0A6J1DLM5 uncharacterized protein LOC111022298

1.5e-124

95.4

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        MDHQLRIK+ND FP QAT MSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVA SSD++MSFLIGGNVLTFSKDQFMLITG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV
        LWRLPGK+VQKKIGKN LRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVK+TLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV

Query:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQV
        NGLKRAMNGKVALYKNKVRTNKKYLVKYSL GFPLAFQV
Subjt:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQV

A0A6J1DSS5 uncharacterized protein LOC111023969

5.5e-106

55.75

Show/hide

Query:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG
        M+H L++ + DRFP Q TS+SHLS  N++I  KLT  QLDMFR+RTIFGRFVDL+MMFCS +VH+FL REV  +  D M F I G ++TFSK +F+L+TG
Subjt:  MDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFSKDQFMLITG

Query:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV
        LWR  G+V+QKK+ KNRLRR+YF D   + LEEF + YK+  F +D+DAVKV+LI YTE+VMMGK+K KS VD DLY QV+DLDYFN++DWG+ +W RT+
Subjt:  LWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTV

Query:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQVWIYEVVPSLITPGVNRLSETAIPRIIRYSCSRVVDTKDLGEEVLGSAVLVISYPLVETELD
         GL+ AM  KV  YKNKV TNKK+ V+YSL GFP+AFQVW YE++PSL+  GVNRLS+TA+PRI RYSCS+ + +K L  +V  S+ L I++PLVE+E +
Subjt:  NGLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQVWIYEVVPSLITPGVNRLSETAIPRIIRYSCSRVVDTKDLGEEVLGSAVLVISYPLVETELD

Query:  KDYQRCPLDEREVVDLTAPGCSTSDSDDGHNPSPITDNLGDEDDLPLD
        + Y+  P D R  ++    G   SD DD        D+ G ++D   D
Subjt:  KDYQRCPLDEREVVDLTAPGCSTSDSDDGHNPSPITDNLGDEDDLPLD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT5G45570.1 Ulp1 protease family protein

8.9e-08

Show/hide

Query:  WVDVDVVYSPLCIK-DHWVLVAIDMTQSEIFVYDSLPGHISTSKLLTDMRPLSHTIPSLLYACGLMDTADCKLKRTPWRVYRPTTDTRQKGSIDCGIFAC
        +VDVD +Y+ L +  +HWV + ID+T   + VYDS+P   + +++      +   IP++L +            +  W+      +    G  DC I++ 
Subjt:  WVDVDVVYSPLCIK-DHWVLVAIDMTQSEIFVYDSLPGHISTSKLLTDMRPLSHTIPSLLYACGLMDTADCKLKRTPWRVYRPTTDTRQKGSIDCGIFAC

Query:  KFLEYLVSGNSLETLVQAQVSHIRRQYATQLW
        K++E L  G S + L    +  +R + A +++
Subjt:  KFLEYLVSGNSLETLVQAQVSHIRRQYATQLW

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAAGTCGTCACTGCCAGATTTGTTGTTGCAAGAAATGGATCGTCGAAAGTGTCGTCTGAAGCTTCGCAGGTGCCGTTGGAATGCTGGTTCAACGCCGGATCGTGGGT
GTGCTGCGGGAGCTCACTGAGATCTACTGTGGGTGTGCTATCGGAGTTTGTAGAGGATGTTGTCCAATGCCAAAGTAGGTTTTCAGAAGGTCGGGCGCCTGATCCGCTAC
CTTTGACGCCTCCAGAAATTGCTATTCGCACCACTGTCGGTCGATCACTGCCGGATCTGTCATGCCGGTGTGGTCGTTGGAGTTTGCAGTCCCTGCCGGATCTGCCACGC
CGGGGTGTTCGCCAGAGTCTGCCGCTACCTTCTGTGTGGGTGTCGAAGGGGTGCACAATGGACCATCAGTTGAGGATTAAGGACAATGACCGCTTTCCGGATCAAGCCAC
CAGCATGTCTCACTTGAGCAATGTCAACAGGCTTATCAAGGATAAACTCACAGCGGACCAACTTGATATGTTCCGTAGAAGAACAATATTTGGTCGATTTGTCGACTTGG
AGATGATGTTCTGCAGTGGTGTAGTTCATCACTTTCTGTCAAGGGAGGTTGCTAGGAGCAGTGACGACAGCATGAGTTTCTTAATTGGTGGCAACGTGTTGACATTCTCG
AAGGATCAATTCATGCTTATAACGGGATTGTGGCGGCTGCCCGGAAAGGTGGTCCAGAAAAAGATTGGAAAGAATAGGTTGCGGAGGAAGTACTTCAACGATGAAGCCTC
CATGCTGCTCGAAGAGTTTGTGGAGGTTTACAAACAGACTGATTTCGAGGACGACGAGGACGCCGTTAAAGTGACATTAATTTTGTACACGGAGCTTGTGATGATGGGAA
AGAGCAAGAGCAAGTCGAAGGTTGACATCGACTTGTACAACCAAGTCGATGACTTGGACTACTTCAACCATTTGGACTGGGGTTCTGATGTCTGGAGTAGGACAGTTAAC
GGTTTGAAGCGTGCGATGAATGGAAAAGTTGCGCTATACAAGAACAAAGTAAGAACGAACAAAAAGTATCTAGTAAAGTATAGCCTACAGGGATTTCCGCTTGCGTTTCA
GGTGTGGATATACGAGGTTGTCCCATCTCTCATCACTCCCGGTGTCAATCGTTTGAGCGAGACCGCCATTCCCCGGATAATTCGGTATTCGTGCAGTAGAGTCGTCGATA
CAAAAGATCTGGGGGAGGAGGTCCTTGGTTCAGCGGTGTTGGTCATATCTTATCCACTCGTGGAGACGGAGCTGGATAAGGACTACCAGAGGTGTCCATTGGACGAAAGA
GAGGTGGTTGATTTAACTGCGCCTGGGTGTTCCACCTCCGACAGTGATGATGGACACAATCCTTCCCCCATCACCGACAATCTTGGCGACGAAGACGATCTCCCACTCGA
CGATGCGCATTCGTTGGAAACGAATGTACAGGCAATGTCAGATGAGTCTTCGGATATGCCACGTACAGAGGCCGCATCTGAAGGTGGGCAACGGACACCGGTCGAAGTAC
TTCAACCAAGTACTTCTATTCGATCGAATGTGGGGCAAAGCACGCGGCAATCACCGCGAGCGACATCACGCGATGTTTTCCCTACACAACGGCACGACACCCGTCGATCG
AATGATAGATTCGGGGCTATGGAGAGAAGGCTGGATCTTTTAGCTTCAGACATGGCGGAGGTGAAGACGGATTTGGCGAAGGTCAAGTCCGACTTGAGTGAAATGAAACT
CATGCTTCAACGGTTGTGCCAGATCGATAGGCGAGAGGTGAATATTGGTGTCTCTCCGTCGGATACAGTCCACGTGTCACATCCATTGGTATCCAATGTTATCCCCGAGC
ATGATGGGGATGCTGATGACCACCAACCTGGAGGTTCCGATGCTGGAAAGAAGGACGATGTGGTTCCTGTAGAAGCGTCGTTGCATGAAAAGGCAACGGATGGAGTAGAG
ATGACCATACCCCCATCCGATCTTGGAGATGCAGAACTGACCAACCCCACGTGTATTGTCGATTCGGTGGAGTTGGATGTTGCAGTGGTGACACCCATTGTTTCGACAGA
GATGGTGGAACTCGAAATGACACCGCCAATAGTACAGGATCCACAAGCAGAGACGACGTCCGATCTAACCTTCGAGCCTCCTGCCTCAACCAACATTGATGGTCCGTGTG
GCATGATCCATGGGCCTCGTCAAGCCGAGCATATTGAGTTGGCCCTTACACCAGCGGATACGAGCCCCACTACTCAACCTATTCCCACACTTACACCAGCATATACGACT
CTCATCCCTCAACCTATTCCCACCCTTACACCAGCTGAAAACCCCACCACCCGTCATCCGAGTGATCCCGTGGGTTCTACTAACCTCGCGTTAGACAAAATTTCTGAACC
ATTGGCCATCGTGCACCAGCCAACTAAGGAGAAGAACCCCCCTCATGGCAAAAAAGCCACCACAATCCGATTTACGGCACCGCAAGAAGCCCCACTCTTTGTCAGCGGTT
CTGCTGTTAACGAACCCACTAAGCCGAAGAAAACTGAACAACAAACCGCTCCTAAGCAGTCGGCCTGGAAAATCGAGGTTTCGTATCCCGACGAAACAAGAAGGACCGAG
CGTAAGCGGACGGAAACGAAACCATTCAGTCCGAAGGACACGCGTTGGGAGATGATGCGTTGGGTACGGGACCCTGGGAATGACAAAACAACGCCGCCGTCTACAACTTG
GAATGTGCAGAGCGGATATTCCAGAAGATTCTTCATTAACATCCTCAATCCTAAGGAGAAGGTGGAAGACCCGGAAGCTGCTGTCATTCTATATTTCATTATGAGGAAGC
TTGGTAGTCGGCCGCACCTGTGCGTTCATAAGTTTTCTGTCCTAGACCCACTACAAATGCAAGTTCTTGCCGCTGCAGGTGGTCCCTATGCACGAATCAAGGGGAAGGTC
GTCCAGGACACGACCAATACTTGGGACGAGTATAAGGAGTGCATGGATGTCGTGCTGGGTCAGGTGGAAGATTTCATTCCATCCTGGGTGGACGTCGACGTAGTGTACAG
CCCGCTCTGTATCAAGGATCACTGGGTCCTGGTTGCGATAGATATGACCCAATCCGAGATTTTTGTATACGACTCATTGCCAGGCCACATTTCCACGTCGAAGTTGCTGA
CAGACATGCGGCCGTTGAGTCATACAATCCCATCGCTTTTGTACGCATGTGGGCTGATGGATACGGCCGATTGCAAGCTGAAGAGGACTCCGTGGCGTGTATACCGTCCT
ACGACCGACACGAGGCAGAAAGGTAGTATAGACTGTGGTATTTTTGCATGTAAATTTTTGGAATATCTTGTGTCGGGTAATAGTTTAGAAACTCTTGTTCAGGCTCAAGT
GTCGCACATTAGAAGGCAGTATGCGACACAACTTTGGCATAATGAACCTTACTTTGAATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MEVVTARFVVARNGSSKVSSEASQVPLECWFNAGSWVCCGSSLRSTVGVLSEFVEDVVQCQSRFSEGRAPDPLPLTPPEIAIRTTVGRSLPDLSCRCGRWSLQSLPDLPR
RGVRQSLPLPSVWVSKGCTMDHQLRIKDNDRFPDQATSMSHLSNVNRLIKDKLTADQLDMFRRRTIFGRFVDLEMMFCSGVVHHFLSREVARSSDDSMSFLIGGNVLTFS
KDQFMLITGLWRLPGKVVQKKIGKNRLRRKYFNDEASMLLEEFVEVYKQTDFEDDEDAVKVTLILYTELVMMGKSKSKSKVDIDLYNQVDDLDYFNHLDWGSDVWSRTVN
GLKRAMNGKVALYKNKVRTNKKYLVKYSLQGFPLAFQVWIYEVVPSLITPGVNRLSETAIPRIIRYSCSRVVDTKDLGEEVLGSAVLVISYPLVETELDKDYQRCPLDER
EVVDLTAPGCSTSDSDDGHNPSPITDNLGDEDDLPLDDAHSLETNVQAMSDESSDMPRTEAASEGGQRTPVEVLQPSTSIRSNVGQSTRQSPRATSRDVFPTQRHDTRRS
NDRFGAMERRLDLLASDMAEVKTDLAKVKSDLSEMKLMLQRLCQIDRREVNIGVSPSDTVHVSHPLVSNVIPEHDGDADDHQPGGSDAGKKDDVVPVEASLHEKATDGVE
MTIPPSDLGDAELTNPTCIVDSVELDVAVVTPIVSTEMVELEMTPPIVQDPQAETTSDLTFEPPASTNIDGPCGMIHGPRQAEHIELALTPADTSPTTQPIPTLTPAYTT
LIPQPIPTLTPAENPTTRHPSDPVGSTNLALDKISEPLAIVHQPTKEKNPPHGKKATTIRFTAPQEAPLFVSGSAVNEPTKPKKTEQQTAPKQSAWKIEVSYPDETRRTE
RKRTETKPFSPKDTRWEMMRWVRDPGNDKTTPPSTTWNVQSGYSRRFFINILNPKEKVEDPEAAVILYFIMRKLGSRPHLCVHKFSVLDPLQMQVLAAAGGPYARIKGKV
VQDTTNTWDEYKECMDVVLGQVEDFIPSWVDVDVVYSPLCIKDHWVLVAIDMTQSEIFVYDSLPGHISTSKLLTDMRPLSHTIPSLLYACGLMDTADCKLKRTPWRVYRP
TTDTRQKGSIDCGIFACKFLEYLVSGNSLETLVQAQVSHIRRQYATQLWHNEPYFE

Moc01g14910 (gene) of Bitter gourd (OHB3-1) v2 genome