CuGenDBv2

Gene ID	Moc04g20700
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Reverse transcriptase
Genome location	chr4:15033443..15040665
RNA-Seq Expression	Moc04g20700
Synteny	Moc04g20700
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0004190 - aspartic-type endopeptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001969 - Aspartic peptidase, active site IPR021109 - Aspartic peptidase domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022153201.1 uncharacterized protein LOC111020757 [Momordica charantia]

1.1e-65

58.36

Show/hide

Query:  KVWAYETISTLSLRVATRLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPAPPVVPDPPAVPDPAVVPAP
        +VWAYETIST        LSDDAIPRLLRWSC YS GF  L  +VFDN  SKVKE+L++T+A+ +HMV ++ PPE R      V+PDPPAVPD AVVP P
Subjt:  KVWAYETISTLSLRVATRLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPAPPVVPDPPAVPDPAVVPAP

Query:  AAVRNPTVVADPPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPSGNDSEALQKRSKRKKFKNNISRRLKRLDDRVGAIEATLTGV
         A      V DPPAD+E G             +EDPV +A           A+D+A PS ND E L+KR K+ KFK  ISRRLKRLD+ VGAIE  L   
Subjt:  AAVRNPTVVADPPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPSGNDSEALQKRSKRKKFKNNISRRLKRLDDRVGAIEATLTGV

Query:  GVAMKGIQRYLKKLSKGKFPDPTKYFARGGGPDDDDPSDQRPDEAPTPDGGPKSMDEDRRPKEVTKTDE
        GVA+KGIQ YLKKL+KGKFPD +KYF  GGGPDDD PSDQRPDE+P PDGG KSMDED+R  E  +TDE
Subjt:  GVAMKGIQRYLKKLSKGKFPDPTKYFARGGGPDDDDPSDQRPDEAPTPDGGPKSMDEDRRPKEVTKTDE

XP_022154299.1 uncharacterized protein LOC111021593 [Momordica charantia]

6.3e-58

79.33

Show/hide

Query:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC
        GTVLV N PAYVLFDSGSS TFISTAFVRQ  LEL PLGFLL VSTPSGSV+I+SQMV+ G LSFD Q L ARLIQLD+RDFDVILGMDWLATNQA+INC
Subjt:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC

Query:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD
        S++EVSFQLP G SF FKG++GGVPR VSAL+AR LLQ G WG+LA+VVD
Subjt:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD

XP_022155163.1 uncharacterized protein LOC111022304 [Momordica charantia]

1.1e-57

85.81

Show/hide

Query:  RLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPA------PPVVPDPPAVPDPAVVPAPAAVRNPTVVAD
        RLSDDAIPRL RWSCTYSRGFLT+QRDVFDN +SKVKEYLVSTNAE EHMV IMRPPEARAIP       PP VPDPPAVPDPAVVPAPAAV N   VAD
Subjt:  RLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPA------PPVVPDPPAVPDPAVVPAPAAVRNPTVVAD

Query:  PPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPS
         PADLERGTQERRVKDKGKNIIEDPVEEAETLD+DALQ PALDDAGPS
Subjt:  PPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPS

XP_022156985.1 uncharacterized protein LOC111023814 [Momordica charantia]

7.5e-59

76.73

Show/hide

Query:  MSLPLHYLPGTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWL
        MSL L YL   VLVHNVPAY LFDSGSSHTFISTAFV QA L LEPLGFLLSVSTPSGS +  SQMVR G+LS  + TL ARLIQLDM+DFD+ILGMDWL
Subjt:  MSLPLHYLPGTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWL

Query:  ATNQANINCSRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD
        ATNQA+IN  RREVSFQLPSG+ FTFKG++G VP+ VSALKAR+LLQ+G WGYL +VVD
Subjt:  ATNQANINCSRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD

XP_022159077.1 uncharacterized protein LOC111025517 [Momordica charantia]

1.7e-71

94.7

Show/hide

Query:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC
        GT LVHNVPAYVLFD GSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC
Subjt:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC

Query:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVDI
        S+REVSFQLPSGRSFTFKG+SGGVPRAVSALKARRLL NG W YLA+VVDI
Subjt:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVDI

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DJX9 uncharacterized protein LOC111020757

5.2e-66

58.36

Show/hide

Query:  KVWAYETISTLSLRVATRLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPAPPVVPDPPAVPDPAVVPAP
        +VWAYETIST        LSDDAIPRLLRWSC YS GF  L  +VFDN  SKVKE+L++T+A+ +HMV ++ PPE R      V+PDPPAVPD AVVP P
Subjt:  KVWAYETISTLSLRVATRLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPAPPVVPDPPAVPDPAVVPAP

Query:  AAVRNPTVVADPPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPSGNDSEALQKRSKRKKFKNNISRRLKRLDDRVGAIEATLTGV
         A      V DPPAD+E G             +EDPV +A           A+D+A PS ND E L+KR K+ KFK  ISRRLKRLD+ VGAIE  L   
Subjt:  AAVRNPTVVADPPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPSGNDSEALQKRSKRKKFKNNISRRLKRLDDRVGAIEATLTGV

Query:  GVAMKGIQRYLKKLSKGKFPDPTKYFARGGGPDDDDPSDQRPDEAPTPDGGPKSMDEDRRPKEVTKTDE
        GVA+KGIQ YLKKL+KGKFPD +KYF  GGGPDDD PSDQRPDE+P PDGG KSMDED+R  E  +TDE
Subjt:  GVAMKGIQRYLKKLSKGKFPDPTKYFARGGGPDDDDPSDQRPDEAPTPDGGPKSMDEDRRPKEVTKTDE

A0A6J1DLN2 uncharacterized protein LOC111021593

3.1e-58

79.33

Show/hide

Query:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC
        GTVLV N PAYVLFDSGSS TFISTAFVRQ  LEL PLGFLL VSTPSGSV+I+SQMV+ G LSFD Q L ARLIQLD+RDFDVILGMDWLATNQA+INC
Subjt:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC

Query:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD
        S++EVSFQLP G SF FKG++GGVPR VSAL+AR LLQ G WG+LA+VVD
Subjt:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD

A0A6J1DM86 uncharacterized protein LOC111022304

5.2e-58

85.81

Show/hide

Query:  RLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPA------PPVVPDPPAVPDPAVVPAPAAVRNPTVVAD
        RLSDDAIPRL RWSCTYSRGFLT+QRDVFDN +SKVKEYLVSTNAE EHMV IMRPPEARAIP       PP VPDPPAVPDPAVVPAPAAV N   VAD
Subjt:  RLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPA------PPVVPDPPAVPDPAVVPAPAAVRNPTVVAD

Query:  PPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPS
         PADLERGTQERRVKDKGKNIIEDPVEEAETLD+DALQ PALDDAGPS
Subjt:  PPADLERGTQERRVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPS

A0A6J1DRW8 uncharacterized protein LOC111023814

3.6e-59

76.73

Show/hide

Query:  MSLPLHYLPGTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWL
        MSL L YL   VLVHNVPAY LFDSGSSHTFISTAFV QA L LEPLGFLLSVSTPSGS +  SQMVR G+LS  + TL ARLIQLDM+DFD+ILGMDWL
Subjt:  MSLPLHYLPGTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWL

Query:  ATNQANINCSRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD
        ATNQA+IN  RREVSFQLPSG+ FTFKG++G VP+ VSALKAR+LLQ+G WGYL +VVD
Subjt:  ATNQANINCSRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVD

A0A6J1DYU5 uncharacterized protein LOC111025517

8.3e-72

94.7

Show/hide

Query:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC
        GT LVHNVPAYVLFD GSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC
Subjt:  GTVLVHNVPAYVLFDSGSSHTFISTAFVRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINC

Query:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVDI
        S+REVSFQLPSGRSFTFKG+SGGVPRAVSALKARRLL NG W YLA+VVDI
Subjt:  SRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLLQNGVWGYLANVVDI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGGCTCTTGACATTTATTCCCAAGATACTGCCCCCCCTCCTTTTACAGCACTTGATGTTCGACCTTGCCATTTATTCCCAAGGACTAGCACCACTACTTCGCAAGC
ACCACTCTACTTTAATCCCTCAAGCCTAACTCATCGAGTCGCATTGACCCTTGACATTTATCCCCAAGGCCTCAATACTCCTCTACAGAAACTTATGTTCGGCCTTGCCA
TTTATTCCCAAGGCCTGAACTGTGTACCGGTCCTTGCCGTTTATCCCAAGCAGCGAGAAACGCCCAAAATGACCTCCAACGACTTCGATTTGATTCCCGTTACTACAAAA
CAACTTCGCTTAGTCGTTGGAGGTTGTCGGATCGAGGGAAAACAACGTGAACAGCCACCACGCGTCGCCCCGCAGCACCTGCTGCTGCCCGAGACCACGTGTCGCCGCCT
GCTGCTACCCGACGCCCGACGCTGCTGCTGCGCTGCCCGACGCCGCCTGCTACTGCCCGAGCCCGACGCTGCACCTACTGCTCCGATGTCGCCGCTGATCGTCGCGTCGC
CTGAACGGAGTTGCTCGTCGGAGAAGAAGAACCCGAGTGGGGGGTGGCCGGCGGCTCCAACAAGAGAGGGAAAGGTATGGGCTTACGAGACGATATCGACGTTGAGTCTG
CGCGTAGCCACGAGGCTGAGCGACGACGCCATTCCTCGACTCCTTAGGTGGTCGTGCACTTATTCTCGTGGGTTTCTTACTCTGCAGAGAGACGTGTTCGATAACATGAT
ATCCAAGGTTAAGGAATACTTGGTTTCGACGAATGCTGAGGCAGAACACATGGTCTGTATCATGCGTCCACCGGAAGCCCGCGCTATACCTGCCCCGCCGGTTGTACCTG
ACCCGCCTGCAGTACCTGACCCGGCTGTTGTACCTGCCCCGGCTGCAGTACGTAACCCGACTGTAGTAGCTGACCCGCCTGCAGATCTGGAAAGGGGTACTCAGGAAAGA
AGGGTGAAGGACAAAGGAAAGAATATCATAGAGGATCCGGTAGAAGAGGCCGAGACATTGGACAATGATGCATTACAGGGTCCTGCATTAGACGATGCTGGACCCAGTGG
AAATGACAGCGAAGCGCTACAGAAGAGGTCGAAACGGAAAAAATTCAAAAATAATATCAGTAGACGGTTGAAGAGGCTCGATGACCGAGTTGGTGCTATCGAGGCCACAC
TGACTGGCGTCGGGGTCGCCATGAAAGGTATCCAGAGATACCTGAAGAAACTGTCGAAGGGTAAATTCCCTGATCCGACCAAATATTTTGCACGTGGGGGTGGGCCCGAT
GATGATGATCCATCGGATCAAAGGCCTGATGAGGCCCCAACACCAGATGGAGGTCCGAAGAGTATGGACGAGGACCGGAGGCCGAAAGAGGTCACTAAGACTGACGAGTA
TCGGACCATGGAGCATGGTTCGAAGAATATGGACGGCCGCAAATACTCAGAGGCTAGGGTAGAGGGCTCCCCCAACAGTTTCGACGCAGGAAGATGTTTGTGTGCGGGGT
TTATGTCTTTACCTTTGCATTATCTCCCAGGTACGGTCTTAGTCCATAATGTGCCTGCTTATGTATTGTTTGACTCGGGATCGAGTCACACCTTCATCTCTACTGCGTTT
GTTCGTCAGGCAACCCTCGAACTAGAGCCGTTAGGGTTTCTGTTGTCAGTTTCTACACCTTCAGGGTCGGTTTTGATTGCTAGTCAAATGGTGAGAGCAGGTGAGTTATC
TTTTGACAATCAGACCCTAGAGGCACGTTTGATCCAATTGGACATGCGGGATTTTGACGTCATTTTAGGCATGGATTGGCTAGCTACCAACCAAGCCAACATTAATTGCT
CGAGGAGGGAAGTCTCTTTCCAACTACCTTCGGGTCGGAGCTTTACGTTTAAAGGAATTTCAGGTGGAGTTCCAAGGGCAGTCTCAGCGTTGAAGGCAAGGCGCCTTTTA
CAAAATGGTGTCTGGGGATATCTGGCCAATGTCGTCGACATTATGTCTCGTAGACTAGTACTAGACGAGTTGGATCGTTCTGAGGTGGAGTTAGCAGTGGAGGATGTCTC
GGCAGTGTTATCTCGACTCTCGGTTGAACCCACTTTGAGACAGCGGGTCATCGCTGCACAGAAGGGAGATCCCAGCCTGAGCAAGGGTTTCAGTATGGTGGACGAAACCT
TGTGTTATAAGGAGGTACCCATTGAGATTGTAGCAAGAGAGACCAAGGTGCTGCGGAATCGGGCAATTGACTTGGTGAAGGTCTTGTGGAGAAATCACCAAGTGGAGGAA
GCCACCTGGGAAAGGGAGGATGAAATTAGAGCCCGGTGCGCGCGGGTGACGGCAACAGCAGTTCTCGGACAACGGGCAGTAGCGATGCGCGGGCGTCTGCAGCAGCGTTG
CGCAGGTGTCGGGCAGCGGCGGAGGTGCACGGCGCGTCGGGCAGCAGCAGTGGTGCGCGAGTTCCGATAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTALDIYSQDTAPPPFTALDVRPCHLFPRTSTTTSQAPLYFNPSSLTHRVALTLDIYPQGLNTPLQKLMFGLAIYSQGLNCVPVLAVYPKQRETPKMTSNDFDLIPVTTK
QLRLVVGGCRIEGKQREQPPRVAPQHLLLPETTCRRLLLPDARRCCCAARRRLLLPEPDAAPTAPMSPLIVASPERSCSSEKKNPSGGWPAAPTREGKVWAYETISTLSL
RVATRLSDDAIPRLLRWSCTYSRGFLTLQRDVFDNMISKVKEYLVSTNAEAEHMVCIMRPPEARAIPAPPVVPDPPAVPDPAVVPAPAAVRNPTVVADPPADLERGTQER
RVKDKGKNIIEDPVEEAETLDNDALQGPALDDAGPSGNDSEALQKRSKRKKFKNNISRRLKRLDDRVGAIEATLTGVGVAMKGIQRYLKKLSKGKFPDPTKYFARGGGPD
DDDPSDQRPDEAPTPDGGPKSMDEDRRPKEVTKTDEYRTMEHGSKNMDGRKYSEARVEGSPNSFDAGRCLCAGFMSLPLHYLPGTVLVHNVPAYVLFDSGSSHTFISTAF
VRQATLELEPLGFLLSVSTPSGSVLIASQMVRAGELSFDNQTLEARLIQLDMRDFDVILGMDWLATNQANINCSRREVSFQLPSGRSFTFKGISGGVPRAVSALKARRLL
QNGVWGYLANVVDIMSRRLVLDELDRSEVELAVEDVSAVLSRLSVEPTLRQRVIAAQKGDPSLSKGFSMVDETLCYKEVPIEIVARETKVLRNRAIDLVKVLWRNHQVEE
ATWEREDEIRARCARVTATAVLGQRAVAMRGRLQQRCAGVGQRRRCTARRAAAVVREFR

Moc04g20700 (gene) of Bitter gourd (OHB3-1) v2 genome