CuGenDBv2

Gene ID	Moc10g20110
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Reverse transcriptase
Genome location	chr10:14851099..14856803
RNA-Seq Expression	Moc10g20110
Synteny	Moc10g20110
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0004190 - aspartic-type endopeptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR021109 - Aspartic peptidase domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022146110.1 uncharacterized protein LOC111015405 [Momordica charantia]

6.7e-45

60.84

Show/hide

Query:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET
        ++ASQ VRA +LS D+Q L  RLIQLDMQ+ DVI+ MDWLAT+QANINCS+REV FQLPSG++F FKG+ G VPR VSALKAR LLQ G WGYLA+VV+ 
Subjt:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET

Query:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDEEEDQV
        SK  P+IDS+HVV EFPDVF  DLP L PV+ +L FC  +     P   + Y+   AEL E + Q+
Subjt:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDEEEDQV

XP_022151719.1 uncharacterized protein LOC111019634 [Momordica charantia]

6.0e-62

85.33

Show/hide

Query:  MRTQMRTMEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNP
        MRTQM TME+MY++MVQAAG  SRSEN+V R D+ EQRG HLGPV++ HPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSP+CSHRNSNQQAESSYNP
Subjt:  MRTQMRTMEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNP

Query:  VTPEGVITREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE
        +TPEGVITREEFDQLKSKFDAQVE LKAKCEKKES  DDGDLGES FTS+
Subjt:  VTPEGVITREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE

XP_022154299.1 uncharacterized protein LOC111021593 [Momordica charantia]

1.8e-42

59.01

Show/hide

Query:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET
        M++SQMV+   LS D Q L  RLIQLD+++ DVI+ MDWLAT+QA+INCSK+EV FQLP G SFMFKG+ GGVPR+VSAL+ARHLLQ G WG+LASVV+T
Subjt:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET

Query:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE
          + P+IDS+HVVNEF DVF ++L  L PV+ +L FC  +     P   + Y+   AEL E
Subjt:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE

XP_022159042.1 uncharacterized protein LOC111025482 [Momordica charantia]

4.0e-42

60.25

Show/hide

Query:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET
        ++ASQ VRA +LS D+Q L  RLIQLDMQ+ D+I+ MDWLAT+QANINCS+REV FQL SG++F FK + G VPR VSALKA+ LLQ G WGYLA+VV+ 
Subjt:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET

Query:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE
        SK  P+IDS+HVV EFPDVF  DLP L PV+ +L FC  I     P   + Y+   AEL E
Subjt:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE

XP_022159327.1 uncharacterized protein LOC111025738 [Momordica charantia]

1.6e-78

69.55

Show/hide

Query:  DRVRASDRRAQAANDGHQREVGAEVVEGQVHEGLETEPLRKSARITTPVLPPAHPKPSKANRGRGGASKRTTRGPASALIRENFDALQKQMEAMRTQMRT
        D     DRRA  ANDGHQREVGAEVVEGQ+HEGL TEP  +SARITTP L PAHPKP KANRGRGGAS+RTT G A A  RENFDALQK+MEAMRTQM T
Subjt:  DRVRASDRRAQAANDGHQREVGAEVVEGQVHEGLETEPLRKSARITTPVLPPAHPKPSKANRGRGGASKRTTRGPASALIRENFDALQKQMEAMRTQMRT

Query:  MEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNPVTPEGVI
        MEEMYN+MVQA G GSRSE++  R                             +RGDLR+HL+RKRSSSLRKG+SP+CSH+NSNQQAESSYNPV PEGVI
Subjt:  MEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNPVTPEGVI

Query:  TREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE
        TREEFDQLKSKFDAQVE LKA+CE K S  DDGDLGES FTS+
Subjt:  TREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CWD0 uncharacterized protein LOC111015405

3.2e-45

60.84

Show/hide

Query:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET
        ++ASQ VRA +LS D+Q L  RLIQLDMQ+ DVI+ MDWLAT+QANINCS+REV FQLPSG++F FKG+ G VPR VSALKAR LLQ G WGYLA+VV+ 
Subjt:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET

Query:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDEEEDQV
        SK  P+IDS+HVV EFPDVF  DLP L PV+ +L FC  +     P   + Y+   AEL E + Q+
Subjt:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDEEEDQV

A0A6J1DDW5 uncharacterized protein LOC111019634

2.9e-62

85.33

Show/hide

Query:  MRTQMRTMEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNP
        MRTQM TME+MY++MVQAAG  SRSEN+V R D+ EQRG HLGPV++ HPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSP+CSHRNSNQQAESSYNP
Subjt:  MRTQMRTMEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNP

Query:  VTPEGVITREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE
        +TPEGVITREEFDQLKSKFDAQVE LKAKCEKKES  DDGDLGES FTS+
Subjt:  VTPEGVITREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE

A0A6J1DLN2 uncharacterized protein LOC111021593

8.8e-43

59.01

Show/hide

Query:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET
        M++SQMV+   LS D Q L  RLIQLD+++ DVI+ MDWLAT+QA+INCSK+EV FQLP G SFMFKG+ GGVPR+VSAL+ARHLLQ G WG+LASVV+T
Subjt:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET

Query:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE
          + P+IDS+HVVNEF DVF ++L  L PV+ +L FC  +     P   + Y+   AEL E
Subjt:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE

A0A6J1DYR1 uncharacterized protein LOC111025482

2.0e-42

60.25

Show/hide

Query:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET
        ++ASQ VRA +LS D+Q L  RLIQLDMQ+ D+I+ MDWLAT+QANINCS+REV FQL SG++F FK + G VPR VSALKA+ LLQ G WGYLA+VV+ 
Subjt:  MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVET

Query:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE
        SK  P+IDS+HVV EFPDVF  DLP L PV+ +L FC  I     P   + Y+   AEL E
Subjt:  SKIAPNIDSIHVVNEFPDVFLEDLPRLSPVQLDLRFCCGI---NVPSLSSLYKAYEAELDE

A0A6J1DZJ1 uncharacterized protein LOC111025738

7.6e-79

69.55

Show/hide

Query:  DRVRASDRRAQAANDGHQREVGAEVVEGQVHEGLETEPLRKSARITTPVLPPAHPKPSKANRGRGGASKRTTRGPASALIRENFDALQKQMEAMRTQMRT
        D     DRRA  ANDGHQREVGAEVVEGQ+HEGL TEP  +SARITTP L PAHPKP KANRGRGGAS+RTT G A A  RENFDALQK+MEAMRTQM T
Subjt:  DRVRASDRRAQAANDGHQREVGAEVVEGQVHEGLETEPLRKSARITTPVLPPAHPKPSKANRGRGGASKRTTRGPASALIRENFDALQKQMEAMRTQMRT

Query:  MEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNPVTPEGVI
        MEEMYN+MVQA G GSRSE++  R                             +RGDLR+HL+RKRSSSLRKG+SP+CSH+NSNQQAESSYNPV PEGVI
Subjt:  MEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSLRKGQSPACSHRNSNQQAESSYNPVTPEGVI

Query:  TREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE
        TREEFDQLKSKFDAQVE LKA+CE K S  DDGDLGES FTS+
Subjt:  TREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTGCTAGTCAAATGGTGAGAGCAGACAAGCTATCCTTAGACGATCAGGCTTTGGCGGTAAGATTGATTCAACTGGACATGCAGAATTTGGATGTTATAGTGTGCAT
GGATTGGCTAGCTACCCATCAAGCCAACATTAATTGTTCGAAAAGGGAAGTCTTCTTCCAACTGCCTTCTGGTCAGAGTTTCATGTTTAAAGGAATCATGGGTGGTGTTC
CGAGGGTAGTTTCAGCTCTAAAGGCCAGACACCTCTTACAGTGTGGTGTTTGGGGTTACTTGGCAAGTGTCGTCGAGACTAGTAAGATTGCACCCAACATTGACTCCATC
CACGTGGTTAATGAGTTCCCGGACGTGTTCCTTGAAGACCTTCCAAGGCTATCCCCTGTTCAACTTGATCTCCGTTTCTGCTGCGGGATTAACGTCCCATCACTGTCTTC
TCTCTACAAGGCCTATGAGGCTGAGCTTGATGAAGAGGAAGATCAGGTCGGAGCTTGTAGTGCTTCAGCTCGCTTTTGTACTAGGAGGTCAAGGTTAAGCAGAAGAGCTT
CATCATTTGCTCGCTGGTCAAAATTTTCAACACTCAATGTTGGCAAGCCGATCTTCACAAGGATGACAGCCTCCAAGCCGAACATTAAATTGAAGGGGTTTTCGCTTGTT
GGTCCTGTTGGATCGGTCCACCTTGAACCGCCTAGAAGACCGGTTGCAGCCATCAAAAAGGCTAAGTATGAAAGCCGAGATACGACATGTTCGGGGTCCGACCTACTGGG
AGACCCGACAGGTCCACTCTCGTGTTCAGGTCGGACCAGAGACCGGGTTCGAGCTAGCGACCGAAGAGCTCAAGCGGCCAATGATGGCCACCAGAGGGAGGTCGGAGCGG
AGGTGGTAGAAGGGCAAGTTCATGAAGGCCTGGAGACAGAACCTCTCCGCAAGTCGGCACGTATCACCACGCCCGTTCTACCACCAGCACATCCAAAGCCATCCAAGGCC
AATCGTGGCCGAGGTGGAGCTTCAAAGAGAACCACCCGAGGACCAGCCTCAGCTCTAATAAGGGAGAATTTTGACGCACTCCAAAAACAAATGGAGGCAATGCGCACTCA
GATGCGCACCATGGAAGAAATGTACAACAAAATGGTGCAAGCTGCGGGCACAGGATCTCGGTCTGAAAACCAGGTGACGCGCGTTGACGTGCGCGAGCAGAGGGGTCCCC
ACCTCGGCCCAGTCGAGGAAGACCATCCCGAAGGAGGTGAGGACGAGGAGTACACTCACCAGAGGGGTGATCTCCGCGAACATCTTAACAGAAAGAGGAGCTCGTCCCTC
CGAAAGGGACAGTCTCCGGCCTGCTCGCACAGGAACTCCAACCAGCAGGCTGAATCCTCCTACAACCCGGTAACCCCCGAAGGGGTGATCACGAGGGAAGAGTTCGACCA
GCTAAAGAGCAAGTTTGATGCTCAGGTTGAGGTCTTGAAGGCCAAGTGCGAGAAGAAAGAAAGTCCACTCGATGATGGTGACCTGGGAGAATCGTCATTCACCTCGGAAT
TTTGGAGGCACCAATCCCTCCGAATTTCAAAACTCCCACCGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVASQMVRADKLSLDDQALAVRLIQLDMQNLDVIVCMDWLATHQANINCSKREVFFQLPSGQSFMFKGIMGGVPRVVSALKARHLLQCGVWGYLASVVETSKIAPNIDSI
HVVNEFPDVFLEDLPRLSPVQLDLRFCCGINVPSLSSLYKAYEAELDEEEDQVGACSASARFCTRRSRLSRRASSFARWSKFSTLNVGKPIFTRMTASKPNIKLKGFSLV
GPVGSVHLEPPRRPVAAIKKAKYESRDTTCSGSDLLGDPTGPLSCSGRTRDRVRASDRRAQAANDGHQREVGAEVVEGQVHEGLETEPLRKSARITTPVLPPAHPKPSKA
NRGRGGASKRTTRGPASALIRENFDALQKQMEAMRTQMRTMEEMYNKMVQAAGTGSRSENQVTRVDVREQRGPHLGPVEEDHPEGGEDEEYTHQRGDLREHLNRKRSSSL
RKGQSPACSHRNSNQQAESSYNPVTPEGVITREEFDQLKSKFDAQVEVLKAKCEKKESPLDDGDLGESSFTSEFWRHQSLRISKLPP

Moc10g20110 (gene) of Bitter gourd (OHB3-1) v2 genome