CuGenDBv2

Gene ID	Moc06g26810
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Reverse transcriptase
Genome location	chr6:20220645..20226371
RNA-Seq Expression	Moc06g26810
Synteny	Moc06g26810
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0090304 - nucleic acid metabolic process (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0004190 - aspartic-type endopeptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function) GO:0016740 - transferase activity (molecular function)
InterPro domains	IPR001969 - Aspartic peptidase, active site IPR021109 - Aspartic peptidase domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022154299.1 uncharacterized protein LOC111021593 [Momordica charantia]

5.1e-69

72.16

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+ +N QRLGQ+ P  V TQ  NQKARVFALTR+E  +AE VV GTVLV + PAYVLFDSGSS TFIS+ FVRQ  LEL PLG LL VSTPSGS++I+SQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD
         VK G LSFD Q L ARLIQLD++DFDVI+GMDWLATNQA+INCS++EVSFQLP G SF FKGVT  VPR VSAL+AR LLQ GAWG+LA+VVD
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD

XP_022154844.1 uncharacterized protein LOC111022005 [Momordica charantia]

2.1e-70

77.9

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        MS ANTQRLGQR P  + TQG N++ARVFALTRKEAADAET+V G VLVH+VP Y LFDS SSHTFIS+ FVRQATL++E LGILLSVSTPSG+++IASQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLL
         V+A +LSFDNQTL+ARLIQLD++DFDVI+GMDWLATNQANINC RREVSFQLP GRSFTFKGVT  VP+ VS LKARR L
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLL

XP_022156992.1 uncharacterized protein LOC111023821 [Momordica charantia]

3.1e-66

69.07

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+  NTQ LGQRIP   + QG   +ARVFALTR + A AE VV+GTVLV  +PAY LFDS SSH+FI+STFVR A LELE LG LLSVSTPSGS+L+ SQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD
         VK G+LSFD QTL  +LIQLDMQDFDVI+GMDWLA NQANI+CS++E SF+LP  ++FTFKGV +RVPR VSALKA   LQ GAW YLA+VVD
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD

XP_022158750.1 uncharacterized protein LOC111025215 [Momordica charantia]

1.7e-64

67.53

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+ +NTQ LGQRIP   + QG   +ARVFALTR +   AE VV  TVLV  +PAY LFDSGSSH+FI+STFV  A LELE LG LLSVSTPSGS+L+ SQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD
         VK G+LSFD QTL  +LIQLDMQDFDVI+GMDWLA N+ANI+CS+++VSF+LP G++FTFKGV + VPR V ALKA  LLQ GAW YLA+VVD
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD

XP_022159077.1 uncharacterized protein LOC111025517 [Momordica charantia]

6.0e-70

69.86

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+AANTQRLGQR  P VSTQG                       GT LVH+VPAYVLFD GSSHTFIS+ FVRQATLELEPLG LLSVSTPSGS+LIASQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVDI--IPP
         V+AGELSFDNQTL ARLIQLDM+DFDVI+GMDWLATNQANINCS+REVSFQLP GRSFTFKGV+  VPR VSALKARRLL NGAW YLA+VVDI   PP
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVDI--IPP

Query:  GQVLDELDRSEVELAVEDV
              +D + V     DV
Subjt:  GQVLDELDRSEVELAVEDV

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DLN2 uncharacterized protein LOC111021593

2.5e-69

72.16

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+ +N QRLGQ+ P  V TQ  NQKARVFALTR+E  +AE VV GTVLV + PAYVLFDSGSS TFIS+ FVRQ  LEL PLG LL VSTPSGS++I+SQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD
         VK G LSFD Q L ARLIQLD++DFDVI+GMDWLATNQA+INCS++EVSFQLP G SF FKGVT  VPR VSAL+AR LLQ GAWG+LA+VVD
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD

A0A6J1DNG3 uncharacterized protein LOC111022005

1.0e-70

77.9

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        MS ANTQRLGQR P  + TQG N++ARVFALTRKEAADAET+V G VLVH+VP Y LFDS SSHTFIS+ FVRQATL++E LGILLSVSTPSG+++IASQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLL
         V+A +LSFDNQTL+ARLIQLD++DFDVI+GMDWLATNQANINC RREVSFQLP GRSFTFKGVT  VP+ VS LKARR L
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLL

A0A6J1DTE5 uncharacterized protein LOC111023821

1.5e-66

69.07

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+  NTQ LGQRIP   + QG   +ARVFALTR + A AE VV+GTVLV  +PAY LFDS SSH+FI+STFVR A LELE LG LLSVSTPSGS+L+ SQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD
         VK G+LSFD QTL  +LIQLDMQDFDVI+GMDWLA NQANI+CS++E SF+LP  ++FTFKGV +RVPR VSALKA   LQ GAW YLA+VVD
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD

A0A6J1DWP4 uncharacterized protein LOC111025215

8.2e-65

67.53

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+ +NTQ LGQRIP   + QG   +ARVFALTR +   AE VV  TVLV  +PAY LFDSGSSH+FI+STFV  A LELE LG LLSVSTPSGS+L+ SQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD
         VK G+LSFD QTL  +LIQLDMQDFDVI+GMDWLA N+ANI+CS+++VSF+LP G++FTFKGV + VPR V ALKA  LLQ GAW YLA+VVD
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVD

A0A6J1DYU5 uncharacterized protein LOC111025517

2.9e-70

69.86

Show/hide

Query:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ
        M+AANTQRLGQR  P VSTQG                       GT LVH+VPAYVLFD GSSHTFIS+ FVRQATLELEPLG LLSVSTPSGS+LIASQ
Subjt:  MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQ

Query:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVDI--IPP
         V+AGELSFDNQTL ARLIQLDM+DFDVI+GMDWLATNQANINCS+REVSFQLP GRSFTFKGV+  VPR VSALKARRLL NGAW YLA+VVDI   PP
Subjt:  KVKAGELSFDNQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVDI--IPP

Query:  GQVLDELDRSEVELAVEDV
              +D + V     DV
Subjt:  GQVLDELDRSEVELAVEDV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCGGCCGCAAATACGCAGAGGTTGGGTCAGAGGATTCCACCACCAGTTTCGACGCAGGGAAATAACCAAAAGGCTCGTGTCTTCGCACTTACTCGCAAGGAAGCGGC
GGATGCCGAAACAGTAGTCATAGGTACTGTTTTAGTCCATGATGTGCCTGCGTATGTATTGTTTGATTCGGGGTCGAGCCACACCTTCATCTCATCTACGTTCGTTCGTC
AGGCAACCCTCGAATTAGAGCCGTTAGGGATTTTGTTGTCGGTTTCTACACCATCAGGGTCGATTTTGATCGCTAGTCAAAAGGTGAAGGCAGGTGAGTTGTCTTTTGAT
AATCAGACTCTAAGGGCAAGGCTGATCCAGCTGGACATGCAAGATTTTGACGTTATTGTGGGCATGGATTGGCTAGCTACCAACCAAGCCAACATTAATTGCTCGAGAAG
AGAAGTCTCCTTTCAACTACCTTTGGGTCGGAGCTTTACGTTTAAAGGGGTTACGAGTAGAGTCCCAAGGACAGTATCAGCGTTGAAGGCAAGACGCCTGTTGCAGAATG
GAGCTTGGGGATATTTGGCCAACGTTGTCGACATTATACCTCCTGGACAAGTGTTAGATGAGTTGGACCGTTCTGAGGTGGAGCTAGCGGTAGAAGATGTGTCAGCAGTG
CTAGCTCAACTCTCGGTCAAACCCACCCTAAGACAACGAATCATCGCTGCACAAAAGGGAGACTCCAGTCTGAGCAAGGGTTTCGTGGATGAAACATTGTGCTATAAAGA
AGTACCCGTTGGGATCGTAGTAAGAGAGACCAAAGTGCTGCAGAACCGGGTGATTGATTTGGTGAAGGTCTTGTGGAGGAACCACCAAATAGAAGAGGCCACCTGGGAGC
GAGAAGACGAATTCAGGGCCCAGTATCCTGAATTGATCGAGCAACGAACTTTCGAGGACGAAACTGCAGGCGGCATCGATACACGCGGGGCTGTGTTCGCGGCGTCCTTT
CTCCGATTCAACAAGCCTAACGACCTCGGAGTTAGATTTGGAGTACCCACACCCAAACGAAATCGATTTAGAATACCCACACCTAAGCGGGGTTGTTTTGTAGCAAGGGA
CATTGAAACGAAGCCATTGGAGATCGTATTGGACGCTTTTCGCTGCTGCAAAAACGTGGACAGCAGCGTATTGGTGGTGTTCGGCGATTATCTACATCCGTTTGAAACCC
GATTTACGCTACCCACGTCTTGGCAAGCTAGATCTAATTTACCCACACCTATACGAAGTCGTTTTGCGTGTGAGGCCGACGCAAACTTAAACACGTGGTTGAGACCAATA
CGCTGGGAAGTCATCGGTACCTTGGGAATAAACGGCAAGGACCGGTGCACAGTTCAGGCCTTGGGAATAAATGGCAAGGCCGAACGTCAAGTTTCTGGAGAGGAGTCGGA
CATCAAGTACTGGAGAAGGAGGAGGTACGGTGACTTGGGAATAAATGTCAAGAGCCGTCATGCCTCGAGAAGTTACGCGGGGAGTGATAAAGGGGGGTGTTGTGGAAGGT
TTAGTACTATGAAACAAGGGCTAGCGATTCATGGGTTGTGGTATTGGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSAANTQRLGQRIPPPVSTQGNNQKARVFALTRKEAADAETVVIGTVLVHDVPAYVLFDSGSSHTFISSTFVRQATLELEPLGILLSVSTPSGSILIASQKVKAGELSFD
NQTLRARLIQLDMQDFDVIVGMDWLATNQANINCSRREVSFQLPLGRSFTFKGVTSRVPRTVSALKARRLLQNGAWGYLANVVDIIPPGQVLDELDRSEVELAVEDVSAV
LAQLSVKPTLRQRIIAAQKGDSSLSKGFVDETLCYKEVPVGIVVRETKVLQNRVIDLVKVLWRNHQIEEATWEREDEFRAQYPELIEQRTFEDETAGGIDTRGAVFAASF
LRFNKPNDLGVRFGVPTPKRNRFRIPTPKRGCFVARDIETKPLEIVLDAFRCCKNVDSSVLVVFGDYLHPFETRFTLPTSWQARSNLPTPIRSRFACEADANLNTWLRPI
RWEVIGTLGINGKDRCTVQALGINGKAERQVSGEESDIKYWRRRRYGDLGINVKSRHASRSYAGSDKGGCCGRFSTMKQGLAIHGLWYW

Moc06g26810 (gene) of Bitter gourd (OHB3-1) v2 genome