CuGenDBv2

Gene ID	Moc03g15080
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Reverse transcriptase
Genome location	chr3:10166151..10177084
RNA-Seq Expression	Moc03g15080
Synteny	Moc03g15080
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR036875 - Zinc finger, CCHC-type superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022149380.1 uncharacterized protein LOC111017810 [Momordica charantia]

3.7e-21

43.14

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + EPTTY AA   AL +DK + +  Q  Q +G+S  VKRKF+S S SQ  R  Q  +  +  P +C  C   H G CW  KRICFKC+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + +KT   A  Q    +  V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

XP_022156067.1 uncharacterized protein LOC111023035 [Momordica charantia]

3.1e-20

42.48

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + E TTY AA   AL +DK +  + Q  Q MG+S  VKRKF+S S SQ+    Q  +  +  P  C  C  +H+G CW  KRICF+C+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + +KT   A  Q   Q+  V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

1.4e-17

35.95

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R  IRG   +  PTTY  A   AL +DK +   +    ++G+S  VKRKF S+      RAPQ+    +  P +C  C   H+G CW   + CF+C + G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC MS++NT+ + ++  P    Q   Q+  V ALT++E  D + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

XP_022156328.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111023249 [Momordica charantia]

2.4e-20

41.18

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + EPTTY AA   AL +DK +  + Q  Q +G++  VKRKF+S S SQ+ R  Q     +  P +C  C  +H+  CW  K+ICFKC+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + +KT      Q   Q   V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

XP_022158750.1 uncharacterized protein LOC111025215 [Momordica charantia]

2.6e-19

40.52

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + EPTTY AA   AL +DK +  + Q  Q +G+S  VKRKF+S S SQ  R  Q  +  +  P +C  C   H+G CW  KRIC++C+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + ++    A  Q    +  V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D5J7 uncharacterized protein LOC111017810

1.8e-21

43.14

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + EPTTY AA   AL +DK + +  Q  Q +G+S  VKRKF+S S SQ  R  Q  +  +  P +C  C   H G CW  KRICFKC+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + +KT   A  Q    +  V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

A0A6J1DQB9 Reverse transcriptase

1.1e-20

41.18

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + EPTTY AA   AL +DK +  + Q  Q +G++  VKRKF+S S SQ+ R  Q     +  P +C  C  +H+  CW  K+ICFKC+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + +KT      Q   Q   V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

A0A6J1DR22 uncharacterized protein LOC111023035

1.5e-20

42.48

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + E TTY AA   AL +DK +  + Q  Q MG+S  VKRKF+S S SQ+    Q  +  +  P  C  C  +H+G CW  KRICF+C+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + +KT   A  Q   Q+  V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

A0A6J1DUM2 uncharacterized protein LOC111023247

7.0e-18

35.95

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R  IRG   +  PTTY  A   AL +DK +   +    ++G+S  VKRKF S+      RAPQ+    +  P +C  C   H+G CW   + CF+C + G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC MS++NT+ + ++  P    Q   Q+  V ALT++E  D + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

A0A6J1DWP4 uncharacterized protein LOC111025215

1.3e-19

40.52

Show/hide

Query:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG
        R EI+GL  + EPTTY AA   AL +DK +  + Q  Q +G+S  VKRKF+S S SQ  R  Q  +  +  P +C  C   H+G CW  KRIC++C+K G
Subjt:  RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVG

Query:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT
        H+ REC M+ SNT+ + ++    A  Q    +  V ALT+ +V+  + +V  T
Subjt:  HYVRECSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAAT

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTAGGACCAAATCCTTTGATTCTAGTTCTCATAGGACTTCGACCTCTCAAACTCCTTTAGAGAATCCTCCCACTAGGAGTAGTAAGTCTCGTCGGTGCAAG
CGGCGCGAGTCACTAGAAATTAGCTGCGACCTCTCTGACTATTCATATTCGAATTGTCCCGAGGAACTATTAGGGATACTTAGATATAACTATTCCATCCCAAAT
GATATTGAGTTGAGAATCCCTACGGCGGGTGAAACGATCGACAAACCTCCAATAGTTTCTAGTACCTATGGTGGAGATTGTGTGAAGATAGAGCCTGCCCTTTGT
CTGTCGAACAAATGCTTGCTATCCATTACATTAAAAAGTCTTCCAGCCCCTTGCCGATTCTATTTAAGCTGCTTTCCTGGAATTGCTAAATTAGTCAACAGGTCA
GTAATGGAAAAAGGTTTCTCTTCGGTTGTGAATGGTCCCACCTCCATAAAGAACTGGAAACAAAGCCAATTTCTTGTCTTCAAAGCACTAATTGATCCTCCACCG
GAGTTAACTAAAGCGACTAGATCAGTCCTAGCTGACTGTGTTGTCCTTTCAGCTAGAGATCGTTATAGTCCCGACCTCTTATCCAATCGAAATTTGAGGAACTGT
GGTCTCGTAGCTAAGCTCACAGAAGCCGCCCACCCCTCCATTGTCTTATTTTTCAGCCACCGCCGCCTCAGCGTCCCCTTTTCCACAGCAGCCAGCGACGGCGTC
TTCCATGGCAGCTCAGGTTCTTCTCCGGCGGCACATTCCCTAGCCTGTTCCAGCGGCTTCGACGGCATTGCACGCAAAGCAGACCACGCTGGTGTTCCTCGAGCT
GCAGCAGTGTCGGTCTTCAACTGTGCCGCATCCTCGACCAGGTGTGGTTTTTGGCGTCGCCTCTCCTCCACGCTTCGATTTGTGGAGTCTTTAGGGGTTGATGTG
GAGTTGGTTATGGTAAAGAACGTTGGATTCTTGGGAAAAGTGAATGGCAAGGTTCTTAGATCCAACTCTCAAGGGTTTCTTAACACCTTGGGTAAAAATGGTCAA
GGGCCGATAGATGGTGAAGTCATCGGGACCTTGGATAAAGGCTGCTTACTGAGTACTGTGGTTGTACTCATCCCTCTTTTTCACCTCCAGTTTGCAGGTGTCGAG
CTAGCTCTTGGGATGATTAATAAAGTGTTTTGTGAAGTTCCATATTTAGGGGATGTCCTAGGATTGATAACTCGTTGTCTTGAGAACCATTCGTGTAGTGGATGG
TTTATGATTAGTGAAGTTTCATTGAAAGCGCAAGTTTTTGTAAGTGTTATTGATCAGAGTAGCGCAGCGGAAGCGTGCACGTATGTGATTTCTGAAGATGATGCA
GAGCCCCATGTTGAACTTTCTATTCGCTCGAGCATACCTCGAGGGTTGATCTCATTAGAAGGTTTGCTAGTATCGGTTGGTATGGCTCGTCAAGGCGACACCCAG
GTTCAAGTCGATAGTCCAGCTTTCACTCTCTACATCGATGAACGTTTTAATGAGGAGACAGAGTTCATACATCGTGCACAAGGAAACACGACAGGGGCTCATCCC
CGTGGGGAAATTAGAGGACTAGATGCAATTATGGAACCAACCACTTACACTGCAGCTCCCGAGAGTGCCCTATTTCTTGATAAGAGTATTCGAAGGGATAGCCAA
GTTGACCAAAAGATGGGCACCTCACATGAAGTTAAAAGGAAGTTTTCATCGTCCTCTTTAAGCCAAACTTTTAGGGCTCCTCAACAACCATTATGGACACGAGAC
ACTCCCTTATTGTGTTACTTCTGTCTGATTCATCATTCTGGGCTGTGTTGGAAGAAGAAGAGGATATGTTTTAAGTGCAAGAAGGTTGGCCATTACGTTAGAGAA
TGTTCGATGAGTAGTTCGAACACCCGGACCATAATACGAAAGACGCTTCCAGTGGCACTAGTGCAAAGTATTGGACAAAAGCAAGACGTCCTTGCACTCACTCAG
GAAGAAGTAAAAGATGTGGATGTTATGGTAGCAGCCACCGCCGCCTCAGCGTCCCCTTTTCCACAGCATCCAGCGACGGCGTCGTCCATGGCAGCTCAAGTTGTC
TCGGCATCTCTCTGCCCCGACATTCCCCTACGACCTGGCTGCGCCACCGTCAAGATCCCTCTCATTCGGATGTGGTATCGGTTCATTCATGTACCCCTCCTCTCG
GGCGTCACAAATACCCATTATAGCAAAGCAGACCACGCCGGCATTCCTCAAGCTGCAGCAGTGTCGGTCTTCAACGACTCGGAGTTTTCGTCACTGAACCCGTTA
CCTAGAAGCAGTAGCATCGGTTTGGGGCGATTTGCAGCAGATAAGGGCTGCTTACTGAGTACTGTGGTTGTACTCATCCCTCTTTTCCCCTCCAGTTTGCAGGAT
GTGAGCTTCTCTTCAAACATTAGTGTTGTTGTTCTAATTGTTCAAGCTCTCGTGAGTGTTGGAAATCAGAGTAGCGCAGCAGAAGCGTGGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MARTKSFDSSSHRTSTSQTPLENPPTRSSKSRRCKRRESLEISCDLSDYSYSNCPEELLGILRYNYSIPNDIELRIPTAGETIDKPPIVSSTYGGDCVKIEPALC
LSNKCLLSITLKSLPAPCRFYLSCFPGIAKLVNRSVMEKGFSSVVNGPTSIKNWKQSQFLVFKALIDPPPELTKATRSVLADCVVLSARDRYSPDLLSNRNLRNC
GLVAKLTEAAHPSIVLFFSHRRLSVPFSTAASDGVFHGSSGSSPAAHSLACSSGFDGIARKADHAGVPRAAAVSVFNCAASSTRCGFWRRLSSTLRFVESLGVDV
ELVMVKNVGFLGKVNGKVLRSNSQGFLNTLGKNGQGPIDGEVIGTLDKGCLLSTVVVLIPLFHLQFAGVELALGMINKVFCEVPYLGDVLGLITRCLENHSCSGW
FMISEVSLKAQVFVSVIDQSSAAEACTYVISEDDAEPHVELSIRSSIPRGLISLEGLLVSVGMARQGDTQVQVDSPAFTLYIDERFNEETEFIHRAQGNTTGAHP
RGEIRGLDAIMEPTTYTAAPESALFLDKSIRRDSQVDQKMGTSHEVKRKFSSSSLSQTFRAPQQPLWTRDTPLLCYFCLIHHSGLCWKKKRICFKCKKVGHYVRE
CSMSSSNTRTIIRKTLPVALVQSIGQKQDVLALTQEEVKDVDVMVAATAASASPFPQHPATASSMAAQVVSASLCPDIPLRPGCATVKIPLIRMWYRFIHVPLLS
GVTNTHYSKADHAGIPQAAAVSVFNDSEFSSLNPLPRSSSIGLGRFAADKGCLLSTVVVLIPLFPSSLQDVSFSSNISVVVLIVQALVSVGNQSSAAEAW

Moc03g15080 (gene) of Bitter gourd (OHB3-1) v2 genome