CuGenDBv2

Gene ID	Moc04g21970
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Reverse transcriptase Ty1/copia-type domain-containing protein
Genome location	chr4:15979891..15989960
RNA-Seq Expression	Moc04g21970
Synteny	Moc04g21970
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022141216.1 uncharacterized protein LOC111011669 [Momordica charantia]

2.0e-04

71.79

Show/hide

Query:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ
        AFLMGLN+SF+Q+RAQLLLMEP  TINRAF+L A   +Q
Subjt:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ

XP_022152756.1 uncharacterized protein LOC111020399 [Momordica charantia]

1.1e-07

37.58

Show/hide

Query:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQL-NKVKAGSGPDSGINHVAITCSHIFS----FHTAVDQWVIDSGASTHICY
        FLMGLN+SFSQ+R QLLLMEP PTINR F+L +  A Q   L +     L   + A S   SG +  +++ S  +S     HT     +  S  +     
Subjt:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQL-NKVKAGSGPDSGINHVAITCSHIFS----FHTAVDQWVIDSGASTHICY

Query:  SRDFLSTFERFLVSLYFCLISLASQWDKSSLKTIGSARYWQGLYLLSTK
        S  F             C++      DKSS K IG A  W GLYLLS +
Subjt:  SRDFLSTFERFLVSLYFCLISLASQWDKSSLKTIGSARYWQGLYLLSTK

XP_022154919.1 uncharacterized protein LOC111022065 [Momordica charantia]

8.0e-06

84.62

Show/hide

Query:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ
        AFLMGLN SFSQIRAQLLLMEPAPTINRAFAL A    Q
Subjt:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ

XP_022158736.1 uncharacterized protein LOC111025199 [Momordica charantia]

2.8e-06

82.05

Show/hide

Query:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQC
        FLMGLNDSFSQIRAQLLLMEPAP+IN AFAL A    QC
Subjt:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQC

XP_038875043.1 uncharacterized protein LOC120067569 [Benincasa hispida]

3.5e-09

45.54

Show/hide

Query:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQLNKVKAGSGPDSGIN---HVAITCSHIFSFHTAVDQWVIDSGASTHICYS
        AFLMGLNDS + IR+QLLLMEP P+INRAF+L     DQ +   +     ++  K+ +     IN   HV   CS       + +QW++DSGASTHICY+
Subjt:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQLNKVKAGSGPDSGIN---HVAITCSHIFSFHTAVDQWVIDSGASTHICYS

Query:  R
        +
Subjt:  R

TrEMBL top hits

e value

%identity

Alignment

A0A2N9G500 Uncharacterized protein

2.1e-07

38.6

Show/hide

Query:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQLNKVKAGSGPDSGINHVAITCSHIFSFHTAV---DQWVIDSGASTHICYSR
        FLMGLNDSF  +RAQ+L+MEP P IN+AF+L +L++   Q  L+  Q  L          +GI   A   S   + H AV    Q++ D+GA+ H+ YS 
Subjt:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQLNKVKAGSGPDSGINHVAITCSHIFSFHTAV---DQWVIDSGASTHICYSR

Query:  DFLSTFERFLVSLY
          LS+F     +++
Subjt:  DFLSTFERFLVSLY

A0A6J1CIG1 uncharacterized protein LOC111011669

9.6e-05

71.79

Show/hide

Query:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ
        AFLMGLN+SF+Q+RAQLLLMEP  TINRAF+L A   +Q
Subjt:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ

A0A6J1DIP8 uncharacterized protein LOC111020399

5.4e-08

37.58

Show/hide

Query:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQL-NKVKAGSGPDSGINHVAITCSHIFS----FHTAVDQWVIDSGASTHICY
        FLMGLN+SFSQ+R QLLLMEP PTINR F+L +  A Q   L +     L   + A S   SG +  +++ S  +S     HT     +  S  +     
Subjt:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQL-NKVKAGSGPDSGINHVAITCSHIFS----FHTAVDQWVIDSGASTHICY

Query:  SRDFLSTFERFLVSLYFCLISLASQWDKSSLKTIGSARYWQGLYLLSTK
        S  F             C++      DKSS K IG A  W GLYLLS +
Subjt:  SRDFLSTFERFLVSLYFCLISLASQWDKSSLKTIGSARYWQGLYLLSTK

A0A6J1DNP7 uncharacterized protein LOC111022065

3.9e-06

84.62

Show/hide

Query:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ
        AFLMGLN SFSQIRAQLLLMEPAPTINRAFAL A    Q
Subjt:  AFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQ

A0A6J1E1U3 uncharacterized protein LOC111025199

1.3e-06

82.05

Show/hide

Query:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQC
        FLMGLNDSFSQIRAQLLLMEPAP+IN AFAL A    QC
Subjt:  FLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQC

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTGAGAGTGCAGTTGGAATGTGAACTACCTGTCAGCGAGATTGATGGGTGTGTTTTGGAATCTAGAGCTTCACATCCACAATGCCAGCATCCTGGATATACC
AAGCCACCGAATCCAATCTCTTCCTTGGAGAACAGAGTCTGCCACTGCCACAAAAGTAAGGAGTATCTAGCAAATTCTTTCTCCACTTTGGCGGTTACCTTCATT
CGTTCCGCTGTTGCCATGGCTATGGATGATCGTCTCAATCCGACTGCTACGGATGAACATCTCAATCTGATTGCTACTTCGTCTTCATCTCTCAATCAACCAACT
CTTGAACAAGTATGTGATGCTTTTCTGATGGGCTTGAATGATTCGTTTAGTCAAATTAGGGCTCAATTACTCCTTATGGAGCCAGCACCCACTATTAATCGCGCG
TTTGCTCTTTTTGCTCTCAATGCAGATCAGTGTCAAGGGTTATTAAATTTGCTTCAATCTCAATTGAATAAAGTGAAGGCTGGATCTGGTCCCGATTCTGGCATT
AATCATGTAGCAATTACTTGTTCTCATATTTTTTCCTTTCACACTGCTGTTGATCAGTGGGTGATTGATTCTGGTGCATCTACTCATATTTGTTATTCTCGAGAT
TTTTTATCAACCTTCGAGCGGTTTCTAGTGTCACTGTATTTTTGCCTGATCAGTCTTGCATCTCAGTGGGACAAGTCCTCTTTGAAGACGATTGGCAGTGCTAGA
TATTGGCAAGGACTCTATTTGCTGTCCACCAAGCCCACGGTTTCTGCTGCTGCTACTAGTCCTATTTCTGCTGCTATAAACTCTGATCCATCCAATGTCATTCAT
GCTACTACCCATACTGATTTGCCTAATGCTTTGTGTACTAATTTGAGTTCTATGCCTCCTGATTTGAATTCTGCTCCACTTTCTTATGCTATGAATACTGCTATT
AATGCACCTACTGAACCTACTGATATGAATACTATTCCTACTGATATGGTTTCTCATATGGCTGTTGATATAACCAATGCTTCTATTGATGTGCCTACTAGTACT
TTTTCTGCTGTACCTATCCCTGATATACCTGATATGTCTCATCCCCAACCTAGTGTTGCTTCACTAAAATACTCACGGCTGGAAACACTCCACGAGTTTGGTGAG
CGATCAAACAAGCATGCTCTGACGGGGCAAGTTGGCGCCAAGGGTGGTCGCCCAAGGGATGGAGCATCAATGGATGGGTCTCCTATAGAGGCTGGCAGAGTGGCC
GATGGAGGGGCGTACTTAGGGCACTGGCGACAGGTAGGGCACGCTGACGGTGCTGGCATGGTCGGCATGCGCGTGGGTAAAGGCATGCGGCTGAGGCAGCATGAG
AGCAAGCGATTGAAGCGAGCGGGTGCGCGGGCGTGTGCGGATGTGCAGCAAGAAGCATGTGAATGTGTGCGCGGATGGTGTGCGCGGTTGAGGCAGCATGCGCGC
GAACGATTTGAGTGCATGCACGAGCTAGATGCATGCATGCGTGTACGGGGCATTGGCGCGCGTGGAGATAAGCAATTGAGCAAAAGGCGTGCACGCAGCGGGCGA
GCTCTTGTGACGTTAACGCGGTGCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVRVQLECELPVSEIDGCVLESRASHPQCQHPGYTKPPNPISSLENRVCHCHKSKEYLANSFSTLAVTFIRSAVAMAMDDRLNPTATDEHLNLIATSSSSLNQPT
LEQVCDAFLMGLNDSFSQIRAQLLLMEPAPTINRAFALFALNADQCQGLLNLLQSQLNKVKAGSGPDSGINHVAITCSHIFSFHTAVDQWVIDSGASTHICYSRD
FLSTFERFLVSLYFCLISLASQWDKSSLKTIGSARYWQGLYLLSTKPTVSAAATSPISAAINSDPSNVIHATTHTDLPNALCTNLSSMPPDLNSAPLSYAMNTAI
NAPTEPTDMNTIPTDMVSHMAVDITNASIDVPTSTFSAVPIPDIPDMSHPQPSVASLKYSRLETLHEFGERSNKHALTGQVGAKGGRPRDGASMDGSPIEAGRVA
DGGAYLGHWRQVGHADGAGMVGMRVGKGMRLRQHESKRLKRAGARACADVQQEACECVRGWCARLRQHARERFECMHELDACMRVRGIGARGDKQLSKRRARSGR
ALVTLTRC

Moc04g21970 (gene) of Bitter gourd (OHB3-1) v2 genome