CuGenDBv2

Gene ID	Moc10g20450
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Reverse transcriptase
Genome location	chr10:15083750..15087995
RNA-Seq Expression	Moc10g20450
Synteny	Moc10g20450
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022149799.1 uncharacterized protein LOC111018145 [Momordica charantia]

2.4e-57

63.02

Show/hide

Query:  ADPPPPPA----DPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGA
        A P  PPA    +PQ+ LL E LQA+INN  GV  VQA+PP+H H PQSEA+FIKDFK YGP TFD  S                     C+DQFKVKGA
Subjt:  ADPPPPPA----DPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGA

Query:  VFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK
        V MLR E LN WDS+A  EDHANVP+ W RFKDLL DYY+P+TVKD KEAEFLHL QGTL+VAQYERKF E SCFALELIP E++KIKR  K
Subjt:  VFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

2.3e-55

42.03

Show/hide

Query:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------------
        M PR SMRL A+          ADP P                      GV  VQA PP+H H PQSEA+FIKDFK YGP TFDG S             
Subjt:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------------

Query:  --------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPI
                C+DQFKVKGAVFMLR E LNWWDS+AA ED+ANVP+ WARFK+LL DYY+P+TVKD KEAEFLHL QGTL+VAQYERKFTE S FALELIP 
Subjt:  --------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPI

Query:  ESVKIKR--------------------------------------------------CEKKSPSEFCRLDSAVRERTAFCKG------------------
        E++KIKR                                                   ++K PS +  L     +R A  +G                  
Subjt:  ESVKIKR--------------------------------------------------CEKKSPSEFCRLDSAVRERTAFCKG------------------

Query:  -------------------VSHVGLERIGVRAAGLPTVSTQGGNQKARVFALTGKEAANAEAVV
                           +S    +R+G R    P VSTQG NQ+ARVFALT KEAA+AE VV
Subjt:  -------------------VSHVGLERIGVRAAGLPTVSTQGGNQKARVFALTGKEAANAEAVV

XP_022156330.1 uncharacterized protein LOC111023250 [Momordica charantia]

1.2e-53

Show/hide

Query:  PPPPPADPQVAL------------LP--EVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CD
        P PPP++    +            LP  E L  +    +    +   PPRHFH PQSEAQFIKDFK YGP TFDGGS                     C+
Subjt:  PPPPPADPQVAL------------LP--EVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CD

Query:  DQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK
        DQFKVKGAVFMLR + LNWWDS+AA EDHAN+PVTWARFKDLL DYY+P+TVKD KEAEFLH +QGTLTVAQYERKFTE S FA ELIP E++KIKR  K
Subjt:  DQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK

XP_022156546.1 uncharacterized protein LOC111023424 [Momordica charantia]

4.4e-67

63.89

Show/hide

Query:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQ------ALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------
        M PRRSMRL A+V+P   GENVADPPPPP   Q  ++P          ALINNT GV   Q +PPRH H PQSEAQFIKDFK YGP TF GGS       
Subjt:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQ------ALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------

Query:  --------------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFA
                      C+DQFKVKGAVFMLR E LNWWDS+AATEDHANVPV WARFK+LL D+Y+ +TV+D KE EFLHL QGTLTVAQYERKFTE S FA
Subjt:  --------------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFA

Query:  LELIPIESVKIKRCEK
        LELIP E++KIKR  K
Subjt:  LELIPIESVKIKRCEK

XP_022158637.1 uncharacterized protein LOC111025088 [Momordica charantia]

2.0e-64

69.95

Show/hide

Query:  PPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGAVFMLRDEPL
        P  +PQVALL E LQALINNT GV   QA PPRHFH PQSEAQFIKDFK YGP TFDGGS                     C+DQFKVKG VFMLR E L
Subjt:  PPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGAVFMLRDEPL

Query:  NWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK
        NWWDS+A  EDHANVPV WARFKDLL DYY+P+TVKD KEAEFLHL QGTLTVAQYERKFTE S FALE IP E++KIKR  K
Subjt:  NWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D841 uncharacterized protein LOC111018145

1.2e-57

63.02

Show/hide

Query:  ADPPPPPA----DPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGA
        A P  PPA    +PQ+ LL E LQA+INN  GV  VQA+PP+H H PQSEA+FIKDFK YGP TFD  S                     C+DQFKVKGA
Subjt:  ADPPPPPA----DPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGA

Query:  VFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK
        V MLR E LN WDS+A  EDHANVP+ W RFKDLL DYY+P+TVKD KEAEFLHL QGTL+VAQYERKF E SCFALELIP E++KIKR  K
Subjt:  VFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK

A0A6J1DQ01 uncharacterized protein LOC111023250

6.0e-54

Show/hide

Query:  PPPPPADPQVAL------------LP--EVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CD
        P PPP++    +            LP  E L  +    +    +   PPRHFH PQSEAQFIKDFK YGP TFDGGS                     C+
Subjt:  PPPPPADPQVAL------------LP--EVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CD

Query:  DQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK
        DQFKVKGAVFMLR + LNWWDS+AA EDHAN+PVTWARFKDLL DYY+P+TVKD KEAEFLH +QGTLTVAQYERKFTE S FA ELIP E++KIKR  K
Subjt:  DQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK

A0A6J1DUM2 uncharacterized protein LOC111023247

1.1e-55

42.03

Show/hide

Query:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------------
        M PR SMRL A+          ADP P                      GV  VQA PP+H H PQSEA+FIKDFK YGP TFDG S             
Subjt:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------------

Query:  --------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPI
                C+DQFKVKGAVFMLR E LNWWDS+AA ED+ANVP+ WARFK+LL DYY+P+TVKD KEAEFLHL QGTL+VAQYERKFTE S FALELIP 
Subjt:  --------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPI

Query:  ESVKIKR--------------------------------------------------CEKKSPSEFCRLDSAVRERTAFCKG------------------
        E++KIKR                                                   ++K PS +  L     +R A  +G                  
Subjt:  ESVKIKR--------------------------------------------------CEKKSPSEFCRLDSAVRERTAFCKG------------------

Query:  -------------------VSHVGLERIGVRAAGLPTVSTQGGNQKARVFALTGKEAANAEAVV
                           +S    +R+G R    P VSTQG NQ+ARVFALT KEAA+AE VV
Subjt:  -------------------VSHVGLERIGVRAAGLPTVSTQGGNQKARVFALTGKEAANAEAVV

A0A6J1DVA0 uncharacterized protein LOC111023424

2.1e-67

63.89

Show/hide

Query:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQ------ALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------
        M PRRSMRL A+V+P   GENVADPPPPP   Q  ++P          ALINNT GV   Q +PPRH H PQSEAQFIKDFK YGP TF GGS       
Subjt:  MSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQ------ALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS-------

Query:  --------------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFA
                      C+DQFKVKGAVFMLR E LNWWDS+AATEDHANVPV WARFK+LL D+Y+ +TV+D KE EFLHL QGTLTVAQYERKFTE S FA
Subjt:  --------------CDDQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFA

Query:  LELIPIESVKIKRCEK
        LELIP E++KIKR  K
Subjt:  LELIPIESVKIKRCEK

A0A6J1DXQ7 uncharacterized protein LOC111025088

9.9e-65

69.95

Show/hide

Query:  PPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGAVFMLRDEPL
        P  +PQVALL E LQALINNT GV   QA PPRHFH PQSEAQFIKDFK YGP TFDGGS                     C+DQFKVKG VFMLR E L
Subjt:  PPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGS---------------------CDDQFKVKGAVFMLRDEPL

Query:  NWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK
        NWWDS+A  EDHANVPV WARFKDLL DYY+P+TVKD KEAEFLHL QGTLTVAQYERKFTE S FALE IP E++KIKR  K
Subjt:  NWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCGTCGAGGCCTCGGGTATAAATGGTCGGGGGTCGATGCGAGGAGTCTTTCGAAAGGAGAACTATTGGGCCTTGTGTACAAATGGTCAAGGGCCAGTAGAC
GGTGAAGTCATTGGGGCCTCGGATAAGGGCTGCTTACTGAGTACTGTGGTTGTACTCATCCCTCTTTTTCCCCTCCAGTTCGTAGGTATCGAGCTAGCTCATGGG
ATGGTGATGGCGAGAAGGAGGCTTGATCGGAAAGACCTGAAATTCGGGGGCGTTACAGTTAGTATCAGAGCCAAAACGTTCCTGTGGACTGACCTAGTAACTAGG
GTGTATAGGAGTAGTGGTCCTGGTCGACCTCCTTGTCCTTACCAGACAATGTCACCCCGTCGTAGTATGAGGTTGCCTGCAAATGTCAATCCAACCCTCAATGGT
GAGAATGTGGCAGACCCACCGCCCCCTCCGGCTGATCCTCAGGTGGCGTTGCTTCCGGAGGTGTTGCAGGCGCTGATCAATAACACAGTTGGAGTTAGCAGTGTA
CAAGCTAAGCCACCCCGACATTTTCATGCTCCTCAAAGCGAAGCCCAATTCATCAAGGATTTCAAGCATTACGGACCCTCTACCTTTGATGGAGGAAGTTGCGAT
GACCAGTTCAAGGTTAAGGGTGCGGTTTTTATGTTGAGGGATGAGCCCCTGAATTGGTGGGACTCACTAGCAGCGACAGAAGACCATGCTAATGTACCGGTCACG
TGGGCAAGGTTCAAGGATTTGTTGTGTGACTACTATTTCCCGAAGACCGTGAAAGATGCAAAGGAGGCAGAGTTCCTCCATCTCACCCAAGGAACCCTGACGGTA
GCACAATATGAAAGAAAGTTTACAGAATTCTCCTGTTTTGCTCTAGAATTAATTCCCATCGAGTCAGTAAAGATCAAGAGGTGTGAAAAGAAAAGTCCCTCCGAA
TTTTGCCGACTAGACTCAGCAGTGCGGGAGAGAACTGCATTTTGCAAGGGAGTGTCACATGTCGGCCTCGAACGCATAGGGGTTAGGGCAGCAGGCCTCCCAACA
GTTTCGACGCAGGGAGGTAACCAGAAGGCTCGTGTTTTCGCACTTACCGGCAAGGAAGCAGCGAATGCCGAAGCCGTTGTCATAGCCGCTCAAAAACTTAATGGC
GAGATTTACAAACAATGGAAGTCGAATTTAAACACTATTCTCGTGATAGATGATCTTAGGTTCGTCTGGCAAGAGAATTGTCTTCAAGCTCCTGTGCCTAACGCC
ATTGTGGCAGTTCGTAACGTCTATGACAGGTGGATCAAGGCCAATGACAAAGCCAAGGTCTACATCTTGGCGAGCATATCTGATGTGCTTGCCAAGAAGCACGAG
GACACGGTCACTGCTAAGGAGATCATGGACTCGCTGCAGAGCATGTTTGGACAACCGTCCTCACAGGCTCGACATGAAGCTCTTAAGTTCGTTACAACTCCCGCA
TGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSVEASGINGRGSMRGVFRKENYWALCTNGQGPVDGEVIGASDKGCLLSTVVVLIPLFPLQFVGIELAHGMVMARRRLDRKDLKFGGVTVSIRAKTFLWTDLVTR
VYRSSGPGRPPCPYQTMSPRRSMRLPANVNPTLNGENVADPPPPPADPQVALLPEVLQALINNTVGVSSVQAKPPRHFHAPQSEAQFIKDFKHYGPSTFDGGSCD
DQFKVKGAVFMLRDEPLNWWDSLAATEDHANVPVTWARFKDLLCDYYFPKTVKDAKEAEFLHLTQGTLTVAQYERKFTEFSCFALELIPIESVKIKRCEKKSPSE
FCRLDSAVRERTAFCKGVSHVGLERIGVRAAGLPTVSTQGGNQKARVFALTGKEAANAEAVVIAAQKLNGEIYKQWKSNLNTILVIDDLRFVWQENCLQAPVPNA
IVAVRNVYDRWIKANDKAKVYILASISDVLAKKHEDTVTAKEIMDSLQSMFGQPSSQARHEALKFVTTPA

Moc10g20450 (gene) of Bitter gourd (OHB3-1) v2 genome