CuGenDBv2

Gene ID	Moc04g22880
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrovirus-related Pol polyprotein from transposon RE1
Genome location	chr4:16621350..16628163
RNA-Seq Expression	Moc04g22880
Synteny	Moc04g22880
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

RVW36054.1 Retrovirus-related Pol polyprotein from transposon RE2 [Vitis vinifera]

3.0e-14

Show/hide

Query:  DEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKK--------ERNFGDLLVSDK------SKDIGSS
        +E +EK  E   F    +A++   + SK+ KW+LD+GCSRHMTGD+SKF  L+K  GG+VTFGDN K        E + G L + DK       +D    
Subjt:  DEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKK--------ERNFGDLLVSDK------SKDIGSS

Query:  KQEVSI-DENKVDGFSS--MLKEWKYAPSHPKDLILGDSEQDDTYTNTEEELEGRPPKRRRLHWTHQQILT--IFKANEKLIR--VKRKSGEEERLSEWP
        K  +++    +V G SS  + K+WK+  +HP+D I+G+     + +     L     + + L WT  Q L    F    K I+  +KR + EE ++ + P
Subjt:  KQEVSI-DENKVDGFSS--MLKEWKYAPSHPKDLILGDSEQDDTYTNTEEELEGRPPKRRRLHWTHQQILT--IFKANEKLIR--VKRKSGEEERLSEWP

XP_022155998.1 uncharacterized protein LOC111022973 [Momordica charantia]

2.9e-17

59.77

Show/hide

Query:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS
        MAH DKEDE D++               VCLKASKKSKWYLD+GCSRHMTGDQSKFVT SK DG FVTF DNKK +  G   + ++S
Subjt:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS

XP_022156978.1 uncharacterized protein LOC111023806 [Momordica charantia]

9.5e-16

71.43

Show/hide

Query:  IALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS
        +A  VCLKASKKSKWYLD+ CSRHMTGDQSKFVT SK DGGFVTFGDNKK +  G   + ++S
Subjt:  IALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS

XP_022158792.1 uncharacterized protein LOC111025259 [Momordica charantia]

6.3e-44

89.32

Show/hide

Query:  VCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKSKDIGSSKQEVSIDENKVDGFSSMLKEWKYAPSHPKDLILGD
        VCLKASKK KWYLD+GCSR+MTGDQSKFVT SK DGGFVTFGD+KKERNFGDLLVSDKSK+I SSKQEVSI+ENKVDGFSSM KEWKYAPSHPKDLILGD
Subjt:  VCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKSKDIGSSKQEVSIDENKVDGFSSMLKEWKYAPSHPKDLILGD

Query:  SEQ
         EQ
Subjt:  SEQ

XP_022950378.1 uncharacterized protein LOC111453493 [Cucurbita moschata]

9.5e-16

56.32

Show/hide

Query:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS
        MAH DKEDE +++               VCLKASKK+KWYLD+GCSRHMTG+ SKFV LSK DGG VTFGDNKK +  G   + + S
Subjt:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS

TrEMBL top hits

e value

%identity

Alignment

A0A438DKP4 Retrovirus-related Pol polyprotein from transposon RE2

1.5e-14

Show/hide

Query:  DEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKK--------ERNFGDLLVSDK------SKDIGSS
        +E +EK  E   F    +A++   + SK+ KW+LD+GCSRHMTGD+SKF  L+K  GG+VTFGDN K        E + G L + DK       +D    
Subjt:  DEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKK--------ERNFGDLLVSDK------SKDIGSS

Query:  KQEVSI-DENKVDGFSS--MLKEWKYAPSHPKDLILGDSEQDDTYTNTEEELEGRPPKRRRLHWTHQQILT--IFKANEKLIR--VKRKSGEEERLSEWP
        K  +++    +V G SS  + K+WK+  +HP+D I+G+     + +     L     + + L WT  Q L    F    K I+  +KR + EE ++ + P
Subjt:  KQEVSI-DENKVDGFSS--MLKEWKYAPSHPKDLILGDSEQDDTYTNTEEELEGRPPKRRRLHWTHQQILT--IFKANEKLIR--VKRKSGEEERLSEWP

A0A6J1DPE4 uncharacterized protein LOC111022973

1.4e-17

59.77

Show/hide

Query:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS
        MAH DKEDE D++               VCLKASKKSKWYLD+GCSRHMTGDQSKFVT SK DG FVTF DNKK +  G   + ++S
Subjt:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS

A0A6J1DS74 uncharacterized protein LOC111023806

4.6e-16

71.43

Show/hide

Query:  IALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS
        +A  VCLKASKKSKWYLD+ CSRHMTGDQSKFVT SK DGGFVTFGDNKK +  G   + ++S
Subjt:  IALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS

A0A6J1DY46 uncharacterized protein LOC111025259

3.1e-44

89.32

Show/hide

Query:  VCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKSKDIGSSKQEVSIDENKVDGFSSMLKEWKYAPSHPKDLILGD
        VCLKASKK KWYLD+GCSR+MTGDQSKFVT SK DGGFVTFGD+KKERNFGDLLVSDKSK+I SSKQEVSI+ENKVDGFSSM KEWKYAPSHPKDLILGD
Subjt:  VCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKSKDIGSSKQEVSIDENKVDGFSSMLKEWKYAPSHPKDLILGD

Query:  SEQ
         EQ
Subjt:  SEQ

A0A6J1GER0 uncharacterized protein LOC111453493

4.6e-16

56.32

Show/hide

Query:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS
        MAH DKEDE +++               VCLKASKK+KWYLD+GCSRHMTG+ SKFV LSK DGG VTFGDNKK +  G   + + S
Subjt:  MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTCATGGTGACAAGGAGGATGAACATGATGAGAAAAATTTCGAGCTAGGCACCTTCCCCAATCCCGAGATTGCCCTTAATGTTTGTTTGAAAGCTTCCAAG
AAAAGTAAGTGGTACTTGGATAATGGTTGCTCGAGGCACATGACGGGAGACCAATCCAAGTTTGTTACTCTCTCCAAAAATGATGGAGGTTTTGTAACATTTGGT
GACAACAAGAAAGAAAGAAATTTTGGAGATTTACTTGTTAGTGACAAAAGCAAAGACATTGGTTCAAGTAAGCAAGAAGTGAGCATCGACGAAAATAAGGTGGAC
GGTTTTTCATCCATGCTAAAGGAGTGGAAGTATGCTCCATCCCATCCTAAGGATTTAATCCTTGGTGATTCCGAACAAGATGACACCTACACCAACACGGAAGAA
GAGCTTGAGGGAAGACCCCCCAAACGAAGGAGACTTCATTGGACACATCAACAAATTTTGACTATTTTCAAAGCCAATGAAAAACTCATTAGGGTCAAGAGGAAG
AGTGGAGAAGAAGAGAGGTTAAGCGAATGGCCCCATTTCAAGGACAAGCCTATCGAGAGACCACTCACACGCAAGCACCGCCAGACCCACGCCTCTGCGCATGCG
CACCCCTGCCATGCACGCCAACATGCCGCTAACCTCACAGCACTGATGCCATTCACGCGCTGTCATCCTCCCACGCCTGTGCCAGCCGTCTCCGCCCGCGCGCTA
ACGCCCCTGCACGCGCAAGCGTCCGCGCGCCATGCCGTTACCAACACCCATACCTGTGCGCATCGCACGCTCATCAGCACCCCTGCTGCCCATACCGCTCGCCCA
GCGCCCGCACACATCCGCAACCATCCTACCGCTCAGCGCCCACGCCGCCCGCACCATGCCACTCACCAAGCACCAGCGCGCCCTCATGCCAGCGCCCTTATCGCC
CGCCAGCATGCCCTGCCCCAACGTCCACGCGCGCGTCCCCGTGCCAGCGCGTGCCCCAACGCCCAGACATCCGCCAGTGCGCCCCTGGCCCAGCGCTCATGCGCG
TGCGTCCATCGTGCCAATGAAGAACCCACTATGGTCAAAAGAAAGCGTGGAGAAGAAGAGCGGTCAAGCAAGTGGCTCCATTTCAAGGACAAGCCTATTGAAAGG
CCACTTGCACGCAAGCACCGCCAGTCGCACGCCCTACGCGTGCGCACCCCTGCCGCTAACCTCACAACGCCCATGCCTGCGCACGCTGCCGCCCGCCCACTCCTG
TGCCAGACGCCTCTGCCCGCGTGCCAACACTCCCTGCACGCCCAAGCACCCGAGCATCCTGTCACCACTCACGCGCCCTACCGCCACTCGCGCGCCTATGCCGCC
ACCAGCGCCCATGCCCGCGCACGCCACACGTTCAAAACGTCCCTACCGCACATCACCAACGCCTCTGCCGCCCAGCGCCAGCGCCCTGCCGCGCATCGCCAGCAC
CCCTACCGCGCATCGTTAGCACCTGTCCCAGTGCCCATGCGCACGCCAAGAGCGCCTGCCCCAGCGCCCAACGCCCATACCGCACGCCAAGCGCGCCTGCCCCAA
CGCCCATACCGCATGCCAAGCGCGCCTGCCCCAACGCCCAGAGCCCATGCTGCACGCCCAGTGCGCCTGCCCCAGCGCCCAGCGACCATGCCGCACGCCCAGCGT
GCCCCACTCGACGTCTATGAGCGCTCGCCACCCTTGCCAGCCATGCCTTGCCGCCCACTCCTCCCAAATAAGGAATGTCTCTCCTTATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAHGDKEDEHDEKNFELGTFPNPEIALNVCLKASKKSKWYLDNGCSRHMTGDQSKFVTLSKNDGGFVTFGDNKKERNFGDLLVSDKSKDIGSSKQEVSIDENKVD
GFSSMLKEWKYAPSHPKDLILGDSEQDDTYTNTEEELEGRPPKRRRLHWTHQQILTIFKANEKLIRVKRKSGEEERLSEWPHFKDKPIERPLTRKHRQTHASAHA
HPCHARQHAANLTALMPFTRCHPPTPVPAVSARALTPLHAQASARHAVTNTHTCAHRTLISTPAAHTARPAPAHIRNHPTAQRPRRPHHATHQAPARPHASALIA
RQHALPQRPRARPRASACPNAQTSASAPLAQRSCACVHRANEEPTMVKRKRGEEERSSKWLHFKDKPIERPLARKHRQSHALRVRTPAANLTTPMPAHAAARPLL
CQTPLPACQHSLHAQAPEHPVTTHAPYRHSRAYAATSAHARARHTFKTSLPHITNASAAQRQRPAAHRQHPYRASLAPVPVPMRTPRAPAPAPNAHTARQARLPQ
RPYRMPSAPAPTPRAHAARPVRLPQRPATMPHAQRAPLDVYERSPPLPAMPCRPLLPNKECLSL

Moc04g22880 (gene) of Bitter gourd (OHB3-1) v2 genome