CuGenDBv2

Gene ID	Moc04g17250
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Transposon Ty3-I Gag-Pol polyprotein
Genome location	chr4:12724922..12725302
RNA-Seq Expression	Moc04g17250
Synteny	Moc04g17250
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022150317.1 uncharacterized protein LOC111018514 [Momordica charantia]

5.7e-19

46.56

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQ--GEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEP---SLVLQISD
        MMLN A NG+  +K+ NEIVDIL  +   N+    +  +  PKKQ  AGV  LD   S Q +   MNQMLK+  +E+  K+A     +P   S V QI++
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQ--GEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEP---SLVLQISD

Query:  ISCVYCGDNHLYENRPANPASIFYVGQGAQR
        I C YC DNH+YEN P NPAS +YVG G  R
Subjt:  ISCVYCGDNHLYENRPANPASIFYVGQGAQR

XP_022154847.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111022007 [Momordica charantia]

7.4e-27

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLV
        MMLNTA NGSLLEKS+NEIVDILNKM DINDQGE GRSL KKQVSAG+FELDTVA  QAQ AAMNQMLKQ TMEKETKT TS+ +   L+
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLV

XP_022158314.1 uncharacterized protein LOC111024824 [Momordica charantia]

5.3e-49

84.92

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY
        MMLNTA N SL EKSI+EI+DILNKMTD NDQGEIGRSLPKKQVSA VFELDTVAS QAQ A +NQMLKQ TMEKETKTATS MLEPSL LQISDISCVY
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY

Query:  CGDNHLYENRPANPASIFYVGQGAQR
        CGDN LYEN PANP S+FYVGQ AQR
Subjt:  CGDNHLYENRPANPASIFYVGQGAQR

XP_022158836.1 uncharacterized protein LOC111025302 [Momordica charantia]

4.6e-37

75.63

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY
        MMLNT  NGSLLEKS+NEIVD+LNKMTDINDQGE+GRSLPKKQVS G+FELDTVAS QAQ AAMNQMLKQ TMEKETKT TS + E S +LQISDISCVY
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY

Query:  CGDNHLYENRPANPASIFY
        CG       R  NP S  Y
Subjt:  CGDNHLYENRPANPASIFY

XP_022159127.1 uncharacterized protein LOC111025557 [Momordica charantia]

2.8e-42

76.38

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSV-MLEPSLVLQISDISCV
        MM +TA N SLLEKS+NEI+DILNKM DINDQ E+GRSLPKKQ SAG+FELDTV S QAQ +AM+QMLKQ TM+K  K ATSV +LEPS +LQISDISCV
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSV-MLEPSLVLQISDISCV

Query:  YCGDNHLYENRPANPASIFYVGQGAQR
        YC DNHLYEN  ANPA IFYVGQG QR
Subjt:  YCGDNHLYENRPANPASIFYVGQGAQR

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DAE9 uncharacterized protein LOC111018514

2.8e-19

46.56

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQ--GEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEP---SLVLQISD
        MMLN A NG+  +K+ NEIVDIL  +   N+    +  +  PKKQ  AGV  LD   S Q +   MNQMLK+  +E+  K+A     +P   S V QI++
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQ--GEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEP---SLVLQISD

Query:  ISCVYCGDNHLYENRPANPASIFYVGQGAQR
        I C YC DNH+YEN P NPAS +YVG G  R
Subjt:  ISCVYCGDNHLYENRPANPASIFYVGQGAQR

A0A6J1DMT3 LOW QUALITY PROTEIN: uncharacterized protein LOC111022007

3.6e-27

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLV
        MMLNTA NGSLLEKS+NEIVDILNKM DINDQGE GRSL KKQVSAG+FELDTVA  QAQ AAMNQMLKQ TMEKETKT TS+ +   L+
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLV

A0A6J1DYY9 uncharacterized protein LOC111025557

1.4e-42

76.38

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSV-MLEPSLVLQISDISCV
        MM +TA N SLLEKS+NEI+DILNKM DINDQ E+GRSLPKKQ SAG+FELDTV S QAQ +AM+QMLKQ TM+K  K ATSV +LEPS +LQISDISCV
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSV-MLEPSLVLQISDISCV

Query:  YCGDNHLYENRPANPASIFYVGQGAQR
        YC DNHLYEN  ANPA IFYVGQG QR
Subjt:  YCGDNHLYENRPANPASIFYVGQGAQR

A0A6J1DZ19 uncharacterized protein LOC111024824

2.6e-49

84.92

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY
        MMLNTA N SL EKSI+EI+DILNKMTD NDQGEIGRSLPKKQVSA VFELDTVAS QAQ A +NQMLKQ TMEKETKTATS MLEPSL LQISDISCVY
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY

Query:  CGDNHLYENRPANPASIFYVGQGAQR
        CGDN LYEN PANP S+FYVGQ AQR
Subjt:  CGDNHLYENRPANPASIFYVGQGAQR

A0A6J1E251 uncharacterized protein LOC111025302

2.2e-37

75.63

Show/hide

Query:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY
        MMLNT  NGSLLEKS+NEIVD+LNKMTDINDQGE+GRSLPKKQVS G+FELDTVAS QAQ AAMNQMLKQ TMEKETKT TS + E S +LQISDISCVY
Subjt:  MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVY

Query:  CGDNHLYENRPANPASIFY
        CG       R  NP S  Y
Subjt:  CGDNHLYENRPANPASIFY

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATGTTGAACACTGCAACCAATGGCTCATTGTTAGAAAAGTCGATAAATGAGATCGTTGATATCTTAAACAAGATGACAGACATTAATGACCAAGGCGAAATAGGAAG
GTCATTGCCAAAGAAGCAAGTATCAGCCGGAGTCTTTGAGTTGGACACAGTAGCTTCAACGCAAGCCCAAACGGCGGCTATGAACCAGATGTTAAAGCAGCCGACAATGG
AGAAGGAAACCAAAACCGCCACTTCGGTGATGCTTGAACCGTCTCTTGTTTTACAAATTTCAGATATATCTTGTGTCTATTGTGGTGATAACCACTTGTATGAAAACCGT
CCAGCTAATCCAGCGTCTATTTTCTATGTAGGTCAAGGTGCCCAGCGGTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MMLNTATNGSLLEKSINEIVDILNKMTDINDQGEIGRSLPKKQVSAGVFELDTVASTQAQTAAMNQMLKQPTMEKETKTATSVMLEPSLVLQISDISCVYCGDNHLYENR
PANPASIFYVGQGAQR

Moc04g17250 (gene) of Bitter gourd (OHB3-1) v2 genome