CuGenDBv2

Gene ID	Moc02g01000
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	MuDRA-like transposase
Genome location	chr2:812195..813559
RNA-Seq Expression	Moc02g01000
Synteny	Moc02g01000
Gene Ontology terms	GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR004332 - Transposase, MuDR, plant

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022148135.1 uncharacterized protein LOC111016888 [Momordica charantia]

3.1e-52

96.23

Show/hide

Query:  MGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCN
        MGCDGLTGQPNDEKLQ MVQSSGTNDVKEGEVFD KKELSLRMHLVAMRLNFQFK+KKSTPELYILRCVDTSCTWRLRATKLRDCN+FKIKKYYSIHTCN
Subjt:  MGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCN

Query:  GGVLKQ
        GGVLKQ
Subjt:  GGVLKQ

XP_022153146.1 uncharacterized protein LOC111020715 [Momordica charantia]

3.2e-70

93.24

Show/hide

Query:  EEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKK
        EEG Y+AEFVNDDYDDALDEESEPDVEQVHAEI RDEAAVQQMGCDGLTGQ N E LQL+VQSSGTNDVKEGEVFDTKKELSLRMHLV MRLNFQFK+KK
Subjt:  EEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKK

Query:  STPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ
        STPELYIL CVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ
Subjt:  STPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ

XP_022155970.1 uncharacterized protein LOC111022954 [Momordica charantia]

2.3e-92

86.36

Show/hide

Query:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG
        GHDIAGLTPLESDVVPC LGDDRVC WN+PGL NDNQDESDESYD LG+SEEG Y+AEF+NDDYDDA DE+ EPDVEQV  EIRRDE  V QMGCDGL G
Subjt:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG

Query:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ
        QPNDEKLQL+VQSSGTNDVKEG+VFDTKKELSLR HLVAM LNFQFK+KKSTPELYILRCVD+SCTWRLRA KL DCNLFKIKKYYSIHTCNG VLKQ
Subjt:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ

XP_022156328.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111023249 [Momordica charantia]

1.4e-52

63.48

Show/hide

Query:  PGRPKRVLELYAHSLYSPIPETHRFGHDIAGLT----PLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEE
        PG  K   +L  H  +      H    +IA         + +VVPC LGDDRVCDW+VPG+ NDN+DES ESYDPL ES+EGH  AE+ N+++DDALD+E
Subjt:  PGRPKRVLELYAHSLYSPIPETHRFGHDIAGLT----PLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEE

Query:  SEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIK
         EPDVEQVH EIRRDE AV+  GC+GLTG PNDEKLQL+VQSSGTNDV EG+VFD KKELSL+MHLVAMR NFQFKI+
Subjt:  SEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIK

XP_022157017.1 uncharacterized protein LOC111023843 [Momordica charantia]

1.8e-81

76.14

Show/hide

Query:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG
        GHD+ GLTPL SDVVPC LGDDRVCDW+VPG+ NDN+DES ESYDPL  SEEGH  AE+ N+++DDALD+E E DVEQVH EIRRDE AV+  GC+GLTG
Subjt:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG

Query:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLK
         PNDEKLQL+VQSSGTNDV EG+VFD KKELSL+MHLVAMR NFQFK+KKSTP+LYILRCV   CTWRLRATKL++C LFKIKKY + HTC GG LK
Subjt:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLK

TrEMBL top hits

e value

%identity

Alignment

A0A6J1D234 uncharacterized protein LOC111016888

1.5e-52

96.23

Show/hide

Query:  MGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCN
        MGCDGLTGQPNDEKLQ MVQSSGTNDVKEGEVFD KKELSLRMHLVAMRLNFQFK+KKSTPELYILRCVDTSCTWRLRATKLRDCN+FKIKKYYSIHTCN
Subjt:  MGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCN

Query:  GGVLKQ
        GGVLKQ
Subjt:  GGVLKQ

A0A6J1DJT1 uncharacterized protein LOC111020715

1.6e-70

93.24

Show/hide

Query:  EEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKK
        EEG Y+AEFVNDDYDDALDEESEPDVEQVHAEI RDEAAVQQMGCDGLTGQ N E LQL+VQSSGTNDVKEGEVFDTKKELSLRMHLV MRLNFQFK+KK
Subjt:  EEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKK

Query:  STPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ
        STPELYIL CVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ
Subjt:  STPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ

A0A6J1DP00 uncharacterized protein LOC111022954

1.1e-92

86.36

Show/hide

Query:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG
        GHDIAGLTPLESDVVPC LGDDRVC WN+PGL NDNQDESDESYD LG+SEEG Y+AEF+NDDYDDA DE+ EPDVEQV  EIRRDE  V QMGCDGL G
Subjt:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG

Query:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ
        QPNDEKLQL+VQSSGTNDVKEG+VFDTKKELSLR HLVAM LNFQFK+KKSTPELYILRCVD+SCTWRLRA KL DCNLFKIKKYYSIHTCNG VLKQ
Subjt:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQ

A0A6J1DQB9 Reverse transcriptase

6.6e-53

63.48

Show/hide

Query:  PGRPKRVLELYAHSLYSPIPETHRFGHDIAGLT----PLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEE
        PG  K   +L  H  +      H    +IA         + +VVPC LGDDRVCDW+VPG+ NDN+DES ESYDPL ES+EGH  AE+ N+++DDALD+E
Subjt:  PGRPKRVLELYAHSLYSPIPETHRFGHDIAGLT----PLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEE

Query:  SEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIK
         EPDVEQVH EIRRDE AV+  GC+GLTG PNDEKLQL+VQSSGTNDV EG+VFD KKELSL+MHLVAMR NFQFKI+
Subjt:  SEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIK

A0A6J1DTG5 uncharacterized protein LOC111023843

8.9e-82

76.14

Show/hide

Query:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG
        GHD+ GLTPL SDVVPC LGDDRVCDW+VPG+ NDN+DES ESYDPL  SEEGH  AE+ N+++DDALD+E E DVEQVH EIRRDE AV+  GC+GLTG
Subjt:  GHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDPLGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTG

Query:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLK
         PNDEKLQL+VQSSGTNDV EG+VFD KKELSL+MHLVAMR NFQFK+KKSTP+LYILRCV   CTWRLRATKL++C LFKIKKY + HTC GG LK
Subjt:  QPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKSTPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTCAATCCCGGATCGAAAGATGGTTCGGGAGTGAACCGGGATACATCCCGGACCAATAGAAGCACTGTGGTCCGGGATGTGTCTCGGACCAAGACTGGTCCG
GGACGGCCAAAACGTGTGCTCGAGTTGTATGCCCACAGCTTGTATTCCCCCATTCCAGAGACCCACAGATTCGGTCATGATATAGCTGGTTTAACACCATTGGAA
TCAGATGTTGTTCCATGTAAGCTAGGAGATGACAGGGTATGTGATTGGAATGTGCCGGGATTATTGAATGATAATCAAGATGAAAGTGATGAATCATATGACCCG
TTGGGAGAGTCAGAAGAAGGACACTATGATGCGGAATTTGTGAATGATGACTATGACGATGCACTTGATGAAGAGTCTGAGCCCGATGTGGAACAGGTACATGCT
GAGATTCGTAGGGATGAAGCAGCCGTTCAACAAATGGGGTGTGATGGTCTCACTGGGCAGCCTAATGATGAGAAGTTGCAACTCATGGTACAGTCTTCTGGAACA
AATGATGTTAAGGAGGGCGAAGTATTTGATACGAAGAAGGAGTTGAGTTTGAGAATGCATTTAGTTGCAATGCGGCTGAATTTTCAGTTTAAAATAAAAAAGTCG
ACACCGGAACTATATATACTACGCTGCGTTGATACTAGTTGCACCTGGAGACTTCGAGCTACAAAGTTGAGGGACTGCAATCTGTTCAAGATAAAAAAATACTAT
AGCATCCATACATGCAATGGTGGAGTTTTGAAACAGATCATAGGCAAGCCAAAAGTTGGGTGGTCGGACATCTTGTCCAAGCGAAGTTTACAGACGTCTCCCGCA
CGTATAGACCGAAGGACATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFNPGSKDGSGVNRDTSRTNRSTVVRDVSRTKTGPGRPKRVLELYAHSLYSPIPETHRFGHDIAGLTPLESDVVPCKLGDDRVCDWNVPGLLNDNQDESDESYDP
LGESEEGHYDAEFVNDDYDDALDEESEPDVEQVHAEIRRDEAAVQQMGCDGLTGQPNDEKLQLMVQSSGTNDVKEGEVFDTKKELSLRMHLVAMRLNFQFKIKKS
TPELYILRCVDTSCTWRLRATKLRDCNLFKIKKYYSIHTCNGGVLKQIIGKPKVGWSDILSKRSLQTSPARIDRRT

Moc02g01000 (gene) of Bitter gourd (OHB3-1) v2 genome