CuGenDBv2

Gene ID	Moc04g17360
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Integrase catalytic domain-containing protein
Genome location	chr4:12794751..12799859
RNA-Seq Expression	Moc04g17360
Synteny	Moc04g17360
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8645659.1 hypothetical protein Csa_020439 [Cucumis sativus]

1.9e-46

41.56

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP +EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK+   G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN HI                   GVG+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAHIGSGILHTSTSS
        GQ+ PI+H G   L  ++ S
Subjt:  GQSLPIAHIGSGILHTSTSS

XP_008448007.1 PREDICTED: uncharacterized protein LOC103490319 isoform X2 [Cucumis melo]

6.2e-45

39.88

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP++EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK    G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN  I                   G+G+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAHIGSGILHTSTSSLKLCNL
        GQ+ P++H G      ++ S  +  L
Subjt:  GQSLPIAHIGSGILHTSTSSLKLCNL

XP_008448008.1 PREDICTED: uncharacterized protein LOC103490319 isoform X3 [Cucumis melo]

2.8e-45

41.29

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP++EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK    G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN  I                   G+G+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAHIG
        GQ+ P++H G
Subjt:  GQSLPIAHIG

XP_011658579.1 uncharacterized protein LOC105436058 [Cucumis sativus]

1.1e-46

42.26

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP +EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK+   G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN HI                   GVG+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAHIG
        GQ+ PI+H G
Subjt:  GQSLPIAHIG

XP_022156563.1 uncharacterized protein LOC111023438 [Momordica charantia]

5.7e-75

60.63

Show/hide

Query:  VPQLNPAFEDWIVKDHALMTVINATLSL-AALAYVVG--------CETSKEVWDTFGEALLIQLLNEYLVIYALNGLTADYNTFRTSMRTREKSVSFEDL
        VPQLNP FEDWI KDHALMTVINAT ++ + L +V           +  KE  D   +   + + +E L+IYALNGLTA YNTFRTSM TREKS +F   
Subjt:  VPQLNPAFEDWIVKDHALMTVINATLSL-AALAYVVG--------CETSKEVWDTFGEALLIQLLNEYLVIYALNGLTADYNTFRTSMRTREKSVSFEDL

Query:  HVLLVSEEAATEKQ--NKRDEVFASPTALLAAS------LLPLAPTGKSSQEGFSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYA
            V    A+ K   +K      +PT   + +      LLPLAPTGKSSQEGFSS I CQICLK GHS LDCFN MNYSFQG HP +QL  MVANHNYA
Subjt:  HVLLVSEEAATEKQ--NKRDEVFASPTALLAAS------LLPLAPTGKSSQEGFSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYA

Query:  TLASSNPSWLTDSGCNAH-------------------IGVGSGQSLPIAHIGSGILHTSTSSLKLCNLLHVPTISSNLLSVHQLCVE
        TLASSNPSWLTDSGCNAH                   IGVG+GQSLPIAH  SGILHTSTSSLKLCNLLHVPTISSNLLSVHQLCV+
Subjt:  TLASSNPSWLTDSGCNAH-------------------IGVGSGQSLPIAHIGSGILHTSTSSLKLCNLLHVPTISSNLLSVHQLCVE

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BI58 uncharacterized protein LOC103490319 isoform X2

3.0e-45

39.88

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP++EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK    G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN  I                   G+G+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAHIGSGILHTSTSSLKLCNL
        GQ+ P++H G      ++ S  +  L
Subjt:  GQSLPIAHIGSGILHTSTSSLKLCNL

A0A1S3BIR3 uncharacterized protein LOC103490319 isoform X3

1.3e-45

41.29

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP++EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK    G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN  I                   G+G+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAHIG
        GQ+ P++H G
Subjt:  GQSLPIAHIG

A0A1S4DWT9 uncharacterized protein LOC103490319 isoform X1

3.0e-45

39.88

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP++EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK    G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN  I                   G+G+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAHIGSGILHTSTSSLKLCNL
        GQ+ P++H G      ++ S  +  L
Subjt:  GQSLPIAHIGSGILHTSTSSLKLCNL

A0A5D3CLI6 T4.5

3.9e-45

41.23

Show/hide

Query:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY
        PQ NP++EDWI KD ALMTVINATLS  ALAYVVG  +SK+VWD   +                                          A +   +NE 
Subjt:  PQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGE------------------------------------------ALLIQLLNEY

Query:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------
         L+IYALNGL  +YNTFRTSMRTR + V+FE+LHVLL +EE+A  KQ+K D+ +  PT LL++  SLL  APT           GK    G         
Subjt:  -LVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAA--SLLPLAPT-----------GKSSQEG---------

Query:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS
                     +   CQIC + GH+ LDCFN MNY+FQG HP  QLA MVA+ N A L+  N S LTDSGCN  I                   G+G+
Subjt:  -----------FSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHI-------------------GVGS

Query:  GQSLPIAH
        GQ+ P++H
Subjt:  GQSLPIAH

A0A6J1DQZ0 uncharacterized protein LOC111023438

2.8e-75

60.63

Show/hide

Query:  VPQLNPAFEDWIVKDHALMTVINATLSL-AALAYVVG--------CETSKEVWDTFGEALLIQLLNEYLVIYALNGLTADYNTFRTSMRTREKSVSFEDL
        VPQLNP FEDWI KDHALMTVINAT ++ + L +V           +  KE  D   +   + + +E L+IYALNGLTA YNTFRTSM TREKS +F   
Subjt:  VPQLNPAFEDWIVKDHALMTVINATLSL-AALAYVVG--------CETSKEVWDTFGEALLIQLLNEYLVIYALNGLTADYNTFRTSMRTREKSVSFEDL

Query:  HVLLVSEEAATEKQ--NKRDEVFASPTALLAAS------LLPLAPTGKSSQEGFSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYA
            V    A+ K   +K      +PT   + +      LLPLAPTGKSSQEGFSS I CQICLK GHS LDCFN MNYSFQG HP +QL  MVANHNYA
Subjt:  HVLLVSEEAATEKQ--NKRDEVFASPTALLAAS------LLPLAPTGKSSQEGFSSRIVCQICLKTGHSTLDCFNIMNYSFQGHHPLVQLAVMVANHNYA

Query:  TLASSNPSWLTDSGCNAH-------------------IGVGSGQSLPIAHIGSGILHTSTSSLKLCNLLHVPTISSNLLSVHQLCVE
        TLASSNPSWLTDSGCNAH                   IGVG+GQSLPIAH  SGILHTSTSSLKLCNLLHVPTISSNLLSVHQLCV+
Subjt:  TLASSNPSWLTDSGCNAH-------------------IGVGSGQSLPIAHIGSGILHTSTSSLKLCNLLHVPTISSNLLSVHQLCVE

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

4.1e-07

32.56

Show/hide

Query:  CQICLKTGHSTLDCFNIMNY--SFQGHHPLVQLAVMVANHNYATLAS-SNPSWLTDSGCNAHIG-------------------VGSGQSLPIAHIGSGIL
        CQIC   GHS   C  + ++  S     P           N A  +  S+ +WL DSG   HI                    V  G ++PI+H GS  L
Subjt:  CQICLKTGHSTLDCFNIMNY--SFQGHHPLVQLAVMVANHNYATLAS-SNPSWLTDSGCNAHIG-------------------VGSGQSLPIAHIGSGIL

Query:  HTSTSSLKLCNLLHVPTISSNLLSVHQLC
         T +  L L N+L+VP I  NL+SV++LC
Subjt:  HTSTSSLKLCNLLHVPTISSNLLSVHQLC

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

2.0e-06

33.59

Show/hide

Query:  CQICLKTGHSTLDCFNIMNYSFQGHHPLVQ-LAVMVANHNYATLASSNP----SWLTDSGCNAHIG-------------------VGSGQSLPIAHIGSG
        CQIC   GHS   C  +  + FQ      Q  +        A LA ++P    +WL DSG   HI                    +  G ++PI H GS 
Subjt:  CQICLKTGHSTLDCFNIMNYSFQGHHPLVQ-LAVMVANHNYATLASSNP----SWLTDSGCNAHIG-------------------VGSGQSLPIAHIGSG

Query:  ILHTSTSSLKLCNLLHVPTISSNLLSVHQLC
         L TS+ SL L  +L+VP I  NL+SV++LC
Subjt:  ILHTSTSSLKLCNLLHVPTISSNLLSVHQLC

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCTAAGGAGTGGAAGTATGCTCCATCCCATCCTAAGGATTTAATTCTTGGTGATCCCGAACAAGGGGAGTGGGAGGTTGCTGTGACGTGCTACCACAAGCACGATCC
TGAGACCCAAGAGGATAGCGAGGAAGATCCGGTGCTGGTGTTCGAGGGGAACTTACCGAAGAAACATGTTCCTCAATTGAATCCGGCGTTTGAAGACTGGATTGTGAAAG
ACCACGCTCTTATGACTGTGATTAACGCCACACTTTCACTGGCTGCTCTAGCCTACGTTGTTGGTTGTGAGACTTCTAAGGAAGTTTGGGATACGTTTGGTGAAGCATTA
CTCATCCAACTCTTGAACGAATACCTTGTCATCTATGCTCTAAACGGCCTCACTGCTGACTATAACACTTTTCGAACATCGATGCGTACTCGTGAGAAGTCTGTGAGTTT
TGAAGATCTTCATGTGTTACTCGTCTCAGAAGAAGCAGCTACTGAAAAGCAGAATAAACGTGATGAAGTTTTCGCTTCTCCTACTGCTCTATTGGCTGCAAGTCTTCTCC
CTCTTGCTCCTACTGGCAAATCATCTCAAGAAGGTTTCTCTTCAAGGATTGTTTGTCAGATTTGCCTGAAAACTGGTCACTCTACATTGGATTGCTTTAATATAATGAAT
TACAGCTTCCAAGGGCATCATCCTCTTGTTCAGTTGGCAGTAATGGTGGCTAATCACAACTATGCCACTCTTGCATCCTCTAATCCCTCGTGGCTTACTGATTCAGGGTG
CAATGCTCATATTGGAGTAGGTAGTGGTCAGTCATTGCCAATTGCCCACATAGGCAGTGGTATTCTTCATACCTCTACCTCTTCTCTAAAACTTTGCAACCTTCTTCATG
TTCCAACTATTTCATCTAATCTTCTTTCCGTTCACCAATTATGTGTTGAAATAATTGCTTTGTTGTTTTCGATTCTACCTCCTCCTTTTTACACTGTTCCTCATTCTTAC
CCGGATGTTCCTGAGTCTGGACTTGAATCTCAGCTTGCACCACATGCTCCTGATATTAGTTCTAATACTACTGCACCTCCTACTAGTTCTCTACATGTTATGTCTGAGCC
TATTGTTGCCCCTATTGCTTCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MPKEWKYAPSHPKDLILGDPEQGEWEVAVTCYHKHDPETQEDSEEDPVLVFEGNLPKKHVPQLNPAFEDWIVKDHALMTVINATLSLAALAYVVGCETSKEVWDTFGEAL
LIQLLNEYLVIYALNGLTADYNTFRTSMRTREKSVSFEDLHVLLVSEEAATEKQNKRDEVFASPTALLAASLLPLAPTGKSSQEGFSSRIVCQICLKTGHSTLDCFNIMN
YSFQGHHPLVQLAVMVANHNYATLASSNPSWLTDSGCNAHIGVGSGQSLPIAHIGSGILHTSTSSLKLCNLLHVPTISSNLLSVHQLCVEIIALLFSILPPPFYTVPHSY
PDVPESGLESQLAPHAPDISSNTTAPPTSSLHVMSEPIVAPIAS

Moc04g17360 (gene) of Bitter gourd (OHB3-1) v2 genome