CuGenDBv2

Gene ID	Lag0011023
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Integrase catalytic domain-containing protein
Genome location	chr1:12356997..12360968
RNA-Seq Expression	Lag0011023
Synteny	Lag0011023
Gene Ontology terms	GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	IPR012337 - Ribonuclease H-like superfamily IPR036397 - Ribonuclease H superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

PON46472.1 hypothetical protein PanWU01x14_251180, partial [Parasponia andersonii]

2.1e-31

31.12

Show/hide

Query:  IRFVNDLARAKYQ-EVLKRDFLFERGF-------GSNLPRFLESGIVNLGWRQFCEKPEPVNSNIVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFD
        ++F  + A  +Y+  +  R    E+GF          LP F+   I    W+QFC  PE     +VREFYANL    +  V +RGV V WS EAIN +F 
Subjt:  IRFVNDLARAKYQ-EVLKRDFLFERGF-------GSNLPRFLESGIVNLGWRQFCEKPEPVNSNIVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFD

Query:  LQDFPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIRLRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSE
        L D P    +E +   +   L   +  V   GA+W VS    +T   + L   A  W  F++ RLLPTTH  TVS+DR+LL  ++L   SI+VG++I SE
Subjt:  LQDFPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIRLRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSE

Query:  IVDCWKKKR---------TQEVRQGGLVYGVNQ---------------------------------------------ILEQLTVLASR-----------
        I  C  +K          T+  R     + VN+                                             IL+QL  L  R           
Subjt:  IVDCWKKKR---------TQEVRQGGLVYGVNQ---------------------------------------------ILEQLTVLASR-----------

Query:  ---LEFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL
           L+   +Q Q +W Y+K RD AL+ ALQ NF+ P   FP FP ++
Subjt:  ---LEFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL

PON78020.1 hypothetical protein PanWU01x14_023740 [Parasponia andersonii]

2.6e-26

33.09

Show/hide

Query:  IVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFDLQD--FPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIR
        +VREFYANL    +  + +RGV V WS EAIN +F L D    H+ F E +  P   +L   +  V   GA+W VS    +T   + L   A  W  F++
Subjt:  IVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFDLQD--FPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIR

Query:  LRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSEIVDCWKKK-----------------------------------RTQEVRQGGLVYGVNQ---
         RLLPTTH   VS+DR+LL  ++L   SI+VG++I SEI  C  +K                                       + Q G      Q   
Subjt:  LRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSEIVDCWKKK-----------------------------------RTQEVRQGGLVYGVNQ---

Query:  --------------ILEQLTVLASRL---EFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL
                      +L+QL  L  RL   E   +Q Q +W Y+K RD AL+ ALQ NF+ P   FP FP ++
Subjt:  --------------ILEQLTVLASRL---EFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL

XP_022841890.1 uncharacterized protein LOC111365565 [Olea europaea var. sylvestris]

1.3e-25

55.26

Show/hide

Query:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPL------GPFVVIAFFPNGAITLQDEKDGRVFKVN
        K+ V H     +I+T YHPQ +GQ E++NREIK ILEK+V+P+RKDWS RL +ALWAYRT +KT L      GPFVV+  F NGA+ ++D  DGRV KVN
Subjt:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPL------GPFVVIAFFPNGAITLQDEKDGRVFKVN

Query:  GQRVKHYWGEEFQA
        GQR+K  +G+   A
Subjt:  GQRVKHYWGEEFQA

XP_031393924.1 uncharacterized protein LOC116205448 [Punica granatum]

1.8e-27

60.4

Show/hide

Query:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLGPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKH
        K+ V H     R+AT YHPQ+NGQAE+SNRE+K+ILEK V+PSRKDWS RLD+ALWAYRT YKTP+GPFVV     NG + +Q+    ++FKVNG R+K 
Subjt:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLGPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKH

Query:  Y
        +
Subjt:  Y

XP_038902507.1 uncharacterized protein LOC120089165 [Benincasa hispida]

1.5e-26

58.77

Show/hide

Query:  RIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPL--------GPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKHY
        R +IAT YHPQ NGQAE+SN+EIK+ILEKVV+ SRKDW+ RLDEALWAYRT YKTPL        GPF++ A FP GA+ L  E     FKVN QRVK Y
Subjt:  RIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPL--------GPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKHY

Query:  WGEEFQAKYPSLRL
        + +  + +  SL L
Subjt:  WGEEFQAKYPSLRL

TrEMBL top hits

e value

%identity

Alignment

A0A1S4A9T0 uncharacterized protein LOC107795262

1.4e-25

53.85

Show/hide

Query:  RIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLGPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKHYWGEEFQAKYP
        ++ T YHPQ +GQA++SN+E+K ILEK V  +RKDW+ +LD+ALWAY T YKTP+GPFVV++   +GA+ L+D      F VNGQRVKHYWG +      
Subjt:  RIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLGPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKHYWGEEFQAKYP

Query:  SLRL
        S+ L
Subjt:  SLRL

A0A1S4CJJ2 uncharacterized protein LOC107819568

3.1e-25

Show/hide

Query:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLG--------PFVVIAFFPNGAITLQDEKDGRVFK
        K+ V H     +++T YHPQ +GQ E+SNRE+K IL+K V  +RKDW+ +L++ALWAYRT YK P+G        PFVV++  P+GA+ L+D     +F 
Subjt:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLG--------PFVVIAFFPNGAITLQDEKDGRVFK

Query:  VNGQRVKHYWGEEF
        VNGQR+KHYWG +F
Subjt:  VNGQRVKHYWGEEF

A0A2P5BCG4 Uncharacterized protein (Fragment)

9.9e-32

31.12

Show/hide

Query:  IRFVNDLARAKYQ-EVLKRDFLFERGF-------GSNLPRFLESGIVNLGWRQFCEKPEPVNSNIVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFD
        ++F  + A  +Y+  +  R    E+GF          LP F+   I    W+QFC  PE     +VREFYANL    +  V +RGV V WS EAIN +F 
Subjt:  IRFVNDLARAKYQ-EVLKRDFLFERGF-------GSNLPRFLESGIVNLGWRQFCEKPEPVNSNIVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFD

Query:  LQDFPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIRLRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSE
        L D P    +E +   +   L   +  V   GA+W VS    +T   + L   A  W  F++ RLLPTTH  TVS+DR+LL  ++L   SI+VG++I SE
Subjt:  LQDFPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIRLRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSE

Query:  IVDCWKKKR---------TQEVRQGGLVYGVNQ---------------------------------------------ILEQLTVLASR-----------
        I  C  +K          T+  R     + VN+                                             IL+QL  L  R           
Subjt:  IVDCWKKKR---------TQEVRQGGLVYGVNQ---------------------------------------------ILEQLTVLASR-----------

Query:  ---LEFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL
           L+   +Q Q +W Y+K RD AL+ ALQ NF+ P   FP FP ++
Subjt:  ---LEFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL

A0A2P5DXM3 Uncharacterized protein

1.3e-26

33.09

Show/hide

Query:  IVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFDLQD--FPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIR
        +VREFYANL    +  + +RGV V WS EAIN +F L D    H+ F E +  P   +L   +  V   GA+W VS    +T   + L   A  W  F++
Subjt:  IVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFDLQD--FPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIR

Query:  LRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSEIVDCWKKK-----------------------------------RTQEVRQGGLVYGVNQ---
         RLLPTTH   VS+DR+LL  ++L   SI+VG++I SEI  C  +K                                       + Q G      Q   
Subjt:  LRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSEIVDCWKKK-----------------------------------RTQEVRQGGLVYGVNQ---

Query:  --------------ILEQLTVLASRL---EFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL
                      +L+QL  L  RL   E   +Q Q +W Y+K RD AL+ ALQ NF+ P   FP FP ++
Subjt:  --------------ILEQLTVLASRL---EFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDL

A0A6P8DHH2 uncharacterized protein LOC116205448

8.7e-28

60.4

Show/hide

Query:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLGPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKH
        K+ V H     R+AT YHPQ+NGQAE+SNRE+K+ILEK V+PSRKDWS RLD+ALWAYRT YKTP+GPFVV     NG + +Q+    ++FKVNG R+K 
Subjt:  KWAVSHSVTRIRIATPYHPQANGQAEISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLGPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKH

Query:  Y
        +
Subjt:  Y

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAACAATCTGTTTATGATCCAATCAATAAACAGCAGTTCCTCTCGGGCCAGGAGAGGATGGGCGCCCTTGTTCAAGACCCGGAATCAGCCCTTAAGGGAACACACATC
TGCTTACCCCAATAGGAGAAGGAGTGAATTCCATCTTGTACTGTTATGTTCCCAGCCCTCATTCGGTCTTGCCCCTGAAATGGATACCCCCACTCGCATGTCTCCTACAT
GGATGCTTTGGATCATTGCATCTATATCGAATACAAAGTGGGCCGTATCACATAGTGTTACCAGGATAAGGATAGCTACCCCTTATCACCCACAAGCAAATGGTCAAGCT
GAAATTAGTAATAGGGAAATTAAAGCTATTTTAGAGAAAGTAGTCCATCCATCTAGAAAGGATTGGTCCTTTAGGTTGGATGAGGCTCTTTGGGCTTACAGGACAACTTA
TAAGACTCCTCTAGGTCCGTTTGTTGTGATTGCGTTTTTCCCCAATGGAGCAATTACTTTGCAGGATGAAAAAGATGGGAGAGTGTTCAAGGTGAATGGACAGCGTGTCA
AGCATTATTGGGGTGAGGAATTTCAGGCGAAGTATCCTTCCCTAAGGTTGGTTCAGAAGATTGTTGCAACAAAGATAATGCTGGAGCAAATGTTCTGCACGAATAGGAAC
GATTTTAATACATTGGTAAGTCTTCTTTCTACTTCGCCTTCTTGTTTCAATCTTGCCATCTACGTTCTTTCTTTCTGCTTTACACTCTCTGCAAAACCCTTTGAGTTATC
TATGGCCAAAACAAGAGCTAGGAAAGAGAGGGAGAGTGAAGAAGAGGAGGTGTCGGTCACGCCGGAAGTGCAAAAAGGGAAAACCAAAAAGAAAAGAACGCCAGAGGAAA
AGGAAGCAAAGAAAAGGAGAAGGCAGCAAAGGGCTGCAGAACAGGAGGAAGTTCAGGAGGTGGCAGACGTTGTTGCCACTACTGCGGAGGAAGGAAGTACTCAAGAACCT
GAAGTACAAAACCCAGATACGGTTCAAGAAAAGATTGCTGAGAAAAATCAAGAAACAGAGGTTGAAGAGCAGGCTGAAGGTGAGCCTAACAAGGAGAAAACACCGGAGCT
GGCGCAGGAGGCTCATGTTGAAGTCATTCTGCCTGAACCGCCCAGACGCCGCCGCATCAAGAGGAAGGCGGGTCGCGTGAGGGTGCTTCGGAACACTCCATCACCTCCGA
CGTCGGACTCTGAGGAAGAAAGAAGGGAAGATGAGAATAAGGAAAAAGAAGAAGAGGCAAGAAAGGCAGAAGAAGAGCGTTTGCGTGAACAGAGAGAAATCAAGGACAAA
GGAATTGCCGAAGCATCGAGAGAAATTGAGGAGCCGAGGGCACCATTCATTCGCTTCGTCAACGATCTTGCTCGAGCAAAATACCAGGAGGTGCTGAAACGGGACTTCTT
GTTCGAACGAGGATTTGGCAGTAATTTGCCCAGGTTCTTGGAGTCTGGAATAGTGAATCTCGGGTGGAGGCAATTTTGTGAGAAACCAGAACCTGTCAATTCCAACATTG
TTCGGGAATTTTACGCCAACCTTGACGTTAAGAATGATTTTGAGGTTATCATTCGCGGAGTGCCTGTACAGTGGAGTCCTGAGGCCATTAATGAATTGTTTGATCTCCAG
GATTTTCCGCATGCCGTTTTTAATGAGATGGTGGTTGCACCATCTAGTGATCAACTGAGTGCGGCTGTCCGGGAGGTAGGCATTGAGGGGGCTCAATGGCGGGTGTCGCA
GACGCGGAAGCATACGTTTCAAGCTGCTTATTTGAAGAGTGAAGCCAACACTTGGATGGGTTTCATCAGGCTACGCTTGCTGCCGACAACACACGACTCCACAGTATCTC
GGGACAGGATATTGCTTGCCTTTGCCATTCTTCGTTCGATGAGTATTGATGTAGGCAAAATTATTTGTTCTGAGATTGTTGATTGCTGGAAAAAGAAGCGTACGCAAGAG
GTTCGCCAAGGTGGGCTTGTGTATGGCGTTAATCAGATCCTAGAGCAACTGACAGTGTTGGCCAGTAGGTTAGAATTTGCTGAAAGGCAAGCTCAGACCTACTGGACTTA
TGCTAAAAGGAGAGATGATGCGCTCAGGGGGGCCTTGCAAACCAATTTCTCAACACCATATCAGGCTTTTCCAGTGTTTCCCGATGATTTGTTTAATCTTTGGATACCAC
CCCCACCTGTTGAACGAGAAGAGGATGTTGATGAGGAGCAGGGTCAGGATGACTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNNLFMIQSINSSSSRARRGWAPLFKTRNQPLREHTSAYPNRRRSEFHLVLLCSQPSFGLAPEMDTPTRMSPTWMLWIIASISNTKWAVSHSVTRIRIATPYHPQANGQA
EISNREIKAILEKVVHPSRKDWSFRLDEALWAYRTTYKTPLGPFVVIAFFPNGAITLQDEKDGRVFKVNGQRVKHYWGEEFQAKYPSLRLVQKIVATKIMLEQMFCTNRN
DFNTLVSLLSTSPSCFNLAIYVLSFCFTLSAKPFELSMAKTRARKERESEEEEVSVTPEVQKGKTKKKRTPEEKEAKKRRRQQRAAEQEEVQEVADVVATTAEEGSTQEP
EVQNPDTVQEKIAEKNQETEVEEQAEGEPNKEKTPELAQEAHVEVILPEPPRRRRIKRKAGRVRVLRNTPSPPTSDSEEERREDENKEKEEEARKAEEERLREQREIKDK
GIAEASREIEEPRAPFIRFVNDLARAKYQEVLKRDFLFERGFGSNLPRFLESGIVNLGWRQFCEKPEPVNSNIVREFYANLDVKNDFEVIIRGVPVQWSPEAINELFDLQ
DFPHAVFNEMVVAPSSDQLSAAVREVGIEGAQWRVSQTRKHTFQAAYLKSEANTWMGFIRLRLLPTTHDSTVSRDRILLAFAILRSMSIDVGKIICSEIVDCWKKKRTQE
VRQGGLVYGVNQILEQLTVLASRLEFAERQAQTYWTYAKRRDDALRGALQTNFSTPYQAFPVFPDDLFNLWIPPPPVEREEDVDEEQGQDD

Lag0011023 (gene) of Sponge gourd (AG-4) v1 genome