; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0010331 (gene) of Snake gourd v1 genome

Gene IDTan0010331
OrganismTrichosanthes anguina (Snake gourd v1)
Descriptionhistone-lysine N-methyltransferase SETD1B-like
Genome locationLG08:75479613..75481399
RNA-Seq ExpressionTan0010331
SyntenyTan0010331
Gene Ontology termsNA
InterPro domainsIPR007789 - Protein of unknown function DUF688


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6607361.1 hypothetical protein SDJN03_00703, partial [Cucurbita argyrosperma subsp. sororia]7.3e-4858.45Show/hide
Query:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS
        +S DFGG  G+M+LK+LKTR+D+  V+EDYHTGV+A+VPF+WE+EPGTPKANF++   G L+SPLTPPPSY+ S       P   P  H  N+N  P+ S
Subjt:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS

Query:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK
          NFL +VF+KLSV KA L PLS  S SSS+SST  T +   R R P+RLSFDSR      EDE+EEE+N +SPVSTLFF    GRGGG++DKG  CYPK
Subjt:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK

Query:  LVKVFTR
        LVKVF++
Subjt:  LVKVFTR

XP_022949317.1 uncharacterized protein LOC111452704 [Cucurbita moschata]3.3e-4858.45Show/hide
Query:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS
        +S DFGG  G+M+LK+LKTR+D+  V+EDYHTGV+A+VPF+WE+EPGTPKANF++   G L+SPLTPPPSY+ S       P   P  H  N+N  P+ S
Subjt:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS

Query:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK
          NFL +VF+KLSV KA L PLS  S SSS+SST+ T +   R R P+RLSFDSR      EDE+EEE+N +SPVSTLFF    GRGGG++DKG  CYPK
Subjt:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK

Query:  LVKVFTR
        LVKVF++
Subjt:  LVKVFTR

XP_022997732.1 uncharacterized protein LOC111492604 [Cucurbita maxima]7.3e-4857.97Show/hide
Query:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS
        +S +FGG  G+M+LK+LKTR+D+  V+EDYHTGV+A+VPF+WE+EPGTPKANF++   G L+SPLTPPPSY+ S       P   P  H  N+N  P+ S
Subjt:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS

Query:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK
          NFL +VF+KLSV KA L PLS  S SSS+SST+ T +   R R P+RLSFDSR      EDE+EEE+N +SPVSTLFF    GRGGG++DKG  CYPK
Subjt:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK

Query:  LVKVFTR
        LVKVF++
Subjt:  LVKVFTR

XP_023519368.1 uncharacterized protein LOC111782803 [Cucurbita pepo subsp. pepo]1.2e-4763.59Show/hide
Query:  KLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKL
        KLK L+TR+DMWIVEEDYHTGV+ASVPF WE+EPGTPKANF E   G  +SPLTPPPS YFS    SPL L         ++SKP+    +FLN VFRKL
Subjt:  KLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKL

Query:  SVKATLQPLSLASLSSSSSSTSTTPTSSGRERG----PKRLSFDSREDED--EEEDNVESPVSTLFFGRGGGRGGGATDKGCYPKLVKVFTRDSK
        S+KA+LQP S  SL SSSSS      SS RERG    P+RLSFDSR D+D   EE+NVESPVSTL FG G       TDKGCYPKL KVFTRDSK
Subjt:  SVKATLQPLSLASLSSSSSSTSTTPTSSGRERG----PKRLSFDSREDED--EEEDNVESPVSTLFFGRGGGRGGGATDKGCYPKLVKVFTRDSK

XP_038894794.1 uncharacterized protein LOC120083212 [Benincasa hispida]2.5e-4860.68Show/hide
Query:  KSSSDFGGGGR-MKLKNLKTREDM-WIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPY
        ++S D GG  R M+LK L+TR+DM ++ EEDYHTGV+ASVPF WE+EPGTPKANF E   G ++SPLTPPPSY+ +  + +  PL       ++ +SKP 
Subjt:  KSSSDFGGGGR-MKLKNLKTREDM-WIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPY

Query:  SSTTNFLNTVFRKLSVKATLQPLSLA-SLSSSSSSTSTTPTSSGRERGPKRLSFDSREDEDEEED--NVESPVSTLFFGRGGGRGGGATDKGCYPKLVKV
        SS +NFLN+VFRKLSVK TLQP S A SLSSSSSSTS+  +   R   P+RLSFDSR D+D+ +D  NVESPVSTLFFG G       +DKGCYPKLVKV
Subjt:  SSTTNFLNTVFRKLSVKATLQPLSLA-SLSSSSSSTSTTPTSSGRERGPKRLSFDSREDEDEEED--NVESPVSTLFFGRGGGRGGGATDKGCYPKLVKV

Query:  FTRDSK
        FTRDSK
Subjt:  FTRDSK

TrEMBL top hitse value%identityAlignment
A0A5D3BF70 NADPH oxidase activator5.3e-4454.72Show/hide
Query:  KSSSDFGGG--GRMKLKNLKTREDM---WIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNS
        ++S + GGG  G+M+LK L+TR+DM    + EEDYHTG++ASVPF WE+EPGTPKAN  + N G L+SPLTPPPSY+ +    +  P+        + +S
Subjt:  KSSSDFGGG--GRMKLKNLKTREDM---WIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNS

Query:  KPYSSTTNFLNTVFRKLSVKATLQPLSLASLSSSSSSTSTTPTSSGRERG-PKRLSFDSREDEDEEED-----NVESPVSTLFFGRGGGRGGGATDKGCY
        KP  +  + LNTVFR LSVK TLQP S AS SSSS      PT   R  G P+RLSFDSR D+D+E+D     NVESPVSTLFFGRG       ++KGCY
Subjt:  KPYSSTTNFLNTVFRKLSVKATLQPLSLASLSSSSSSTSTTPTSSGRERG-PKRLSFDSREDEDEEED-----NVESPVSTLFFGRGGGRGGGATDKGCY

Query:  PKLVKVFTRDSK
        P LVKVFTR SK
Subjt:  PKLVKVFTRDSK

A0A6J1GBP3 uncharacterized protein LOC1114527041.6e-4858.45Show/hide
Query:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS
        +S DFGG  G+M+LK+LKTR+D+  V+EDYHTGV+A+VPF+WE+EPGTPKANF++   G L+SPLTPPPSY+ S       P   P  H  N+N  P+ S
Subjt:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS

Query:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK
          NFL +VF+KLSV KA L PLS  S SSS+SST+ T +   R R P+RLSFDSR      EDE+EEE+N +SPVSTLFF    GRGGG++DKG  CYPK
Subjt:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK

Query:  LVKVFTR
        LVKVF++
Subjt:  LVKVFTR

A0A6J1HLP7 uncharacterized protein LOC1114647332.1e-4561.03Show/hide
Query:  KLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKL
        KLK ++TR+DMWIVEEDYHTGV+ASVPF WE+EPGTPKANF E   G  +SPLTPPPS YFS    SPL L          NS       +FLN VFRKL
Subjt:  KLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKL

Query:  SVKATLQPLSLASLSSSSSSTSTTPTSSGRERG----PKRLSFDSREDED--EEEDNVESPVSTLFFGRGGGRGGGATDKGCYPKLVKVFTRDSK
        S+KA+LQP S  SL SSSSS      SS RERG    P+RLSFDSR D+D   +E+NVESPVSTL FG G        DKGCYP LVKVF RDSK
Subjt:  SVKATLQPLSLASLSSSSSSTSTTPTSSGRERG----PKRLSFDSREDED--EEEDNVESPVSTLFFGRGGGRGGGATDKGCYPKLVKVFTRDSK

A0A6J1I3P2 uncharacterized protein LOC1114693813.9e-4762.56Show/hide
Query:  KLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKL
        KLK ++TR+DMWIVEEDYHTGV+ASVPF WE+EPGTPKANF E   G  +SPLTPPPS YFS    SPL L         ++SKP+    +FLN VFRKL
Subjt:  KLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKL

Query:  SVKATLQPLSLASLSSSSSSTSTTPTSSGRERG----PKRLSFDSREDED--EEEDNVESPVSTLFFGRGGGRGGGATDKGCYPKLVKVFTRDSK
        S+KA+LQP S  SL SSSSS     +SS RERG    P+RLSFDSR D+D   EE+NVESPVSTL FG G        D+GCYPKLVKVFTRDSK
Subjt:  SVKATLQPLSLASLSSSSSSTSTTPTSSGRERG----PKRLSFDSREDED--EEEDNVESPVSTLFFGRGGGRGGGATDKGCYPKLVKVFTRDSK

A0A6J1K5W9 uncharacterized protein LOC1114926043.5e-4857.97Show/hide
Query:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS
        +S +FGG  G+M+LK+LKTR+D+  V+EDYHTGV+A+VPF+WE+EPGTPKANF++   G L+SPLTPPPSY+ S       P   P  H  N+N  P+ S
Subjt:  SSSDFGGG-GRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSS

Query:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK
          NFL +VF+KLSV KA L PLS  S SSS+SST+ T +   R R P+RLSFDSR      EDE+EEE+N +SPVSTLFF    GRGGG++DKG  CYPK
Subjt:  TTNFLNTVFRKLSV-KATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSR------EDEDEEEDNVESPVSTLFFGRGGGRGGGATDKG--CYPK

Query:  LVKVFTR
        LVKVF++
Subjt:  LVKVFTR

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G06930.1 unknown protein4.2e-0932.8Show/hide
Query:  VEEDYHTGVAASVPFMWETEPGTPKANFKEINEG----------LLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKLSVK
        VE DY+ G +A+VPF WE++PGTP+   K  +             + +PLTPPPSY+++  SPS           S  +  P  +     NT+F  L  K
Subjt:  VEEDYHTGVAASVPFMWETEPGTPKANFKEINEG----------LLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKLSVK

Query:  ATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSREDEDEEEDNVESPVSTLFFGRGGGRGGG---ATDKGCYPKLVKVFTR
            P S A  SSSSSS+S+ P+S      P R S            ++ +   +++F  G     G   A   GCY  LVKV  R
Subjt:  ATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSREDEDEEEDNVESPVSTLFFGRGGGRGGG---ATDKGCYPKLVKVFTR

AT2G40475.1 unknown protein2.0e-1139.33Show/hide
Query:  YHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKLSVKATLQPLSLASLSSS
        Y+ G  ASVPF+WET PGTPK      +E L + PLTPPPSYY S++S          S N  S ++     T F+ T+  +   + +    S +S SSS
Subjt:  YHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLNTVFRKLSVKATLQPLSLASLSSS

Query:  SSSTSTTPTSSGRERGPKRLSFDSR---EDEDEEEDNVESPVSTLFFGRG
        S S+S+ P  S  E  P++    SR   +++DEEE    SP STL + RG
Subjt:  SSSTSTTPTSSGRERGPKRLSFDSR---EDEDEEEDNVESPVSTLFFGRG

AT3G56260.2 unknown protein1.2e-0835.06Show/hide
Query:  EDMWIVEED---YHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLN-TVFRKL----
        ED + ++E+   Y+ G  AS+PF+WE+ PGTPK +    ++  L  PLTPPPSYY S    +P            + SK  S  + FL+ ++F  L    
Subjt:  EDMWIVEED---YHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLN-TVFRKL----

Query:  --SVKATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSRED----EDEEEDNVESPVSTLFFGRGGGRG
          S K      S +S SSSSS +S+ P S       KR+S D +        EE++   SP STL    GG  G
Subjt:  --SVKATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSRED----EDEEEDNVESPVSTLFFGRGGGRG

AT5G01790.1 unknown protein1.6e-0548.84Show/hide
Query:  YHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYY
        Y+ G A +VPF WE+ PGTPK    E+     + PLTPPPS++
Subjt:  YHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYY


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCAACAAAAAAATCATCAAGTGATTTTGGGGGAGGAGGGAGAATGAAGCTGAAAAACCTGAAAACAAGAGAGGACATGTGGATTGTGGAAGAAGATTACCATACAGG
AGTAGCAGCGTCAGTGCCATTCATGTGGGAGACTGAACCAGGCACTCCCAAGGCAAATTTCAAAGAAATTAATGAGGGACTCCTAATTTCTCCTCTCACGCCCCCACCTT
CCTATTATTTCTCAGCCACCTCACCCAGCCCTCTCCCCCTCCCCCTCCCCCTCAGCCATAATTCTAATTCTAATTCTAAGCCATATTCCTCTACAACCAATTTCCTCAAC
ACCGTTTTCAGGAAGCTTTCTGTCAAGGCCACTCTTCAGCCTCTTTCCCTGGCTTCGTTATCCTCATCGTCTTCGTCTACGTCTACAACACCGACGAGCTCTGGGAGGGA
AAGAGGCCCGAAAAGATTGTCATTTGATTCGAGGGAGGACGAGGACGAAGAAGAGGATAATGTAGAATCACCTGTTTCTACTTTGTTCTTTGGGCGTGGAGGAGGAAGAG
GAGGAGGAGCAACTGATAAAGGATGCTATCCAAAGTTGGTCAAGGTATTCACCAGGGATTCTAAATGA
mRNA sequenceShow/hide mRNA sequence
TGATTTGAAATTTCAACAATGAGTTAAATTGATTGAATATTTGTGTGCTTAAAAATGTATGGACTAGAAAGGAGAGAGGCATTGTAGTTTGGTGAAGGATTGTGTAGGGT
AAAAGATCAGGTGCCAATAAAGTAGGGAAACAGGAAGACCACAAAAACAGAGGGGTTTGTGAAATGATCCATTGGTTTGGTGGTAGTGGTGGTAACAATTAGCATATTGA
TGGAGGCTGAGGCATGGATGGTTTTGTGTTGCCATTTCTTTCTCCCCAAAAAGAAGGCAAAGACAATAATAGGATTATTGAAGAGTTCTCAGTTACCTTACCATCTGTAA
TGTCAATGGCTTATAATATGGATATATTCAAGAAACAACAATAATTGCAGCAGCAGCAGCAGATCGAATGAATTTCTTTTCCACGGCTACCCATTAGAAGAAGAGCAGAG
AGGCAGAGGAAGAAGAAGAAGGTGGAATTATTTATGGCAACAAAAAAATCATCAAGTGATTTTGGGGGAGGAGGGAGAATGAAGCTGAAAAACCTGAAAACAAGAGAGGA
CATGTGGATTGTGGAAGAAGATTACCATACAGGAGTAGCAGCGTCAGTGCCATTCATGTGGGAGACTGAACCAGGCACTCCCAAGGCAAATTTCAAAGAAATTAATGAGG
GACTCCTAATTTCTCCTCTCACGCCCCCACCTTCCTATTATTTCTCAGCCACCTCACCCAGCCCTCTCCCCCTCCCCCTCCCCCTCAGCCATAATTCTAATTCTAATTCT
AAGCCATATTCCTCTACAACCAATTTCCTCAACACCGTTTTCAGGAAGCTTTCTGTCAAGGCCACTCTTCAGCCTCTTTCCCTGGCTTCGTTATCCTCATCGTCTTCGTC
TACGTCTACAACACCGACGAGCTCTGGGAGGGAAAGAGGCCCGAAAAGATTGTCATTTGATTCGAGGGAGGACGAGGACGAAGAAGAGGATAATGTAGAATCACCTGTTT
CTACTTTGTTCTTTGGGCGTGGAGGAGGAAGAGGAGGAGGAGCAACTGATAAAGGATGCTATCCAAAGTTGGTCAAGGTATTCACCAGGGATTCTAAATGAAAACAGATC
TTCTCATCATCATCAACATCTTTTATATATATATAAATATACAGAAATTAATAATATATGTGATCAGTTGCAGTTTTTATAACTTTTTAGGGAGAGCTTTTTTCCTTCTT
CTTGTTTTCTCCCATATATTGAGAAAACATGCCCTCTCTGATCTCTCTCTTGATGAGAAGAGCTTCACATGTTGTTCACAATCACAATGTTCTAATTTCATAAAGAAATA
TGCATGCATGCACATATTCCAATTCCA
Protein sequenceShow/hide protein sequence
MATKKSSSDFGGGGRMKLKNLKTREDMWIVEEDYHTGVAASVPFMWETEPGTPKANFKEINEGLLISPLTPPPSYYFSATSPSPLPLPLPLSHNSNSNSKPYSSTTNFLN
TVFRKLSVKATLQPLSLASLSSSSSSTSTTPTSSGRERGPKRLSFDSREDEDEEEDNVESPVSTLFFGRGGGRGGGATDKGCYPKLVKVFTRDSK