CuGenDBv2

Gene ID	Tan0001687
Organism	Trichosanthes anguina (Snake gourd v1)
Description	SWIM-type domain-containing protein
Genome location	LG01:42021746..42023315
RNA-Seq Expression	Tan0001687
Synteny	Tan0001687
Gene Ontology terms	GO:0044238 - primary metabolic process (biological process) GO:0044260 - cellular macromolecule metabolic process (biological process) GO:0008270 - zinc ion binding (molecular function) GO:0016798 - hydrolase activity, acting on glycosyl bonds (molecular function)
InterPro domains	IPR004332 - Transposase, MuDR, plant IPR007527 - Zinc finger, SWIM-type

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8809571.1 hypothetical protein D1007_13864 [Hordeum vulgare]

3.0e-20

26.94

Show/hide

Query:  DMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLDRF
        +M  ++F + + F +   L+ AI+ Y +K    +++I NDK RV   C G C W L A+     N+  +K Y+GEHTC RE+  + +T+  +A  Y++ F
Subjt:  DMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLDRF

Query:  RSQPDWSL---AKIIEEEYNNVYTK-------------KHG----KYN---------------------------------------NMDKE-----LGS
        R+    SL    ++++ +YN + T+              HG    +YN                                       N++ E     +  
Subjt:  RSQPDWSL---AKIIEEEYNNVYTK-------------KHG----KYN---------------------------------------NMDKE-----LGS

Query:  RILEKLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTCGVWQLSGIHCPHVIQCIYYVKKNPE
        +I +KL K+   S       AG ++F V+    +Y V+I+K  C+C  WQLSGI C H + C+ Y +  PE
Subjt:  RILEKLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTCGVWQLSGIHCPHVIQCIYYVKKNPE

PKI34156.1 hypothetical protein CRG98_045435 [Punica granatum]

6.0e-21

31.13

Show/hide

Query:  PEIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQ-CKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMY
        P++DM+   F V L F    +L+ AI+ ++  +  +++F  ND+ +V   C  + C W+L+AS + ND+T+ IKT  G H C R+       S+ +A  Y
Subjt:  PEIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQ-CKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMY

Query:  LDRFRSQPDWSLAKIIEEEYNNVYTKKHGKYNNMDKELGSRILEKLAKSKTASRKVIPRWAGNNMFEVE-SGNIQYFVDIEKRICTCGVWQLSGIHCPHV
         DR ++ PDW                              + LE L   K  S   I  W G+  FE E S   +  V+++ R C+C  WQL+GI C H 
Subjt:  LDRFRSQPDWSLAKIIEEEYNNVYTKKHGKYNNMDKELGSRILEKLAKSKTASRKVIPRWAGNNMFEVE-SGNIQYFVDIEKRICTCGVWQLSGIHCPHV

Query:  IQCIYYVKKNPE
        I  I+Y+ + PE
Subjt:  IQCIYYVKKNPE

XP_020087512.1 uncharacterized protein LOC109709617 [Ananas comosus]

8.6e-20

41.12

Show/hide

Query:  MNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLDRFR
        M  ++F+V +RF S   LK+AI+ Y+I N + ++F  NDK RV  +C   C W ++A+V++++ T+Q+K+Y  +H CS++FVN+ +TS+ +AK YL+R +
Subjt:  MNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLDRFR

Query:  SQPDWSL
          P W L
Subjt:  SQPDWSL

XP_028052320.1 uncharacterized protein LOC114256842 [Camellia sinensis]

8.6e-20

27.7

Show/hide

Query:  PEIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYL
        PE D  + +F++ + F +    KDA++ YA+K  Y+V+F  ++  +V   CS  C+WRL+AS +  +NT+QIKTY   HTC+R + +R +TS+ +A  Y+
Subjt:  PEIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYL

Query:  DRFRSQPDWSLAK---------IIEEEYNNVYTKKHGKYNNMDKELGSRILE------KLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTC
        ++FR+ P W + +         ++E      Y  +      +D     +  +      +L ++   SR  I  W      +  S  +   +D  +R+   
Subjt:  DRFRSQPDWSLAK---------IIEEEYNNVYTKKHGKYNNMDKELGSRILE------KLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTC

Query:  GVWQLSGIHCPHV
        GV  L G+   H+
Subjt:  GVWQLSGIHCPHV

XP_028081740.1 uncharacterized protein LOC114283107 [Camellia sinensis]

8.3e-23

25.17

Show/hide

Query:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD
        ++D+ +I+F++ + F +    K+ +  YA+K  Y+V+F  ++  +V   CS  C+W+L+AS +  +NT+QIKTY   HTC+R + NR +TSS +A  Y++
Subjt:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD

Query:  RFRSQPDWSLAKI---------------------------IEEEYNNVYTKK------------------------------------------------
        +FR+ P W + +                            IE      YTK+                                                
Subjt:  RFRSQPDWSLAKI---------------------------IEEEYNNVYTKK------------------------------------------------

Query:  ---------------------HGKYNNMDKELGSRILEKLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTCGVWQLSGIHCPHVIQCIYYV
                               K     + + + I  K+ K+K  S   IP W+G   FEV  G   Y V++E R CTC  W L+GI  PHV+  I++ 
Subjt:  ---------------------HGKYNNMDKELGSRILEKLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTCGVWQLSGIHCPHVIQCIYYV

Query:  KK
        K+
Subjt:  KK

TrEMBL top hits

e value

%identity

Alignment

A0A251PFQ5 ZnF_PMZ domain-containing protein

7.1e-20

42.45

Show/hide

Query:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD
        + DM++  F V ++FPS KVLK AI++Y    +Y  + + NDK R++  C   CKWRL+AS+++ +NT QIK+Y  +H+CS+ F N+NITS+ +++ Y+ 
Subjt:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD

Query:  RFRSQP
        R +  P
Subjt:  RFRSQP

A0A5E4G990 PREDICTED: transposon

7.1e-20

42.45

Show/hide

Query:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD
        + DM++  F V ++FPS KVLK AI++Y    +Y  + + NDK R++  C   CKWRL+AS+++ +NT QIK+Y  +H+CS+ F N+NITS+ +++ Y+ 
Subjt:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD

Query:  RFRSQP
        R +  P
Subjt:  RFRSQP

A0A6P5EVI6 uncharacterized protein LOC109709617

4.2e-20

41.12

Show/hide

Query:  MNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLDRFR
        M  ++F+V +RF S   LK+AI+ Y+I N + ++F  NDK RV  +C   C W ++A+V++++ T+Q+K+Y  +H CS++FVN+ +TS+ +AK YL+R +
Subjt:  MNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLDRFR

Query:  SQPDWSL
          P W L
Subjt:  SQPDWSL

A0A6V7QX45 SWIM-type domain-containing protein

1.4e-23

30.14

Show/hide

Query:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD
        E DM +  F + + F S K  + AI+ Y+IKN YN++ + N+K +V  +C   C W ++AS I    T+Q+K Y  EH C + F N+ +TSS +AK Y+D
Subjt:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD

Query:  RFRSQPDWSLAKIIEEEYNNVYTKKHGKYNNMDKELGSRILEKLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTCGVWQLSGIHCPHVIQC
        RFR+ P W L                        E  +  +  L K      +++        F+  S + Q+ VD+ ++ C+C  W L+G+  PH I  
Subjt:  RFRSQPDWSLAKIIEEEYNNVYTKKHGKYNNMDKELGSRILEKLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTCGVWQLSGIHCPHVIQC

Query:  IYYVKKNPE
        + +    P+
Subjt:  IYYVKKNPE

M5X0G1 ZnF_PMZ domain-containing protein (Fragment)

7.1e-20

42.45

Show/hide

Query:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD
        + DM++  F V ++FPS KVLK AI++Y    +Y  + + NDK R++  C   CKWRL+AS+++ +NT QIK+Y  +H+CS+ F N+NITS+ +++ Y+ 
Subjt:  EIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLD

Query:  RFRSQP
        R +  P
Subjt:  RFRSQP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCCTGAGATTGACATGAACCATATTGATTTTAGAGTGAGACTGAGGTTTCCTAGCCCAAAAGTCCTGAAAGATGCCATAAAATTGTATGCAATTAAGAATGCTTACAA
TGTGAGGTTCATTAATAATGATAAGGTGAGGGTCACTACTATTTGTTCTGGGCAATGCAAATGGAGATTGCATGCAAGTGTTATTGAGAATGATAACACTATTCAGATTA
AGACCTACATAGGTGAACATACATGTAGTAGGGAGTTTGTGAATCGAAACATTACTTCTAGTTCGATTGCTAAGATGTACTTGGATCGGTTTAGGAGCCAGCCAGATTGG
TCTCTTGCTAAAATAATTGAGGAGGAATATAATAATGTGTACACTAAGAAGCATGGTAAATATAACAACATGGATAAAGAACTTGGTAGTAGAATTCTAGAAAAGTTGGC
AAAGAGTAAAACTGCTTCTAGGAAAGTCATACCTCGTTGGGCTGGAAATAACATGTTTGAGGTGGAGTCTGGTAATATTCAGTATTTTGTGGACATTGAGAAGCGGATTT
GTACATGTGGTGTATGGCAGTTAAGTGGGATTCATTGCCCTCATGTTATCCAATGCATCTATTATGTGAAAAAAAATCCTGAATAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MPEIDMNHIDFRVRLRFPSPKVLKDAIKLYAIKNAYNVRFINNDKVRVTTICSGQCKWRLHASVIENDNTIQIKTYIGEHTCSREFVNRNITSSSIAKMYLDRFRSQPDW
SLAKIIEEEYNNVYTKKHGKYNNMDKELGSRILEKLAKSKTASRKVIPRWAGNNMFEVESGNIQYFVDIEKRICTCGVWQLSGIHCPHVIQCIYYVKKNPE

Tan0001687 (gene) of Snake gourd v1 genome