; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0012451 (gene) of Snake gourd v1 genome

Gene IDTan0012451
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionLSD1 zinc finger family protein
Genome locationLG07:71307207..71309428
RNA-Seq ExpressionTan0012451
SyntenyTan0012451
Gene Ontology termsGO:0005634 - nucleus (cellular component)
InterPro domainsIPR005735 - Zinc finger, LSD1-type
IPR040319 - LSD1-like


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAF2918191.1 hypothetical protein DAI22_08g039400 [Oryza sativa Japonica Group]5.7e-3684.04Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSI
        S  C +C T       GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA+EANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVGVS+
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSI

RLM60365.1 hypothetical protein C2845_PM14G03340 [Panicum miliaceum]1.5e-3665.67Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK--LLF
        S  C +C T       GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA+EANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVG S+   L +
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK--LLF

Query:  C--SVHKLGIIKKLKRPNR--SDTDYVDKHDRTK
        C     +L  +K L+ P +  S+ D +  H+  K
Subjt:  C--SVHKLGIIKKLKRPNR--SDTDYVDKHDRTK

RXH97013.1 hypothetical protein DVH24_035681 [Malus domestica]4.0e-3763.09Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK---LL
        S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVGVS     LL
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK---LL

Query:  FCSVHKLG---------IIKKLKRPNRSDTDYVDKHDRTKSLISKVIVN
        + +V+K           IIKK+   +   +    KH RT+    KVI++
Subjt:  FCSVHKLG---------IIKKLKRPNRSDTDYVDKHDRTKSLISKVIVN

XP_009785779.1 PREDICTED: protein LSD1-like, partial [Nicotiana sylvestris]5.7e-3695Show/hide
Query:  TGTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK
        TGTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA+EANQVAHV+CGNCRMLLMYQYGARSVKCAVCNF+T+VGVSIK
Subjt:  TGTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK

XP_038887481.1 protein LOL1 isoform X1 [Benincasa hispida]2.2e-4867.26Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIKLLFCS
        S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV        
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIKLLFCS

Query:  VHKLGIIKKLKRPNRSDTDYVDKHDRTKSLISKVIVNIVVPNSTTAA-CNIRNTVHHVCTTRQAEVPL
                            V++HDR+KSLI+KVIVN+VVPNSTTAA  NIR+ +  VC TRQ EVPL
Subjt:  VHKLGIIKKLKRPNRSDTDYVDKHDRTKSLISKVIVNIVVPNSTTAA-CNIRNTVHHVCTTRQAEVPL

TrEMBL top hitse value%identityAlignment
A0A1U7XFQ3 protein LSD1-like2.8e-3695Show/hide
Query:  TGTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK
        TGTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA+EANQVAHV+CGNCRMLLMYQYGARSVKCAVCNF+T+VGVSIK
Subjt:  TGTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK

A0A3L6PNX9 Uncharacterized protein7.3e-3765.67Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK--LLF
        S  C +C T       GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA+EANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVG S+   L +
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK--LLF

Query:  C--SVHKLGIIKKLKRPNR--SDTDYVDKHDRTK
        C     +L  +K L+ P +  S+ D +  H+  K
Subjt:  C--SVHKLGIIKKLKRPNR--SDTDYVDKHDRTK

A0A498JSX6 Uncharacterized protein1.9e-3763.09Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK---LL
        S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVGVS     LL
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK---LL

Query:  FCSVHKLG---------IIKKLKRPNRSDTDYVDKHDRTKSLISKVIVN
        + +V+K           IIKK+   +   +    KH RT+    KVI++
Subjt:  FCSVHKLG---------IIKKLKRPNRSDTDYVDKHDRTKSLISKVIVN

A0A7J8XQF1 Uncharacterized protein (Fragment)6.2e-3683.16Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK
        S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVGVS++
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK

M1BH58 LOL1 (LSD ONE LIKE 1)2.1e-3684.21Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK
        S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA+EANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIK

SwissProt top hitse value%identityAlignment
P94077 Protein LSD11.6e-2058.33Show/hide
Query:  EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA-LEANQVAH--------VSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS
        +MA ++CGGC T+LMY RGA+SV+CSCC T NL    +NQVAH        ++CG+CR  LMY YGA SVKCAVC FVT+V +S
Subjt:  EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA-LEANQVAH--------VSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS

Q0J7V9 Protein LSD13.7e-3883.87Show/hide
Query:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS
        S  C +C T       GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA+EANQVAHV+CGNCRMLLMYQYGARSVKCAVCNFVTSVG S
Subjt:  SFSCFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS

Q2QMB3 Protein LOL25.8e-2359.74Show/hide
Query:  GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS
        G ++A L+CGGC TLLMY R ATSV+CSCC TVNL    + +AH++CG C+ +LMY YGA SVKCA+CNF+T+ G++
Subjt:  GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS

Q6ASS2 Protein LOL37.5e-2353.68Show/hide
Query:  SFSCFMCKTGT---------EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS
        S  C +C+  T         EMA L+CGGC TLLMY R A +V+CSCC TVNL    N +AHVSCG CR  LMY YGA SVKCA+C+++T+ G++
Subjt:  SFSCFMCKTGT---------EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS

Q93ZB1 Protein LOL17.0e-3778.22Show/hide
Query:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV
        +M  +G+ S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHV+CGNC MLLMYQYGARSVKCAVCNFVTSVG 
Subjt:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV

Query:  S
        S
Subjt:  S

Arabidopsis top hitse value%identityAlignment
AT1G32540.1 lsd one like 15.0e-3878.22Show/hide
Query:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV
        +M  +G+ S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHV+CGNC MLLMYQYGARSVKCAVCNFVTSVG 
Subjt:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV

Query:  S
        S
Subjt:  S

AT1G32540.2 lsd one like 15.0e-3878.22Show/hide
Query:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV
        +M  +G+ S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHV+CGNC MLLMYQYGARSVKCAVCNFVTSVG 
Subjt:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV

Query:  S
        S
Subjt:  S

AT1G32540.3 lsd one like 15.0e-3878.22Show/hide
Query:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV
        +M  +G+ S  C +C         GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHV+CGNC MLLMYQYGARSVKCAVCNFVTSVG 
Subjt:  VMQKIGSFS--CFMCKT-------GTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGV

Query:  S
        S
Subjt:  S

AT4G20380.1 LSD1 zinc finger family protein1.1e-2158.33Show/hide
Query:  EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA-LEANQVAH--------VSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS
        +MA ++CGGC T+LMY RGA+SV+CSCC T NL    +NQVAH        ++CG+CR  LMY YGA SVKCAVC FVT+V +S
Subjt:  EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA-LEANQVAH--------VSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS

AT4G20380.2 LSD1 zinc finger family protein1.1e-2158.33Show/hide
Query:  EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA-LEANQVAH--------VSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS
        +MA ++CGGC T+LMY RGA+SV+CSCC T NL    +NQVAH        ++CG+CR  LMY YGA SVKCAVC FVT+V +S
Subjt:  EMAQLVCGGCHTLLMYIRGATSVQCSCCHTVNLA-LEANQVAH--------VSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTATGAATTTGCCCCACTACTCATTGCCCAGCAAAATTCCCTCTTGCCTTTTCAAGCTTTCTTTCCCCAGCTTCTTCCTTGCTGGGTTTCACCATTTTTGCCGCACAG
AGCCAGCTTGTGTGCTCCGGATGTAGAAACCTTCTGCTTTATCCAGTTGGGGCAACCTCTGTTTGCTGTGCAGTTTGTAATGCAAAAGATTGGAAGTTTTAGTTGCTTTA
TGTGTAAAACAGGCACAGAAATGGCACAATTGGTGTGTGGAGGCTGCCATACTCTTCTCATGTACATTCGCGGTGCTACGAGCGTACAATGTTCTTGTTGCCACACCGTC
AACTTAGCTTTGGAAGCGAATCAGGTGGCACACGTTAGCTGTGGGAACTGCAGGATGCTACTGATGTATCAATATGGAGCACGATCAGTGAAATGTGCAGTATGCAATTT
TGTGACATCAGTTGGGGTCAGTATAAAACTTCTATTTTGTTCAGTTCATAAATTAGGCATCATCAAAAAGCTCAAAAGACCAAACAGATCTGATACTGACTATGTCGACA
AGCACGATCGAACAAAAAGCCTAATATCTAAAGTTATTGTAAACATTGTTGTCCCAAATTCGACAACTGCGGCTTGCAATATTCGTAACACCGTCCACCATGTTTGTACG
ACTCGACAAGCGGAGGTTCCTCTCATATTCACTTGTATAGAGCTATATTTCTGCGCGTGA
mRNA sequenceShow/hide mRNA sequence
ATGTATGAATTTGCCCCACTACTCATTGCCCAGCAAAATTCCCTCTTGCCTTTTCAAGCTTTCTTTCCCCAGCTTCTTCCTTGCTGGGTTTCACCATTTTTGCCGCACAG
AGCCAGCTTGTGTGCTCCGGATGTAGAAACCTTCTGCTTTATCCAGTTGGGGCAACCTCTGTTTGCTGTGCAGTTTGTAATGCAAAAGATTGGAAGTTTTAGTTGCTTTA
TGTGTAAAACAGGCACAGAAATGGCACAATTGGTGTGTGGAGGCTGCCATACTCTTCTCATGTACATTCGCGGTGCTACGAGCGTACAATGTTCTTGTTGCCACACCGTC
AACTTAGCTTTGGAAGCGAATCAGGTGGCACACGTTAGCTGTGGGAACTGCAGGATGCTACTGATGTATCAATATGGAGCACGATCAGTGAAATGTGCAGTATGCAATTT
TGTGACATCAGTTGGGGTCAGTATAAAACTTCTATTTTGTTCAGTTCATAAATTAGGCATCATCAAAAAGCTCAAAAGACCAAACAGATCTGATACTGACTATGTCGACA
AGCACGATCGAACAAAAAGCCTAATATCTAAAGTTATTGTAAACATTGTTGTCCCAAATTCGACAACTGCGGCTTGCAATATTCGTAACACCGTCCACCATGTTTGTACG
ACTCGACAAGCGGAGGTTCCTCTCATATTCACTTGTATAGAGCTATATTTCTGCGCGTGA
Protein sequenceShow/hide protein sequence
MYEFAPLLIAQQNSLLPFQAFFPQLLPCWVSPFLPHRASLCAPDVETFCFIQLGQPLFAVQFVMQKIGSFSCFMCKTGTEMAQLVCGGCHTLLMYIRGATSVQCSCCHTV
NLALEANQVAHVSCGNCRMLLMYQYGARSVKCAVCNFVTSVGVSIKLLFCSVHKLGIIKKLKRPNRSDTDYVDKHDRTKSLISKVIVNIVVPNSTTAACNIRNTVHHVCT
TRQAEVPLIFTCIELYFCA