CuGenDBv2

Gene ID	Tan0015397
Organism	Trichosanthes anguina (Snake gourd v1)
Description	DUF4050 domain-containing protein
Genome location	LG02:95502037..95504689
RNA-Seq Expression	Tan0015397
Synteny	Tan0015397
Gene Ontology terms	GO:0016020 - membrane (cellular component)
InterPro domains	IPR025124 - Domain of unknown function DUF4050

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7020386.1 hypothetical protein SDJN02_17070 [Cucurbita argyrosperma subsp. argyrosperma]

9.2e-101

92.82

Show/hide

Query:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW
        MYSRCCLLSRLEGCSSKPCCSFLQFSG+YLRALIVL+VDN+KLLFHRRSC G CTGPALG+AMDGPS GLRVEDQEAKKQCLPENF SSSTCEMDNSTVW
Subjt:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW

Query:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        SQRSMASAQSHDSH+N+GSST+FVNSGLLLWNETRKQWVGNK SESQK+VREPKISWNATY+SLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
Subjt:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

XP_022951409.1 uncharacterized protein LOC111454240 isoform X1 [Cucurbita moschata]

9.2e-101

92.82

Show/hide

Query:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW
        MYSRCCLLSRLEGCSSKPCCSFLQFSG+YLRALIVL+VDN+KLLFHRRSC G CTGPALG+AMDGPS GLRVEDQEAKKQCLPENF SSSTCEMDNSTVW
Subjt:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW

Query:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        SQRSMASAQSHDSH+N+GSST+FVNSGLLLWNETRKQWVGNK SESQK+VREPKISWNATY+SLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
Subjt:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

XP_023002499.1 uncharacterized protein LOC111496323 isoform X1 [Cucurbita maxima]

6.0e-100

91.79

Show/hide

Query:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW
        MYSRCCLLSRLEGCSSKPCCSFLQFSG+YLRALIVL+VDN+KLLFHRRSC G CTGPALG+AMDGPS GLRV+DQEAKKQCLP+NF SSSTCEMDNSTVW
Subjt:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW

Query:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        SQRSMASAQSHDSH+N+GSST+FVNSGLLLWNETRKQWVGNK SESQK+VREPKISWNATY+SLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
Subjt:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

XP_023537962.1 uncharacterized protein LOC111798846 [Cucurbita pepo subsp. pepo]

6.6e-99

91.79

Show/hide

Query:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW
        MYSRCCLLSRLEGCSSKPCCSFLQFSG+YLRALIVL+VDN+KLLFHRRSC G CTGPALG+AMDG S GLRVEDQEAKKQCLPENF SSS CEMDNSTVW
Subjt:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW

Query:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        SQRSMASAQSHDSH+N+GSST+FVNSGLLLWNETRKQWVGNK S+SQKQVREPKISWNATY+SLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
Subjt:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

XP_038885342.1 uncharacterized protein LOC120075759 isoform X1 [Benincasa hispida]

4.7e-97

88.78

Show/hide

Query:  MYSRCCLLSRLEGCSS-KPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV
        MYSRCCLL RLEGCSS KPCCSFLQFSGEYLRALI+LMVDN+KLLFHRRSCHGCCT  AL NAMDGPS+GLRV+DQEAKKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSS-KPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV

Query:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        WSQRSMASA SHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNK SE QKQV+EPKISW+ATY+SLL TNKPFPE +PL EMI+FLVDVWEQ+GLYD
Subjt:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LPL3 Uncharacterized protein

2.1e-95

87.76

Show/hide

Query:  MYSRCCLLSRLEGCSSK-PCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALI+LMVD +KLLFH+R   GCCT  ALGNAMDGPS+GLRV+++EAKKQCLPENFPSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSK-PCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV

Query:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        WSQRSMAS Q+HDSHSNIGSSTDFVNSGLLLWNETRKQWVGNK S SQKQV+EPKISWNATY++LLTTNKPFPEAIPL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

A0A1S3BC47 uncharacterized protein LOC103488310 isoform X1

3.3e-96

88.78

Show/hide

Query:  MYSRCCLLSRLEGCSSK-PCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALI+LMVD +KLLFH+R   GCC+  ALGNAMDGPS+GLRV+D+EAKKQCLPENFPSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSK-PCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV

Query:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        WSQRSMASAQSHDS SNIGSSTDFVNSGLLLWNETRKQWVGNK S+SQKQV+EPKISWNATY+SLLTTNKPFPEAIPL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

A0A5A7VGA9 Uncharacterized protein

3.3e-96

88.78

Show/hide

Query:  MYSRCCLLSRLEGCSSK-PCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALI+LMVD +KLLFH+R   GCC+  ALGNAMDGPS+GLRV+D+EAKKQCLPENFPSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSK-PCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTV

Query:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        WSQRSMASAQSHDS SNIGSSTDFVNSGLLLWNETRKQWVGNK S+SQKQV+EPKISWNATY+SLLTTNKPFPEAIPL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

A0A6J1GIP5 uncharacterized protein LOC111454240 isoform X1

4.5e-101

92.82

Show/hide

Query:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW
        MYSRCCLLSRLEGCSSKPCCSFLQFSG+YLRALIVL+VDN+KLLFHRRSC G CTGPALG+AMDGPS GLRVEDQEAKKQCLPENF SSSTCEMDNSTVW
Subjt:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW

Query:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        SQRSMASAQSHDSH+N+GSST+FVNSGLLLWNETRKQWVGNK SESQK+VREPKISWNATY+SLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
Subjt:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

A0A6J1KQM2 uncharacterized protein LOC111496323 isoform X1

2.9e-100

91.79

Show/hide

Query:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW
        MYSRCCLLSRLEGCSSKPCCSFLQFSG+YLRALIVL+VDN+KLLFHRRSC G CTGPALG+AMDGPS GLRV+DQEAKKQCLP+NF SSSTCEMDNSTVW
Subjt:  MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVW

Query:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        SQRSMASAQSHDSH+N+GSST+FVNSGLLLWNETRKQWVGNK SESQK+VREPKISWNATY+SLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
Subjt:  SQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G15350.1 unknown protein

1.0e-25

48.55

Show/hide

Query:  DGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASA-QSHDSHS---NIGSSTDFVNSGLLLWNETRKQWVG-NKRSESQKQVREPKISWN
        D PS  +    +  KK  + E+F S+ST +MDN T  SQ S++S+ Q+ DS S   N  +  ++VN GLLLWN+TR++WVG +K +      +  K++WN
Subjt:  DGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASA-QSHDSHS---NIGSSTDFVNSGLLLWNETRKQWVG-NKRSESQKQVREPKISWN

Query:  -ATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
         ATY+SLL +NK FP+ IPL EM++FLVD+WEQEGLYD
Subjt:  -ATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

AT1G15350.2 unknown protein

1.0e-25

48.55

Show/hide

Query:  DGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASA-QSHDSHS---NIGSSTDFVNSGLLLWNETRKQWVG-NKRSESQKQVREPKISWN
        D PS  +    +  KK  + E+F S+ST +MDN T  SQ S++S+ Q+ DS S   N  +  ++VN GLLLWN+TR++WVG +K +      +  K++WN
Subjt:  DGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASA-QSHDSHS---NIGSSTDFVNSGLLLWNETRKQWVG-NKRSESQKQVREPKISWN

Query:  -ATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
         ATY+SLL +NK FP+ IPL EM++FLVD+WEQEGLYD
Subjt:  -ATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

AT4G32342.1 unknown protein

4.8e-31

48.1

Show/hide

Query:  NVKLLFHRRSCHGCCTGP-ALGNAMDGPSRGLRVEDQEAKK-QCLPENFPSSSTCEMD-NSTVWSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRK
        N K L +  +C GCC     L   +D PS+GL+++ +  KK     ++F S+STC+MD N T+ SQ   +S    D   +  +ST+FVN GL+LWN TR+
Subjt:  NVKLLFHRRSCHGCCTGP-ALGNAMDGPSRGLRVEDQEAKK-QCLPENFPSSSTCEMD-NSTVWSQRSMASAQSHDSHSNIGSSTDFVNSGLLLWNETRK

Query:  QWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLY
        QW     +  Q  V EP ISWN+TY+SLL+TNK FP+ IPL EM+ FLVDVWE+EGLY
Subjt:  QWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLY

AT5G25360.1 unknown protein

6.1e-42

57.72

Show/hide

Query:  CHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASAQSHDSHSNIGSS---TDFVNSGLLLWNETRKQWVGNKRSES
        C GCC  P L  A+D PS+GLR++ +  KK  + E+F S+STCEMDNST+ SQRSM+S    ++ S   S+   T+FVN GL LWN+TR+QW+ N  S+ 
Subjt:  CHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASAQSHDSHSNIGSS---TDFVNSGLLLWNETRKQWVGNKRSES

Query:  QKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        + +VREP ISWNATYESLL  NK F   IPL EM++FLVDVWEQEGLYD
Subjt:  QKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

AT5G25360.2 unknown protein

6.1e-42

57.72

Show/hide

Query:  CHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASAQSHDSHSNIGSS---TDFVNSGLLLWNETRKQWVGNKRSES
        C GCC  P L  A+D PS+GLR++ +  KK  + E+F S+STCEMDNST+ SQRSM+S    ++ S   S+   T+FVN GL LWN+TR+QW+ N  S+ 
Subjt:  CHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASAQSHDSHSNIGSS---TDFVNSGLLLWNETRKQWVGNKRSES

Query:  QKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD
        + +VREP ISWNATYESLL  NK F   IPL EM++FLVDVWEQEGLYD
Subjt:  QKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTATTCTAGGTGTTGTCTCCTCAGCCGCTTAGAGGGCTGCTCTAGCAAACCATGTTGCTCGTTTTTACAGTTTTCTGGAGAATATCTGCGCGCTCTTATAGTTTTGAT
GGTGGATAATGTCAAGCTTCTTTTCCACAGAAGAAGCTGTCATGGATGCTGCACTGGACCTGCACTAGGTAATGCAATGGATGGGCCGTCTAGAGGTCTGAGAGTTGAAG
ACCAAGAAGCAAAGAAACAATGCTTACCGGAAAATTTCCCAAGCTCTAGCACATGTGAAATGGACAACAGTACAGTTTGGTCCCAGAGAAGCATGGCATCAGCCCAGTCA
CATGATTCCCACAGCAATATTGGGAGCAGTACAGACTTCGTAAATTCTGGACTTCTTCTTTGGAATGAAACCAGGAAGCAATGGGTCGGAAATAAAAGGTCAGAGAGCCA
AAAGCAAGTTCGAGAACCCAAAATAAGTTGGAATGCTACTTACGAGAGCTTATTAACGACGAACAAGCCATTCCCCGAGGCCATACCTCTTGCTGAGATGATAGAGTTTC
TTGTTGATGTCTGGGAGCAGGAGGGTCTATATGACTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MYSRCCLLSRLEGCSSKPCCSFLQFSGEYLRALIVLMVDNVKLLFHRRSCHGCCTGPALGNAMDGPSRGLRVEDQEAKKQCLPENFPSSSTCEMDNSTVWSQRSMASAQS
HDSHSNIGSSTDFVNSGLLLWNETRKQWVGNKRSESQKQVREPKISWNATYESLLTTNKPFPEAIPLAEMIEFLVDVWEQEGLYD

Tan0015397 (gene) of Snake gourd v1 genome