CuGenDBv2

Gene ID	HG10004675
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	DUF4050 domain-containing protein
Genome location	Chr08:19434435..19436988
RNA-Seq Expression	HG10004675
Synteny	HG10004675
Gene Ontology terms	GO:0016020 - membrane (cellular component)
InterPro domains	IPR025124 - Domain of unknown function DUF4050

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0064925.1 uncharacterized protein E6C27_scaffold82G002430 [Cucumis melo var. makuwa]

2.0e-95

88.78

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALILLMVD IKLLFH+R   GCC+ASALGNAMD PSKGLRVKD+E KKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SAQS DS SNIGSSTDFVNSGLLLWNETRKQW GNKMS SQKQVQEPKISWNATYDSLLTTNKPFPE +PL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

XP_004138726.1 uncharacterized protein LOC101216869 [Cucumis sativus]

5.8e-95

87.76

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALILLMVD IKLLFH+R   GCCTASALGNAMD PSKGLRVK++E KKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ S Q+ DSHSNIGSSTDFVNSGLLLWNETRKQW GNKMS SQKQVQEPKISWNATYD+LLTTNKPFPE +PL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

XP_008445211.1 PREDICTED: uncharacterized protein LOC103488310 isoform X1 [Cucumis melo]

2.0e-95

88.78

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALILLMVD IKLLFH+R   GCC+ASALGNAMD PSKGLRVKD+E KKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SAQS DS SNIGSSTDFVNSGLLLWNETRKQW GNKMS SQKQVQEPKISWNATYDSLLTTNKPFPE +PL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

XP_022951409.1 uncharacterized protein LOC111454240 isoform X1 [Cucurbita moschata]

5.1e-91

85.2

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLLSRLEGCSS KPCCSFLQFSG+YLRALI+L+VDN+KLLFHRRSC G CT  ALG+AMD PS GLRV+DQE KKQCLPEN  SSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SAQS DSH+N+GSST+FVNSGLLLWNETRKQW GNK S+SQK+V+EPKISWNATYDSLLTTNKPFPE +PLAEMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

XP_038885342.1 uncharacterized protein LOC120075759 isoform X1 [Benincasa hispida]

1.3e-99

91.33

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLL RLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASAL NAMD PSKGLRVKDQE KKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SA S DSHSNIGSSTDFVNSGLLLWNETRKQW GNKMS+ QKQVQEPKISW+ATYDSLL TNKPFPEPVPL EMI+FLVDVWEQ+GLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LPL3 Uncharacterized protein

2.8e-95

87.76

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALILLMVD IKLLFH+R   GCCTASALGNAMD PSKGLRVK++E KKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ S Q+ DSHSNIGSSTDFVNSGLLLWNETRKQW GNKMS SQKQVQEPKISWNATYD+LLTTNKPFPE +PL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

A0A1S3BC47 uncharacterized protein LOC103488310 isoform X1

9.7e-96

88.78

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALILLMVD IKLLFH+R   GCC+ASALGNAMD PSKGLRVKD+E KKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SAQS DS SNIGSSTDFVNSGLLLWNETRKQW GNKMS SQKQVQEPKISWNATYDSLLTTNKPFPE +PL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

A0A5A7VGA9 Uncharacterized protein

9.7e-96

88.78

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLL+RLEGCSSK PCCSFLQFSGEY+RALILLMVD IKLLFH+R   GCC+ASALGNAMD PSKGLRVKD+E KKQCLPEN PSSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SAQS DS SNIGSSTDFVNSGLLLWNETRKQW GNKMS SQKQVQEPKISWNATYDSLLTTNKPFPE +PL EMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

A0A6J1GIP5 uncharacterized protein LOC111454240 isoform X1

2.5e-91

85.2

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLLSRLEGCSS KPCCSFLQFSG+YLRALI+L+VDN+KLLFHRRSC G CT  ALG+AMD PS GLRV+DQE KKQCLPEN  SSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SAQS DSH+N+GSST+FVNSGLLLWNETRKQW GNK S+SQK+V+EPKISWNATYDSLLTTNKPFPE +PLAEMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

A0A6J1KQM2 uncharacterized protein LOC111496323 isoform X1

1.2e-90

84.69

Show/hide

Query:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV
        MYSRCCLLSRLEGCSS KPCCSFLQFSG+YLRALI+L+VDN+KLLFHRRSC G CT  ALG+AMD PS GLRV DQE KKQCLP+N  SSSTCEMDNSTV
Subjt:  MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTV

Query:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        WSQRS+ SAQS DSH+N+GSST+FVNSGLLLWNETRKQW GNK S+SQK+V+EPKISWNATYDSLLTTNKPFPE +PLAEMIEFLVDVWEQEGLYD
Subjt:  WSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G15350.1 unknown protein

9.4e-27

44.81

Show/hide

Query:  CHGCCT--ASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSA----QSQDSHSNIGSSTDFVNSGLLLWNETRKQWAG-NK
        C GC     S   +  D PS  +    +  KK  + E+  S+ST +MDN T  SQ S+ S+     SQ +  N  +  ++VN GLLLWN+TR++W G +K
Subjt:  CHGCCT--ASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSA----QSQDSHSNIGSSTDFVNSGLLLWNETRKQWAG-NK

Query:  MSDSQKQVQEPKISWN-ATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
         ++     Q  K++WN ATYDSLL +NK FP+P+PL EM++FLVD+WEQEGLYD
Subjt:  MSDSQKQVQEPKISWN-ATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

AT1G15350.2 unknown protein

9.4e-27

44.81

Show/hide

Query:  CHGCCT--ASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSA----QSQDSHSNIGSSTDFVNSGLLLWNETRKQWAG-NK
        C GC     S   +  D PS  +    +  KK  + E+  S+ST +MDN T  SQ S+ S+     SQ +  N  +  ++VN GLLLWN+TR++W G +K
Subjt:  CHGCCT--ASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSA----QSQDSHSNIGSSTDFVNSGLLLWNETRKQWAG-NK

Query:  MSDSQKQVQEPKISWN-ATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
         ++     Q  K++WN ATYDSLL +NK FP+P+PL EM++FLVD+WEQEGLYD
Subjt:  MSDSQKQVQEPKISWN-ATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

AT4G32342.1 unknown protein

5.5e-35

52.53

Show/hide

Query:  NIKLLFHRRSCHGCCTAS-ALGNAMDEPSKGLRVKDQEVKK-QCLPENCPSSSTCEMD-NSTVWSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRK
        N K L +  +C GCC     L   +DEPSKGL+++ + VKK     ++  S+STC+MD N T+ SQ S P    Q S SN   ST+FVN GL+LWN TR+
Subjt:  NIKLLFHRRSCHGCCTAS-ALGNAMDEPSKGLRVKDQEVKK-QCLPENCPSSSTCEMD-NSTVWSQRSIPSAQSQDSHSNIGSSTDFVNSGLLLWNETRK

Query:  QWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLY
        QW    ++  Q  V EP ISWN+TYDSLL+TNK FP+P+PL EM+ FLVDVWE+EGLY
Subjt:  QWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLY

AT5G25360.1 unknown protein

8.8e-41

56.38

Show/hide

Query:  CHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSAQSQDSHSNIGSS---TDFVNSGLLLWNETRKQWAGNKMSDS
        C GCC    L  A+DEPSKGLR++ + VKK  + E+  S+STCEMDNST+ SQRS+ S    ++ S   S+   T+FVN GL LWN+TR+QW  N  S  
Subjt:  CHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSAQSQDSHSNIGSS---TDFVNSGLLLWNETRKQWAGNKMSDS

Query:  QKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        + +V+EP ISWNATY+SLL  NK F  P+PL EM++FLVDVWEQEGLYD
Subjt:  QKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

AT5G25360.2 unknown protein

8.8e-41

56.38

Show/hide

Query:  CHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSAQSQDSHSNIGSS---TDFVNSGLLLWNETRKQWAGNKMSDS
        C GCC    L  A+DEPSKGLR++ + VKK  + E+  S+STCEMDNST+ SQRS+ S    ++ S   S+   T+FVN GL LWN+TR+QW  N  S  
Subjt:  CHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSAQSQDSHSNIGSS---TDFVNSGLLLWNETRKQWAGNKMSDS

Query:  QKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD
        + +V+EP ISWNATY+SLL  NK F  P+PL EM++FLVDVWEQEGLYD
Subjt:  QKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTATTCTAGGTGTTGTCTCCTCAGCCGCTTAGAGGGTTGCTCTAGCAAGAAACCATGTTGTTCATTCTTACAGTTTTCTGGAGAATATCTGCGCGCTCTTATTCTTTT
GATGGTGGATAATATCAAGCTTCTTTTCCATAGAAGAAGCTGTCATGGATGCTGCACTGCATCTGCACTAGGTAATGCAATGGACGAGCCGTCTAAAGGTCTGAGAGTTA
AAGACCAAGAAGTAAAGAAACAATGCTTACCTGAAAATTGCCCGAGCTCTAGCACATGTGAAATGGACAACAGTACAGTTTGGTCCCAGAGAAGCATTCCATCAGCCCAG
TCACAAGATTCTCACAGTAATATTGGGAGCAGTACAGACTTTGTAAACTCTGGACTACTTCTTTGGAATGAGACCAGGAAACAATGGGCTGGAAATAAAATGTCCGACAG
CCAAAAGCAAGTTCAAGAACCCAAAATAAGCTGGAATGCTACTTATGACAGCTTATTAACAACGAACAAACCGTTCCCCGAGCCCGTACCTCTTGCTGAGATGATAGAGT
TTCTTGTTGATGTCTGGGAGCAGGAGGGTCTATATGACTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MYSRCCLLSRLEGCSSKKPCCSFLQFSGEYLRALILLMVDNIKLLFHRRSCHGCCTASALGNAMDEPSKGLRVKDQEVKKQCLPENCPSSSTCEMDNSTVWSQRSIPSAQ
SQDSHSNIGSSTDFVNSGLLLWNETRKQWAGNKMSDSQKQVQEPKISWNATYDSLLTTNKPFPEPVPLAEMIEFLVDVWEQEGLYD

HG10004675 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome