CuGenDBv2

Gene ID	Tan0017721
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Mucin-5AC like
Genome location	LG04:85983990..85984744
RNA-Seq Expression	Tan0017721
Synteny	Tan0017721
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6606765.1 hypothetical protein SDJN03_00107, partial [Cucurbita argyrosperma subsp. sororia]

1.5e-61

79.63

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFD--DSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT
        MDA+E H+SK P LFDQILPPRLEDAGLEDCALPPDSIREAFFKAASA+KSTATA LS  D  DSDGY VED WSPTA+LPTD++ GILPE DPPAAC T
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFD--DSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT

Query:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        +KGLKLPEF  D VVVG MEERRGKG CVVDVLEGLE+GDE KK+K    EEE+PILAEGFA
Subjt:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

XP_008447517.1 PREDICTED: uncharacterized protein LOC103489947 [Cucumis melo]

1.1e-56

75.62

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK
        MDA+E H + QP  FDQILPPRLEDAGLED ALPPDSIREAFFKAASAVKS ATALLSP DD +    +DPWSPT+ LPTDI+ GILP+ D PA C T K
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK

Query:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        GLKLPEFG+DEVV+G MEERRGK  CVVD LEGLEIGDE +KEKK   EEEKPIL EGFA
Subjt:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

XP_022949149.1 uncharacterized protein LOC111452587 [Cucurbita moschata]

4.1e-62

80.25

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFD--DSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT
        MDA+E H+SK P LFDQILPPRLEDAGLEDCALPPDSIREAFFKAASA+KSTATA LS  D  DSDGY VED WSPTA+LPTD++ GILPE DPPAAC T
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFD--DSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT

Query:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        +KGLKLPEF  D VVVG MEERRGKG CVVDVLEGLE+GDE KK+KK   EEE+PILAEGFA
Subjt:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

XP_023523630.1 uncharacterized protein LOC111787807 [Cucurbita pepo subsp. pepo]

2.6e-61

79.63

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLS--PFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT
        MDA+E H+SK P LFDQILPPRLEDAGLEDCALPPDSIREAFFKAASA+KSTATA LS    DDSDGY VED WSP A+LPTD++ GILPE DPPAAC T
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLS--PFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT

Query:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        +KGLKLPEF  D VVVG MEERRGKG CVVDVLEGLE+GDE KK+KK   EEE+PILAEGFA
Subjt:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

XP_038900451.1 uncharacterized protein LOC120087668 [Benincasa hispida]

1.9e-56

75.62

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK
        MDA+E+H +  P +FDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSP DD      +DPWSPT+ LPTD++ GILP+RD PA C TEK
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK

Query:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        GLKLPE G DEVV+G MEERRGK  CVVD LEGLEIGDE K  +KKS +EEKPIL EGFA
Subjt:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LDD6 Uncharacterized protein

1.1e-44

68.12

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK
        MDA+E H + QPS F QILPPRLEDAGLED ALPPDSIREAFFKAASAVKS ATA LS  DD D    + P SPT+ALPTD         D PA C T+K
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK

Query:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        GL+LPEFG+DEVV+G MEERRGKG CVVD LEGLEIGD+ +KE  K  E++KP+L EGFA
Subjt:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

A0A1S3BI85 uncharacterized protein LOC103489947

5.5e-57

75.62

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK
        MDA+E H + QP  FDQILPPRLEDAGLED ALPPDSIREAFFKAASAVKS ATALLSP DD +    +DPWSPT+ LPTDI+ GILP+ D PA C T K
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK

Query:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        GLKLPEFG+DEVV+G MEERRGK  CVVD LEGLEIGDE +KEKK   EEEKPIL EGFA
Subjt:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

A0A5A7U9B5 Uncharacterized protein

5.5e-57

75.62

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK
        MDA+E H + QP  FDQILPPRLEDAGLED ALPPDSIREAFFKAASAVKS ATALLSP DD +    +DPWSPT+ LPTDI+ GILP+ D PA C T K
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEK

Query:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        GLKLPEFG+DEVV+G MEERRGK  CVVD LEGLEIGDE +KEKK   EEEKPIL EGFA
Subjt:  GLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

A0A6J1GBZ4 uncharacterized protein LOC111452587

2.0e-62

80.25

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFD--DSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT
        MDA+E H+SK P LFDQILPPRLEDAGLEDCALPPDSIREAFFKAASA+KSTATA LS  D  DSDGY VED WSPTA+LPTD++ GILPE DPPAAC T
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFD--DSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT

Query:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA
        +KGLKLPEF  D VVVG MEERRGKG CVVDVLEGLE+GDE KK+KK   EEE+PILAEGFA
Subjt:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

A0A6J1K989 uncharacterized protein LOC111492831

2.8e-53

77.18

Show/hide

Query:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLS--PFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT
        MDA+E H+SK P LFDQILPPRLEDAGLEDCALPPDSI EAFFKAASA+KSTAT  LS    DDSDGY VED WSPTAAL TD++ GI PE DPPAAC T
Subjt:  MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLS--PFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGT

Query:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKS
        +KGLKLPEF  D VVVG MEERRGKG C VDVLEGLE+GDE KK+KK +
Subjt:  EKGLKLPEFGRDEVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G15230.1 unknown protein

2.4e-20

50.32

Show/hide

Query:  LFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEKGL-KLPEFGR--D
        L D ILPP L DAGLEDCALPP+SI+EAF KAA+AVKS A ++    ++ DG C+ DP   TA     II G   ERD    C   KG+ KL E  +  D
Subjt:  LFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEKGL-KLPEFGR--D

Query:  EVVVGEMEERRGKGCCVVDVLEGLEI-GDEDKKEKKKSSEEE-----KPILAEGF
         VV GE EE  GK C  VD L+ L++ G E   EKK  S+E+     KPIL EGF
Subjt:  EVVVGEMEERRGKGCCVVDVLEGLEI-GDEDKKEKKKSSEEE-----KPILAEGF

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGACGCATCAGAACGCCACAAATCCAAACAACCAAGTCTCTTCGATCAAATCCTCCCTCCCCGTCTCGAAGACGCCGGCCTCGAGGATTGCGCCCTTCCTCCCGATTC
CATTCGTGAAGCCTTCTTCAAGGCCGCCTCCGCCGTCAAATCCACGGCCACCGCTCTTCTTTCCCCCTTCGACGATTCCGACGGCTACTGTGTCGAGGATCCATGGTCGC
CTACTGCCGCTCTACCTACCGACATCATCGCTGGAATCTTGCCGGAGCGCGATCCTCCAGCGGCTTGCGGGACGGAGAAGGGATTGAAATTGCCGGAGTTTGGTCGGGAT
GAGGTCGTTGTTGGGGAAATGGAGGAGAGGAGAGGGAAGGGTTGCTGTGTGGTAGATGTATTGGAAGGGTTGGAGATTGGTGATGAAGACAAGAAGGAGAAGAAGAAGAG
CAGTGAAGAAGAGAAACCTATTTTAGCGGAAGGTTTTGCTTGA

mRNA sequence

Show/hide mRNA sequence

AATTCCCAAATCTTCCAAATTTAGGGTTTCTCATTCTCATGGACGCATCAGAACGCCACAAATCCAAACAACCAAGTCTCTTCGATCAAATCCTCCCTCCCCGTCTCGAA
GACGCCGGCCTCGAGGATTGCGCCCTTCCTCCCGATTCCATTCGTGAAGCCTTCTTCAAGGCCGCCTCCGCCGTCAAATCCACGGCCACCGCTCTTCTTTCCCCCTTCGA
CGATTCCGACGGCTACTGTGTCGAGGATCCATGGTCGCCTACTGCCGCTCTACCTACCGACATCATCGCTGGAATCTTGCCGGAGCGCGATCCTCCAGCGGCTTGCGGGA
CGGAGAAGGGATTGAAATTGCCGGAGTTTGGTCGGGATGAGGTCGTTGTTGGGGAAATGGAGGAGAGGAGAGGGAAGGGTTGCTGTGTGGTAGATGTATTGGAAGGGTTG
GAGATTGGTGATGAAGACAAGAAGGAGAAGAAGAAGAGCAGTGAAGAAGAGAAACCTATTTTAGCGGAAGGTTTTGCTTGATATTCTGCAGTTTGATTAAGCTCTGCGAA
ATTCTTTGGTGCAAATTTTAATGGAGTTCTTGTTATTGATTGTGCATAACGTGGAGTTAGAGAGATTTTGCTTCAATTTTGCTGCCTGCTTCTTTGTGAATGTGCATAGA
GAGAGTCAGAGAGATGAGTTGATTTTTTTTTAAATTTTTTGTTTCTATTTAATCAAACTCCTTTTTAATTTTCTTTTCTCTAAGTTAATAGCCAC

Protein sequence

Show/hide protein sequence

MDASERHKSKQPSLFDQILPPRLEDAGLEDCALPPDSIREAFFKAASAVKSTATALLSPFDDSDGYCVEDPWSPTAALPTDIIAGILPERDPPAACGTEKGLKLPEFGRD
EVVVGEMEERRGKGCCVVDVLEGLEIGDEDKKEKKKSSEEEKPILAEGFA

Tan0017721 (gene) of Snake gourd v1 genome