CuGenDBv2

Gene ID	CmUC05G097610
Organism	Citrullus mucosospermus (Watermelon (USVL531) v1)
Description	Beta-1,3-N-Acetylglucosaminyltransferase family protein
Genome location	CmU531Chr05:27215171..27218843
RNA-Seq Expression	CmUC05G097610
Synteny	CmUC05G097610
Gene Ontology terms	GO:0001709 - cell fate determination (biological process)
InterPro domains	IPR040361 - Tapetum determinant 1

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0063321.1 TPD1 protein-like protein 1A-like [Cucumis melo var. makuwa]

1.7e-58

88.98

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLSTMIAAI+IL LSFINEG A GSCSLDTINIGTQRSGREIGGQPEWNVQ+INNCDCPQK+I+LSC GFQT+EPVDPSILSKQ D CLLINGGIVQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCPT
        GSSVSFSYAWDPPVIM PRFSV  CPT
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCPT

XP_022141679.1 uncharacterized protein LOC111011980 [Momordica charantia]

4.1e-57

88.89

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLSTMIAAILIL LSFIN+GSA G+CSLDTINIGT+RSGREIGGQPEWNVQVINNCDCPQK+IVLSCPGFQT EPV PSILSKQGDTCLLING  VQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCP
         +SVSFSYAWDPP IMFPRFSV QCP
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCP

XP_022937408.1 uncharacterized protein LOC111443708 [Cucurbita moschata]

3.1e-57

88.19

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLS MIAAILILFLSFINEG    SCSLDTINIGTQRSGR IGGQPEWNVQVINNCDCPQK+IVLSCPGFQTVEPVDPSI+SKQGD C LINGGIVQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCPT
        GSSV FSYAWDPP I+FPRFSV QC T
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCPT

XP_022976215.1 uncharacterized protein LOC111476671 [Cucurbita maxima]

1.3e-58

89.76

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLS MIAAILILFLSFINEG   GSCSLDTINIGTQRSGR IGGQPEWNVQVINNCDCPQK+IVLSCPGFQTVEPVDPSI+SKQGD CLLINGGIVQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCPT
        GSSV FSYAWDPP I+FPRFSV QC T
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCPT

XP_038899927.1 uncharacterized protein LOC120087115 [Benincasa hispida]

3.9e-60

91.34

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINL TMIAAI ILFLSFINEGSA GSCSLDTINIGTQRSGREIGGQPEWNVQVINNC+CPQK+IVLSCPGFQT+EPVDPSILSKQ DTCLLINGG VQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCPT
        GSSVSFSYAWDPP+IMFPR SV QCPT
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCPT

TrEMBL top hits

e value

%identity

Alignment

A0A5A7VC88 TPD1 protein-like protein 1A-like

8.0e-59

88.98

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLSTMIAAI+IL LSFINEG A GSCSLDTINIGTQRSGREIGGQPEWNVQ+INNCDCPQK+I+LSC GFQT+EPVDPSILSKQ D CLLINGGIVQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCPT
        GSSVSFSYAWDPPVIM PRFSV  CPT
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCPT

A0A5D3E811 TPD1 protein-like protein 1A-like

2.8e-56

89.26

Show/hide

Query:  MIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSF
        MIAAI+IL LSFINEG A GSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQK+I+LSC GFQT+EPVDPSILSKQ D CLLINGGIVQPGSSVSF
Subjt:  MIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSF

Query:  SYAWDPPVIMFPRFSVPQCPT
        SYAWDPPVIM PRFSV  CPT
Subjt:  SYAWDPPVIMFPRFSVPQCPT

A0A6J1CJF7 uncharacterized protein LOC111011980

2.0e-57

88.89

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLSTMIAAILIL LSFIN+GSA G+CSLDTINIGT+RSGREIGGQPEWNVQVINNCDCPQK+IVLSCPGFQT EPV PSILSKQGDTCLLING  VQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCP
         +SVSFSYAWDPP IMFPRFSV QCP
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCP

A0A6J1FFZ8 uncharacterized protein LOC111443708

1.5e-57

88.19

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLS MIAAILILFLSFINEG    SCSLDTINIGTQRSGR IGGQPEWNVQVINNCDCPQK+IVLSCPGFQTVEPVDPSI+SKQGD C LINGGIVQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCPT
        GSSV FSYAWDPP I+FPRFSV QC T
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCPT

A0A6J1IIV5 uncharacterized protein LOC111476671

6.1e-59

89.76

Show/hide

Query:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP
        MINLS MIAAILILFLSFINEG   GSCSLDTINIGTQRSGR IGGQPEWNVQVINNCDCPQK+IVLSCPGFQTVEPVDPSI+SKQGD CLLINGGIVQP
Subjt:  MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQP

Query:  GSSVSFSYAWDPPVIMFPRFSVPQCPT
        GSSV FSYAWDPP I+FPRFSV QC T
Subjt:  GSSVSFSYAWDPPVIMFPRFSVPQCPT

SwissProt top hits

e value

%identity

Alignment

Q1G3T1 TPD1 protein homolog 1

5.8e-06

34.12

Show/hide

Query:  CSLDTINIGTQRSGREIGGQPEWNVQVINNC--DCPQKKIVLSCPGFQTVEPVDPSILSK-QGDTCLLINGGIVQPGSSVSFSYA
        CS D I +    +     G P + V++ N+C  DC   +I +SC  F +V  V+P +  +   D CL+ +G  + PG S+SF YA
Subjt:  CSLDTINIGTQRSGREIGGQPEWNVQVINNC--DCPQKKIVLSCPGFQTVEPVDPSILSK-QGDTCLLINGGIVQPGSSVSFSYA

Arabidopsis top hits

e value

%identity

Alignment

AT1G32583.1 FUNCTIONS IN: molecular_function unknown

4.1e-07

34.12

Show/hide

Query:  CSLDTINIGTQRSGREIGGQPEWNVQVINNC--DCPQKKIVLSCPGFQTVEPVDPSILSK-QGDTCLLINGGIVQPGSSVSFSYA
        CS D I +    +     G P + V++ N+C  DC   +I +SC  F +V  V+P +  +   D CL+ +G  + PG S+SF YA
Subjt:  CSLDTINIGTQRSGREIGGQPEWNVQVINNC--DCPQKKIVLSCPGFQTVEPVDPSILSK-QGDTCLLINGGIVQPGSSVSFSYA

AT4G32090.1 Beta-1,3-N-Acetylglucosaminyltransferase family protein

1.4e-23

47.06

Show/hide

Query:  ILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAW
        +++L LS ++ G  +  C+   I IG  R+GREIGGQPEW V VIN C+C QK + LSC GF   +PV P +L  QG+TCL+I G  +  G++  F+YA 
Subjt:  ILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAW

Query:  DP
         P
Subjt:  DP

AT4G32100.1 Beta-1,3-N-Acetylglucosaminyltransferase family protein

5.7e-17

Show/hide

Query:  LILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAWD
        L+L  +F+ +G    S SL+++++   ++G  +  +PEW V+V+N+  C      LSC  F++V P+D  +LSK GDTCLL NG  +     +SF Y WD
Subjt:  LILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAWD

AT4G32105.1 Beta-1,3-N-Acetylglucosaminyltransferase family protein

1.4e-18

42.57

Show/hide

Query:  LILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNC-DCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAW
        L+LFL+F+N+G   G C L+ +++   ++G+ +  +PEW V+V N C +C  +   LSC GFQ+V PV  S+LSK GD CLL  G  + P     F+Y W
Subjt:  LILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNC-DCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAW

Query:  D
        D
Subjt:  D

AT4G32110.1 Beta-1,3-N-Acetylglucosaminyltransferase family protein

1.4e-18

39.6

Show/hide

Query:  LILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNC-DCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAW
        L+LFL+F+N+G   G CSL+++++   ++G+ +  +PEW V+V N C +C  +   L C GF +V P+D S+L K GD CL+  G  + P   + F Y W
Subjt:  LILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNC-DCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVSFSYAW

Query:  D
        D
Subjt:  D

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGATCAACCTCTCCACCATGATTGCAGCAATCCTCATCCTATTCCTAAGTTTCATCAATGAAGGGTCTGCTATTGGAAGCTGCAGTTTGGACACCATTAACATA
GGAACACAAAGAAGCGGAAGGGAGATTGGAGGGCAACCTGAATGGAACGTGCAAGTAATTAACAATTGCGATTGTCCTCAGAAGAAGATCGTCTTGTCCTGTCCA
GGGTTTCAGACTGTTGAACCCGTTGATCCATCGATTCTTTCAAAGCAAGGGGACACTTGCCTTCTCATAAACGGAGGAATTGTACAACCTGGTTCTTCAGTTTCA
TTTTCCTATGCTTGGGATCCCCCTGTCATCATGTTCCCTCGTTTCTCTGTTCCTCAGTGTCCTACCTGA

mRNA sequence

Show/hide mRNA sequence

AAAATTTTAAATTTACCTAATCTATTAAAGCATATCAATGCCCATGTTAATTTAACAAAGTGCTTATCGTTGAACTCATTTTTAACCCCACCCCAGGCTTGTAAA
TTGTAACTATTAAGCTAACGTTCAATGACTAAAAATCAAAAATTTGAATGTCCACTACACGTATATAAATAAATAAATAAATAAATAATTAAAAAGTTTCAAAAA
TATTTAAGAAAAAGTAAATAACACCAACCCACAATGAGATTATAACTTTTACATTACAAGCTAAACACGAGAACACTTTCCATCTGCACAAGATTTTTTAACCAA
CTTGTTTTAGATCACAAATTAAATTGGATGCACATATCAAACTTGATCTCTTTTGTGTTTGTCCTCTGGAGAAATTAACAATTACCAATGGATAGAAACTCCAAC
TGGCGCAATGGTAAATGGCAAAATAGAATAGAAATTTACAATCACCAATAAATGCCAAAATTGCACTCAAGCCACGTTTATCCCAACTGAAACGCACTCCATCAA
TGGTAAAATAAAAGGCACAATCTAATTGAGGAATAGAAGGTGTTCAATTTGATTGTGGTTGAAAATTACGTGAAACTCACTACTTTTACCGTTACCATTATCACT
ATCGTTACAAATATTGTTACTATAACAATATGAAAATTATGAATCTAGTACATTTATTGTTACTTTTATTTTTACCTTTACCGTTACCGTTAGGGTCAAGTAGTA
ATAGTAACGATAACGGTAACATTAAATTGTGACAAATTTGTAATTCTAAGTAAATGCGATCAAAAGCAATTCAATTACATTTGCGATTCAGACTTACTACAATTG
ATCCAACAATAAAATTTCATTAAACTACACCAATCTTCTTTACAATTTGGTAAACGTAGCCTCAGTTCAATGTGAGATTGAAGAGCGGAGGTTTCAACACAGCCA
AAGCCATCAAACCCACCAGTTTAGTCGAGTTGGGGGATCAATGTGTGGTTAATGATGGCTTTCCAATCTATTCTGCTGTTCTTATCTCCTTCACTACTGCATGGG
ACCCTTCATTAAATTTCAAGCCTTTTTCTCCCAAGTTGCTTGTTCCTAGTTAGTTACTCAAGGTTTTTGCTTTCTCTTTTCTCCAACTTATAGTGTAAGGAGTCC
TTACTCCTTTTATGTTTTGTACTACGAGTCTTTGGCAAAGTTCAATATATTTATAGAGGTTTAAGACTTATTTTGGTCTCTTCGAACTTTCATATATTTAAATGG
TTTTGGAACTTTTTGCATGAGCAAAAGCTGATCAAGGTCAGGTAATGAGGTCGGCCAATAATCCTGATACCAACTTTCAATTGGAGATGGCATTTACTTTTTCTT
ACCTATCAAGCTTCAGCACAAGTCTCGTCACTCGCAGTCCAAGAAAGGTAGTTTCAATCTATACGTCTCCCACTCTCTATTGCAGCAAACCAGATTGGTTCGAGA
TGACTAGTGAGATGTTGGGGGATGGTCTATTGGGTGTTACAAAGAGAGTGTAGTTTGGGTGTTAGGCAGGTTAAGAGGGGGAGGGTTGTATGAAAAAAGATGTTG
ATGTGATATACAATAAATGGAAGGAGCATGAAAAAGATATTCATACTCCTATAATATTGTAGATTTTCCCGAGGGAGAGAGAGGTGTATGAAAAAAATGTAAGAA
AAATTTCCCATACTCTCGTACTACTGAAAATATGCCGAGGGACTAGGGGCAGGAAGAGAGGGGCTATATTAGAAAGAGAGGGAATGGAAAAGGAGTAGAGTCATG
CATGCAAGAGAGAGAAAATGGTGGTCTTGTAATGTTAAAAGAGAGAATGAATGAGTGGAAGGTCATGGGAGAGAGAAGAGAGATGGATTTGATTGGCAGACTTGC
ATGTGAAAGATGGATTTGATTGGTGCATGTGCATGTTAGAAAGGAAAGAAGAGTACTGAGAACTTAATAAGTGAGAAAGAAAAGGAGAATAGGGAAGAGAGAAGA
ATGACAAAAGGTTGAAAGATAATAAAGGAAGAGAGAGGAACACAATAGGAACAGAAATAAAGAGTTTTGGATGCAGGGTCGGTCAGAAGGAGGTGTATATACTCT
CCTAACTAAACAAGGGGTTAGTTTTGGATATTCGGGTTCGGTCATGAACTTGGTCTGATTCAGTCTTTTAATTTAACTCCCCGAATCTTTTGAAGTATACCCTTC
AAACTTATAAAATGGTGTAGCAATTAACTCCAACTATTTAGGGAATTAAAACAATAGAGTTAAGTTATAAGAATTTTGTTAGCATAAAGGGATAATTATTAATTA
TTATGTGCCGAAAGTTGCCTAAATAAAATTTAAACAAAGCATCAATTTGATGGAAAAAGAAAAGAAAAAGGAAACGTCGAGAGAATAATAGGGTATAAAATTACG
TCACGATATGCATCTTCCTATTTTTGTTGTTCTTAGTTACATGGGATGTTCAATGTTTAAAAACGGTCAACCCAAATGAAATATTATGTTGACAGCACATCACAC
TAAAGACTTGCGTGAGAGTTTTAAATTTATTTCTTTTTCTTCGAGACTATTATTAATATAATTATTGCCATAATAACCAATGAGGAAAGCCATTCAAAATACAGA
TATGAAAACACTAACATACTATAATTTCCAAGATAAAGTAATCATAAAAACAAAGAAGTTGGTTTGTAAACCCACTTATCTCAAAAGCACTGCCTGCCAGCAAAA
AGTTCCCTTCAGCTATGATCAACCTCTCCACCATGATTGCAGCAATCCTCATCCTATTCCTAAGTTTCATCAATGAAGGGTCTGCTATTGGAAGCTGCAGTTTGG
ACACCATTAACATAGGAACACAAAGAAGCGGAAGGGAGATTGGAGGGCAACCTGAATGGAACGTGCAAGTAATTAACAATTGCGATTGTCCTCAGAAGAAGATCG
TCTTGTCCTGTCCAGGGTTTCAGACTGTTGAACCCGTTGATCCATCGATTCTTTCAAAGCAAGGGGACACTTGCCTTCTCATAAACGGAGGAATTGTACAACCTG
GTTCTTCAGTTTCATTTTCCTATGCTTGGGATCCCCCTGTCATCATGTTCCCTCGTTTCTCTGTTCCTCAGTGTCCTACCTGAAGATCCAAAAACAATTTTTTTT
AAAAAAAAAAACGGTTATCAATTTAGTCTGAGTTGATATTGTAGTTAAGAAAAAAAAATTGAAAAATAATCGTTCCTTCTGTATGAAAAGAAGAATATAGGTGAT
GTCTTAAGAGTTAAGCCCATATTTCTTGAGGTTGTTTCCTTCACCTGATTGATCTACTAAAGATGGGACTGTCAGCTTATAGTTATTTGGTACAAGTGAGAAATT
TTACCTGTAGGAATGTCTTTTCTCTAAACAAATGTTGCCATCCTCACATGAGTTTGACAATAGAATAGAACCTGCCTTTCTGAAAGATTAATATAATATAAGCAA
CTTGTATAGCTTGTATTTGTACAGCATGATTTCTCATTCAGGGTATGTGACAGTTGGAAAGACAGAGTGTTGTATGTATAAATAAAAGAAGCTTTC

Protein sequence

Show/hide protein sequence

MINLSTMIAAILILFLSFINEGSAIGSCSLDTINIGTQRSGREIGGQPEWNVQVINNCDCPQKKIVLSCPGFQTVEPVDPSILSKQGDTCLLINGGIVQPGSSVS
FSYAWDPPVIMFPRFSVPQCPT

CmUC05G097610 (gene) of Watermelon (USVL531) v1 genome