CuGenDBv2

Gene ID	Clc09G03590
Organism	Citrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
Description	GAG1At protein
Genome location	ClcChr09:2743617..2745810
RNA-Seq Expression	Clc09G03590
Synteny	Clc09G03590
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004135879.1 uncharacterized protein LOC101214375 [Cucumis sativus]

1.1e-31

90.12

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        MSGEAKSGG SGG GGFRSRMEHYLYSGDKKHVAAGIV+ GIIFGIPWALMNRGSKH+SHQDYMERADKARSQRLSS   S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

XP_022953259.1 uncharacterized protein LOC111455862 [Cucurbita moschata]

2.9e-32

92.59

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        MSGEAKSGG  GGGGGFRSRMEHYLYSG+KKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS   S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

XP_022992483.1 uncharacterized protein LOC111488802 [Cucurbita maxima]

6.4e-32

91.36

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        MSG+AKSGG  GGGGGFRSRMEHYLYSG+KKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS   S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

XP_038897163.1 uncharacterized protein LOC120085312 isoform X1 [Benincasa hispida]

1.6e-38

86.27

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS-AP-ISCIFPLPLLTLNEGKLYS
        MSGEAK GG +GG GGFRSRMEHYLYSG+KKHVAAGIVVIGIIFGIPW LMNRGSKHQSHQDYME+ADKARSQRLSS AP ISCI P P+LTL EGKLYS
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS-AP-ISCIFPLPLLTLNEGKLYS

Query:  SR
         R
Subjt:  SR

XP_038897164.1 uncharacterized protein LOC120085312 isoform X2 [Benincasa hispida]

2.7e-38

78.57

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS-AP-ISCIFPLPLLTLNEGKLYS
        MSGEAK GG +GG GGFRSRMEHYLYSG+KKHVAAGIVVIGIIFGIPW LMNRGSKHQSHQDYME+ADKARSQRLSS AP ISCI P P+LTL EGKLYS
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS-AP-ISCIFPLPLLTLNEGKLYS

Query:  SRILMQSIALYS
           + +    Y+
Subjt:  SRILMQSIALYS

TrEMBL top hits

e value

%identity

Alignment

A0A1S3CEK3 uncharacterized protein LOC103499845

9.0e-32

90.12

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        MSGEAKSGG SGG GGFRSRME+YLYSGDKKHVAAGIV+ GIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS   S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

A0A5D3CFG0 Uncharacterized protein

9.0e-32

90.12

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        MSGEAKSGG SGG GGFRSRME+YLYSGDKKHVAAGIV+ GIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS   S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

A0A6J1DAT5 uncharacterized protein LOC111018966

3.0e-27

80.95

Show/hide

Query:  MSGEAKSGGGSGGGG-------GFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS
        M GE K GG SGGGG       GFRSRMEH+LYSGDKKHVAAGI VI IIFGIPW LM+RGSKHQSHQDYMERADKARSQRLSS
Subjt:  MSGEAKSGGGSGGGG-------GFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS

A0A6J1GP50 uncharacterized protein LOC111455862

1.4e-32

92.59

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        MSGEAKSGG  GGGGGFRSRMEHYLYSG+KKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS   S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

A0A6J1JZC0 uncharacterized protein LOC111488802

3.1e-32

91.36

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        MSG+AKSGG  GGGGGFRSRMEHYLYSG+KKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSS   S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G16000.1 unknown protein

3.1e-24

64.2

Show/hide

Query:  MSGEAKSGGG---SGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSA
        M  E K+ GG     GGGGFR++MEHY+YSG+KKHV  GI ++ IIFG+PW LM +GSKHQSHQDYM++ADKAR  RLSS+
Subjt:  MSGEAKSGGG---SGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSA

AT1G80890.1 unknown protein

1.8e-24

66.67

Show/hide

Query:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS
        M  E+KS   + GGGG R++MEHY+YSG+KKHV AGI +I IIFGIPW LMN+GSKH+SHQDY+E+ADKAR  RLSS+  S
Subjt:  MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPIS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

mRNA sequence

Show/hide mRNA sequence

ATGAGCGGCGAGGCTAAAAGCGGCGGCGGGAGCGGCGGAGGAGGTGGTTTCAGATCGAGAATGGAGCACTATTTATACAGCGGCGACAAAAAGCACGTCGCCGCTGGGAT
AGTCGTCATTGGTATCATCTTCGGCATCCCTTGGGCCCTCATGAATCGAGGATCAAAACATCAGTCGCATCAAGACTATATGGAAAGAGCTGATAAAGCTCGAAGTCAGA
GACTCTCTTCAGCTCCTATATCTTGCATTTTCCCCCTCCCTCTTCTGACATTAAATGAAGGCAAATTATACTCATCAAGAATATTAATGCAATCTATTGCATTGTATTCC
CAACCTGTGCCGAATCATAAAACCACTCTAAATAGTGAAGTCGTCCTTGAAGAAGGGACCCAGAGTTATGCCATTGTTGAATGATTCCAATTTAGACTATGTATGTTCTA
ATCTTGGGTGCTTCAAGAGTTGTTCTTTGTTTTTTTCTATTATTATTACTATTATTGTTCATATTTTTATGAGAAAATTTCCATGAACAAAGAAACAAGGGGTGAAATTA
GTATTATTGCCGTCTAGAGTTGGGAAAAATCTATTCAATCCTAATGAAGCTATAGCTTTAACCCTCAAACTGTTCCCATG

Protein sequence

Show/hide protein sequence

MSGEAKSGGGSGGGGGFRSRMEHYLYSGDKKHVAAGIVVIGIIFGIPWALMNRGSKHQSHQDYMERADKARSQRLSSAPISCIFPLPLLTLNEGKLYSSRILMQSIALYS
QPVPNHKTTLNSEVVLEEGTQSYAIVE

Clc09G03590 (gene) of Watermelon (cordophanus) v2 genome