CuGenDBv2

Gene ID	ClCG08G015590
Organism	Citrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
Description	Thioredoxin domain-containing protein
Genome location	CG_Chr08:28096329..28098691
RNA-Seq Expression	ClCG08G015590
Synteny	ClCG08G015590
Gene Ontology terms	GO:0006396 - RNA processing (biological process) GO:0045454 - cell redox homeostasis (biological process) GO:0009507 - chloroplast (cellular component)
InterPro domains	IPR013766 - Thioredoxin domain IPR036249 - Thioredoxin-like superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0041672.1 thioredoxin-like protein [Cucumis melo var. makuwa]

4.4e-99

87.68

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQP FCFKWPWDVD +N  DCSFEGPWLFKSLQNVG FAFNFVNKVSKSSP W+ TFK L+ +  TGGNKISQSRK+LTPEEQGEAENRA AAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEATVIEFYSPKC LCNSLLN VME+EARNS+WL+IVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHL+KLK+PK
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
        +TP
Subjt:  NTP

XP_004152726.1 uncharacterized protein LOC101203280 [Cucumis sativus]

2.2e-98

85.71

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQPFFCFKWPWDVDPKN  DCSFE PWLFKSLQNVG FAF+FVNK SKSSPPW+ TFK+L+ +  TGGNKISQSRK+LTPEEQGEAENRA AAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEAT+IEFYSPKC LCNSLLN V EMEARNS+WL+IVMADAENDKWLPELLHYDI YVPCFVLLDKHGKALAKT +PSSRLHVIAGLSHL+K+K+PK
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
        +TP
Subjt:  NTP

XP_008444648.1 PREDICTED: uncharacterized protein LOC103487919 [Cucumis melo]

1.8e-100

88.67

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQP FCFKWPWDVD KN  DCSFEGPWLFKSLQNVG FAFNFVNKVSKSSPPW+ TFK L+ +  TGGNKISQSRK+LTPEEQGEAENRA AAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEATVIEFYSPKC LCNSLLN VME+EARNS+WL+IVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHL+KLK+PK
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
        +TP
Subjt:  NTP

XP_022144394.1 uncharacterized protein LOC111014082 [Momordica charantia]

7.2e-102

89.55

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQPFFCFKWPWD DPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWIN FK L  +AS GGNK S  RK LTPEEQGEAE+RAFA+AL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEATVIEFYSPKCRLCNSLL+ VMEMEARNS+WLSIVMADAEN+KWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLL LK P+
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  N
        +
Subjt:  N

XP_038885736.1 uncharacterized protein LOC120076025 [Benincasa hispida]

1.3e-106

93.1

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQPFFC KWPWDVDPKNPFDCSFEGPWLFKSLQNVG FAFNFVNKVSKSSPPWINTFK L+LDASTGGN ISQSRK+LTPEEQGEAENRAFAAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEATVIEFYSPKC LCNSLLN VMEMEARNS+WL+IVMADAEN KWLPE+LHYDIRYVPCFVLLDKHGKALAKTGIPSSRL VIAGLSHL+KLKAPK
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
        NTP
Subjt:  NTP

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LRE2 Thioredoxin domain-containing protein

1.1e-98

85.71

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQPFFCFKWPWDVDPKN  DCSFE PWLFKSLQNVG FAF+FVNK SKSSPPW+ TFK+L+ +  TGGNKISQSRK+LTPEEQGEAENRA AAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEAT+IEFYSPKC LCNSLLN V EMEARNS+WL+IVMADAENDKWLPELLHYDI YVPCFVLLDKHGKALAKT +PSSRLHVIAGLSHL+K+K+PK
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
        +TP
Subjt:  NTP

A0A1S3BAS7 uncharacterized protein LOC103487919

8.6e-101

88.67

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQP FCFKWPWDVD KN  DCSFEGPWLFKSLQNVG FAFNFVNKVSKSSPPW+ TFK L+ +  TGGNKISQSRK+LTPEEQGEAENRA AAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEATVIEFYSPKC LCNSLLN VME+EARNS+WL+IVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHL+KLK+PK
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
        +TP
Subjt:  NTP

A0A5A7TE38 Thioredoxin-like protein

2.1e-99

87.68

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQP FCFKWPWDVD +N  DCSFEGPWLFKSLQNVG FAFNFVNKVSKSSP W+ TFK L+ +  TGGNKISQSRK+LTPEEQGEAENRA AAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEATVIEFYSPKC LCNSLLN VME+EARNS+WL+IVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHL+KLK+PK
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
        +TP
Subjt:  NTP

A0A6J1CS67 uncharacterized protein LOC111014082

3.5e-102

89.55

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        MGSTPKQPFFCFKWPWD DPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWIN FK L  +AS GGNK S  RK LTPEEQGEAE+RAFA+AL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        ASGKEATVIEFYSPKCRLCNSLL+ VMEMEARNS+WLSIVMADAEN+KWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLL LK P+
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  N
        +
Subjt:  N

A0A6J1KP92 uncharacterized protein LOC111496027

8.6e-93

81.77

Show/hide

Query:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL
        M STPKQP FCFKWPWD++PKNP DCSFEGPWLFKSLQNVG FA NF+N+VSKSSPPW+N FK L  D    GNKIS+SRK L+PEEQGEAENRAFAAAL
Subjt:  MGSTPKQPFFCFKWPWDVDPKNPFDCSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAAL

Query:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK
        A GKEATVIEFYSPKC LC+SLL FV +MEARNS WL+IVMADAENDKWLPE+LHYDI YVPCFV+LDK GKALAKTGIPSSRLHVIAGLSHLLKLK P 
Subjt:  ASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPK

Query:  NTP
          P
Subjt:  NTP

SwissProt top hits

e value

%identity

Alignment

P35088 Thiol:disulfide interchange protein TxlA

1.2e-06

35.38

Show/hide

Query:  VIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGK
        ++EFY+  C  C ++   +  ++   S+ L  VM + +NDKWLPE+L Y++  +P FV L+  G+
Subjt:  VIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGK

P73920 Thiol:disulfide interchange protein TxlA homolog

4.8e-08

34.57

Show/hide

Query:  AAALASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKT
        A AL +G+  T++EFY+  C  C ++   + E++      ++  M + +N+KWLPE+L Y +  +P FV LD  G A+A++
Subjt:  AAALASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKT

Arabidopsis top hits

e value

%identity

Alignment

AT5G06430.1 Thioredoxin superfamily protein

2.3e-66

58.94

Show/hide

Query:  KIKTIMGSTPKQPFFCFKWPWDVD--PKNPFD-CSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAE
        K+ T   ST K PFFC KWPWD +  PK+    C F+GPWLF+S+Q +G+ A + +    ++                         +K L+  EQGEAE
Subjt:  KIKTIMGSTPKQPFFCFKWPWDVD--PKNPFD-CSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAE

Query:  NRAFAAALASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSH
         RAFAAALAS KEATV+EFYS KCRLCNSLL FV+E+E RNSNWLSI MADAEN+KW PELLHYD++YVPCFVLLDK+G+ALAKTG+PSSR HVIAG+SH
Subjt:  NRAFAAALASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSNWLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSH

Query:  LLKLKAP
        LLK+K P
Subjt:  LLKLKAP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAACTTAAAAAGAAAAAGGAAAAAAAGAAAAAAAGAAGAAGAGGAGAATGGAGGCAGAAAAGCCATCTCCAGAGCTCGCCCTGCTTTGTTAGCTGTTACCATTTTCAC
ATCCTTCTCCTTGTCGCCTACGAATTGTCCAAAGGAGTTCCGAGGGGCATCTCCTTTCTCAGTCCTAGTACCCCGCTTCTGGAAGCTCAATAAGGGGCAGGGTGATAGTT
TTATAGGAAGGGAAAGAAGAAAGATAAAGACTATAATGGGTTCAACACCCAAACAACCTTTCTTTTGCTTCAAATGGCCATGGGACGTAGACCCTAAAAATCCTTTCGAC
TGTTCGTTTGAGGGTCCTTGGCTGTTCAAATCGCTGCAAAATGTGGGTGCCTTTGCTTTCAATTTTGTAAATAAAGTTTCGAAGTCGTCGCCTCCATGGATCAATACTTT
TAAGGCGTTGCGATTGGATGCCTCAACTGGTGGAAATAAGATATCTCAGTCTAGAAAGATATTAACTCCTGAAGAGCAAGGGGAGGCAGAAAATAGAGCATTTGCTGCAG
CATTGGCCAGTGGGAAAGAAGCCACCGTGATTGAGTTCTACTCGCCCAAATGTCGCCTTTGCAATTCTTTGCTCAATTTTGTTATGGAGATGGAAGCAAGGAATTCAAAT
TGGCTTAGTATTGTGATGGCAGATGCAGAGAATGATAAATGGCTGCCCGAGCTTCTTCATTATGACATTAGATATGTTCCATGCTTTGTGTTGCTGGACAAACATGGGAA
GGCGCTAGCGAAGACGGGTATTCCTAGCAGTCGGCTTCATGTGATTGCAGGACTCTCTCATCTTCTCAAACTGAAAGCGCCCAAGAACACTCCCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNLKRKRKKRKKEEEENGGRKAISRARPALLAVTIFTSFSLSPTNCPKEFRGASPFSVLVPRFWKLNKGQGDSFIGRERRKIKTIMGSTPKQPFFCFKWPWDVDPKNPFD
CSFEGPWLFKSLQNVGAFAFNFVNKVSKSSPPWINTFKALRLDASTGGNKISQSRKILTPEEQGEAENRAFAAALASGKEATVIEFYSPKCRLCNSLLNFVMEMEARNSN
WLSIVMADAENDKWLPELLHYDIRYVPCFVLLDKHGKALAKTGIPSSRLHVIAGLSHLLKLKAPKNTP

ClCG08G015590 (gene) of Watermelon (Charleston Gray) v2.5 genome