CuGenDBv2

Gene ID	Tan0006457
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Protein BUNDLE SHEATH DEFECTIVE 2, chloroplastic
Genome location	LG01:101428875..101429790
RNA-Seq Expression	Tan0006457
Synteny	Tan0006457
Gene Ontology terms	GO:0061077 - chaperone-mediated protein folding (biological process) GO:0009570 - chloroplast stroma (cellular component) GO:0016020 - membrane (cellular component) GO:0101031 - chaperone complex (cellular component) GO:0044183 - protein folding chaperone (molecular function)
InterPro domains	IPR036410 - Heat shock protein DnaJ, cysteine-rich domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0038807.1 chaperone protein DnaJ-like [Cucumis melo var. makuwa]

1.2e-53

83.21

Show/hide

Query:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA
        MASS F  SA+CF+S TT+ AI  CSNQKLNLI N F  YS  ARFPHL  KAA NDRNTKPNSVICGDCDGNGAVLCSQCKG+GVNAVDFFNGQFKAG 
Subjt:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA

Query:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        SCWLCGG+KEMLCGNCNGAGFVGGFLSTYDQ
Subjt:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

XP_004136477.1 protein BUNDLE SHEATH DEFECTIVE 2, chloroplastic isoform X2 [Cucumis sativus]

6.2e-53

81.06

Show/hide

Query:  MASSFFPASASCFNSTTV--PAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAG
        MASS F  SA+CF+STT     I  CSNQKLNLI NGF  YS  ARFPHL  KAA NDRNTKPNSVICGDCDGNGAV+CSQCKG GVNAVDFFNGQFKAG
Subjt:  MASSFFPASASCFNSTTV--PAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAG

Query:  ASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
         SCWLCGG+KEMLCGNCNGAGF+GGFLSTYDQ
Subjt:  ASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

XP_008466412.1 PREDICTED: chaperone protein DnaJ-like [Cucumis melo]

3.6e-53

82.44

Show/hide

Query:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA
        MASS F  SA+CF+S TT+ A+  CSNQKLNLI NGF  YS  ARFPHL  KAA NDRNTKPNSVICGDCDGNGAVLCSQCKG+GVNAVDFFNGQFKAG 
Subjt:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA

Query:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        SCWLCGG+ EMLCGNCNGAGFVGGFLSTYDQ
Subjt:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

XP_022148277.1 uncharacterized protein LOC111016947 [Momordica charantia]

3.4e-59

86.05

Show/hide

Query:  MASSFFPASASCFNSTTVPAIGGCSNQKLNLISNGFRYSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASC
        MA S F ASA CFNSTTV AIGGCSN KLNLI NG  YSPAARFPHLN KAA NDRNTKPNS+ICGDCDGNGAVLCSQCKGSGVN  D FNGQFKAG SC
Subjt:  MASSFFPASASCFNSTTVPAIGGCSNQKLNLISNGFRYSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASC

Query:  WLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        WLCGGKK+MLCGNCNGAGF+GGFLSTYDQ
Subjt:  WLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

XP_038899028.1 protein BUNDLE SHEATH DEFECTIVE 2, chloroplastic-like [Benincasa hispida]

3.5e-56

84.73

Show/hide

Query:  MASSFFPASASCF-NSTTVPAIGGCSNQKLNLISNGF-RYSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA
        MASS F ASA+CF +STT+ AI G SNQKLNL++NGF  YS  ARFPHLN KAA NDRNTKPNSVICGDCDGNGAVLCSQCKG+GVNAVDFFNGQFKAGA
Subjt:  MASSFFPASASCF-NSTTVPAIGGCSNQKLNLISNGF-RYSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA

Query:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        SCWLCGG+KEMLCGNCNGAGF+GGFLSTYDQ
Subjt:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LDP8 Uncharacterized protein

3.0e-53

81.06

Show/hide

Query:  MASSFFPASASCFNSTTV--PAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAG
        MASS F  SA+CF+STT     I  CSNQKLNLI NGF  YS  ARFPHL  KAA NDRNTKPNSVICGDCDGNGAV+CSQCKG GVNAVDFFNGQFKAG
Subjt:  MASSFFPASASCFNSTTV--PAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAG

Query:  ASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
         SCWLCGG+KEMLCGNCNGAGF+GGFLSTYDQ
Subjt:  ASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

A0A1S3CSH4 chaperone protein DnaJ-like

1.8e-53

82.44

Show/hide

Query:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA
        MASS F  SA+CF+S TT+ A+  CSNQKLNLI NGF  YS  ARFPHL  KAA NDRNTKPNSVICGDCDGNGAVLCSQCKG+GVNAVDFFNGQFKAG 
Subjt:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA

Query:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        SCWLCGG+ EMLCGNCNGAGFVGGFLSTYDQ
Subjt:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

A0A5A7TB44 Chaperone protein DnaJ-like

6.0e-54

83.21

Show/hide

Query:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA
        MASS F  SA+CF+S TT+ AI  CSNQKLNLI N F  YS  ARFPHL  KAA NDRNTKPNSVICGDCDGNGAVLCSQCKG+GVNAVDFFNGQFKAG 
Subjt:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA

Query:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        SCWLCGG+KEMLCGNCNGAGFVGGFLSTYDQ
Subjt:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

A0A5D3E725 Chaperone protein DnaJ-like

1.8e-53

82.44

Show/hide

Query:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA
        MASS F  SA+CF+S TT+ A+  CSNQKLNLI NGF  YS  ARFPHL  KAA NDRNTKPNSVICGDCDGNGAVLCSQCKG+GVNAVDFFNGQFKAG 
Subjt:  MASSFFPASASCFNS-TTVPAIGGCSNQKLNLISNGFR-YSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGA

Query:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        SCWLCGG+ EMLCGNCNGAGFVGGFLSTYDQ
Subjt:  SCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

A0A6J1D4M9 uncharacterized protein LOC111016947

1.6e-59

86.05

Show/hide

Query:  MASSFFPASASCFNSTTVPAIGGCSNQKLNLISNGFRYSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASC
        MA S F ASA CFNSTTV AIGGCSN KLNLI NG  YSPAARFPHLN KAA NDRNTKPNS+ICGDCDGNGAVLCSQCKGSGVN  D FNGQFKAG SC
Subjt:  MASSFFPASASCFNSTTVPAIGGCSNQKLNLISNGFRYSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASC

Query:  WLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        WLCGGKK+MLCGNCNGAGF+GGFLSTYDQ
Subjt:  WLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

SwissProt top hits

e value

%identity

Alignment

Q9SN73 Protein BUNDLE SHEATH DEFECTIVE 2, chloroplastic

6.9e-31

71.6

Show/hide

Query:  KAANND-RNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        KAANN+ + TKPNS++C +C+G G V CSQCKG GVN +D FNGQFKAGA CWLC GKKE+LCG+CNGAGF+GGFLST+D+
Subjt:  KAANND-RNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

Q9XF14 Protein BUNDLE SHEATH DEFECTIVE 2, chloroplastic

3.2e-28

58.62

Show/hide

Query:  LNSKAANNDRNTKPN----SVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        + +KA  ND++ K +    S++C DC+GNGA++C++C+G+GVN+VD+F G+FKAG+ CWLC GK+E+LCGNCNGAGF+GGFLST+D+
Subjt:  LNSKAANNDRNTKPN----SVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

Arabidopsis top hits

e value

%identity

Alignment

AT3G47650.1 DnaJ/Hsp40 cysteine-rich domain superfamily protein

4.9e-32

71.6

Show/hide

Query:  KAANND-RNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ
        KAANN+ + TKPNS++C +C+G G V CSQCKG GVN +D FNGQFKAGA CWLC GKKE+LCG+CNGAGF+GGFLST+D+
Subjt:  KAANND-RNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASCWLCGGKKEMLCGNCNGAGFVGGFLSTYDQ

AT5G17840.1 DnaJ/Hsp40 cysteine-rich domain superfamily protein

3.3e-04

36.21

Show/hide

Query:  CGDCDGNGAVLCSQCKGSGVNAVDFFNGQ-FKAGASCWLCGGKKEMLCGNCNGAGFVG
        C  C+  GA+LCS C G+G+        Q       C  CGG   ++C  C G G VG
Subjt:  CGDCDGNGAVLCSQCKGSGVNAVDFFNGQ-FKAGASCWLCGGKKEMLCGNCNGAGFVG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGTCTTCATTTTTCCCGGCATCGGCAAGTTGCTTCAATTCCACTACAGTTCCAGCAATTGGAGGTTGTAGCAATCAGAAGCTCAACCTGATTAGCAATGGCTTCCG
TTATTCTCCAGCTGCTCGATTCCCTCATCTAAATAGCAAGGCTGCGAATAATGATCGGAACACAAAACCTAATAGCGTGATTTGTGGCGATTGTGATGGAAATGGTGCTG
TTCTTTGCTCGCAATGCAAAGGAAGTGGAGTTAATGCTGTTGATTTCTTCAATGGACAGTTCAAAGCCGGAGCATCTTGTTGGCTGTGCGGGGGGAAAAAGGAAATGCTG
TGTGGGAATTGCAATGGGGCTGGCTTCGTTGGAGGTTTTCTCAGCACTTATGATCAATAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASSFFPASASCFNSTTVPAIGGCSNQKLNLISNGFRYSPAARFPHLNSKAANNDRNTKPNSVICGDCDGNGAVLCSQCKGSGVNAVDFFNGQFKAGASCWLCGGKKEML
CGNCNGAGFVGGFLSTYDQ

Tan0006457 (gene) of Snake gourd v1 genome