CuGenDBv2

Gene ID	Sgr029503
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic
Genome location	tig00153403:1420592..1432894
RNA-Seq Expression	Sgr029503
Synteny	Sgr029503
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	IPR003425 - CCB3/YggT

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6575811.1 Protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia]

3.7e-88

80.27

Show/hide

Query:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR
        MAA  CS L+AIRVIG              +GSSPLIPN+GNSS  RGF +HPQ NPNCRFQA +CSSSLLG+ TSSKIHL L YATPPLKP     AAR
Subjt:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR

Query:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
        TIPFALQDAS+AASDFM N++LADLDP TAKLAIGFLGPFLSAFSFLFI RIVMSWYPKLP+GKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
Subjt:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG

Query:  LVSFLNEILLGPQGLLVLLSQQI
        LVSFLNEILLGPQGLLVLLSQQ+
Subjt:  LVSFLNEILLGPQGLLVLLSQQI

XP_004136016.2 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X1 [Cucumis sativus]

4.1e-87

78.03

Show/hide

Query:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR
        MAA  CS L++IRVIG              IGSSPL PN+GNS+  RGFK+HPQRNPNC+FQA++CSSSLLG+ TSSK  LSLAY  PPLKPAA YEAAR
Subjt:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR

Query:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
        TIPF LQDASMAASDF+ +M LADLDP TAKLAI FLGP LS FSFLFI RIVMSWYPKLP+GKFPYVIAYAPTEPLL+ATRKVIPPLGGVDVTPVVWFG
Subjt:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG

Query:  LVSFLNEILLGPQGLLVLLSQQI
        L+SFLNEILLGPQGLLVLLSQQ+
Subjt:  LVSFLNEILLGPQGLLVLLSQQI

XP_022991242.1 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X1 [Cucurbita maxima]

5.5e-84

78.92

Show/hide

Query:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR
        MAA  CS L+AIRVIG              +GSS LIPN+GNSS+ RGF +HPQ NPNCRFQA +CSSSLLG+ TSSKI L L  ATP LKP     AAR
Subjt:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR

Query:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
        TIPFALQDASMAASDF  N+ALADLDP TAKLAIGFLGPFLSAFSFLFI RIVMSWYPKLP+GKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
Subjt:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG

Query:  LVSFLNEILLGPQGLLVLLSQQI
        LVSFLNEILLGPQGLLVLLSQQ+
Subjt:  LVSFLNEILLGPQGLLVLLSQQI

XP_023548987.1 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X1 [Cucurbita pepo subsp. pepo]

2.8e-88

80.72

Show/hide

Query:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR
        MAA  CS L+AIRVIG              +GSSPLIPN+GNSS  RGF +HPQ NPNCRFQA +CSSSLLG+ TSSKIHL L YATPPLKP     AAR
Subjt:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR

Query:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
        TIPFALQDASMAASDFM N+ALADLDP TAKLAIG LGPFLSAFSFLFI RIVMSWYPKLP+GKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
Subjt:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG

Query:  LVSFLNEILLGPQGLLVLLSQQI
        LVSFLNEILLGPQGLLVLLSQQ+
Subjt:  LVSFLNEILLGPQGLLVLLSQQI

XP_038896182.1 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X1 [Benincasa hispida]

1.4e-90

81.9

Show/hide

Query:  AACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAARTI
        AA CS L+ IRV                IGSSPLIPNYGNSS SRGFK+HPQRNPNCRFQA +CSSS+L + T+SK+HLSLAYAT PLKPAA YEAARTI
Subjt:  AACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAARTI

Query:  PFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLV
        PFALQDASM+ASDFM N+ALADLDP  AKLAIGFLGPFLSAFSFLFI RIVMSWYPKLP+GKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLV
Subjt:  PFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLV

Query:  SFLNEILLGPQGLLVLLSQQI
        SFLNEILLGPQGLLVLLSQQ+
Subjt:  SFLNEILLGPQGLLVLLSQQI

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K9A7 Uncharacterized protein

2.0e-87

78.03

Show/hide

Query:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR
        MAA  CS L++IRVIG              IGSSPL PN+GNS+  RGFK+HPQRNPNC+FQA++CSSSLLG+ TSSK  LSLAY  PPLKPAA YEAAR
Subjt:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR

Query:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
        TIPF LQDASMAASDF+ +M LADLDP TAKLAI FLGP LS FSFLFI RIVMSWYPKLP+GKFPYVIAYAPTEPLL+ATRKVIPPLGGVDVTPVVWFG
Subjt:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG

Query:  LVSFLNEILLGPQGLLVLLSQQI
        L+SFLNEILLGPQGLLVLLSQQ+
Subjt:  LVSFLNEILLGPQGLLVLLSQQI

A0A6J1CTL8 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X1

1.8e-80

88.95

Show/hide

Query:  SSVSRGFKHHPQRNPNCRFQALQCSSSLLG-TVTSSKIHLSLAYATPPLKPAAVYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFL
        +S+ RGFKHHPQRNPN RFQALQCSSSLLG TVTSSK+ L LA ATPPLKPAA +E  RT PFALQDASMAASDF  NMALADLDPATAKLAIGFLGPFL
Subjt:  SSVSRGFKHHPQRNPNCRFQALQCSSSLLG-TVTSSKIHLSLAYATPPLKPAAVYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFL

Query:  SAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQ
        SAFSFLFI+RIVMSWYPKLP+GKFPYV+AYAPTEPLLI TRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQ
Subjt:  SAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQ

A0A6J1CUI3 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X2

1.8e-80

88.95

Show/hide

Query:  SSVSRGFKHHPQRNPNCRFQALQCSSSLLG-TVTSSKIHLSLAYATPPLKPAAVYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFL
        +S+ RGFKHHPQRNPN RFQALQCSSSLLG TVTSSK+ L LA ATPPLKPAA +E  RT PFALQDASMAASDF  NMALADLDPATAKLAIGFLGPFL
Subjt:  SSVSRGFKHHPQRNPNCRFQALQCSSSLLG-TVTSSKIHLSLAYATPPLKPAAVYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFL

Query:  SAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQ
        SAFSFLFI+RIVMSWYPKLP+GKFPYV+AYAPTEPLLI TRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQ
Subjt:  SAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQ

A0A6J1CUU2 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X3

1.1e-80

88.46

Show/hide

Query:  SSVSRGFKHHPQRNPNCRFQALQCSSSLLG-TVTSSKIHLSLAYATPPLKPAAVYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFL
        +S+ RGFKHHPQRNPN RFQALQCSSSLLG TVTSSK+ L LA ATPPLKPAA +E  RT PFALQDASMAASDF  NMALADLDPATAKLAIGFLGPFL
Subjt:  SSVSRGFKHHPQRNPNCRFQALQCSSSLLG-TVTSSKIHLSLAYATPPLKPAAVYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFL

Query:  SAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQI
        SAFSFLFI+RIVMSWYPKLP+GKFPYV+AYAPTEPLLI TRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQ+
Subjt:  SAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLVSFLNEILLGPQGLLVLLSQQI

A0A6J1JL88 protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic isoform X1

2.7e-84

78.92

Show/hide

Query:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR
        MAA  CS L+AIRVIG              +GSS LIPN+GNSS+ RGF +HPQ NPNCRFQA +CSSSLLG+ TSSKI L L  ATP LKP     AAR
Subjt:  MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAAR

Query:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
        TIPFALQDASMAASDF  N+ALADLDP TAKLAIGFLGPFLSAFSFLFI RIVMSWYPKLP+GKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG
Subjt:  TIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFG

Query:  LVSFLNEILLGPQGLLVLLSQQI
        LVSFLNEILLGPQGLLVLLSQQ+
Subjt:  LVSFLNEILLGPQGLLVLLSQQI

SwissProt top hits

e value

%identity

Alignment

Q8RWM7 Protein COFACTOR ASSEMBLY OF COMPLEX C SUBUNIT B CCB3, chloroplastic

3.4e-44

74.22

Show/hide

Query:  VYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVT
        + EAA T     Q  S+  S+ + N++LADLDP TAKLAIG LGP LSAF FLFILRIVMSWYPKLP+ KFPYV+AYAPTEP+L+ TRKVIPPL GVDVT
Subjt:  VYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVT

Query:  PVVWFGLVSFLNEILLGPQGLLVLLSQQ
        PVVWFGLVSFL+EIL+GPQGLLVL+SQQ
Subjt:  PVVWFGLVSFLNEILLGPQGLLVLLSQQ

Arabidopsis top hits

e value

%identity

Alignment

AT5G36120.1 cofactor assembly, complex C (B6F)

2.4e-45

74.22

Show/hide

Query:  VYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVT
        + EAA T     Q  S+  S+ + N++LADLDP TAKLAIG LGP LSAF FLFILRIVMSWYPKLP+ KFPYV+AYAPTEP+L+ TRKVIPPL GVDVT
Subjt:  VYEAARTIPFALQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVT

Query:  PVVWFGLVSFLNEILLGPQGLLVLLSQQ
        PVVWFGLVSFL+EIL+GPQGLLVL+SQQ
Subjt:  PVVWFGLVSFLNEILLGPQGLLVLLSQQ

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCGCCGCCTGCTGCTCCCCTCTCACCGCCATTCGAGTAATAGGTTCTTTCTTTCTTTCTCCTCTTTCAATTTTCAATCCTAGTATAATAGGATCGTCCCCT
TTGATTCCTAACTATGGAAATTCAAGCGTCTCTAGAGGCTTCAAGCACCATCCTCAAAGAAATCCAAACTGCAGATTCCAGGCACTCCAATGTAGCTCATCTTTG
TTGGGTACTGTTACCTCTTCCAAGATTCATCTGTCATTAGCCTATGCCACCCCTCCATTAAAGCCAGCTGCTGTATATGAAGCTGCAAGGACTATCCCCTTTGCC
CTGCAAGATGCATCGATGGCTGCCTCGGATTTCATGACAAACATGGCCCTGGCCGACCTCGACCCAGCAACAGCAAAGCTCGCTATCGGCTTTCTGGGGCCATTT
CTCTCTGCATTTTCGTTTCTGTTTATCTTGAGAATAGTGATGTCTTGGTATCCAAAGTTGCCTCTGGGAAAGTTTCCATATGTTATAGCCTATGCCCCCACTGAA
CCACTTCTAATTGCAACAAGGAAGGTGATCCCCCCTCTCGGCGGAGTTGACGTAACGCCAGTCGTCTGGTTCGGATTGGTTAGTTTCCTCAACGAGATATTGCTT
GGTCCCCAAGGGCTGCTTGTCCTCCTTTCTCAACAGATTTTCAGTAACATTAACGAATCTGGGTTTGAACTCAAGTTAATTGACTGGTTGAGTCGGGCATTTCTT
CAAACATTTGGTGGGACAATTTGGACATTAACTTCGCAAGAGATTCAAGTAGAGAAAGTAGACTACCGAAAGAACTATATCGGATCAAAAGAGAAGAACAGGGCA
AACAGTGGCTGGTCGAAGTGCATGAAATCAGAAAAGTACCTCTTTTCCGCGAAAATGGAGGAAAATTTTGGGAGACGCTCTGCAGAAAAATTCTATCCACAGGCT
AAAATCAGGGAGGTGCGTTTGATTTATTTACAGCGACTTGTCATTTTTCAGTTCTCTTATCAGCAACCGGCTGCTGCAGAATATAAGGAGATTGACAGTTCTCCA
AGGGAGAGAGCTCTAGGAAAGCTCTGCACTCCCTCAGCTCCCTCTTGTCTTCTACCTCTGAAGAAGACAGTGTTGCCAAGAAGTAGCCATTTGCATCAGTTGATT
CACTCAGAAAGGAGTGTAGAAGAAAGGTCCAACGGAATACAACTTCATCTTGTTGTTCGCGAGAATGCGAAAAGAACGAAGCAGAGCACCCGCGACGCCATTGTT
GATGTTGGTGACAATGTCGCCAAGAAGTACCCATGCTCGTCCGTTGGAAAGCTAGAGAAGGAGAAGGGAGCCGCTTCGTTGCCTTTCTCGTTCAAAGCTAAGCAT
CGGAGGAAGAAACGGCGCCGGCGGCCAGCAGCCACAGCAGCAGCACCGGAGTTGCAGAGAGTTGCCTTGCGAGAGCCATCTGATCTGTATAACTTTGGAGCTGCG
AAGAATTATTGTTGGTTTGGGGGTTTTATAGAGAGATTGAATACTTGGACGCACGACGCCGGAGGAGGGCATGATGATGATGCCGACAGAAACAGCTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAAACCSPLTAIRVIGSFFLSPLSIFNPSIIGSSPLIPNYGNSSVSRGFKHHPQRNPNCRFQALQCSSSLLGTVTSSKIHLSLAYATPPLKPAAVYEAARTIPFA
LQDASMAASDFMTNMALADLDPATAKLAIGFLGPFLSAFSFLFILRIVMSWYPKLPLGKFPYVIAYAPTEPLLIATRKVIPPLGGVDVTPVVWFGLVSFLNEILL
GPQGLLVLLSQQIFSNINESGFELKLIDWLSRAFLQTFGGTIWTLTSQEIQVEKVDYRKNYIGSKEKNRANSGWSKCMKSEKYLFSAKMEENFGRRSAEKFYPQA
KIREVRLIYLQRLVIFQFSYQQPAAAEYKEIDSSPRERALGKLCTPSAPSCLLPLKKTVLPRSSHLHQLIHSERSVEERSNGIQLHLVVRENAKRTKQSTRDAIV
DVGDNVAKKYPCSSVGKLEKEKGAASLPFSFKAKHRRKKRRRRPAATAAAPELQRVALREPSDLYNFGAAKNYCWFGGFIERLNTWTHDAGGGHDDDADRNS

Sgr029503 (gene) of Monk fruit (Qingpiguo) v1 genome