CuGenDBv2

Gene ID	Bhi04G001030
Organism	Benincasa hispida cv. B227 (Wax gourd (B227) v1)
Description	Unknown protein
Genome location	chr4:32744228..32749468
RNA-Seq Expression	Bhi04G001030
Synteny	Bhi04G001030
Gene Ontology terms	GO:0009507 - chloroplast (cellular component) GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004138679.1 uncharacterized protein LOC101205088 [Cucumis sativus]

3.4e-62

88.06

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M +NPKF+ +KEDE++PKS  PFPWFSFLPKFDFRLPFP+NGGKKPP VVVDE RKAD+DAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAV+WQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDSSN
        LGGFLILSWAWARWKERRPQRRSNDD+EDEDSS+
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDSSN

XP_008456569.1 PREDICTED: uncharacterized protein LOC103496485 [Cucumis melo]

7.1e-60

87.12

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M +NPKF+ MKEDE++PKS  PFPWFSFLPKFDFRLPFP+NGGKK P VVVDE RKAD+DAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAV+WQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS
        LGGFLILSWAWARWKERRPQRRSNDD+ED+ S
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS

XP_023550786.1 uncharacterized protein LOC111808822 isoform X1 [Cucurbita pepo subsp. pepo]

2.0e-54

84.09

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M+E PK IGMKEDE SPK  FPF WFSFLPKFD RLP PINGGKKPPA V+DEG K DDDAQKPEFVRFPKA L V SVE EADVSGKTSNPAVIWQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS
        LGGFLILSWAWARWKERRP+RRS+DD+E+EDS
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS

XP_023550789.1 uncharacterized protein LOC111808822 isoform X3 [Cucurbita pepo subsp. pepo]

2.0e-54

84.09

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M+E PK IGMKEDE SPK  FPF WFSFLPKFD RLP PINGGKKPPA V+DEG K DDDAQKPEFVRFPKA L V SVE EADVSGKTSNPAVIWQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS
        LGGFLILSWAWARWKERRP+RRS+DD+E+EDS
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS

XP_038886165.1 uncharacterized protein LOC120076415 [Benincasa hispida]

6.2e-72

100

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDSSNI
        LGGFLILSWAWARWKERRPQRRSNDDEEDEDSSNI
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDSSNI

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LSR5 Uncharacterized protein

1.7e-62

88.06

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M +NPKF+ +KEDE++PKS  PFPWFSFLPKFDFRLPFP+NGGKKPP VVVDE RKAD+DAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAV+WQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDSSN
        LGGFLILSWAWARWKERRPQRRSNDD+EDEDSS+
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDSSN

A0A1S3C3J3 uncharacterized protein LOC103496485

3.5e-60

87.12

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M +NPKF+ MKEDE++PKS  PFPWFSFLPKFDFRLPFP+NGGKK P VVVDE RKAD+DAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAV+WQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS
        LGGFLILSWAWARWKERRPQRRSNDD+ED+ S
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS

A0A5D3CKR2 Uncharacterized protein

3.5e-60

87.12

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M +NPKF+ MKEDE++PKS  PFPWFSFLPKFDFRLPFP+NGGKK P VVVDE RKAD+DAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAV+WQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS
        LGGFLILSWAWARWKERRPQRRSNDD+ED+ S
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS

A0A6J1FFF8 uncharacterized protein LOC111444995

5.3e-53

82.58

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M+ENPK IGMKED  SPK  FPF WFSFLPKFD RLP PINGGKKPPA V+DE  K DD AQKPEFVRFPKA L V SVE EADVSGKTSNPAVIWQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS
        LGGFLILSWAWARWKERRP+RRS+DD+E+EDS
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS

A0A6J1JVP7 uncharacterized protein LOC111489298

1.8e-53

81.82

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA
        M+E+PK IG+KE E+SPK  FPF WFSFLPKFD RLP PINGGKKPPA V+DEG K D+DAQKPEFVRFPKA L V SVE EADVSGKTSNPAVIWQVYA
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYA

Query:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS
        LGGFLILSWAWARWKERRP+RRS+DD+E+EDS
Subjt:  LGGFLILSWAWARWKERRPQRRSNDDEEDEDS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G52230.1 unknown protein

1.2e-12

35.81

Show/hide

Query:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKP-----EFVRF----PKAELPVASVEAEADVSGKTSN
        MAE  + +      DS   P   P F     F F  P       KPP   +D         ++P     E V F    PK+  P+   EAE   SG+TSN
Subjt:  MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKP-----EFVRF----PKAELPVASVEAEADVSGKTSN

Query:  PAVIWQVYALGGFLILSWAWARWKER-----RPQRRSNDDEEDEDSSN
          ++WQVYALGGFL+L WAWARW ER     + +   +DD++D+D  +
Subjt:  PAVIWQVYALGGFLILSWAWARWKER-----RPQRRSNDDEEDEDSSN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCAGAGAACCCAAAATTTATTGGGATGAAAGAAGACGAGGATTCCCCAAAATCCCCCTTCCCCTTTCCTTGGTTCTCTTTTCTTCCCAAGTTTGACTTCCGA
TTGCCTTTTCCGATCAACGGCGGCAAGAAACCGCCGGCTGTGGTGGTTGATGAAGGCCGAAAGGCCGACGACGATGCTCAGAAGCCGGAGTTCGTGAGGTTTCCT
AAAGCAGAGTTGCCTGTCGCTTCGGTGGAGGCTGAAGCTGATGTCTCCGGCAAGACTTCCAATCCGGCGGTCATCTGGCAGGTATATGCCCTGGGTGGGTTTCTT
ATATTGAGTTGGGCATGGGCAAGATGGAAGGAGAGAAGGCCCCAAAGACGTTCAAATGATGACGAGGAGGACGAAGATTCCAGTAATATCTAG

mRNA sequence

Show/hide mRNA sequence

AAGGATCACAACAATGGACTGAGATTGTCTCTTTCTCTCATATTCATTGTAGCCATAATATTACAGCAAAAAAATGGCAGAGAACCCAAAATTTATTGGGATGAA
AGAAGACGAGGATTCCCCAAAATCCCCCTTCCCCTTTCCTTGGTTCTCTTTTCTTCCCAAGTTTGACTTCCGATTGCCTTTTCCGATCAACGGCGGCAAGAAACC
GCCGGCTGTGGTGGTTGATGAAGGCCGAAAGGCCGACGACGATGCTCAGAAGCCGGAGTTCGTGAGGTTTCCTAAAGCAGAGTTGCCTGTCGCTTCGGTGGAGGC
TGAAGCTGATGTCTCCGGCAAGACTTCCAATCCGGCGGTCATCTGGCAGGTATATGCCCTGGGTGGGTTTCTTATATTGAGTTGGGCATGGGCAAGATGGAAGGA
GAGAAGGCCCCAAAGACGTTCAAATGATGACGAGGAGGACGAAGATTCCAGTAATATCTAGTTTTGTGTTTGCCTTGAACAGCCCTTAATAAATGTTGAAGTTAC
ATTTTTAGTGCTAGAATCAATCTTGAGTTTATACCCGTTATTTGTAATTTCGAGTTAAATCAGTCATTTTCTAACCCTTTGTCAATCCTTGAAAATGATCTTAGT
ATGAAATTAAAACCCATCTCCATGAGGGTTTTCTAATGTATTGGTGCAAAAGCAACAATATTTGATCTTAATAAGAGGCTTCCTGCTTGCAAACGGTAATATGCA
AAAGCAAGTATTTAACGTTAGCCACCGTCTTCATGAGGCTTCAGAGTAAAGAAAACTTGTATGTTTGAATCCTTTGCTATCAGTCATTGCTATATATACATGATA
CAGAATTTGCAAGAGGTCAATGAATTGAAAACCAGCATTGGTTTATTACTATTATTAATCACAAAAGTAGTTGCCGGTAAAAGAATGATACATCTCGAGTAAAAC
ATGTACAGAGACCAAATTTATGCAGGAACTCAATCAAGTTTCTAACAAGCTATCAAGAAAATTTGACTAACTAAACCAACCTATTCCGTGTAGCCCTGAACAAGT
GTGGTAGTTTTGATTTGCCAGCTAACTCAACATTCTATGTACACCATCCTGAGACCCTTTCCTAATAACTGGGGTCCATGATATGCGACTGGTACCGCATATAAC
TTAATGGTATATCCTTCGCAAGAGCAACGAGAAAATCCGGTTCATACCAAAACCAAGTAGTTCACTCTGGCTTGAAATAACCATCATATATGGATAGTTGATCGA
ATGCATCAAAATTTGCCTTCAGTCCAATAAATTGGCTACCCAAATGAGCACAACCAGCATCAGGCCACCGACACCCTCCGTCCCGAGTGCGTAATGGGCAAAGAG
CTTCACAGATGTGACCGAGGGGGTTACTTGGAACATCATCTGCTGTAACTGTGATAGAAAGGGAGAGGTCATTCTCTTCACTGGGGGATGGCAGTGAACGATGTG
AAACCCTTCTTGAAGCAGGATGACTTTTCTGGTTGGATTTTTTCATCAGGTCGCCCTCAATATCAACAGTACAATAACCATTACTAGAGACTTGAACCTTGCAAC
CTAGAGACTGAATTGCTCTCTTTATGGCTTCACATTCTTTGCTTGCACTTTTTGCAGCATTCCTAGCAGATATACTTAATTGTTTCTCGTTTTGCAACTCTGATT
TTAATGATTCCATGGCAGCCGTCATCTCCTGGGCTTTTCTCTCGGCCATTTCTTTGTCCTATTAGGCATTTTATGGTATGCAAGAATCAATCAGGTTGACACTGA
GGACAACAAAACATTGTACATAAACGACGCCCATACATAAAATTAACTTTCAAGAAACAACAGGTTCACCAACTATGAATAAACCGAATCTTAAGTGGTTATAGA
AAGCCACTTCTCTCTTTTCGGTTTTGGCTACTGTTCATTTGCTCCAAAACAATCAGATTAAAGTAAAAGTCATATAATATCAGCAATCCAATTACTATAGAACTA
CTTCAATGAAGTAAGGGGAAGTTGTGCATTGCAACAGAATAAATAGTTTTGTAAGTTCCTTGGCTTGGAAGTTGGAATTCTTTGGCTATCCCCCCTCTTTTTGTG
ATTTCATACCATCAACAGGAGAATATAAAAAATGAAAACAATTTGTTCTTGTGCAGAGAACTCCCAAGATAATTTTTAAAAACAGTTCATTAAAAAAAAAAAAAA
AAACTGCAGCTGTTTTTTGTTGTATTCTTTAGTGTGTTACAACTGTCCCTGCGTTTGGAACTAAAACGATAGAAGATAAATTTTGAGACAAACCAATTTGAAAAG
GAGTTTTTTAAAACAAAGTTTAAAAATACAACCAAACAATGAATTAAATTTCTTCTGCAACTGTTTCTAGAGTTCGGGACATTTATTCATGATCCAAGTATGAGA
AAAGAATCGTACCTTCTGCATTTCAGAGAATTTTATAGCCATTTTCCTGCATCTGACTTCAAGTTCCCCAGCTTGGGATTCTTTTGGACAAGCCCAACGAAGATG
GAATTGTGGCCAGAGAGTTGGAGCTAGAGCTGCTGCCGGAGGTAAGATAGGGCCTTCATGTTTGGTAGGTTCATAGAAGAGGTTATAATGCACATGTGAACTTCC
TTCCGAGGCTCGTAAATCAGCTAAATATGCCCATAGACAGCCACAAACTTCAGAAACTGCACATTGCTGCCGCTCCTTCTCACTGAGACATCAGAAAACAATCAT
TCACCAAGTCCCTCCAATAAGTGCTATTATTAACGTTTAACAATTTAGGGCGCGTTTGGGGTACTGAGTTGGTTATTATAGTCAATGGGTTATAAGAGTTTGTGT
TTAAGGGTGCAAACTATTTTTATTTGGATAAGAAATAGTAAATGTTGTAGCAAGAAAAGAAGACAGGATGATTGAAATATAATAAATACGGTAGCAAATGGTAAA
TACTATAGCAAAAAGGAGTTTGAAATAGTATTTATTATAGTTAATTGTAGGTTATGCTTAGAATTCAAGGATACAATTGTACAACCTATAGAATAGATCCTGTTC
AAGTAAGGTCGTTATGCTTAATTGTAAGTTATAAATAATTGTTCACACCACTATTATACTTGGTGCGCCAAAGCATGGAGTGGGCTATAATAACCTACTCCACCA
ATTTCTAGTTGGTGCCCCCAAACGGCCCCTTAAGATCAGTAGTGTAAGATATATATAACATGGGCCAGTTACACGGAACTATTCCAAGAAATAAACTGTCTTAAA
AGTTCTAATCATGGAATAATGATCTTTATCTACAGACAATAGTTAAACAGG

Protein sequence

Show/hide protein sequence

MAENPKFIGMKEDEDSPKSPFPFPWFSFLPKFDFRLPFPINGGKKPPAVVVDEGRKADDDAQKPEFVRFPKAELPVASVEAEADVSGKTSNPAVIWQVYALGGFL
ILSWAWARWKERRPQRRSNDDEEDEDSSNI

Bhi04G001030 (gene) of Wax gourd (B227) v1 genome