CuGenDBv2

Gene ID	CsGy4G001030
Organism	Cucumis sativus L. var. sativus cv. Gy14 (Cucumber (Gy14) v2.1)
Description	BEST Arabidopsis thaliana protein match is: 3'-5' exonuclease domain-containing protein / K homology domain-containing protein / KH domain-containing protein .
Genome location	Gy14Chr4:624601..628162
RNA-Seq Expression	CsGy4G001030
Synteny	CsGy4G001030
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004152357.1 uncharacterized protein LOC101212915 isoform X1 [Cucumis sativus]

9.00e-192

100

Show/hide

Query:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC
        MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC
Subjt:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC

Query:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM
        ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM
Subjt:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

XP_008454305.1 PREDICTED: uncharacterized protein LOC103494744 isoform X1 [Cucumis melo]

3.10e-183

97.05

Show/hide

Query:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPP TSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCST SPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

XP_008454306.1 PREDICTED: uncharacterized protein LOC103494744 isoform X2 [Cucumis melo]

2.28e-174

94.1

Show/hide

Query:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPP TSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPAR        DEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCST SPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

XP_011652951.1 uncharacterized protein LOC101212915 isoform X2 [Cucumis sativus]

6.62e-183

97.04

Show/hide

Query:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC
        MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPAR        DEMSWQYSPMSEDSDDCRFC
Subjt:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC

Query:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM
        ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM
Subjt:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

XP_038904570.1 uncharacterized protein LOC120090942 [Benincasa hispida]

6.24e-175

94.44

Show/hide

Query:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC
        MGVESNSAPPP  SSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQR+EMSWQYSPMSEDSDDCRFC
Subjt:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC

Query:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM
        ETSTNLFP+QSDSSVPTSPVSPYRYQRPFSGV PSTGTNTSLGCST SPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSSM
Subjt:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        ELPYCSMPEPGPNIEAE+RPCSCIKSLVDER +QLEECSSMG  VSE EYNE+KSCKDLNRDMKDS SGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KWN0 Uncharacterized protein

4.36e-192

100

Show/hide

Query:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC
        MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC
Subjt:  MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFC

Query:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM
        ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM
Subjt:  ETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

A0A1S3BXT2 uncharacterized protein LOC103494744 isoform X1

1.50e-183

97.05

Show/hide

Query:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPP TSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCST SPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

A0A1S3BYE6 uncharacterized protein LOC103494744 isoform X2

1.10e-174

94.1

Show/hide

Query:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPP TSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPAR        DEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCST SPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

A0A5A7TRC2 Uncharacterized protein

1.50e-183

97.05

Show/hide

Query:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPP TSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPP-TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCST SPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

A0A6J1F722 uncharacterized protein LOC111441454 isoform X1

1.58e-169

91.94

Show/hide

Query:  MGVESNSAPPPP---TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDC
        MGVESNS PPPP   +SSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLY RDEMS QYSPMSEDSDDC
Subjt:  MGVESNSAPPPP---TSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDC

Query:  RFCETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGP
        RFCETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+ PSTGTNTSLGC+T  PVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GP
Subjt:  RFCETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGP

Query:  SSMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG
        SSMELPYCSMPEPGPNIEAE+R CS IKSLVDERVYQL ECSSMG  VSE EYNEQKSCKDLNR+MKDS SGG
Subjt:  SSMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G25920.1 BEST Arabidopsis thaliana protein match is: 3'-5' exonuclease domain-containing protein / K homology domain-containing protein / KH domain-containing protein (TAIR:AT2G25910.2)

1.5e-59

55.3

Show/hide

Query:  PPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFCE--TSTNL
        PP P S S   SP GKR RDP+DEVYLDN  S KRYLSEIMA SLNGLTVGD L  N+++SPARSES LY RD++S QYSPMSEDSD+ RFCE  T+T  
Subjt:  PPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFCE--TSTNL

Query:  FPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSP---------VTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGP
          S    S PTSPVSPYRYQRP +       + T L  S T P          T+ Q  QRGSD+EGRFPSSPSDICHS DLRR ALLRSVQMR QP G 
Subjt:  FPSQSDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSP---------VTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGP

Query:  SSMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEY-NEQKSCKDLN
        SS   P         NI+ E+R CS  KS+ ++R Y      + G  +  +E  ++ KSCK L+
Subjt:  SSMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEY-NEQKSCKDLN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGCGTCGAATCAAACTCCGCGCCGCCCCCGCCAACGTCCTCCTCTTCTACGCCATCTCCGAGCGGGAAGAGGGCCAGAGATCCCGACGATGAAGTTTACCTCGACAA
TTTCCACTCTCACAAACGCTACCTCAGTGAGATAATGGCTTCTAGTTTGAACGGATTGACGGTGGGGGACCCCCTTTCAGAGAATCTTATGGATTCCCCTGCGAGGTCAG
AGTCTATGCTTTATCAAAGGGATGAAATGTCCTGGCAATATTCCCCTATGTCAGAAGACTCAGATGACTGCCGGTTTTGTGAGACATCCACCAATTTGTTTCCCTCGCAG
TCTGATAGCAGTGTACCTACCAGCCCGGTCTCTCCATACCGATATCAGAGGCCATTCAGTGGGGTGGCTCCTTCAACAGGTACCAATACTTCGCTTGGATGTTCTACTAC
CAGTCCCGTCACTAGCTTGCAGCCCCATCAACGTGGATCAGATTCTGAGGGTCGTTTCCCATCATCTCCAAGTGATATATGTCACTCAGCAGATCTGAGAAGGGCTGCGC
TCCTGCGTTCGGTACAGATGAGAGCACAACCTCCTGGTCCATCATCTATGGAGTTGCCATATTGCTCTATGCCTGAGCCTGGACCAAATATAGAAGCTGAAGACCGGCCA
TGCTCTTGTATAAAATCGTTGGTTGATGAAAGAGTTTATCAACTTGAGGAATGCTCATCAATGGGGTTGGGAGTGTCTGAGTCCGAATATAATGAACAGAAATCATGCAA
GGACTTGAACAGGGATATGAAAGACAGCCGGTCTGGAGGGTAG

mRNA sequence

Show/hide mRNA sequence

TTTTAAACGAATATTTATTTATTAGTAGCTGTGAATGGGAAAAACTCCCAAACTTAATCTATATAACCCCATCATAATTAATGTTTGATGTAAATATTAAAGTTTTAAAG
AAATTTGTAGAAATGTTTAGAGCTTCAAAATTCAAACTTTTATAAAAATCCCAAACAAAAGTTTGAAATAATAAAATTAAAGCTGTTTTTGGGAAAATTCGAAGGAGAGT
CCCAGAAAGGGGAAAACCATAGAAAAAGCTTTGTTGTTGTTCATCTTCTACAATTCCTTCCGGTGATTCCATTTCCAGTTTCAAAAATCGCCAACATTCTCCTCTTCTCC
ACCCGAAGGATCATCGAATTTCTATTTTTTGCTTCCATTTCTTGCTCCGGAAACTGTTCAAGTTGCCCTAATGGGCGTCGAATCAAACTCCGCGCCGCCCCCGCCAACGT
CCTCCTCTTCTACGCCATCTCCGAGCGGGAAGAGGGCCAGAGATCCCGACGATGAAGTTTACCTCGACAATTTCCACTCTCACAAACGCTACCTCAGTGAGATAATGGCT
TCTAGTTTGAACGGATTGACGGTGGGGGACCCCCTTTCAGAGAATCTTATGGATTCCCCTGCGAGGTCAGAGTCTATGCTTTATCAAAGGGATGAAATGTCCTGGCAATA
TTCCCCTATGTCAGAAGACTCAGATGACTGCCGGTTTTGTGAGACATCCACCAATTTGTTTCCCTCGCAGTCTGATAGCAGTGTACCTACCAGCCCGGTCTCTCCATACC
GATATCAGAGGCCATTCAGTGGGGTGGCTCCTTCAACAGGTACCAATACTTCGCTTGGATGTTCTACTACCAGTCCCGTCACTAGCTTGCAGCCCCATCAACGTGGATCA
GATTCTGAGGGTCGTTTCCCATCATCTCCAAGTGATATATGTCACTCAGCAGATCTGAGAAGGGCTGCGCTCCTGCGTTCGGTACAGATGAGAGCACAACCTCCTGGTCC
ATCATCTATGGAGTTGCCATATTGCTCTATGCCTGAGCCTGGACCAAATATAGAAGCTGAAGACCGGCCATGCTCTTGTATAAAATCGTTGGTTGATGAAAGAGTTTATC
AACTTGAGGAATGCTCATCAATGGGGTTGGGAGTGTCTGAGTCCGAATATAATGAACAGAAATCATGCAAGGACTTGAACAGGGATATGAAAGACAGCCGGTCTGGAGGG
TAGTAAATGCTAAAAATGTACAGAGGAAAATCTCTTCTAACATAACAACACATGTGACACATTGCTGCTGTGAGACTGGAAAATGTTTGCCTAATTTACTTGCTTTCTCT
TGATTGAGGATGGTTTAGTCTTCTGCTAGCTCCATTTCCAAGTGCGTGGTGCCTTGTGCTATTTTCATTGTCAAGTGTGTGTGGAAGTTGCGTTTAACCATTCAACGCCT
GTGAAGCCTGGGTTGGGAAGATGTTCATGGTTGATCTGGGTTAATCATGTATGAAAGCTCTGTCTATCTATTTGAGTCTATTGGAGCTACCGGAGTCAAGAGAAGAAGTT
TCTCAGAGTTAAGTTTATTGATAAATGATGCGGCTTTATGCGTCACAAGGTTGAAGTTGCAAGTGTTCCATTCGTTTCATATCTGTGAGAACACTGTTATTATTGAATTA
TTTTGTTCTAATTGTGTTATGAGCATGCAGGCATAATTGATGAGAAAACTAAAAGATTTAAAGAGGTGAGGAAGGGAGCAAAGGGAATTTGAAGCAAATAGCTAAAATAA
CATACATTATATTGTAGAGTATAGTAAAATTACCGATTAGATAGCTGATGTATCTATCATTGGTATGTATATTTTTTTTCCATTTGGATTTGTATAGTTGGAGACTGCAA
GTTACCATTCTGAAGAGCTACTGATCGTCCATAAAAAAATTGCATGTATCTATGTTGGGGGGTGTTTTCTCTCTTAGGTTTTCAACAGTTTTAAATCTTGTTGTTTTATT
TATATTAACTTTTGTTTTTG

Protein sequence

Show/hide protein sequence

MGVESNSAPPPPTSSSSTPSPSGKRARDPDDEVYLDNFHSHKRYLSEIMASSLNGLTVGDPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFCETSTNLFPSQ
SDSSVPTSPVSPYRYQRPFSGVAPSTGTNTSLGCSTTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPPGPSSMELPYCSMPEPGPNIEAEDRP
CSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSRSGG

CsGy4G001030 (gene) of Cucumber (Gy14) v2.1 genome