CuGenDBv2

Gene ID	Pay0004533
Organism	Cucumis melo var. inodorus cv. Payzawat (Melon (Payzawat) v1)
Description	BEST Arabidopsis thaliana protein match is: 3'-5' exonuclease domain-containing protein / K homology domain-containing protein / KH domain-containing protein .
Genome location	chr07:28636349..28640274
RNA-Seq Expression	Pay0004533
Synteny	Pay0004533
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_004152357.1 uncharacterized protein LOC101212915 isoform X1 [Cucumis sativus]

1.9e-141

97.05

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSA PPPPTSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCS-TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCS TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCS-TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

XP_008454305.1 PREDICTED: uncharacterized protein LOC103494744 isoform X1 [Cucumis melo]

8.2e-148

100

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

XP_008454306.1 PREDICTED: uncharacterized protein LOC103494744 isoform X2 [Cucumis melo]

4.3e-141

97.04

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPA        RDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

XP_011652951.1 uncharacterized protein LOC101212915 isoform X2 [Cucumis sativus]

7.9e-135

94.1

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSA PPPPTSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPA        RDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCS-TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCS TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCS-TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

XP_038904570.1 uncharacterized protein LOC120090942 [Benincasa hispida]

6.1e-135

92.96

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPP   SSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPARSESMLYQR+EMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
        CETSTNLFP+QSDSSVPTSPVSPYRYQRPFSG+ PS GTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSSM
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        ELPYCSMPEPGPNIEAE+RPCSCIKSLVDER +QLEECSSM  GVSE EYNE+KSCKDLNRDMKDS+SGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KWN0 Uncharacterized protein

9.4e-142

97.05

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSA PPPPTSSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCS-TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSS
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSG+APS GTNTSLGCS TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPSS
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCS-TSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSS

Query:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDS+SGG
Subjt:  MELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

A0A1S3BXT2 uncharacterized protein LOC103494744 isoform X1

3.9e-148

100

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

A0A1S3BYE6 uncharacterized protein LOC103494744 isoform X2

2.1e-141

97.04

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPA        RDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

A0A5A7TRC2 Uncharacterized protein

3.9e-148

100

Show/hide

Query:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
        MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF
Subjt:  MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRF

Query:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
        CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM
Subjt:  CETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSM

Query:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
Subjt:  ELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

A0A6J1F722 uncharacterized protein LOC111441454 isoform X1

2.3e-132

91.91

Show/hide

Query:  MGVESNSAPPPPP--TSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDC
        MGVESNS PPPPP  +SSSSTPSPSGKRARDP+DEVYLDNFHSHKRYLSEIMASSLNGLTVG+PLSENLMDSPARSESMLY RDEMS QYSPMSEDSDDC
Subjt:  MGVESNSAPPPPP--TSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDC

Query:  RFCETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPS
        RFCETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGM PS GTNTSLGC+T PVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQP GPS
Subjt:  RFCETSTNLFPSQSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPS

Query:  SMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG
        SMELPYCSMPEPGPNIEAE+R CS IKSLVDERVYQL ECSSM  GVSE EYNEQKSCKDLNR+MKDS+SGG
Subjt:  SMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G25920.1 BEST Arabidopsis thaliana protein match is: 3'-5' exonuclease domain-containing protein / K homology domain-containing protein / KH domain-containing protein (TAIR:AT2G25910.2)

9.9e-59

54.17

Show/hide

Query:  PPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFCE--TSTNL
        PP P S S   SP GKR RDPEDEVYLDN  S KRYLSEIMA SLNGLTVG+ L  N+++SPARSES LY RD++S QYSPMSEDSD+ RFCE  T+T  
Subjt:  PPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFCE--TSTNL

Query:  FPSQSDSSVPTSPVSPYRYQRPFSG----------MAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGP
          S    S PTSPVSPYRYQRP +           +  S+    S+  + +  T+ Q  QRGSD+EGRFPSSPSDICHS DLRR ALLRSVQMR QP G 
Subjt:  FPSQSDSSVPTSPVSPYRYQRPFSG----------MAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGP

Query:  SSMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEY-NEQKSCKDLN
        SS   P         NI+ E+R CS  KS+ ++R Y      + G  +  +E  ++ KSCK L+
Subjt:  SSMELPYCSMPEPGPNIEAEDRPCSCIKSLVDERVYQLEECSSMGLGVSESEY-NEQKSCKDLN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGCGTCGAATCAAACTCCGCGCCGCCGCCGCCGCCAACGTCCTCGTCTTCTACGCCTTCTCCGAGCGGGAAGAGGGCCAGAGATCCCGAGGATGAAGTTTATCTCGA
CAATTTCCACTCTCACAAACGCTACCTCAGTGAGATAATGGCTTCTAGTTTGAATGGATTGACGGTGGGGGAGCCCCTTTCAGAGAATCTTATGGATTCCCCTGCGAGGT
CAGAGTCTATGCTTTATCAAAGGGATGAAATGTCCTGGCAATATTCCCCTATGTCAGAAGATTCAGATGACTGCCGGTTTTGTGAGACATCCACCAACTTGTTTCCCTCG
CAGTCAGATAGCAGTGTACCTACCAGCCCGGTCTCTCCATACAGATATCAGAGGCCATTCAGTGGGATGGCTCCTTCAAATGGTACCAATACTTCGCTTGGATGTTCTAC
CAGCCCTGTCACTAGCTTGCAGCCCCATCAACGTGGATCAGATTCTGAGGGTCGTTTCCCATCATCTCCAAGTGATATATGTCACTCAGCAGATCTGAGAAGGGCTGCGC
TCCTGCGTTCGGTACAGATGAGAGCACAACCTGCTGGTCCATCATCTATGGAGTTGCCATATTGCTCTATGCCTGAGCCTGGACCAAATATAGAAGCTGAAGACCGGCCA
TGTTCTTGTATAAAATCGTTGGTTGATGAAAGAGTTTATCAACTCGAGGAATGCTCATCTATGGGATTGGGAGTGTCTGAGTCTGAATATAATGAACAAAAATCATGCAA
GGACTTGAACAGGGATATGAAAGACAGCCAGTCTGGAGGGTAG

mRNA sequence

Show/hide mRNA sequence

AAAAAAATTACCATTCAAATTATTGTAGCAAACTTATGAATCTATACATAATAATTAATGTTTGAAACAATAGTTTGATGTAATTATTAAAGTTTGAAATAAATTTGTAG
AAAAGTTTAGACCTTCAAAATTCAAACTTTTATAAAAATCCGAAACAAAAGTTTGAAATAATAAAATTGAAACTGTTTTTGGGAAAATTCCAAGGAGAGTCCTCAAAAAG
GGAAAAACCAAAGAAAAAGCTTTGTTGTTGTTCATCTTCTACAATCCAAAACTTGTTCCGGTGATTCCAGTTCCAAAAATTGCCAACATTATCCTCTTCTCCTCGCTAAA
GGGTCATCGAATTCCTATTTTTTGCTCGGGAAGCTGTTGAAGTTGCCCTGATGGGCGTCGAATCAAACTCCGCGCCGCCGCCGCCGCCAACGTCCTCGTCTTCTACGCCT
TCTCCGAGCGGGAAGAGGGCCAGAGATCCCGAGGATGAAGTTTATCTCGACAATTTCCACTCTCACAAACGCTACCTCAGTGAGATAATGGCTTCTAGTTTGAATGGATT
GACGGTGGGGGAGCCCCTTTCAGAGAATCTTATGGATTCCCCTGCGAGGTCAGAGTCTATGCTTTATCAAAGGGATGAAATGTCCTGGCAATATTCCCCTATGTCAGAAG
ATTCAGATGACTGCCGGTTTTGTGAGACATCCACCAACTTGTTTCCCTCGCAGTCAGATAGCAGTGTACCTACCAGCCCGGTCTCTCCATACAGATATCAGAGGCCATTC
AGTGGGATGGCTCCTTCAAATGGTACCAATACTTCGCTTGGATGTTCTACCAGCCCTGTCACTAGCTTGCAGCCCCATCAACGTGGATCAGATTCTGAGGGTCGTTTCCC
ATCATCTCCAAGTGATATATGTCACTCAGCAGATCTGAGAAGGGCTGCGCTCCTGCGTTCGGTACAGATGAGAGCACAACCTGCTGGTCCATCATCTATGGAGTTGCCAT
ATTGCTCTATGCCTGAGCCTGGACCAAATATAGAAGCTGAAGACCGGCCATGTTCTTGTATAAAATCGTTGGTTGATGAAAGAGTTTATCAACTCGAGGAATGCTCATCT
ATGGGATTGGGAGTGTCTGAGTCTGAATATAATGAACAAAAATCATGCAAGGACTTGAACAGGGATATGAAAGACAGCCAGTCTGGAGGGTAGTAAATTCTAAAAATGTA
CAGAGGAAAATCTCTTCTAACATAACAACACATGTGACACATTGCTGCTGTGAGACTGGAAAGTGTTTGCCTTTTGGTTCAACCTCCATGGAAATTCTCTTTTTCCCTAA
TTTATTTGCTTACCCTTAATTGAGGATGGTTTAGTCTTCTGCTAGCTCCATTTCCAAGTGCGTGGTGCCTTGTGCTATTTTCATTGTCAAGTGTGTGTGGAAGTTGCGTT
TAACTGTTCAACGCTTGTGAAGCCCGAGTTGAGAAGGTGTTCATGGTTGATCATGTGCGAAACCTCTGTCTATCTGTTTGATTCTATTGGAGCTGCCGGAGTCAAGAGAA
GATGTTTCTCAGAGTTAAGTTTATTGATAAATGATGCGGCTTTATGCGTCACAAGGTTGAAGTTGCAACTGTTCCATTTGTTTCCTGTGATAACAGTGTTATTATTGAAT
TTTTTTTGTTTTAATCGGGTTATGAGCATGCCGGCATAATTGATGGGAAAACTAAAAGATGTATAGAGACGAAAAGGGAACAAAGGGAATTTGAAGCAAATAGCTAAAAT
AACTTCACTGTAGAGTACAGAAAGACTACCGATTAGACAGCTGATTTATTTACCATCGGTATGTATATATTTTTCCTTTTGGATTGTATAGTTGGAGACTTCAAGTTACC
ATAAAAAAATGCATGTACCTATGTTTGGTGTGTTTTCTCTCTTTATATTCACAGATATCTCAG

Protein sequence

Show/hide protein sequence

MGVESNSAPPPPPTSSSSTPSPSGKRARDPEDEVYLDNFHSHKRYLSEIMASSLNGLTVGEPLSENLMDSPARSESMLYQRDEMSWQYSPMSEDSDDCRFCETSTNLFPS
QSDSSVPTSPVSPYRYQRPFSGMAPSNGTNTSLGCSTSPVTSLQPHQRGSDSEGRFPSSPSDICHSADLRRAALLRSVQMRAQPAGPSSMELPYCSMPEPGPNIEAEDRP
CSCIKSLVDERVYQLEECSSMGLGVSESEYNEQKSCKDLNRDMKDSQSGG

Pay0004533 (gene) of Melon (Payzawat) v1 genome