CuGenDBv2

Gene ID	Lag0021255
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Unknown protein
Genome location	chr7:5917033..5921187
RNA-Seq Expression	Lag0021255
Synteny	Lag0021255
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022138115.1 uncharacterized protein LOC111009363 isoform X1 [Momordica charantia]

9.5e-117

85.94

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEA LLQTCKSKAV DFTFGAL GGGVTWAGTWRLNKFIRLNLSGGAAA+FGLWRF+RSLNSC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP
        ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRP+IRWRYRNFFSDDVAH QR HDND KNNLHGNSH  SSN DS+SNQ  SY E D KGNALEFKP
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP

Query:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET
        V TK G DATADPLDC+F  LA+ EEIQ S++S+T+ KSH RSRRYHRRHRRHN+T
Subjt:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET

XP_022138116.1 uncharacterized protein LOC111009363 isoform X2 [Momordica charantia]

9.5e-117

85.94

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEA LLQTCKSKAV DFTFGAL GGGVTWAGTWRLNKFIRLNLSGGAAA+FGLWRF+RSLNSC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP
        ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRP+IRWRYRNFFSDDVAH QR HDND KNNLHGNSH  SSN DS+SNQ  SY E D KGNALEFKP
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP

Query:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET
        V TK G DATADPLDC+F  LA+ EEIQ S++S+T+ KSH RSRRYHRRHRRHN+T
Subjt:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET

XP_022956077.1 uncharacterized protein LOC111457878 [Cucurbita moschata]

2.3e-118

84.09

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEAN+LQTCKSKAV DFTFG L GGGVTWAGTWRLNKF+RLNLSGGA A+FGL RF+RSL+SC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV
        ANIVVTKYHNDPRTMQHISKHF+YE+VFDDSTLDRPKIRWRYRNFFSDDVAHAQR H NDPK+NLHGN HDSSNRDS+ NQ DSYG+ D KGNA EF PV
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV

Query:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV
         TK G D ATADPLD IF +L REEEIQ SS SS SPKSH RS+RY+RRHRRHN+TMPT FEHV
Subjt:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV

XP_022980008.1 uncharacterized protein LOC111479542 [Cucurbita maxima]

8.6e-118

84.09

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEAN+LQTCKSKAV DFTFG L GGGVTWAGTWRLNKF+RLNLSGGA A+FGL RF+RSL+SC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV
        ANI+VTK HNDPRTMQHISKHF+YE+VFDDSTLDRPKIRWRYRNFFSDDVAHAQRAH NDPK+NLHGN HDSSNRDS+ NQ DSYGE D KGNA EF PV
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV

Query:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV
         TK G D ATADPLD IF +L REEEIQ SS SS SPKSH RS+RY+RRHRRHN+TMPT FEHV
Subjt:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV

XP_023527180.1 uncharacterized protein LOC111790494 isoform X1 [Cucurbita pepo subsp. pepo]

3.8e-118

83.71

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEAN+LQTCKSKAV DFTFG L GGGVTWAGTWRLNKF+RLNLSGGA A+FGL RF+RSL+SC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV
        ANIVVTKYHNDPRTMQHISKHF+YE+VFDDSTLDRPKIRWRYRNFFSDDVAHAQR H NDPK+NLHGN HDSSNRDS+ NQ DSYG+ D KGNA EF PV
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV

Query:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV
         TK G D ATADPLD IF ++ REEEIQ SS SS SPKSH RS+RY+RRHRRHN+TMPT FEHV
Subjt:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV

TrEMBL top hits

e value

%identity

Alignment

A0A1S3AWL2 uncharacterized protein LOC103483703 isoform X1

4.5e-104

75.76

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGE L ELE VLRSK N LT EEA LLQTC+SKAV DFTFG + GGG+TWAGTWRLNKF RLNLSGGAAA+ G WRF+RSLNSC+D+IL+LDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV
        ANIVVT+YHNDPR MQ+ISKHF+YE+VFDDST DRPKIRWRYRNFFSDDVAH+QR H ND  NN+H NSH    RDSS++Q DSYG+SD KGNA EFKPV
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV

Query:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV
         TK G D ATADPLDCIF +LAREEEIQ S+ S+ SPK H RSRRY+RRHR+ N+T PT+FE+V
Subjt:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV

A0A6J1C8I6 uncharacterized protein LOC111009363 isoform X1

4.6e-117

85.94

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEA LLQTCKSKAV DFTFGAL GGGVTWAGTWRLNKFIRLNLSGGAAA+FGLWRF+RSLNSC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP
        ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRP+IRWRYRNFFSDDVAH QR HDND KNNLHGNSH  SSN DS+SNQ  SY E D KGNALEFKP
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP

Query:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET
        V TK G DATADPLDC+F  LA+ EEIQ S++S+T+ KSH RSRRYHRRHRRHN+T
Subjt:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET

A0A6J1C8T0 uncharacterized protein LOC111009363 isoform X2

4.6e-117

85.94

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEA LLQTCKSKAV DFTFGAL GGGVTWAGTWRLNKFIRLNLSGGAAA+FGLWRF+RSLNSC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP
        ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRP+IRWRYRNFFSDDVAH QR HDND KNNLHGNSH  SSN DS+SNQ  SY E D KGNALEFKP
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHD-SSNRDSSSNQGDSYGESDGKGNALEFKP

Query:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET
        V TK G DATADPLDC+F  LA+ EEIQ S++S+T+ KSH RSRRYHRRHRRHN+T
Subjt:  VHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNET

A0A6J1GVC2 uncharacterized protein LOC111457878

1.1e-118

84.09

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEAN+LQTCKSKAV DFTFG L GGGVTWAGTWRLNKF+RLNLSGGA A+FGL RF+RSL+SC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV
        ANIVVTKYHNDPRTMQHISKHF+YE+VFDDSTLDRPKIRWRYRNFFSDDVAHAQR H NDPK+NLHGN HDSSNRDS+ NQ DSYG+ D KGNA EF PV
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV

Query:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV
         TK G D ATADPLD IF +L REEEIQ SS SS SPKSH RS+RY+RRHRRHN+TMPT FEHV
Subjt:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV

A0A6J1IXZ4 uncharacterized protein LOC111479542

4.1e-118

84.09

Show/hide

Query:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL
        MGEALFELEQVLRSKQNSLT EEAN+LQTCKSKAV DFTFG L GGGVTWAGTWRLNKF+RLNLSGGA A+FGL RF+RSL+SC+DHILALDGSRMQKEL
Subjt:  MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKEL

Query:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV
        ANI+VTK HNDPRTMQHISKHF+YE+VFDDSTLDRPKIRWRYRNFFSDDVAHAQRAH NDPK+NLHGN HDSSNRDS+ NQ DSYGE D KGNA EF PV
Subjt:  ANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPV

Query:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV
         TK G D ATADPLD IF +L REEEIQ SS SS SPKSH RS+RY+RRHRRHN+TMPT FEHV
Subjt:  HTKLGMD-ATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G05430.1 unknown protein

3.5e-16

31.02

Show/hide

Query:  ALFELEQVLRSK--QNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNK---FIRLNLSGGAAA----IFGLWRFNRSLNSCIDHILALDGS
        AL +L  VL SK  Q  +T EE+  + +C  KA+    F +  GGG+TW  T +L K     R+ L+ G AA    +   W  ++   S +DHIL+ D +
Subjt:  ALFELEQVLRSK--QNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNK---FIRLNLSGGAAA----IFGLWRFNRSLNSCIDHILALDGS

Query:  RMQKELANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQG--------DSYG
        RMQKEL N++V     +    Q +SKHFY E V+ D   D+P++RWR R  F++  +     +    + N +G  + S  R S  +          +S G
Subjt:  RMQKELANIVVTKYHNDPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQG--------DSYG

Query:  ESDGKGNALEFKPVHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPR-SRRYHRRHRRHNETMPTS
         SDG+                A  D LD +F      E I     S  + K+  R  +R  RR R  N    T+
Subjt:  ESDGKGNALEFKPVHTKLGMDATADPLDCIFDSLAREEEIQQSSTSSTSPKSHPR-SRRYHRRHRRHNETMPTS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGCGAAGCTTTATTCGAACTCGAACAAGTTCTCAGGTCCAAACAGAACAGCTTGACGTTCGAGGAAGCGAATTTGCTCCAAACATGTAAGTCTAAGGCTGTTCTAGA
TTTTACATTTGGAGCTCTCTTTGGAGGTGGTGTGACATGGGCAGGAACATGGAGGCTGAATAAGTTCATTCGGTTAAATCTTTCTGGAGGAGCTGCTGCGATATTTGGAT
TATGGAGATTTAACAGGTCCCTAAATTCATGCATCGATCATATTCTTGCACTGGATGGAAGTAGGATGCAAAAGGAGTTGGCAAATATTGTAGTGACGAAATATCACAAT
GATCCTCGTACAATGCAGCACATATCCAAGCATTTTTATTATGAGAAAGTGTTTGACGATTCAACATTGGACCGGCCAAAAATAAGGTGGCGTTATCGAAATTTCTTTAG
TGATGATGTTGCTCATGCTCAGAGGGCACATGACAATGACCCTAAGAATAACTTGCATGGAAATTCCCACGATTCATCCAACCGCGACTCCAGTTCCAACCAGGGTGACT
CCTATGGTGAGTCTGATGGCAAAGGAAATGCACTTGAGTTCAAGCCAGTCCATACTAAGCTGGGCATGGATGCTACCGCAGACCCTCTGGATTGTATTTTCGATTCACTG
GCAAGAGAAGAAGAAATTCAGCAATCGAGTACCTCTAGCACATCACCGAAATCTCACCCTCGTAGTAGAAGATACCACCGTCGGCATCGAAGACATAATGAGACAATGCC
AACAAGCTTTGAACATGTGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGEALFELEQVLRSKQNSLTFEEANLLQTCKSKAVLDFTFGALFGGGVTWAGTWRLNKFIRLNLSGGAAAIFGLWRFNRSLNSCIDHILALDGSRMQKELANIVVTKYHN
DPRTMQHISKHFYYEKVFDDSTLDRPKIRWRYRNFFSDDVAHAQRAHDNDPKNNLHGNSHDSSNRDSSSNQGDSYGESDGKGNALEFKPVHTKLGMDATADPLDCIFDSL
AREEEIQQSSTSSTSPKSHPRSRRYHRRHRRHNETMPTSFEHV

Lag0021255 (gene) of Sponge gourd (AG-4) v1 genome