CuGenDBv2

Gene ID	Lag0031067
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	C2H2-type domain-containing protein
Genome location	chr11:4396945..4399438
RNA-Seq Expression	Lag0031067
Synteny	Lag0031067
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6606923.1 hypothetical protein SDJN03_00265, partial [Cucurbita argyrosperma subsp. sororia]

3.8e-115

89.17

Show/hide

Query:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP
        MQSIHALGFSHSLQFSQSH H N KN LL+   SHGSN K+  RTSLSLRT+WPSISIALFGSGFLLGPLLDGLHSRVNLVVY+ GS+DIGPL TNIWVP
Subjt:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP

Query:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM
        FLLG+FYCTVGLIQLY+DE FSP R EGSLG+TVASLIALALFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACVVGL+CPLAEIPIM
Subjt:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM

Query:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSR
        KFFHLWYYPQANVEIFGEG+ISWTITCYFVYTPFLINLSR
Subjt:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSR

KAG7036627.1 hypothetical protein SDJN02_00246 [Cucurbita argyrosperma subsp. argyrosperma]

3.8e-123

88.72

Show/hide

Query:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP
        MQSIHALGFSHSLQFSQSH H N KN LL+   SHGSN K+  RTSLSLRT+WPSISIALFGSGFLLGPLLDGLHSRVNLVVY+ GS+DIGPL TNIWVP
Subjt:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP

Query:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM
        FLLG+FYCTVGLIQLY+DE FSP R EGSLG+TVASLIALALFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACVVGL+CPLAEIPIM
Subjt:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM

Query:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA
        KFFHLWYYPQANVEIFGEG+ISWTITCYFVYTPFLINLSRWLKSV+D+AAVKKD SA
Subjt:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA

XP_022949544.1 uncharacterized protein LOC111452860 [Cucurbita moschata]

1.4e-122

88.33

Show/hide

Query:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP
        MQSIHALGFSHSLQFSQSH H N KN LL+   SHGSN K+  RTSLSLRT+WPSISIALFGSGFLLGPLLDGLHSRVNLVVY+ GS+DIGPL TNIWVP
Subjt:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP

Query:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM
        FLLG+FYCTVGLIQLY+DE FSP R EGSLG+TVASLIALALFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACVVGL+CPLAEIPIM
Subjt:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM

Query:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA
        KFFHLWYYPQANVEIFGEG+ISWTITCYFVYTPFLINLSRWLKSV+D+ AVKKD SA
Subjt:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA

XP_022998487.1 uncharacterized protein LOC111493103 [Cucurbita maxima]

2.8e-118

87.21

Show/hide

Query:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP
        MQSIHALGFSHSLQFSQSH H N KN LL+   +HGSN ++  RTSLSLRT+WPSISIALFGSGFLLGPLLDGLHSRVNLVVY+ GS+DIGPL TNI VP
Subjt:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP

Query:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM
        FLLGLFYCTVGLIQLY+DE F P R EGSLG+TVASLIALALFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACVVGL+CPLAEIPIM
Subjt:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM

Query:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWL-KSVVDAAAVKKDESA
        KFFHLWYYPQANVEIFGEG+ISWTITCYFVYTPFLINLSRWL  SVVD+AAVKKD SA
Subjt:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWL-KSVVDAAAVKKDESA

XP_038904924.1 uncharacterized protein LOC120091134 [Benincasa hispida]

6.5e-123

87.21

Show/hide

Query:  KMQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWV
        KMQSI+ALGFSHSLQFSQSH HSNSK  L KPHC+  S+     RTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSI IGPLHTNIWV
Subjt:  KMQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWV

Query:  PFLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPI
        PFLLGLFYC+VGLIQLY+DE FSP+++EG  GRTVASLIAL LFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACV+GLVCPLAEIPI
Subjt:  PFLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPI

Query:  MKFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA
        MKFFHLWYYP+AN+EIFGEGI+SWTITCYFVYTPFLINLSRWLKSVVDAAA  +D SA
Subjt:  MKFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LBT1 Uncharacterized protein

2.4e-115

84.94

Show/hide

Query:  MQSIHALGFSHSLQF--SQSHLHSNSKNPLLKPHC-SHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNI
        MQSI ALGFS SLQF  S SH HSNS+  + KPHC SHGS      R SLSLRTTWPSISI+LF SGFLLGPLLDGLHSRVNLVVYRTGSI IGPLHTNI
Subjt:  MQSIHALGFSHSLQF--SQSHLHSNSKNPLLKPHC-SHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNI

Query:  WVPFLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEI
        WVPFLLGLFYCTVGLIQLY+DEKFS K+++GSLG+TVASLIAL LFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACV+GL CPLAEI
Subjt:  WVPFLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEI

Query:  PIMKFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDES
        PIMKFFHLW YP+AN++IFGEGIISWT+TCYFVYTPFLINLSRWLKSVVDAAAV +DES
Subjt:  PIMKFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDES

A0A1S3BI47 uncharacterized protein LOC103489906

2.7e-114

83.4

Show/hide

Query:  MQSIHALGFSHSLQFSQSH----LHSNSKNPLLKPHC-SHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHT
        MQSI ALGFSHSLQF  SH     HSNS+  L KPHC SHGSN     R +LSLRTTWPSISI+LF SGFLLGPLLDGLHSRVNLVVYRTGSI IGPLHT
Subjt:  MQSIHALGFSHSLQFSQSH----LHSNSKNPLLKPHC-SHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHT

Query:  NIWVPFLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLA
        NIWVPFLLGLFYCTVGLIQLY+DEKFSPK+++GSL +TVASLIAL LFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACV+GL CPLA
Subjt:  NIWVPFLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLA

Query:  EIPIMKFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVD----AAAVKKDES
        EIPIMKFFHLW YP+AN+EIFGEGIISWT+TCYFVYTPFLINLSRWLKSVVD    AAAV +D S
Subjt:  EIPIMKFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVD----AAAVKKDES

A0A6J1DRY1 uncharacterized protein LOC111023831

3.1e-115

85.99

Show/hide

Query:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP
        MQSI+ LG S  LQF Q    S SK+  LKP CSHGS S+   RTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVY+TGSID+GPLHTNIWVP
Subjt:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP

Query:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM
        FLLGLFY TVGL+QLY+DE FS   +EGSLGRTVASLIALALFIELSAEMYKAGVA NIEAYALFAGAE IWA LDSSLLGFSLACVVGL CPLAEIPIM
Subjt:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM

Query:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA
        KFFHLW YPQANVEIFGEGIISW ITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA
Subjt:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA

A0A6J1GD48 uncharacterized protein LOC111452860

7.0e-123

88.33

Show/hide

Query:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP
        MQSIHALGFSHSLQFSQSH H N KN LL+   SHGSN K+  RTSLSLRT+WPSISIALFGSGFLLGPLLDGLHSRVNLVVY+ GS+DIGPL TNIWVP
Subjt:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP

Query:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM
        FLLG+FYCTVGLIQLY+DE FSP R EGSLG+TVASLIALALFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACVVGL+CPLAEIPIM
Subjt:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM

Query:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA
        KFFHLWYYPQANVEIFGEG+ISWTITCYFVYTPFLINLSRWLKSV+D+ AVKKD SA
Subjt:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA

A0A6J1KGW6 uncharacterized protein LOC111493103

1.4e-118

87.21

Show/hide

Query:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP
        MQSIHALGFSHSLQFSQSH H N KN LL+   +HGSN ++  RTSLSLRT+WPSISIALFGSGFLLGPLLDGLHSRVNLVVY+ GS+DIGPL TNI VP
Subjt:  MQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNSKSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVP

Query:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM
        FLLGLFYCTVGLIQLY+DE F P R EGSLG+TVASLIALALFIELSAEMYKAGVA NIEAYALFAGAEFIWALLDSSLLGFSLACVVGL+CPLAEIPIM
Subjt:  FLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIM

Query:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWL-KSVVDAAAVKKDESA
        KFFHLWYYPQANVEIFGEG+ISWTITCYFVYTPFLINLSRWL  SVVD+AAVKKD SA
Subjt:  KFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWL-KSVVDAAAVKKDESA

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT4G01935.1 unknown protein

4.7e-79

58.94

Show/hide

Query:  SNSKNPLLKPHCSHGSN----SKSIC-----RTSLSLRTTW-PSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVPFLLGLFYCTVG
        S+    L+KP   +G N     K +C     ++  S   +W   +S++LFGSGF+LGPLLDG+HSRV+LVVY+ G+  IGPLHTNIWVPFLLGLFYCTVG
Subjt:  SNSKNPLLKPHCSHGSN----SKSIC-----RTSLSLRTTW-PSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVPFLLGLFYCTVG

Query:  LIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIMKFFHLWYYPQA
        L+QL +DE  S     GSL +TV SL+AL  F+ELSAEMYKAGV+ NIEAY LFA AEFIW  LD + + F++A ++G+ CPLAEIPIM+FFHLWYYP+A
Subjt:  LIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAEMYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIMKFFHLWYYPQA

Query:  NVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA
        N+EIFG+G+++WT TCYFVYTPFLINL+RWL++V++   ++ D S+
Subjt:  NVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTGCAGGTTTTCAATGTTGCAGGCCACATCTTTCGAATCTCTCTATCTAATTTTGAAGTCCACACTCACTCATCAAAATCACAATCCATACACATTTGGGCTCAACAA
TCCTTCAATTTACAGCCCTCCAATTCGCCAAAATGAATTCTTGTGGATTGCAACGAAACAATTTTCAAAATTTCATCTATTCGGATCCTCAACGAACTCCAAAATGCAAT
CAATCCATGCATTGGGCTTCTCCCACTCTCTCCAATTTTCCCAATCCCATCTCCATTCGAACTCCAAAAATCCTCTGCTCAAACCCCATTGCAGCCATGGAAGCAACAGC
AAGAGCATATGCAGAACAAGCCTCAGTCTCAGAACCACTTGGCCCTCCATTTCCATCGCCCTCTTCGGCTCCGGCTTTCTCTTAGGCCCTCTTCTCGACGGACTCCATTC
GCGGGTGAATCTCGTCGTTTACCGAACAGGATCGATCGACATCGGCCCACTCCACACTAACATCTGGGTTCCTTTCTTGTTGGGATTGTTTTACTGTACTGTTGGGTTGA
TTCAACTCTACGTAGATGAGAAATTTTCGCCAAAAAGAACAGAGGGGAGTTTGGGCAGGACAGTAGCATCCTTGATAGCATTGGCTTTGTTTATTGAATTGAGTGCTGAA
ATGTACAAAGCTGGAGTGGCAGCCAACATTGAGGCCTATGCATTGTTTGCTGGGGCTGAGTTTATATGGGCATTGCTTGATAGTTCTTTGCTTGGTTTCTCACTGGCTTG
TGTTGTTGGCCTTGTCTGCCCTCTGGCTGAGATTCCCATTATGAAGTTCTTCCATCTCTGGTATTATCCACAAGCAAACGTCGAGATCTTTGGCGAGGGGATAATCAGCT
GGACAATCACTTGCTATTTTGTGTATACTCCATTCTTGATAAATTTATCAAGATGGCTCAAGTCTGTGGTGGATGCTGCTGCTGTAAAGAAAGATGAGTCTGCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MCRFSMLQATSFESLYLILKSTLTHQNHNPYTFGLNNPSIYSPPIRQNEFLWIATKQFSKFHLFGSSTNSKMQSIHALGFSHSLQFSQSHLHSNSKNPLLKPHCSHGSNS
KSICRTSLSLRTTWPSISIALFGSGFLLGPLLDGLHSRVNLVVYRTGSIDIGPLHTNIWVPFLLGLFYCTVGLIQLYVDEKFSPKRTEGSLGRTVASLIALALFIELSAE
MYKAGVAANIEAYALFAGAEFIWALLDSSLLGFSLACVVGLVCPLAEIPIMKFFHLWYYPQANVEIFGEGIISWTITCYFVYTPFLINLSRWLKSVVDAAAVKKDESA

Lag0031067 (gene) of Sponge gourd (AG-4) v1 genome