CuGenDBv2

Gene ID	Spg028440
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	GATA-N domain-containing protein
Genome location	scaffold7:11356984..11362797
RNA-Seq Expression	Spg028440
Synteny	Spg028440
Gene Ontology terms	GO:0006813 - potassium ion transport (biological process) GO:0009658 - chloroplast organization (biological process) GO:0045893 - positive regulation of transcription, DNA-templated (biological process) GO:0005634 - nucleus (cellular component) GO:0016020 - membrane (cellular component) GO:0003677 - DNA binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR004332 - Transposase, MuDR, plant

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_008456929.1 PREDICTED: uncharacterized protein LOC103496731 [Cucumis melo]

3.9e-39

80.99

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS GGFPSQLGQ WK+   RP  RSSNLRV    AE GEERE  G  ENKKSLFSSVTEALDFS VRSSRDAELLDDARQAT++GG+MTREQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

XP_022941869.1 uncharacterized protein LOC111447101 [Cucurbita moschata]

1.4e-41

80.17

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS  GF SQ GQ WK A E    RSSNLRVSAK+ E GEE+EDGG R+NK+SLFSSVTEALDFSQVRSSRDAELLDDARQAT++GG+M+REQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

XP_022996627.1 uncharacterized protein LOC111491808 [Cucurbita maxima]

1.2e-40

79.34

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS  GF SQ GQ WK A E    RSSNLRVSAKA E GEE+EDG  R+NK+SLFSSVTEALDFSQVRSSRDAELL+DARQAT+SGG+M++EQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

XP_023532465.1 uncharacterized protein LOC111794620 [Cucurbita pepo subsp. pepo]

3.2e-41

80.17

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS  GF SQ GQ WK A E    RSSNLRVSAKA E GEE+ED G R+NK+SLFSSVTEALDFSQVRSSRDAELLDDARQAT++GG+M+REQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

XP_038891315.1 uncharacterized protein LOC120080762 [Benincasa hispida]

1.2e-40

82.79

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEERED-GGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYG
        MVAISPS GGFPSQL Q WK    RP  RSSNLRV AKAAE GEERE  GG  ENKKSLFSSVTEALDFS VRSSRDAELLDDARQAT++GG+MTREQYG
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEERED-GGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYG

Query:  ALRRKIGGTYKDFFKSYIEDPG
        ALRRKIGGTYKDFFKSYIE  G
Subjt:  ALRRKIGGTYKDFFKSYIEDPG

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KM41 GATA-N domain-containing protein

4.2e-39

79.34

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAI PS GGFPSQLGQ WK+   RP  RSSNLRV    AE GEERE GG  ENKKSLFSSVTEALDFS VRS+RDAELLDDARQAT++GG+M+REQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

A0A1S3C3X8 uncharacterized protein LOC103496731

1.9e-39

80.99

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS GGFPSQLGQ WK+   RP  RSSNLRV    AE GEERE  G  ENKKSLFSSVTEALDFS VRSSRDAELLDDARQAT++GG+MTREQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

A0A5D3DFR3 GATA-N domain-containing protein

1.9e-39

80.99

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS GGFPSQLGQ WK+   RP  RSSNLRV    AE GEERE  G  ENKKSLFSSVTEALDFS VRSSRDAELLDDARQAT++GG+MTREQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

A0A6J1FPP4 uncharacterized protein LOC111447101

7.0e-42

80.17

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS  GF SQ GQ WK A E    RSSNLRVSAK+ E GEE+EDGG R+NK+SLFSSVTEALDFSQVRSSRDAELLDDARQAT++GG+M+REQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

A0A6J1K2I3 uncharacterized protein LOC111491808

5.9e-41

79.34

Show/hide

Query:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA
        MVAISPS  GF SQ GQ WK A E    RSSNLRVSAKA E GEE+EDG  R+NK+SLFSSVTEALDFSQVRSSRDAELL+DARQAT+SGG+M++EQYGA
Subjt:  MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGA

Query:  LRRKIGGTYKDFFKSYIEDPG
        LRRKIGGTYKDFFKSYIE  G
Subjt:  LRRKIGGTYKDFFKSYIEDPG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G56290.1 unknown protein

5.5e-23

66.67

Show/hide

Query:  VSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGALRRKIGGTYKDFFKSYIEDPG
        VSAK     E+ ED  + E + SLF+ +T+ALDFSQVRS +DAELL +AR+AT+SG KMT+EQYGALRRKIGGTYKDFFKSY+E  G
Subjt:  VSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGALRRKIGGTYKDFFKSYIEDPG

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTGGCGATTTCTCCATCACAGGGCGGATTCCCGTCGCAATTAGGGCAGAGATGGAAGGCGGCGGGGGAAAGGCCTAGTGGCCGGAGCTCGAATTTGAGAGTATCGGC
GAAAGCGGCGGAGAACGGCGAGGAGAGAGAGGACGGCGGCAGAAGGGAGAACAAGAAGTCGCTGTTCAGCAGCGTGACGGAGGCGTTGGATTTCTCTCAGGTCCGATCGA
GTCGCGACGCTGAGCTCCTCGATGATGCTCGTCAAGCCACCAGATCCGGCGGCAAAATGACCCGGGAACAGTATGGAGCTCTAAGAAGGAAGATAGGAGGGACCTACAAG
GACTTCTTCAAATCTTACATAGAAGATCCTGGTCTGGAACTTGGTCAAAATCCTGGTCGAAATCCTGGTCGAAATCCTGGTCGAGATCTTGGTCAAGATTTTTTCATGCA
CATCATGCCTCGTGTGTGGGTTTGTTGTGGTGGGATATGGAATGAGAGTGAAAAGGAGTACGAAGGTGGGAAGTTGAGAGGGTTCGATGTGGATGTTGGAATTACACATG
TCGACTTCGTAGGTCGGGTTTATAGAATAAGTCGTATAAATCCCACTGAGTTTGATATTGTGATAAGGTGTGTACTCCATCTAAAGTCCAAAGCTCCAGCATTTGTTATC
CAAGATGACGAAGACCTTCATACTTTCCTGACGTGGGAAGAGGTCTCTGTAAGACCTCTCTACGTATCGACTGTGCCAAAGTTTTCGAGTAATGAGAGACATAGGTTACT
TCCCATTCCATACACGGTATCAAATAACCCCAATCAATGTAATCCTTCCTCATCCTTCCCATATAACCAAGGACAAGATATCCCCTCCACAAACATCTCTAACCAAGGAC
AAAGTGCAGTAGCATCACTTACTCCGATGTCCAATAATGTATCTGCATATAACTTGGGAGATGATGTAGACCATGCTTGGGGGGAACTGAGAGATGAAGGGTTGGAAGTA
GATGAAGATGATGACTGGAGTGTGGATAGAGATGATGAGTCAAATGTAGATGTAGATTACGATGAGGATAGAGATGATGGACTTGATGAGACAGAGACAGATGGATATGG
TCATAGAGAGGCCCCGCCTGCTAATGCATCTGAAGCTCCACCTGTTAATGCATCTGAAGCTCCCCCTGTTAATGCACCTGAAGCTCCCCCTGTTAATGCACCTGAGGCTA
TGCATGCATCAGTTTCGGTCGCCCCACAAACTTCTGTGACAGCTCCATCAGGTAACTCAATTGTCATGTCTGGTCAGTCTTCTGGTTTTGATGATATACAAGTTGGGGAT
ATATTCATGTGCAAAAAAGACCTGACCATAAGATTGTCTGTTCTGGCGATGAAGAGAAACTTCGAGTTTAAGGTTAATAAGTCCAAAAAAGATATATACGTAGTTGTCTG
TCGCACTGATGAATGTAAATGGAGACTTCGAGCCATGAGATTGAAAGGTATCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVAISPSQGGFPSQLGQRWKAAGERPSGRSSNLRVSAKAAENGEEREDGGRRENKKSLFSSVTEALDFSQVRSSRDAELLDDARQATRSGGKMTREQYGALRRKIGGTYK
DFFKSYIEDPGLELGQNPGRNPGRNPGRDLGQDFFMHIMPRVWVCCGGIWNESEKEYEGGKLRGFDVDVGITHVDFVGRVYRISRINPTEFDIVIRCVLHLKSKAPAFVI
QDDEDLHTFLTWEEVSVRPLYVSTVPKFSSNERHRLLPIPYTVSNNPNQCNPSSSFPYNQGQDIPSTNISNQGQSAVASLTPMSNNVSAYNLGDDVDHAWGELRDEGLEV
DEDDDWSVDRDDESNVDVDYDEDRDDGLDETETDGYGHREAPPANASEAPPVNASEAPPVNAPEAPPVNAPEAMHASVSVAPQTSVTAPSGNSIVMSGQSSGFDDIQVGD
IFMCKKDLTIRLSVLAMKRNFEFKVNKSKKDIYVVVCRTDECKWRLRAMRLKGI

Spg028440 (gene) of Sponge gourd (cylindrica) v1 genome