CuGenDBv2

Gene ID	HG10018845
Organism	Lagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Description	Nuclear transcription factor Y subunit C-4, putative
Genome location	Chr04:9598898..9599785
RNA-Seq Expression	HG10018845
Synteny	HG10018845
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0031439.1 uncharacterized protein E6C27_scaffold139G001960 [Cucumis melo var. makuwa]

1.4e-89

81.57

Show/hide

Query:  MVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVL
        MVIL+FPCIVSILGQESG SEFFSVSDM DS +LDLFFRDLGHEG++ NGHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDR+GLFSDDSFDFVL
Subjt:  MVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVL

Query:  SWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKD
        SW  +DS FIDRILK GGIVAFPL NNNDPSNHF+KKPNY+P+FLNRY+SIIVA+EKTA+AD LVYASASRRRL + SLPT NAALRDLE         D
Subjt:  SWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKD

Query:  VAKPNQLGRKIKYLPDI
        V KPN+LGRKI YL D+
Subjt:  VAKPNQLGRKIKYLPDI

XP_008455527.1 PREDICTED: uncharacterized protein LOC103495679 [Cucumis melo]

4.9e-106

79.01

Show/hide

Query:  MDFARFNRPNS------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI
        MD ARFNRPN+      +WNS THLVI FPNTRI R+ISYS  FAMVIL+FPCIVSILGQESG SEFFSVSDM DS +LDLFFRDLGHEG++ NGHKVLI
Subjt:  MDFARFNRPNS------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI

Query:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL
        LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDR+GLFSDDSFDFVLSW  +DS FIDRILK GGIVAFPL NNNDPSNHF+KKPNY+P+FLNRY+SIIVA+
Subjt:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL

Query:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDI
        EKTA+AD LVYASASRRRL + SLPT NAALRDLE         DV KPN+LGRKI YL D+
Subjt:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDI

XP_011659719.1 uncharacterized protein LOC105436238 [Cucumis sativus]

1.3e-106

78.33

Show/hide

Query:  MDFARFNRP------NSTWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI
        MD ARFNRP      N +WNS THLVI FP T+I R+ISYS  FAMVIL+FPCIVSILGQE+G SEFFSV DM DS++LDLFFRDLGHEG++ NGHKVLI
Subjt:  MDFARFNRP------NSTWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI

Query:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL
        LSSAET GLIQIRVLDGDEHKLNIVVDSDFDR+GLFSDDSFDFVLSWG +DS FIDRILKIGGIVAFPL NNNDPS+HF+KKPNY+PVFLNRY+SIIVA+
Subjt:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL

Query:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIA
        EKT MAD+LVY SASRRRL + SLPTRNAALRDLE         DV KPN+LGRKIKYLPD++
Subjt:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIA

XP_022141924.1 uncharacterized protein LOC111012177 [Momordica charantia]

7.2e-89

62.29

Show/hide

Query:  MDFARFNRPNS-------------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQLDLFFRDLGHEGWAIN
        MDFARFNR  +              WNS+THLVIKFP+ RI  +IS SL  A+VIL+ PCIVSILG+ES SEF SVSD+ DS QLDL FRD G+EG  IN
Subjt:  MDFARFNRPNS-------------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQLDLFFRDLGHEGWAIN

Query:  GHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSS
        G K +ILSS  T GL Q+RV+D DE KL+IV+DSDFD+SGLFSDDSFDFV +WG VDS F+DRILK GGI+AFP  N+ PSNHFQKKPNYRPVFL+RYSS
Subjt:  GHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSS

Query:  IIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDL-EDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEASRRRI---VTVGQREWSNTLIR
        IIVA+EKTAM D +VY+SASRR L QFS  T  AA+R L ED+L E P K VAKP+ L RKIKY+ D+    L+  R+ +   VTVG  E +  +I+
Subjt:  IIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDL-EDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEASRRRI---VTVGQREWSNTLIR

XP_038889013.1 uncharacterized protein LOC120078778 [Benincasa hispida]

7.6e-123

88.46

Show/hide

Query:  MDFARFNRPNS------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLIL
        MDF  FNRPNS      +WNS THLVIKFPNT+I R+ISYSL FAM IL+FP IVSILGQESGSEFFSVSDM DS+QLDLFFRDLGHEG  INGHK LIL
Subjt:  MDFARFNRPNS------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLIL

Query:  SSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIVALEK
        SSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLS GLVDS FIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIV +EK
Subjt:  SSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIVALEK

Query:  TAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDI
        TAMADQLVYAS+SRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPN+LGRK+KYLPD+
Subjt:  TAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDI

TrEMBL top hits

e value

%identity

Alignment

A0A0A0K451 Uncharacterized protein

6.3e-107

78.33

Show/hide

Query:  MDFARFNRP------NSTWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI
        MD ARFNRP      N +WNS THLVI FP T+I R+ISYS  FAMVIL+FPCIVSILGQE+G SEFFSV DM DS++LDLFFRDLGHEG++ NGHKVLI
Subjt:  MDFARFNRP------NSTWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI

Query:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL
        LSSAET GLIQIRVLDGDEHKLNIVVDSDFDR+GLFSDDSFDFVLSWG +DS FIDRILKIGGIVAFPL NNNDPS+HF+KKPNY+PVFLNRY+SIIVA+
Subjt:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL

Query:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIA
        EKT MAD+LVY SASRRRL + SLPTRNAALRDLE         DV KPN+LGRKIKYLPD++
Subjt:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIA

A0A1S3C0P0 uncharacterized protein LOC103495679

2.4e-106

79.01

Show/hide

Query:  MDFARFNRPNS------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI
        MD ARFNRPN+      +WNS THLVI FPNTRI R+ISYS  FAMVIL+FPCIVSILGQESG SEFFSVSDM DS +LDLFFRDLGHEG++ NGHKVLI
Subjt:  MDFARFNRPNS------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLI

Query:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL
        LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDR+GLFSDDSFDFVLSW  +DS FIDRILK GGIVAFPL NNNDPSNHF+KKPNY+P+FLNRY+SIIVA+
Subjt:  LSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVAL

Query:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDI
        EKTA+AD LVYASASRRRL + SLPT NAALRDLE         DV KPN+LGRKI YL D+
Subjt:  EKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDI

A0A2P6QZ04 Uncharacterized protein

3.1e-45

44.49

Show/hide

Query:  NSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEF-FSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVLDGDE
        +S   LVIK P+ ++ R+I  S+  A+V+L+ PCI SI  + + SE   S S +F  +QL L F DL  EG    G K LI+S      +  IR L+ D+
Subjt:  NSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEF-FSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVLDGDE

Query:  HKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASASRRRLF
        +   I +DSD +R     D+S DFV ++ L D+ F+DR+LK+GGIVA PL +NDPSN F KK NY+ V+L RY+SI VA+ KT +A +L   +  RRRL 
Subjt:  HKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASASRRRLF

Query:  QFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEASRRRI
        QF    +   L+ LEDVLLEPP + +AK +Q  +K+K+LPD+  + LE   RR+
Subjt:  QFSLPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEASRRRI

A0A5A7SQ50 Uncharacterized protein

7.0e-90

81.57

Show/hide

Query:  MVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVL
        MVIL+FPCIVSILGQESG SEFFSVSDM DS +LDLFFRDLGHEG++ NGHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDR+GLFSDDSFDFVL
Subjt:  MVILSFPCIVSILGQESG-SEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVL

Query:  SWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKD
        SW  +DS FIDRILK GGIVAFPL NNNDPSNHF+KKPNY+P+FLNRY+SIIVA+EKTA+AD LVYASASRRRL + SLPT NAALRDLE         D
Subjt:  SWGLVDSHFIDRILKIGGIVAFPL-NNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDLEDVLLEPPIKD

Query:  VAKPNQLGRKIKYLPDI
        V KPN+LGRKI YL D+
Subjt:  VAKPNQLGRKIKYLPDI

A0A6J1CK51 uncharacterized protein LOC111012177

3.5e-89

62.29

Show/hide

Query:  MDFARFNRPNS-------------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQLDLFFRDLGHEGWAIN
        MDFARFNR  +              WNS+THLVIKFP+ RI  +IS SL  A+VIL+ PCIVSILG+ES SEF SVSD+ DS QLDL FRD G+EG  IN
Subjt:  MDFARFNRPNS-------------TWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQLDLFFRDLGHEGWAIN

Query:  GHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSS
        G K +ILSS  T GL Q+RV+D DE KL+IV+DSDFD+SGLFSDDSFDFV +WG VDS F+DRILK GGI+AFP  N+ PSNHFQKKPNYRPVFL+RYSS
Subjt:  GHKVLILSSAETKGLIQIRVLDGDEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSS

Query:  IIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDL-EDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEASRRRI---VTVGQREWSNTLIR
        IIVA+EKTAM D +VY+SASRR L QFS  T  AA+R L ED+L E P K VAKP+ L RKIKY+ D+    L+  R+ +   VTVG  E +  +I+
Subjt:  IIVALEKTAMADQLVYASASRRRLFQFSLPTRNAALRDL-EDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEASRRRI---VTVGQREWSNTLIR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G58120.1 BEST Arabidopsis thaliana protein match is: methyltransferases (TAIR:AT5G01710.1)

4.4e-20

29.93

Show/hide

Query:  NSTWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQ-LDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVL
        +S+  S+    +K   + +  +   S L A++ LSF  + S+L   + +   S S   D  + L L   DL  +G    G K L LS  + +  +     
Subjt:  NSTWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQ-LDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVL

Query:  DGDEHKLNIVVDSDFDRSGLFSDDSFDFVL--SWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASA
           E  + +V  SD +   +  D++FDF    S  +  + FIDR LK+GGI    LN  D   +F K PNY  V++      ++ + KT   +Q     A
Subjt:  DGDEHKLNIVVDSDFDRSGLFSDDSFDFVL--SWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASA

Query:  SRRRLFQFS-LPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEA---SRRRIVTVGQREWSN
        + R+L   +    R  ALR LEDVLLEPP     K     ++ +YLPD+    L+    SRR  + VG  + S+
Subjt:  SRRRLFQFS-LPTRNAALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEA---SRRRIVTVGQREWSN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATTTTGCTCGTTTCAATCGACCCAATAGCACCTGGAATTCCAATACCCATTTGGTTATTAAGTTTCCTAATACTCGAATTTTTCGTATGATTTCTTATTCGTTGTT
ATTTGCTATGGTTATTCTCTCGTTTCCCTGTATTGTCTCCATTCTTGGGCAAGAAAGTGGGTCTGAGTTTTTTTCTGTGTCAGATATGTTTGATTCTAAGCAATTGGATT
TGTTTTTTCGTGATTTGGGTCACGAAGGCTGGGCCATTAACGGCCATAAGGTTCTCATTTTGAGCTCTGCTGAAACTAAGGGCTTGATTCAGATTCGTGTGTTGGATGGT
GATGAACACAAACTTAATATTGTTGTGGACTCTGATTTTGATAGGAGTGGATTGTTTTCTGATGATTCTTTTGATTTTGTGTTATCTTGGGGCCTTGTGGACTCTCATTT
CATTGATAGAATTTTGAAAATCGGTGGCATTGTGGCTTTTCCACTCAATAACAATGACCCATCAAATCATTTTCAAAAGAAACCAAATTACAGGCCTGTGTTTCTCAATA
GATACAGCTCCATTATTGTGGCATTGGAGAAGACAGCCATGGCTGATCAGCTGGTTTATGCTTCAGCTTCAAGAAGACGTCTCTTTCAATTCTCATTGCCAACTAGAAAT
GCAGCTTTGAGAGACCTTGAGGATGTTCTACTTGAGCCACCAATTAAGGATGTGGCCAAACCAAACCAACTTGGGAGGAAAATCAAGTACCTTCCTGACATCGCACACAG
TTTTCTCGAAGCTTCTAGGCGAAGGATCGTCACGGTTGGCCAGCGTGAATGGTCCAATACTTTGATCAGAACTACCCAAGAAAGGATCAGGAGTTTGAGGTTCCCAAAAT
TGACTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDFARFNRPNSTWNSNTHLVIKFPNTRIFRMISYSLLFAMVILSFPCIVSILGQESGSEFFSVSDMFDSKQLDLFFRDLGHEGWAINGHKVLILSSAETKGLIQIRVLDG
DEHKLNIVVDSDFDRSGLFSDDSFDFVLSWGLVDSHFIDRILKIGGIVAFPLNNNDPSNHFQKKPNYRPVFLNRYSSIIVALEKTAMADQLVYASASRRRLFQFSLPTRN
AALRDLEDVLLEPPIKDVAKPNQLGRKIKYLPDIAHSFLEASRRRIVTVGQREWSNTLIRTTQERIRSLRFPKLT

HG10018845 (gene) of Bottle gourd (Hangzhou Gourd) v1 genome