CuGenDBv2

Gene ID	Lag0028587
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	protein CROWDED NUCLEI 3
Genome location	chr8:25875303..25878047
RNA-Seq Expression	Lag0028587
Synteny	Lag0028587
Gene Ontology terms	GO:0006997 - nucleus organization (biological process) GO:0005652 - nuclear lamina (cellular component)
InterPro domains	IPR040418 - Protein crowded nuclei

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7032453.1 Protein CROWDED NUCLEI 2 [Cucurbita argyrosperma subsp. argyrosperma]

9.7e-26

91.43

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHNLGL+L+EKK WASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

XP_004147138.1 protein CROWDED NUCLEI 3 [Cucumis sativus]

2.6e-26

85.33

Show/hide

Query:  IDYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFRYTWF
        +DYQHNLGLLLIEKK+WASK+D+LGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +  ++
Subjt:  IDYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFRYTWF

XP_022930031.1 protein CROWDED NUCLEI 1-like isoform X1 [Cucurbita moschata]

9.7e-26

91.43

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHNLGL+L+EKK WASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

XP_038907101.1 protein CROWDED NUCLEI 1 isoform X1 [Benincasa hispida]

4.4e-26

92.86

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHNLGLLLIEKK+WASKY+QLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

XP_038907102.1 protein CROWDED NUCLEI 1 isoform X2 [Benincasa hispida]

4.4e-26

92.86

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHNLGLLLIEKK+WASKY+QLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3CSZ3 protein CROWDED NUCLEI 3

1.2e-24

88.57

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHN+GLLLIEKK+WA K+DQL QDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

A0A5D3BM77 Protein CROWDED NUCLEI 3

1.2e-24

88.57

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHN+GLLLIEKK+WA K+DQL QDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

A0A6J1E0M3 protein CROWDED NUCLEI 1-like isoform X2

3.4e-24

70.97

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFRYTWF------VERLLMIEKILGD
        DYQHNLGLLL+EKKEWASKYD+LGQ+LAETEEI KREQSAH+IALSEVETR DNLKKALAAEKQ+V S +  ++       E  L  EK L D
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFRYTWF------VERLLMIEKILGD

A0A6J1EPS4 protein CROWDED NUCLEI 1-like isoform X1

4.7e-26

91.43

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHNLGL+L+EKK WASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

A0A6J1K004 protein CROWDED NUCLEI 1-like isoform X1

4.7e-26

91.43

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR
        DYQHNLGL+L+EKK WASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV S +
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFR

SwissProt top hits

e value

%identity

Alignment

A0A166B1A6 Nuclear matrix constituent protein 1

4.7e-15

60.61

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV
        DYQ+N+GLLLIEKKEW SK+++L Q   ET++  K+EQ AHLIA+S+ E R +NL KAL  EKQ V
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV

F4HRT5 Protein CROWDED NUCLEI 1

2.0e-13

56.25

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQ
        +YQH++GLLLIEKKEW+S+Y+ L Q   E  E  K+E++AHLIA+++VE R + L+KAL  EKQ
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQ

I0J0E7 Nuclear matrix constituent protein 1

2.5e-16

63.64

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV
        +YQ+N+GLLLIEKKEW+S ++++   LAE EEI KREQ+AH+IAL+E E R DNL+KAL  EKQ V
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV

Q0DY81 Nuclear matrix constituent protein 1a

8.0e-15

59.09

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV
        +YQ+N+GLLLIEKKEW +K D++ Q L + EEI KREQ+AHL A+SE E R ++++KAL  EKQ V
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV

Q9SAF6 Protein CROWDED NUCLEI 2

6.8e-14

61.54

Show/hide

Query:  YQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV
        YQHN+GLLL+E KE  SK++QL Q   E +EI KREQS+HL AL+ VE R +NL+KAL  EKQ V
Subjt:  YQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV

Arabidopsis top hits

e value

%identity

Alignment

AT1G13220.1 nuclear matrix constituent protein-related

4.8e-15

61.54

Show/hide

Query:  YQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV
        YQHN+GLLL+E KE  SK++QL Q   E +EI KREQS+HL AL+ VE R +NL+KAL  EKQ V
Subjt:  YQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV

AT1G13220.2 nuclear matrix constituent protein-related

4.8e-15

61.54

Show/hide

Query:  YQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV
        YQHN+GLLL+E KE  SK++QL Q   E +EI KREQS+HL AL+ VE R +NL+KAL  EKQ V
Subjt:  YQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV

AT1G67230.1 little nuclei1

1.4e-14

56.25

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQ
        +YQH++GLLLIEKKEW+S+Y+ L Q   E  E  K+E++AHLIA+++VE R + L+KAL  EKQ
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQ

AT1G68790.1 little nuclei3

1.0e-12

53.03

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV
        DYQHN+GLLLIEKK+W S  ++L Q   E  E+ KRE++++ I L+E + R +NL+KAL  EKQ V
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHV

AT5G65770.1 little nuclei4

3.0e-09

40.28

Show/hide

Query:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFRYT
        DYQHN+GLLL+EK E +S+Y+++   + E++    RE+SA++ AL+E + R ++LKK +   K+ + S   T
Subjt:  DYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFRYT

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTCATTGATTACCAGCACAATTTAGGACTTCTTTTGATAGAGAAGAAAGAGTGGGCTTCAAAGTATGACCAACTAGGGCAAGATTTAGCAGAAACTGAGGAGATCTT
CAAACGTGAACAATCAGCACATTTAATTGCACTATCCGAAGTTGAAACGAGGAGGGATAATTTGAAGAAAGCTCTAGCTGCTGAGAAGCAACATGTGTTTAGTTTTCGCT
ACACATGGTTTGTAGAAAGATTGTTGATGATTGAAAAGATCCTTGGGGATTTCTTTTGGGAAGGTGCAAAGGAAGATGGTGGAATGCATAATGTGAACAGGGCAAGAACT
CGTCAAGCTAAATGGATATGGCAGGCTTCTGAAAACAAATTCACAATGACCATCCTGAAGCTTTACAAACTTTCTGATTGTGTGGTGGGATTTCTTGAACATTTTTTGGA
AGGTGTAGGGCTCTCCCTCAATTCCTCCAAATCTTCTATAGTTGGAATCGATGTCGAGGAGGTGGAGGTAATTCAGCAAGCTGTCCGTTTGGGATGTTGTCATCTTGCTA
AATGGATTTGGACTTCTCTTCCTCTCGAATATGGGGGCCTTGGTATTGGTTCATTGAAACAGAGGAATACTGCTCTTCTCATTAAATGGTTGTGGAGATTTGCTCAAGAA
GAGCAAGCTTTATGGAGAAAGGTAGTTGATAGTACCTATACGGCAGTGAGCCAAGTGGTTGGATGTCTCTTCCCCCAAAAGGGACCTCAAGGGCAAGACCGTGGTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFIDYQHNLGLLLIEKKEWASKYDQLGQDLAETEEIFKREQSAHLIALSEVETRRDNLKKALAAEKQHVFSFRYTWFVERLLMIEKILGDFFWEGAKEDGGMHNVNRART
RQAKWIWQASENKFTMTILKLYKLSDCVVGFLEHFLEGVGLSLNSSKSSIVGIDVEEVEVIQQAVRLGCCHLAKWIWTSLPLEYGGLGIGSLKQRNTALLIKWLWRFAQE
EQALWRKVVDSTYTAVSQVVGCLFPQKGPQGQDRG

Lag0028587 (gene) of Sponge gourd (AG-4) v1 genome