; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lsi03G005970 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome

Gene IDLsi03G005970
OrganismLagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
DescriptionCell cycle progression protein 1
Genome locationchr03:7428610..7431343
RNA-Seq ExpressionLsi03G005970
SyntenyLsi03G005970
Gene Ontology termsGO:0015979 - photosynthesis (biological process)
GO:0009507 - chloroplast (cellular component)
GO:0009522 - photosystem I (cellular component)
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7022506.1 hypothetical protein SDJN02_16238, partial [Cucurbita argyrosperma subsp. argyrosperma]1.3e-2073.47Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTT--TTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQ+ILMALA+TLN+FASSNVQSVQRN+   PPTT  TT+A+ +A S I RRGL+LSA    A AA   AVDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTT--TTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

XP_004136934.1 uncharacterized protein LOC101214221 [Cucumis sativus]7.8e-2175Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQSILMALAVTLNKFASSNVQSVQRN+A         ATAT  S IGRR LLLS +A  +AAA    VDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

XP_008455049.1 PREDICTED: uncharacterized protein LOC103495319 [Cucumis melo]1.2e-2175Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQSILMALAVTLNKFASSNVQSVQRN+          ATAT  S IGRR LLLS VA  + AA   AVDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

XP_022927848.1 uncharacterized protein LOC111434615 [Cucurbita moschata]7.8e-2174.49Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTT--TTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQ+ILMALA+TLN+FASSNVQSVQRN+   PPTT  TT+A+ +A S I RRGLLLSA    A AA   AVDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTT--TTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

XP_038887440.1 uncharacterized protein LOC120077574 [Benincasa hispida]4.6e-2988.54Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKP T    ATAT GS IGRRGLLLSAVA+ AAA PEEAVDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

TrEMBL top hitse value%identityAlignment
A0A1S3C176 uncharacterized protein LOC1034953195.8e-2275Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQSILMALAVTLNKFASSNVQSVQRN+          ATAT  S IGRR LLLS VA  + AA   AVDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

A0A6J1D554 uncharacterized protein LOC111017388 isoform X25.5e-2073Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKEVIFL
        MSSIGQSILMALAVT+NKFASSNVQSV RNQ          + A A S IGRRGLL SAVA  AA AP   VDSRTELLKRYLKKSE NKEKNDKE I L
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKEVIFL

A0A6J1D574 uncharacterized protein LOC111017388 isoform X13.5e-1973.96Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQSILMALAVT+NKFASSNVQSV RNQ          + A A S IGRRGLL SAVA  AA AP   VDSRTELLKRYLKKSE NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

A0A6J1EM63 uncharacterized protein LOC1114346153.8e-2174.49Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTT--TTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQ+ILMALA+TLN+FASSNVQSVQRN+   PPTT  TT+A+ +A S I RRGLLLSA    A AA   AVDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTT--TTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

A0A6J1JNZ7 uncharacterized protein LOC1114862011.9e-2075Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSIGQ+ILMALA+TLN+FASSNVQSVQRN+   PPTT   AT +A S I RRGLLLSA    A AA   AVDSRTELLKRYLKKSE+NKEKNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G49975.1 INVOLVED IN: photosynthesis; LOCATED IN: photosystem I, chloroplast, thylakoid membrane; EXPRESSED IN: 20 plant structures; EXPRESSED DURING: 13 growth stages; CONTAINS InterPro DOMAIN/s: Photosystem I reaction centre subunit N (InterPro:IPR008796); Has 34 Blast hits to 34 proteins in 14 species: Archae - 0; Bacteria - 0; Metazoa - 0; Fungi - 0; Plants - 34; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink).1.7e-1351.04Show/hide
Query:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE
        MSSI QSILMAL VT+NK+ASSNVQ+V+RN   +   T   A       +GRR +L S+ +  AA     A+ S  +LL++YLKK+E+NK KNDKE
Subjt:  MSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKSEDNKEKNDKE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACCAAGAAAGCCTCATCTATTCTCTTCAACCTCATCCTCAAAACTCAAAACTCAAAACTCTCACTCCGATGAGTTCCATCGGCCAAAGCATTCTCATGGCCCTCGC
CGTCACTCTCAACAAATTCGCTTCCTCTAACGTTCAATCCGTTCAGAGAAACCAAGCCAACAAGCCTCCCACCACCACCACCGCCGCCACTGCCACCGCCGGTTCTGCAA
TCGGAAGAAGAGGCCTCCTCTTGTCCGCCGTTGCTTCCACCGCCGCCGCCGCTCCTGAAGAAGCCGTCGACTCCAGAACCGAGCTGCTAAAAAGGTACCTCAAGAAGTCT
GAAGATAACAAAGAAAAGAATGACAAGGAGGTAATTTTTTTGTAA
mRNA sequenceShow/hide mRNA sequence
CTTTTATTAAAGGTATATTATATGGACCAAGAAAGCCTCATCTATTCTCTTCAACCTCATCCTCAAAACTCAAAACTCAAAACTCTCACTCCGATGAGTTCCATCGGCCA
AAGCATTCTCATGGCCCTCGCCGTCACTCTCAACAAATTCGCTTCCTCTAACGTTCAATCCGTTCAGAGAAACCAAGCCAACAAGCCTCCCACCACCACCACCGCCGCCA
CTGCCACCGCCGGTTCTGCAATCGGAAGAAGAGGCCTCCTCTTGTCCGCCGTTGCTTCCACCGCCGCCGCCGCTCCTGAAGAAGCCGTCGACTCCAGAACCGAGCTGCTA
AAAAGGTACCTCAAGAAGTCTGAAGATAACAAAGAAAAGAATGACAAGGAGGTAATTTTTTTGTAATTTTGCCTATATTCTATTTTATTAAAAAATTTAAATCCTTATTT
TCTAGTGTTCTAGAAAAATGATTTAAATATGATCGTTTATGGTCTAACTATCACTCTATAATATATGATACAAAAAAATTTGTAATTTTAACAGAGATTGGAAAGTTACT
ACAAGCGAAATT
Protein sequenceShow/hide protein sequence
MDQESLIYSLQPHPQNSKLKTLTPMSSIGQSILMALAVTLNKFASSNVQSVQRNQANKPPTTTTAATATAGSAIGRRGLLLSAVASTAAAAPEEAVDSRTELLKRYLKKS
EDNKEKNDKEVIFL