; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lsi03G004550 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome

Gene IDLsi03G004550
OrganismLagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
DescriptionTrinucleotide repeat-containing gene 18 protein-like protein
Genome locationchr03:5171001..5171588
RNA-Seq ExpressionLsi03G004550
SyntenyLsi03G004550
Gene Ontology termsNA
InterPro domainsIPR007789 - Protein of unknown function DUF688


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7015908.1 hypothetical protein SDJN02_21012, partial [Cucurbita argyrosperma subsp. argyrosperma]1.9e-8283.59Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF
        MFQSSRR+HSFSSSSS+SLSS+SS+SSSRGS YFP++SPFS AATP+R+FSGSIPFSWEHLPGIPKKQSPARLRR S+SPL+SLLPLPPNS+T PSSKR 
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF

Query:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        GFQDWRKSN Q SQRDPFFDAF+ECSKEP AA   +ELW G SNGK ++RSLSDRFGF+NLYSSCKRTC VSESIVYLPRTPRSSFDLLNQR+GG
Subjt:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

XP_008441227.1 PREDICTED: uncharacterized protein LOC103485423 [Cucumis melo]2.7e-9292.31Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF
        MFQSSRRTHSFSSSSSNSLSS+SS+SSSRGSYYFP +SPFS +ATPIRSFSG+IPFSWEHLPGIPKKQSPARLRRGS+SPLSSLLPLPPNSTT  SSKRF
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF

Query:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        GFQDWRKSNRQN QRDPFFDAFLECSKEPT AAVD+ELWSG SNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTP SSFDLLNQRSGG
Subjt:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

XP_011649907.1 uncharacterized protein LOC105434677 [Cucumis sativus]5.1e-9192.89Show/hide
Query:  MFQSSRRTHSFSS-SSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKR
        MFQSSRRTHSFSS SSSNSLS  SS+SSSRGSYYFPDDSPFS AATPIRSFSG+IPFSWEHLPGIPKKQSPARLRRGS+SPLSS LPLPPNSTTP SSKR
Subjt:  MFQSSRRTHSFSS-SSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKR

Query:  FGFQDWRKSNRQNSQRDPFFDAFLECSKEPT-AAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        FGFQDWRKSNRQN+QRDPFFDAFLECSKEPT AAAVD+ELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRT RSSFDLLNQR+GG
Subjt:  FGFQDWRKSNRQNSQRDPFFDAFLECSKEPT-AAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

XP_023549797.1 putative protein TPRXL [Cucurbita pepo subsp. pepo]1.1e-8081.91Show/hide
Query:  MFQSSRRTHSFSSSSSNSL----SSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPS
        MFQSSRR+HSFSSSSS+SL    SS+SS+SSSRGS YFP++SPFS AATP+R+FSGSIPFSWEHLPGIPKKQSPARLRR S+SPL+SLLPLPPNS+T PS
Subjt:  MFQSSRRTHSFSSSSSNSL----SSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPS

Query:  SKRFGFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        SKR GFQDWRKSN Q SQRDPFFDAF+ECSKEP AA   +ELW G SNGK ++RSLSDRFGF+NLYSSCKRTC VSESIVYLPRTPRSSFDLLNQR+GG
Subjt:  SKRFGFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

XP_038885392.1 uncharacterized protein LOC120075791 [Benincasa hispida]1.1e-9394.95Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF
        MFQSSRRTHSFSSSSSNSLS  SS+SSSRGSYYFPD+SPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGS+SPLSSLLPLPPNS TPPSSKRF
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF

Query:  GFQDWRKSNRQNSQRDPFFDAFLECSKEP-TAAAVDSELWS--GGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        GFQDWRKSNRQNSQRDPFFDAFLECSKEP TAAAVD+ELWS  GGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
Subjt:  GFQDWRKSNRQNSQRDPFFDAFLECSKEP-TAAAVDSELWS--GGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

TrEMBL top hitse value%identityAlignment
A0A1S3B2H5 uncharacterized protein LOC1034854231.3e-9292.31Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF
        MFQSSRRTHSFSSSSSNSLSS+SS+SSSRGSYYFP +SPFS +ATPIRSFSG+IPFSWEHLPGIPKKQSPARLRRGS+SPLSSLLPLPPNSTT  SSKRF
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF

Query:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        GFQDWRKSNRQN QRDPFFDAFLECSKEPT AAVD+ELWSG SNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTP SSFDLLNQRSGG
Subjt:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

A0A5D3C8I6 Trinucleotide repeat-containing gene 18 protein-like protein1.3e-9292.31Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF
        MFQSSRRTHSFSSSSSNSLSS+SS+SSSRGSYYFP +SPFS +ATPIRSFSG+IPFSWEHLPGIPKKQSPARLRRGS+SPLSSLLPLPPNSTT  SSKRF
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF

Query:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        GFQDWRKSNRQN QRDPFFDAFLECSKEPT AAVD+ELWSG SNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTP SSFDLLNQRSGG
Subjt:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

A0A6J1DE38 uncharacterized protein LOC1110202114.2e-7582.9Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKK-QSPARLRRGSSSPLSSLLPLPPNSTTPPSSKR
        MFQSSRRTHSFSSS     SS SS+SSSRGSYYFPDDSP S +ATPIRSFSG+IPFSWEHLPGIPKK QSPARLR+ S+SPL+SLLPLPPNSTTPPSSKR
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKK-QSPARLRRGSSSPLSSLLPLPPNSTTPPSSKR

Query:  FGFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGG---SNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLL
        FGFQ+WRKSNR NSQRDPFFDAF+ECSK+  +AA  +ELWSGG   + GKAI+RSLSDRFGFLNLYSSCKRTCGVSESIV LPRTPRSSFDLL
Subjt:  FGFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGG---SNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLL

A0A6J1GNZ5 uncharacterized protein LOC1114561373.8e-7680.5Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF
        MFQSSRRT SFSSSS +  SS+SS+SSSRGSYYFPDDSP S AATPIRSFSGSIPFSWE+LPGIPKKQSPARLR  S+SPL+SLLPLPP STT PSSKRF
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF

Query:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAV-----DSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        GF DWRKSNRQNSQRDPFFDAF+ECSKEP+AA        +ELW+ GSNGKA++RSLSDRFGFLN  SSCKRTCGVSESIVY PR  RSSFDLLN R+GG
Subjt:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAV-----DSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

A0A6J1JTM6 uncharacterized protein LOC1114877395.0e-7680.5Show/hide
Query:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF
        MFQSSRRT SFSSSSS   SS+SS+SSSRGSYYFPDDSP S AATPIRSFSGSIPFSWE+LPGIPKKQSPARLR  S+SPL+ LLPLPP ST  PSSKRF
Subjt:  MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRF

Query:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAV-----DSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
        GF DWRKSNRQNSQRDPFFDAF+ECSKEP+AA        +ELW+ GSNGKA++RSLSDRFGFLN YSSCKRTC VSESIVY PR  RSSFDLLN RSGG
Subjt:  GFQDWRKSNRQNSQRDPFFDAFLECSKEPTAAAV-----DSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G22680.1 unknown protein3.2e-1941.67Show/hide
Query:  SRRTHSFSSSSSNSLSSASS-ASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRFGFQ
        +RR++S   SS+ ++S+  S +SSS  S  F  +SP    ATP+      IPFSWE LPG PK+ S  R     +  LS+LLPLPP+ +    + R    
Subjt:  SRRTHSFSSSSSNSLSSASS-ASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRFGFQ

Query:  DWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG
          +K+    + RDPF  A +ECSK    A  D E  +GG + K + +S S   G LNLYSSC+R C VSESIVYLP++  +S+D L+  + G
Subjt:  DWRKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG

AT1G71970.1 unknown protein5.7e-2444.02Show/hide
Query:  SSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPP--NSTTPPSSKRFG
        SSRR    S SSS+S SS SS SSS  S  FP DSP ++ ATP+R     +PFSWE LPG PK  S     R ++   + LLPLPP  N + P + K+  
Subjt:  SSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPP--NSTTPPSSKRFG

Query:  FQDWRKSNRQNS----QRDPFFDAFLECSK-EPTAAAVDSEL------------WSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPR-
              S+++NS     +DPF  A LECSK E T +  D ++             SGGS+      S+ DRFG +NLY SC+RTC V+ESIVYLPR  + 
Subjt:  FQDWRKSNRQNS----QRDPFFDAFLECSK-EPTAAAVDSEL------------WSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPR-

Query:  SSFDLLNQR
        +S+D L  R
Subjt:  SSFDLLNQR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTTTCAATCTTCTCGCCGGACTCATTCCTTCTCTTCTTCTTCTTCTAATTCCCTCTCCTCCGCTTCCTCCGCCTCCTCCTCCCGCGGCTCTTACTATTTTCCC
GATGACTCTCCCTTCTCCACCGCCGCCACTCCGATCCGATCATTCTCCGGCAGCATTCCCTTCTCTTGGGAGCATTTACCAGGAATCCCTAAAAAACAGTCTCCA
GCCAGGCTCCGGCGAGGTTCATCCTCTCCTCTCTCCTCTCTCCTCCCCTTACCTCCCAATTCCACCACTCCGCCGTCTTCCAAACGCTTCGGATTTCAAGATTGG
AGGAAATCAAACCGTCAAAATTCGCAGCGAGATCCTTTCTTCGACGCCTTCCTCGAGTGCTCTAAGGAACCTACCGCCGCCGCCGTCGATTCCGAGCTCTGGAGC
GGCGGCAGTAATGGTAAGGCGATTACAAGAAGTCTGAGCGATCGATTCGGATTCTTGAATCTGTATTCTTCTTGTAAACGGACCTGCGGCGTTTCGGAATCCATC
GTTTACCTACCGAGAACGCCGAGGAGTTCGTTCGATCTGCTTAACCAGCGTAGCGGCGGGTGA
mRNA sequenceShow/hide mRNA sequence
ATGTTTCAATCTTCTCGCCGGACTCATTCCTTCTCTTCTTCTTCTTCTAATTCCCTCTCCTCCGCTTCCTCCGCCTCCTCCTCCCGCGGCTCTTACTATTTTCCC
GATGACTCTCCCTTCTCCACCGCCGCCACTCCGATCCGATCATTCTCCGGCAGCATTCCCTTCTCTTGGGAGCATTTACCAGGAATCCCTAAAAAACAGTCTCCA
GCCAGGCTCCGGCGAGGTTCATCCTCTCCTCTCTCCTCTCTCCTCCCCTTACCTCCCAATTCCACCACTCCGCCGTCTTCCAAACGCTTCGGATTTCAAGATTGG
AGGAAATCAAACCGTCAAAATTCGCAGCGAGATCCTTTCTTCGACGCCTTCCTCGAGTGCTCTAAGGAACCTACCGCCGCCGCCGTCGATTCCGAGCTCTGGAGC
GGCGGCAGTAATGGTAAGGCGATTACAAGAAGTCTGAGCGATCGATTCGGATTCTTGAATCTGTATTCTTCTTGTAAACGGACCTGCGGCGTTTCGGAATCCATC
GTTTACCTACCGAGAACGCCGAGGAGTTCGTTCGATCTGCTTAACCAGCGTAGCGGCGGGTGA
Protein sequenceShow/hide protein sequence
MFQSSRRTHSFSSSSSNSLSSASSASSSRGSYYFPDDSPFSTAATPIRSFSGSIPFSWEHLPGIPKKQSPARLRRGSSSPLSSLLPLPPNSTTPPSSKRFGFQDW
RKSNRQNSQRDPFFDAFLECSKEPTAAAVDSELWSGGSNGKAITRSLSDRFGFLNLYSSCKRTCGVSESIVYLPRTPRSSFDLLNQRSGG