; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS024540 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS024540
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
DescriptionTrinucleotide repeat-containing gene 18 protein-like protein
Genome locationscaffold234:3391274..3392487
RNA-Seq ExpressionMS024540
SyntenyMS024540
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7033401.1 hypothetical protein SDJN02_07457, partial [Cucurbita argyrosperma subsp. argyrosperma]1.9e-6979.9Show/hide
Query:  MFQSSRRTHSF-SSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQ
        MFQSSRRT SF SSSSS SSSSSSSRGSYYFPDDSPLS+ATPIRSFSG+IPFSWE+LPGIPKK QSPARLR DSASPLTSLLPLPP STT PSSKRFGF 
Subjt:  MFQSSRRTHSF-SSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQ

Query:  EWRKSNRHNSQRDPFFDAFVECSKDRASA-------AAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
        +WRKSNR N QRDPFFDAFVECSK+ ++A        AELW+ G   + GKA+SRSLSDRFGFLN YSSCKRTCGVSESIV  PR  RSSFDLL
Subjt:  EWRKSNRHNSQRDPFFDAFVECSKDRASA-------AAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

XP_008441227.1 PREDICTED: uncharacterized protein LOC103485423 [Cucumis melo]9.8e-7181.87Show/hide
Query:  MFQSSRRTHSFSSSS----SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKR
        MFQSSRRTHSFSSSS    S SSSSSSSRGSYYFP +SP S SATPIRSFSG IPFSWEHLPGIPKK QSPARLR+ SASPL+SLLPLPPNSTT  SSKR
Subjt:  MFQSSRRTHSFSSSS----SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKR

Query:  FGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA--AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
        FGFQ+WRKSNR N QRDPFFDAF+ECSK+  +AA  AELWS   G++ GKAI+RSLSDRFGFLNLYSSCKRTCGVSESIV LPRTP SSFDLL
Subjt:  FGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA--AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

XP_011649907.1 uncharacterized protein LOC105434677 [Cucumis sativus]2.8e-7382.9Show/hide
Query:  MFQSSRRTHSF---SSSSSLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRF
        MFQSSRRTHSF   SSS+SLSSSSSSSRGSYYFPDDSP S +ATPIRSFSG IPFSWEHLPGIPKK QSPARLR+ SASPL+S LPLPPNSTTP SSKRF
Subjt:  MFQSSRRTHSF---SSSSSLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRF

Query:  GFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA---AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
        GFQ+WRKSNR N+QRDPFFDAF+ECSK+  +AA   AELWSGG   + GKAI+RSLSDRFGFLNLYSSCKRTCGVSESIV LPRT RSSFDLL
Subjt:  GFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA---AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

XP_022152500.1 uncharacterized protein LOC111020211 [Momordica charantia]5.2e-10499.5Show/hide
Query:  MFQSSRRTHSFSSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQE
        MFQSSRRTHSFSSSSSL SSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQE
Subjt:  MFQSSRRTHSFSSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQE

Query:  WRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLLVRSPPPPDGCDEIS
        WRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLLVRSPPPPDGCDEIS
Subjt:  WRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLLVRSPPPPDGCDEIS

Query:  G
        G
Subjt:  G

XP_038885392.1 uncharacterized protein LOC120075791 [Benincasa hispida]3.7e-7886.98Show/hide
Query:  MFQSSRRTHSFSSSS--SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFG
        MFQSSRRTHSFSSSS  SLSSSSSSSRGSYYFPD+SP S +ATPIRSFSG+IPFSWEHLPGIPKK QSPARLR+ SASPL+SLLPLPPNS TPPSSKRFG
Subjt:  MFQSSRRTHSFSSSS--SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFG

Query:  FQEWRKSNRHNSQRDPFFDAFVECSKDRASAA---AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
        FQ+WRKSNR NSQRDPFFDAF+ECSK+ ++AA   AELWSGGGGSN GKAI+RSLSDRFGFLNLYSSCKRTCGVSESIV LPRTPRSSFDLL
Subjt:  FQEWRKSNRHNSQRDPFFDAFVECSKDRASAA---AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

TrEMBL top hitse value%identityAlignment
A0A1S3B2H5 uncharacterized protein LOC1034854234.8e-7181.87Show/hide
Query:  MFQSSRRTHSFSSSS----SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKR
        MFQSSRRTHSFSSSS    S SSSSSSSRGSYYFP +SP S SATPIRSFSG IPFSWEHLPGIPKK QSPARLR+ SASPL+SLLPLPPNSTT  SSKR
Subjt:  MFQSSRRTHSFSSSS----SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKR

Query:  FGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA--AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
        FGFQ+WRKSNR N QRDPFFDAF+ECSK+  +AA  AELWS   G++ GKAI+RSLSDRFGFLNLYSSCKRTCGVSESIV LPRTP SSFDLL
Subjt:  FGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA--AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

A0A5D3C8I6 Trinucleotide repeat-containing gene 18 protein-like protein4.8e-7181.87Show/hide
Query:  MFQSSRRTHSFSSSS----SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKR
        MFQSSRRTHSFSSSS    S SSSSSSSRGSYYFP +SP S SATPIRSFSG IPFSWEHLPGIPKK QSPARLR+ SASPL+SLLPLPPNSTT  SSKR
Subjt:  MFQSSRRTHSFSSSS----SLSSSSSSSRGSYYFPDDSPLS-SATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKR

Query:  FGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA--AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
        FGFQ+WRKSNR N QRDPFFDAF+ECSK+  +AA  AELWS   G++ GKAI+RSLSDRFGFLNLYSSCKRTCGVSESIV LPRTP SSFDLL
Subjt:  FGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAA--AELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

A0A6J1DE38 uncharacterized protein LOC1110202112.5e-10499.5Show/hide
Query:  MFQSSRRTHSFSSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQE
        MFQSSRRTHSFSSSSSL SSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQE
Subjt:  MFQSSRRTHSFSSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQE

Query:  WRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLLVRSPPPPDGCDEIS
        WRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLLVRSPPPPDGCDEIS
Subjt:  WRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLLVRSPPPPDGCDEIS

Query:  G
        G
Subjt:  G

A0A6J1GNZ5 uncharacterized protein LOC1114561373.4e-6979.49Show/hide
Query:  MFQSSRRTHSFSSS--SSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGF
        MFQSSRRT SFSSS  SS SSSSSSSRGSYYFPDDSPLS+ATPIRSFSG+IPFSWE+LPGIPKK QSPARLR DSASPLTSLLPLPP STT PSSKRFGF
Subjt:  MFQSSRRTHSFSSS--SSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGF

Query:  QEWRKSNRHNSQRDPFFDAFVECSKDRASA-------AAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
         +WRKSNR NSQRDPFFDAFVECSK+ ++A        AELW+ G   + GKA+SRSLSDRFGFLN  SSCKRTCGVSESIV  PR  RSSFDLL
Subjt:  QEWRKSNRHNSQRDPFFDAFVECSKDRASA-------AAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

A0A6J1JTM6 uncharacterized protein LOC1114877392.2e-6878.87Show/hide
Query:  MFQSSRRTHSF-SSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQ
        MFQSSRRT SF SSSSS SSSSSSSRGSYYFPDDSPLS+ATPIRSFSG+IPFSWE+LPGIPKK QSPARLR DSASPLT LLPLPP ST  PSSKRFGF 
Subjt:  MFQSSRRTHSF-SSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQ

Query:  EWRKSNRHNSQRDPFFDAFVECSKDRASA-------AAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL
        +WRKSNR NSQRDPFFDAFVECSK+ ++A        AELW+ G   + GKA+SRSLSDRFGFLN YSSCKRTC VSESIV  PR  RSSFDLL
Subjt:  EWRKSNRHNSQRDPFFDAFVECSKDRASA-------AAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPRSSFDLL

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G22680.1 unknown protein6.2e-1541.08Show/hide
Query:  RTMFQSSRRTHS--FSSSSSLS---SSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSS
        RT    +RR++S  FSS+ ++S   S SSSS  S  F  +SP   ATP+      IPFSWE LPG PK+     +        L++LLPLPP+ +    +
Subjt:  RTMFQSSRRTHS--FSSSSSLS---SSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSS

Query:  KRFGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRT
         R      +K+    + RDPF  A VECSK    A  +    GG S      SRS+    G LNLYSSC+R C VSESIV LP++
Subjt:  KRFGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVSESIVCLPRT

AT1G71970.1 unknown protein4.0e-2244.12Show/hide
Query:  SSRRTHSFSSSSSLSSSSSSSRGSYYFPDDSPLSS-ATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPP--NSTTPPSSKRFGFQE
        SSRR  S SSSSS SS SS S  S  FP DSPL+S ATP+R     +PFSWE LPG PK        R+++ S    LLPLPP  N + P + K+    +
Subjt:  SSRRTHSFSSSSSLSSSSSSSRGSYYFPDDSPLSS-ATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPP--NSTTPPSSKRFGFQE

Query:  WRKSNRHNS----QRDPFFDAFVECSKDRASAAAELWSGGG---------GSNGG--KAISR-SLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPR-SSF
           S++ NS     +DPF  A +ECSKD  + +       G         G++GG  K +S+ S+ DRFG +NLY SC+RTC V+ESIV LPR  + +S+
Subjt:  WRKSNRHNS----QRDPFFDAFVECSKDRASAAAELWSGGG---------GSNGG--KAISR-SLSDRFGFLNLYSSCKRTCGVSESIVCLPRTPR-SSF

Query:  DLLV
        D L+
Subjt:  DLLV

AT5G53030.1 unknown protein2.2e-0440Show/hide
Query:  ATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSS
        ATP  + +G++PF WE  PG P++++ PARL Q     +   L LPP    P  S
Subjt:  ATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSS

AT5G53030.2 unknown protein2.2e-0440Show/hide
Query:  ATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSS
        ATP  + +G++PF WE  PG P++++ PARL Q     +   L LPP    P  S
Subjt:  ATPIRSFSGAIPFSWEHLPGIPKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGATTGGGCTTCGAATCTCAATATCTAATTCATTTTTTAGACCTTATATCTTAAAGACACCGGTGCGTGTGTGCGCGCAGAAAGCGAATCCCCAATTTCCAAATTCCCA
AATTCTTTCAGAAGAGAATGTGAAGAGTCAGAGAAAGAGAACGATGTTTCAATCTTCTCGCCGGACTCATTCTTTTTCTTCTTCTTCCTCCCTCTCCTCCTCCTCCTCCT
CCTCCCGCGGCTCCTACTACTTTCCCGATGACTCTCCCCTCTCCTCCGCCACTCCGATCCGATCATTCTCCGGTGCCATTCCCTTCTCATGGGAACATCTGCCCGGAATC
CCCAAGAAATTACAGTCTCCGGCCAGGCTCCGGCAAGATTCCGCCTCCCCGCTGACCTCTCTCCTCCCCCTGCCTCCCAATTCCACCACTCCGCCCTCCTCCAAGCGCTT
CGGATTTCAAGAATGGAGGAAATCGAACCGCCACAACTCGCAGCGGGATCCTTTCTTTGACGCCTTCGTCGAGTGCTCCAAGGACCGCGCCTCCGCCGCCGCCGAGCTTT
GGAGCGGCGGCGGCGGCAGCAATGGCGGCAAGGCGATTTCGAGAAGCTTGAGCGACCGGTTCGGGTTCTTGAATCTGTACTCTTCCTGCAAACGGACCTGCGGCGTCTCG
GAGTCGATCGTGTGCCTTCCGAGAACGCCGAGAAGTTCCTTCGATCTGCTGGTGAGGTCCCCGCCGCCGCCGGATGGATGCGACGAGATAAGTGGTTGA
mRNA sequenceShow/hide mRNA sequence
ATGATTGGGCTTCGAATCTCAATATCTAATTCATTTTTTAGACCTTATATCTTAAAGACACCGGTGCGTGTGTGCGCGCAGAAAGCGAATCCCCAATTTCCAAATTCCCA
AATTCTTTCAGAAGAGAATGTGAAGAGTCAGAGAAAGAGAACGATGTTTCAATCTTCTCGCCGGACTCATTCTTTTTCTTCTTCTTCCTCCCTCTCCTCCTCCTCCTCCT
CCTCCCGCGGCTCCTACTACTTTCCCGATGACTCTCCCCTCTCCTCCGCCACTCCGATCCGATCATTCTCCGGTGCCATTCCCTTCTCATGGGAACATCTGCCCGGAATC
CCCAAGAAATTACAGTCTCCGGCCAGGCTCCGGCAAGATTCCGCCTCCCCGCTGACCTCTCTCCTCCCCCTGCCTCCCAATTCCACCACTCCGCCCTCCTCCAAGCGCTT
CGGATTTCAAGAATGGAGGAAATCGAACCGCCACAACTCGCAGCGGGATCCTTTCTTTGACGCCTTCGTCGAGTGCTCCAAGGACCGCGCCTCCGCCGCCGCCGAGCTTT
GGAGCGGCGGCGGCGGCAGCAATGGCGGCAAGGCGATTTCGAGAAGCTTGAGCGACCGGTTCGGGTTCTTGAATCTGTACTCTTCCTGCAAACGGACCTGCGGCGTCTCG
GAGTCGATCGTGTGCCTTCCGAGAACGCCGAGAAGTTCCTTCGATCTGCTGGTGAGGTCCCCGCCGCCGCCGGATGGATGCGACGAGATAAGTGGTTGA
Protein sequenceShow/hide protein sequence
MIGLRISISNSFFRPYILKTPVRVCAQKANPQFPNSQILSEENVKSQRKRTMFQSSRRTHSFSSSSSLSSSSSSSRGSYYFPDDSPLSSATPIRSFSGAIPFSWEHLPGI
PKKLQSPARLRQDSASPLTSLLPLPPNSTTPPSSKRFGFQEWRKSNRHNSQRDPFFDAFVECSKDRASAAAELWSGGGGSNGGKAISRSLSDRFGFLNLYSSCKRTCGVS
ESIVCLPRTPRSSFDLLVRSPPPPDGCDEISG