; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS002997 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS002997
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
Descriptionsmall acidic protein-like isoform X2
Genome locationscaffold595_1:893098..894300
RNA-Seq ExpressionMS002997
SyntenyMS002997
Gene Ontology termsGO:0005515 - protein binding (molecular function)
InterPro domainsIPR036020 - WW domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0039848.1 uncharacterized protein E6C27_scaffold122G001230 [Cucumis melo var. makuwa]2.4e-6676.35Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-N
        +VKEDPRTA A   +   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRSD+ N
Subjt:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-N

Query:  GFP
        GFP
Subjt:  GFP

XP_004140554.1 uncharacterized protein LOC101221916 [Cucumis sativus]1.9e-6675Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGESSYYSEDEEG----SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-
        +VKEDPRTA A   +   Y ED++G     SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRSD+ 
Subjt:  RVKEDPRTAEADGGESSYYSEDEEG----SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-

Query:  NGFP
        NGFP
Subjt:  NGFP

XP_016902460.1 PREDICTED: uncharacterized protein LOC103498882 [Cucumis melo]1.0e-6476.26Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD
        +VKEDPRTA A   +   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRSD+
Subjt:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD

XP_022148882.1 uncharacterized protein LOC111017445 [Momordica charantia]1.8e-9899.47Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
        MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR

Query:  TAEADGGESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
        TAEADGG+SSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
Subjt:  TAEADGGESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP

XP_038906838.1 uncharacterized protein LOC120092736 [Benincasa hispida]1.3e-6775.61Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRL+SAAA+SA   R  SS SSS SSSDDE       H++FDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGESSYYSEDEE-----GSSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD
        RVKEDPRTAEA   +   YSEDE+       SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRSD+
Subjt:  RVKEDPRTAEADGGESSYYSEDEE-----GSSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD

Query:  -NGFP
         NGFP
Subjt:  -NGFP

TrEMBL top hitse value%identityAlignment
A0A0A0KF89 Uncharacterized protein9.0e-6775Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGESSYYSEDEEG----SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-
        +VKEDPRTA A   +   Y ED++G     SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRSD+ 
Subjt:  RVKEDPRTAEADGGESSYYSEDEEG----SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-

Query:  NGFP
        NGFP
Subjt:  NGFP

A0A1S4E3A8 uncharacterized protein LOC1034988824.9e-6576.26Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD
        +VKEDPRTA A   +   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRSD+
Subjt:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD

A0A5A7TA84 Uncharacterized protein1.2e-6676.35Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM
        MKSPDMAA+TDSLEQSFRNFSLNHRLSSAA +SA   R  SS SSS SSSDDE       H+RFDT LELNSHISLPPFWEQCLDLKTGEVYY NCRTGM
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDE-------HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGM

Query:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-N
        +VKEDPRTA A   +   YSED  E+G  SS DGGSEESC SSS GG R+Q    N EDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRSD+ N
Subjt:  RVKEDPRTAEADGGESSYYSED--EEG-SSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-N

Query:  GFP
        GFP
Subjt:  GFP

A0A6J1D688 uncharacterized protein LOC1110174458.9e-9999.47Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
        MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPR

Query:  TAEADGGESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
        TAEADGG+SSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP
Subjt:  TAEADGGESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP

A0A6J1GM82 uncharacterized protein LOC1114557802.1e-6373.5Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSD---DEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKE
        MKSPDMAA+TDSLEQSFR FSLNHRL SAA ++    RRSSSSSSS        ++HHRFDTTLELNSHISLPPFWEQCLDLKTGEVYY NCRTGMRV E
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSD---DEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKE

Query:  DPRTAEADGGESSYYSEDEE----GSSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-NGFP
        DPRTAEA   +   YSED++      SS D GSEESC SSS G  R+Q     EEDVLVVAGCKRCFMYFMVPKQVEDCPKC SS LVHFDRS+D NGFP
Subjt:  DPRTAEADGGESSYYSEDEE----GSSSDDGGSEESCCSSSCGGRRKQ----NEEDVLVVAGCKRCFMYFMVPKQVEDCPKC-SSLLVHFDRSDD-NGFP

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G28070.1 unknown protein9.6e-2945.99Show/hide
Query:  MAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPRT----
        MA IT+ LE+S +N SL                R SS       SD+     D  LEL+SH S+P   EQCLDLKTGE+YY +  +GMRVKEDPR     
Subjt:  MAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPRT----

Query:  ---AEADGGESS--YYSEDEEGSSSDDGGSEESCCSSSCGGR---RKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR
           A+   GESS   +S +E  S  +   SEES   SS   R   +++ +EDVLVVAGCK C MYFMVPK  +DCPKC++ L+HFD+
Subjt:  ---AEADGGESS--YYSEDEEGSSSDDGGSEESCCSSSCGGR---RKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR

AT2G33510.1 CONTAINS InterPro DOMAIN/s: WW/Rsp5/WWP (InterPro:IPR001202)1.6e-3950.77Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKED
        MK+P+M  IT+SLE+S  N SLN R            RR         SS +EH     D TLELNSH+SLP  WEQCLDLKTGE+YYIN + GMRVKED
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKED

Query:  PR---TAEADGG----------ESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR
        PR    A+ D G          +SSYY  +E  S S     E            ++ EEDVLVVAGCK CFMYFMVPK VEDCPKC++ L+HFDR
Subjt:  PR---TAEADGG----------ESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDR

AT2G33510.2 unknown protein1.6e-3647.14Show/hide
Query:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLK---------------TGE
        MK+P+M  IT+SLE+S  N SLN R            RR         SS +EH     D TLELNSH+SLP  WEQCLDLK               TGE
Subjt:  MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHR--FDTTLELNSHISLPPFWEQCLDLK---------------TGE

Query:  VYYINCRTGMRVKEDPR---TAEADGG----------ESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPK
        +YYIN + GMRVKEDPR    A+ D G          +SSYY  +E  S S     E            ++ EEDVLVVAGCK CFMYFMVPK VEDCPK
Subjt:  VYYINCRTGMRVKEDPR---TAEADGG----------ESSYYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPK

Query:  CSSLLVHFDR
        C++ L+HFDR
Subjt:  CSSLLVHFDR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAAATCTCCGGATATGGCGGCGATTACTGATTCTCTGGAGCAGTCTTTCCGTAACTTCTCCCTCAATCATCGCCTCTCCTCGGCTGCCGCGGCCTCCGCCGCAAGGCC
CCGGAGGTCCTCCTCCTCTTCCTCTTCACCTTCTTCTTCCGACGACGAACATCATCGCTTCGACACAACCTTGGAACTCAACTCTCACATCTCCCTCCCTCCTTTCTGGG
AGCAATGCCTCGATTTAAAGACAGGGGAAGTGTACTACATCAACTGCCGGACCGGGATGAGAGTAAAGGAAGATCCTCGGACGGCGGAAGCAGACGGCGGAGAATCTTCG
TACTACTCGGAAGACGAGGAGGGGAGCTCGTCGGACGACGGCGGGAGCGAGGAGTCGTGTTGTTCGTCGTCGTGCGGTGGTAGGAGAAAGCAAAACGAGGAGGACGTGCT
GGTGGTGGCCGGATGCAAGAGATGCTTCATGTACTTCATGGTGCCGAAGCAGGTGGAAGATTGCCCCAAATGCAGCAGTCTTCTTGTTCATTTCGATCGCTCCGACGATA
ATGGCTTCCCA
mRNA sequenceShow/hide mRNA sequence
ATGAAATCTCCGGATATGGCGGCGATTACTGATTCTCTGGAGCAGTCTTTCCGTAACTTCTCCCTCAATCATCGCCTCTCCTCGGCTGCCGCGGCCTCCGCCGCAAGGCC
CCGGAGGTCCTCCTCCTCTTCCTCTTCACCTTCTTCTTCCGACGACGAACATCATCGCTTCGACACAACCTTGGAACTCAACTCTCACATCTCCCTCCCTCCTTTCTGGG
AGCAATGCCTCGATTTAAAGACAGGGGAAGTGTACTACATCAACTGCCGGACCGGGATGAGAGTAAAGGAAGATCCTCGGACGGCGGAAGCAGACGGCGGAGAATCTTCG
TACTACTCGGAAGACGAGGAGGGGAGCTCGTCGGACGACGGCGGGAGCGAGGAGTCGTGTTGTTCGTCGTCGTGCGGTGGTAGGAGAAAGCAAAACGAGGAGGACGTGCT
GGTGGTGGCCGGATGCAAGAGATGCTTCATGTACTTCATGGTGCCGAAGCAGGTGGAAGATTGCCCCAAATGCAGCAGTCTTCTTGTTCATTTCGATCGCTCCGACGATA
ATGGCTTCCCA
Protein sequenceShow/hide protein sequence
MKSPDMAAITDSLEQSFRNFSLNHRLSSAAAASAARPRRSSSSSSSPSSSDDEHHRFDTTLELNSHISLPPFWEQCLDLKTGEVYYINCRTGMRVKEDPRTAEADGGESS
YYSEDEEGSSSDDGGSEESCCSSSCGGRRKQNEEDVLVVAGCKRCFMYFMVPKQVEDCPKCSSLLVHFDRSDDNGFP