CuGenDBv2

Gene ID	Moc01g01880
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Unknown protein
Genome location	chr1:1264118..1270164
RNA-Seq Expression	Moc01g01880
Synteny	Moc01g01880
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain IPR021109 - Aspartic peptidase domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022137317.1 uncharacterized protein LOC111008813 [Momordica charantia]

8.8e-236

79.77

Show/hide

Query:  LKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT
        +KA+S   P  P  VITREEFD ++ + D QV+ALKA+CE+KE P +DGDLGESPFTSD++EAPIPPKFK PT+KPYDGSKDPKDYVEVFE LMDFQAA+
Subjt:  LKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT

Query:  DAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET
        DAIKCRAF+IALTGSARLWYRRLPA  ISTYSQLR++F++ FSSRHYD+KT THLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADE 
Subjt:  DAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET

Query:  LTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE--------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI
        LTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE                          + R EYR +E+GPT+SRPYER+TPTTIPIS+ILTNI
Subjt:  LTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE--------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI

Query:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG
        EESGMEKLLKR EKLRG PE+R+KDKYCRFHR+HGHNTS+ WELKRQIE+LIQDGYFKKFVGK R++S EK+EERKRSRTPPRR DRPAVINTIFG  SG
Subjt:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG

Query:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG
        GQSG KRKELAR ARREVC+IREQ+PTC ITF  ADLE VHLPHNDALVIAPL+DHVVV RVLVDGG SANILSLPTYLALGWTRSQLKKSPTPLVGFSG
Subjt:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG

Query:  ESVSPEGCIDLSVTIEQDATQVTQMAEFV
        ESV PEG IDL VT+ QD TQVTQMAEFV
Subjt:  ESVSPEGCIDLSVTIEQDATQVTQMAEFV

XP_022150760.1 uncharacterized protein LOC111018823 [Momordica charantia]

5.7e-203

68.75

Show/hide

Query:  NSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQ
        +SN +A+S + P  P+ VITREEFD ++ + + QV+ALKA+CE+KE P +DGDLGESPFTSD++EA        PT+K YDGSKDPKDYVEVFEGLMDFQ
Subjt:  NSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQ

Query:  AATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLA
        AA+DAIKCRAFQIALTGSARLW                                                     FQE+QLKVA  SDDSAMCYFLTGLA
Subjt:  AATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLA

Query:  DETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE-------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILT
        DE LTVKLG+EAPATFAEVLQKAKKVIDGQELLRTKTGRPE                         + R E+R + +GPT+SRPYER+TPTTIPIS+ILT
Subjt:  DETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE-------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILT

Query:  NIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSL
        NIEESGMEKLLKR EKLRG PE+RNKDKYCRFHR+H HNTS+ WELKRQIEDLIQD YFKKFVGK R++S EK+EERK SRTP RR DRPAVINTIFG  
Subjt:  NIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSL

Query:  SGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGF
        SGGQSG+KRKELAR ARREVC+IREQ+PTC ITF  ADLE VHLPHNDALVIAPL+DHVVVRRVLVD G SANI+SL TYLALGWTRSQLKKS TPLVGF
Subjt:  SGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGF

Query:  SGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK
        S ESV PEGCIDL VT+  D TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFR +PSTL +
Subjt:  SGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK

XP_022152854.1 uncharacterized protein LOC111020479 [Momordica charantia]

4.2e-246

Show/hide

Query:  KAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD
        KA+S Y P+ P  VITREEFD +K +FD QV+ALKARCEKKES FDDGDLGE  F+SDI+EA IPPKFKTPTMKPYDGSKDPKDYVEVFE LMDFQAATD
Subjt:  KAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD

Query:  AIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL
        AIKC AFQIALTGSARLWYRRLPARLISTYSQLRK+FISQFSSRHYDRKT THLATIRQKEGETLREYVTRF EEQLKVAHCSDDSAMCYFLTGLADETL
Subjt:  AIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL

Query:  TVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI
        TVKL EEAPATFAEVLQK KKVIDGQELLRTKTGRPE                           +SR +YR S S   QSRPYE YTPTTIPI +ILTNI
Subjt:  TVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI

Query:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG
        EE+GMEKLLKR EKLRGDPEKRN DKYCRFHRDHGHNTSN WELKRQIEDLIQDGYFKKFVGK RSNS+EK+EERKR RTPPRRDDRPAVI         
Subjt:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG

Query:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG
            NK+KELAREARREVC+IREQ+PT SI F  ADLEGVHLPHNDALVIAPL+D V+VRR+LVDGGASANILSL TYLALGWTRSQLKKSPTPLVGFSG
Subjt:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG

Query:  ESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK
        ES+S EGCIDL V+I QD TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFR VPSTL +
Subjt:  ESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK

XP_022153957.1 uncharacterized protein LOC111021344 [Momordica charantia]

2.0e-192

78.45

Show/hide

Query:  MDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL
        MDFQAATDAIKCRAFQIALT SARLWYRRLPAR ISTYSQLRK+ ISQFSSRHYDRKT THLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL
Subjt:  MDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL

Query:  TGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPEN---------------------------SRTEYRGSESGPTQSRPYERYTPTTIP
        TGLADETLTVKLGEEAPATFAEVL+KAKKVIDGQELLRTKTGRPE                            SRTEYR SESGP++SRPYERYT TTIP
Subjt:  TGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPEN---------------------------SRTEYRGSESGPTQSRPYERYTPTTIP

Query:  ISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVIN
        IS+ILTNIEESGMEKLLKR EKLRGD EKRNKDKYCRFHRDHGHNT++CWELKRQIEDLIQD YFK                                  
Subjt:  ISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVIN

Query:  TIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSP
              +GGQSGNKRK+LAREARREVC+IREQKPTC I F D+DLEGVHLPHNDALVIAPL+DHV VRRVLVDG ASANILSLPTYLALGWTR QLKKSP
Subjt:  TIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSP

Query:  TPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTL
        TP VGFSGESVSPEGCIDL VTI QDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSF  VPSTL
Subjt:  TPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTL

XP_022155139.1 uncharacterized protein LOC111022280 [Momordica charantia]

7.4e-235

72.55

Show/hide

Query:  PGEPGEKGAPSIQPGDGEPIPNNEGVDYSLRDNDLRKHLTEKKKRASWEPEDSPSYSREFSNSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALK
        PG PGEKGAPSIQPG+ EPIPN+EGVDYSLRDNDLRKHLT+KKK+ASWEPEDS SYSREFSNSNLKAQSKYKPL PEAVI REEFDLMKHRFDEQV+ALK
Subjt:  PGEPGEKGAPSIQPGDGEPIPNNEGVDYSLRDNDLRKHLTEKKKRASWEPEDSPSYSREFSNSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALK

Query:  ARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRK
        ARCEKKESPFDD DLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKC AFQIALTGSARLW RRLPAR ISTYSQLRK
Subjt:  ARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRK

Query:  KFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGR
        +FI QFS RHYDRKT THLATIRQKE                                   DETLTVKLGEEAPATFAEVLQ AKKVIDGQELLRTKT R
Subjt:  KFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGR

Query:  PE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHG
        PE                            SRTEYR SESGP++SRPYER                                                  
Subjt:  PE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHG

Query:  HNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDA
             CWELKRQIEDLIQD YFKKFVGK RSNS+EK+EERKRSRTPPRR+DRPAVINTIFG  SGGQ  NKRKELA EARR+V +IREQKPTCSITF D 
Subjt:  HNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDA

Query:  DLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRS
        DLEGVHLPHNDALVIAPL+DHV+VRRVLVDGGASANILSLPTYLAL  TRSQLKKSPTPLVGFS ESVSPEGCIDL VTI QD+TQVTQMAEFVVIDGR 
Subjt:  DLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRS

Query:  AYNAIFGRPIIHSFRTVPSTLQK
        AYNAIF RPIIHSF+ VPS L +
Subjt:  AYNAIFGRPIIHSFRTVPSTLQK

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C7X5 uncharacterized protein LOC111008813

4.2e-236

79.77

Show/hide

Query:  LKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT
        +KA+S   P  P  VITREEFD ++ + D QV+ALKA+CE+KE P +DGDLGESPFTSD++EAPIPPKFK PT+KPYDGSKDPKDYVEVFE LMDFQAA+
Subjt:  LKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAAT

Query:  DAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET
        DAIKCRAF+IALTGSARLWYRRLPA  ISTYSQLR++F++ FSSRHYD+KT THLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADE 
Subjt:  DAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADET

Query:  LTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE--------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI
        LTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE                          + R EYR +E+GPT+SRPYER+TPTTIPIS+ILTNI
Subjt:  LTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE--------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI

Query:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG
        EESGMEKLLKR EKLRG PE+R+KDKYCRFHR+HGHNTS+ WELKRQIE+LIQDGYFKKFVGK R++S EK+EERKRSRTPPRR DRPAVINTIFG  SG
Subjt:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG

Query:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG
        GQSG KRKELAR ARREVC+IREQ+PTC ITF  ADLE VHLPHNDALVIAPL+DHVVV RVLVDGG SANILSLPTYLALGWTRSQLKKSPTPLVGFSG
Subjt:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG

Query:  ESVSPEGCIDLSVTIEQDATQVTQMAEFV
        ESV PEG IDL VT+ QD TQVTQMAEFV
Subjt:  ESVSPEGCIDLSVTIEQDATQVTQMAEFV

A0A6J1D9E1 uncharacterized protein LOC111018823

2.8e-203

68.75

Show/hide

Query:  NSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQ
        +SN +A+S + P  P+ VITREEFD ++ + + QV+ALKA+CE+KE P +DGDLGESPFTSD++EA        PT+K YDGSKDPKDYVEVFEGLMDFQ
Subjt:  NSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQ

Query:  AATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLA
        AA+DAIKCRAFQIALTGSARLW                                                     FQE+QLKVA  SDDSAMCYFLTGLA
Subjt:  AATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLA

Query:  DETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE-------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILT
        DE LTVKLG+EAPATFAEVLQKAKKVIDGQELLRTKTGRPE                         + R E+R + +GPT+SRPYER+TPTTIPIS+ILT
Subjt:  DETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE-------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILT

Query:  NIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSL
        NIEESGMEKLLKR EKLRG PE+RNKDKYCRFHR+H HNTS+ WELKRQIEDLIQD YFKKFVGK R++S EK+EERK SRTP RR DRPAVINTIFG  
Subjt:  NIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSL

Query:  SGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGF
        SGGQSG+KRKELAR ARREVC+IREQ+PTC ITF  ADLE VHLPHNDALVIAPL+DHVVVRRVLVD G SANI+SL TYLALGWTRSQLKKS TPLVGF
Subjt:  SGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGF

Query:  SGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK
        S ESV PEGCIDL VT+  D TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFR +PSTL +
Subjt:  SGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK

A0A6J1DHB3 uncharacterized protein LOC111020479

2.0e-246

Show/hide

Query:  KAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD
        KA+S Y P+ P  VITREEFD +K +FD QV+ALKARCEKKES FDDGDLGE  F+SDI+EA IPPKFKTPTMKPYDGSKDPKDYVEVFE LMDFQAATD
Subjt:  KAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATD

Query:  AIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL
        AIKC AFQIALTGSARLWYRRLPARLISTYSQLRK+FISQFSSRHYDRKT THLATIRQKEGETLREYVTRF EEQLKVAHCSDDSAMCYFLTGLADETL
Subjt:  AIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETL

Query:  TVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI
        TVKL EEAPATFAEVLQK KKVIDGQELLRTKTGRPE                           +SR +YR S S   QSRPYE YTPTTIPI +ILTNI
Subjt:  TVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNI

Query:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG
        EE+GMEKLLKR EKLRGDPEKRN DKYCRFHRDHGHNTSN WELKRQIEDLIQDGYFKKFVGK RSNS+EK+EERKR RTPPRRDDRPAVI         
Subjt:  EESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSG

Query:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG
            NK+KELAREARREVC+IREQ+PT SI F  ADLEGVHLPHNDALVIAPL+D V+VRR+LVDGGASANILSL TYLALGWTRSQLKKSPTPLVGFSG
Subjt:  GQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSG

Query:  ESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK
        ES+S EGCIDL V+I QD TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFR VPSTL +
Subjt:  ESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQK

A0A6J1DKD3 uncharacterized protein LOC111021344

9.9e-193

78.45

Show/hide

Query:  MDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL
        MDFQAATDAIKCRAFQIALT SARLWYRRLPAR ISTYSQLRK+ ISQFSSRHYDRKT THLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL
Subjt:  MDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKKFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFL

Query:  TGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPEN---------------------------SRTEYRGSESGPTQSRPYERYTPTTIP
        TGLADETLTVKLGEEAPATFAEVL+KAKKVIDGQELLRTKTGRPE                            SRTEYR SESGP++SRPYERYT TTIP
Subjt:  TGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPEN---------------------------SRTEYRGSESGPTQSRPYERYTPTTIP

Query:  ISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVIN
        IS+ILTNIEESGMEKLLKR EKLRGD EKRNKDKYCRFHRDHGHNT++CWELKRQIEDLIQD YFK                                  
Subjt:  ISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVIN

Query:  TIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSP
              +GGQSGNKRK+LAREARREVC+IREQKPTC I F D+DLEGVHLPHNDALVIAPL+DHV VRRVLVDG ASANILSLPTYLALGWTR QLKKSP
Subjt:  TIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSP

Query:  TPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTL
        TP VGFSGESVSPEGCIDL VTI QDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSF  VPSTL
Subjt:  TPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTL

A0A6J1DPC9 uncharacterized protein LOC111022280

3.6e-235

72.55

Show/hide

Query:  PGEPGEKGAPSIQPGDGEPIPNNEGVDYSLRDNDLRKHLTEKKKRASWEPEDSPSYSREFSNSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALK
        PG PGEKGAPSIQPG+ EPIPN+EGVDYSLRDNDLRKHLT+KKK+ASWEPEDS SYSREFSNSNLKAQSKYKPL PEAVI REEFDLMKHRFDEQV+ALK
Subjt:  PGEPGEKGAPSIQPGDGEPIPNNEGVDYSLRDNDLRKHLTEKKKRASWEPEDSPSYSREFSNSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQVDALK

Query:  ARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRK
        ARCEKKESPFDD DLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKC AFQIALTGSARLW RRLPAR ISTYSQLRK
Subjt:  ARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRK

Query:  KFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGR
        +FI QFS RHYDRKT THLATIRQKE                                   DETLTVKLGEEAPATFAEVLQ AKKVIDGQELLRTKT R
Subjt:  KFISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGR

Query:  PE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHG
        PE                            SRTEYR SESGP++SRPYER                                                  
Subjt:  PE---------------------------NSRTEYRGSESGPTQSRPYERYTPTTIPISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHG

Query:  HNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDA
             CWELKRQIEDLIQD YFKKFVGK RSNS+EK+EERKRSRTPPRR+DRPAVINTIFG  SGGQ  NKRKELA EARR+V +IREQKPTCSITF D 
Subjt:  HNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQEERKRSRTPPRRDDRPAVINTIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDA

Query:  DLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRS
        DLEGVHLPHNDALVIAPL+DHV+VRRVLVDGGASANILSLPTYLAL  TRSQLKKSPTPLVGFS ESVSPEGCIDL VTI QD+TQVTQMAEFVVIDGR 
Subjt:  DLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRS

Query:  AYNAIFGRPIIHSFRTVPSTLQK
        AYNAIF RPIIHSF+ VPS L +
Subjt:  AYNAIFGRPIIHSFRTVPSTLQK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTAAAGGCAAGGTCCACTCTAGTGTTCAGGTCAGAACCGGAGACCGGGTTCGAGTTCAATTCGTGAAGAACCGTTGGCAAGAGGGAGATCTGCCGCGCAGA
TCTGCCCACCATGCGAACCAAGAGCTACCACCTACTCACCCGAAACCCTCAAAAGCCAACAGAGGCCGAGGAGGGACAGCGAGAAAGACCTCCCAAAAGGCCAAC
CAGGCAGCAGACCCTGAAGCTCTATCTACTCTCCAACGCGAGTTGGATGATATGCGTCATCGGTTGCGCACAATGGAAGAAATGTACGCCGAGGCAACGCGTGCT
AACCGAACTGCATCTCCCTCTATAGCCCCGGGCGAACCCGGTGAAAAGGGAGCTCCATCTATCCAACCTGGCGATGGCGAGCCCATTCCTAACAATGAAGGGGTG
GATTACAGCTTGCGAGACAACGATCTGAGAAAGCATCTCACTGAAAAGAAGAAGAGAGCATCTTGGGAGCCGGAAGACTCTCCTTCCTACTCTCGAGAATTCTCC
AACTCGAACCTAAAGGCTCAATCAAAATACAAGCCCCTAGCACCAGAAGCTGTGATCACCAGGGAAGAATTCGACTTGATGAAACACAGGTTCGACGAGCAGGTC
GATGCACTCAAAGCCAGGTGCGAGAAGAAGGAGAGCCCGTTTGACGATGGCGACTTGGGAGAATCGCCATTCACCTCGGATATTATGGAGGCTCCAATCCCTCCG
AAGTTTAAGACTCCTACCATGAAGCCCTATGATGGGTCTAAGGACCCCAAAGACTATGTTGAGGTCTTCGAGGGCCTCATGGATTTTCAAGCGGCAACGGATGCA
ATAAAATGCCGCGCCTTCCAGATCGCTCTTACCGGCAGCGCGCGCCTGTGGTACCGGAGACTGCCGGCTAGGTTGATATCGACCTATTCTCAGCTGAGAAAGAAG
TTCATTAGCCAGTTCTCTTCTCGGCATTACGATAGAAAAACAACGACTCACCTTGCCACCATCAGACAGAAGGAAGGAGAGACGTTGAGAGAATATGTCACACGG
TTCCAGGAGGAGCAGCTTAAGGTCGCGCACTGCTCCGATGATTCGGCCATGTGCTACTTCCTCACCGGCCTGGCCGATGAGACCTTGACAGTAAAACTTGGAGAG
GAGGCTCCAGCCACCTTCGCCGAAGTATTGCAAAAAGCGAAGAAAGTCATTGATGGGCAGGAGCTCCTCCGAACCAAGACTGGCCGACCTGAAAATAGCAGAACA
GAGTACCGTGGGTCGGAGAGCGGCCCTACCCAGAGCCGACCTTATGAACGGTACACCCCAACCACCATCCCCATCTCCAAGATACTCACGAACATCGAGGAGAGC
GGGATGGAAAAGCTCCTCAAGCGACTTGAGAAGCTCCGAGGAGACCCAGAAAAGCGCAACAAAGATAAGTACTGTCGTTTTCATCGCGATCACGGCCACAATACG
TCAAATTGCTGGGAGTTAAAACGCCAGATTGAAGACCTCATTCAAGATGGCTACTTCAAAAAATTTGTGGGTAAACTGAGGTCTAACTCGATTGAAAAGCAAGAA
GAGAGGAAGCGTTCAAGAACGCCGCCTCGCCGGGATGACCGACCTGCGGTCATCAACACTATTTTCGGGAGCCTGAGTGGGGGCCAGTCCGGAAACAAGAGGAAG
GAGCTAGCTCGCGAGGCCAGGCGCGAGGTATGCGTCATCAGGGAGCAGAAGCCTACTTGCTCCATCACTTTCGGCGACGCCGACTTGGAGGGGGTCCACTTGCCT
CACAATGACGCGCTTGTGATCGCCCCTCTCGTTGATCACGTCGTGGTCCGAAGAGTATTGGTTGATGGAGGTGCATCTGCCAACATCTTGTCCCTCCCAACATAT
CTAGCATTGGGATGGACCAGGTCACAATTGAAAAAAAGTCCAACACCCTTGGTTGGATTCTCTGGAGAATCGGTCTCCCCAGAAGGGTGCATCGACCTGTCGGTA
ACTATCGAGCAAGATGCTACCCAAGTAACGCAGATGGCCGAGTTCGTAGTGATCGACGGTAGATCGGCCTATAACGCCATTTTCGGGAGACCCATCATCCACTCA
TTTCGGACCGTCCCCTCCACACTACAGAAAGCTCGAGCTTCATACGAGACCGACCTGGCTAGATCGGTCCCGGTCGAAATCTTGGACACTCCTTCAATCTTGGAG
CCAGATGTAATGGAGGTTGATACTCCATCACCCACTTGGATGGACCGAATCGTGGAGTTCATCAAAGGAAACCCACCGCAAGATCCGAAGGAGCAAAAGAAGATG
GCACGAAGAGCAGCTCGGTTCACACTCCGAGAAGGAATGTTGTACCGACAGTATCAGAACAGAATGGCCAGACATTACAATGCCCGAGTTCGACCTCGAAGCTTC
CAAGTTGGACATTTGGTCTTGAGAAAAATTCAGAGTCATGTTGGCACCCTTGACCCAAGTTGGGAGGGACCATTCGAAGTCAAAGGCATAGTCCGACCTGGAACT
TATATGCTGGCTGACCTGGAAGGAAGAGTGCTTGCGCATCCATGGAACGCGGAGCACTTGAAGTGCTATTACCCCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVKGKVHSSVQVRTGDRVRVQFVKNRWQEGDLPRRSAHHANQELPPTHPKPSKANRGRGGTARKTSQKANQAADPEALSTLQRELDDMRHRLRTMEEMYAEATRA
NRTASPSIAPGEPGEKGAPSIQPGDGEPIPNNEGVDYSLRDNDLRKHLTEKKKRASWEPEDSPSYSREFSNSNLKAQSKYKPLAPEAVITREEFDLMKHRFDEQV
DALKARCEKKESPFDDGDLGESPFTSDIMEAPIPPKFKTPTMKPYDGSKDPKDYVEVFEGLMDFQAATDAIKCRAFQIALTGSARLWYRRLPARLISTYSQLRKK
FISQFSSRHYDRKTTTHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADETLTVKLGEEAPATFAEVLQKAKKVIDGQELLRTKTGRPENSRT
EYRGSESGPTQSRPYERYTPTTIPISKILTNIEESGMEKLLKRLEKLRGDPEKRNKDKYCRFHRDHGHNTSNCWELKRQIEDLIQDGYFKKFVGKLRSNSIEKQE
ERKRSRTPPRRDDRPAVINTIFGSLSGGQSGNKRKELAREARREVCVIREQKPTCSITFGDADLEGVHLPHNDALVIAPLVDHVVVRRVLVDGGASANILSLPTY
LALGWTRSQLKKSPTPLVGFSGESVSPEGCIDLSVTIEQDATQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRTVPSTLQKARASYETDLARSVPVEILDTPSILE
PDVMEVDTPSPTWMDRIVEFIKGNPPQDPKEQKKMARRAARFTLREGMLYRQYQNRMARHYNARVRPRSFQVGHLVLRKIQSHVGTLDPSWEGPFEVKGIVRPGT
YMLADLEGRVLAHPWNAEHLKCYYP

Moc01g01880 (gene) of Bitter gourd (OHB3-1) v2 genome