CuGenDBv2

Gene ID	Moc06g29210
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Unknown protein
Genome location	chr6:21960976..21965549
RNA-Seq Expression	Moc06g29210
Synteny	Moc06g29210
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain IPR021109 - Aspartic peptidase domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022137317.1 uncharacterized protein LOC111008813 [Momordica charantia]

6.8e-264

90.89

Show/hide

Query:  AESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE--------------
        AESS NPATPAGVITR EFDQLRG+LDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE              
Subjt:  AESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE--------------

Query:  -------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALT
               IALTGSARLWYRRLPA SISTY+QLRREFLA FSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALT
Subjt:  -------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALT

Query:  VKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEE
        VKLG+EAPATF EVLQKAKKVIDGQELLRTKT RPER+IGR RSGKD E AD KSKDKGSFSSGRAE+RRA NG TRSRPYERFTPTTIPISEILTNIEE
Subjt:  VKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEE

Query:  SGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQ
        SGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSD WELKRQIE+LIQDGYFKKFVGKPRTSSA+KKEERKRSRTPPRRTDRPAVINTIFGGPS GQ
Subjt:  SGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQ

Query:  SGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGES
        SG KRKE ARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVV RVLVDGG SANILSLPTYLALGWTRSQLKKSPTPLVGFSGES
Subjt:  SGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGES

Query:  VIPEGCIDLPVTMGQDQTQVTQMAEFV
        VIPEG IDLPVT+GQDQTQVTQMAEFV
Subjt:  VIPEGCIDLPVTMGQDQTQVTQMAEFV

XP_022150760.1 uncharacterized protein LOC111018823 [Momordica charantia]

7.3e-266

77.49

Show/hide

Query:  SENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE-------
        S NQ+  AESSHNPATP GVITR EFDQLRGKL+AQVEALKAKCEQKEGPLNDGDLGESPFTSDVLE        APTVK YDGSKDPKDYVE       
Subjt:  SENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE-------

Query:  --------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTG
                      IALTGSARLW                                                     FQE+QLKVA  SDDSAMCYFLTG
Subjt:  --------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTG

Query:  LADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDEKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEI
        LADEALTVKLG EAPATF EVLQKAKKVIDGQELLRTKT RPER I R RSGKDEKADLKSKDKGSFSSGRAEFRRAVNG TRSRPYERFTPTTIPISEI
Subjt:  LADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDEKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEI

Query:  LTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFG
        LTNIEESGMEKLLKRPEKLRGAPERR+KDKYCRFHREH HNTSD WELKRQIEDLIQD YFKKFVGKPRTSSA+KKEERK SRTP RR DRPAVINTIFG
Subjt:  LTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFG

Query:  GPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLV
        GPS GQSGHKRKE ARAARREVCIIREQRPTCPITFD ADLEEVHLPHNDALVIAPLIDHVVVRRVLVD G SANI+SL TYLALGWTRSQLKKS TPLV
Subjt:  GPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLV

Query:  GFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALET
        GFS ESVIPEGCIDLPVT+G DQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVG VRGEQ ASRECYASALKGSSVCALET
Subjt:  GFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALET

Query:  LAGRDGTLEFEADLPRREFAAPTEELE----LKEHFFRGLDHPTKMMLNNAAN
        L  RDGTLEF+A+LPRREFAAPTEELE    L+  +   +DH  ++   ++ N
Subjt:  LAGRDGTLEFEADLPRREFAAPTEELE----LKEHFFRGLDHPTKMMLNNAAN

XP_022152110.1 uncharacterized protein LOC111019899 [Momordica charantia]

3.0e-219

91.28

Show/hide

Query:  MCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTP
        MCYFLTGLADEALTVKL +EAPATF EVLQKAKKVIDGQELLRTK       IG+ RSGKD E  D KSKDKGSFS+GRAE+RRA NG TRSRPYERFTP
Subjt:  MCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTP

Query:  TTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRP
        TTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSD WELK QIEDLIQDGYFKKFVGKPRTSSA+KKEERKRSRTPPRRTDRP
Subjt:  TTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRP

Query:  AVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQL
        AVINTIFGGPS GQSGHKRK+ ARAARREVCIIREQRPTCPITFD ADL EVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQL
Subjt:  AVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQL

Query:  KKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKG
        KKSPTPLVGFSGESV+PEGCIDLPVT+GQDQT+VTQMAEFVV+DGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYAS LKG
Subjt:  KKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKG

Query:  SSVCALETLAGRDGTLEFEADLPRREFAAPTEELEL
        +SVCALETL  RDGTLEFEADLP REFAAP EELEL
Subjt:  SSVCALETLAGRDGTLEFEADLPRREFAAPTEELEL

XP_022152854.1 uncharacterized protein LOC111020479 [Momordica charantia]

5.4e-269

69.96

Show/hide

Query:  MVQPANLTNTADRKTLAASDAHQREVGVAVVEGQGHDGLATEPLRRSARITAPVLPPAHPRTSKATRGRGGTSKKSARGPAPAPTSENFDALQREMEAMR
        MVQPAN TNTADR+ LAA+  HQREVG  VVEGQGH+ L TEPL RSARIT PVLPPAHP+ SK                                    
Subjt:  MVQPANLTNTADRKTLAASDAHQREVGVAVVEGQGHDGLATEPLRRSARITAPVLPPAHPRTSKATRGRGGTSKKSARGPAPAPTSENFDALQREMEAMR

Query:  TQMRSMEEMYNEMILAAGAGSRSENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPT
                                     AESS+NP TP GVITR EFDQL+ K DAQVEALKA+CE+KE   +DGDLGE  F+SD+LEA IPPKFK PT
Subjt:  TQMRSMEEMYNEMILAAGAGSRSENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPT

Query:  VKPYDGSKDPKDYVE---------------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRF
        +KPYDGSKDPKDYVE                     IALTGSARLWYRRLPAR ISTY+QLR+EF++QFSSRHYD+KT THLATIRQKEGETLREYVTRF
Subjt:  VKPYDGSKDPKDYVE---------------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRF

Query:  QEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDE-KADLKSKDKG-SFSSGRAEFRR
         EEQLKVAHCSDDSAMCYFLTGLADE LTVKL +EAPATF EVLQK KKVIDGQELLRTKT RPE+ I + R+GKD+ KAD KS+DKG S SS R ++RR
Subjt:  QEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDE-KADLKSKDKG-SFSSGRAEFRR

Query:  AVNGHTRSRPYERFTPTTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKK
        + + H +SRPYE +TPTTIPI EILTNIEE+GMEKLLKRPEKLRG PE+R+ DKYCRFHR+HGHNTS+ WELKRQIEDLIQDGYFKKFVGKPR++S +KK
Subjt:  AVNGHTRSRPYERFTPTTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKK

Query:  EERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANI
        EERKR RTPPRR DRPAVIN             K+KE AR ARREVCIIREQRPT  I F+ ADLE VHLPHNDALVIAPLID V+VRR+LVDGGASANI
Subjt:  EERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANI

Query:  LSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVR
        LSL TYLALGWTRSQLKKSPTPLVGFSGES+  EGCIDLPV++ QD TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRA+PSTLHQVLKYST NGVGTVR
Subjt:  LSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVR

Query:  GEQTASRECYASALKGSSVCALETLAGRD
        GE   SRECYAS  K SSVCALE    RD
Subjt:  GEQTASRECYASALKGSSVCALETLAGRD

XP_022158414.1 uncharacterized protein LOC111024904 [Momordica charantia]

1.0e-206

74.81

Show/hide

Query:  EIALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDE
        +IALTGSARLWYRRLPARSISTY+QLR+EF++QFSS HYD+KTATHLATIRQKE ETLREYVTRFQEEQLKVAHCSDDSAMCYFLT LADE LTVKLG+E
Subjt:  EIALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDE

Query:  APATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDR-SGKDEKADLKSKDKGSFSS-GRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEESGMEK
        AP TFVEVLQKAKKVIDGQELLRTKT RPE++I + + S +  KAD KS+DKGS SS  R E+RR  +G +RSRPYER+T +TIPISEILTNIEESGMEK
Subjt:  APATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDR-SGKDEKADLKSKDKGSFSS-GRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEESGMEK

Query:  LLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKR
        LLKRPEKLRG  E+R+K+KYCRFHR+HGHNT+ CWELKRQIEDLIQDGYFKKFVGKPR++S +KKEERKRSRTPPRR DRPAVINTIFGGP+ GQSG+KR
Subjt:  LLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKR

Query:  KESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEG
        KE AR ARREVCIIRE +PTC ITF  ADLE VHLPHNDALVIA LIDH +VRRVL+DG                                        G
Subjt:  KESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEG

Query:  CIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALETLAGRDGTLEFE
        CIDLPVT+GQD TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRA+PSTLHQVLKYSTPN VG VRGEQ  SRECYASALKGS+VCALE    R    E E
Subjt:  CIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALETLAGRDGTLEFE

Query:  ADLP---RREFAAPTEELEL
        ADLP   +R+F  PTEELEL
Subjt:  ADLP---RREFAAPTEELEL

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C7X5 uncharacterized protein LOC111008813

3.3e-264

90.89

Show/hide

Query:  AESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE--------------
        AESS NPATPAGVITR EFDQLRG+LDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE              
Subjt:  AESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE--------------

Query:  -------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALT
               IALTGSARLWYRRLPA SISTY+QLRREFLA FSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALT
Subjt:  -------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALT

Query:  VKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEE
        VKLG+EAPATF EVLQKAKKVIDGQELLRTKT RPER+IGR RSGKD E AD KSKDKGSFSSGRAE+RRA NG TRSRPYERFTPTTIPISEILTNIEE
Subjt:  VKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEE

Query:  SGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQ
        SGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSD WELKRQIE+LIQDGYFKKFVGKPRTSSA+KKEERKRSRTPPRRTDRPAVINTIFGGPS GQ
Subjt:  SGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQ

Query:  SGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGES
        SG KRKE ARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVV RVLVDGG SANILSLPTYLALGWTRSQLKKSPTPLVGFSGES
Subjt:  SGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGES

Query:  VIPEGCIDLPVTMGQDQTQVTQMAEFV
        VIPEG IDLPVT+GQDQTQVTQMAEFV
Subjt:  VIPEGCIDLPVTMGQDQTQVTQMAEFV

A0A6J1D9E1 uncharacterized protein LOC111018823

3.5e-266

77.49

Show/hide

Query:  SENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE-------
        S NQ+  AESSHNPATP GVITR EFDQLRGKL+AQVEALKAKCEQKEGPLNDGDLGESPFTSDVLE        APTVK YDGSKDPKDYVE       
Subjt:  SENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVE-------

Query:  --------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTG
                      IALTGSARLW                                                     FQE+QLKVA  SDDSAMCYFLTG
Subjt:  --------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTG

Query:  LADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDEKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEI
        LADEALTVKLG EAPATF EVLQKAKKVIDGQELLRTKT RPER I R RSGKDEKADLKSKDKGSFSSGRAEFRRAVNG TRSRPYERFTPTTIPISEI
Subjt:  LADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDEKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEI

Query:  LTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFG
        LTNIEESGMEKLLKRPEKLRGAPERR+KDKYCRFHREH HNTSD WELKRQIEDLIQD YFKKFVGKPRTSSA+KKEERK SRTP RR DRPAVINTIFG
Subjt:  LTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFG

Query:  GPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLV
        GPS GQSGHKRKE ARAARREVCIIREQRPTCPITFD ADLEEVHLPHNDALVIAPLIDHVVVRRVLVD G SANI+SL TYLALGWTRSQLKKS TPLV
Subjt:  GPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLV

Query:  GFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALET
        GFS ESVIPEGCIDLPVT+G DQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVG VRGEQ ASRECYASALKGSSVCALET
Subjt:  GFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALET

Query:  LAGRDGTLEFEADLPRREFAAPTEELE----LKEHFFRGLDHPTKMMLNNAAN
        L  RDGTLEF+A+LPRREFAAPTEELE    L+  +   +DH  ++   ++ N
Subjt:  LAGRDGTLEFEADLPRREFAAPTEELE----LKEHFFRGLDHPTKMMLNNAAN

A0A6J1DD03 uncharacterized protein LOC111019899

1.4e-219

91.28

Show/hide

Query:  MCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTP
        MCYFLTGLADEALTVKL +EAPATF EVLQKAKKVIDGQELLRTK       IG+ RSGKD E  D KSKDKGSFS+GRAE+RRA NG TRSRPYERFTP
Subjt:  MCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKD-EKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTP

Query:  TTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRP
        TTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSD WELK QIEDLIQDGYFKKFVGKPRTSSA+KKEERKRSRTPPRRTDRP
Subjt:  TTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRP

Query:  AVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQL
        AVINTIFGGPS GQSGHKRK+ ARAARREVCIIREQRPTCPITFD ADL EVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQL
Subjt:  AVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQL

Query:  KKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKG
        KKSPTPLVGFSGESV+PEGCIDLPVT+GQDQT+VTQMAEFVV+DGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYAS LKG
Subjt:  KKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKG

Query:  SSVCALETLAGRDGTLEFEADLPRREFAAPTEELEL
        +SVCALETL  RDGTLEFEADLP REFAAP EELEL
Subjt:  SSVCALETLAGRDGTLEFEADLPRREFAAPTEELEL

A0A6J1DHB3 uncharacterized protein LOC111020479

2.6e-269

69.96

Show/hide

Query:  MVQPANLTNTADRKTLAASDAHQREVGVAVVEGQGHDGLATEPLRRSARITAPVLPPAHPRTSKATRGRGGTSKKSARGPAPAPTSENFDALQREMEAMR
        MVQPAN TNTADR+ LAA+  HQREVG  VVEGQGH+ L TEPL RSARIT PVLPPAHP+ SK                                    
Subjt:  MVQPANLTNTADRKTLAASDAHQREVGVAVVEGQGHDGLATEPLRRSARITAPVLPPAHPRTSKATRGRGGTSKKSARGPAPAPTSENFDALQREMEAMR

Query:  TQMRSMEEMYNEMILAAGAGSRSENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPT
                                     AESS+NP TP GVITR EFDQL+ K DAQVEALKA+CE+KE   +DGDLGE  F+SD+LEA IPPKFK PT
Subjt:  TQMRSMEEMYNEMILAAGAGSRSENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPT

Query:  VKPYDGSKDPKDYVE---------------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRF
        +KPYDGSKDPKDYVE                     IALTGSARLWYRRLPAR ISTY+QLR+EF++QFSSRHYD+KT THLATIRQKEGETLREYVTRF
Subjt:  VKPYDGSKDPKDYVE---------------------IALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRF

Query:  QEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDE-KADLKSKDKG-SFSSGRAEFRR
         EEQLKVAHCSDDSAMCYFLTGLADE LTVKL +EAPATF EVLQK KKVIDGQELLRTKT RPE+ I + R+GKD+ KAD KS+DKG S SS R ++RR
Subjt:  QEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDRSGKDE-KADLKSKDKG-SFSSGRAEFRR

Query:  AVNGHTRSRPYERFTPTTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKK
        + + H +SRPYE +TPTTIPI EILTNIEE+GMEKLLKRPEKLRG PE+R+ DKYCRFHR+HGHNTS+ WELKRQIEDLIQDGYFKKFVGKPR++S +KK
Subjt:  AVNGHTRSRPYERFTPTTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKK

Query:  EERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANI
        EERKR RTPPRR DRPAVIN             K+KE AR ARREVCIIREQRPT  I F+ ADLE VHLPHNDALVIAPLID V+VRR+LVDGGASANI
Subjt:  EERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANI

Query:  LSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVR
        LSL TYLALGWTRSQLKKSPTPLVGFSGES+  EGCIDLPV++ QD TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRA+PSTLHQVLKYST NGVGTVR
Subjt:  LSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVR

Query:  GEQTASRECYASALKGSSVCALETLAGRD
        GE   SRECYAS  K SSVCALE    RD
Subjt:  GEQTASRECYASALKGSSVCALETLAGRD

A0A6J1DZB9 uncharacterized protein LOC111024904

4.8e-207

74.81

Show/hide

Query:  EIALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDE
        +IALTGSARLWYRRLPARSISTY+QLR+EF++QFSS HYD+KTATHLATIRQKE ETLREYVTRFQEEQLKVAHCSDDSAMCYFLT LADE LTVKLG+E
Subjt:  EIALTGSARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDE

Query:  APATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDR-SGKDEKADLKSKDKGSFSS-GRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEESGMEK
        AP TFVEVLQKAKKVIDGQELLRTKT RPE++I + + S +  KAD KS+DKGS SS  R E+RR  +G +RSRPYER+T +TIPISEILTNIEESGMEK
Subjt:  APATFVEVLQKAKKVIDGQELLRTKTSRPERRIGRDR-SGKDEKADLKSKDKGSFSS-GRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEESGMEK

Query:  LLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKR
        LLKRPEKLRG  E+R+K+KYCRFHR+HGHNT+ CWELKRQIEDLIQDGYFKKFVGKPR++S +KKEERKRSRTPPRR DRPAVINTIFGGP+ GQSG+KR
Subjt:  LLKRPEKLRGAPERRSKDKYCRFHREHGHNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKR

Query:  KESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEG
        KE AR ARREVCIIRE +PTC ITF  ADLE VHLPHNDALVIA LIDH +VRRVL+DG                                        G
Subjt:  KESARAARREVCIIREQRPTCPITFDGADLEEVHLPHNDALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEG

Query:  CIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALETLAGRDGTLEFE
        CIDLPVT+GQD TQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRA+PSTLHQVLKYSTPN VG VRGEQ  SRECYASALKGS+VCALE    R    E E
Subjt:  CIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPSTLHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALETLAGRDGTLEFE

Query:  ADLP---RREFAAPTEELEL
        ADLP   +R+F  PTEELEL
Subjt:  ADLP---RREFAAPTEELEL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTTCAACCAGCAAACTTGACCAATACGGCAGATCGAAAGACTCTAGCTGCCAGCGATGCCCACCAGAGGGAGGTCGGAGTAGCAGTGGTAGAGGGGCAAGGTCACGA
TGGCCTAGCAACAGAACCGCTCCGCAGGTCGGCACGAATCACCGCGCCTGTCCTACCACCTGCGCACCCAAGGACATCCAAGGCCACCCGTGGCCGAGGTGGGACCTCTA
AGAAGAGCGCCCGGGGTCCAGCCCCGGCTCCAACAAGTGAGAACTTTGACGCACTCCAGAGAGAAATGGAGGCAATGCGCACACAAATGCGGTCCATGGAGGAAATGTAT
AACGAAATGATACTAGCCGCAGGCGCAGGGTCCCGATCTGAAAATCAGGAGACCTCCGCTGAATCCTCTCACAACCCAGCAACTCCCGCAGGGGTGATCACAAGGGCGGA
GTTCGACCAGCTGAGGGGCAAGCTCGACGCTCAGGTGGAGGCCTTAAAGGCCAAATGTGAGCAGAAAGAAGGTCCACTGAACGATGGCGACTTGGGAGAATCGCCCTTCA
CCTCGGACGTTTTGGAAGCACCGATCCCTCCGAAGTTCAAAGCTCCTACCGTGAAACCTTATGATGGGTCGAAGGACCCCAAGGATTATGTTGAGATCGCGCTTACCGGC
AGCGCGCGTTTGTGGTATCGGAGACTGCCAGCTAGGTCGATCTCGACCTACGCTCAGCTGAGAAGGGAGTTCCTTGCCCAGTTCTCCTCTCGGCACTACGACAAAAAGAC
AGCGACCCATCTCGCCACCATCAGGCAAAAGGAAGGTGAGACGCTGCGGGAATATGTCACTAGATTCCAGGAGGAACAATTGAAGGTCGCACACTGCTCTGATGACTCGG
CCATGTGCTACTTTCTCACCGGCCTAGCCGACGAAGCCCTCACGGTGAAGCTTGGAGACGAGGCCCCGGCCACTTTCGTCGAAGTGCTGCAGAAGGCGAAGAAAGTCATC
GATGGGCAGGAGCTCCTCCGAACCAAAACCAGCCGACCAGAACGAAGGATCGGCCGGGATAGAAGCGGAAAAGATGAAAAGGCGGATCTCAAGTCCAAGGACAAGGGATC
TTTCTCCAGTGGCCGAGCTGAGTTTCGAAGGGCGGTGAACGGACACACCAGGAGCCGACCTTACGAACGCTTCACCCCGACCACGATTCCAATTTCCGAGATCCTAACGA
ACATCGAGGAGTCCGGAATGGAAAAACTACTCAAACGTCCTGAGAAGCTTCGGGGAGCCCCGGAGAGGCGCAGCAAGGACAAGTATTGCCGCTTCCATCGGGAGCACGGC
CACAACACGTCGGACTGCTGGGAGTTGAAGCGCCAAATTGAGGATCTAATTCAAGATGGCTACTTCAAGAAATTTGTGGGAAAGCCCAGGACCAGCTCGGCAAAGAAAAA
GGAAGAGCGAAAGCGTTCGAGGACGCCGCCCCGGCGCACTGACCGACCTGCGGTCATCAATACCATTTTCGGAGGGCCAAGCAGGGGTCAGTCCGGACATAAAAGAAAGG
AGTCAGCTCGTGCAGCCAGGCGCGAGGTGTGCATCATCAGGGAGCAGAGGCCGACCTGTCCAATCACCTTCGACGGTGCAGACTTGGAGGAGGTCCACCTGCCCCACAAT
GATGCACTTGTGATCGCTCCCTTGATTGATCATGTGGTGGTCAGGAGGGTGCTGGTAGATGGAGGCGCATCTGCTAACATCCTGTCCTTACCGACCTACCTCGCCCTGGG
ATGGACGAGGTCGCAATTGAAGAAAAGCCCGACACCGCTGGTTGGGTTCTCTGGAGAATCGGTCATCCCAGAGGGTTGCATCGACTTGCCGGTCACGATGGGGCAGGACC
AAACTCAGGTCACCCAAATGGCCGAGTTCGTGGTAATTGACGGTAGATCGGCCTATAACGCCATCTTTGGGAGACCCATCATCCACTCATTTCGGGCCATTCCCTCGACA
CTTCATCAAGTTTTGAAGTATTCCACCCCCAATGGCGTGGGCACGGTCCGAGGAGAACAGACCGCTTCGAGGGAGTGTTATGCCTCCGCACTCAAAGGCTCATCGGTCTG
CGCCCTCGAAACTCTCGCCGGTAGGGATGGGACGCTCGAGTTCGAGGCCGACCTGCCGAGGAGGGAGTTTGCCGCACCCACTGAGGAGCTCGAGCTTAAAGAACATTTCT
TTAGAGGTTTAGATCATCCTACTAAGATGATGCTAAACAATGCTGCCAATGGAGCCTTTACAAAGAAGACATTCAACGAGATAGTTGACATCCTAAATGGCTTAGCTTCA
CACAACGAACTATGGTGTTCGCAAAGATTTAGGGTAGCACCAAAGAAGCAAGATCCAGCTGGAGTTTTGGCTCTGGACATTGCGACCTCGATGCAAAAAGAGATGATTAC
AATGAACCAGAGGCTAAAAGAGATGGCATTGGGAATAAAAAATCCATTAGCCACGCCGATACAACCTGTGCAGTCGGATTATTGCACTCCTGCCCCTGTTTGCCAAGTCA
ACAATCTCATTTGTTCATTTTGCAGTGAAAACCATATTTATGATAATTGTCCACATAACCCTGCTTCCGTTTTTTATGTAGGACATGGGAACAATAGGAACATTAACCCA
TATTCGAACACCTACAACCCAGGTTGGAGGCACCACCCTAATTTCTCATGGGGAGGTCAAGAAGGTTCGAGCGGTTTTAATCAAGGGCAGAGCCAGCAGAACAAGCAGCC
CTATGTTCCACCTACACAGCAATACATCCCACCGCCGCAACAACAGTACAATCAAAGAACACAGACTCCACCAGTTCAAAATAACAACTCAAATCTTGAGAATATGATGG
AGTACATGGCCCGAACCGACGTAGTGATACAATCCCAAGCGGCATCAATGAGGAATTTCGAGACCCAATTGGGACAGCTCGCCAATGAATTGAAGAATAGACCACATGTT
CTTTTCCAGGCCATACTGAATTACCAAGACGAGAAGGGAAAGAACAGTGAAAGCTGTCACCCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVQPANLTNTADRKTLAASDAHQREVGVAVVEGQGHDGLATEPLRRSARITAPVLPPAHPRTSKATRGRGGTSKKSARGPAPAPTSENFDALQREMEAMRTQMRSMEEMY
NEMILAAGAGSRSENQETSAESSHNPATPAGVITRAEFDQLRGKLDAQVEALKAKCEQKEGPLNDGDLGESPFTSDVLEAPIPPKFKAPTVKPYDGSKDPKDYVEIALTG
SARLWYRRLPARSISTYAQLRREFLAQFSSRHYDKKTATHLATIRQKEGETLREYVTRFQEEQLKVAHCSDDSAMCYFLTGLADEALTVKLGDEAPATFVEVLQKAKKVI
DGQELLRTKTSRPERRIGRDRSGKDEKADLKSKDKGSFSSGRAEFRRAVNGHTRSRPYERFTPTTIPISEILTNIEESGMEKLLKRPEKLRGAPERRSKDKYCRFHREHG
HNTSDCWELKRQIEDLIQDGYFKKFVGKPRTSSAKKKEERKRSRTPPRRTDRPAVINTIFGGPSRGQSGHKRKESARAARREVCIIREQRPTCPITFDGADLEEVHLPHN
DALVIAPLIDHVVVRRVLVDGGASANILSLPTYLALGWTRSQLKKSPTPLVGFSGESVIPEGCIDLPVTMGQDQTQVTQMAEFVVIDGRSAYNAIFGRPIIHSFRAIPST
LHQVLKYSTPNGVGTVRGEQTASRECYASALKGSSVCALETLAGRDGTLEFEADLPRREFAAPTEELELKEHFFRGLDHPTKMMLNNAANGAFTKKTFNEIVDILNGLAS
HNELWCSQRFRVAPKKQDPAGVLALDIATSMQKEMITMNQRLKEMALGIKNPLATPIQPVQSDYCTPAPVCQVNNLICSFCSENHIYDNCPHNPASVFYVGHGNNRNINP
YSNTYNPGWRHHPNFSWGGQEGSSGFNQGQSQQNKQPYVPPTQQYIPPPQQQYNQRTQTPPVQNNNSNLENMMEYMARTDVVIQSQAASMRNFETQLGQLANELKNRPHV
LFQAILNYQDEKGKNSESCHP

Moc06g29210 (gene) of Bitter gourd (OHB3-1) v2 genome