CuGenDBv2

Gene ID	Tan0012059
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Protein of Unknown Function (DUF239)
Genome location	LG01:26757097..26761890
RNA-Seq Expression	Tan0012059
Synteny	Tan0012059
Gene Ontology terms	NA
InterPro domains	IPR004314 - Neprosin IPR025521 - Neprosin activation peptide

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8650029.1 hypothetical protein Csa_011504 [Cucumis sativus]

1.7e-109

52.39

Show/hide

Query:  QAFDSNLSLEEDLELEKQLKILNKPPITT------------FQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFG-WSKDSSQSND--DSLLYN
        +A +S LS EE+LE+E+ LK+LNKP I T            +Q+KEG+IIDC+DIN QPA DH LLKNHKVQ  PS Y    + KDSSQ+N+   +L  N
Subjt:  QAFDSNLSLEEDLELEKQLKILNKPPITT------------FQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFG-WSKDSSQSND--DSLLYN

Query:  NNG--ESCPMGSVPIRRTLKKDLIRLRSVSSKRPT-----------NIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSN
        NN   E CP G VPIRRTLKKDLIRL+S+SS               +  ++D   +VKFPY QNVVS S+EK   KYYG  + +SVYN++++ DQSSS+N
Subjt:  NNG--ESCPMGSVPIRRTLKKDLIRLRSVSSKRPT-----------NIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSN

Query:  IWIVGGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGAN
        IWIVGGP ++  V++ GW VNP +NGD +  +F YWTADGG  TGCYN+ C GFVQV+ ++     L P+S YEGQQYDY   + Q +  GNWW+L+G N
Subjt:  IWIVGGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGAN

Query:  HTSIGYWPKELFGNL-NGADQVAWGGIAKPSPNGNSPVLGNGHMP--NGKFNEACYFRTMNYIKQNLQGAF--PVQANTIDYVSNTNCYNLVDSLDCGIH
           +GYWPKEL  NL +GADQ+AWGGIA+PS +G SP+LG+GH P  NG +NE CY R +  I       +  P   NT+ Y SNT+CY+L  +++CG  
Subjt:  HTSIGYWPKELFGNL-NGADQVAWGGIAKPSPNGNSPVLGNGHMP--NGKFNEACYFRTMNYIKQNLQGAF--PVQANTIDYVSNTNCYNLVDSLDCGIH

Query:  NWYYCFTFGGPGGNNCRA
           YCFTFGGPGG NC A
Subjt:  NWYYCFTFGGPGGNNCRA

TYK11502.1 neprosin 2 [Cucumis melo var. makuwa]

1.3e-109

52.31

Show/hide

Query:  MLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDS--SQSNDDSLL-YNN
        + F+C N K + A + NLS EE+LE+E+QLK+LNKP I T+++KEG+IIDC+DIN QPA DH LLKNHKVQ  PS +     K+   SQSN+  L   NN
Subjt:  MLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDS--SQSNDDSLL-YNN

Query:  NGESCPMGSVPIRRTLKKDLIRLRSVSS---KRPTNIKYYD------STKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVA-QDQSSSSNIWIV
        NGE CP+G VPIRRTLK+DLIRL+S+SS   K+ +++K  D      S  AV+FPYDQNVVS S+ K+ + Y+GA A I+VYN++++ ++QSSS+NIW+V
Subjt:  NGESCPMGSVPIRRTLKKDLIRLRSVSS---KRPTNIKYYD------STKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVA-QDQSSSSNIWIV

Query:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI
        GGP E+ NV++A      A++GDSLP TF YWT D GA TGCYN+LC GFV V+       ++ P+SIY+G+QYDY  ++ Q    G+WW+ +G +   +
Subjt:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI

Query:  GYWPKELFGN-LNGADQVAWGGIAKPS-PNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT
        GYWP ELF N L GA+QVAWGG A+PS  +  SP LG+GH PNG+ +EAC+ R + YI  N   + P   NTI+YVS+++CY+L+ + +C    + YCFT
Subjt:  GYWPKELFGN-LNGADQVAWGGIAKPS-PNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT

Query:  FGGPGGNNCRA
        FGGPGG +C A
Subjt:  FGGPGGNNCRA

XP_022145287.1 uncharacterized protein LOC111014775 [Momordica charantia]

7.6e-97

51.73

Show/hide

Query:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS
        MA KA MWL+I++L + LN KG  AFDSNLS+EE+LE E QLK+LNKP ITTFQ++EG+IIDC+DIN QPA DH LLKNHKVQ                 
Subjt:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS

Query:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVG
                                                                   V S++M++   KYYG A ++SVYNL+VAQDQSSSSNIWI+G
Subjt:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVG

Query:  GPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIG
        GPPEA NVI+ GWQVNP INGDS    F YWTADGG  TG YN+ C  F+Q + +  P++ L PSS Y+G+QYDY+  VFQD PTG+WWL +  + T+IG
Subjt:  GPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIG

Query:  YWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYV
        YWPKELFG+LN GA+QVAWGGIAKPSPNG SP LGNGH PN GK ++ACYFRT+NYI +N +       NT  Y+
Subjt:  YWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYV

XP_022145288.1 uncharacterized protein LOC111014777 [Momordica charantia]

9.5e-124

58.44

Show/hide

Query:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS
        MA KA MWL+I++L + LN KG  AFDSNLS EE+LELE QLK+LN+P ITTFQ++EG+IIDC+DIN QPA DH  LK+HK+Q +PS YPFG SKDSS S
Subjt:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS

Query:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTK-AVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIV
         D S + NNN  +CP G VPIRRT+KKDLIR+RS+SSK PT IK   S K  V FPY+Q+VVS++M+K   KYYGA+ ++SVYNL+VAQDQSSSSNIWI+
Subjt:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTK-AVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIV

Query:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI
        GGPP+A NVI+AGWQVNP INGDSL   F YWT                                                 D PTGNWWL +G +H +I
Subjt:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI

Query:  GYWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT
        GYWPKELFG+LN G +QVAWGGIAKPSPNG SP LGNGH PN  K+++ACYFR MNY+ +N +G FP   NT +Y+SN +CY L +   CG   +YYC T
Subjt:  GYWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT

Query:  FGGPGGNNC
        FGGPGGNNC
Subjt:  FGGPGGNNC

XP_031738649.1 uncharacterized protein LOC116402744 [Cucumis sativus]

2.1e-115

52.63

Show/hide

Query:  VIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFG-WSKDSSQSNDDSLL-Y
        ++I+ F+C N K + A + NLS EEDLE+E+QLK+LNKP I T+++KEG+IIDC+DIN QPA DH LLKNHKVQ  PS +    + +DSSQSN+  L   
Subjt:  VIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFG-WSKDSSQSNDDSLL-Y

Query:  NNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRP-------------TNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQD-QSSS
        NNNGE CP+G VPIRRTLK+DLIRL+S+SS                +   +YD   AV+FPY QNVVS S+ K+ + Y+GA A I+V+N++++ + QSSS
Subjt:  NNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRP-------------TNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQD-QSSS

Query:  SNIWIVGGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLG
        +NIW++GG  ++ NV++AGWQVNPA+NGD+LP TF YWT D G  TGCYN+LC GFV V+       ++ P+SIY+GQQYDY  ++ Q    G+WW+ +G
Subjt:  SNIWIVGGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLG

Query:  ANHTSIGYWPKELFGN-LNGADQVAWGGIAKPSPNGN-SPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHN
         N   +GYWP ELF N L GADQVAWGG A+P+  G+ SP LG+GH PNGK +EA + R + YI  N   + P   NTI+YVSN++CY+L+ + +C    
Subjt:  ANHTSIGYWPKELFGN-LNGADQVAWGGIAKPSPNGN-SPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHN

Query:  WYYCFTFGGPGGNNCRAN
        + YCFTFGGPGG+ C A+
Subjt:  WYYCFTFGGPGGNNCRAN

TrEMBL top hits

e value

%identity

Alignment

A0A059CIH2 Uncharacterized protein

4.5e-87

45.59

Show/hide

Query:  MAPKAMWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSN
        MA K +  V+++L +   SK      +N+S ++D++LE+QLK+LNKPPI TF ++EG+IIDCIDI+ QPA DH LLKNHK+Q +P      +SK SS + 
Subjt:  MAPKAMWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSN

Query:  DDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVGG
            +   + + CP+G+VPI+R  K+DLIR RS+      N+   +       P  Q+ V LS + +    YGA+  ISVYN++ A DQ SS NIWI  G
Subjt:  DDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVGG

Query:  PPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGY
        PP+  ++I+AGW+V+P +N D L   F YWT D G + GCYN  C GFVQVDR  TP+  L+P S Y G  Y+  + V QD  TGNWWL +     ++GY
Subjt:  PPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGY

Query:  WPKELFGNL-NGADQVAWGGIAKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGG
        WPKELF NL NG+   AWGG+AK   NG  P +GNGHMP+   ++A YFR + ++  N +   P + N    V   +CYNL+ +L      W Y FTFGG
Subjt:  WPKELFGNL-NGADQVAWGGIAKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGG

Query:  PGGNNCRA
        PGG  CRA
Subjt:  PGGNNCRA

A0A5D3CJM0 Neprosin 2

6.4e-110

52.31

Show/hide

Query:  MLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDS--SQSNDDSLL-YNN
        + F+C N K + A + NLS EE+LE+E+QLK+LNKP I T+++KEG+IIDC+DIN QPA DH LLKNHKVQ  PS +     K+   SQSN+  L   NN
Subjt:  MLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDS--SQSNDDSLL-YNN

Query:  NGESCPMGSVPIRRTLKKDLIRLRSVSS---KRPTNIKYYD------STKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVA-QDQSSSSNIWIV
        NGE CP+G VPIRRTLK+DLIRL+S+SS   K+ +++K  D      S  AV+FPYDQNVVS S+ K+ + Y+GA A I+VYN++++ ++QSSS+NIW+V
Subjt:  NGESCPMGSVPIRRTLKKDLIRLRSVSS---KRPTNIKYYD------STKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVA-QDQSSSSNIWIV

Query:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI
        GGP E+ NV++A      A++GDSLP TF YWT D GA TGCYN+LC GFV V+       ++ P+SIY+G+QYDY  ++ Q    G+WW+ +G +   +
Subjt:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI

Query:  GYWPKELFGN-LNGADQVAWGGIAKPS-PNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT
        GYWP ELF N L GA+QVAWGG A+PS  +  SP LG+GH PNG+ +EAC+ R + YI  N   + P   NTI+YVS+++CY+L+ + +C    + YCFT
Subjt:  GYWPKELFGN-LNGADQVAWGGIAKPS-PNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT

Query:  FGGPGGNNCRA
        FGGPGG +C A
Subjt:  FGGPGGNNCRA

A0A6J1CVJ6 uncharacterized protein LOC111014777

4.6e-124

58.44

Show/hide

Query:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS
        MA KA MWL+I++L + LN KG  AFDSNLS EE+LELE QLK+LN+P ITTFQ++EG+IIDC+DIN QPA DH  LK+HK+Q +PS YPFG SKDSS S
Subjt:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS

Query:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTK-AVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIV
         D S + NNN  +CP G VPIRRT+KKDLIR+RS+SSK PT IK   S K  V FPY+Q+VVS++M+K   KYYGA+ ++SVYNL+VAQDQSSSSNIWI+
Subjt:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTK-AVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIV

Query:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI
        GGPP+A NVI+AGWQVNP INGDSL   F YWT                                                 D PTGNWWL +G +H +I
Subjt:  GGPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSI

Query:  GYWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT
        GYWPKELFG+LN G +QVAWGGIAKPSPNG SP LGNGH PN  K+++ACYFR MNY+ +N +G FP   NT +Y+SN +CY L +   CG   +YYC T
Subjt:  GYWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFT

Query:  FGGPGGNNC
        FGGPGGNNC
Subjt:  FGGPGGNNC

A0A6J1CVW9 uncharacterized protein LOC111014774

2.0e-87

46.53

Show/hide

Query:  WLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLLY
        W  I++  +CL+    QA  SNLS EE+LELE+QLK+LN+P ITTF++KEG IIDC+DI+ QPA DH  LKNHKVQ++PS YPFG SKDS+ S +     
Subjt:  WLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLLY

Query:  NNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASN
                                                           NVVSL + K   +YYG     SVYNL+VAQDQSSSSNIWIVGGPPE  N
Subjt:  NNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASN

Query:  VIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF
               VNP INGDSL   F YWT                                                 D  TG+WWL +  + T+IGYWPKELF
Subjt:  VIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF

Query:  GNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMP-NGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSL-DCGIHNWYYCFTFGGPGGN
        G+LN GA+QVAWGGIAKPSPNG SP LGNGH P NGK+NEACYF+++NYI  N  G  P   N + +VSN++CY L D    C   N Y+CFTFGGPGGN
Subjt:  GNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMP-NGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSL-DCGIHNWYYCFTFGGPGGN

Query:  NCRA
        NCRA
Subjt:  NCRA

A0A6J1CW60 uncharacterized protein LOC111014775

3.7e-97

51.73

Show/hide

Query:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS
        MA KA MWL+I++L + LN KG  AFDSNLS+EE+LE E QLK+LNKP ITTFQ++EG+IIDC+DIN QPA DH LLKNHKVQ                 
Subjt:  MAPKA-MWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQS

Query:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVG
                                                                   V S++M++   KYYG A ++SVYNL+VAQDQSSSSNIWI+G
Subjt:  NDDSLLYNNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVG

Query:  GPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIG
        GPPEA NVI+ GWQVNP INGDS    F YWTADGG  TG YN+ C  F+Q + +  P++ L PSS Y+G+QYDY+  VFQD PTG+WWL +  + T+IG
Subjt:  GPPEASNVIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIG

Query:  YWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYV
        YWPKELFG+LN GA+QVAWGGIAKPSPNG SP LGNGH PN GK ++ACYFRT+NYI +N +       NT  Y+
Subjt:  YWPKELFGNLN-GADQVAWGGIAKPSPNGNSPVLGNGHMPN-GKFNEACYFRTMNYIKQNLQGAFPVQANTIDYV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G20170.1 Protein of Unknown Function (DUF239)

9.3e-61

36.55

Show/hide

Query:  EDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLLYNNNGE-SCPMGSVPIRRTLKKDLIRL
        E  EL+K L  +NKP I +FQ+K G I+DCIDI  Q A DH LLKNH +QL+P+  P  W++D +     SL +  + + SCP G+V I+RT  +DLI++
Subjt:  EDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLLYNNNGE-SCPMGSVPIRRTLKKDLIRL

Query:  RSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKY-------YGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASNVIIAGWQVNPAINGDSLP
        +         +KY      VK+   ++   L+M    F         YGA  NI++++  V  DQ S ++I++  G  ++   I AGW V+P +N ++  
Subjt:  RSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKY-------YGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASNVIIAGWQVNPAINGDSLP

Query:  TTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF---GNLNGADQVAWGG-I
          F YWTADG  KTGCYN +CPGFVQV           P+S Y+G+QY     ++QD+ TGNWW L+   +  IGYWPK LF   G   GA +V WGG +
Subjt:  TTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF---GNLNGADQVAWGG-I

Query:  AKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNT-NCYNLVDSLDCGIHNWYYCFTFGGPGG
                SP++G+GH P   F +A +   +  I + ++         +   +N+  CY +      G   W     +GGPGG
Subjt:  AKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNT-NCYNLVDSLDCGIHNWYYCFTFGGPGG

AT2G20170.2 Protein of Unknown Function (DUF239)

9.3e-61

36.55

Show/hide

Query:  EDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLLYNNNGE-SCPMGSVPIRRTLKKDLIRL
        E  EL+K L  +NKP I +FQ+K G I+DCIDI  Q A DH LLKNH +QL+P+  P  W++D +     SL +  + + SCP G+V I+RT  +DLI++
Subjt:  EDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLLYNNNGE-SCPMGSVPIRRTLKKDLIRL

Query:  RSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKY-------YGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASNVIIAGWQVNPAINGDSLP
        +         +KY      VK+   ++   L+M    F         YGA  NI++++  V  DQ S ++I++  G  ++   I AGW V+P +N ++  
Subjt:  RSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKY-------YGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASNVIIAGWQVNPAINGDSLP

Query:  TTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF---GNLNGADQVAWGG-I
          F YWTADG  KTGCYN +CPGFVQV           P+S Y+G+QY     ++QD+ TGNWW L+   +  IGYWPK LF   G   GA +V WGG +
Subjt:  TTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF---GNLNGADQVAWGG-I

Query:  AKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNT-NCYNLVDSLDCGIHNWYYCFTFGGPGG
                SP++G+GH P   F +A +   +  I + ++         +   +N+  CY +      G   W     +GGPGG
Subjt:  AKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNT-NCYNLVDSLDCGIHNWYYCFTFGGPGG

AT3G13510.1 Protein of Unknown Function (DUF239)

6.0e-60

34.86

Show/hide

Query:  SLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDS-------LLYNNNGESCPMGSVPIRR
        S  +  E++K L  LNKPP+ T QS +G+IIDCI I+ QPA DH  LK+HK+Q++PS +P G   D+  S +          L++  G+ C  G++P+RR
Subjt:  SLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDS-------LLYNNNGESCPMGSVPIRR

Query:  TLKKDLIRLRSV---SSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQ-DQSSSSNIWIVGGP-PEASNVIIAGWQVNPA
        T + D++R  SV     K+  ++    S +      + +  +++  + D KYYGA A ++V+   +   ++ S S IW++GG   +  N I AGWQV+P 
Subjt:  TLKKDLIRLRSV---SSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQ-DQSSSSNIWIVGGP-PEASNVIIAGWQVNPA

Query:  INGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELFGNL-NGADQVA
        + GD+    F YWT+D    TGCYN+LC GF+Q++       ++SP S Y   QYD S+ +++D   G+WW+  G N   +GYWP  LF  L   A  + 
Subjt:  INGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELFGNL-NGADQVA

Query:  WGG-IAKPSPNGNS--PVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGGPGGN-NC
        WGG +      G+     +G+GH P   F++A YFR +  +  +     P    T  +   +NCY++    +    +W + F +GGPG N NC
Subjt:  WGG-IAKPSPNGNS--PVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGGPGGN-NC

AT4G23390.1 Protein of Unknown Function (DUF239)

3.7e-65

38.25

Show/hide

Query:  LVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSN-DDSLLY
        L +  + + L  + H+   S    EE  E++K L  LNKP + +FQ++ G I DCIDI  Q A DH LLKNH ++L+P+  P  W+KD++ S+   SL +
Subjt:  LVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSN-DDSLLY

Query:  NNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASN
          +  SCP+G+V ++R + +DLIR + + S R  N     S K  K     +  +    K D  +YGA  NI+V+N  V+ DQ S + + + G   +   
Subjt:  NNNGESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASN

Query:  VIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF
         I AGW V P +N ++    F YWTADG  KT CYN L PGFV V       M   P SIY+GQQY   V+++QD  T +WW +L  N+  IGYWPK LF
Subjt:  VIIAGWQVNPAINGDSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELF

Query:  ---GNLNGADQVAWGGIAKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQ-NLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGGPGG
           G  +GA  V WGG    S    SP +G+GH P   F +A Y   +  I     + + P+ +    + S+ NCYN+   L  G   W     FGGPGG
Subjt:  ---GNLNGADQVAWGGIAKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQ-NLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGGPGG

AT5G18460.1 Protein of Unknown Function (DUF239)

1.6e-60

35.42

Show/hide

Query:  LEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLL------YNNNGESCPMGSVPIRRTLKKDLIR
        ++K L  +NK P+ T QS +G++IDC+    QPA DH LLK+HK+Q  P + P    KD      +++L      ++ NG  CP G+VPIRR    D++R
Subjt:  LEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLL------YNNNGESCPMGSVPIRRTLKKDLIR

Query:  LRSV---SSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQ-DQSSSSNIWIVGGP---PEASNVIIAGWQVNPAINGDSL
         +S+     KR +      + K      + +  +++  +S  + YGA A I+V++  + + ++ S S IWI+ G    P+  N I AGWQV+P + GD+ 
Subjt:  LRSV---SSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQ-DQSSSSNIWIVGGP---PEASNVIIAGWQVNPAINGDSL

Query:  PTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELFGNL-NGADQVAWGG---
        P  F YWT+D    TGCYN+LC GF+Q +        +SP S ++G Q+D ++ +++D   GNWW+ LG + T +GYWP ELF +L + A  V WGG   
Subjt:  PTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELFGNL-NGADQVAWGG---

Query:  IAKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGGPGGN
          + S    +  +G+GH P+  F +A YFR +  +  +     PV    I    NT CY++  S     + W   F +GGPG N
Subjt:  IAKPSPNGNSPVLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGGPGGN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCTCCCAAAGCAATGTGGTTAGTGATCATAATGTTGTTTATTTGCCTAAACTCTAAAGGCCACCAAGCTTTTGATTCAAACCTCTCACTAGAAGAAGATTTGGAGTT
AGAAAAGCAACTCAAAATTCTCAACAAGCCACCCATTACAACATTTCAGAGCAAGGAGGGAAATATCATTGATTGTATCGACATCAATAACCAACCAGCTCACGATCATC
ATTTACTAAAAAATCACAAAGTTCAGCTTCAACCAAGTAGGTATCCATTTGGATGGTCAAAAGATTCATCTCAATCAAACGATGACTCACTTCTATATAATAACAATGGA
GAATCTTGTCCTATGGGTTCTGTTCCTATAAGAAGAACACTAAAGAAAGATCTGATAAGGTTAAGATCGGTATCATCAAAGCGACCGACCAATATCAAATATTATGATTC
TACTAAAGCAGTCAAATTCCCTTACGATCAAAACGTGGTTTCTCTTTCTATGGAGAAATCAGACTTCAAATATTATGGAGCTGCTGCAAATATATCTGTTTATAATTTGA
CTGTGGCTCAAGATCAATCTTCTTCTTCTAACATATGGATTGTCGGTGGCCCTCCTGAAGCTTCCAATGTAATAATTGCAGGTTGGCAGGTGAATCCAGCAATAAATGGT
GATAGTCTCCCTACAACGTTTGGGTATTGGACAGCTGATGGAGGTGCTAAAACGGGATGCTACAATATACTTTGTCCAGGTTTCGTACAAGTAGATCGAACTAATACTCC
AGACATGACTCTTTCCCCATCTTCTATTTATGAAGGGCAACAATATGACTACTCGGTTGCTGTTTTTCAGGATGATCCAACAGGCAATTGGTGGCTTCTACTAGGTGCGA
ATCACACATCAATAGGGTATTGGCCAAAAGAGTTGTTTGGAAATCTAAATGGAGCTGATCAAGTGGCTTGGGGAGGCATTGCAAAGCCTTCACCAAATGGAAATAGCCCT
GTCTTGGGGAATGGCCATATGCCAAATGGAAAGTTCAATGAAGCTTGCTACTTTAGAACCATGAACTACATAAAACAAAATTTGCAAGGTGCATTTCCTGTTCAAGCAAA
CACAATAGATTATGTTAGTAACACTAATTGTTACAATTTGGTGGATAGTTTGGATTGTGGAATACATAATTGGTATTATTGCTTCACATTTGGAGGACCAGGTGGTAATA
ATTGTAGAGCCAATTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAPKAMWLVIIMLFICLNSKGHQAFDSNLSLEEDLELEKQLKILNKPPITTFQSKEGNIIDCIDINNQPAHDHHLLKNHKVQLQPSRYPFGWSKDSSQSNDDSLLYNNNG
ESCPMGSVPIRRTLKKDLIRLRSVSSKRPTNIKYYDSTKAVKFPYDQNVVSLSMEKSDFKYYGAAANISVYNLTVAQDQSSSSNIWIVGGPPEASNVIIAGWQVNPAING
DSLPTTFGYWTADGGAKTGCYNILCPGFVQVDRTNTPDMTLSPSSIYEGQQYDYSVAVFQDDPTGNWWLLLGANHTSIGYWPKELFGNLNGADQVAWGGIAKPSPNGNSP
VLGNGHMPNGKFNEACYFRTMNYIKQNLQGAFPVQANTIDYVSNTNCYNLVDSLDCGIHNWYYCFTFGGPGGNNCRAN

Tan0012059 (gene) of Snake gourd v1 genome