CuGenDBv2

Gene ID	MC03g1095
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	PAX-interacting protein 1
Genome location	MC03:17239225..17246586
RNA-Seq Expression	MC03g1095
Synteny	MC03g1095
Gene Ontology terms	GO:0008080 - N-acetyltransferase activity (molecular function)
InterPro domains	IPR000182 - GNAT domain IPR001357 - BRCT domain IPR016181 - Acyl-CoA N-acyltransferase IPR036420 - BRCT domain superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6595690.1 putative F-box protein, partial [Cucurbita argyrosperma subsp. sororia]

0.0

77.64

Show/hide

Query:  QEANQNPAAMAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFME
        +EA + PA MA  ++ A RS+ PI+GKEGHV+DAN PECD  G+GEKC S+G+YSFVLVNPND+DSDSK YLQ VL LYKRELP MVYAANTGKQSTFME
Subjt:  QEANQNPAAMAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFME

Query:  KCVSNGKYCTLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVD
        KCVSNGKYCTLLL+STS  D   I AAITYQIVPADTQYAEIPLAAVSS +QHKGF RILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVD
Subjt:  KCVSNGKYCTLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVD

Query:  TKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGG
        TKGKARRIPVRADIRRALCFPGGSTLMVSHIYQG +  SAD PKS +  L+PD        +RT VA Q CK SNA+D+QTIE L FQPEEF +   LGG
Subjt:  TKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGG

Query:  ENKFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQE
        ENK H  QNQD V  CN P SF E+EN +TAS  E++   G+LDE  CSCSTQ AKR WEASLSSLKSKKVKGVHL H + DS+++F+P+ NG DTCSQ 
Subjt:  ENKFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQE

Query:  YSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTL
         SL NSKHEILAS  PKN STS  TQNFCEEFG+V +AS+   C+ L TLGKSF+IMLMNIADEAKKTQL+KVIEELGGSLTSDGSTSTHVITGKVRKTL
Subjt:  YSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTL

Query:  NFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVN
        NFCTALCSGAWI+SPSWLKESYREGRFVDE PYVL+D DY+ KYR SLKTAVLRAKARPGALFEGYDVCIS+HA+PPPK LSVIVKSAGGNVI+GL KV+
Subjt:  NFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVN

Query:  EVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
         VS+TIF+ACEEDVEEAL+A K+GIWTFNS+WLM+CVMRQELD+EAPQFAESL
Subjt:  EVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

XP_022153879.1 uncharacterized protein LOC111021292 isoform X1 [Momordica charantia]

0.0

100

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHG
        VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHG
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHG

Query:  CNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGS
        CNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGS
Subjt:  CNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGS

Query:  PKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSP
        PKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSP
Subjt:  PKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSP

Query:  SWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVE
        SWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVE
Subjt:  SWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVE

Query:  EALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        EALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
Subjt:  EALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

XP_022966224.1 uncharacterized protein LOC111465956 isoform X1 [Cucurbita maxima]

0.0

78.73

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MA  ++   RS  PI+GKEGHV+DAN PECD  G+GEKC S+G+YSFVLVNPN++DS SK YLQ VL LYKRELP MVYAANTGKQSTFMEKCVSNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLL+STS ADP  I AAITYQIVPADTQYAEIPLAAVSS +QHKGF RILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN
        VRADIRRALCFPGGSTLMVSHIYQG +  SAD PKS +  L+PD        +RT VA Q CK SNA+D+QT E LNFQPEEF +  PLGGENK H  QN
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN

Query:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE
        QDAV  CN P  F E+ENR+TAS  E++   G+LDE  CSCSTQ AKRVWEASLSSLKSKKVKGVHL H   DS ++F+P+ NGCDTCSQ  SL NSKHE
Subjt:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE

Query:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
        ILAS  PKNPSTS  TQNFCEE G+VN+AS+    + L TLGKSF+IMLMNIADEAKKTQL+KVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
Subjt:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG

Query:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA
        AWIVSPSWLKESYREGRFVDE PY+L+D DY+ KYR SLKTAVLRAKARPGALFEGYDVCISAHA+PPPK LSVIVKSAGGNVI+GL KV+ VS+TIF+A
Subjt:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA

Query:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        CEEDVEEAL+A K+GIWTFNS+WLM+CVMRQELD+EAPQFAESL
Subjt:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

XP_038881370.1 uncharacterized protein LOC120072912 isoform X1 [Benincasa hispida]

0.0

83.23

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MAP+KK   RS IPI+GKEG V+D N PE DGKGIGEKC S+G+YSFVLVNPND+DS SK YLQEVLQLYKRELPTMVYAANTGKQSTFM+KCVSNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLL S S  DP LI AAITYQIVPADTQYAEIPLAAVSS +QHKGFG ILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN
        VRADIRRALCFPGGSTLMVSHI QGI+M SADLPKS S  L+P+A       ER GVA Q C  SNAVD+QT + LNFQP++FVT APLG ENK   PQ 
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN

Query:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE
        QDAVH CN P SF EIEN RTAS  E+SNT G+LDE HCSCSTQSAKRVWEASLSSLKSKKVKGVHL HF+SDS++NF+P+ NG DT SQ  SL NSKHE
Subjt:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE

Query:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
        ILAS S KNPSTSN TQNFC+EFG+VN+AS+   CEE  TLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLT+DGSTSTHVITGKVRKTLNFCTALCSG
Subjt:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG

Query:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA
        AWIVSPSWLKESYREGRFVDELPYVL+D DY+ KYR SLKTAVLRAKARPGALFEGYDVCISAHA+PPPK LSVIVKSAGGNVIH L KVNEVSKTIF+A
Subjt:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA

Query:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
         EEDVEEALLA KKGIWTFNS+WLMTCVMRQELDLEAPQFAESL
Subjt:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

XP_038881371.1 uncharacterized protein LOC120072912 isoform X2 [Benincasa hispida]

0.0

81.37

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MAP+KK   RS IPI                  GIGEKC S+G+YSFVLVNPND+DS SK YLQEVLQLYKRELPTMVYAANTGKQSTFM+KCVSNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLL S S  DP LI AAITYQIVPADTQYAEIPLAAVSS +QHKGFG ILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN
        VRADIRRALCFPGGSTLMVSHI QGI+M SADLPKS S  L+P+A       ER GVA Q C  SNAVD+QT + LNFQP++FVT APLG ENK   PQ 
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN

Query:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE
        QDAVH CN P SF EIEN RTAS  E+SNT G+LDE HCSCSTQSAKRVWEASLSSLKSKKVKGVHL HF+SDS++NF+P+ NG DT SQ  SL NSKHE
Subjt:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE

Query:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
        ILAS S KNPSTSN TQNFC+EFG+VN+AS+   CEE  TLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLT+DGSTSTHVITGKVRKTLNFCTALCSG
Subjt:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG

Query:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA
        AWIVSPSWLKESYREGRFVDELPYVL+D DY+ KYR SLKTAVLRAKARPGALFEGYDVCISAHA+PPPK LSVIVKSAGGNVIH L KVNEVSKTIF+A
Subjt:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA

Query:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
         EEDVEEALLA KKGIWTFNS+WLMTCVMRQELDLEAPQFAESL
Subjt:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BKX0 uncharacterized protein LOC103491160 isoform X3

0.0

78.59

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MAPRKK   RS I I+GKEGH +D N  EC GKG+GEKC S+G+YSFVLVNPND+DS SK YLQ+VLQLYKRELPTM YAANTGKQSTFMEKC+SNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLL S S  D  L+ AAITYQIVPADTQYAEIPLAAVS  +QHKGFG ILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGK RRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA--RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAV
        VRADIRRALCFPGGSTLM+SHI QGI+M SADLPK L   L+P+A    R  VA Q C  SNA D+ TI+ LNFQP+EFVT  PLG EN+   PQNQDAV
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA--RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAV

Query:  HGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILAS
        H  N P SF EIEN  TAS  E+SNT G+LDE HCSCS QSAKRVWEASLSSLKSKKVKGV+L HF+SDS++N +PK NG + CSQ  SL NSKHEIL+S
Subjt:  HGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILAS

Query:  GSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIV
          PK P T+  TQNFC+EFG+VN+AS+   CEE  TLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLT+DGSTSTHVITGKVRKTLNFCTALCSGAWIV
Subjt:  GSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIV

Query:  SPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEED
        S SWLKESYREGRFVDELP +L+D DY+ KYR SLKT VLRAKARPGALFEGYDVCISAHA+PPPK LS+IVKSAGG+VIH LDKVN VSKTIF+ACEED
Subjt:  SPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEED

Query:  VEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        VEEAL+A +KGIWTFN +WLMTC+MRQE+DLEAPQFAESL
Subjt:  VEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

A0A6J1DI38 uncharacterized protein LOC111021292 isoform X2

0.0

99.8

Show/hide

Query:  KGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPD
        +GFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPD
Subjt:  KGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPD

Query:  ARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVW
        ARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVW
Subjt:  ARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVW

Query:  EASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLM
        EASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLM
Subjt:  EASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLM

Query:  NIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARP
        NIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARP
Subjt:  NIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARP

Query:  GALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        GALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
Subjt:  GALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

A0A6J1DKD6 uncharacterized protein LOC111021292 isoform X1

0.0

100

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHG
        VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHG
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQDAVHG

Query:  CNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGS
        CNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGS
Subjt:  CNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGS

Query:  PKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSP
        PKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSP
Subjt:  PKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSP

Query:  SWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVE
        SWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVE
Subjt:  SWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVE

Query:  EALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        EALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
Subjt:  EALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

A0A6J1EGI9 uncharacterized protein LOC111432350 isoform X1

0.0

77.8

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MA  ++ A RS+ PI+GKEGHV+DA+ PECD  G+GEKC S+G+YSFVLVNPND+DSDSK +LQ VL LYKRELP MVYAANTGKQSTFMEKCVSNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLL+STS  D   I AAITYQIVPADTQYAEIPLAAVSS +QHKGF RILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN
        VRADIRRALCFPGGSTLMVSHIYQG +  SAD PKS +  L+PD        +RT VA Q CK SNA+D+QTIE L FQPEEF +   LGGENK H  QN
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN

Query:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE
        QD V  CN P SF E+EN +TAS  E++   G+LDE  CSCSTQ AKR WEASLSSLKSKKVKGVHL H + DS+++F+P+ NG DTCSQ  SL NSKHE
Subjt:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE

Query:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
        ILAS  PKN STS  TQNFCEEFG+V +AS+   C+ L T GKSF+IMLMNIADEAKKTQL+KVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
Subjt:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG

Query:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA
        AWIVSPSWLKESYREGRFVDE PYVL+D DY+ KYR SLKTAVLRAKARPGALFEGYDVCIS+HA+PPPK LSVIVKSAGGNVI+GL KV+ VS+TIF+A
Subjt:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA

Query:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        CEEDVEEAL+A K+GIWTFNS+WLM+CVMRQELD+EAPQFAESL
Subjt:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

A0A6J1HT38 uncharacterized protein LOC111465956 isoform X1

0.0

78.73

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC
        MA  ++   RS  PI+GKEGHV+DAN PECD  G+GEKC S+G+YSFVLVNPN++DS SK YLQ VL LYKRELP MVYAANTGKQSTFMEKCVSNGKYC
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYC

Query:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
        TLLL+STS ADP  I AAITYQIVPADTQYAEIPLAAVSS +QHKGF RILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP
Subjt:  TLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIP

Query:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN
        VRADIRRALCFPGGSTLMVSHIYQG +  SAD PKS +  L+PD        +RT VA Q CK SNA+D+QT E LNFQPEEF +  PLGGENK H  QN
Subjt:  VRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDA------RERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQN

Query:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE
        QDAV  CN P  F E+ENR+TAS  E++   G+LDE  CSCSTQ AKRVWEASLSSLKSKKVKGVHL H   DS ++F+P+ NGCDTCSQ  SL NSKHE
Subjt:  QDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHE

Query:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
        ILAS  PKNPSTS  TQNFCEE G+VN+AS+    + L TLGKSF+IMLMNIADEAKKTQL+KVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG
Subjt:  ILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSG

Query:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA
        AWIVSPSWLKESYREGRFVDE PY+L+D DY+ KYR SLKTAVLRAKARPGALFEGYDVCISAHA+PPPK LSVIVKSAGGNVI+GL KV+ VS+TIF+A
Subjt:  AWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLA

Query:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        CEEDVEEAL+A K+GIWTFNS+WLM+CVMRQELD+EAPQFAESL
Subjt:  CEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

SwissProt top hits

e value

%identity

Alignment

A0JNA8 PAX-interacting protein 1

2.9e-19

28.94

Show/hide

Query:  EFGNVNMASKAHQCEELPTLGKSF-----KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREG
        E  NV  +SK  + E++P   K         +L    +  +  Q +K +  LGG +       TH+I  KV +T+ F TA+     IV+P WL+E ++  
Subjt:  EFGNVNMASKAHQCEELPTLGKSF-----KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREG

Query:  RFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVI-----------HGLDKVNEVSKTIFLACEEDV
        +FVDE  Y+L D++  + +  SL+ ++ RA A P  LF+     I+    P    +  IV+ AGG V+           H  +K   +S+ + ++CE D+
Subjt:  RFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVI-----------HGLDKVNEVSKTIFLACEEDV

Query:  EEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQF
                +GI   N+++++T V+ Q LD E+ +F
Subjt:  EEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQF

Q5U2M8 Mediator of DNA damage checkpoint protein 1

6.4e-19

26.56

Show/hide

Query:  KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLR
        K++   + D   +    + +  LGGSL S  + ++H++T ++R+T+ F  A+  G  I+S +WL +S + G F+    Y++ D +    +  SL+ ++ R
Subjt:  KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLR

Query:  AKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEA
        A+ R   L E Y++ ++   +PPP  +  I+   GG V+  +    ++ + + + C ED+    +A++ G+   + ++L+T V++QE   EA
Subjt:  AKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEA

Q6ZW49 PAX-interacting protein 1

1.7e-19

29.18

Show/hide

Query:  EFGNVNMASKAHQCEELPTLGKSF-----KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREG
        E  NV  +SK  + E++P   K         +L    +  +  Q +K +  LGG +       TH+I  KV +T+ F TA+     IV+P WL+E +R  
Subjt:  EFGNVNMASKAHQCEELPTLGKSF-----KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREG

Query:  RFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIH---GLDKVNE------VSKTIFLACEEDVEE
        +F+DE  Y+L D++  + +  SL+ ++ RA   P  LF+     I+    P    +  IV+ AGG V+       K+ E      +S+ I ++CE D+  
Subjt:  RFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIH---GLDKVNE------VSKTIFLACEEDVEE

Query:  ALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQF
              +GI   N+++++T V+ Q LD E+ +F
Subjt:  ALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQF

Q767L8 Mediator of DNA damage checkpoint protein 1

3.7e-19

29.14

Show/hide

Query:  KVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCIS
        + +  LGGSL S  + ++H++T ++R+T+ F  AL  G  I+S  WL +S + G F+    YV+ D +    +  SL+ A+ RA+ R   L EGY++ ++
Subjt:  KVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCIS

Query:  AHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEA
           +PPP  +  I+   GG V+  + +  +  + + + C +D     +  + G+   + ++L+T V++QE   EA
Subjt:  AHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEA

Q7YR40 Mediator of DNA damage checkpoint protein 1

3.7e-19

27.19

Show/hide

Query:  KAHQCEELPTL--GKSFKIMLMNIADEAKKTQLMKVIE--------ELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVD
        K  Q EE P     +S +   +N    A K     V++         LGGSL    + ++H++T ++R+T+ F  AL  G  I+S  WL +S++ G F+ 
Subjt:  KAHQCEELPTL--GKSFKIMLMNIADEAKKTQLMKVIE--------ELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVD

Query:  ELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFN
           YV+ D +    +  SL+ A+ RA+ R   L EGY++ ++   +PPP  +  I+   GG  +  + +  +  + + + C +D     +  + G+   +
Subjt:  ELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFN

Query:  SDWLMTCVMRQELDLEA
         ++L+T V++QE   EA
Subjt:  SDWLMTCVMRQELDLEA

Arabidopsis top hits

e value

%identity

Alignment

AT2G41450.1 N-acetyltransferases;N-acetyltransferases

8.0e-150

45.1

Show/hide

Query:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDG--------------KGIGEKCPSEGDY----SFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAAN
        MAP++ +  +S +  +G     +D     C+                 I EK     DY     F+L+NP D D  +K +LQEVL+LY +ELP M YA+N
Subjt:  MAPRKKAAPRSQIPILGKEGHVIDANQPECDG--------------KGIGEKCPSEGDY----SFVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAAN

Query:  TGKQSTFMEKCVSNGKYCTLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQ
        TGKQS F+E+CVS GKYC+L+L+ST   D   I AAITYQIVPADTQYAEIPLAAV+  HQ KGFG+++Y EL KRL SVGIRTI+CW DKESEGFW KQ
Subjt:  TGKQSTFMEKCVSNGKYCTLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQ

Query:  GFLSIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCK--PSNAVDKQTIEKLNFQPEEFVTF
        GF+ +AEVD KGKA+ + ++++IR+ALCFPGGSTLM+SH+ +   +S+ ++  S                K +C+  P +A +  T              
Subjt:  GFLSIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCK--PSNAVDKQTIEKLNFQPEEFVTF

Query:  APLGGEN-----KFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPK
         P+ G++      F      D + G   P   + I  +   + +    TT    +    CST   KR WEASLSSL+SK+++        ++++ + I K
Subjt:  APLGGEN-----KFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPK

Query:  GNGCDTCSQEYSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTH
         +   + +++   GNS    +   S       N  +  C     ++M ++ +        G+ ++I+LM+I DE K+  L +VI +LGG++T DG+TSTH
Subjt:  GNGCDTCSQEYSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTH

Query:  VITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGG
        ++TGKVRKTLN CTALCSGAWIVSPSWLKES REGRF +E  ++L D DY LKY   LK+ VLRAKARP +L +GYD+C+  + E P K  S I+KSAGG
Subjt:  VITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGG

Query:  NVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        NVI G++KV E SK I++ CEED   AL AAKKGIWTF+S+W M CVM+Q+LDL+ PQF ESL
Subjt:  NVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

AT2G41450.2 N-acetyltransferases;N-acetyltransferases

3.0e-149

47.91

Show/hide

Query:  FVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYCTLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKG
        F+L+NP D D  +K +LQEVL+LY +ELP M YA+NTGKQS F+E+CVS GKYC+L+L+ST   D   I AAITYQIVPADTQYAEIPLAAV+  HQ KG
Subjt:  FVLVNPNDYDSDSKFYLQEVLQLYKRELPTMVYAANTGKQSTFMEKCVSNGKYCTLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKG

Query:  FGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDAR
        FG+++Y EL KRL SVGIRTI+CW DKESEGFW KQGF+ +AEVD KGKA+ + ++++IR+ALCFPGGSTLM+SH+ +   +S+ ++  S          
Subjt:  FGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFLSIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDAR

Query:  ERTGVAKQRCK--PSNAVDKQTIEKLNFQPEEFVTFAPLGGEN-----KFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQS
              K +C+  P +A +  T               P+ G++      F      D + G   P   + I  +   + +    TT    +    CST  
Subjt:  ERTGVAKQRCK--PSNAVDKQTIEKLNFQPEEFVTFAPLGGEN-----KFHYPQNQDAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQS

Query:  AKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSF
         KR WEASLSSL+SK+++        ++++ + I K +   + +++   GNS    +   S       N  +  C     ++M ++ +        G+ +
Subjt:  AKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGSPKNPSTSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSF

Query:  KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLR
        +I+LM+I DE K+  L +VI +LGG++T DG+TSTH++TGKVRKTLN CTALCSGAWIVSPSWLKES REGRF +E  ++L D DY LKY   LK+ VLR
Subjt:  KIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLR

Query:  AKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL
        AKARP +L +GYD+C+  + E P K  S I+KSAGGNVI G++KV E SK I++ CEED   AL AAKKGIWTF+S+W M CVM+Q+LDL+ PQF ESL
Subjt:  AKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELDLEAPQFAESL

AT4G02110.1 transcription coactivators

8.3e-06

24.82

Show/hide

Query:  AKKTQLMKVIEELGGSLTSDGS----TSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDS----DYSLKYRGSLKTAVLRAK
        +++ +  ++I  L G    D       +TH I  ++R+T  F  A  SG+WI+   ++ +S   G+ + E PY    S    D ++      K  ++R K
Subjt:  AKKTQLMKVIEELGGSLTSDGS----TSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDS----DYSLKYRGSLKTAVLRAK

Query:  ARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVI
           GAL+    V       P    L   VK+  G ++
Subjt:  ARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVI

AT4G03130.1 BRCT domain-containing DNA repair protein

5.2e-16

29.63

Show/hide

Query:  NIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARP
        N+ DE  K Q  K++  LG S  S  + STH I  +  +T N   A+  G ++V+P WL+   +    +DE  Y+L D     K    L T++ RAK  P
Subjt:  NIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARP

Query:  GALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKV-----NEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELD
          L +G+ VCI+   +P    ++ +VK   G V+   + +     N     + L+C+ED +  L    +G   F S+ L+  ++ Q+L+
Subjt:  GALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKV-----NEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQELD

AT4G21070.1 breast cancer susceptibility1

1.4e-05

25.77

Show/hide

Query:  KKTQLMKVIEELGGSLTSD-GSTSTHVI-----TGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARP
        +KT + +  E  G +++ +  ST THVI      G  ++TL F  A+  G WI++  W+K   +  ++V E PY +    + ++    L     RA  + 
Subjt:  KKTQLMKVIEELGGSLTSD-GSTSTHVI-----TGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDELPYVLDDSDYSLKYRGSLKTAVLRAKARP

Query:  GALFEGYDVCISAHAEPPPKA-LSVIVKSAGGNVIHG---LDKVNEVSKTIFLACEEDVEEAL
          LF G    I    E   K  L  ++ +AGG ++         NE S  +  + E   ++ L
Subjt:  GALFEGYDVCISAHAEPPPKA-LSVIVKSAGGNVIHG---LDKVNEVSKTIFLACEEDVEEAL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

CGCATATATTTTTTATTGACAATTGTACCCTTCTTCCCGCCCGATCGAAATACAGTGCTCTGCTCTCAAAACCTTCCACAGGAAGCTAACCAAAATCCCGCGGCCATGGC
GCCAAGGAAGAAAGCTGCACCTCGCTCTCAAATCCCAATTCTGGGGAAAGAGGGGCATGTTATTGATGCTAATCAACCAGAATGCGACGGAAAAGGTATCGGAGAAAAAT
GTCCCTCTGAAGGCGATTATTCTTTTGTGCTCGTTAATCCGAATGATTATGATAGTGACAGCAAGTTTTATCTTCAGGAAGTATTACAATTATACAAAAGGGAACTACCC
ACAATGGTCTATGCTGCAAATACTGGAAAGCAATCGACTTTTATGGAGAAATGCGTATCTAATGGGAAATATTGTACATTGCTCTTGAGATCCACATCTGTGGCTGATCC
AAGATTGATCAGAGCTGCAATTACCTACCAAATAGTTCCTGCTGACACACAATATGCTGAGATTCCTCTTGCTGCTGTCAGTTCAGGTCACCAACACAAGGGATTTGGTC
GTATATTATACATGGAACTTAGAAAAAGACTTCAAAGTGTTGGAATCCGTACAATATTCTGTTGGGGAGACAAGGAATCTGAAGGCTTTTGGTCCAAACAGGGTTTTTTG
TCCATAGCAGAAGTGGACACTAAGGGAAAAGCTCGTAGAATACCTGTTAGAGCTGACATTCGTAGAGCTTTATGCTTTCCTGGTGGTTCTACCCTCATGGTTTCACACAT
TTACCAGGGAATTGCAATGAGTTCTGCAGACTTGCCAAAGTCACTTTCTGATTCATTAAGGCCTGATGCCCGCGAAAGAACTGGTGTTGCCAAACAAAGATGCAAGCCTT
CAAATGCAGTTGACAAGCAGACCATTGAAAAGTTGAACTTCCAACCTGAAGAGTTTGTTACTTTTGCACCCCTGGGAGGAGAAAACAAATTTCATTATCCTCAAAACCAG
GACGCGGTGCATGGCTGCAATCGTCCAGCTTCTTTTAATGAAATAGAGAACCGCAGGACAGCCAGTAGGGTAGAAATATCCAATACTACTGGTCATTTAGATGAGAGACA
TTGTTCTTGTTCTACACAAAGTGCAAAGAGAGTTTGGGAAGCATCACTTTCTTCACTGAAATCTAAGAAAGTAAAAGGAGTTCATCTGCACCATTTCAATTCAGATTCTA
GCCAGAACTTTATTCCAAAGGGTAACGGATGTGATACCTGCTCTCAAGAATACTCATTAGGCAATTCAAAGCATGAGATATTGGCTAGTGGTTCTCCTAAAAATCCTTCA
ACCAGTAATTCTACACAGAACTTTTGTGAAGAATTTGGAAATGTTAACATGGCATCAAAAGCCCACCAGTGCGAAGAGCTTCCCACATTAGGAAAATCATTTAAAATTAT
GTTGATGAATATTGCTGATGAAGCAAAGAAAACTCAGCTCATGAAGGTAATTGAGGAGCTCGGTGGTTCTCTCACCTCTGATGGGAGTACAAGCACCCATGTCATTACAG
GAAAAGTGCGGAAAACTCTAAATTTCTGCACAGCTCTCTGTTCAGGAGCTTGGATTGTCTCCCCCAGTTGGTTAAAAGAAAGCTATCGGGAAGGCAGATTTGTTGATGAG
TTGCCTTACGTACTAGATGATAGTGACTACTCGTTGAAGTATAGAGGCAGCTTAAAAACTGCAGTTCTCAGAGCGAAAGCACGTCCTGGAGCTTTATTCGAGGGATATGA
TGTTTGCATATCAGCTCACGCTGAACCACCACCTAAGGCTCTCTCTGTGATAGTCAAGTCAGCCGGTGGAAATGTTATTCATGGGCTAGATAAGGTAAATGAAGTATCAA
AAACGATCTTTTTGGCGTGCGAGGAAGACGTGGAGGAAGCATTACTGGCTGCGAAAAAAGGGATATGGACTTTTAACAGTGACTGGCTGATGACCTGTGTGATGAGACAA
GAACTAGACCTGGAAGCCCCTCAGTTTGCTGAGTCCCTATAA

mRNA sequence

Show/hide mRNA sequence

CCCGCATATATTTTTTATTGACAATTGTACCCTTCTTCCCGCCCGATCGAAATACAGTGCTCTGCTCTCAAAACCTTCCACAGGAAGCTAACCAAAATCCCGCGGCCATG
GCGCCAAGGAAGAAAGCTGCACCTCGCTCTCAAATCCCAATTCTGGGGAAAGAGGGGCATGTTATTGATGCTAATCAACCAGAATGCGACGGAAAAGGTATCGGAGAAAA
ATGTCCCTCTGAAGGCGATTATTCTTTTGTGCTCGTTAATCCGAATGATTATGATAGTGACAGCAAGTTTTATCTTCAGGAAGTATTACAATTATACAAAAGGGAACTAC
CCACAATGGTCTATGCTGCAAATACTGGAAAGCAATCGACTTTTATGGAGAAATGCGTATCTAATGGGAAATATTGTACATTGCTCTTGAGATCCACATCTGTGGCTGAT
CCAAGATTGATCAGAGCTGCAATTACCTACCAAATAGTTCCTGCTGACACACAATATGCTGAGATTCCTCTTGCTGCTGTCAGTTCAGGTCACCAACACAAGGGATTTGG
TCGTATATTATACATGGAACTTAGAAAAAGACTTCAAAGTGTTGGAATCCGTACAATATTCTGTTGGGGAGACAAGGAATCTGAAGGCTTTTGGTCCAAACAGGGTTTTT
TGTCCATAGCAGAAGTGGACACTAAGGGAAAAGCTCGTAGAATACCTGTTAGAGCTGACATTCGTAGAGCTTTATGCTTTCCTGGTGGTTCTACCCTCATGGTTTCACAC
ATTTACCAGGGAATTGCAATGAGTTCTGCAGACTTGCCAAAGTCACTTTCTGATTCATTAAGGCCTGATGCCCGCGAAAGAACTGGTGTTGCCAAACAAAGATGCAAGCC
TTCAAATGCAGTTGACAAGCAGACCATTGAAAAGTTGAACTTCCAACCTGAAGAGTTTGTTACTTTTGCACCCCTGGGAGGAGAAAACAAATTTCATTATCCTCAAAACC
AGGACGCGGTGCATGGCTGCAATCGTCCAGCTTCTTTTAATGAAATAGAGAACCGCAGGACAGCCAGTAGGGTAGAAATATCCAATACTACTGGTCATTTAGATGAGAGA
CATTGTTCTTGTTCTACACAAAGTGCAAAGAGAGTTTGGGAAGCATCACTTTCTTCACTGAAATCTAAGAAAGTAAAAGGAGTTCATCTGCACCATTTCAATTCAGATTC
TAGCCAGAACTTTATTCCAAAGGGTAACGGATGTGATACCTGCTCTCAAGAATACTCATTAGGCAATTCAAAGCATGAGATATTGGCTAGTGGTTCTCCTAAAAATCCTT
CAACCAGTAATTCTACACAGAACTTTTGTGAAGAATTTGGAAATGTTAACATGGCATCAAAAGCCCACCAGTGCGAAGAGCTTCCCACATTAGGAAAATCATTTAAAATT
ATGTTGATGAATATTGCTGATGAAGCAAAGAAAACTCAGCTCATGAAGGTAATTGAGGAGCTCGGTGGTTCTCTCACCTCTGATGGGAGTACAAGCACCCATGTCATTAC
AGGAAAAGTGCGGAAAACTCTAAATTTCTGCACAGCTCTCTGTTCAGGAGCTTGGATTGTCTCCCCCAGTTGGTTAAAAGAAAGCTATCGGGAAGGCAGATTTGTTGATG
AGTTGCCTTACGTACTAGATGATAGTGACTACTCGTTGAAGTATAGAGGCAGCTTAAAAACTGCAGTTCTCAGAGCGAAAGCACGTCCTGGAGCTTTATTCGAGGGATAT
GATGTTTGCATATCAGCTCACGCTGAACCACCACCTAAGGCTCTCTCTGTGATAGTCAAGTCAGCCGGTGGAAATGTTATTCATGGGCTAGATAAGGTAAATGAAGTATC
AAAAACGATCTTTTTGGCGTGCGAGGAAGACGTGGAGGAAGCATTACTGGCTGCGAAAAAAGGGATATGGACTTTTAACAGTGACTGGCTGATGACCTGTGTGATGAGAC
AAGAACTAGACCTGGAAGCCCCTCAGTTTGCTGAGTCCCTATAACAAAAAAGGTTAGCTTTCAGTTTTGGACTCCATAAAGCCATTTGTAAATCTCTCTTTCTCACTTGT
TGAATTTGGTACATAAACAAATTTTGTTTGTTCCTTCTTTATATATGTATTCGTTAGTAAACAAACTCAATAATTTTATTGGAAGAAGATTTCTGAAGTTTTAGCTGGTG
CATAGTAACTTACTGAAATGGAGACAAAACTTGATGTGAACTCATTATGGTGGTCTGCTTTGAAATCG

Protein sequence

Show/hide protein sequence

RIYFLLTIVPFFPPDRNTVLCSQNLPQEANQNPAAMAPRKKAAPRSQIPILGKEGHVIDANQPECDGKGIGEKCPSEGDYSFVLVNPNDYDSDSKFYLQEVLQLYKRELP
TMVYAANTGKQSTFMEKCVSNGKYCTLLLRSTSVADPRLIRAAITYQIVPADTQYAEIPLAAVSSGHQHKGFGRILYMELRKRLQSVGIRTIFCWGDKESEGFWSKQGFL
SIAEVDTKGKARRIPVRADIRRALCFPGGSTLMVSHIYQGIAMSSADLPKSLSDSLRPDARERTGVAKQRCKPSNAVDKQTIEKLNFQPEEFVTFAPLGGENKFHYPQNQ
DAVHGCNRPASFNEIENRRTASRVEISNTTGHLDERHCSCSTQSAKRVWEASLSSLKSKKVKGVHLHHFNSDSSQNFIPKGNGCDTCSQEYSLGNSKHEILASGSPKNPS
TSNSTQNFCEEFGNVNMASKAHQCEELPTLGKSFKIMLMNIADEAKKTQLMKVIEELGGSLTSDGSTSTHVITGKVRKTLNFCTALCSGAWIVSPSWLKESYREGRFVDE
LPYVLDDSDYSLKYRGSLKTAVLRAKARPGALFEGYDVCISAHAEPPPKALSVIVKSAGGNVIHGLDKVNEVSKTIFLACEEDVEEALLAAKKGIWTFNSDWLMTCVMRQ
ELDLEAPQFAESL

MC03g1095 (gene) of Bitter gourd (Dali-11) v1 genome