CuGenDBv2

Gene ID	MS022450
Organism	Momordica charantia cv. TR (Bitter gourd (TR) v1)
Description	transcription factor SPT20 homolog isoform X1
Genome location	scaffold47:3444272..3447187
RNA-Seq Expression	MS022450
Synteny	MS022450
Gene Ontology terms	NA
InterPro domains	IPR010820 - UBA-like domain DUF1421

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022147811.1 basic salivary proline-rich protein 2-like [Momordica charantia]

6.0e-288

99.62

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVTNSSK-DFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGIS
        MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVTNSSK DFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGIS
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVTNSSK-DFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGIS

Query:  SRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNEN
        SRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNEN
Subjt:  SRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNEN

Query:  ASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQF
        ASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQF
Subjt:  ASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQF

Query:  NQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPPQVKNAFGPAA
        NQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAP+GGSAPQQPPQVKNAFGPAA
Subjt:  NQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPPQVKNAFGPAA

Query:  GEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQ
        GEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQ
Subjt:  GEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQ

Query:  RMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        RMEDSGQPVDFNAVLDRLSASAGPGPQRAW
Subjt:  RMEDSGQPVDFNAVLDRLSASAGPGPQRAW

XP_022952329.1 class E vacuolar protein-sorting machinery protein hse1-like [Cucurbita moschata]

2.8e-229

84.14

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI
        MASGSAGRPNSAPK+FDFGSD+ILCS+EDY  ++ SNGSHSDPV+  NSSKDFHK RMS+VFP +AYGQ +DSI QDVI+ VENSMKKHSDNLLRFLEGI
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI

Query:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE
        SSRLSQLELYCYNLDKSVGEMRS+LARDHEE+DSKLKSIEKH+QEVHRSVQIIRDKQELAETQKDLAKLQV QKEPS SSH Q+NEER S   +DPKKNE
Subjt:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE

Query:  NASEIHNQQLALALPHQIVPQQNPIT-PPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQ
        N SEIHNQQLALALPHQIVPQQNPIT PPSAALPQNVPQQQQSYYISS+QLPGQ P   QHAQ QYISSDSQHRA QPQDVS    QMTNPQLSQ P  Q
Subjt:  NASEIHNQQLALALPHQIVPQQNPIT-PPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQ

Query:  QFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS--YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNA
         FNQYQQQW Q PSQ AQPPQQ SMQPQIRPPP+SVYPS   PP+QPTS+PETLSSSMPMQMSFASIPQPGSSR D VPYGY A +GGSAPQQPPQVKNA
Subjt:  QFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS--YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNA

Query:  FGPAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDH
        +GPA GEGYM PPGQQ ALSSGGAYMMYDRESGR PHH PQQ PHHP QQ HF+QSGY PAN   Q+ PQAPTGPHVS+RNPSHSHLIEKLVGMGFRGDH
Subjt:  FGPAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDH

Query:  VASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        VAS+IQRMEDSGQ VDFNAVLDRLS  AGPGPQRAW
Subjt:  VASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

XP_022969058.1 ataxin-2 homolog [Cucurbita maxima]

1.4e-231

84.46

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI
        MASGSAGRPNSAPK+FDFGSD+ILCS+EDY  ++ SNGSHSDPV+  NSSKDFHK RMS+VFP +AYGQ +DSI QDVI+TVENSMKKHSDNLLRFLEGI
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI

Query:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE
        SSRLSQLELYCYNLDKSVGEMRS+LARDHEE+DSKLKSIEKH+QEVHRSVQIIRDKQELAETQKDLAKLQV QKEPS SSH Q+NEER S   +DPKKNE
Subjt:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE

Query:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ
        N SEIHNQQLALALPHQIVPQQNP+TPPSAALPQNVPQQ QSYYISS+QLPGQ P   QHAQ QYISSDS HRA QPQDVS    QMTNPQLSQ P  Q 
Subjt:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ

Query:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNAFG
        FNQYQQQW Q PSQ AQPPQQ SMQPQIRPPP+SVYPS YPP+QPTS+PETLSSSMPMQMSFASIPQPGSSR D VPYGY A +GGSAPQQPPQVKNA+G
Subjt:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNAFG

Query:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA
        PA GEGYM PPGQQ ALSSGGAYMMYDRESGR PHH PQQ PHHP QQ HFNQSGY PAN   Q+ PQAPTGPHVS+RNPSHSHLIEKLVGMGFRGDHVA
Subjt:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA

Query:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        S+IQRMEDSGQ VDFNAVLDRLS  AGPGPQRAW
Subjt:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

XP_023554446.1 trithorax group protein osa-like [Cucurbita pepo subsp. pepo]

8.8e-231

84.27

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI
        MASGSAGRPNSAPK+FDFGSD+ILCS+EDY  ++ SNGSHSDPV+  NSSKDFHK RMS+VFP +AYGQ +DSI QDVI+TVENSMKKHSDNLLRFLEGI
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI

Query:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE
        SSRLSQLELYCYNLDKSVGEMRS+LARDHEE++SKLKSIEKH+QEVHRSVQIIRDKQELAETQKDLAKLQV QKEPS SSH Q+NEER S   +DPKKNE
Subjt:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE

Query:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ
        N SEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISS+QLPGQ P   QHAQ QYISSDSQHRA QPQDVS     MTNPQLSQ P  Q 
Subjt:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ

Query:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNAFG
        FNQYQQQW Q PSQ AQPPQQ SMQPQIRPPP+SVYPS YPP+QPTS+PETLSSSMPMQMSFA IPQPGSSR D VPYGY A +GGSAPQQPPQVKNA+G
Subjt:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNAFG

Query:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA
        PA GEGYM PPGQQ ALSSGGAYMMYDRESGR PHH PQQ PHHP QQ HFNQSGY PAN   Q+ PQAP GPHVS+RNPSHSHLIEKLVGMGFRGDHVA
Subjt:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA

Query:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        S+IQRMEDSGQ VDFNAVLDRLS  AGPGPQRAW
Subjt:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

XP_038888365.1 ataxin-2 homolog [Benincasa hispida]

1.0e-231

85.07

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPV--TNSSKDFHKGRMSSVFPASAYG--QAEDSIKQDVISTVENSMKKHSDNLLRFLE
        MASGSAGRPNS+PK+FDFGSDDILCS+EDY  +D SNGSH+DPV  TNS+KDFHK RMS+VFPA+AYG  QA+DSI Q+VISTVENSMKKHSDNLLRFLE
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPV--TNSSKDFHKGRMSSVFPASAYG--QAEDSIKQDVISTVENSMKKHSDNLLRFLE

Query:  GISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKK
        GISSRLSQLELYCYNLDKSVGEMRS+LARDHEE+DSKLKS+EKH+QEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSH QSNEERASS ASDPKK
Subjt:  GISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKK

Query:  NENASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPL
        NEN SEIHNQQLALALPHQIVPQQN IT PSAALPQN+PQQQQSYYISS+QLPGQPPH+ QHAQGQYIS DS +RA QPQDVS    QM+NPQLSQ PP 
Subjt:  NENASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPL

Query:  QQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNA
        Q FNQY QQW Q PSQQ QPPQQPSMQPQIRPPP SVYPS YPP+QPTS+PETLSSSMPM MSF SIPQPGSSR+D  PYGY A +GGSAPQQPPQVKNA
Subjt:  QQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNA

Query:  FGPAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDH
        +GPA GEGYM PPGQQ    SGGAYMMYDRESGR PHHPPQQ PHHP QQPHFNQSGY PAN S Q+ PQAPTGPHVS+RNPSHSHLIEKLVGMGFRGDH
Subjt:  FGPAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDH

Query:  VASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        VAS+IQRMEDSGQPVDFNAVLDRLS   GPGPQRAW
Subjt:  VASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

TrEMBL top hits

e value

%identity

Alignment

A0A1S3C1W2 arginine-glutamic acid dipeptide repeats protein-like

1.3e-227

83.71

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDP--VTNSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI
        MASGSAGRPNS+PK+FDFGSDDILCS+EDY  +D SNGS SDP  VTN  KDFHK RMS+VFPA+ YGQA+D+I Q+VISTVENSMKKHSDNLLRFLEGI
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDP--VTNSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI

Query:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE
        SSRLSQLELYCYNLDKSVGEMRSELARDHEE+DSKLKS+EKH+QEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSS+H QSNEERASS ASD KK E
Subjt:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE

Query:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ
        N SEIHNQQLALALPHQIVPQQNPITPPSAALPQN+PQQQQSYYIS +QLPGQPPHI QHAQ QYISSDSQHRA QPQDVS    QM+NPQLSQ PP Q 
Subjt:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ

Query:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAP-TGGSAPQQPPQVKNAFG
        FNQYQQQW Q PSQQ QPPQQPSMQ QIRPPP SVYPS YPP+QPTS+PETL SSMPMQMSF SIPQPGSSRVD  PYGYAP +GGSAPQQPPQVKNA+G
Subjt:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAP-TGGSAPQQPPQVKNAFG

Query:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA
        P  GEGYM PPGQQ    SGGAYMMYDRESGR        PPHHPPQQ HFNQSGY  AN   Q+ PQAP GPHVS+RNPSHSHLIEKLVGMGFRGDHVA
Subjt:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA

Query:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        S+IQRMEDSGQPVDFNAVLDRLS+ +GPGPQRAW
Subjt:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

A0A5D3C6G6 Arginine-glutamic acid dipeptide repeats protein-like

6.4e-227

83.52

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPV--TNSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI
        MASGSAGRPNS+PK+FDFGSDDILCS+EDY  +D SNGS SDPV  TN  KDFHK RMS+VFPA+ Y QA+D+I Q+VISTVENSMKKHSDNLLRFLEGI
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPV--TNSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI

Query:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE
        SSRLSQLELYCYNLDKSVGEMRSELARDHEE+DSKLKS+EKH+QEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSS+H QSNEERASS ASD KK E
Subjt:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE

Query:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ
        N SEIHNQQLALALPHQIVPQQNPITPPSAALPQN+PQQQQSYYIS +QLPGQPPHI QHAQ QYISSDSQHRA QPQDVS    QM+NPQLSQ PP Q 
Subjt:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ

Query:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAP-TGGSAPQQPPQVKNAFG
        FNQYQQQW Q PSQQ QPPQQPSMQ QIRPPP SVYPS YPP+QPTS+PETL SSMPMQMSF SIPQPGSSRVD  PYGYAP +GGSAPQQPPQVKNA+G
Subjt:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAP-TGGSAPQQPPQVKNAFG

Query:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA
        P  GEGYM PPGQQ    SGGAYMMYDRESGR        PPHHPPQQ HFNQSGY  AN   Q+ PQAP GPHVS+RNPSHSHLIEKLVGMGFRGDHVA
Subjt:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA

Query:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        S+IQRMEDSGQPVDFNAVLDRLS+ +GPGPQRAW
Subjt:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

A0A6J1D3H2 basic salivary proline-rich protein 2-like

2.9e-288

99.62

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVTNSSK-DFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGIS
        MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVTNSSK DFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGIS
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVTNSSK-DFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGIS

Query:  SRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNEN
        SRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNEN
Subjt:  SRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNEN

Query:  ASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQF
        ASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQF
Subjt:  ASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQF

Query:  NQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPPQVKNAFGPAA
        NQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAP+GGSAPQQPPQVKNAFGPAA
Subjt:  NQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPPQVKNAFGPAA

Query:  GEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQ
        GEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQ
Subjt:  GEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQ

Query:  RMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        RMEDSGQPVDFNAVLDRLSASAGPGPQRAW
Subjt:  RMEDSGQPVDFNAVLDRLSASAGPGPQRAW

A0A6J1GLD5 class E vacuolar protein-sorting machinery protein hse1-like

1.4e-229

84.14

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI
        MASGSAGRPNSAPK+FDFGSD+ILCS+EDY  ++ SNGSHSDPV+  NSSKDFHK RMS+VFP +AYGQ +DSI QDVI+ VENSMKKHSDNLLRFLEGI
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI

Query:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE
        SSRLSQLELYCYNLDKSVGEMRS+LARDHEE+DSKLKSIEKH+QEVHRSVQIIRDKQELAETQKDLAKLQV QKEPS SSH Q+NEER S   +DPKKNE
Subjt:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE

Query:  NASEIHNQQLALALPHQIVPQQNPIT-PPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQ
        N SEIHNQQLALALPHQIVPQQNPIT PPSAALPQNVPQQQQSYYISS+QLPGQ P   QHAQ QYISSDSQHRA QPQDVS    QMTNPQLSQ P  Q
Subjt:  NASEIHNQQLALALPHQIVPQQNPIT-PPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQ

Query:  QFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS--YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNA
         FNQYQQQW Q PSQ AQPPQQ SMQPQIRPPP+SVYPS   PP+QPTS+PETLSSSMPMQMSFASIPQPGSSR D VPYGY A +GGSAPQQPPQVKNA
Subjt:  QFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS--YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNA

Query:  FGPAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDH
        +GPA GEGYM PPGQQ ALSSGGAYMMYDRESGR PHH PQQ PHHP QQ HF+QSGY PAN   Q+ PQAPTGPHVS+RNPSHSHLIEKLVGMGFRGDH
Subjt:  FGPAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDH

Query:  VASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        VAS+IQRMEDSGQ VDFNAVLDRLS  AGPGPQRAW
Subjt:  VASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

A0A6J1HZW1 ataxin-2 homolog

6.6e-232

84.46

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI
        MASGSAGRPNSAPK+FDFGSD+ILCS+EDY  ++ SNGSHSDPV+  NSSKDFHK RMS+VFP +AYGQ +DSI QDVI+TVENSMKKHSDNLLRFLEGI
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVT--NSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGI

Query:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE
        SSRLSQLELYCYNLDKSVGEMRS+LARDHEE+DSKLKSIEKH+QEVHRSVQIIRDKQELAETQKDLAKLQV QKEPS SSH Q+NEER S   +DPKKNE
Subjt:  SSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNE

Query:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ
        N SEIHNQQLALALPHQIVPQQNP+TPPSAALPQNVPQQ QSYYISS+QLPGQ P   QHAQ QYISSDS HRA QPQDVS    QMTNPQLSQ P  Q 
Subjt:  NASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQ

Query:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNAFG
        FNQYQQQW Q PSQ AQPPQQ SMQPQIRPPP+SVYPS YPP+QPTS+PETLSSSMPMQMSFASIPQPGSSR D VPYGY A +GGSAPQQPPQVKNA+G
Subjt:  FNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPS-YPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGY-APTGGSAPQQPPQVKNAFG

Query:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA
        PA GEGYM PPGQQ ALSSGGAYMMYDRESGR PHH PQQ PHHP QQ HFNQSGY PAN   Q+ PQAPTGPHVS+RNPSHSHLIEKLVGMGFRGDHVA
Subjt:  PAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQSGYSPANPSLQM-PQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVA

Query:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        S+IQRMEDSGQ VDFNAVLDRLS  AGPGPQRAW
Subjt:  SVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G01560.1 Protein of unknown function (DUF1421)

1.5e-18

29.9

Show/hide

Query:  NGSHSD--PVTNSSKDFHKGRMSSVFPASAYGQAEDSIKQDVIST--VENSMKKHSDNLLRFLEGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDS
        N S SD  PV+ +S + + G + S+ P+        ++    I +  ++ +MKKH+D LL  +EG+S+RLSQLE   +NL+  V +++  +   H  +D 
Subjt:  NGSHSD--PVTNSSKDFHKGRMSSVFPASAYGQAEDSIKQDVIST--VENSMKKHSDNLLRFLEGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDS

Query:  KLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNENASEIHNQQLALALPHQIVPQQNPITPPSAALPQ
        K++ ++  L EV   VQ+++DKQE+ E Q  L+K QVS +   + +H    +  A S A  P +    +       + A P Q         PPS+ LP 
Subjt:  KLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNENASEIHNQQLALALPHQIVPQQNPITPPSAALPQ

Query:  NVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSS
         +P Q      SS Q P  PP                H  PQP      PP  +NP   QAP        Q Q   QPS Q+ PPQQP    Q  PPPSS
Subjt:  NVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSS

Query:  VY----------PSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPPQVKNAFGPAAGEGYMPPPGQQSALSSGGAYMMY
         Y           SYPP+ P   P   + S P Q  F + PQP        P  Y   GG +    P            GY+  P   S      A   +
Subjt:  VY----------PSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPPQVKNAFGPAAGEGYMPPPGQQSALSSGGAYMMY

Query:  DRESGRS-PHHPPQQP-PHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRLSAS
           +G   P     +P PH  P     +  G S            + P   SR P    +I+++  MGF  D V + ++++ ++GQ VD N VLD+L   
Subjt:  DRESGRS-PHHPPQQP-PHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRLSAS

Query:  AGPGP
         G  P
Subjt:  AGPGP

AT4G28300.1 Protein of unknown function (DUF1421)

1.4e-112

50.82

Show/hide

Query:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDP---VTNSSKDFHKGRM--SSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFL
        MASGS+GR NS  K FDFGSDDILCSY+DY N+DSSNG HSDP    +NS+K+FHK RM  SSVFP S+Y   EDS+ QD+  TVE +MK ++DN++RFL
Subjt:  MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDP---VTNSSKDFHKGRM--SSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFL

Query:  EGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPK
        EG+SSRLSQLELYCYNLDK++GEMRSEL   HE++D KL+S++KHLQEVHRSVQI+RDKQELA+TQK+LAKLQ+ QKE SSSSH Q  E+R ++   +PK
Subjt:  EGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPK

Query:  KNENASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISS-DSQHRAPQPQDVSSLPPQMTNPQLSQAP
        K+EN S+ HNQQLALALPHQI PQ           PQ  PQQ Q Y      +P  P  +Q       +S+  SQ +AP  Q     PP    P    + 
Subjt:  KNENASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISS-DSQHRAPQPQDVSSLPPQMTNPQLSQAP

Query:  PLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVP--ETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPP-QV
          Q F QYQQ W         PP     QPQ RP  S  YP+Y P+ P + P  E+L SSM MQ  ++  PQ     +    YG AP     PQ PP Q 
Subjt:  PLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVP--ETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPP-QV

Query:  KNAFGPAAGEGYMP--PPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQ----SGYSPANPSLQMPQAPTGPHVSS---RNPSHSHLIE
        K ++ P  G+GY+P  PP       SG A  MY  E GR  + PPQ  P    QQ H+ Q     GYSP       P    G ++ +       +  LIE
Subjt:  KNAFGPAAGEGYMP--PPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQ----SGYSPANPSLQMPQAPTGPHVSS---RNPSHSHLIE

Query:  KLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
        KLV MGFRGDHV +VIQRME+SGQP+DFN +LDRLS  +  GP R W
Subjt:  KLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

AT4G28300.2 Protein of unknown function (DUF1421)

3.3e-90

48.56

Show/hide

Query:  SSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQE
        SSVFP S+Y   EDS+ QD+  TVE +MK ++DN++RFLEG+SSRLSQLELYCYNLDK++GEMRSEL   HE++D KL+S++KHLQEVHRSVQI+RDKQE
Subjt:  SSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQE

Query:  LAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNENASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQ
        LA+TQK+LAKLQ+ QKE SSSSH Q  E+R ++   +PKK+EN S+ HNQQLALALPHQI PQ           PQ  PQQ Q Y      +P  P  +Q
Subjt:  LAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNENASEIHNQQLALALPHQIVPQQNPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQ

Query:  QHAQGQYISS-DSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVP--ETLSSSM
               +S+  SQ +AP  Q     PP    P    +   Q F QYQQ W         PP     QPQ RP  S  YP+Y P+ P + P  E+L SSM
Subjt:  QHAQGQYISS-DSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPPSSVYPSYPPSQPTSVP--ETLSSSM

Query:  PMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPP-QVKNAFGPAAGEGYMP--PPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQ-
         MQ  ++  PQ     +    YG AP     PQ PP Q K ++ P  G+GY+P  PP       SG A  MY  E GR  + PPQ  P    QQ H+ Q 
Subjt:  PMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPP-QVKNAFGPAAGEGYMP--PPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHHPPQQPHFNQ-

Query:  ---SGYSPANPSLQMPQAPTGPHVSS---RNPSHSHLIEKLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW
            GYSP       P    G ++ +       +  LIEKLV MGFRGDHV +VIQRME+SGQP+DFN +LDRLS  +  GP R W
Subjt:  ---SGYSPANPSLQMPQAPTGPHVSS---RNPSHSHLIEKLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

AT5G14540.1 Protein of unknown function (DUF1421)

5.0e-22

30.16

Show/hide

Query:  NGSHSDPVTNSSKDFHKGRMSSVFPASAYGQAE-DSIKQDVISTVENSMKKHSDNLLRFLEGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLK
        + S   PV+ SS   + G M S+ P+  + + + +S +  +IS ++ +MK H+D LL  +EG+S+RL+QLE    +L+  V +++  +   H ++D KL+
Subjt:  NGSHSDPVTNSSKDFHKGRMSSVFPASAYGQAE-DSIKQDVISTVENSMKKHSDNLLRFLEGISSRLSQLELYCYNLDKSVGEMRSELARDHEESDSKLK

Query:  SIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNENASEIHNQQLALALPHQIV---PQQNPITPPSAALPQ
         +E  + EV   VQ+++DKQE+ E Q  L+KLQ+S+      +H    E  A   AS P+   +A+   +       P Q +     Q+ ++PPS  LPQ
Subjt:  SIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNENASEIHNQQLALALPHQIV---PQQNPITPPSAALPQ

Query:  NVPQ---QQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPP
           Q   QQ+ Y+  S Q   QPP   Q            ++ P P      PP    PQ             Q Q+ QQP  Q Q P      P+  P 
Subjt:  NVPQ---QQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPP

Query:  PSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTG---GSAPQQPPQVKNAFGPAAGEGYMP--PPGQQSALSSGGAYMMYDR
        P   YP  PP QP S P     S P Q  + + P P S  +   P G + +G   G +P+  P      GP +  G  P   P  QS  S  GAY     
Subjt:  PSSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTG---GSAPQQPPQVKNAFGPAAGEGYMP--PPGQQSALSSGGAYMMYDR

Query:  ESGRSPHHPPQQP-PHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRL
             P  P  +P P   P     +  G    + S         P   +R P    +I+K+V MGF  D V   ++ + ++GQ VD N VLD+L
Subjt:  ESGRSPHHPPQQP-PHHPPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGTCTGGCTCAGCAGGTCGCCCTAACTCCGCCCCCAAAGCCTTTGATTTTGGTTCCGATGATATTCTCTGCTCATACGAGGACTACGCCAACAAGGACTCTTCAAA
CGGTAGCCACAGCGATCCCGTTACGAATTCCAGCAAGGATTTTCACAAAGGTAGAATGTCTTCTGTATTCCCTGCTTCTGCCTATGGTCAAGCAGAAGATTCCATCAAAC
AAGATGTGATTTCTACTGTTGAGAACAGCATGAAAAAGCATTCTGATAACCTTTTGCGTTTTCTCGAGGGAATAAGTTCACGCCTATCACAACTTGAACTATACTGCTAC
AACCTTGATAAATCTGTTGGAGAAATGCGATCTGAATTAGCTCGTGACCACGAAGAGTCAGATTCAAAGCTTAAATCTATTGAGAAGCATCTACAAGAGGTCCATAGGTC
TGTACAGATTATAAGAGACAAGCAAGAACTTGCTGAGACTCAAAAAGACCTAGCCAAACTTCAGGTTTCTCAGAAAGAACCATCTTCGTCAAGCCATCCACAGTCAAATG
AGGAGAGGGCTTCATCAGCTGCCTCTGATCCTAAAAAGAATGAAAATGCATCTGAGATTCACAACCAGCAATTAGCTCTAGCCTTGCCACATCAGATCGTCCCACAGCAA
AATCCCATCACACCTCCTTCAGCAGCTTTGCCTCAGAATGTGCCTCAACAGCAGCAATCTTATTACATCTCCTCAACCCAATTGCCTGGTCAACCACCCCATATACAACA
GCATGCTCAGGGCCAATATATTTCATCTGATTCTCAACACCGGGCACCACAACCTCAAGATGTTTCTTCATTGCCACCACAGATGACCAATCCCCAGCTAAGTCAAGCTC
CACCGCTCCAACAGTTCAACCAGTATCAACAACAATGGACGCAGCAGCCGTCTCAACAGGCACAACCACCACAACAGCCTTCTATGCAGCCTCAGATCAGACCACCACCT
TCTTCAGTCTATCCTTCTTATCCACCAAGTCAACCGACTTCTGTGCCAGAGACTCTGTCAAGCAGCATGCCTATGCAAATGTCTTTTGCGTCGATTCCTCAACCTGGTTC
GAGCCGTGTGGATACAGTGCCTTATGGGTATGCCCCAACTGGTGGTTCTGCTCCACAGCAACCTCCTCAAGTCAAAAATGCTTTTGGACCAGCAGCAGGTGAGGGATATA
TGCCTCCTCCTGGACAACAATCCGCACTTTCCTCAGGAGGTGCATACATGATGTACGATAGGGAAAGCGGAAGGTCACCCCACCATCCGCCCCAGCAACCACCACACCAT
CCGCCCCAACAACCACACTTCAATCAAAGTGGATATTCTCCCGCCAATCCATCTCTTCAGATGCCTCAGGCTCCAACAGGCCCCCATGTTTCATCCCGTAATCCAAGCCA
TTCACATTTAATCGAGAAGCTGGTTGGCATGGGTTTCAGGGGCGACCACGTTGCCAGTGTAATTCAGAGAATGGAGGACAGTGGCCAACCTGTTGACTTCAACGCAGTTC
TGGACCGGTTGAGTGCTTCTGCAGGTCCAGGTCCACAAAGAGCGTGG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MASGSAGRPNSAPKAFDFGSDDILCSYEDYANKDSSNGSHSDPVTNSSKDFHKGRMSSVFPASAYGQAEDSIKQDVISTVENSMKKHSDNLLRFLEGISSRLSQLELYCY
NLDKSVGEMRSELARDHEESDSKLKSIEKHLQEVHRSVQIIRDKQELAETQKDLAKLQVSQKEPSSSSHPQSNEERASSAASDPKKNENASEIHNQQLALALPHQIVPQQ
NPITPPSAALPQNVPQQQQSYYISSTQLPGQPPHIQQHAQGQYISSDSQHRAPQPQDVSSLPPQMTNPQLSQAPPLQQFNQYQQQWTQQPSQQAQPPQQPSMQPQIRPPP
SSVYPSYPPSQPTSVPETLSSSMPMQMSFASIPQPGSSRVDTVPYGYAPTGGSAPQQPPQVKNAFGPAAGEGYMPPPGQQSALSSGGAYMMYDRESGRSPHHPPQQPPHH
PPQQPHFNQSGYSPANPSLQMPQAPTGPHVSSRNPSHSHLIEKLVGMGFRGDHVASVIQRMEDSGQPVDFNAVLDRLSASAGPGPQRAW

MS022450 (gene) of Bitter gourd (TR) v1 genome