CuGenDBv2

Gene ID	Tan0013697
Organism	Trichosanthes anguina (Snake gourd v1)
Description	S1 motif domain-containing protein
Genome location	LG07:68199578..68206263
RNA-Seq Expression	Tan0013697
Synteny	Tan0013697
Gene Ontology terms	GO:0034337 - RNA folding (biological process) GO:1901259 - chloroplast rRNA processing (biological process) GO:0009507 - chloroplast (cellular component) GO:0003729 - mRNA binding (molecular function) GO:0019843 - rRNA binding (molecular function)
InterPro domains	IPR003029 - S1 domain IPR012340 - Nucleic acid-binding, OB-fold IPR022967 - RNA-binding domain, S1

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0042780.1 protein MLP1 [Cucumis melo var. makuwa]

0.0e+00

85.78

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFF PIDLLRPRR AVRNLCFNGR S+FSVLASKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKS+E
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNL+RPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPTIYNEDDVEDKPSR+RMKPNLSLKMS   TKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN+ASKGS+SDR+D FTLSKKPEIGG+KT +E+END          TVD K +N I+DLYIL+RPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF
        +SEETE  SS+ ENG  IDY ++GLQ HEPSD++Y+ENPAA SE F+DILDSTI++S KATLLGKP+RVD SS ET KL+REEAST ETD+NGA+E  +F
Subjt:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF

Query:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP
        SAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPS YKQNLGTIGS+  G+Q F STR 
Subjt:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP

Query:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI
        D EIDVK+GGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKL+FS+RPKEREELVEKKRSLM TLQVGDVVKCCIKKIAYFGIFVEI
Subjt:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI

Query:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        EGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH P DGRL+S EVDTE
Subjt:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

KAE8647864.1 hypothetical protein Csa_000384 [Cucumis sativus]

0.0e+00

86.38

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFFTPIDLLRPRR AVRNLCFNGRPS+FSVL+SKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNLVRPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPT YNEDDVEDKPSRIRMKPNLSLKMS  STKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN ASK  TSDR+D FTLSKKPEIGG++TR+E+E+D+          VD K +N I+DLYILKRPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQP-HEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAEN
        +SEETE  SS+ ENG  IDY A+GLQ  HEPSD++Y+ENPAA SE FSDILD TI+ S KATLLGKP+RVD SS ET KL+REE ST ETD+NGA E EN
Subjt:  MSEETEEASSSKENGIVIDYFALGLQP-HEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAEN

Query:  FSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTR
        FSAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSD GSQ F STR
Subjt:  FSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTR

Query:  PDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVE
        PD EIDVK+GGELTPDMKLEDLLQIY++EKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKER++LV+KKRSLM TLQVGDVVKCCIKKIAYFGIFVE
Subjt:  PDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVE

Query:  IEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        IEGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH P DGRL+S E+DTE
Subjt:  IEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

XP_008437232.1 PREDICTED: uncharacterized protein LOC103482723 isoform X2 [Cucumis melo]

0.0e+00

85.69

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFF PIDLLRPRR AVRNLCFNGR S+FSVLASKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKS+E
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNL+RPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPTIYNEDDVEDKPSR+RMKPNLSLKMS   TKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN+ASKGS+SDR+D FTLSKKPEIGG+KT +E+END          TVD K +N I+DLYIL+RPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF
        +SEETE  SS+ ENG  IDY ++GLQ HEPSD++Y+ENPAA SE F+DILDSTI++S KATLLGKP+RVD SS ET KL+REEAST ETD+NGA+E  +F
Subjt:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF

Query:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP
        SAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPS YKQNLGTIGSS  GSQ F STR 
Subjt:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP

Query:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI
        D EIDVK+GGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKV VVLANRKSRKL+FS+RPKEREELVEKKRSLM TLQVGDVVKCCIKKIAYFGIFVEI
Subjt:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI

Query:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTEVFV
        EGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH   DGRL+S EVDTEVF+
Subjt:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTEVFV

XP_011654764.1 uncharacterized protein LOC101217667 [Cucumis sativus]

0.0e+00

86.38

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFFTPIDLLRPRR AVRNLCFNGRPS+FSVL+SKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNLVRPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPT YNEDDVEDKPSRIRMKPNLSLKMS  STKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN ASK  TSDR+D FTLSKKPEIGG++TR+E+E+D+          VD K +N I+DLYILKRPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQP-HEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAEN
        +SEETE  SS+ ENG  IDY A+GLQ  HEPSD++Y+ENPAA SE FSDILD TI+ S KATLLGKP+RVD SS ET KL+REE ST ETD+NGA E EN
Subjt:  MSEETEEASSSKENGIVIDYFALGLQP-HEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAEN

Query:  FSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTR
        FSAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSD GSQ F STR
Subjt:  FSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTR

Query:  PDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVE
        PD EIDVK+GGELTPDMKLEDLLQIY++EKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKER++LV+KKRSLM TLQVGDVVKCCIKKIAYFGIFVE
Subjt:  PDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVE

Query:  IEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        IEGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH P DGRL+S E+DTE
Subjt:  IEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

XP_022159776.1 uncharacterized protein LOC111026097 isoform X1 [Momordica charantia]

0.0e+00

85.53

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFFT IDLLRPRRGAVRNLC NGRPSRFSVLASKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNL+RPQLKK+MKLKA  KPP  D+KK SQAVAK AVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSL M+ G TKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTS+E I++KEK SGDE VDI +NI++QASKGS+SD VD FTLSKKPEI G++ R+ NEND KNL YSE  T+D K EN IE+LYILKRPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEA--STLETDINGAVEAE
         S ETEEA+SS EN   ID FAL LQPHEPS+M+Y E+PAA SEPFSDILD ++KLS +A LLGKP+R+D  SNETLKLS EEA  +T ETD+N AVE +
Subjt:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEA--STLETDINGAVEAE

Query:  NFSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPST
        NFSAIPAL+EHELADWT+AEDL K GDRA+VEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGS+D+GSQNF ST
Subjt:  NFSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPST

Query:  RPDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFV
        RPD E DVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVL NRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFV
Subjt:  RPDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFV

Query:  EIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        EIEGVPAL+HQTE+SWDATLNPAS++KIGQVVEAKVHQLDFSLERIFLSLKQITPDPL E LESVV DH P DGRLE  EVDTE
Subjt:  EIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KKL1 S1 motif domain-containing protein

0.0e+00

86.38

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFFTPIDLLRPRR AVRNLCFNGRPS+FSVL+SKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNLVRPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPT YNEDDVEDKPSRIRMKPNLSLKMS  STKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN ASK  TSDR+D FTLSKKPEIGG++TR+E+E+D+          VD K +N I+DLYILKRPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQP-HEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAEN
        +SEETE  SS+ ENG  IDY A+GLQ  HEPSD++Y+ENPAA SE FSDILD TI+ S KATLLGKP+RVD SS ET KL+REE ST ETD+NGA E EN
Subjt:  MSEETEEASSSKENGIVIDYFALGLQP-HEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAEN

Query:  FSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTR
        FSAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSD GSQ F STR
Subjt:  FSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTR

Query:  PDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVE
        PD EIDVK+GGELTPDMKLEDLLQIY++EKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKER++LV+KKRSLM TLQVGDVVKCCIKKIAYFGIFVE
Subjt:  PDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVE

Query:  IEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        IEGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH P DGRL+S E+DTE
Subjt:  IEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

A0A1S3AU26 uncharacterized protein LOC103482723 isoform X2

0.0e+00

85.69

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFF PIDLLRPRR AVRNLCFNGR S+FSVLASKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKS+E
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNL+RPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPTIYNEDDVEDKPSR+RMKPNLSLKMS   TKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN+ASKGS+SDR+D FTLSKKPEIGG+KT +E+END          TVD K +N I+DLYIL+RPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF
        +SEETE  SS+ ENG  IDY ++GLQ HEPSD++Y+ENPAA SE F+DILDSTI++S KATLLGKP+RVD SS ET KL+REEAST ETD+NGA+E  +F
Subjt:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF

Query:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP
        SAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPS YKQNLGTIGSS  GSQ F STR 
Subjt:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP

Query:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI
        D EIDVK+GGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKV VVLANRKSRKL+FS+RPKEREELVEKKRSLM TLQVGDVVKCCIKKIAYFGIFVEI
Subjt:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI

Query:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTEVFV
        EGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH   DGRL+S EVDTEVF+
Subjt:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTEVFV

A0A1S3AU41 uncharacterized protein LOC103482723 isoform X1

0.0e+00

85.78

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFF PIDLLRPRR AVRNLCFNGR S+FSVLASKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKS+E
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNL+RPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPTIYNEDDVEDKPSR+RMKPNLSLKMS   TKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN+ASKGS+SDR+D FTLSKKPEIGG+KT +E+END          TVD K +N I+DLYIL+RPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF
        +SEETE  SS+ ENG  IDY ++GLQ HEPSD++Y+ENPAA SE F+DILDSTI++S KATLLGKP+RVD SS ET KL+REEAST ETD+NGA+E  +F
Subjt:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF

Query:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP
        SAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPS YKQNLGTIGSS  GSQ F STR 
Subjt:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP

Query:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI
        D EIDVK+GGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKV VVLANRKSRKL+FS+RPKEREELVEKKRSLM TLQVGDVVKCCIKKIAYFGIFVEI
Subjt:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI

Query:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        EGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH   DGRL+S EVDTE
Subjt:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

A0A5A7THK9 Protein MLP1

0.0e+00

85.78

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFF PIDLLRPRR AVRNLCFNGR S+FSVLASKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKS+E
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNL+RPQLKKEMKLKA NKPP PD+KK SQAV K  VSPKGRVPNVILRKPTIYNEDDVEDKPSR+RMKPNLSLKMS   TKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTSNEVIDE EKLSGD  VD VENIEN+ASKGS+SDR+D FTLSKKPEIGG+KT +E+END          TVD K +N I+DLYIL+RPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF
        +SEETE  SS+ ENG  IDY ++GLQ HEPSD++Y+ENPAA SE F+DILDSTI++S KATLLGKP+RVD SS ET KL+REEAST ETD+NGA+E  +F
Subjt:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENF

Query:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP
        SAIPALEEHELADWTKAEDL KSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPS YKQNLGTIGS+  G+Q F STR 
Subjt:  SAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRP

Query:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI
        D EIDVK+GGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKL+FS+RPKEREELVEKKRSLM TLQVGDVVKCCIKKIAYFGIFVEI
Subjt:  DPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEI

Query:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        EGVPALIHQTEISWD  LNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDH P DGRL+S EVDTE
Subjt:  EGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

A0A6J1E4Z1 uncharacterized protein LOC111026097 isoform X1

0.0e+00

85.53

Show/hide

Query:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
        MDGRALTASSFFT IDLLRPRRGAVRNLC NGRPSRFSVLASKEEAELD+WDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE
Subjt:  MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNE

Query:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR
        VEELSLDGLNL+RPQLKK+MKLKA  KPP  D+KK SQAVAK AVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSL M+ G TKEKYSDMTLLR
Subjt:  VEELSLDGLNLVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLR

Query:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG
        KPEPMTS+E I++KEK SGDE VDI +NI++QASKGS+SD VD FTLSKKPEI G++ R+ NEND KNL YSE  T+D K EN IE+LYILKRPLNVMSG
Subjt:  KPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSG

Query:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEA--STLETDINGAVEAE
         S ETEEA+SS EN   ID FAL LQPHEPS+M+Y E+PAA SEPFSDILD ++KLS +A LLGKP+R+D  SNETLKLS EEA  +T ETD+N AVE +
Subjt:  MSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEA--STLETDINGAVEAE

Query:  NFSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPST
        NFSAIPAL+EHELADWT+AEDL K GDRA+VEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGS+D+GSQNF ST
Subjt:  NFSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPST

Query:  RPDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFV
        RPD E DVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVL NRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFV
Subjt:  RPDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFV

Query:  EIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE
        EIEGVPAL+HQTE+SWDATLNPAS++KIGQVVEAKVHQLDFSLERIFLSLKQITPDPL E LESVV DH P DGRLE  EVDTE
Subjt:  EIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTDGRLESPEVDTE

SwissProt top hits

e value

%identity

Alignment

Q49XT0 30S ribosomal protein S1

6.3e-14

33.8

Show/hide

Query:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV
        I+  S F GQ +K+ V   +  + ++I S +  E  E  EKK  L+ +L  GDV++  + ++  FG FV+I GV  L+H +E+S +   +P     IG+ 
Subjt:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV

Query:  VEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTD
        V  K+  +D   ERI LS+K   P P     ES+ G+    D
Subjt:  VEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTD

Q4L6I1 30S ribosomal protein S1

6.3e-14

34.51

Show/hide

Query:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV
        I+  S F GQ I++ V   + ++ ++I S +  E+ E   KK SL+ +L  GDV+K  + ++  FG FV+I GV  L+H +E+S +   +P     +GQ 
Subjt:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV

Query:  VEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTD
        V+ KV  ++   ERI LS+K   P P     ES+ G     D
Subjt:  VEAKVHQLDFSLERIFLSLKQITPDPLAEALESVVGDHGPTD

Q5HFU7 30S ribosomal protein S1

1.8e-13

34.92

Show/hide

Query:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV
        I+  S F GQ I++ V   + ++ ++I S +  E+EE   KK  L+ +L  GDV+   + ++  FG F++I GV  L+H +E+S +    P     IGQ 
Subjt:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV

Query:  VEAKVHQLDFSLERIFLSLKQITPDP
        V+ K+  +D   ERI LS+K   P P
Subjt:  VEAKVHQLDFSLERIFLSLKQITPDP

Q99U14 30S ribosomal protein S1

1.8e-13

34.92

Show/hide

Query:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV
        I+  S F GQ I++ V   + ++ ++I S +  E+EE   KK  L+ +L  GDV+   + ++  FG F++I GV  L+H +E+S +    P     IGQ 
Subjt:  IKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQV

Query:  VEAKVHQLDFSLERIFLSLKQITPDP
        V+ K+  +D   ERI LS+K   P P
Subjt:  VEAKVHQLDFSLERIFLSLKQITPDP

Q9JZ44 30S ribosomal protein S1

8.8e-16

32.58

Show/hide

Query:  IYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASY
        + D   +K  S F G++I+  V+  ++K   ++ S R      L E++++L+  LQ G V+K  +K I  +G FV++ G+  L+H T+++W    +P+  
Subjt:  IYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASY

Query:  FKIGQVVEAKVHQLDFSLERIFLSLKQITPDP
         ++GQ VEAKV + D   +R+ L +KQ+  DP
Subjt:  FKIGQVVEAKVHQLDFSLERIFLSLKQITPDP

Arabidopsis top hits

e value

%identity

Alignment

AT1G12800.1 Nucleic acid-binding, OB-fold-like protein

2.1e-161

50.93

Show/hide

Query:  ALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASK-EEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNEVEE
        A  A  F +    +R RR     L    +  +F V ASK EE +L++WDQMEL FGRL+GEDPKLTLAKI+++K++P+AS++++EKSFY+ KGK  EVEE
Subjt:  ALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASK-EEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNEVEE

Query:  L--------------SLDGLNLVRPQLKKEMKL-KAVNKPPAPDLKK-LSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRG
        +              SLDGL LV+P LK  +K  + V K P+P LKK L +AVA P V    R+PNVILRKP+ +   + +D+ S++R+KPNL+LKM   
Subjt:  L--------------SLDGLNLVRPQLKKEMKL-KAVNKPPAPDLKK-LSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRG

Query:  STKEKYSDMTLLRKPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENE-NDLKNLDYSEIGTVDDKNENDIE
           E++SDMTLLRKPEP+  + V +E++K   D+       +E    +G T  +   +TL +KPE   +   VE E  D   ++ SEI        N I+
Subjt:  STKEKYSDMTLLRKPEPMTSNEVIDEKEKLSGDENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENE-NDLKNLDYSEIGTVDDKNENDIE

Query:  DLYILKRPLNVMSGMSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLS-NKATLLGKPKRVDDSSNETLKLSREEAS
                 N+   +++     SS  EN  +     L       S+M   E    +S+P   I    I  +  +A+L GKP+R+D SS E    +  + S
Subjt:  DLYILKRPLNVMSGMSEETEEASSSKENGIVIDYFALGLQPHEPSDMEYIENPAASSEPFSDILDSTIKLS-NKATLLGKPKRVDDSSNETLKLSREEAS

Query:  TLETDINGAVEAENFSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTI
         +  +  G   +      P     E  DW KAE LVK+  RADVE+ISSSTRGF VS+GSL+GF+PYRNLAAKWKFLAFESWLR+KG+DPS Y+QNLG I
Subjt:  TLETDINGAVEAENFSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTI

Query:  GSSDAGSQN-FPSTRPDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVV
        G  D  S++  P +  D E+     GE++ DMKLEDLL +YDREK KFLSSFVGQKIKVNVV+ANR SRKLIFS+RP+E EE VEKKR+LMA L+VGDVV
Subjt:  GSSDAGSQN-FPSTRPDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVV

Query:  KCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVV-GDHGPTDGRLESPEVDTE
        KCCIKKI YFGIF E+EGVPAL+HQ+E+SWDATL+PASYFKIGQ+VEAKVHQLDF+LERIFLSLK+ITPDPL EALESVV GD+    GRL++ E+D E
Subjt:  KCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVV-GDHGPTDGRLESPEVDTE

AT3G23700.1 Nucleic acid-binding proteins superfamily

3.0e-11

25.1

Show/hide

Query:  ADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRPDPEIDVKNGGE
        +DW  A+   KSGD  + EV   +  G ++ F SLVGF+PY  L+                                             P    K    
Subjt:  ADWTKAEDLVKSGDRADVEVISSSTRGFVVSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRPDPEIDVKNGGE

Query:  LTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIE------GVPA
          P   + ++ +           + VG K+ V VV A+ ++RKLI S    E+  L  K       + VGDV    +  +  +G F+ +        +  
Subjt:  LTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIE------GVPA

Query:  LIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVV
        L+H +E+SWD   +     + G  V   V  +D    RI LS+KQ+  DPL E L+ V+
Subjt:  LIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEALESVV

AT5G30510.1 ribosomal protein S1

1.6e-04

24.79

Show/hide

Query:  QKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLD
        ++I +  V  + +  KL+ S R    +          A L +G VV   ++ +  +G F++I G+  L+H ++IS D   + A+  + G  ++  +   D
Subjt:  QKIKVNVVLANRKSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLD

Query:  FSLERIFLSLKQITPDP
            R+ LS K++ P P
Subjt:  FSLERIFLSLKQITPDP

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

mRNA sequence

Show/hide mRNA sequence

ATGGACGGTCGTGCTCTAACGGCCTCCTCCTTCTTCACCCCCATTGATTTATTGCGACCCAGAAGAGGAGCTGTTAGAAATCTGTGTTTTAATGGCAGACCCAGTAGGTT
TTCGGTTCTTGCTTCCAAAGAAGAGGCTGAGCTCGACCAGTGGGACCAAATGGAGCTCAAGTTCGGGCGCTTGATTGGGGAAGACCCCAAATTAACATTGGCCAAGATAA
TGAGCAAAAAAATGAATCCTGATGCTTCTTATCTTGAAGTTGAAAAATCATTTTACCAGAAGAAGGGTAAGTCCAACGAGGTTGAGGAACTTTCCCTTGATGGTTTGAAT
TTGGTCAGACCTCAGTTAAAGAAGGAAATGAAGTTAAAAGCTGTCAATAAGCCACCAGCACCAGATTTAAAGAAACTCAGCCAAGCAGTTGCAAAGCCAGCAGTTAGTCC
TAAAGGTAGGGTTCCCAATGTTATTTTGAGGAAACCAACGATTTATAATGAGGATGATGTTGAAGATAAGCCGTCAAGGATAAGAATGAAGCCAAATTTATCATTGAAAA
TGAGCCGTGGATCAACAAAGGAGAAATATAGTGATATGACACTGTTGAGGAAGCCGGAACCAATGACTTCAAATGAAGTTATTGATGAGAAGGAAAAGCTCTCTGGTGAT
GAGAATGTTGATATTGTTGAGAATATTGAAAATCAGGCTAGTAAGGGATCAACAAGTGACCGAGTTGATGGCTTTACTCTTTCTAAGAAGCCAGAAATAGGAGGTGAAAA
AACAAGAGTTGAAAATGAAAATGATCTTAAAAATCTTGATTATTCAGAAATTGGTACTGTTGATGATAAAAATGAAAATGACATTGAAGACTTGTACATCCTAAAAAGGC
CTTTAAATGTGATGTCTGGCATGTCTGAAGAAACTGAAGAAGCCTCATCATCAAAGGAAAACGGGATAGTAATTGATTATTTTGCTCTAGGATTACAGCCTCATGAGCCA
AGTGATATGGAATATATTGAGAACCCAGCAGCTTCCAGCGAACCATTTAGTGATATTTTGGATTCAACAATAAAGTTATCCAACAAAGCTACATTATTGGGTAAACCAAA
AAGAGTAGATGATTCTTCAAATGAAACATTAAAACTCAGTAGAGAAGAGGCCTCCACCCTTGAAACTGATATCAATGGTGCCGTTGAGGCAGAGAACTTCTCTGCTATCC
CTGCTTTGGAGGAACATGAACTTGCTGACTGGACTAAAGCAGAGGATCTGGTGAAGTCGGGAGACAGAGCTGATGTGGAAGTAATAAGCTCGAGTACCCGAGGGTTTGTT
GTATCATTCGGCTCCCTAGTAGGATTTATTCCATATCGTAATCTTGCTGCCAAGTGGAAGTTCTTAGCTTTTGAGTCATGGCTAAGACAGAAAGGTTTGGATCCATCAAT
ATACAAGCAGAACTTAGGAACTATTGGAAGTAGTGATGCTGGAAGCCAGAATTTTCCCAGTACTAGACCGGATCCAGAAATTGATGTAAAAAATGGGGGAGAGCTTACAC
CTGATATGAAATTGGAGGATCTTCTTCAAATATATGATCGGGAGAAAATCAAATTCTTGTCATCATTTGTTGGCCAGAAAATCAAAGTAAATGTGGTGTTGGCGAACAGA
AAATCAAGGAAGCTTATATTTTCCATAAGGCCAAAAGAAAGGGAAGAATTGGTCGAGAAAAAGAGGAGTTTAATGGCTACACTGCAAGTAGGTGATGTTGTCAAATGCTG
CATCAAGAAGATTGCTTATTTTGGTATCTTTGTCGAGATTGAAGGCGTGCCTGCTTTGATTCACCAGACAGAGATTTCCTGGGATGCTACTTTAAACCCTGCATCATACT
TTAAGATTGGTCAGGTTGTTGAGGCCAAAGTCCATCAGTTGGATTTTTCACTCGAACGCATATTCTTATCGTTAAAGCAGATTACTCCAGATCCGCTGGCTGAAGCATTG
GAGTCTGTGGTTGGTGATCATGGTCCCACGGATGGAAGATTGGAATCACCAGAAGTAGATACTGAGGTGTTTGTATTCTCTTGTTAGTCAAGTATTATAATGGGAGTGAT
TGGCGATTTAATCATGACTTATCATCAAACTAGCATCACCTTTTGGCCTTTATGAAAGTTTTACATGCATCCCTGCATGCCTAGTTTGCATGTTGCCTATATGTGGGAAG
AAGTTCAGGAAATATCTCCATCTACCCAAATATATCTCAAGTGTTTCGAACATTCTTACTGGTGTGTGAAACGTGCTAATACTAGAACATGCATCAATCCACCCAATAAT
TAAGATATTTATCTTCCCAATCCTTATCAAGGGAGCTTGAGTTCCATTTTTGCAAATTAAATCTGGAAAACCATCAAATCTTCATAAACCTTATGAACACTTGGAAAATA
AATTTTGCTTTATAGCACGTTTATTTCCTTGTTTGACAATATGCATACAATGAGTAGAATGAAACATAGCTGATTTAACTGAATGTGCAATATCGTTTTTCTCATTTGAC
TTTTTTCAGAAATCATTAAATGGTTTTTCATTACAAGTTCTATTTTGGACAGTGGGCTGATGTAGAATCTCTCATCAAGGAACTGCAAAATATTGAAGGTATTGAGGCTG
TATCCAAAGGGCGATTTTTCCTTAGCCCTGGCTTGGCTCCAACCTTTCAGGTTTATATGGCTTCTATGTATGAAAATCAGTACAAATTACTTGCTAGATCTGGAAACAAA
GTACAAGAGCTGATGGTTCAGACATCATTAGAAAAAGAAACAGTGAAATCTGTTATCTTAACTTGCACCAACAGGGTAGAGTAGCAGTTTCTTAAGTTTCTGAAGCTTTT
GCTTTGAAGGAAGATTTGATTGTTCAAGGCACATAAAACAAGCAGCATTAGAACTGATCTTCTGAATTAGAAGAATAGGAAAATAGTTCTCTTCCACTTTGCTTCACAGT
GAGAAGAATCCTTTGTACTTTTCGTTTTTGTTTTTTTGCCCAATCTCTTGTGGGGAAGCAGAAGGAACTTAGCTACTGTTGATTAAAATCCAACCACATCATTATATTTT
TCTTCACTCAATAGAAATTCAACATCTTTTTCACTGTAAACCTGTAGTTGGTTAAATGTGTAGTTTGGAGCAGTCCTTAAAAACCTGGTCTAAAAATTCAAACCTATTTT
TGTTAAAGTGTTGATGTAATTAAATTTGCCATAGCCTATAAATTTAGGCTTTTGGGTTGATTGGTGGTTTAACATGATATCAAAATAGGAG

Protein sequence

Show/hide protein sequence

MDGRALTASSFFTPIDLLRPRRGAVRNLCFNGRPSRFSVLASKEEAELDQWDQMELKFGRLIGEDPKLTLAKIMSKKMNPDASYLEVEKSFYQKKGKSNEVEELSLDGLN
LVRPQLKKEMKLKAVNKPPAPDLKKLSQAVAKPAVSPKGRVPNVILRKPTIYNEDDVEDKPSRIRMKPNLSLKMSRGSTKEKYSDMTLLRKPEPMTSNEVIDEKEKLSGD
ENVDIVENIENQASKGSTSDRVDGFTLSKKPEIGGEKTRVENENDLKNLDYSEIGTVDDKNENDIEDLYILKRPLNVMSGMSEETEEASSSKENGIVIDYFALGLQPHEP
SDMEYIENPAASSEPFSDILDSTIKLSNKATLLGKPKRVDDSSNETLKLSREEASTLETDINGAVEAENFSAIPALEEHELADWTKAEDLVKSGDRADVEVISSSTRGFV
VSFGSLVGFIPYRNLAAKWKFLAFESWLRQKGLDPSIYKQNLGTIGSSDAGSQNFPSTRPDPEIDVKNGGELTPDMKLEDLLQIYDREKIKFLSSFVGQKIKVNVVLANR
KSRKLIFSIRPKEREELVEKKRSLMATLQVGDVVKCCIKKIAYFGIFVEIEGVPALIHQTEISWDATLNPASYFKIGQVVEAKVHQLDFSLERIFLSLKQITPDPLAEAL
ESVVGDHGPTDGRLESPEVDTEVFVFSC

Tan0013697 (gene) of Snake gourd v1 genome