CuGenDBv2

Gene ID	Sgr019887
Organism	Siraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Description	Protein of Unknown Function (DUF239)
Genome location	tig00153424:800725..808553
RNA-Seq Expression	Sgr019887
Synteny	Sgr019887
Gene Ontology terms	NA
InterPro domains	IPR004314 - Neprosin IPR025521 - Neprosin activation peptide

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6590299.1 hypothetical protein SDJN03_15722, partial [Cucurbita argyrosperma subsp. sororia]

3.9e-197

84.41

Show/hide

Query:  LLLYPLFLS---LVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENE
        LL + LFLS   L++QRF +VC LN++ KQVSSLRL+RIQRHLD INKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ KK KENE
Subjt:  LLLYPLFLS---LVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENE

Query:  VKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVW
            DG   R GSGAGG +QTWRVNGTRCPKG+IPVRR+T +DVLRAKS+FD+GKK+RPILLDR+IDAPD+VSGNGHEHAIAYT  S EMYGAKATINVW
Subjt:  VKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVW

Query:  DPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILI
        DPSIQVVNEFSLSQ+WI+SGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLC+GFVQTN+K+AIGAAISP+SSFSGSQYDITILI
Subjt:  DPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILI

Query:  WKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNC
        WKDPKLG+WWMGFGDNTLVGYWPAELFTHL DHATMVEWGGEVVNSRA G+HTSTQMGSG FP+DGFGKASYFRNLE+VDSDNSLSAVQ+IS +AENTNC
Subjt:  WKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNC

Query:  YNIM
        YNIM
Subjt:  YNIM

XP_008443756.1 PREDICTED: uncharacterized protein LOC103487273 [Cucumis melo]

3.2e-199

84.69

Show/hide

Query:  VSSALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKEN
        +S+ L    +F  +V QRFT+VC LNYTY+++SSLRL+RIQRHLD+INKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ K +KEN
Subjt:  VSSALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKEN

Query:  EVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINV
        + + G+   RR GSGA  A+QTWRVNGTRCPKGTIPVRRTT  DVLR+KSLFDFGKKRRPILLDR+IDAPDVVSGNGHEHAIAYTG+S+EMYGAKATINV
Subjt:  EVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINV

Query:  WDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITIL
        WDPSIQ+VNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLCAGFVQTNSK+AIGAAISPISS SGSQYDITIL
Subjt:  WDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITIL

Query:  IWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTN
        IWKDPKLGNWWMGFG+NTLVGYWPAELFTHLADHATMVEWGGEVVNSR  G+HTSTQMGSG FP+DGF KASYFRNLE+VDSDNSLS VQ+IS +AENTN
Subjt:  IWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTN

Query:  CYNIM
        CYNIM
Subjt:  CYNIM

XP_022151674.1 uncharacterized protein LOC111019590 [Momordica charantia]

1.0e-210

88.19

Show/hide

Query:  MGCGKRGVSS--ALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAER
        MGCGKR   S   L L    + +V +RF++V  LNYTYKQVSSLRL+RIQRHLDNINKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E 
Subjt:  MGCGKRGVSS--ALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAER

Query:  PRMKKMKE-NEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQE
        PR+KKMKE NEVKDGDGS  R GSGAGGAWQTWRVNGTRCPKG+IPVRR+T +DVLRAKSLFDFGKKRRPILLDR++DAPDVVSGNGHEHAIAYTG+SQE
Subjt:  PRMKKMKE-NEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQE

Query:  MYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSF
        MYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLCAGFVQTNSK+AIGAAISPISSF
Subjt:  MYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSF

Query:  SGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQ
        +GSQYD+TILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHL DHATMVEWGGEVVNS+ARGEHTSTQMGSGRF E+GFGKASYFRNLE+VDSDNSLSAVQ
Subjt:  SGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQ

Query:  EISTLAENTNCYNIM
        EISTLAEN +CYNIM
Subjt:  EISTLAENTNCYNIM

XP_038878455.1 uncharacterized protein LOC120070684 isoform X1 [Benincasa hispida]

2.0e-201

86.73

Show/hide

Query:  LLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLT-------IQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMK
        LL+ L L L+LQRFT+VC LNYTYKQVSSLRLERIQRHLD+INKP LLT       IQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ KK+ 
Subjt:  LLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLT-------IQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMK

Query:  ENEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATI
        EN  ++G+ SGR  GSGAGGA QTWRVNGTRCPKG+IPVRR+T +DVLR+KSLFDFGKK+RPILLDRRIDAPDVVSGNGHEHAIAYT +S+EMYGAKATI
Subjt:  ENEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATI

Query:  NVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDIT
        NVWDPSIQ+VNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLCAGFVQTN+K+AIGAAISPISSFSGSQYDIT
Subjt:  NVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDIT

Query:  ILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAEN
        ILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRA G+HTSTQMGSG FP+DGFGKASYFRNLE+VDSDNSLSAVQ+IS +AEN
Subjt:  ILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAEN

Query:  TNCYNIM
        TNCYNIM
Subjt:  TNCYNIM

XP_038878456.1 uncharacterized protein LOC120070684 isoform X2 [Benincasa hispida]

1.6e-203

88.25

Show/hide

Query:  LLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDG
        LL+ L L L+LQRFT+VC LNYTYKQVSSLRLERIQRHLD+INKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ KK+ EN  ++G
Subjt:  LLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDG

Query:  DGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSI
        + SGR  GSGAGGA QTWRVNGTRCPKG+IPVRR+T +DVLR+KSLFDFGKK+RPILLDRRIDAPDVVSGNGHEHAIAYT +S+EMYGAKATINVWDPSI
Subjt:  DGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSI

Query:  QVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDP
        Q+VNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLCAGFVQTN+K+AIGAAISPISSFSGSQYDITILIWKDP
Subjt:  QVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDP

Query:  KLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNIM
        KLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRA G+HTSTQMGSG FP+DGFGKASYFRNLE+VDSDNSLSAVQ+IS +AENTNCYNIM
Subjt:  KLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNIM

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LXY9 Uncharacterized protein

2.3e-195

Show/hide

Query:  VSSALLLYPLFLSLVLQRFTVVCSLNYTY-KQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKE
        +S+ L    +F  ++ QRFT+VC LNYTY K +SSLRL+RIQRHLD+INKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ K  KE
Subjt:  VSSALLLYPLFLSLVLQRFTVVCSLNYTY-KQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKE

Query:  NEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATIN
        N+    + S RR GSGA  ++QTWRVNGTRCPKGT+PVRRTT  DVLR+KSLFDFGKK+RPILLDR+IDAPDVVSGNGHEHAIAYTG+S+EMYGAKATIN
Subjt:  NEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATIN

Query:  VWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITI
        VWDPSI++VNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLC+GFVQTNSK+AIGAAISPISS +GSQYDITI
Subjt:  VWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITI

Query:  LIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENT
        LIWKDPKLGNWWMGFG+NTLVGYWPAELFTHLADHATMVEWGGEVVNSR  G+HTSTQMGSG FP+DGF KASYFRNLE+VDSDNSLS+VQ+IS +AENT
Subjt:  LIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENT

Query:  NCYNIM
        NCYNIM
Subjt:  NCYNIM

A0A1S3B8R5 uncharacterized protein LOC103487273

1.5e-199

84.69

Show/hide

Query:  VSSALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKEN
        +S+ L    +F  +V QRFT+VC LNYTY+++SSLRL+RIQRHLD+INKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ K +KEN
Subjt:  VSSALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKEN

Query:  EVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINV
        + + G+   RR GSGA  A+QTWRVNGTRCPKGTIPVRRTT  DVLR+KSLFDFGKKRRPILLDR+IDAPDVVSGNGHEHAIAYTG+S+EMYGAKATINV
Subjt:  EVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINV

Query:  WDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITIL
        WDPSIQ+VNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLCAGFVQTNSK+AIGAAISPISS SGSQYDITIL
Subjt:  WDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITIL

Query:  IWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTN
        IWKDPKLGNWWMGFG+NTLVGYWPAELFTHLADHATMVEWGGEVVNSR  G+HTSTQMGSG FP+DGF KASYFRNLE+VDSDNSLS VQ+IS +AENTN
Subjt:  IWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTN

Query:  CYNIM
        CYNIM
Subjt:  CYNIM

A0A6J1DDR6 uncharacterized protein LOC111019590

5.1e-211

88.19

Show/hide

Query:  MGCGKRGVSS--ALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAER
        MGCGKR   S   L L    + +V +RF++V  LNYTYKQVSSLRL+RIQRHLDNINKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E 
Subjt:  MGCGKRGVSS--ALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAER

Query:  PRMKKMKE-NEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQE
        PR+KKMKE NEVKDGDGS  R GSGAGGAWQTWRVNGTRCPKG+IPVRR+T +DVLRAKSLFDFGKKRRPILLDR++DAPDVVSGNGHEHAIAYTG+SQE
Subjt:  PRMKKMKE-NEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQE

Query:  MYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSF
        MYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLCAGFVQTNSK+AIGAAISPISSF
Subjt:  MYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSF

Query:  SGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQ
        +GSQYD+TILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHL DHATMVEWGGEVVNS+ARGEHTSTQMGSGRF E+GFGKASYFRNLE+VDSDNSLSAVQ
Subjt:  SGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQ

Query:  EISTLAENTNCYNIM
        EISTLAEN +CYNIM
Subjt:  EISTLAENTNCYNIM

A0A6J1HAZ7 uncharacterized protein LOC111461698

2.4e-197

84.41

Show/hide

Query:  LLLYPLFLS---LVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENE
        LL + LFLS   L++QRF +VC LN++ KQVSSLRL+RIQRHLD INKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ KK+KENE
Subjt:  LLLYPLFLS---LVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENE

Query:  VKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVW
            DG   R GSGAGG +QTWRVNGTRCPKG+IPVRR+T +DVLR KS+FD+GKK+RPILLDR+IDAPDVVSGNGHEHAIAYT  S EMYGAKATINVW
Subjt:  VKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVW

Query:  DPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILI
        DPSIQVVNEFSLSQ+WI+SGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLC+GFVQTN+K+AIGAAISP+SSFSGSQYDITILI
Subjt:  DPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILI

Query:  WKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNC
        WKDPKLG+WWMGFGDNTLVGYWPAELFTHL DHATMVEWGGEVVNSRA G+HTSTQMGSG FP+DGFGKASYFRNLE+VDSDNSLSAVQ+IS +AENTNC
Subjt:  WKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNC

Query:  YNIM
        YNIM
Subjt:  YNIM

A0A6J1JIQ1 uncharacterized protein LOC111485460

1.2e-196

84.75

Show/hide

Query:  LLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDG
        L + LFL L++QRF +VC LN++ KQVSSLRL+RIQRHLD INKP LLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQR P E P+ KK+KENE    
Subjt:  LLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDG

Query:  DGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSI
        DG   R GSGAGG +QTWRVNGTRCPKG+IPVRR+T +DVLRAKS+FD+GKK+RPILLDR+IDAPDVVSGNGHEHAIAYT  S EMYGAKATINVWDPSI
Subjt:  DGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSI

Query:  QVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDP
        QVVNEFSLSQ+WI+SGSFDGSDLNSIEAGWQVSPELYGD++PRLFTYWTSDAYQATGCYNLLC+GFVQTN+K+AIGAAISP+SSFSGSQYDITILIWKDP
Subjt:  QVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDP

Query:  KLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNIM
        KLG+WWMGFGDNTLVGYWPAELFTHL DHATMVEWGGEVVNSRA G+HTSTQMGSG FP+DGFGKASYFRNLE+VDSDNSLS VQ+IS +AENTNCYNIM
Subjt:  KLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNIM

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G10750.1 Protein of Unknown Function (DUF239)

1.3e-121

56.82

Show/hide

Query:  LFLSLVL--QRFTVVCS-----LNYTYKQVSSL-RLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENE
        LFLSL+L    F+ V S      N T + +  L +L+ I +HL  INKP++ TI SPDGDIIDCV    QPA DHP L+  K   +P ERPR        
Subjt:  LFLSLVL--QRFTVVCS-----LNYTYKQVSSL-RLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENE

Query:  VKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVW
             G  RRG      ++Q W + G  CP+GT+P+RRT + D+LRA S+  FGKK R    D         S NGHEHA+ Y  + ++ YGAKA+INVW
Subjt:  VKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVW

Query:  DPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILI
         P +Q   EFSLSQIWI+SGSF G+DLN+IEAGWQVSPELYGD  PR FTYWT+DAYQATGCYNLLC+GFVQTNS++AIGAAISP SS+ G Q+DIT+LI
Subjt:  DPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILI

Query:  WKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNC
        WKDPK GNWW+ FG   LVGYWP+ LFTHL +HA+MV++GGE+VNS   G HTSTQMGSG F E+GF K+SYFRN++VVD DN+L     +  LA++ NC
Subjt:  WKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNC

Query:  YNI
        Y+I
Subjt:  YNI

AT1G55360.1 Protein of Unknown Function (DUF239)

6.1e-124

56.69

Show/hide

Query:  SLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDGDGSGRRGGSGAGGAWQTW
        SL+Y  +   S +   +++HL+ +NKPA+ +IQS DGD+IDCV   KQPA DHP LK+HKIQ +P   P      E    D   S  +     G   Q W
Subjt:  SLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDGDGSGRRGGSGAGGAWQTW

Query:  RVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSIQVVNEFSLSQIWILSGSF
           G +C +GTIP+RRT + DVLRA S+  +GKK+R  +   +   PD+++ +GH+HAIAY     + YGAKATINVW+P IQ  NEFSLSQIW+L GSF
Subjt:  RVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSIQVVNEFSLSQIWILSGSF

Query:  DGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDPKLGNWWMGFGDNTLVGYW
         G DLNSIEAGWQVSP+LYGD   RLFTYWTSDAYQATGCYNLLC+GF+Q NS +A+GA+ISP+S +  SQYDI+ILIWKDPK G+WWM FG+  ++GYW
Subjt:  DGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDPKLGNWWMGFGDNTLVGYW

Query:  PAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNI
        P+ LF++L + A+M+EWGGEVVNS++ G+HTSTQMGSG+FPE+GF KASYFRN++VVD  N+L A + + T  E +NCY++
Subjt:  PAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNI

AT5G18460.1 Protein of Unknown Function (DUF239)

3.9e-171

72.03

Show/hide

Query:  ALLLYPLFLSLVL-QRFTVVCSLNYT--YKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKEN
        +LLL+ L +SL L Q+   + + N T  Y+QVSSLRL RIQ+HL+ INK  + TIQSPDGD+IDCV KRKQPALDHPLLK+HKIQ+ P + P+MK  K++
Subjt:  ALLLYPLFLSLVL-QRFTVVCSLNYT--YKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKEN

Query:  EVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINV
        +VK+ +       +   GAWQ W VNGTRCPKGT+P+RR T +DVLRAKSLFDFGKKRR I LD+R + PD +  NGHEHAIAYT +S E+YGAKATINV
Subjt:  EVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINV

Query:  WDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITIL
        WDP I+ VNEFSLSQIWILSGSF G DLNSIEAGWQVSPELYGD +PRLFTYWTSD+YQATGCYNLLC+GF+QTN+K+AIGAAISP+S+F G+Q+DITIL
Subjt:  WDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITIL

Query:  IWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTN
        IWKDPK+GNWWMG GD+TLVGYWPAELFTHLADHAT VEWGGEVVN+RA G HT+TQMGSG FP++GFGKASYFRNLEVVDSDNSL  V ++  LAENT 
Subjt:  IWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTN

Query:  CYNI
        CY+I
Subjt:  CYNI

AT5G56530.1 Protein of Unknown Function (DUF239)

1.1e-122

58.74

Show/hide

Query:  IQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRR
        + +HL+ +NKPA+ +IQSPDGDIIDCVH  KQPA DHP LK+HKIQ  P+  P      E++V +      +         Q W  NG  C +GTIPVRR
Subjt:  IQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRR

Query:  TTQSDVLRAKSLFDFGKKRR-PILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVS
        T + DVLRA S+  +GKK+   + L R  D PD+++ +GH+HAIAY     + YGAKATINVW+P +Q  NEFSLSQ+WIL GSF G DLNSIEAGWQVS
Subjt:  TTQSDVLRAKSLFDFGKKRR-PILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVS

Query:  PELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMV
        P+LYGD   RLFTYWTSDAYQATGCYNLLC+GF+Q NS++A+GA+ISP+S F   QYDI+I IWKDPK G+WWM FGD  ++GYWP+ LF++LAD A++V
Subjt:  PELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMV

Query:  EWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNI
        EWGGEVVN    G HT+TQMGSG+FP++GF KASYFRN++VVDS N+L   + ++T  E +NCY++
Subjt:  EWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNI

AT5G56530.2 Protein of Unknown Function (DUF239)

1.1e-122

58.74

Show/hide

Query:  IQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRR
        + +HL+ +NKPA+ +IQSPDGDIIDCVH  KQPA DHP LK+HKIQ  P+  P      E++V +      +         Q W  NG  C +GTIPVRR
Subjt:  IQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKENEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRR

Query:  TTQSDVLRAKSLFDFGKKRR-PILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVS
        T + DVLRA S+  +GKK+   + L R  D PD+++ +GH+HAIAY     + YGAKATINVW+P +Q  NEFSLSQ+WIL GSF G DLNSIEAGWQVS
Subjt:  TTQSDVLRAKSLFDFGKKRR-PILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSIQVVNEFSLSQIWILSGSFDGSDLNSIEAGWQVS

Query:  PELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMV
        P+LYGD   RLFTYWTSDAYQATGCYNLLC+GF+Q NS++A+GA+ISP+S F   QYDI+I IWKDPK G+WWM FGD  ++GYWP+ LF++LAD A++V
Subjt:  PELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDPKLGNWWMGFGDNTLVGYWPAELFTHLADHATMV

Query:  EWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNI
        EWGGEVVN    G HT+TQMGSG+FP++GF KASYFRN++VVDS N+L   + ++T  E +NCY++
Subjt:  EWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNI

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

TTAGTGAGAGAAATGGGTTGTGGAAAAAGAGGGGTTTCATCAGCTCTTCTTCTATATCCTTTGTTTCTCTCTCTAGTTCTTCAAAGATTCACTGTGGTTTGCAGCCTCAA
TTATACATATAAGCAAGTCAGTAGCTTGAGACTTGAAAGGATTCAAAGGCATTTGGACAACATTAACAAGCCTGCTCTTCTCACCATTCAGAGCCCAGATGGTGATATCA
TAGATTGTGTTCATAAAAGAAAACAGCCAGCTCTGGATCATCCCCTTTTGAAGAACCACAAGATTCAGAGAGAGCCAGCGGAGAGGCCGAGAATGAAGAAGATGAAAGAG
AATGAAGTAAAAGATGGCGATGGCAGTGGAAGGAGGGGAGGATCGGGTGCGGGAGGTGCATGGCAAACTTGGCGTGTGAATGGAACACGGTGTCCGAAGGGGACTATTCC
AGTGCGGCGCACCACACAGTCGGACGTGCTCCGAGCCAAGTCTTTGTTTGACTTTGGTAAGAAACGTCGACCCATTCTGCTTGATCGACGAATCGACGCTCCTGATGTAG
TCAGTGGGAATGGTCACGAGCATGCGATCGCGTACACAGGAACATCGCAGGAGATGTATGGAGCGAAGGCGACAATAAACGTGTGGGACCCGTCAATCCAAGTGGTCAAC
GAGTTCAGCCTATCCCAGATTTGGATTCTCTCGGGATCATTCGACGGCTCAGATCTCAACAGCATAGAAGCTGGTTGGCAGGTCAGTCCGGAGCTTTATGGTGACACTCA
ACCTAGATTATTCACATATTGGACGAGCGACGCGTATCAAGCAACGGGGTGCTACAATCTTTTATGCGCAGGATTTGTGCAAACAAACAGCAAAGTCGCGATCGGAGCGG
CCATTTCGCCGATCTCTTCATTTTCCGGCAGCCAATATGACATCACCATTCTCATTTGGAAGGATCCGAAGCTGGGAAACTGGTGGATGGGATTCGGGGACAACACACTG
GTGGGGTACTGGCCGGCGGAGCTATTCACCCATCTGGCCGACCACGCCACGATGGTGGAGTGGGGCGGCGAGGTGGTCAACTCAAGGGCCAGAGGCGAGCACACCTCCAC
CCAAATGGGCTCCGGCCGCTTCCCCGAGGACGGCTTCGGCAAAGCCAGCTACTTCCGAAACCTCGAGGTCGTCGACTCCGATAATAGCCTCAGCGCCGTCCAGGAGATCT
CGACCTTGGCCGAGAACACCAATTGCTACAACATTATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

LVREMGCGKRGVSSALLLYPLFLSLVLQRFTVVCSLNYTYKQVSSLRLERIQRHLDNINKPALLTIQSPDGDIIDCVHKRKQPALDHPLLKNHKIQREPAERPRMKKMKE
NEVKDGDGSGRRGGSGAGGAWQTWRVNGTRCPKGTIPVRRTTQSDVLRAKSLFDFGKKRRPILLDRRIDAPDVVSGNGHEHAIAYTGTSQEMYGAKATINVWDPSIQVVN
EFSLSQIWILSGSFDGSDLNSIEAGWQVSPELYGDTQPRLFTYWTSDAYQATGCYNLLCAGFVQTNSKVAIGAAISPISSFSGSQYDITILIWKDPKLGNWWMGFGDNTL
VGYWPAELFTHLADHATMVEWGGEVVNSRARGEHTSTQMGSGRFPEDGFGKASYFRNLEVVDSDNSLSAVQEISTLAENTNCYNIMX

Sgr019887 (gene) of Monk fruit (Qingpiguo) v1 genome