CuGenDBv2

Gene ID	Tan0000795
Organism	Trichosanthes anguina (Snake gourd v1)
Description	DUF4283 domain-containing protein
Genome location	LG04:3410577..3412972
RNA-Seq Expression	Tan0000795
Synteny	Tan0000795
Gene Ontology terms	NA
InterPro domains	IPR025558 - Domain of unknown function DUF4283 IPR040256 - Uncharacterized protein At4g02000-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6600113.1 hypothetical protein SDJN03_05346, partial [Cucurbita argyrosperma subsp. sororia]

1.5e-216

65.64

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV
        MAV SKH H +R  +GAG+D AA S                    + GATVCNLT SQTARI QQFDQSLI  VVGKKIHP+QLA RLRR+LHLAGDLDV
Subjt:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV

Query:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR
        FELGLGFFVLKFSNA DYYEALEERPWSI HLCIYVFPWIPNFKPSEASIPFVDVW+RLPELSIEYYD+EVLE+IAETIGGRLVKIDPVTE REKCM+AR
Subjt:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR

Query:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK------------------------
        ICIR+NL +PLNLSFQFG+N QKIVYEGLD LC VC  +DDLKHDCLSN S S+GFDPH+H ARP+QA GSS SS                         
Subjt:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK------------------------

Query:  -----------KPMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELK
                   K  +I S+P+PASA GSR+QV      LEL LNE PSL + + DK V                            KES +I M  P LK
Subjt:  -----------KPMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELK

Query:  QTNLIQSVPLTPSVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTI
        QTNLIQSVPL P V+ED QFR  KTSSPTTLAV NNEPQPSSLA+K+IA LQP    EAGLKFYST IQ ST +K I NTP++ I V S PT+YTIDPTI
Subjt:  QTNLIQSVPLTPSVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTI

Query:  TSLAITLSEV-ATTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVR
        T+LAI L E+ ATT  SNQN++ I  VPT          SEAV +  S CSKKMLCWNF  TDNAKL+RALKDLI+LHKPSIVLIFGTKISGADAD V R
Subjt:  TSLAITLSEV-ATTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVR

Query:  ELAFDGSYCRKPDGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK
        ELAFDGSYCRKPDGY GG WLLLS+QDV I+VSSYSPQQVSASV+ HSK NK
Subjt:  ELAFDGSYCRKPDGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK

KAG7030784.1 hypothetical protein SDJN02_04821, partial [Cucurbita argyrosperma subsp. argyrosperma]

3.4e-216

65.69

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV
        MAV SKH H +R  +GAG+D AA S                    + GATVCNLT SQTARI QQFDQSLI  VVGKKIHP+QLA RLRR+LHLAGDLDV
Subjt:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV

Query:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR
        FELGLGFFVLKFSNA DYYEALEERPWSI HLCIYVFPWIPNFKPSEASIPFVDVW+RLPELSIEYYD+EVLE+IAETIGGRLVKIDPVTE REKCM+AR
Subjt:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR

Query:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK------------------------
        ICIR+NL +PLNLSFQFG+N QKIVYEGLD LC VC  +DDLKHDCLSN S S+GFDPH+HRARP+QA GSS SS                         
Subjt:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK------------------------

Query:  -------------KPMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPE
                     K  +I S+P+PASA GSR+QV      LEL LNE PSL + + DK V                            KES +I MKAP 
Subjt:  -------------KPMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPE

Query:  LKQTNLIQSVPLTPSVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDP
        LKQTNLIQSVPL P V+ED QFR  KTSSPTTLAV NNEPQP SLA+K+IA LQP    EAGLKFYST IQ ST +K I NTP++ I V S PT+YTIDP
Subjt:  LKQTNLIQSVPLTPSVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDP

Query:  TITSLAITLSEV-ATTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRV
        TITSLAI L E+ ATT  SNQN++ I  VPT          SEAV +  S CSKKMLCWNF  TDNAKL+RALKDLI+LHKPSIVLIFGTKI G DAD V
Subjt:  TITSLAITLSEV-ATTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRV

Query:  VRELAFDGSYCRKPDGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVL
        VRELAFDGSYCRKPDGY GG WLLLS+QDV I+VSSYSPQQVSASV+
Subjt:  VRELAFDGSYCRKPDGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVL

KAG7030785.1 hypothetical protein SDJN02_04822, partial [Cucurbita argyrosperma subsp. argyrosperma]

3.3e-187

58.59

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATS---FRKKNKRPI-SSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAG
        M V S  S S    +GAG DEAA      RKK KRP+ +SSSD ESH  +TGATVCNL+ SQTARITQQFD SLIA V G+ I P+QLA RLRRHLHL  
Subjt:  MAVLSKHSHSARPLSGAGHDEAATS---FRKKNKRPI-SSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAG

Query:  DLDVFELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKC
        D++VFELGLG+FVLKFS     Y ALE+ PWSI +LCIY F W P+FKPSEA    VDVW+RL ELSIEYYDEE+L +IA TIGG LVK DPVT+ R KC
Subjt:  DLDVFELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKC

Query:  MFARICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLS--NPSGSTGFD------PHYHRARPVQAIGSSSSSKKPMMIRSEPSPA
         FARICIR+NLC PL    + GR +QKI YEGLD LCP CR + DLK +CL+  NPSGS+G D       H+HR RP+  +GSSSSSK+P +I S  SPA
Subjt:  MFARICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLS--NPSGSTGFD------PHYHRARPVQAIGSSSSSKKPMMIRSEPSPA

Query:  SAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSVVEDQFRAAK
        S  GSR+QVLE D LL+      PS+ I         VK +A AK K  CG    V++LP LPK+ ST   KAPEL+         + P+VVE QF+ AK
Subjt:  SAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSVVEDQFRAAK

Query:  TSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTID-PTITSLAITLSEVATTMVSNQNQYTI
        TS+PT +A HNN               QPC V +A L F S  I+ ST++KE+ + P+KEI V  CP V+TI+   I S  + LS + T  + N+N YT+
Subjt:  TSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTID-PTITSLAITLSEVATTMVSNQNQYTI

Query:  DFVPTSRGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDGYNGGVWLLLSR
        D +PT+R  D+ G GS+ V   ESCSKKMLCW F GTDNA L++ALKDLI+LH+PSIVLIFGTKISGA+A+ VVREL+F GSYCRKPDGYNGGVWLLLSR
Subjt:  DFVPTSRGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDGYNGGVWLLLSR

Query:  QDVHIDVSSYSPQQVSASVLFHSKTNKPETSLSNADTGTSSRPWGRTFCYTS
        QDV I+V SYSPQQVSASV F S TN+P  S  N DT TSS PWG TF YTS
Subjt:  QDVHIDVSSYSPQQVSASVLFHSKTNKPETSLSNADTGTSSRPWGRTFCYTS

XP_022941630.1 uncharacterized protein LOC111446932 isoform X1 [Cucurbita moschata]

2.1e-218

67.03

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV
        MAV SKH H +R  +GAG+D AA S                    + GATVCNLT SQTARI QQFDQSLI  VVGKKIHP+QLA RLRR+LHLAGDLDV
Subjt:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV

Query:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR
        FELGLGFFVLKFSNA DYYEALEERPWSI HLCIYVFPWIPNFKPSEASIPFVDVW+RLPELSIEYYD+EVLE+IAETIGGRLVKIDPVT  REKCM+AR
Subjt:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR

Query:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK-----------------------K
        ICIR+NL +PLNLSFQFG+N QKIVYEGLD LC VC  +DDLKHDCLSN S S+GFDPH+H ARP+QA GSS SS                        K
Subjt:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK-----------------------K

Query:  PMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTP
          +I S+P+PASA GSR+QV      LEL LNE PSL + + DK V                            KES +I M  P LKQTNLIQSVPL P
Subjt:  PMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTP

Query:  SVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-A
         V+ED QFR  KTSSPTTLAV NNEPQPSSLA+K+IA LQP    EAGLKFYST IQ ST +K I NTP++ I V S PT+YTIDPTITSLAI L E+ A
Subjt:  SVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-A

Query:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKP
        TT  SNQN++ I  VPT          SEAV +  S CSKKMLCWNF  TDNAKL+RALKDLI+LHKPSIVLIFGTKISGADAD VVRELAFDGSYCRKP
Subjt:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKP

Query:  DGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK
        DGY GG WLLLS+QDV I+VSSYSPQQVSASV+ HSK NK
Subjt:  DGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK

XP_022941632.1 uncharacterized protein LOC111446932 isoform X2 [Cucurbita moschata]

1.2e-218

67.24

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV
        MAV SKH H +R  +GAG+D AA S                    + GATVCNLT SQTARI QQFDQSLI  VVGKKIHP+QLA RLRR+LHLAGDLDV
Subjt:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV

Query:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR
        FELGLGFFVLKFSNA DYYEALEERPWSI HLCIYVFPWIPNFKPSEASIPFVDVW+RLPELSIEYYD+EVLE+IAETIGGRLVKIDPVT  REKCM+AR
Subjt:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR

Query:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK---------------------KPM
        ICIR+NL +PLNLSFQFG+N QKIVYEGLD LC VC  +DDLKHDCLSN S S+GFDPH+H ARP+QA GSS SS                      K  
Subjt:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK---------------------KPM

Query:  MIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSV
        +I S+P+PASA GSR+QV      LEL LNE PSL + + DK V                            KES +I M  P LKQTNLIQSVPL P V
Subjt:  MIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSV

Query:  VED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-ATT
        +ED QFR  KTSSPTTLAV NNEPQPSSLA+K+IA LQP    EAGLKFYST IQ ST +K I NTP++ I V S PT+YTIDPTITSLAI L E+ ATT
Subjt:  VED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-ATT

Query:  MVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDG
          SNQN++ I  VPT          SEAV +  S CSKKMLCWNF  TDNAKL+RALKDLI+LHKPSIVLIFGTKISGADAD VVRELAFDGSYCRKPDG
Subjt:  MVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDG

Query:  YNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK
        Y GG WLLLS+QDV I+VSSYSPQQVSASV+ HSK NK
Subjt:  YNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK

TrEMBL top hits

e value

%identity

Alignment

A0A0A0KLB0 DUF4283 domain-containing protein

1.8e-170

55.12

Show/hide

Query:  SARPLSGAGHDEAATS---FRKKNK--RPISSSSDFESHHPSTGATV--CNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDVFE
        S  P +GAG DEAA      RKK K   PI  SSDF S   +T ATV  CNLT S+T RITQQF  SLIA VVGK   P QLA RLR HL L  D+ VF+
Subjt:  SARPLSGAGHDEAATS---FRKKNK--RPISSSSDFESHHPSTGATV--CNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDVFE

Query:  LGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFARIC
        LGLG+FVLKFS     Y ALE+ PWSI +LCI+ FPW P+FKPSEA    V+VW+RLPELSIEYYD  +L+RIA+ IG  LVKIDPVT  R KC FAR C
Subjt:  LGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFARIC

Query:  IRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDC------------LSNPSGSTGF-----DPHYHRARPVQAIGSSSSSKKPMMIRSEP
        I +NLC PL    + GR RQ+I YEG + LC  C R+ DL+HDC            L+NPSGS GF     +PH+   R  + IGS+S+SK+P++   E 
Subjt:  IRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDC------------LSNPSGSTGF-----DPHYHRARPVQAIGSSSSSKKPMMIRSEP

Query:  SPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNS---------VKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLT
        SP SAW S  + +E++P L+LKL + P+L   +  K+ +          VK + + K+K KC   +SVQ LP LPK+ STI +KAPELK+        + 
Subjt:  SPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNS---------VKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLT

Query:  PSVVEDQFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDP-TITSLAITLSEVA
        PSVVED+ +  KT + T +A HN++P PS  A  +I  LQP P SEA LKF S  I C TRK+EI N+P+K I   S PTVYTIDP  ITSL I LSEV 
Subjt:  PSVVEDQFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDP-TITSLAITLSEVA

Query:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPD
                  TI+ VPT +GGD+ GVGSE     E C+KK+L W F   DNAKL+RALKDLI+LH+PSIVLIFG KISG D D+V+RELAF GSY  KPD
Subjt:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPD

Query:  GYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNKPETSLSNADTGTSSRPWGRTFCYTS
        GYNGGVWLLLS+QDV   V+S+S QQVSASV FHS+TN    S SNADT TSS PWG TF YTS
Subjt:  GYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNKPETSLSNADTGTSSRPWGRTFCYTS

A0A5A7SSJ3 DUF4283 domain-containing protein

7.6e-182

58.13

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATS---FRKKNK--RPISSSSDFESHHPSTGATV--CNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLH
        MA+ S H     P +GAG DEAA      RKK K   PIS SSDFES   +T ATV  CNLT S+T RITQQF  SLIA VVGK   P QLA RLR HL 
Subjt:  MAVLSKHSHSARPLSGAGHDEAATS---FRKKNK--RPISSSSDFESHHPSTGATV--CNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLH

Query:  LAGDLDVFELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERR
        L  D+ VFELGLG+FVLKFS     Y ALE+ PWSI +LCI+ FPW P+FKPSEA    V+VW+RLPELSIEYYD E+L+RIA+ IGGRLVKIDPVT  R
Subjt:  LAGDLDVFELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERR

Query:  EKCMFARICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDC--LSNPSGSTGF-----DPHYHRARPVQAIGSSSSSKKPMMIRSEPS
         KC FAR CI +NLC PL    + GR RQ+I YEG + LC  C R+ DL+HDC  L+NPSGS GF     +PH+   R  +  GS+SSSK+P++   E S
Subjt:  EKCMFARICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDC--LSNPSGSTGF-----DPHYHRARPVQAIGSSSSSKKPMMIRSEPS

Query:  PASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNS---------VKAEAVAKQKGKCGVSVSVQTLPILPK-ESSTIAMKAPELKQTNLIQSVPLT
          SAW S  + +E++P L+LK    P+L   +  K+  S         VK +A+ K+K KC   +SVQ LP LPK +SSTI +KAPELK         + 
Subjt:  PASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNS---------VKAEAVAKQKGKCGVSVSVQTLPILPK-ESSTIAMKAPELKQTNLIQSVPLT

Query:  PSVVEDQFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDP-TITSLAITLSEVA
        PSVVEDQ + AKT + T +A HN++P PS  A  +I  LQP P SEA LKF S  I C TRK+EI N+P+KE    S PTVYTIDP  ITSL I+LSEV 
Subjt:  PSVVEDQFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDP-TITSLAITLSEVA

Query:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPD
        TT +SNQNQYTI+ VPT +GGDK GVG E     E C+KKML W F   DNAKL+RALKDLI+LH+PSIVLIFG KI+G DA +V++ELAF GSY  +PD
Subjt:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPD

Query:  GYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNKPETSLSNADTGTSSRPWGRTFCYTS
        GYNGGVWLLLS+QDV   V+SYSPQQVSASV FHS+TN    S SNADT TSS PWG TF YTS
Subjt:  GYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNKPETSLSNADTGTSSRPWGRTFCYTS

A0A5A7SY10 DUF4283 domain-containing protein

9.3e-172

57.1

Show/hide

Query:  VLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDVFE
        V SKHS S+R L+    DE  ++ RKK KRP+SSSS+   H+P+      +LT SQTARI Q F  SLIA V G  +H + LA RLRR+L L GDLDVFE
Subjt:  VLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDVFE

Query:  LGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFARIC
        L LGFFVLKFSN+SDY EALEE PWSISHLCI+V PW+PNFKPSEA I  VDVW+RLPEL IEYYD+E+LE+IAE IG  LVKIDPVTERR+KCMFARIC
Subjt:  LGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFARIC

Query:  IRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCL--SNPSGSTGFDPHYHRARPVQAIGSSSS------SKKPMMIRSEPSPASAWGSR
        IR+ LC+PL  S QFG+  QK+ YEGLD LC VC  ID+LKH CL  +NPSGS+G DPH     P+QAI  SSS      SKKP +I S PS  SA GS+
Subjt:  IRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCL--SNPSGSTGFDPHYHRARPVQAIGSSSS------SKKPMMIRSEPSPASAWGSR

Query:  YQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSVVEDQFRAAKTSSPTT
         Q  E++P LELKL + P L +G           + V  +K         + LP  P+ESST   + PE        SVPL   +V DQFRAAK SSPT 
Subjt:  YQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSVVEDQFRAAKTSSPTT

Query:  LAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVY-SCPTVYTIDPTITSLAITLSEVATTMVSNQNQYTIDFVPTS
        L V NN    SS               EAG+  +S  IQ +  +K++ NTP   I V  S PTVYTIDPT  SL I  SEV T   SNQN+Y I+FV  S
Subjt:  LAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVY-SCPTVYTIDPTITSLAITLSEVATTMVSNQNQYTIDFVPTS

Query:  RGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDGYNGGVWLLLSRQDVHID
        R  +   V S+A  +   C KKMLCWNF G D AKLI+A K LI L +PSIVLIFG+KIS ADA+ VVRELAF+GSYCRKPDGYNGGVW++LS QDV I+
Subjt:  RGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDGYNGGVWLLLSRQDVHID

Query:  VSSYSPQQVSASVLFHSKTNKPETSLSNADTGTS
        VSSYSPQ+VSASV F SK N+PE  L + DT TS
Subjt:  VSSYSPQQVSASVLFHSKTNKPETSLSNADTGTS

A0A6J1FN13 uncharacterized protein LOC111446932 isoform X2

6.0e-219

67.24

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV
        MAV SKH H +R  +GAG+D AA S                    + GATVCNLT SQTARI QQFDQSLI  VVGKKIHP+QLA RLRR+LHLAGDLDV
Subjt:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV

Query:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR
        FELGLGFFVLKFSNA DYYEALEERPWSI HLCIYVFPWIPNFKPSEASIPFVDVW+RLPELSIEYYD+EVLE+IAETIGGRLVKIDPVT  REKCM+AR
Subjt:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR

Query:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK---------------------KPM
        ICIR+NL +PLNLSFQFG+N QKIVYEGLD LC VC  +DDLKHDCLSN S S+GFDPH+H ARP+QA GSS SS                      K  
Subjt:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK---------------------KPM

Query:  MIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSV
        +I S+P+PASA GSR+QV      LEL LNE PSL + + DK V                            KES +I M  P LKQTNLIQSVPL P V
Subjt:  MIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSV

Query:  VED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-ATT
        +ED QFR  KTSSPTTLAV NNEPQPSSLA+K+IA LQP    EAGLKFYST IQ ST +K I NTP++ I V S PT+YTIDPTITSLAI L E+ ATT
Subjt:  VED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-ATT

Query:  MVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDG
          SNQN++ I  VPT          SEAV +  S CSKKMLCWNF  TDNAKL+RALKDLI+LHKPSIVLIFGTKISGADAD VVRELAFDGSYCRKPDG
Subjt:  MVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKPDG

Query:  YNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK
        Y GG WLLLS+QDV I+VSSYSPQQVSASV+ HSK NK
Subjt:  YNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK

A0A6J1FU80 uncharacterized protein LOC111446932 isoform X1

1.0e-218

67.03

Show/hide

Query:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV
        MAV SKH H +R  +GAG+D AA S                    + GATVCNLT SQTARI QQFDQSLI  VVGKKIHP+QLA RLRR+LHLAGDLDV
Subjt:  MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDV

Query:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR
        FELGLGFFVLKFSNA DYYEALEERPWSI HLCIYVFPWIPNFKPSEASIPFVDVW+RLPELSIEYYD+EVLE+IAETIGGRLVKIDPVT  REKCM+AR
Subjt:  FELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFAR

Query:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK-----------------------K
        ICIR+NL +PLNLSFQFG+N QKIVYEGLD LC VC  +DDLKHDCLSN S S+GFDPH+H ARP+QA GSS SS                        K
Subjt:  ICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSK-----------------------K

Query:  PMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTP
          +I S+P+PASA GSR+QV      LEL LNE PSL + + DK V                            KES +I M  P LKQTNLIQSVPL P
Subjt:  PMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEAVAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTP

Query:  SVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-A
         V+ED QFR  KTSSPTTLAV NNEPQPSSLA+K+IA LQP    EAGLKFYST IQ ST +K I NTP++ I V S PT+YTIDPTITSLAI L E+ A
Subjt:  SVVED-QFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKEITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEV-A

Query:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKP
        TT  SNQN++ I  VPT          SEAV +  S CSKKMLCWNF  TDNAKL+RALKDLI+LHKPSIVLIFGTKISGADAD VVRELAFDGSYCRKP
Subjt:  TTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLES-CSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGTKISGADADRVVRELAFDGSYCRKP

Query:  DGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK
        DGY GG WLLLS+QDV I+VSSYSPQQVSASV+ HSK NK
Subjt:  DGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G01050.1 zinc ion binding;nucleic acid binding

2.5e-20

29.55

Show/hide

Query:  LIASVVGKKIHPQQLAFRLRRHLHLAGDLDVFELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDE
        +I  V+G +I    L  +LR     +G + V +L   FF+++F    +Y  AL   PW +    + V  W   F P    I    VWVRL  +   YY  
Subjt:  LIASVVGKKIHPQQLAFRLRRHLHLAGDLDVFELGLGFFVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDE

Query:  EVLERIAETIGGRLVKIDPVTERREKCMFARICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAI
         +L  IA  + GR +K+D  T   +K  FAR+CI +NL  PL  +     +R  + YEGL  +C  C     L H C  N              R V  +
Subjt:  EVLERIAETIGGRLVKIDPVTERREKCMFARICIRLNLCHPLNLSFQFGRNRQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAI

Query:  GSSSSSKKPMMIRSEPSPAS
        G        ++ R+   PA+
Subjt:  GSSSSSKKPMMIRSEPSPAS

AT5G36228.1 nucleic acid binding;zinc ion binding

1.5e-09

27.08

Show/hide

Query:  FVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFARICIRLNL
        F ++F +  D    L   PW  +   I +  W  +F P+E  + F+DVWV +  + + Y  E  +E IA T+ G +V +D   E   +  F R+ +R++ 
Subjt:  FVLKFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFARICIRLNL

Query:  CHPLNL--SFQFGRNRQKIV---YEGLDFLCPVCRRIDDLKHDC
          PL      +F    + ++   YE L  +C  C R++     C
Subjt:  CHPLNL--SFQFGRNRQKIV---YEGLDFLCPVCRRIDDLKHDC

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGGTTCTATCCAAACATTCCCATTCAGCCCGCCCGCTCTCCGGCGCCGGCCACGACGAAGCGGCCACTAGTTTCAGGAAGAAGAACAAGAGACCAATTTCTTCCTC
ATCGGACTTCGAATCTCATCATCCATCCACCGGCGCCACCGTCTGTAACCTCACTTCCTCTCAAACAGCTCGGATCACGCAACAGTTCGATCAGTCCCTCATAGCATCGG
TCGTCGGCAAGAAGATCCATCCACAGCAACTCGCTTTTCGCCTTCGCCGTCATCTTCATCTCGCCGGAGATTTGGACGTCTTCGAGCTAGGGCTTGGCTTTTTCGTGCTG
AAATTCTCCAACGCTTCAGACTACTACGAAGCTCTTGAAGAGCGTCCTTGGTCCATTTCTCACCTTTGCATCTATGTATTTCCATGGATTCCCAATTTCAAGCCATCGGA
GGCCTCGATTCCTTTCGTTGATGTCTGGGTTCGGCTTCCGGAGCTCAGCATCGAGTACTACGACGAGGAGGTTTTGGAGCGAATTGCGGAAACCATCGGCGGCCGTCTCG
TGAAGATCGATCCGGTAACTGAACGACGAGAGAAATGTATGTTTGCTCGTATCTGTATTAGGTTAAATTTATGTCATCCCCTTAATTTGAGTTTCCAATTTGGGCGAAAT
CGGCAGAAAATTGTGTATGAGGGTTTGGATTTCTTGTGCCCTGTCTGTAGACGTATTGATGATTTGAAACATGATTGTTTGAGTAACCCTTCTGGTTCTACTGGGTTTGA
TCCCCATTACCACAGAGCTCGTCCAGTGCAGGCAATTGGCTCGAGTTCGAGTTCGAAGAAGCCGATGATGATTCGTTCTGAACCTTCACCGGCATCAGCTTGGGGATCCA
GATACCAAGTTCTTGAAGAAGATCCATTGCTTGAGTTGAAATTGAATGAAGGGCCAAGCCTTTCAATTGGTGATTGTGATAAATCAGTAAATTCTGTGAAGGCTGAAGCA
GTTGCAAAGCAAAAGGGGAAATGTGGAGTCTCTGTCTCTGTTCAAACATTGCCCATCTTGCCAAAAGAATCTTCAACAATAGCCATGAAAGCTCCTGAGTTAAAACAGAC
CAATTTGATTCAATCTGTGCCTTTAACTCCTTCTGTTGTTGAAGATCAGTTCAGGGCTGCAAAAACCAGTAGCCCCACAACACTTGCAGTCCATAACAATGAACCTCAAC
CATCATCATTGGCTGTTAAAACCATTGCTTCCCTGCAACCATGTCCTGTTTCAGAGGCTGGCCTCAAGTTCTATTCGACTGGAATCCAATGCTCGACAAGAAAGAAAGAG
ATAACCAACACACCAGCTAAAGAAATTGGTGTCTATAGTTGCCCCACTGTTTACACAATCGACCCAACAATCACAAGCCTTGCAATTACTCTGTCAGAAGTGGCAACAAC
CATGGTATCAAACCAAAATCAGTATACTATCGACTTTGTTCCGACATCGAGAGGTGGAGACAAGTGTGGAGTTGGTTCGGAGGCAGTACCTGTATTAGAATCGTGTTCTA
AGAAGATGTTGTGCTGGAATTTTCTTGGGACAGACAACGCGAAGCTAATACGAGCATTGAAAGATCTAATTGAACTACACAAGCCATCCATTGTGCTGATCTTTGGCACC
AAGATCAGTGGTGCTGATGCAGATCGGGTTGTTCGGGAGCTCGCTTTCGACGGTTCATATTGTAGAAAGCCTGATGGCTACAATGGTGGAGTTTGGCTGTTATTGTCCCG
GCAAGATGTGCACATTGATGTCAGTTCCTACAGCCCACAGCAGGTTTCTGCATCAGTACTGTTTCATTCTAAAACCAATAAACCAGAGACAAGTCTTTCAAATGCAGATA
CCGGAACATCTTCGCGACCGTGGGGACGGACTTTCTGCTACACTTCAATGGCATGCTGA

mRNA sequence

Show/hide mRNA sequence

AAAAAATCACTTCGAAGCTTCTATAGACTTCAAAAAGTCAAAAATGGAAGAAGATTTCTGTCTCTCTTCGTCTATAAATTTCAATTCAGTTCCTCGACATGTCAATCATC
TTCCACTGCAAAATTCAACCCACCTTTTATGGCGGTTCTATCCAAACATTCCCATTCAGCCCGCCCGCTCTCCGGCGCCGGCCACGACGAAGCGGCCACTAGTTTCAGGA
AGAAGAACAAGAGACCAATTTCTTCCTCATCGGACTTCGAATCTCATCATCCATCCACCGGCGCCACCGTCTGTAACCTCACTTCCTCTCAAACAGCTCGGATCACGCAA
CAGTTCGATCAGTCCCTCATAGCATCGGTCGTCGGCAAGAAGATCCATCCACAGCAACTCGCTTTTCGCCTTCGCCGTCATCTTCATCTCGCCGGAGATTTGGACGTCTT
CGAGCTAGGGCTTGGCTTTTTCGTGCTGAAATTCTCCAACGCTTCAGACTACTACGAAGCTCTTGAAGAGCGTCCTTGGTCCATTTCTCACCTTTGCATCTATGTATTTC
CATGGATTCCCAATTTCAAGCCATCGGAGGCCTCGATTCCTTTCGTTGATGTCTGGGTTCGGCTTCCGGAGCTCAGCATCGAGTACTACGACGAGGAGGTTTTGGAGCGA
ATTGCGGAAACCATCGGCGGCCGTCTCGTGAAGATCGATCCGGTAACTGAACGACGAGAGAAATGTATGTTTGCTCGTATCTGTATTAGGTTAAATTTATGTCATCCCCT
TAATTTGAGTTTCCAATTTGGGCGAAATCGGCAGAAAATTGTGTATGAGGGTTTGGATTTCTTGTGCCCTGTCTGTAGACGTATTGATGATTTGAAACATGATTGTTTGA
GTAACCCTTCTGGTTCTACTGGGTTTGATCCCCATTACCACAGAGCTCGTCCAGTGCAGGCAATTGGCTCGAGTTCGAGTTCGAAGAAGCCGATGATGATTCGTTCTGAA
CCTTCACCGGCATCAGCTTGGGGATCCAGATACCAAGTTCTTGAAGAAGATCCATTGCTTGAGTTGAAATTGAATGAAGGGCCAAGCCTTTCAATTGGTGATTGTGATAA
ATCAGTAAATTCTGTGAAGGCTGAAGCAGTTGCAAAGCAAAAGGGGAAATGTGGAGTCTCTGTCTCTGTTCAAACATTGCCCATCTTGCCAAAAGAATCTTCAACAATAG
CCATGAAAGCTCCTGAGTTAAAACAGACCAATTTGATTCAATCTGTGCCTTTAACTCCTTCTGTTGTTGAAGATCAGTTCAGGGCTGCAAAAACCAGTAGCCCCACAACA
CTTGCAGTCCATAACAATGAACCTCAACCATCATCATTGGCTGTTAAAACCATTGCTTCCCTGCAACCATGTCCTGTTTCAGAGGCTGGCCTCAAGTTCTATTCGACTGG
AATCCAATGCTCGACAAGAAAGAAAGAGATAACCAACACACCAGCTAAAGAAATTGGTGTCTATAGTTGCCCCACTGTTTACACAATCGACCCAACAATCACAAGCCTTG
CAATTACTCTGTCAGAAGTGGCAACAACCATGGTATCAAACCAAAATCAGTATACTATCGACTTTGTTCCGACATCGAGAGGTGGAGACAAGTGTGGAGTTGGTTCGGAG
GCAGTACCTGTATTAGAATCGTGTTCTAAGAAGATGTTGTGCTGGAATTTTCTTGGGACAGACAACGCGAAGCTAATACGAGCATTGAAAGATCTAATTGAACTACACAA
GCCATCCATTGTGCTGATCTTTGGCACCAAGATCAGTGGTGCTGATGCAGATCGGGTTGTTCGGGAGCTCGCTTTCGACGGTTCATATTGTAGAAAGCCTGATGGCTACA
ATGGTGGAGTTTGGCTGTTATTGTCCCGGCAAGATGTGCACATTGATGTCAGTTCCTACAGCCCACAGCAGGTTTCTGCATCAGTACTGTTTCATTCTAAAACCAATAAA
CCAGAGACAAGTCTTTCAAATGCAGATACCGGAACATCTTCGCGACCGTGGGGACGGACTTTCTGCTACACTTCAATGGCATGCTGATGCGAGAAGGTAAAGAAGCATTG
GACACCATCTTCTTAGATTTAAAATACAAAGAATTTTAAGCTTTTGTTCATTAGAATTGCTTGAAAGATGATGACTTTGGGAAGTTTCTGCATTTGTGTTGTGATCAAAG
TTTCTGAGATATAATGGATGATCGGATTCTGTTGGTTTAGTGGATGTAGGCAGCTGAACCACTTTAAATCTTGTGCCCATTTGTTCTTCTTTCTTAAAACTCTTTTTACA
TTCCATTGCTTAGATGACTTTGTTTTTTTTTTTTAATCTTCAAAGGCATTTGCTTAATGATCTTCAAGAATAAGGGGTTACCACAA

Protein sequence

Show/hide protein sequence

MAVLSKHSHSARPLSGAGHDEAATSFRKKNKRPISSSSDFESHHPSTGATVCNLTSSQTARITQQFDQSLIASVVGKKIHPQQLAFRLRRHLHLAGDLDVFELGLGFFVL
KFSNASDYYEALEERPWSISHLCIYVFPWIPNFKPSEASIPFVDVWVRLPELSIEYYDEEVLERIAETIGGRLVKIDPVTERREKCMFARICIRLNLCHPLNLSFQFGRN
RQKIVYEGLDFLCPVCRRIDDLKHDCLSNPSGSTGFDPHYHRARPVQAIGSSSSSKKPMMIRSEPSPASAWGSRYQVLEEDPLLELKLNEGPSLSIGDCDKSVNSVKAEA
VAKQKGKCGVSVSVQTLPILPKESSTIAMKAPELKQTNLIQSVPLTPSVVEDQFRAAKTSSPTTLAVHNNEPQPSSLAVKTIASLQPCPVSEAGLKFYSTGIQCSTRKKE
ITNTPAKEIGVYSCPTVYTIDPTITSLAITLSEVATTMVSNQNQYTIDFVPTSRGGDKCGVGSEAVPVLESCSKKMLCWNFLGTDNAKLIRALKDLIELHKPSIVLIFGT
KISGADADRVVRELAFDGSYCRKPDGYNGGVWLLLSRQDVHIDVSSYSPQQVSASVLFHSKTNKPETSLSNADTGTSSRPWGRTFCYTSMAC

Tan0000795 (gene) of Snake gourd v1 genome