CuGenDBv2

Gene ID	Tan0022523
Organism	Trichosanthes anguina (Snake gourd v1)
Description	ATP-dependent DNA helicase
Genome location	LG09:67688242..67692173
RNA-Seq Expression	Tan0022523
Synteny	Tan0022523
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG6587803.1 hypothetical protein SDJN03_16368, partial [Cucurbita argyrosperma subsp. sororia]

2.2e-226

78.03

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKE
        MTLYPEKL VKRECDDSFH    HLDKRFKPDF +SISGP TLPATSSQNNPLDE SPLGLTLRK+PSLLDLIQMKLSQGI ST+GDSNSETFDF+V+KE
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKE

Query:  SRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNP
        +  +T+ G+TEKLKASNFPAS LKIGRWEYKSR+EGDLVAKCYYAKHKLVWEIL GGLKSKIE+QWSDIMALKANCPDDGPATLNVVL RRPLFFRETNP
Subjt:  SRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNP

Query:  QPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGA
        QPRKHTLWQATADFT GEASMQRQHFLQCPQG LNKHFEKLIQCD+RLNFLSRQPEIV GS YFEP ASGFT FEQ+S+ GLEQ  NDNRSV+       
Subjt:  QPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGA

Query:  SSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEM
                                           HE+EENRS TKV+SM+R WEQ+KV G+ PSMSMSDLVNHIEQHI+EQ T TKSPFVDDGSECQEM
Subjt:  SSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEM

Query:  LNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSF
        LN+I RYLLSDNQLSAASDEASLMSRVDSLCCLLQKEP  VQS   SG   VEG D KED  +LRDGR+  ESHIKIHP+ETKDVSGS+Q SAMSRKDSF
Subjt:  LNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSF

Query:  ADLLLHLPRIASLPKFLFNISDGNEDQD
        ADLLLHLPRIASLPKFLFNISDG+ED+D
Subjt:  ADLLLHLPRIASLPKFLFNISDGNEDQD

KAG7035694.1 hypothetical protein SDJN02_02492, partial [Cucurbita argyrosperma subsp. argyrosperma]

1.6e-224

76.91

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH---------QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSE
        MTLYPEKL VKRECDDSFH    HLDKRFKPDF          QSISGP TLPATSSQNNPLDE SPLGLTLRK+PSLLDLIQMKLSQGI ST+GDSNSE
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH---------QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSE

Query:  TFDFVVKKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRR
        TFDF+V+KE+  +T+ G+TEKLKASNFPAS LKIGRWEYKSR+EGDLVAKCYYAKHKLVWEIL GGLKSKIE+QWSDIMALKANCPDDGPATLNVVL RR
Subjt:  TFDFVVKKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRR

Query:  PLFFRETNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRS
        PLFFRETNPQPRKHTLWQATADFT GEASMQRQHFLQCPQG LNKHFEKLIQCD+RLNFLSRQPEIV GS YFEP ASGFT FEQ+S+ GLEQ  NDNRS
Subjt:  PLFFRETNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRS

Query:  VLSTFQDGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFV
        V+                                          HE+EENRS TKV+SM+R WEQ+KV G+ PSMSMSDLVNHIEQHI+EQ T TKSPFV
Subjt:  VLSTFQDGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFV

Query:  DDGSECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQS
        DDGSECQEMLN+I RYLLSDNQLSAASDEASLMSRVDSLCCLLQKEP  VQS   SG   VEG D KED  +LRDGR+  ESHIKIHP+ETKDVSGS+Q 
Subjt:  DDGSECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQS

Query:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD
        SAMSRKDSFADLLLHLPRIASLPKFLFNISDG+ED+D
Subjt:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

XP_008443832.1 PREDICTED: uncharacterized protein LOC103487331 isoform X3 [Cucumis melo]

5.2e-223

77.09

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH--QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVV
        +TL+ +K  VKRECDDSFH E    DKRFKPD H  QS+ G  TL +TSS NNPLDEPSPLGL LRKSPSLLDLIQMKLSQG +ST +G SN+ETFDFVV
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH--QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVV

Query:  KKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRE
        K ES+D TVPG+ EKLKASNFPAS LKIGRWEYKSR+EGDLVAKCYYAKHKLVWEIL+GGLKSKIEIQWSDIM LKANCPDDGPA LNVVL RRPLFFRE
Subjt:  KKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRE

Query:  TNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQ
        TNPQPRKHTLWQATADFTDGEAS+ RQHF+QCP GLLNKHFEKL+QCD+RLNFLSRQP IVLGS YFEPRAS FTT EQASI GLEQA N N+S+LS FQ
Subjt:  TNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQ

Query:  DGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGS-E
        D  SS+ A+SL IEQASPQMVFEP T+E PSPSSVMDAHEIEEN S  KVTS  RNWE +KVPG+HPSMSMSDLVNHI  HITEQM STK+PFVDDGS E
Subjt:  DGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGS-E

Query:  CQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIHPEETKDVSGSIQS
         Q ML+DIA+YLLSDNQLSA SDE SLMSRV+SLCCLLQKEP  VQSSQ +G +  EG ++K+D      A+LRDG++I E HI I P +    SGSIQ+
Subjt:  CQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIHPEETKDVSGSIQS

Query:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD
        S+MSRKDS+ +LLLHLPRIASLPKFLF+ISDG+E QD
Subjt:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

XP_038879515.1 uncharacterized protein LOC120071357 isoform X1 [Benincasa hispida]

5.2e-239

80.33

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST--SGDSNSETFDFVVK
        MTLYPEKL VKRE DDSFH E   LDKRFKPDFH+S+SGP TL ATSS NNPLDEPSPLGL LRKSPSLLDLIQMKLSQG AST  +G SN+ETF+FVVK
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST--SGDSNSETFDFVVK

Query:  KESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRET
         ES+D TVPG+ EKLKASNFPAS L+IGRWEYKSR+EGDLVAKCYYAKHKLVWEIL+GGLKSKIEIQWSDIMAL ANCPDDGPA LNVVL RRPLFFRET
Subjt:  KESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRET

Query:  NPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQD
        NPQPRKHTLWQATADFTDGEAS+QRQHFLQCP GLLNKHFEKLIQCD+RLNFLSRQPEIVLGS YFEP AS FTT +QASI GLEQAENDN+S+LSTFQD
Subjt:  NPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQD

Query:  GASSSAASSLKIEQASPQMVFEPCTLEVPSPSS-------------VMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTS
          SSSA SSLKIE+ASPQMVFEP T+E PSPSS             VMDAHEIEENRS TKVT   RNWEQ+KVPG+HPS+SMSDLVNHI  HITEQM S
Subjt:  GASSSAASSLKIEQASPQMVFEPCTLEVPSPSS-------------VMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTS

Query:  TKSPFVDDGS-ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKD
        TK+PFVD+GS E Q ML+DIA+YLLSDNQLSAASDE SLMSRVDSLCCLLQKEP  VQSSQ +G +CVEG++ ++D A LRDG++I E HIKIHPE T++
Subjt:  TKSPFVDDGS-ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKD

Query:  VSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD
        VSGSIQ+SAMSRKDS+ DLLLHLPRIASLPK LF+ISDG+E QD
Subjt:  VSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

XP_038879516.1 uncharacterized protein LOC120071357 isoform X2 [Benincasa hispida]

8.5e-242

82.3

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST--SGDSNSETFDFVVK
        MTLYPEKL VKRE DDSFH E   LDKRFKPDFH+S+SGP TL ATSS NNPLDEPSPLGL LRKSPSLLDLIQMKLSQG AST  +G SN+ETF+FVVK
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST--SGDSNSETFDFVVK

Query:  KESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRET
         ES+D TVPG+ EKLKASNFPAS L+IGRWEYKSR+EGDLVAKCYYAKHKLVWEIL+GGLKSKIEIQWSDIMAL ANCPDDGPA LNVVL RRPLFFRET
Subjt:  KESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRET

Query:  NPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQD
        NPQPRKHTLWQATADFTDGEAS+QRQHFLQCP GLLNKHFEKLIQCD+RLNFLSRQPEIVLGS YFEP AS FTT +QASI GLEQAENDN+S+LSTFQD
Subjt:  NPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQD

Query:  GASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGS-EC
          SSSA SSLKIE+ASPQMVFEP T+E PSPSSVMDAHEIEENRS TKVT   RNWEQ+KVPG+HPS+SMSDLVNHI  HITEQM STK+PFVD+GS E 
Subjt:  GASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGS-EC

Query:  QEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRK
        Q ML+DIA+YLLSDNQLSAASDE SLMSRVDSLCCLLQKEP  VQSSQ +G +CVEG++ ++D A LRDG++I E HIKIHPE T++VSGSIQ+SAMSRK
Subjt:  QEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRK

Query:  DSFADLLLHLPRIASLPKFLFNISDGNEDQD
        DS+ DLLLHLPRIASLPK LF+ISDG+E QD
Subjt:  DSFADLLLHLPRIASLPKFLFNISDGNEDQD

TrEMBL top hits

e value

%identity

Alignment

A0A1S3B8H0 uncharacterized protein LOC103487331 isoform X1

1.5e-220

75.27

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH--QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVV
        +TL+ +K  VKRECDDSFH E    DKRFKPD H  QS+ G  TL +TSS NNPLDEPSPLGL LRKSPSLLDLIQMKLSQG +ST +G SN+ETFDFVV
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH--QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVV

Query:  KKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRE
        K ES+D TVPG+ EKLKASNFPAS LKIGRWEYKSR+EGDLVAKCYYAKHKLVWEIL+GGLKSKIEIQWSDIM LKANCPDDGPA LNVVL RRPLFFRE
Subjt:  KKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRE

Query:  TNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQ
        TNPQPRKHTLWQATADFTDGEAS+ RQHF+QCP GLLNKHFEKL+QCD+RLNFLSRQP IVLGS YFEPRAS FTT EQASI GLEQA N N+S+LS FQ
Subjt:  TNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQ

Query:  DGASSSAASSLKIEQASPQMVFEPCTLEVPSPSS-------------VMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMT
        D  SS+ A+SL IEQASPQMVFEP T+E PSPSS             VMDAHEIEEN S  KVTS  RNWE +KVPG+HPSMSMSDLVNHI  HITEQM 
Subjt:  DGASSSAASSLKIEQASPQMVFEPCTLEVPSPSS-------------VMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMT

Query:  STKSPFVDDGS-ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIH
        STK+PFVDDGS E Q ML+DIA+YLLSDNQLSA SDE SLMSRV+SLCCLLQKEP  VQSSQ +G +  EG ++K+D      A+LRDG++I E HI I 
Subjt:  STKSPFVDDGS-ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIH

Query:  PEETKDVSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD
        P +    SGSIQ+S+MSRKDS+ +LLLHLPRIASLPKFLF+ISDG+E QD
Subjt:  PEETKDVSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

A0A1S3B8X8 uncharacterized protein LOC103487331 isoform X2

1.2e-220

75.41

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH-QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVVK
        +TL+ +K  VKRECDDSFH E    DKRFKPD H QS+ G  TL +TSS NNPLDEPSPLGL LRKSPSLLDLIQMKLSQG +ST +G SN+ETFDFVVK
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH-QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVVK

Query:  KESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRET
         ES+D TVPG+ EKLKASNFPAS LKIGRWEYKSR+EGDLVAKCYYAKHKLVWEIL+GGLKSKIEIQWSDIM LKANCPDDGPA LNVVL RRPLFFRET
Subjt:  KESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRET

Query:  NPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQD
        NPQPRKHTLWQATADFTDGEAS+ RQHF+QCP GLLNKHFEKL+QCD+RLNFLSRQP IVLGS YFEPRAS FTT EQASI GLEQA N N+S+LS FQD
Subjt:  NPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQD

Query:  GASSSAASSLKIEQASPQMVFEPCTLEVPSPSS-------------VMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTS
          SS+ A+SL IEQASPQMVFEP T+E PSPSS             VMDAHEIEEN S  KVTS  RNWE +KVPG+HPSMSMSDLVNHI  HITEQM S
Subjt:  GASSSAASSLKIEQASPQMVFEPCTLEVPSPSS-------------VMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTS

Query:  TKSPFVDDGS-ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIHP
        TK+PFVDDGS E Q ML+DIA+YLLSDNQLSA SDE SLMSRV+SLCCLLQKEP  VQSSQ +G +  EG ++K+D      A+LRDG++I E HI I P
Subjt:  TKSPFVDDGS-ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIHP

Query:  EETKDVSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD
         +    SGSIQ+S+MSRKDS+ +LLLHLPRIASLPKFLF+ISDG+E QD
Subjt:  EETKDVSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

A0A1S3B908 uncharacterized protein LOC103487331 isoform X3

2.5e-223

77.09

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH--QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVV
        +TL+ +K  VKRECDDSFH E    DKRFKPD H  QS+ G  TL +TSS NNPLDEPSPLGL LRKSPSLLDLIQMKLSQG +ST +G SN+ETFDFVV
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFH--QSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIAST-SGDSNSETFDFVV

Query:  KKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRE
        K ES+D TVPG+ EKLKASNFPAS LKIGRWEYKSR+EGDLVAKCYYAKHKLVWEIL+GGLKSKIEIQWSDIM LKANCPDDGPA LNVVL RRPLFFRE
Subjt:  KKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRE

Query:  TNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQ
        TNPQPRKHTLWQATADFTDGEAS+ RQHF+QCP GLLNKHFEKL+QCD+RLNFLSRQP IVLGS YFEPRAS FTT EQASI GLEQA N N+S+LS FQ
Subjt:  TNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQ

Query:  DGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGS-E
        D  SS+ A+SL IEQASPQMVFEP T+E PSPSSVMDAHEIEEN S  KVTS  RNWE +KVPG+HPSMSMSDLVNHI  HITEQM STK+PFVDDGS E
Subjt:  DGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGS-E

Query:  CQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIHPEETKDVSGSIQS
         Q ML+DIA+YLLSDNQLSA SDE SLMSRV+SLCCLLQKEP  VQSSQ +G +  EG ++K+D      A+LRDG++I E HI I P +    SGSIQ+
Subjt:  CQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIHPEETKDVSGSIQS

Query:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD
        S+MSRKDS+ +LLLHLPRIASLPKFLF+ISDG+E QD
Subjt:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

A0A6J1C1F5 uncharacterized protein LOC111007116 isoform X1

4.4e-220

77.47

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKE
        M L PEK AVKR+CDDSF +  G LDKRFKPDFH              QNNP DEPSPLGLTLRKSPSLLDLIQMKLS G AST+G SNSE FDF+VKKE
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKE

Query:  SRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNP
         +D T+PG+TEKLKASNFPAS LKIGRWEYKSRYEGDLVAKCYYAKHKLVWEIL+GGLKSKIEIQWSDIMALKANCPDDGP TLNVVL R PLFFRETNP
Subjt:  SRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNP

Query:  QPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGA
        QPRKHTLWQATADFTDGEASM+RQHFLQCPQGLLNKHFEKLIQCD+ LNFLS+QPEIVLGS YFEP+AS FTT EQAS  GLE+AE+  R  L TFQ  A
Subjt:  QPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGA

Query:  SSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEM
        S S ASSLKIEQ SPQMV EPCTLEVPSPSSVMD HEIEENRS TKVT   RNWEQ+KVPG+HPSMSMSDLVNHI  HITEQM ST  PFVD GSE Q M
Subjt:  SSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEM

Query:  LNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIH---PEETKDVSGSIQS-
        L++IA YLL+DNQ SAASDE  L SRVDSLCCLL KEPAAVQS Q S  SCV G D KED     AA+LRD ++ M  HIK+H    EETKDVS S Q+ 
Subjt:  LNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKED-----AAKLRDGRSIMESHIKIH---PEETKDVSGSIQS-

Query:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD
        +A+SRKDSF DLLLHLPRI SLPKFLFNISDG+E QD
Subjt:  SAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

A0A6J1KT49 uncharacterized protein LOC111497989

2.0e-220

76.33

Show/hide

Query:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKE
        MTLYPEK AVKRECDDSFH    HLDKRFKPDF               +NNP+DEPSPLGLTLRKSPSLLDLIQM+LSQGI ST+GDSNSETFDF+V+KE
Subjt:  MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKE

Query:  SRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNP
        +  +T+ G+TEKLKASNFPASHLKIGRWEYK R+EGDLVAKCYYAKHKLVWEIL+GGLKSKIE+QWSDIMALKANCPDDGPATLNVVL RRPLFFRETNP
Subjt:  SRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNP

Query:  QPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGA
        QPRKHTLWQATADFT GEASMQRQHFLQCPQG LNKHFEKLIQCD+RLNFLSRQPEI  GS YFEP ASGFTTFEQASI GLEQ  NDNRSV+       
Subjt:  QPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGA

Query:  SSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEM
                                           HE+EENRS TKV+SM+RNWEQ+KV G+HPSMSMSDLVNHI QHI+EQMT TKSPF DDGSECQEM
Subjt:  SSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEM

Query:  LNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSF
        LN+I RYLLSDNQLSAASDEASLMSRVDSLCCLLQKEP AVQS   SG   VEG D KED  +LRDGR+  ESHIKIHP+ETKDVSGSIQ SAMSRKDSF
Subjt:  LNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSF

Query:  ADLLLHLPRIASLPKFLFNISDGNEDQD
        ADL+LHLPRIASLPKFLFNISDG+ED+D
Subjt:  ADLLLHLPRIASLPKFLFNISDGNEDQD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G54300.1 unknown protein

3.3e-26

43.29

Show/hide

Query:  NFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDG-------GLKSKIEIQWSDIMALKANCPD-DGPATLNVVLGRRPLFFRETNPQPRKHTLW
        NFP S ++IG W   ++   D+VAK Y+AK KL+WE L G        LK KIEIQW+D+ + + +    D    L + L +RP FF ETNPQ  KHT W
Subjt:  NFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDG-------GLKSKIEIQWSDIMALKANCPD-DGPATLNVVLGRRPLFFRETNPQPRKHTLW

Query:  -QATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGF
         Q   DFT   AS  R+H L  P G+L K+ EKL+  D+  + L   P  V  S YF+   SGF
Subjt:  -QATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGF

AT2G24100.1 unknown protein

8.8e-112

47.88

Show/hide

Query:  YPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKESRD
        +P KL +    +DS  +E   L+KR K      +    T   + S+ + L+EPSPLGL+L+KSPS  +LI+MKLSQ    +  DSNS      VKKES  
Subjt:  YPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKESRD

Query:  ITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNPQPR
            G+ EKLKASNFPA+ L+IG+WEYKSRYEGDLVAKCY+AKHKLVWE+L+ GLKSKIEIQWSDIMALKAN P+D P TL +VL RRPLFFRETNPQPR
Subjt:  ITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNPQPR

Query:  KHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGASSS
        KHTLWQAT+DFTDG+ASM RQHFLQCP G++NKHFEKL+QCD RL  LSRQPEI L + +F+ R S    FE  S+ G                   S +
Subjt:  KHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGASSS

Query:  AASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRN-WEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEMLN
         AS +  + +S  +      L   SPSSVMDA  IE    +  + S + N W Q+K+PG+H S+SM+D +  +                D   E  +   
Subjt:  AASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSRN-WEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEMLN

Query:  DIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSFAD
        ++ + LLSDN  +  SDE S+MS+V+S C LLQ    +  + + +    V G D+     +   G+ +++             S S     MSRKDSF+D
Subjt:  DIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAAVQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSFAD

Query:  LLLHLPRIASLPKFLFNISD
        LL+HLPRI SLPKFLFNIS+
Subjt:  LLLHLPRIASLPKFLFNISD

AT3G05770.1 unknown protein

5.3e-32

40.09

Show/hide

Query:  SQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKH
        + N  +DE   L L L K+P L++ I+  L   +  T     +E         S+  T+P S EKLKA NFP S +KIG   + ++   D+VAK Y+AK 
Subjt:  SQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKESRDITVPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKH

Query:  KLVWEILDG-------GLKSKIEIQWSDIMALKANCPD-DGPATLNVVLGRRPLFFRETNPQPRKHTLW-QATADFTDGEASMQRQHFLQCPQGLLNKHF
        KL+WE L G        LKSKIEIQW+D+ + + +    D    L + L +RP FF ETNPQ  KHT W Q   DFT  +AS  R+H L  P G+L K+ 
Subjt:  KLVWEILDG-------GLKSKIEIQWSDIMALKANCPD-DGPATLNVVLGRRPLFFRETNPQPRKHTLW-QATADFTDGEASMQRQHFLQCPQGLLNKHF

Query:  EKLIQCDTRLNFLSRQPEIVLGSSYFE
        EKL+  D+  + L + P  V  S YF+
Subjt:  EKLIQCDTRLNFLSRQPEIVLGSSYFE

AT4G30780.1 unknown protein

8.8e-112

45.56

Show/hide

Query:  EKLAVKRE-CDDSFHDERGHLDKR---FKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQ-GIASTSGDSNSETFDFVVKKE
        ++L VK E  +D   +E G L+KR   + P    S   PA       + NPLDEPSPLGL+L+KSPSLL+LIQMK++  G    +    +      +K+E
Subjt:  EKLAVKRE-CDDSFHDERGHLDKR---FKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQ-GIASTSGDSNSETFDFVVKKE

Query:  SRDIT---------VPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRR
        S+ I           PGS EKLKASNFPAS LKIG+WEYKSRYEGDLVAKCY+AKHKLVWE+L+ GLKSKIEIQWSDIMALKANCP+DGP TL +VL R+
Subjt:  SRDIT---------VPGSTEKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRR

Query:  PLFFRETNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRS
        PLFFRETNPQPRKHTLWQAT+DFTDG+ASM RQHFLQC QG++NKHFEKL+QCD RL  LSRQPEI + S YF+ R S    FE  S        N N S
Subjt:  PLFFRETNPQPRKHTLWQATADFTDGEASMQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRS

Query:  VLSTFQDGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSR-NWEQLKVPGVHPSMSMSDLVNHI---------------
           +     + + AS +  + +S  M     + E PSPSSV+DA   E    +  V S +R +  Q++ PG+H SMS+SD +  +               
Subjt:  VLSTFQDGASSSAASSLKIEQASPQMVFEPCTLEVPSPSSVMDAHEIEENRSTTKVTSMSR-NWEQLKVPGVHPSMSMSDLVNHI---------------

Query:  ------------------EQHITE---------QMTSTKSPFVD------DGS--ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAA
                           ++IT+           + + S FV        GS  E  E    + + LLSDN    A DE SLM RV+SL  LL K+P  
Subjt:  ------------------EQHITE---------QMTSTKSPFVD------DGS--ECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAA

Query:  VQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNED
          +SQ +    V      E    + D  +   ++ ++      D + S +   M RKDSF+DLLLHLPRI SLPKFL NIS+ + D
Subjt:  VQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNED

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGTTGTATCCGGAGAAATTAGCGGTGAAGCGGGAGTGTGATGATTCTTTTCACGACGAGCGTGGTCACTTGGACAAGCGGTTCAAGCCCGATTTTCATCAGTCGAT
TTCGGGACCTGCCACATTACCTGCAACCTCTTCACAGAATAATCCGCTTGATGAGCCTAGTCCTCTTGGTTTGACACTAAGGAAGAGCCCGTCCCTATTGGATCTAATTC
AGATGAAACTCTCACAGGGGATTGCGTCTACTTCTGGAGATTCGAACAGTGAAACTTTTGACTTCGTGGTTAAAAAAGAAAGCAGGGACATTACCGTGCCGGGTTCCACT
GAGAAACTAAAGGCTTCAAACTTCCCAGCTTCACATTTAAAGATTGGACGTTGGGAGTATAAATCAAGATATGAAGGTGATCTCGTGGCTAAGTGTTACTATGCTAAGCA
TAAGCTTGTTTGGGAAATCCTTGACGGTGGACTCAAAAGTAAAATAGAGATACAATGGTCAGATATTATGGCTTTAAAAGCTAATTGTCCTGATGATGGACCTGCTACAC
TAAATGTTGTGCTGGGTAGACGACCTCTTTTCTTCAGGGAGACCAACCCACAACCAAGGAAGCATACTTTGTGGCAGGCAACAGCTGACTTTACGGACGGTGAGGCCAGC
ATGCAGAGGCAGCATTTTCTGCAATGCCCTCAAGGGCTTCTAAACAAGCATTTTGAAAAGCTCATCCAATGTGACACACGCCTAAACTTCTTAAGCCGCCAACCAGAGAT
TGTGTTGGGTTCTTCATATTTTGAACCAAGAGCCTCTGGCTTTACGACCTTTGAGCAAGCCAGCATCGGTGGTTTGGAGCAAGCAGAGAACGACAATCGATCAGTACTTT
CTACTTTCCAGGATGGAGCTTCATCATCTGCTGCATCATCATTGAAGATTGAACAGGCCTCTCCTCAAATGGTGTTTGAACCTTGCACCCTGGAGGTGCCTTCCCCCAGT
TCAGTGATGGATGCTCATGAGATTGAAGAAAATAGAAGCACTACTAAAGTAACCAGCATGTCAAGAAACTGGGAGCAGTTAAAGGTTCCGGGGGTTCATCCATCCATGTC
AATGAGCGACCTCGTAAACCACATTGAACAGCACATTACAGAACAAATGACTTCTACAAAGTCACCATTTGTTGACGATGGTTCGGAATGCCAAGAAATGCTGAATGATA
TTGCACGTTACTTGCTGAGTGACAATCAATTGTCAGCAGCTTCTGATGAGGCATCACTGATGTCAAGAGTCGATTCTCTGTGTTGCCTGTTGCAGAAAGAACCTGCTGCA
GTTCAAAGTTCTCAACCCAGCGGTGGAAGCTGTGTTGAAGGATCCGATTCGAAAGAGGATGCCGCCAAGTTGAGAGATGGCAGGAGTATTATGGAAAGCCATATTAAGAT
TCATCCAGAGGAAACAAAGGATGTTTCTGGAAGCATACAATCCTCTGCTATGTCGAGGAAAGATTCATTTGCGGATTTGCTGTTGCATCTTCCCCGAATTGCATCGCTCC
CTAAGTTCTTGTTTAACATTTCAGATGGTAATGAAGATCAAGATTAA

mRNA sequence

Show/hide mRNA sequence

CTCGATCAAAAACCAAGTACGTGGGAGTTTCTATTCGGCACGTGTTGGTACAAGCGGTCTCCTTCGCCGCCAAGCGCCGACGACAACTTCCACTCTGAATTTAATCTCCT
ACTTATTTAATTCTAGGGTTCGTAAACTTCTCCTTTCTTACTAATTCTTCCCTTCTTCTTTCGATTCCGAAAGGTTTTGTTGCGTTTTTCGAATATCATTGGTGCAATTT
GTGGATTCCAAGATGACGTTGTATCCGGAGAAATTAGCGGTGAAGCGGGAGTGTGATGATTCTTTTCACGACGAGCGTGGTCACTTGGACAAGCGGTTCAAGCCCGATTT
TCATCAGTCGATTTCGGGACCTGCCACATTACCTGCAACCTCTTCACAGAATAATCCGCTTGATGAGCCTAGTCCTCTTGGTTTGACACTAAGGAAGAGCCCGTCCCTAT
TGGATCTAATTCAGATGAAACTCTCACAGGGGATTGCGTCTACTTCTGGAGATTCGAACAGTGAAACTTTTGACTTCGTGGTTAAAAAAGAAAGCAGGGACATTACCGTG
CCGGGTTCCACTGAGAAACTAAAGGCTTCAAACTTCCCAGCTTCACATTTAAAGATTGGACGTTGGGAGTATAAATCAAGATATGAAGGTGATCTCGTGGCTAAGTGTTA
CTATGCTAAGCATAAGCTTGTTTGGGAAATCCTTGACGGTGGACTCAAAAGTAAAATAGAGATACAATGGTCAGATATTATGGCTTTAAAAGCTAATTGTCCTGATGATG
GACCTGCTACACTAAATGTTGTGCTGGGTAGACGACCTCTTTTCTTCAGGGAGACCAACCCACAACCAAGGAAGCATACTTTGTGGCAGGCAACAGCTGACTTTACGGAC
GGTGAGGCCAGCATGCAGAGGCAGCATTTTCTGCAATGCCCTCAAGGGCTTCTAAACAAGCATTTTGAAAAGCTCATCCAATGTGACACACGCCTAAACTTCTTAAGCCG
CCAACCAGAGATTGTGTTGGGTTCTTCATATTTTGAACCAAGAGCCTCTGGCTTTACGACCTTTGAGCAAGCCAGCATCGGTGGTTTGGAGCAAGCAGAGAACGACAATC
GATCAGTACTTTCTACTTTCCAGGATGGAGCTTCATCATCTGCTGCATCATCATTGAAGATTGAACAGGCCTCTCCTCAAATGGTGTTTGAACCTTGCACCCTGGAGGTG
CCTTCCCCCAGTTCAGTGATGGATGCTCATGAGATTGAAGAAAATAGAAGCACTACTAAAGTAACCAGCATGTCAAGAAACTGGGAGCAGTTAAAGGTTCCGGGGGTTCA
TCCATCCATGTCAATGAGCGACCTCGTAAACCACATTGAACAGCACATTACAGAACAAATGACTTCTACAAAGTCACCATTTGTTGACGATGGTTCGGAATGCCAAGAAA
TGCTGAATGATATTGCACGTTACTTGCTGAGTGACAATCAATTGTCAGCAGCTTCTGATGAGGCATCACTGATGTCAAGAGTCGATTCTCTGTGTTGCCTGTTGCAGAAA
GAACCTGCTGCAGTTCAAAGTTCTCAACCCAGCGGTGGAAGCTGTGTTGAAGGATCCGATTCGAAAGAGGATGCCGCCAAGTTGAGAGATGGCAGGAGTATTATGGAAAG
CCATATTAAGATTCATCCAGAGGAAACAAAGGATGTTTCTGGAAGCATACAATCCTCTGCTATGTCGAGGAAAGATTCATTTGCGGATTTGCTGTTGCATCTTCCCCGAA
TTGCATCGCTCCCTAAGTTCTTGTTTAACATTTCAGATGGTAATGAAGATCAAGATTAATTTAGTTGCAAGCTAATTTTCAAGGTCTTTGGATAGTATGAGGAATGGGGA
TTCTGGAATTTGTAGCACGTAGAAGAATCCTTTACGTGTAAAAATTCTTTTATTAGGTTCACAGTCAATTGACCACAGAACGGTTACTATTGTACACAGAATGGGTTTGA
ATTGATTATATTTAAGGGTCGAATGATAAATCTAGTTGTATTTTAA

Protein sequence

Show/hide protein sequence

MTLYPEKLAVKRECDDSFHDERGHLDKRFKPDFHQSISGPATLPATSSQNNPLDEPSPLGLTLRKSPSLLDLIQMKLSQGIASTSGDSNSETFDFVVKKESRDITVPGST
EKLKASNFPASHLKIGRWEYKSRYEGDLVAKCYYAKHKLVWEILDGGLKSKIEIQWSDIMALKANCPDDGPATLNVVLGRRPLFFRETNPQPRKHTLWQATADFTDGEAS
MQRQHFLQCPQGLLNKHFEKLIQCDTRLNFLSRQPEIVLGSSYFEPRASGFTTFEQASIGGLEQAENDNRSVLSTFQDGASSSAASSLKIEQASPQMVFEPCTLEVPSPS
SVMDAHEIEENRSTTKVTSMSRNWEQLKVPGVHPSMSMSDLVNHIEQHITEQMTSTKSPFVDDGSECQEMLNDIARYLLSDNQLSAASDEASLMSRVDSLCCLLQKEPAA
VQSSQPSGGSCVEGSDSKEDAAKLRDGRSIMESHIKIHPEETKDVSGSIQSSAMSRKDSFADLLLHLPRIASLPKFLFNISDGNEDQD

Tan0022523 (gene) of Snake gourd v1 genome