CuGenDBv2

Gene ID	Tan0000370
Organism	Trichosanthes anguina (Snake gourd v1)
Description	Transposase
Genome location	LG04:17468592..17471495
RNA-Seq Expression	Tan0000370
Synteny	Tan0000370
Gene Ontology terms	NA
InterPro domains	IPR004264 - Transposase, Tnp1/En/Spm-like IPR038765 - Papain-like cysteine peptidase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022136076.1 uncharacterized protein LOC111007859 isoform X1 [Momordica charantia]

3.3e-200

55.51

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE +V I  E +   RRG TTM  L  +R +G+R  I+YN+QGQ +G+NA +M+S+IGVCVRQ+IP+TY  WKEVPQELKDKIF  VE SFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
        +SK+ ILQSA+ KFRTF+ TL + +ILPFKDE   L++ P+KY HIDQ QW +FVNA LSEEWE  SR  KE R KC YNHHISRKGYANLA+EL+L+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS
         S RA LW +ARKGKNNEYFDD T++CA RIDELA  +KG+D+LTEALGT EH GRVRG+G  V PS YFN+ + K K+ +   N       +PSKK + 
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS

Query:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV
              K KE++N  EEI       +E  PCHLA+ S DN+V VGT++ ++ Q PTVHGVPLGV+NVRV+VD+++ E A +PIP+RGE+E+L+Q+IG FV
Subjt:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV

Query:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV
        AWPR LVI ++ K    S    T +  +K+TD HV+IKLLNRY MLSMQ +DT+++ LSK +FG+EK IYL  +DI+ YC M+EIGYSCI+ Y+AYLW V
Subjt:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV

Query:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP
         +YEI  KF +VD  TI  +VKSQE R  NLANRLEMVN  L+Q V I Y +G                                   SL++WQAKHS+ 
Subjt:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP

Query:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
        +Y +   WK +KCP Q  SVECGYYVQKYIREI+ N+S  I N +   K AY+QEEIDE+R++WADFVG  V
Subjt:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

XP_022136077.1 uncharacterized protein LOC111007859 isoform X2 [Momordica charantia]

6.2e-199

55.51

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE +V I  E +   RRG TTM  L  +R +G+R  I+YN+QGQ +G+NA +M+S+IGVCVRQ+IP+TY  WKEVPQELKDKIF  VE SFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
        +SK+ ILQSA+ KFRTF+ TL + +ILPFKDE   L++ P+KY HIDQ QW +FVNA LSEEWE  SR  KE R KC YNHHISRKGYANLA+EL+L+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS
         S RA LW +ARKGKNNEYFDD T++CA RIDELA  +KG+D+LTEALGT EH GRVRG+G  V PS YFN+ + K K+ +   N       +PSKK + 
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS

Query:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV
              K KE++N  EEI       +E  PCHLA+ S DN+V VGT++ ++ Q PTVHGVPLGV+NVRV+VD+++ E A +PIP+RGE+E+L+Q+IG FV
Subjt:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV

Query:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV
        AWPR LVI ++ K    S    T +  +K+TD HV+IKLLNRY MLSMQ +DT+++ LSK +FG+EK IYL  +DI+ YC M+EIGYSCI+ Y+AYLW V
Subjt:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV

Query:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP
         +YEI  KF +VD  TI  +VKSQE R  NLANRLEMVN  L+Q V I Y +G                                   SL++WQAKHS+ 
Subjt:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP

Query:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
        +Y +   WK +KCP Q  SVECGYYVQKYIREI+ N+S  I N +   K AY+QEEIDE+R++WADFVG  V
Subjt:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

XP_022136079.1 uncharacterized protein LOC111007859 isoform X3 [Momordica charantia]

7.1e-203

57.47

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE +V I  E +   RRG TTM  L  +R +G+R  I+YN+QGQ +G+NA +M+S+IGVCVRQ+IP+TY  WKEVPQELKDKIF  VE SFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
        +SK+ ILQSA+ KFRTF+ TL + +ILPFKDE   L++ P+KY HIDQ QW +FVNA LSEEWE  SR  KE R KC YNHHISRKGYANLA+EL+L+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS
         S RA LW +ARKGKNNEYFDD T++CA RIDELA  +KG+D+LTEALGT EH GRVRG+G  V PS YFN+ + K K+ +   N       +PSKK + 
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS

Query:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV
              K KE++N  EEI       +E  PCHLA+ S DN+V VGT++ ++ Q PTVHGVPLGV+NVRV+VD+++ E A +PIP+RGE+E+L+Q+IG FV
Subjt:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV

Query:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV
        AWPR LVI ++ K    S    T +  +K+TD HV+IKLLNRY MLSMQ +DT+++ LSK +FG+EK IYL  +DI+ YC M+EIGYSCI+ Y+AYLW V
Subjt:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV

Query:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECG
         +YEI  KF +VD  TI  +VKSQE R  NLANRLEMVN  L+Q V I Y +G            SL++WQAKHS+ +Y +   WK +KCP Q  SVECG
Subjt:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECG

Query:  YYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
        YYVQKYIREI+ N+S  I N +   K AY+QEEIDE+R++WADFVG  V
Subjt:  YYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

XP_038895921.1 uncharacterized protein LOC120084092 isoform X1 [Benincasa hispida]

1.3e-196

53.8

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE NV I+ E + T RRG T M  L  +R  GER  I+YN+ GQ VG+NA +M+S+IGVCVRQQIPLTY +WK VPQELKD IF  ++MSFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
         SK+ ILQSA+ KFRTF+ TL Q++ILP+KDE S L++ P+KYSHID+ QWE+FV A LSEEWE  S  Q+E+R KC YNHHISRKGYANLA+ELEL+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---------------
           RATLW +ARK KNNEY D  T++CA RIDELA   KG+D+LTEALGTPEHRGR+RG+G  V P+ ++N+ + K K  +ES N               
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---------------

Query:  -------------IMSCSPSKKSASIGSNHLKDKE------VINDVEEILERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVG
                     ++     +K    G N  K K+      V+ D EEILE  PCHLAI S DN+V VGTM+ SDAQ P+++ +PLG +NVR +VD+++G
Subjt:  -------------IMSCSPSKKSASIGSNHLKDKE------VINDVEEILERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVG

Query:  EDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDI
        ED  LPIP + ++++L Q+IGNFVAWPR LVI  K KK+   +     + S+KYTD HVTIKLLNRYAM SMQ DD IQ+ LS+ + G+EK IYL  DDI
Subjt:  EDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDI

Query:  LHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------
        + YCGM EIGYSCI+AY+A LW  CD EI  KF +VDQ TI + VK QE R  NL NRLEMV+  LDQ V I YNTG                       
Subjt:  LHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------

Query:  -------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
                     SL+ WQAKHSL QY + I WK +KCPRQ  ++ECGYYVQKYIREI+ NS+  I NL    + AY+Q+EID +R++WA+FV RFV
Subjt:  -------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

XP_038895930.1 uncharacterized protein LOC120084092 isoform X2 [Benincasa hispida]

9.9e-197

53.88

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE NV I+ E + T RRG T M  L  +R  GER  I+YN+ GQ VG+NA +M+S+IGVCVRQQIPLTY +WK VPQELKD IF  ++MSFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
         SK+ ILQSA+ KFRTF+ TL Q++ILP+KDE S L++ P+KYSHID+ QWE+FV A LSEEWE  S  Q+E+R KC YNHHISRKGYANLA+ELEL+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---------------
           RATLW +ARK KNNEY D  T++CA RIDELA   KG+D+LTEALGTPEHRGR+RG+G  V P+ ++N+ + K K  +ES N               
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---------------

Query:  -------------IMSCSPSKKSASIGSNHLKDKE------VINDVEEILERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVG
                     ++     +K    G N  K K+      V+ D EEILE  PCHLAI S DN+V VGTM+ SDAQ P+++ +PLG +NVR +VD+++G
Subjt:  -------------IMSCSPSKKSASIGSNHLKDKE------VINDVEEILERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVG

Query:  EDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDI
        ED  LPIP + ++++L Q+IGNFVAWPR LVI  K KK+   +     + S+KYTD HVTIKLLNRYAM SMQ DD IQ+ LS+ + G+EK IYL  DDI
Subjt:  EDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDI

Query:  LHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------
        + YCGM EIGYSCI+AY+A LW  CD EI  KF +VDQ TI + VK QE R  NL NRLEMV+  LDQ V I YNTG                       
Subjt:  LHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------

Query:  ------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
                    SL+ WQAKHSL QY + I WK +KCPRQ  ++ECGYYVQKYIREI+ NS+  I NL    + AY+Q+EID +R++WA+FV RFV
Subjt:  ------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BRX5 uncharacterized protein LOC103493028 isoform X1

1.6e-192

51.83

Show/hide

Query:  SSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDPQS
        SS DE NV I+ E + T RRG T M  L  +R  GER  I+YN++GQ VG+NA +M+S+IGVCVRQQIP+TY +WKEVPQELKD IF  ++MSFV+D  S
Subjt:  SSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDPQS

Query:  KNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAEDTS
        K+ ILQSA+ KFR+F+ TL Q +ILP+KDE S L++ P+KYSHID+ QWE+FV A LSEEWE  S  Q+E+R KC YNHHISRKGYANLA+ELEL+ D  
Subjt:  KNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAEDTS

Query:  TRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKES-------------------
         RATLW +ARK KNN  FDD T++C  RIDELA   KG+D+LTEALGTPEHRGR+RG+G  V P+ + N+ R   K S++S                   
Subjt:  TRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKES-------------------

Query:  ------------------GNIMSCSPSKKSASIGSNHLKDKEVINDVEEILE------------RTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLG
                           ++       K    G    K K V+ + EE LE              PCHLAI S DNVV VG M+ SD Q PT+HG+PLG
Subjt:  ------------------GNIMSCSPSKKSASIGSNHLKDKEVINDVEEILE------------RTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLG

Query:  VENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMF
         EN+RV VD+ + ED  LPIP++G++E+L+Q+IGNFVAWPR LVI  K KK+  ++    T+ S+KYTD HVTIKLLNRYAM +MQ +D IQ++LS+H+F
Subjt:  VENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMF

Query:  GEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG----------
        G+EK IYL  DDI+ YCGM EIGYSCI+ Y+A LW VC+ EI  +F LVDQ TI + +KSQE R  NL NRLEM N  LDQ V I YNTG          
Subjt:  GEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG----------

Query:  --------------------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRV
                                  SL+ WQ +HS   Y S I WK +KCPR   S+ECGYYVQKY+RE++ N++  I NL      AY QEEID +RV
Subjt:  --------------------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRV

Query:  QWADFVGRFV
        +WA+FV RFV
Subjt:  QWADFVGRFV

A0A5D3CYL9 ULP_PROTEASE domain-containing protein

1.6e-192

51.83

Show/hide

Query:  SSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDPQS
        SS DE NV I+ E + T RRG T M  L  +R  GER  I+YN++GQ VG+NA +M+S+IGVCVRQQIP+TY +WKEVPQELKD IF  ++MSFV+D  S
Subjt:  SSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDPQS

Query:  KNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAEDTS
        K+ ILQSA+ KFR+F+ TL Q +ILP+KDE S L++ P+KYSHID+ QWE+FV A LSEEWE  S  Q+E+R KC YNHHISRKGYANLA+ELEL+ D  
Subjt:  KNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAEDTS

Query:  TRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKES-------------------
         RATLW +ARK KNN  FDD T++C  RIDELA   KG+D+LTEALGTPEHRGR+RG+G  V P+ + N+ R   K S++S                   
Subjt:  TRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKES-------------------

Query:  ------------------GNIMSCSPSKKSASIGSNHLKDKEVINDVEEILE------------RTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLG
                           ++       K    G    K K V+ + EE LE              PCHLAI S DNVV VG M+ SD Q PT+HG+PLG
Subjt:  ------------------GNIMSCSPSKKSASIGSNHLKDKEVINDVEEILE------------RTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLG

Query:  VENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMF
         EN+RV VD+ + ED  LPIP++G++E+L+Q+IGNFVAWPR LVI  K KK+  ++    T+ S+KYTD HVTIKLLNRYAM +MQ +D IQ++LS+H+F
Subjt:  VENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKS-DVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMF

Query:  GEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG----------
        G+EK IYL  DDI+ YCGM EIGYSCI+ Y+A LW VC+ EI  +F LVDQ TI + +KSQE R  NL NRLEM N  LDQ V I YNTG          
Subjt:  GEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG----------

Query:  --------------------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRV
                                  SL+ WQ +HS   Y S I WK +KCPR   S+ECGYYVQKY+RE++ N++  I NL      AY QEEID +RV
Subjt:  --------------------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRV

Query:  QWADFVGRFV
        +WA+FV RFV
Subjt:  QWADFVGRFV

A0A6J1C2H7 uncharacterized protein LOC111007859 isoform X1

1.6e-200

55.51

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE +V I  E +   RRG TTM  L  +R +G+R  I+YN+QGQ +G+NA +M+S+IGVCVRQ+IP+TY  WKEVPQELKDKIF  VE SFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
        +SK+ ILQSA+ KFRTF+ TL + +ILPFKDE   L++ P+KY HIDQ QW +FVNA LSEEWE  SR  KE R KC YNHHISRKGYANLA+EL+L+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS
         S RA LW +ARKGKNNEYFDD T++CA RIDELA  +KG+D+LTEALGT EH GRVRG+G  V PS YFN+ + K K+ +   N       +PSKK + 
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS

Query:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV
              K KE++N  EEI       +E  PCHLA+ S DN+V VGT++ ++ Q PTVHGVPLGV+NVRV+VD+++ E A +PIP+RGE+E+L+Q+IG FV
Subjt:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV

Query:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV
        AWPR LVI ++ K    S    T +  +K+TD HV+IKLLNRY MLSMQ +DT+++ LSK +FG+EK IYL  +DI+ YC M+EIGYSCI+ Y+AYLW V
Subjt:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV

Query:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP
         +YEI  KF +VD  TI  +VKSQE R  NLANRLEMVN  L+Q V I Y +G                                   SL++WQAKHS+ 
Subjt:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP

Query:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
        +Y +   WK +KCP Q  SVECGYYVQKYIREI+ N+S  I N +   K AY+QEEIDE+R++WADFVG  V
Subjt:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

A0A6J1C398 uncharacterized protein LOC111007859 isoform X3

3.4e-203

57.47

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE +V I  E +   RRG TTM  L  +R +G+R  I+YN+QGQ +G+NA +M+S+IGVCVRQ+IP+TY  WKEVPQELKDKIF  VE SFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
        +SK+ ILQSA+ KFRTF+ TL + +ILPFKDE   L++ P+KY HIDQ QW +FVNA LSEEWE  SR  KE R KC YNHHISRKGYANLA+EL+L+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS
         S RA LW +ARKGKNNEYFDD T++CA RIDELA  +KG+D+LTEALGT EH GRVRG+G  V PS YFN+ + K K+ +   N       +PSKK + 
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS

Query:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV
              K KE++N  EEI       +E  PCHLA+ S DN+V VGT++ ++ Q PTVHGVPLGV+NVRV+VD+++ E A +PIP+RGE+E+L+Q+IG FV
Subjt:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV

Query:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV
        AWPR LVI ++ K    S    T +  +K+TD HV+IKLLNRY MLSMQ +DT+++ LSK +FG+EK IYL  +DI+ YC M+EIGYSCI+ Y+AYLW V
Subjt:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV

Query:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECG
         +YEI  KF +VD  TI  +VKSQE R  NLANRLEMVN  L+Q V I Y +G            SL++WQAKHS+ +Y +   WK +KCP Q  SVECG
Subjt:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG------------SLRMWQAKHSLPQYHSAITWKLVKCPRQPSSVECG

Query:  YYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
        YYVQKYIREI+ N+S  I N +   K AY+QEEIDE+R++WADFVG  V
Subjt:  YYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

A0A6J1C4J7 uncharacterized protein LOC111007859 isoform X2

3.0e-199

55.51

Show/hide

Query:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP
        S SS DE +V I  E +   RRG TTM  L  +R +G+R  I+YN+QGQ +G+NA +M+S+IGVCVRQ+IP+TY  WKEVPQELKDKIF  VE SFV+D 
Subjt:  SGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDP

Query:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED
        +SK+ ILQSA+ KFRTF+ TL + +ILPFKDE   L++ P+KY HIDQ QW +FVNA LSEEWE  SR  KE R KC YNHHISRKGYANLA+EL+L+ D
Subjt:  QSKNSILQSAANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAED

Query:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS
         S RA LW +ARKGKNNEYFDD T++CA RIDELA  +KG+D+LTEALGT EH GRVRG+G  V PS YFN+ + K K+ +   N       +PSKK + 
Subjt:  TSTRATLWLQARKGKNNEYFDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGN---IMSCSPSKKSAS

Query:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV
              K KE++N  EEI       +E  PCHLA+ S DN+V VGT++ ++ Q PTVHGVPLGV+NVRV+VD+++ E A +PIP+RGE+E+L+Q+IG FV
Subjt:  IGSNHLKDKEVINDVEEI-------LERTPCHLAIRSKDNVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFV

Query:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV
        AWPR LVI ++ K    S    T +  +K+TD HV+IKLLNRY MLSMQ +DT+++ LSK +FG+EK IYL  +DI+ YC M+EIGYSCI+ Y+AYLW V
Subjt:  AWPRDLVIFNKGKKSDVSVHVPT-SHSTKYTDAHVTIKLLNRYAMLSMQEDDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTV

Query:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP
         +YEI  KF +VD  TI  +VKSQE R  NLANRLEMVN  L+Q V I Y +G                                   SL++WQAKHS+ 
Subjt:  CDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTG-----------------------------------SLRMWQAKHSLP

Query:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV
        +Y +   WK +KCP Q  SVECGYYVQKYIREI+ N+S  I N +   K AY+QEEIDE+R++WADFVG  V
Subjt:  QYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGTGGATCAAGTGACGATGAAGTGAACGTTGCGATCCAAATGGAGGCTAGGCATACTAATCGACGTGGTCTCACTACTATGCGTGGTCTGGCACGCGTAAGGATTAT
AGGAGAACGCTTAGTCATCCAATACAACAATCAAGGCCAGAGTGTTGGTGATAATGCAAACCAAATGGAAAGTTATATTGGAGTTTGCGTTAGGCAACAAATTCCATTAA
CTTACACGACTTGGAAAGAAGTTCCCCAAGAATTGAAAGATAAAATTTTTTATTCTGTAGAGATGTCATTTGTGATCGACCCTCAGTCCAAAAATAGTATTCTTCAATCA
GCGGCAAATAAATTTCGAACATTTCGATACACGTTGTATCAAAAACACATACTTCCATTTAAGGATGAGTCGTCCTTGTTGAAACATCTCCCACAAAAGTATTCACATAT
TGATCAAAACCAATGGGAGGCATTTGTGAATGCTACATTATCGGAAGAATGGGAGGCACAAAGTCGTGTACAAAAGGAAAAGAGAGAGAAATGTAAATATAATCATCACA
TCTCTCGCAAAGGATATGCCAACTTAGCTGAAGAACTAGAATTGGCCGAAGATACTTCCACTCGTGCCACCTTATGGTTACAGGCACGAAAAGGAAAAAATAATGAATAC
TTCGATGATGAAACCAAACAATGCGCTGGTCGAATCGACGAACTAGCTATGAAGAATAAAGGTAAAGACGTATTGACCGAAGCATTAGGCACGCCAGAACACAGAGGGCG
TGTTAGAGGAATAGGTATGTCTGTCAAACCATCAACATACTTTAACATTCCTCGAGTGAAGGAAAAATCAAGCAAAGAGTCTGGCAACATAATGTCGTGCTCACCTTCCA
AAAAGTCTGCAAGCATAGGCAGTAATCATCTAAAAGACAAGGAGGTCATTAACGATGTGGAAGAAATTTTAGAGAGAACTCCATGTCATCTAGCAATAAGATCAAAGGAT
AATGTGGTTGTTGTAGGCACAATGTACACGTCTGACGCTCAATTTCCCACAGTCCATGGAGTTCCCTTAGGAGTTGAAAATGTTAGAGTGATAGTAGACATGATCGTAGG
TGAAGATGCTCCATTACCAATTCCTATACGGGGAGAAGTAGAGTCCCTGAGTCAATCTATAGGAAATTTTGTGGCATGGCCTCGTGACCTTGTCATTTTTAATAAGGGGA
AAAAGTCGGATGTTTCTGTACATGTGCCTACTTCACATTCTACAAAGTACACAGATGCTCACGTGACTATTAAACTTCTGAATCGTTATGCAATGTTATCGATGCAAGAA
GATGATACGATTCAAGTCACATTGAGCAAGCACATGTTCGGGGAGGAAAAATTAATTTATTTACATCACGATGATATCCTGCATTATTGTGGGATGGTGGAGATAGGGTA
CTCCTGCATAGTCGCATACGTTGCGTATCTTTGGACTGTATGTGACTATGAAATAATCGCCAAGTTCTTTCTAGTTGATCAAATAACCATTCCTAATTTTGTTAAAAGTC
AAGAAACACGTTGTATAAATCTGGCTAACAGGTTAGAAATGGTTAATTTGGACTTGGATCAACAAGTTTTCATCTCATATAATACTGGATCCTTGAGAATGTGGCAAGCC
AAACACTCACTTCCACAATATCATTCTGCCATCACTTGGAAACTTGTAAAGTGCCCCCGTCAACCGAGTTCTGTGGAGTGCGGGTACTATGTACAGAAGTATATACGAGA
AATCTTATATAATTCTAGTATCCCTATAATGAACCTCGTAATTCAACACAAAACTGCATATAAACAAGAAGAAATCGACGAGATTCGAGTACAATGGGCGGATTTTGTTG
GCAGATTTGTATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSGSSDDEVNVAIQMEARHTNRRGLTTMRGLARVRIIGERLVIQYNNQGQSVGDNANQMESYIGVCVRQQIPLTYTTWKEVPQELKDKIFYSVEMSFVIDPQSKNSILQS
AANKFRTFRYTLYQKHILPFKDESSLLKHLPQKYSHIDQNQWEAFVNATLSEEWEAQSRVQKEKREKCKYNHHISRKGYANLAEELELAEDTSTRATLWLQARKGKNNEY
FDDETKQCAGRIDELAMKNKGKDVLTEALGTPEHRGRVRGIGMSVKPSTYFNIPRVKEKSSKESGNIMSCSPSKKSASIGSNHLKDKEVINDVEEILERTPCHLAIRSKD
NVVVVGTMYTSDAQFPTVHGVPLGVENVRVIVDMIVGEDAPLPIPIRGEVESLSQSIGNFVAWPRDLVIFNKGKKSDVSVHVPTSHSTKYTDAHVTIKLLNRYAMLSMQE
DDTIQVTLSKHMFGEEKLIYLHHDDILHYCGMVEIGYSCIVAYVAYLWTVCDYEIIAKFFLVDQITIPNFVKSQETRCINLANRLEMVNLDLDQQVFISYNTGSLRMWQA
KHSLPQYHSAITWKLVKCPRQPSSVECGYYVQKYIREILYNSSIPIMNLVIQHKTAYKQEEIDEIRVQWADFVGRFV

Tan0000370 (gene) of Snake gourd v1 genome