; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0006117 (gene) of Snake gourd v1 genome

Gene IDTan0006117
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionSec-independent protein translocase protein TatB-like
Genome locationLG07:7254284..7263277
RNA-Seq ExpressionTan0006117
SyntenyTan0006117
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0043466.1 sec-independent protein translocase protein TatB-like [Cucumis melo var. makuwa]1.4e-10087.45Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDT+AQLDAIRHEIRSISILNPGPLT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AA SGV S+SAEEKPTVETT       +AASILKVATSQISNEH RATTFARLAESP IKNG SAS PI+TDVEKLNDEFGLP VLPVSAENTGLLPK
Subjt:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EE KGSDIMLEAVLEAEVAHNAKEFFS  QSQMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

XP_004152379.1 uncharacterized protein LOC101219447 [Cucumis sativus]1.7e-10187.45Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGE+ LLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDS+M+QT AR+VHKELQDT+AQLDAIRHEIRSISILNPGPLT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AADSGV S+SAEEKPTVETT        AASILKVATSQISNEHSRATTFARLAESP IKNG SAS PI+TDVEKLNDEFGLP VLPVSAENTGLLPK
Subjt:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EE KGSDIMLEAVLEAEVAHNAKEFFS HQSQMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

XP_008436983.1 PREDICTED: sec-independent protein translocase protein TatB [Cucumis melo]1.4e-10087.45Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDT+AQLDAIRHEIRSISILNPGPLT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AA SGV S+SAEEKPTVETT       + ASILKVATSQISNEHSRATTFARLAESP IKNG SAS PI+TDVEKLNDEFGLP VLPVSAENTGLLPK
Subjt:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EE KGSDIMLEAVLEAEVAHNAKEFFS  QSQMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

XP_022922242.1 uncharacterized protein LOC111430283 [Cucurbita moschata]6.0e-9984.94Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGAT AFIGPKDLP IARMAGR AG+AIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSIS LNPG LT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVE-------TTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AADSGV SDSA+EKP+VE       TT AA+ILKVATSQIS EHSRATTFA+LAESPTI+NG SASFP++TDVEK NDE G+PSVLPVSAEN G+LPK
Subjt:  LTAADSGVASDSAEEKPTVE-------TTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EELKGSDIMLEAVLEAEVA++AKEFFSHHQ QMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

XP_023551431.1 uncharacterized protein LOC111809244 [Cucurbita pepo subsp. pepo]2.3e-9884.52Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGAT AFIGPKDLP IARMAGR AG+AIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSIS LNPG LT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVE-------TTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AADSGV SDSA+EKP+VE       TT AA+ILKVATSQIS EHSRATTFA+LAESPTI+NG SASFP +TDVE  NDE G+PSVLPVSAEN G+LPK
Subjt:  LTAADSGVASDSAEEKPTVE-------TTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EELKGSDIMLEAV+EAEVAH+AKEFFSHHQ QMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

TrEMBL top hitse value%identityAlignment
A0A0A0KN15 Uncharacterized protein8.2e-10287.45Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGE+ LLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDS+M+QT AR+VHKELQDT+AQLDAIRHEIRSISILNPGPLT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AADSGV S+SAEEKPTVETT        AASILKVATSQISNEHSRATTFARLAESP IKNG SAS PI+TDVEKLNDEFGLP VLPVSAENTGLLPK
Subjt:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EE KGSDIMLEAVLEAEVAHNAKEFFS HQSQMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

A0A1S3ATI2 sec-independent protein translocase protein TatB7.0e-10187.45Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDT+AQLDAIRHEIRSISILNPGPLT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AA SGV S+SAEEKPTVETT       + ASILKVATSQISNEHSRATTFARLAESP IKNG SAS PI+TDVEKLNDEFGLP VLPVSAENTGLLPK
Subjt:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EE KGSDIMLEAVLEAEVAHNAKEFFS  QSQMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

A0A5A7TN47 Sec-independent protein translocase protein TatB-like7.0e-10187.45Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDT+AQLDAIRHEIRSISILNPGPLT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AA SGV S+SAEEKPTVETT       +AASILKVATSQISNEH RATTFARLAESP IKNG SAS PI+TDVEKLNDEFGLP VLPVSAENTGLLPK
Subjt:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EE KGSDIMLEAVLEAEVAHNAKEFFS  QSQMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

A0A6J1E2P5 uncharacterized protein LOC1114302832.9e-9984.94Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGAT AFIGPKDLP IARMAGR AG+AIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSIS LNPG LT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVE-------TTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AADSGV SDSA+EKP+VE       TT AA+ILKVATSQIS EHSRATTFA+LAESPTI+NG SASFP++TDVEK NDE G+PSVLPVSAEN G+LPK
Subjt:  LTAADSGVASDSAEEKPTVE-------TTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EELKGSDIMLEAVLEAEVA++AKEFFSHHQ QMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

E5GCU4 Uncharacterized protein7.0e-10187.45Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE
        MLGISYGEL LLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDT+AQLDAIRHEIRSISILNPGPLT+RLVDNPE
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPE

Query:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK
        L AA SGV S+SAEEKPTVETT       + ASILKVATSQISNEHSRATTFARLAESP IKNG SAS PI+TDVEKLNDEFGLP VLPVSAENTGLLPK
Subjt:  LTAADSGVASDSAEEKPTVETT-------SAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPK

Query:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ
        R EE KGSDIMLEAVLEAEVAHNAKEFFS  QSQMKQEQ
Subjt:  RTEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQ

SwissProt top hitse value%identityAlignment
A4G9I1 Sec-independent protein translocase protein TatB3.4e-0427.88Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPG---------PL
        M+ I++ +L ++  A   FIGP+ LP +ARMAG + GRA  Y+   + +    M+  + R++HK++QD  A  D  R   ++IS  +             
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPG---------PL

Query:  TRRLVDNPELTAADSGVASDSAEEKPTVETTSAASILKVATSQISNEHSRATTFARLAESPTIKN
        T  L++ P  T   S   S +  +K    T++  S  K  + Q S   S A   A+   +   K+
Subjt:  TRRLVDNPELTAADSGVASDSAEEKPTVETTSAASILKVATSQISNEHSRATTFARLAESPTIKN

Q0C0V9 Sec-independent protein translocase protein TatB5.8e-0434.85Show/hide
Query:  GISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQD
        GI + EL L+  A    IGPKDLP++ R  G++ G+     +  +  FD + +Q++  ++ KE+QD
Subjt:  GISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQD

Arabidopsis top hitse value%identityAlignment
AT5G43680.1 unknown protein1.1e-4246.44Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDN--
        MLG+SYGEL L++GATAA +GPKDLP+IAR  GR+ GRAIGY+ +ARG  D VM+Q Q +++ KE+QD  AQ+DAI H  R  S+ +  PLTRR VDN  
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDN--

Query:  ---PELTAADSGVASDSAEEK-PTVETTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPKR
           P  +  +  V S + EEK   V+  + A     ++S   N H++AT+FARL+E+            ++     LN +     VLPVSAE   LLP+R
Subjt:  ---PELTAADSGVASDSAEEK-PTVETTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPKR

Query:  TEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQG
         E  +GSD+MLEAVLEAEVAH AK FF+  + +    +G
Subjt:  TEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQG

AT5G43680.2 unknown protein1.1e-4246.44Show/hide
Query:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDN--
        MLG+SYGEL L++GATAA +GPKDLP+IAR  GR+ GRAIGY+ +ARG  D VM+Q Q +++ KE+QD  AQ+DAI H  R  S+ +  PLTRR VDN  
Subjt:  MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDN--

Query:  ---PELTAADSGVASDSAEEK-PTVETTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPKR
           P  +  +  V S + EEK   V+  + A     ++S   N H++AT+FARL+E+            ++     LN +     VLPVSAE   LLP+R
Subjt:  ---PELTAADSGVASDSAEEK-PTVETTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPKR

Query:  TEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQG
         E  +GSD+MLEAVLEAEVAH AK FF+  + +    +G
Subjt:  TEELKGSDIMLEAVLEAEVAHNAKEFFSHHQSQMKQEQG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGTTGGGCATTTCATATGGAGAACTCTTCCTCCTTATTGGAGCTACTGCTGCCTTCATTGGACCAAAGGATCTCCCAGTGATAGCAAGAATGGCTGGACGGATGGCTGG
CAGAGCAATTGGATATGTTCAGTTAGCTCGAGGTCAGTTTGACTCTGTCATGCAACAAACCCAAGCTCGCCAGGTTCACAAGGAATTGCAAGACACTATGGCTCAGCTTG
ATGCTATTCGTCATGAAATTCGAAGCATATCGATCCTGAATCCTGGGCCATTGACTCGGAGGCTTGTGGACAATCCTGAGCTCACAGCAGCTGATAGTGGTGTAGCTAGT
GATTCAGCCGAAGAAAAACCTACTGTGGAGACTACATCAGCAGCTAGCATCCTCAAGGTTGCAACTTCACAAATATCAAATGAACACAGCCGAGCGACCACGTTTGCAAG
GTTGGCTGAATCACCAACCATAAAGAATGGTTTCTCTGCCTCATTTCCAATTTCTACAGACGTTGAAAAGCTTAATGATGAGTTTGGACTTCCTTCCGTTTTACCTGTAT
CTGCTGAAAATACTGGGCTGTTACCTAAACGCACGGAGGAGTTAAAAGGGTCTGACATAATGTTAGAAGCAGTATTGGAAGCAGAGGTGGCTCACAATGCAAAAGAATTT
TTCTCACATCATCAAAGTCAAATGAAACAGGAACAAGGATGA
mRNA sequenceShow/hide mRNA sequence
CGCAAACAGAGGCGCGCCGAACCCCCCATCACCTTGCTTCTCGTTTTCGTACAGACCGCCAGCGCCGCCGGTTCTTTTTTTTTTTTTCGTATTTTTCGCCGACGACGACA
GCAATCGCCGGCTCGTCCCCTTTCGTCCTCTCCGCCGACTGGCCGACACTGCACGCCGCCCCCTGCGTCTTCTTCTTCGTCTTTTTCAGTTCCCAGCCGGACATCTTCCT
CTTCTTCGGGTTTCCGCCGCCGGCTCTTCCTGCATCCTCCGGTCGTCTTCCATCCATCCGATCTGTCGCCGGCAGCACGTCTCCGACCAGCCCACGCCCACAGCAAGCCC
AGCCCAGCCCGCCGATCGGGCCACAGGAATCCCGGATCTGTATTTCACGCTCAGCCGCCGGTAAGGAGCACGCTCGTGTTAAGGGAGTGTGTGGAACTTGGGATCGAACT
CCTAAACCTTTGATACCAATCAATGAAGAGGCTGAATTGAGTGAAAGTTATTGCATCTGAGATCATTCTCAATCTCTAGGCCTGGCTTGATTGCTATTCTGAGTTCCTGT
GAGAGACGCTACGAAACTTAAATGTTGGGCATTTCATATGGAGAACTCTTCCTCCTTATTGGAGCTACTGCTGCCTTCATTGGACCAAAGGATCTCCCAGTGATAGCAAG
AATGGCTGGACGGATGGCTGGCAGAGCAATTGGATATGTTCAGTTAGCTCGAGGTCAGTTTGACTCTGTCATGCAACAAACCCAAGCTCGCCAGGTTCACAAGGAATTGC
AAGACACTATGGCTCAGCTTGATGCTATTCGTCATGAAATTCGAAGCATATCGATCCTGAATCCTGGGCCATTGACTCGGAGGCTTGTGGACAATCCTGAGCTCACAGCA
GCTGATAGTGGTGTAGCTAGTGATTCAGCCGAAGAAAAACCTACTGTGGAGACTACATCAGCAGCTAGCATCCTCAAGGTTGCAACTTCACAAATATCAAATGAACACAG
CCGAGCGACCACGTTTGCAAGGTTGGCTGAATCACCAACCATAAAGAATGGTTTCTCTGCCTCATTTCCAATTTCTACAGACGTTGAAAAGCTTAATGATGAGTTTGGAC
TTCCTTCCGTTTTACCTGTATCTGCTGAAAATACTGGGCTGTTACCTAAACGCACGGAGGAGTTAAAAGGGTCTGACATAATGTTAGAAGCAGTATTGGAAGCAGAGGTG
GCTCACAATGCAAAAGAATTTTTCTCACATCATCAAAGTCAAATGAAACAGGAACAAGGATGACAATTTCATGAGCATCATAGCATTGATGAATGGCCCATAAATGAAGT
TCAGTCGGTTCAAAATGCGAATCCCAGGTATTCCCCTGGCTTCATATGTGTCATTTGTGTAAGCGAATGAATTATTACTACATAGAAAGTTACACTTCGAAGGCATACTT
GTGAAAGTATATTTAACTTACTTTTGCAAGTCAGAAAGAAAAGGGGAAATGAAACACGTACTCTGCTCATACTTGTTGATCTGTGGTGCCCCTATATATTATAGTGAAGT
CATATGCTTGCATACATCAATTGTTTTCACTGTTTTTTATCAGTTATGTACAGAAGCATGTGGTGGGTCACTGCTTCACAATGCTGCTTGTCACTTAGGCTTATGTTTTC
AGCAACGTATCTTCTTATATCGTGGCCTGGATCTGTAGTTACGATACTCATTAGTATGTTAAGTGGCTTTGTTACTTATCTGTAGTGATAGAAATGGATATGTATCGCAG
TTTCATGATTTTTTCTACCCTGTAGTTTGTGTTTGAAATGAAAAGAAGTCATTTGTCTGATGGTACATAGTTATGTTTTTTTTTTTTTTTTTTTTCACAGCCGTTCGTTT
GATCATTTTGAAGGGATTTAACGTTTTGACATCAAACGAGTTTCTGAAATTCTTGAACTAAGTTTAAAGTGATCATTTCATCCTTTAATATTTTTGTTTTGTTTATCTGT
GCGCACACCCCAACTAATCTTATAGGACAATTGTCCGACTCTACTACATGTAGTTGTCAAGAAAACTCGTAGGATATTAAGTTTTAGGTAGGTAACAATCAGAGATTGAA
TTCATTACCCTTTATTATTCTCCTGACTAACCCATGATGGATCATATGTAATAGGCGTGTTTGAGGATTAGTTATAGTACCTATGCTAGTTTGCATACCCGTTGTTAAAA
AAAAGGAGATTATTTGTAAAATCTCTGAATGAGTAATTCCCCTTTGGTCATGTCTAACAAAATAATAATAAGAATAACAATAATATAAAAAAATAAAATTTGACCGTGGG
CTTTTTAAAAAATAGAGAAAAATATCTTTTTAGTCTTCATGTTTCAAATTTGTGTATATTTAGTACTTGTGTTTTAAAATTAGACAATCAAGTCCTCTAAACTTATATAA
TAGTTCTATTGAGTCCATATTTGTGTATATTTAGTCATTGTATTTTAAATTAGACAATCAAGTCCCCGAAATTTATAAAATAGTTCTATTGAGTCCATATGCAATTAACT
TTTGACTGTGGCATTTTTTAATATATTAAAAATATAAAATAATAACTGAAATAATAATTAAGAAAAGAGAGAAAATCTCTCCCCTCTTTTCCTTTCCCCTTTGCGTTGTG
ATCAGACAAGTAACCAGGAGATGATTTTGCCAACATCCTCAAAAACAACAAATATCTTTGGGCATAAAATGGCAAAATAACAAAGGAGGAAAAATGAAGAATGCAATCGA
AAAACCTTAGAAACAATGGGTTTGAATCTGCAGCAAAGAATCGAGCAACAAGCGATTTGAAAACGAAAAACAGAAGTGAAGAGAGGCCATGGGAGGGAGATGAAGAACTT
GGAATCACATTTGAAAGAGATGGGTAACTCAAATTTAAATTGCCATCGAAACAGAGAGTGAAATTGAGATGACTGGGGTTGGTGGGCACACTAAGATTGGGGGATGAAGC
CAAATGAAAATTGAAAAGAGAATGGGTCGACACGTACAGAAACGAGTTCAAATTTTTTTAATTTCTAGCAAAATTTCATGTATAATTGTTTATGATTTTGGAGGGAAAAG
ATTGTGTGACCCATGTTCGGTGAGGTTGCGCCTTGATCTAACTCGAGCTGCTGTAGTGAGGCTCGAGTCGGCAGCTTGCAACGTCGATGGCAGCAGATCAAGGGAAGAGG
CGGTCGGGTAAGACTTCGCGGCCGATACACTGTTGGTTACAGGTTTGAGTCGTTCATTTTCTAGCGATCACTAACGGCGTGTGAAGAGGCCTACACGGTGAGGGAAGAAG
AAAGGGGAGAGGAAGGGGCACGAAGAGAAGGAGAAGAAAGGGAGAGGGGAAGGAGAAGGAGAAGGAGGAAAAAG
Protein sequenceShow/hide protein sequence
MLGISYGELFLLIGATAAFIGPKDLPVIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTMAQLDAIRHEIRSISILNPGPLTRRLVDNPELTAADSGVAS
DSAEEKPTVETTSAASILKVATSQISNEHSRATTFARLAESPTIKNGFSASFPISTDVEKLNDEFGLPSVLPVSAENTGLLPKRTEELKGSDIMLEAVLEAEVAHNAKEF
FSHHQSQMKQEQG