; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

ClCG01G004480 (gene) of Watermelon (Charleston Gray) v2.5 genome

Gene IDClCG01G004480
OrganismCitrullus lanatus subsp. vulgaris cv. Charleston Gray (Watermelon (Charleston Gray) v2.5)
DescriptionSec-independent protein translocase protein TatB-like
Genome locationCG_Chr01:4779358..4791348
RNA-Seq ExpressionClCG01G004480
SyntenyClCG01G004480
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAA0043466.1 sec-independent protein translocase protein TatB-like [Cucumis melo var. makuwa]1.3e-8587.62Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDTLAQ+DAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAA   VTS+SA+EKPTVE TPVA+KTA AA+ILKVATS+ISNEH RATTFARLAESP IKNGSSASLPIT DVE L+DEF LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP
        RP
Subjt:  RP

XP_004152379.1 uncharacterized protein LOC101219447 [Cucumis sativus]3.4e-8677.22Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGE+LLLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDS+M+QT AR+VHKELQDTLAQ+DAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAAD  VTS+SA+EKPTVE TPVA+KTAPAA+ILKVATS+ISNEHSRATTFARLAESP IKNGSSASLPIT DVE L+DEF LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP----GTLSVIELKALIMIALFYKLFHRTHHTRYRR
        RP    G+  ++E      +A   K F  +H ++ ++
Subjt:  RP----GTLSVIELKALIMIALFYKLFHRTHHTRYRR

XP_008436983.1 PREDICTED: sec-independent protein translocase protein TatB [Cucumis melo]1.3e-8587.62Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDTLAQ+DAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAA   VTS+SA+EKPTVE TPVA+KTA  A+ILKVATS+ISNEHSRATTFARLAESP IKNGSSASLPIT DVE L+DEF LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP
        RP
Subjt:  RP

XP_022922242.1 uncharacterized protein LOC111430283 [Cucurbita moschata]5.4e-8481.02Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGAT AFIGPKDLP IARMAGR AG+AIGYVQLARGQFDSVMQQTQARQVHKELQDT+AQ+DAIRHEIRSIS LNPG LTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAAD  VTSDSAKEKP+VEITP A+ T PAANILKVATS+IS EHSRATTFA+LAESPTI+NGSSAS P+  DVE  +DE  +P VLP+SAENAG+LPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RPGTL--SVIELKALI
        RP  L  S I L+A++
Subjt:  RPGTL--SVIELKALI

XP_038875802.1 sec-independent protein translocase protein TatB [Benincasa hispida]6.8e-8788.61Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGATAA IGPKDLP+IARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAAD  VTSDSAKEKPTV+ITPV +KTAPAA+ILKVATSEISNEH RAT FAR+A S TIKNGSSASLPIT D+E  +DE  LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP
        RP
Subjt:  RP

TrEMBL top hitse value%identityAlignment
A0A0A0KN15 Uncharacterized protein1.6e-8677.22Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGE+LLLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDS+M+QT AR+VHKELQDTLAQ+DAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAAD  VTS+SA+EKPTVE TPVA+KTAPAA+ILKVATS+ISNEHSRATTFARLAESP IKNGSSASLPIT DVE L+DEF LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP----GTLSVIELKALIMIALFYKLFHRTHHTRYRR
        RP    G+  ++E      +A   K F  +H ++ ++
Subjt:  RP----GTLSVIELKALIMIALFYKLFHRTHHTRYRR

A0A1S3ATI2 sec-independent protein translocase protein TatB6.2e-8687.62Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDTLAQ+DAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAA   VTS+SA+EKPTVE TPVA+KTA  A+ILKVATS+ISNEHSRATTFARLAESP IKNGSSASLPIT DVE L+DEF LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP
        RP
Subjt:  RP

A0A5A7TN47 Sec-independent protein translocase protein TatB-like6.2e-8687.62Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDTLAQ+DAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAA   VTS+SA+EKPTVE TPVA+KTA AA+ILKVATS+ISNEH RATTFARLAESP IKNGSSASLPIT DVE L+DEF LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP
        RP
Subjt:  RP

A0A6J1E2P5 uncharacterized protein LOC1114302832.6e-8481.02Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGAT AFIGPKDLP IARMAGR AG+AIGYVQLARGQFDSVMQQTQARQVHKELQDT+AQ+DAIRHEIRSIS LNPG LTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAAD  VTSDSAKEKP+VEITP A+ T PAANILKVATS+IS EHSRATTFA+LAESPTI+NGSSAS P+  DVE  +DE  +P VLP+SAENAG+LPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RPGTL--SVIELKALI
        RP  L  S I L+A++
Subjt:  RPGTL--SVIELKALI

E5GCU4 Uncharacterized protein6.2e-8687.62Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE
        MLGISYGELLLLIGATAA IGPKDLP+I+RMAGRMAGRAIGYVQLARGQFDSVM+QT ARQVHKELQDTLAQ+DAIRHEIRSISILNPGPLTQRLVDNPE
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPE

Query:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK
        LKAA   VTS+SA+EKPTVE TPVA+KTA  A+ILKVATS+ISNEHSRATTFARLAESP IKNGSSASLPIT DVE L+DEF LP VLP+SAEN GLLPK
Subjt:  LKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPK

Query:  RP
        RP
Subjt:  RP

SwissProt top hitse value%identityAlignment
A4G9I1 Sec-independent protein translocase protein TatB8.0e-0633.78Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQID
        M+ I++ +L ++  A   FIGP+ LP +ARMAG + GRA  Y+   + +    M+  + R++HK++QD    ++
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQID

Q0C0V9 Sec-independent protein translocase protein TatB2.0e-0437.88Show/hide
Query:  GISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQD
        GI + ELLL+  A    IGPKDLPM+ R  G++ G+     +  +  FD + +Q++  ++ KE+QD
Subjt:  GISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQD

Arabidopsis top hitse value%identityAlignment
AT5G43680.1 unknown protein8.7e-3247.09Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDN--
        MLG+SYGELLL++GATAA +GPKDLP+IAR  GR+ GRAIGY+ +ARG  D VM+Q Q +++ KE+QD  AQ+DAI H  R  S+ +  PLT+R VDN  
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDN--

Query:  ---PELKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENA
           P     +G VTS + +EK      PV   T   A     ++S   N H++AT+FARL+E+    NG + SL         SD      VLP+SAE A
Subjt:  ---PELKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENA

Query:  GLLPKR
         LLP+R
Subjt:  GLLPKR

AT5G43680.2 unknown protein8.7e-3247.09Show/hide
Query:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDN--
        MLG+SYGELLL++GATAA +GPKDLP+IAR  GR+ GRAIGY+ +ARG  D VM+Q Q +++ KE+QD  AQ+DAI H  R  S+ +  PLT+R VDN  
Subjt:  MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDN--

Query:  ---PELKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENA
           P     +G VTS + +EK      PV   T   A     ++S   N H++AT+FARL+E+    NG + SL         SD      VLP+SAE A
Subjt:  ---PELKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENA

Query:  GLLPKR
         LLP+R
Subjt:  GLLPKR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGACAAATAAAAGGAACAGGGTCGCAACACGCCGAACCCAGCTGAGAAATGGAATCGGATCTGTTGGAATTAGAAACAGCACACACCATACTCGATACCGGCGCCTGTC
GTCGCGCCGTCCATTGCACAGCCATCAACTCGCCACTCTACACGACCCGATTCTAAAGGGAGAAAACCCCTCTGTTTTCTTTTCACTTGTGCCGCCCCACACCCTTGCTT
TTGTATTGGTTTGTCGCCGCCGATCGCCACTGTCAGCCAATTTCCCCCGCACAAGGCTAAGTTTAAAGTTTCTGAAGGGTGTTTGGTTTCGTGAACGCGAAAAGGATAAA
AAGAAAAAAGTTCTGAGCCACTACGAAACTCAGATGCTAGGCATTTCATATGGAGAACTCCTCCTCCTTATTGGGGCTACTGCTGCCTTCATTGGGCCAAAGGATCTCCC
AATGATAGCAAGAATGGCAGGAAGGATGGCTGGCAGAGCAATTGGATATGTTCAGTTAGCTCGAGGTCAGTTTGACTCTGTGATGCAACAAACCCAAGCTCGCCAGGTTC
ACAAGGAATTGCAAGACACTTTGGCTCAGATTGATGCTATTCGCCATGAAATTCGAAGCATTTCGATCTTGAATCCTGGGCCATTGACTCAGAGGCTTGTGGACAATCCT
GAGCTCAAAGCAGCCGATGGTAGTGTAACTAGTGATTCAGCAAAAGAGAAACCTACTGTCGAGATTACACCAGTTGCTAAGAAGACTGCACCGGCAGCTAACATCCTCAA
GGTTGCAACTTCAGAAATATCAAATGAGCACAGCCGAGCAACTACATTTGCCAGGTTGGCTGAATCACCAACCATAAAGAATGGTTCCTCTGCCTCGTTGCCAATTACTA
AAGACGTAGAAACGCTAAGTGACGAGTTTGAACTTCCTATGGTTTTACCTATCTCGGCCGAAAATGCTGGGTTGTTACCTAAGCGCCCGGGTACCTTATCTGTTATTGAA
TTAAAAGCTTTGATAATGATTGCCTTATTTTATAAACTTTTTCACCGCACACACCATACTCGATACCGGCGCCTGTCGTCGCGCCGTCCATTGCACAGCCATCAACTCGC
CACTCTACACGACCCGATTCTAAAGGGAGAAAACCCCTCTGTTTTCTTTTCACTTGTGCCGCCCCACACCCTTGCTTTTGTATTGGTTTGTCGCCGCCGATCGCCACTGT
CAGCCAATTTCCCCCGCACAAGGCTAAGTTTAAAGTTTCTGAAGGGTGTTTGGTTTCGTGAACGCGAAAAGGATAAAAAGAAAAAAGTTCTGAGCCACTACGAAACTCAG
ATGCTAGGCATTTCATATGGAGAACTCCTCCTCCTTATTGGGGCTACTGCTGCCTTCATTGGGCCAAAGGATCTCCCAATGATAGCAAGAATGGCAGGAAGGATGGCTGG
CAGAGCAATTGGATATGTTCAGTTAGCTCGAGGTCAGTTTGACTCTGTGATGCAACAAACCCAAGCTCGCCAGGTTCACAAGGAATTGCAAGACACTTTGGCTCAGATTG
ATGCTATTCGCCATGAAATTCGAAGCATTTCGATCTTGAATCCTGGGCCATTGACTCAGAGGCTTGTGGACAATCCTGAGCTCAAAGCAGCCGATGGTAGTGTAACTAGT
GATTCAGCAAAAGAGAAACCTACTGTCGAGATTACACCAGTTGCTAAGAAGACTGCACCGGCAGCTAACATCCTCAAGGTTGCAACTTCAGAAATATCAAATGAGCACAG
CCGAGCAACTACATTTGCCAGGTTGGCTGAATCACCAACCATAAAGAATGGTTCCTCTGCCTCGTTGCCAATTACTAAAGACGTAGAAACGCTAAGTGACGAGTTTGAAC
TTCCTATGGTTTTACCTATCTCGGCCGAAAATGCTGGGTTGTTACCTAAGCGCCCGGGTACCTTATCTGTTATTGAATTAAAAGCTTTGATAATGATTGCCTTATTTTAT
AAACTTTTTCACCGGTAG
mRNA sequenceShow/hide mRNA sequence
ATGACAAATAAAAGGAACAGGGTCGCAACACGCCGAACCCAGCTGAGAAATGGAATCGGATCTGTTGGAATTAGAAACAGCACACACCATACTCGATACCGGCGCCTGTC
GTCGCGCCGTCCATTGCACAGCCATCAACTCGCCACTCTACACGACCCGATTCTAAAGGGAGAAAACCCCTCTGTTTTCTTTTCACTTGTGCCGCCCCACACCCTTGCTT
TTGTATTGGTTTGTCGCCGCCGATCGCCACTGTCAGCCAATTTCCCCCGCACAAGGCTAAGTTTAAAGTTTCTGAAGGGTGTTTGGTTTCGTGAACGCGAAAAGGATAAA
AAGAAAAAAGTTCTGAGCCACTACGAAACTCAGATGCTAGGCATTTCATATGGAGAACTCCTCCTCCTTATTGGGGCTACTGCTGCCTTCATTGGGCCAAAGGATCTCCC
AATGATAGCAAGAATGGCAGGAAGGATGGCTGGCAGAGCAATTGGATATGTTCAGTTAGCTCGAGGTCAGTTTGACTCTGTGATGCAACAAACCCAAGCTCGCCAGGTTC
ACAAGGAATTGCAAGACACTTTGGCTCAGATTGATGCTATTCGCCATGAAATTCGAAGCATTTCGATCTTGAATCCTGGGCCATTGACTCAGAGGCTTGTGGACAATCCT
GAGCTCAAAGCAGCCGATGGTAGTGTAACTAGTGATTCAGCAAAAGAGAAACCTACTGTCGAGATTACACCAGTTGCTAAGAAGACTGCACCGGCAGCTAACATCCTCAA
GGTTGCAACTTCAGAAATATCAAATGAGCACAGCCGAGCAACTACATTTGCCAGGTTGGCTGAATCACCAACCATAAAGAATGGTTCCTCTGCCTCGTTGCCAATTACTA
AAGACGTAGAAACGCTAAGTGACGAGTTTGAACTTCCTATGGTTTTACCTATCTCGGCCGAAAATGCTGGGTTGTTACCTAAGCGCCCGGGTACCTTATCTGTTATTGAA
TTAAAAGCTTTGATAATGATTGCCTTATTTTATAAACTTTTTCACCGCACACACCATACTCGATACCGGCGCCTGTCGTCGCGCCGTCCATTGCACAGCCATCAACTCGC
CACTCTACACGACCCGATTCTAAAGGGAGAAAACCCCTCTGTTTTCTTTTCACTTGTGCCGCCCCACACCCTTGCTTTTGTATTGGTTTGTCGCCGCCGATCGCCACTGT
CAGCCAATTTCCCCCGCACAAGGCTAAGTTTAAAGTTTCTGAAGGGTGTTTGGTTTCGTGAACGCGAAAAGGATAAAAAGAAAAAAGTTCTGAGCCACTACGAAACTCAG
ATGCTAGGCATTTCATATGGAGAACTCCTCCTCCTTATTGGGGCTACTGCTGCCTTCATTGGGCCAAAGGATCTCCCAATGATAGCAAGAATGGCAGGAAGGATGGCTGG
CAGAGCAATTGGATATGTTCAGTTAGCTCGAGGTCAGTTTGACTCTGTGATGCAACAAACCCAAGCTCGCCAGGTTCACAAGGAATTGCAAGACACTTTGGCTCAGATTG
ATGCTATTCGCCATGAAATTCGAAGCATTTCGATCTTGAATCCTGGGCCATTGACTCAGAGGCTTGTGGACAATCCTGAGCTCAAAGCAGCCGATGGTAGTGTAACTAGT
GATTCAGCAAAAGAGAAACCTACTGTCGAGATTACACCAGTTGCTAAGAAGACTGCACCGGCAGCTAACATCCTCAAGGTTGCAACTTCAGAAATATCAAATGAGCACAG
CCGAGCAACTACATTTGCCAGGTTGGCTGAATCACCAACCATAAAGAATGGTTCCTCTGCCTCGTTGCCAATTACTAAAGACGTAGAAACGCTAAGTGACGAGTTTGAAC
TTCCTATGGTTTTACCTATCTCGGCCGAAAATGCTGGGTTGTTACCTAAGCGCCCGGGTACCTTATCTGTTATTGAATTAAAAGCTTTGATAATGATTGCCTTATTTTAT
AAACTTTTTCACCGGTAGCATTAAAATCTTGACTTGGGAGGTTAGTGCACTTGGAAGTAAGACATCAATTGATGAGGTGTTAGATGAGCTATGGACGGGTGGGACACCAA
TTATACCTGATAACCACGATGTATGTTCATTGTTCGATTGAGGATGGATAGACACTTTCTTTTAGAGGATAAATGGTTAGGTGAGACGTACCCAATGCAATAATGCATTT
TAGGCGGTGGTGGAGTGCTTATGGCATAGCAAAAGGTTAGTTTTCATTCGTTATTTAGGATTGGATCATTTTGCATTAAAGTAGCTCGTATTGAGTCATCTGTACAAAAA
TCTCATGCCATTGTGTGGGGACTACGGGAAAAAAGGTACGATACAGTTTTTAGAGGGCTTTAGAGGTCTCTAAACAATGTTTGGTCCTTGGTACGATTCTATGTGGCTTC
GTGGGCTTCTATAGCCAAGCCATTTAGTAATTATCTGGTAGAACTCATTCGACTTGATTGAAGGTTGTGTTTGTAGTTTGCCTTTCTTTTTTCTGGGTTCTCTTTTCATT
TGTCCTTTTGTTCTTTCATTTTTTCAAGGGAAGTTTGGTTATTCATAAAATAATAATAATTATAAAAGCTATCAGGCTGTAAACATTTCATTCAGTTATTTTCCTAAATT
AAATTGATATTTGTTATCTTGGGGGAATTTTTTTTTTAAGGAATCAAGTATTATGAATGATAACCACTTTGCAATTAGATTTGTGTTCCATGTATTGAAACTATTCGATT
TTTTCAGAGGAGTTTAAAGGGTCTGACATAATGTTAGAAGCTGTATTAGAAGCAGAGGTGGCTCACAATGCAAAAGAATTTTTTTCACGTCCTCAAAATCAAACGAAACA
GGAACAAGGATGACAATTTCATGAACATCATTTTGTTGCATCATAGCATTGATGAATGTGGCCTATAAATGAAGTTCAGAAGATTCAAAAAGCGTCCCAGCTGTTCCTTT
GATCATTCTCAAAGGATTTAACGCATTGACATCAAACTAGAAGGAGGGTTTGGAAACTCTATGAACTAAGTTTGAATTGATATCTTTATTAAAGTAATAGACAGTTGTCT
CCAAGGATTGGTTCAAAGTGTAGCTATGTGGTTTGCATGCCCTTTTGATGAAAACAAAGTAATTATTTGTAAAATCTTTGAATGAGTAATTCCTCCCTGGTCATCTCTCA
TCAATTATGGTAGAGGTTTACTTGGTTTTTGATACTCTACATACATATTTTAGGTATTGTTTCATAACTATTTGAGTTTTTAAACTTTAAGCTCATGTGTACTA
Protein sequenceShow/hide protein sequence
MTNKRNRVATRRTQLRNGIGSVGIRNSTHHTRYRRLSSRRPLHSHQLATLHDPILKGENPSVFFSLVPPHTLAFVLVCRRRSPLSANFPRTRLSLKFLKGVWFREREKDK
KKKVLSHYETQMLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNP
ELKAADGSVTSDSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPKRPGTLSVIE
LKALIMIALFYKLFHRTHHTRYRRLSSRRPLHSHQLATLHDPILKGENPSVFFSLVPPHTLAFVLVCRRRSPLSANFPRTRLSLKFLKGVWFREREKDKKKKVLSHYETQ
MLGISYGELLLLIGATAAFIGPKDLPMIARMAGRMAGRAIGYVQLARGQFDSVMQQTQARQVHKELQDTLAQIDAIRHEIRSISILNPGPLTQRLVDNPELKAADGSVTS
DSAKEKPTVEITPVAKKTAPAANILKVATSEISNEHSRATTFARLAESPTIKNGSSASLPITKDVETLSDEFELPMVLPISAENAGLLPKRPGTLSVIELKALIMIALFY
KLFHR