; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0014307 (gene) of Snake gourd v1 genome

Gene IDTan0014307
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionR3H domain containing protein
Genome locationLG08:14797677..14802979
RNA-Seq ExpressionTan0014307
SyntenyTan0014307
Gene Ontology termsGO:0003676 - nucleic acid binding (molecular function)
InterPro domainsIPR001374 - R3H domain
IPR024771 - SUZ domain
IPR036867 - R3H domain superfamily


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6586140.1 TATA box-binding protein-associated factor RNA polymerase I subunit B, partial [Cucurbita argyrosperma subsp. sororia]7.8e-11885.07Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGV RHLVLERCPESS+PSILVSDILWEYDEPQ+STIPHQLLRRKENSS S  KSPPQR+ EER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFMMH+GEDSEP KPKPRC+PVVARRMIAHALG RINS PE TT HCKEQG+V NNA+ QAN+ KE DSTVEVVNKT LQ DQCVN+KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSNT--ARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
          KN N I SSARGSN+  A+MKADK SPKAS VDNEYLKREHLGAAKRMFSQALGK  RKNESL TR
Subjt:  VDKNCNQIVSSARGSNT--ARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

XP_022937642.1 uncharacterized protein LOC111443986 isoform X1 [Cucurbita moschata]3.9e-11784.7Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGV RHLVLERCPESS+PSILVSDILWEYDEPQ+STIPHQLLRRKENSS S  KSPPQR+ EER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFMMH+GEDSEP KPKPRC+PVVARRMIAHALG RINS PE TT HCKEQG+V NNA+ QAN+ KE DSTVEVVNKT LQ DQCVN+KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSNT--ARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
          KN N I SSARGSN+  A+MKADK SPKAS VDNEYL REHLGAAKRMFSQALGK  RKNESL TR
Subjt:  VDKNCNQIVSSARGSNT--ARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

XP_022965481.1 uncharacterized protein LOC111465372 isoform X1 [Cucurbita maxima]1.9e-11986.19Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEG  RHLVLERCPESS+PSILVSDILWEYDEPQ+STIPHQLLRRKENSS S  KSPPQRS EER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFMMH+GEDSEP KPKPRC+PVVARRMIAHALG RINS PE TT HCKEQG+V NNAY QAN+ KE DSTVEVVNKT LQTDQCVN+KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSN--TARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
        V KN N   SSARGSN   A+MKADK SPKAS VDNEYLKREHLGAAKRMFSQALGK  RKNESLQTR
Subjt:  VDKNCNQIVSSARGSN--TARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

XP_023538509.1 uncharacterized protein LOC111799266 [Cucurbita pepo subsp. pepo]6.6e-11784.7Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILELEPMDSYNRLLLHRLADIFGF+HVSVGEGV RHLVLERCPESS+PSILVSDILWEYDEPQ+STIPHQLLRRKENSS S  KSPPQRS EER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFMMH+GEDSEP KPKPRC+PVVARRMIAHALG RINS PE T+ H KEQG+V NNAY QAN+ KE DSTVEVVNKT LQ DQCVN+KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSNTA--RMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
          KN N I SSARGSN A  +MKADK SPKAS VDNEYLKREHLGAAKRMFSQALGK  RKNESL TR
Subjt:  VDKNCNQIVSSARGSNTA--RMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

XP_038890965.1 uncharacterized protein LOC120080389 isoform X2 [Benincasa hispida]4.3e-11685.34Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEG +RHLVLERCP+SSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKS PQ SLEER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFMM++GEDS+PMKPKPRC+PVVARRMIAHALG RINS PEDTT H KEQG VVNNAY QA DSK  DSTVE VNK I Q+ Q VN KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSNTARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
        VDKNCN  VS ARGS  A+MK DK SPKAS VDNEYLKREHLGAAK MFSQALGK  RKN+SLQTR
Subjt:  VDKNCNQIVSSARGSNTARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

TrEMBL top hitse value%identityAlignment
A0A0A0LH15 Uncharacterized protein6.6e-11582.33Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILEL+PMDSYNRLLLHRLADIFG  HVSVGEG +RHLVLER PESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKS PQRSLEER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFM H+GED+EP+KPKPRC+P VARRMIAHALG R+NS  EDT  H KEQG V NNAY QA DSK  DSTVE +NKTI ++DQCVN KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSNTARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
        +DKNCN  VS ARGS  A+MK  K  PKAS VDNE+LKREHLGAAKRMFSQALGK CRKNESLQTR
Subjt:  VDKNCNQIVSSARGSNTARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

A0A1S3B4H8 uncharacterized protein LOC103485903 isoform X22.4e-11281.65Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILEL+PMDSYNRLLLHRLADIFG  HVS GEG +RHLVLER PESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASS KS PQRSLEER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        E AYLAVRERIFM H+GED+EP+KPKPRC+P VARRMIAHALG R+NSFPEDT  H K QG V NNAY QA DSK  +STVE +NKTI Q+DQC+N KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSNTARMKADKISPKAS-SVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
         DKNCN  VS ARGS  A+MK DK SPKAS  VDNE+LKREHLGAAKRMFSQALGK CRKNESLQTR
Subjt:  VDKNCNQIVSSARGSNTARMKADKISPKAS-SVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

A0A6J1FBT0 uncharacterized protein LOC111443986 isoform X11.9e-11784.7Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGV RHLVLERCPESS+PSILVSDILWEYDEPQ+STIPHQLLRRKENSS S  KSPPQR+ EER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFMMH+GEDSEP KPKPRC+PVVARRMIAHALG RINS PE TT HCKEQG+V NNA+ QAN+ KE DSTVEVVNKT LQ DQCVN+KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSNT--ARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
          KN N I SSARGSN+  A+MKADK SPKAS VDNEYL REHLGAAKRMFSQALGK  RKNESL TR
Subjt:  VDKNCNQIVSSARGSNT--ARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

A0A6J1HKF9 uncharacterized protein LOC111465372 isoform X19.0e-12086.19Show/hide
Query:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER
        E SSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEG  RHLVLERCPESS+PSILVSDILWEYDEPQ+STIPHQLLRRKENSS S  KSPPQRS EER
Subjt:  ERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEER

Query:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE
        EAAYLAVRERIFMMH+GEDSEP KPKPRC+PVVARRMIAHALG RINS PE TT HCKEQG+V NNAY QAN+ KE DSTVEVVNKT LQTDQCVN+KNE
Subjt:  EAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNE

Query:  VDKNCNQIVSSARGSN--TARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
        V KN N   SSARGSN   A+MKADK SPKAS VDNEYLKREHLGAAKRMFSQALGK  RKNESLQTR
Subjt:  VDKNCNQIVSSARGSN--TARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

A0A6J1HP21 uncharacterized protein LOC111465372 isoform X22.1e-11385.94Show/hide
Query:  MDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEEREAAYLAVRERIF
        MDSYNRLLLHRLADIFGFAHVSVGEG  RHLVLERCPESS+PSILVSDILWEYDEPQ+STIPHQLLRRKENSS S  KSPPQRS EEREAAYLAVRERIF
Subjt:  MDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWEYDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEEREAAYLAVRERIF

Query:  MMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNEVDKNCNQIVSSA
        MMH+GEDSEP KPKPRC+PVVARRMIAHALG RINS PE TT HCKEQG+V NNAY QAN+ KE DSTVEVVNKT LQTDQCVN+KNEV KN N   SSA
Subjt:  MMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDSKESDSTVEVVNKTILQTDQCVNTKNEVDKNCNQIVSSA

Query:  RGSN--TARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR
        RGSN   A+MKADK SPKAS VDNEYLKREHLGAAKRMFSQALGK  RKNESLQTR
Subjt:  RGSN--TARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
No hits found

Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGACTCAAACATTGCTGAAACCTTATTCGGGAAACACGACGACAATGCTGATAGTTTTGTAGACAGTTTCAACAAACGCCTAATGGGGAAAATGGGCTGCCCTTCCAA
TGCATTCTTCTATGAACATACGGGAGCAGAAAGAAGTTCAGATGGAATCTTGGAGTTGGAACCAATGGATTCATACAACCGTCTTCTATTGCATCGCCTTGCTGATATTT
TTGGATTTGCCCACGTATCAGTTGGTGAAGGTGTTCATAGACACTTGGTTTTGGAGCGATGCCCAGAGTCATCAATACCGTCCATTCTTGTGAGTGATATTCTGTGGGAG
TACGATGAACCTCAAATGTCAACAATACCACACCAACTGTTAAGGAGAAAGGAAAATTCTTCTGCGAGTTCGACGAAATCACCTCCTCAACGATCTCTTGAAGAGAGAGA
AGCAGCCTATCTGGCTGTTCGTGAGCGAATTTTCATGATGCACATGGGAGAAGATAGCGAACCCATGAAGCCAAAGCCACGCTGTAATCCTGTGGTTGCACGACGCATGA
TTGCTCATGCACTGGGTCACAGAATAAATTCATTTCCTGAGGATACTACTTACCATTGCAAAGAGCAAGGAGCTGTAGTTAATAATGCATACACCCAAGCAAATGATTCG
AAGGAGTCTGATTCTACCGTAGAAGTTGTTAACAAAACCATTTTGCAGACAGATCAATGTGTGAACACAAAGAATGAAGTGGATAAGAATTGTAATCAAATTGTGTCATC
CGCAAGGGGAAGTAATACTGCCAGAATGAAAGCTGACAAGATTTCTCCAAAGGCAAGTAGTGTCGACAATGAGTACTTGAAGAGGGAACATTTAGGAGCAGCGAAGAGGA
TGTTTTCTCAGGCTTTGGGCAAGCCCTGCCGGAAGAATGAATCTTTGCAAACTCGTTGA
mRNA sequenceShow/hide mRNA sequence
GTTCGAAATCAAGAAATGCAAACAGTAAAAGGAAATGAAAATAAAGGTGAATCTAAGAGAACGCACTAATCGTTTGAAAGCACGAGTGCAAAGAAGTTGAAAAATGAGGA
AGAAGTTCGAAAGCTCCCTAACTGGAAAATGGCAAAGAAGTGGGAGAAGATGAAGTTGAGCGGTTTGCTATAGGGGCAAATTTTTACGGTGCCCAATTGCCCCATAAATA
AATTTATTTATTATTTTTTAAAGGAAAATTATTTTTTATTTATTATTTTAAAAAAAAAAAAAAAAAAAAAAACTTTATCATTTGTCTGTCAGACGCCAGTTTTGTCCAAG
ATTTCTTCGTAAATCGAACGCCCCGTTGAAACTCCTTTGAGTCTTCAATCTTCATACTTCAGAATGACCATCACCCAATTCGCCATGGTGGAGGAGTTGGCCTTTCTTGT
TAAGGACAACCTCCCTAGCAAGCATCTTATTCTATCCATGGAAGAAACCCTTGTCAACTTTCTTCAGGATGAAACCTGGTAATGTGTTGGATGATGGTTAGATGATGTTA
GTTATTGAGTTTAATAATATTTTTGTGTTTCATTCTGATTCCACCCAATGGTGAAAGGGACAAGTGGAAGGTTATGGACTCAAACATTGCTGAAACCTTATTCGGGAAAC
ACGACGACAATGCTGATAGTTTTGTAGACAGTTTCAACAAACGCCTAATGGGGAAAATGGGCTGCCCTTCCAATGCATTCTTCTATGAACATACGGGAGCAGAAAGAAGT
TCAGATGGAATCTTGGAGTTGGAACCAATGGATTCATACAACCGTCTTCTATTGCATCGCCTTGCTGATATTTTTGGATTTGCCCACGTATCAGTTGGTGAAGGTGTTCA
TAGACACTTGGTTTTGGAGCGATGCCCAGAGTCATCAATACCGTCCATTCTTGTGAGTGATATTCTGTGGGAGTACGATGAACCTCAAATGTCAACAATACCACACCAAC
TGTTAAGGAGAAAGGAAAATTCTTCTGCGAGTTCGACGAAATCACCTCCTCAACGATCTCTTGAAGAGAGAGAAGCAGCCTATCTGGCTGTTCGTGAGCGAATTTTCATG
ATGCACATGGGAGAAGATAGCGAACCCATGAAGCCAAAGCCACGCTGTAATCCTGTGGTTGCACGACGCATGATTGCTCATGCACTGGGTCACAGAATAAATTCATTTCC
TGAGGATACTACTTACCATTGCAAAGAGCAAGGAGCTGTAGTTAATAATGCATACACCCAAGCAAATGATTCGAAGGAGTCTGATTCTACCGTAGAAGTTGTTAACAAAA
CCATTTTGCAGACAGATCAATGTGTGAACACAAAGAATGAAGTGGATAAGAATTGTAATCAAATTGTGTCATCCGCAAGGGGAAGTAATACTGCCAGAATGAAAGCTGAC
AAGATTTCTCCAAAGGCAAGTAGTGTCGACAATGAGTACTTGAAGAGGGAACATTTAGGAGCAGCGAAGAGGATGTTTTCTCAGGCTTTGGGCAAGCCCTGCCGGAAGAA
TGAATCTTTGCAAACTCGTTGAGGGGAAGCAGATTATTACGGAATCACAATTCTTTGAGTTGTCAGGATTACTGGTGCGAATAAAAAGATTAATGGGAATGTGTCTGTGA
TGACAAATTTGTCAACGTTGCTTACATTGCCAAAGGTAAAGTATGAAGGACATCGTTGTCATCGGCAACTTGATCGGGGTGAATACAATGCTTATGGCTGCTAGTTTATG
TTGCCAATCGATATTCAGTTGGCAAATATGAGAATCTAACATTGCATTCTCTAGCTTATGTATTCCTTGATTGATGTGCTTGGAATTTGATCTAGTCGTTTAAGCAGCGC
TGTATGACAAGATTGAATTATGTGGTCCGAGCAGAGTCTTAAGGAAAAGTTTTTGGTACAATAAGTTGGGATCATATCTGTTCATAGACTGAGCTGAGAAGCGCATATAG
CGGAGTTGTGAAGGTCAAGTAAAGGTTTCTAACTTAAATTTGTGTTGGCACTTGAATTATTATATCCTTTCTCTATCGTCATTTGATGTATAAAATAGAGCATCTCGTGG
GTGTCATTAAATAGATACTTGACTCGATATCAGGCAATATACTATTTTAAGTTGTATTGTTCCCTTTAAAA
Protein sequenceShow/hide protein sequence
MDSNIAETLFGKHDDNADSFVDSFNKRLMGKMGCPSNAFFYEHTGAERSSDGILELEPMDSYNRLLLHRLADIFGFAHVSVGEGVHRHLVLERCPESSIPSILVSDILWE
YDEPQMSTIPHQLLRRKENSSASSTKSPPQRSLEEREAAYLAVRERIFMMHMGEDSEPMKPKPRCNPVVARRMIAHALGHRINSFPEDTTYHCKEQGAVVNNAYTQANDS
KESDSTVEVVNKTILQTDQCVNTKNEVDKNCNQIVSSARGSNTARMKADKISPKASSVDNEYLKREHLGAAKRMFSQALGKPCRKNESLQTR