; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0000687 (gene) of Snake gourd v1 genome

Gene IDTan0000687
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionProline-rich nuclear receptor coactivator
Genome locationLG06:78600355..78602509
RNA-Seq ExpressionTan0000687
SyntenyTan0000687
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6575030.1 hypothetical protein SDJN03_25669, partial [Cucurbita argyrosperma subsp. sororia]2.2e-9492.86Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL
        MGTEILRPQDCLIERIRVPPA FCRRRSSYG+ DSNVCNYN RSNRK+  RSERPEQRKRFVSNHSEP+VSKRSSSDDLKAMKNSLVME VTILRRGESL
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL

Query:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        DSKIKSEALKKEGDNLVVCGTERLGPAPEM+PKQIRIVDVRCP++GKADVYAGSAFSMSP PSSLPLPSFSKKK+VSTIVDDSATRDLRRLLRLDA
Subjt:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

XP_004144965.1 uncharacterized protein LOC101217755 [Cucumis sativus]2.8e-8989.5Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTVRS---ERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR
        MGTEILRPQDCLIERIRVPPA+FCRRRSSYG+ DSN+C NYNPRSNRKS  RS   ERPEQRKRFV NHSEP+VSKRSSSDDLKAMKNSLVME VTILRR
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTVRS---ERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR

Query:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        GESLDSKIKSEALKKEGDN+VVCGT+RLGPAPE V KQIRIVDVR P+AGKADVYAGSAFSMSPSPSSLPLPSFSKKK+VS IVDDSATRDLRRLLRLDA
Subjt:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

XP_008458522.1 PREDICTED: uncharacterized protein LOC103497904 [Cucumis melo]5.1e-9190.5Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTV---RSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR
        MGTEILRPQDCLIERIRVPPA+FCRRRSSYG+ DSN+C NYNPRSNRKS     RSERPEQRKRFV NHSEP+VSKRSSSDDLKAMKNSLVME VTILRR
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTV---RSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR

Query:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        GESLDSKIKSEALKKEGDN+VVCGT+RLGPAPE V KQIRIVDVRCP+AGKADVYAGSAFSMSPSPSSLPLPSFSKKK+VSTIVDDSATRDLRRLLRLDA
Subjt:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

XP_022138318.1 uncharacterized protein LOC111009532 [Momordica charantia]4.9e-8688.94Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSN-VCNYNPRSNRKS--TVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRG
        MGTEILRPQDCLIERIRVPPA+ CRRRSSYG+SDS+ V +YNPRSNRKS    R ERPEQ+KRFVSNHSEP+VSKRSSSDDLKAMKNSLVME VTILRRG
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSN-VCNYNPRSNRKS--TVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRG

Query:  ESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        ESLDSK KSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCP+   +DVYAGSAFSMSPSPSSLPLPSFSKKK VSTIVDDSATRDLRRLLRLDA
Subjt:  ESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

XP_022930480.1 uncharacterized protein LOC111436920 [Cucurbita moschata]7.1e-8586.73Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL
        MGTEILRPQDCL  RI VP  +FCRRR SYG+SDSNVCNYN RSNRKS  RS+RPEQRKRFVSN SEP+VSKRSSS+D K   NSLVMENVTILRRGESL
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL

Query:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        DSK K EALKKE DNLVVCGTERLGPAPEMV KQIRIVDVRCP+ GKADVYAGSAFSMSPSPSSLPLPSFSKKK VSTIVDDSATRDLRRLLRLDA
Subjt:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

TrEMBL top hitse value%identityAlignment
A0A0A0KCP9 Uncharacterized protein1.4e-8989.5Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTVRS---ERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR
        MGTEILRPQDCLIERIRVPPA+FCRRRSSYG+ DSN+C NYNPRSNRKS  RS   ERPEQRKRFV NHSEP+VSKRSSSDDLKAMKNSLVME VTILRR
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTVRS---ERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR

Query:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        GESLDSKIKSEALKKEGDN+VVCGT+RLGPAPE V KQIRIVDVR P+AGKADVYAGSAFSMSPSPSSLPLPSFSKKK+VS IVDDSATRDLRRLLRLDA
Subjt:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

A0A1S3C7J3 uncharacterized protein LOC1034979042.5e-9190.5Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTV---RSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR
        MGTEILRPQDCLIERIRVPPA+FCRRRSSYG+ DSN+C NYNPRSNRKS     RSERPEQRKRFV NHSEP+VSKRSSSDDLKAMKNSLVME VTILRR
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTV---RSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR

Query:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        GESLDSKIKSEALKKEGDN+VVCGT+RLGPAPE V KQIRIVDVRCP+AGKADVYAGSAFSMSPSPSSLPLPSFSKKK+VSTIVDDSATRDLRRLLRLDA
Subjt:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

A0A5A7SWA1 Uncharacterized protein2.5e-9190.5Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTV---RSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR
        MGTEILRPQDCLIERIRVPPA+FCRRRSSYG+ DSN+C NYNPRSNRKS     RSERPEQRKRFV NHSEP+VSKRSSSDDLKAMKNSLVME VTILRR
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVC-NYNPRSNRKSTV---RSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRR

Query:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        GESLDSKIKSEALKKEGDN+VVCGT+RLGPAPE V KQIRIVDVRCP+AGKADVYAGSAFSMSPSPSSLPLPSFSKKK+VSTIVDDSATRDLRRLLRLDA
Subjt:  GESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

A0A6J1CCP9 uncharacterized protein LOC1110095322.4e-8688.94Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSN-VCNYNPRSNRKS--TVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRG
        MGTEILRPQDCLIERIRVPPA+ CRRRSSYG+SDS+ V +YNPRSNRKS    R ERPEQ+KRFVSNHSEP+VSKRSSSDDLKAMKNSLVME VTILRRG
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSN-VCNYNPRSNRKS--TVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRG

Query:  ESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        ESLDSK KSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCP+   +DVYAGSAFSMSPSPSSLPLPSFSKKK VSTIVDDSATRDLRRLLRLDA
Subjt:  ESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

A0A6J1EX01 uncharacterized protein LOC1114369203.4e-8586.73Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL
        MGTEILRPQDCL  RI VP  +FCRRR SYG+SDSNVCNYN RSNRKS  RS+RPEQRKRFVSN SEP+VSKRSSS+D K   NSLVMENVTILRRGESL
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL

Query:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA
        DSK K EALKKE DNLVVCGTERLGPAPEMV KQIRIVDVRCP+ GKADVYAGSAFSMSPSPSSLPLPSFSKKK VSTIVDDSATRDLRRLLRLDA
Subjt:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT2G25250.1 unknown protein7.8e-0528.66Show/hide
Query:  NYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIV
        N +P    K  + + R        S  S P  S  + ++            +V IL+RGE ++ KI  E    + +        ++G  P  +   IRI 
Subjt:  NYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIV

Query:  DVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLD
        + +   +  A  YAG   S SP PS +PLP+F   K V+      AT DL ++LRLD
Subjt:  DVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLD

AT3G21570.1 unknown protein3.4e-1634.67Show/hide
Query:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL
        MGTEI+RPQ+CL++R+R  PA+F                +N R N        +P+QR+RF              SD+ +    ++V       R+GES 
Subjt:  MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESL

Query:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSA-FSMSPSPSSLPLPSFSKKKYVSTIV----DDSATRDLRRLLRL
        DS    +  K                                P     D+YAGS+ F++SP+PSSLPLPSFSKKK  S +V    DDSA++DLRRLLRL
Subjt:  DSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSA-FSMSPSPSSLPLPSFSKKKYVSTIV----DDSATRDLRRLLRL

AT4G32020.1 unknown protein9.5e-1130.35Show/hide
Query:  MGTEILRPQDCL------IERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTIL
        MG  +L PQDCL      +++ R P A   R++ +  ++ +       +S+R S+     P    R   +   P  + +      K++ N++ +  V IL
Subjt:  MGTEILRPQDCL------IERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTIL

Query:  RRGESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRL
        +RGE +  K  S+ + +  D   +  T R+GP P ++P QIR+   +   +  A  YAG     SP PS +PLP+F  KK         AT DL R+LRL
Subjt:  RRGESLDSKIKSEALKKEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRL

Query:  D
        D
Subjt:  D


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGGGACTGAGATCCTACGGCCTCAGGATTGTTTGATCGAAAGAATCAGAGTTCCGCCGGCATCGTTTTGTCGTCGGAGGAGTTCTTATGGGAGCTCTGATTCGAATGT
TTGTAACTATAATCCCAGATCTAACAGGAAGTCGACGGTTCGGTCGGAGCGGCCGGAGCAGCGGAAACGGTTTGTTTCGAATCACTCGGAGCCGACGGTCTCGAAGAGAT
CGAGTTCCGATGATTTGAAGGCGATGAAGAATAGTTTGGTGATGGAGAATGTTACGATCTTGAGGCGAGGTGAATCGCTCGATTCGAAGATCAAGAGCGAAGCTCTGAAG
AAGGAAGGTGATAATCTGGTCGTGTGTGGGACCGAGAGGTTGGGGCCGGCGCCGGAAATGGTTCCGAAACAGATCCGGATCGTCGACGTAAGATGTCCGGTAGCCGGAAA
AGCCGATGTGTACGCCGGATCTGCGTTTTCGATGTCGCCGTCTCCAAGTTCTCTTCCATTACCGTCGTTCTCGAAGAAAAAATATGTATCCACCATCGTCGACGACTCGG
CTACCAGAGATCTGAGGCGTTTGCTTCGGCTCGACGCATGA
mRNA sequenceShow/hide mRNA sequence
CTCTCTCTCTTCGCTCAAACAAGGCGGCCAATCGCTTTCTGTTTTCACGCGTCATTTTGCGAGGGGTCGGTGAGATTAAGATTAGACCAACGCTCTTTTATTTTTTCACC
TTCCTCGAAACGACACCGTTTTTTCCATCCTCATTTCTCTCTTTCTTTGTTTTTCTTTCCCTATATATCTCTCATCACGCGTTCTGAAGACCAAACAAAGCCTTGCAGAG
CAGAAATACAGAGAGGGATTCCGGGGGAAAAAAAAAAGAGAAAAAAAAAAAATTGAAAAGACGATAATACCCTTCTTCTTCTTCTTCTTCCTCTTCTTCTTGTTCCAGTG
TCTCCCGTTCTGTTGTTGGTCCCCTGTGTGAGGAAGAGGAGGCGAGGGTTAAAGCTTTTTAGTTTCAGAGAAAAGGGAACTCACAGCCCGTAGCGTTTGTTCTTCTTTGG
TTTATAAACTTTTTTTTTTCGTTTGTTTTTTGGGAGATTTCTTAGGGATTTTGACTTCTTTCATCCATGGGGACTGAGATCCTACGGCCTCAGGATTGTTTGATCGAAAG
AATCAGAGTTCCGCCGGCATCGTTTTGTCGTCGGAGGAGTTCTTATGGGAGCTCTGATTCGAATGTTTGTAACTATAATCCCAGATCTAACAGGAAGTCGACGGTTCGGT
CGGAGCGGCCGGAGCAGCGGAAACGGTTTGTTTCGAATCACTCGGAGCCGACGGTCTCGAAGAGATCGAGTTCCGATGATTTGAAGGCGATGAAGAATAGTTTGGTGATG
GAGAATGTTACGATCTTGAGGCGAGGTGAATCGCTCGATTCGAAGATCAAGAGCGAAGCTCTGAAGAAGGAAGGTGATAATCTGGTCGTGTGTGGGACCGAGAGGTTGGG
GCCGGCGCCGGAAATGGTTCCGAAACAGATCCGGATCGTCGACGTAAGATGTCCGGTAGCCGGAAAAGCCGATGTGTACGCCGGATCTGCGTTTTCGATGTCGCCGTCTC
CAAGTTCTCTTCCATTACCGTCGTTCTCGAAGAAAAAATATGTATCCACCATCGTCGACGACTCGGCTACCAGAGATCTGAGGCGTTTGCTTCGGCTCGACGCATGAGAT
CTTCTCCAGACAGTGAATTTGGATCGGAAATCCATCAAATAATCATCTCTCGTCCATTTCTCATCTCTCATCTTTCTAACGTCTCTCTCGATCTGTCCAGATCTGAACTG
CCGTGATTTTTTTAAACGGTGGTAGATCGGAAAATCGAGCTAAACGAGACAGGTAAATCAGATATAAAAGAAGAAGTATATCATAATATCGTGTATTTATGATGATCCAG
GTTTGTTTAACGGGGAAGAAATTTGTGTATTGTGTAAGTTCTTAGCTAAAATCTAGGCCGGAAGAAAAGTAATTTGGGTGGGTATGGGTTTGATTTCTGCAAATATTGGG
AGAAAAGTAGTTTGCGCTTTGAATGATTAATTTTCTGCTCTGTTGTGAATTTCTTTAAGTCAAGGGCTTTGTTAGTTTTTCTTCTTCTTCTGTATGATATTATGAAACAA
GCTTAATATAATAAGAAAACAAATCTGATGAAGATTTTGTAGATCTGGTCGCCATAGCCATAGTTCTTGAAGTTCTTCACCATCTGAAAGTCCCCTTTCTCTTTCCCCTC
ATTTCTCTTCCGTTTACTGAAATTTCCGCCATTAAAGAACATGTCGAGCTCGTTTCAGTTCTGAAAAGCAAAATTAAAAGATATTACAGTCAAATTCGGTTCCAGTAAAG
AAATGAAACGGATGATGAATTTTGAAGTGTTTTCCTCACCGCCATGGTTTTTTCTTTAAAGACAGGGAAACGGCGGCACATGGGAGACATGAAGGAGAAGAAGAAGAATA
GGGTTTTGAGATTGGTAGGTGGAAGGTCGAATCACAGGAAAGATATTTTTTTTGCTTTTCTAAAAGAATATAAAAAGGCAAAAGCTGGCTGCACGATAATAATCAACAAT
TCGTACTTAATGACATATTTGTGTGGAATAAGTCTGTATGGCTCATTTGTTTTTTTTTTATTATTATTATTTATTTTGTATTTCCATGAATTGTCAATATTTTTTAAAAA
TTGATACAAAATTAAAATTTAGAAATTTATAATTGATATAAATATTTATTTTCATAGAAGGGAGG
Protein sequenceShow/hide protein sequence
MGTEILRPQDCLIERIRVPPASFCRRRSSYGSSDSNVCNYNPRSNRKSTVRSERPEQRKRFVSNHSEPTVSKRSSSDDLKAMKNSLVMENVTILRRGESLDSKIKSEALK
KEGDNLVVCGTERLGPAPEMVPKQIRIVDVRCPVAGKADVYAGSAFSMSPSPSSLPLPSFSKKKYVSTIVDDSATRDLRRLLRLDA