; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Tan0012844 (gene) of Snake gourd v1 genome

Gene IDTan0012844
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionRetrotransposon protein
Genome locationLG01:14001412..14006369
RNA-Seq ExpressionTan0012844
SyntenyTan0012844
Gene Ontology termsGO:0046872 - metal ion binding (molecular function)
InterPro domainsIPR027806 - Harbinger transposase-derived nuclease domain


Homology Show/hide homology
GenBank top hitse value%identityAlignment
ADN34114.1 retrotransposon protein [Cucumis melo subsp. melo]8.0e-5567.53Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDA+SR N LKVP+GYYYL DVGYPNAEGFLAPY G+RYHL EWRG  NAP   +EFFNMKHYSARNVIER F VLKGRWAILR KS+YPV+
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++  + D ++EVDS       ++I +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

KAA0044844.1 retrotransposon protein [Cucumis melo var. makuwa]8.0e-5568.18Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDA+SR N LKVP+GYYYL DVGYPNAEGFLAPY G+RYHL EWRG  NAP   +EFFNMKH SARNVIER F VLKGRWAILREKS+YPV+
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++  + D ++EVDS        NI +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

KAA0062747.1 retrotransposon protein [Cucumis melo var. makuwa]2.5e-5668.83Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDAISR NGLKVP+GYYYLCD GYPNAEGFLAPY GERYHLSEWRG  NAP   REFFNMKH S+RNVIER F +LKG WAILR KS+YPV 
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++S ++D+++E DS      G+ I +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

KAA0068124.1 retrotransposon protein [Cucumis melo var. makuwa]3.1e-5466.88Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDA+SR NGLKVP+GYYYL D GYPNAEGFLAPY G+RYHL EWRG  NAP   +EFFNMKH SARNVIER F VLKGRWAILR KS+YPV+
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++  + D ++EVDS       ++I +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

XP_038885881.1 protein ALP1-like [Benincasa hispida]1.9e-5671.24Show/hide
Query:  TIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQI
        T DSRV RD ISR NGLKVP+GYYYLCDVGYPNAEGFLAPY GERYHLSEWRG  NAP   REFFNMKH SA NVIER   +LKGRWAILR +S+YPVQI
Subjt:  TIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQI

Query:  QCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        QCRTI   CL+HN I REM++S L+++++EVDS      G  I +IESSNEWT
Subjt:  QCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

TrEMBL top hitse value%identityAlignment
A0A5A7TNY6 Retrotransposon protein3.9e-5568.18Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDA+SR N LKVP+GYYYL DVGYPNAEGFLAPY G+RYHL EWRG  NAP   +EFFNMKH SARNVIER F VLKGRWAILREKS+YPV+
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++  + D ++EVDS        NI +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

A0A5A7UPP3 Putative nuclease HARBI15.6e-5466.23Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S +DSR+LRDAISR NGLKVP+GYYY  D GYPNA+GFLAPY G+RYHL EWRG+ N P   +EFFNMKH SARNVIER F VLKGRWAILR KS+YPV+
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++  + D + EVDS     + ++I +IE+SNEWT
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

A0A5A7VL29 Retrotransposon protein1.5e-5466.88Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDA+SR NGLKVP+GYYYL D GYPNAEGFLAPY G+RYHL EWRG  NAP   +EFFNMKH SARNVIER F VLKGRWAILR KS+YPV+
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++  + D ++EVDS       ++I +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

A0A5D3DG22 Retrotransposon protein1.2e-5668.83Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDAISR NGLKVP+GYYYLCD GYPNAEGFLAPY GERYHLSEWRG  NAP   REFFNMKH S+RNVIER F +LKG WAILR KS+YPV 
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++S ++D+++E DS      G+ I +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

E5GCB5 Retrotransposon protein3.9e-5567.53Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSR+LRDA+SR N LKVP+GYYYL DVGYPNAEGFLAPY G+RYHL EWRG  NAP   +EFFNMKHYSARNVIER F VLKGRWAILR KS+YPV+
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT
        +QCRTI   CL+HNLI REM++  + D ++EVDS       ++I +IE+SNEW+
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G43722.1 unknown protein4.2e-0939.78Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRG-YYYLCDVGYPNAEGFLAPYSGE-----RYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGR
        S  D+ VL+ A    +   +P    YYL D GYPN +G LAPY        RYH+S++      PR   E FN  H S R+VIER F + K +
Subjt:  STIDSRVLRDAISRSNGLKVPRG-YYYLCDVGYPNAEGFLAPYSGE-----RYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGR

AT4G10890.1 unknown protein2.1e-0841.79Show/hide
Query:  YYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAIL
        YYL +  YP   G+L P+    YHL ++ G    P  ++E FN KH   R+VI+R F V K +W IL
Subjt:  YYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAIL

AT5G28730.1 unknown protein4.8e-0537.93Show/hide
Query:  MGRSTIDSRVLRDAISRSNGLKV-PRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIV
        M  ST D+RVL  AIS      V P   YYL D GY N  G+LAPY  E     +   +      L E  N+K Y   NV     +V
Subjt:  MGRSTIDSRVLRDAISRSNGLKV-PRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIV

AT5G35695.1 CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (InterPro:IPR006912)8.4e-1836.36Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  DSRVL DA+ +          +YL D G+ N   FLAP+ G RYHL E+ G    P    E FN++H S RNVIER F + K R+AI +    +  +
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGEN
         Q   + T   +HN + +E  S       E  + G +V N  N
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGEN

AT5G41980.1 CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (InterPro:IPR006912)2.7e-1635.88Show/hide
Query:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ
        S  D +VL  A++R N L+VP+G YY+ D  YPN  GF+APY G          S N+    +E FN +H      I R F  LK R+ IL     YP+Q
Subjt:  STIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQ

Query:  IQCRTITTYCLIHNLICREMSSSTLLDEVEE
         Q + +   C +HN +  E     +    EE
Subjt:  IQCRTITTYCLIHNLICREMSSSTLLDEVEE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGGAAGGTCGACAATCGATTCTAGAGTTCTTAGGGATGCCATCTCTCGTTCTAACGGTTTGAAGGTTCCTAGGGGGTACTATTATTTGTGTGATGTTGGTTACCCTAA
TGCTGAGGGATTCCTTGCTCCTTATAGTGGAGAACGATACCACCTTTCAGAGTGGCGTGGATCATGGAATGCACCGAGAATTCTACGAGAATTTTTCAACATGAAACACT
ATTCTGCAAGGAACGTGATCGAAAGAGAGTTCATAGTCTTGAAGGGGAGGTGGGCCATTCTACGAGAAAAGTCATTTTACCCGGTCCAAATACAATGTCGAACTATAACA
ACATATTGTCTCATTCACAACCTAATCTGTAGGGAGATGAGTTCGAGCACTCTATTGGATGAGGTGGAGGAAGTCGACTCTGGTCAAATAGTAGCGAATGGGGAAAATAT
ACAATTCATTGAAAGCTCCAACGAATGGACCTAA
mRNA sequenceShow/hide mRNA sequence
AAATAACCCTTTGTCACAAGCATTAATTTTCGCTATCTTTCTCTCATTACTCTATGGCGAAACGAAACGTCTCACCTTCCTCTCGAAGAACTTCTCTCCTTCCTCTCATA
GAGCTTCTCTCATTCGTCTCTCTTTCATCTCCATCTTCCCTACTGTGAATCGTCTTTCAATGGAGTTGAGGTTAGGGTTTGCTATATTCCTTCTACTTTTCTCTGACAGG
TACGCATCTTCTTCTTACTTGTTCGATTTTTCGTCTTCGAATCCATACCCTTTACTCCGTCGATCGACTTTTCTTCATGGATCTAGTGTCCAACTATCCATGCAACGAAA
TCTATCTTATTTTACCTCTGAATCGTCTCGTTTCGTGGCGATTTTTCGAAAAATTCTTCCAAATGGTTTAGGATTTGACTAGATCCTTAGCCCTAATCTTTCACTCTTTT
TTCCAGAACCCTAATCTCAACATCCTAAGGGGAGGACTCACCTCCCGCCGCTTTAATGCCCCATGTCGGTCCCTCTTTTGTTTCCATTTAATCCTTTCTTCTGTACTTAT
CTCTGTCATGATATGGCTAGTGCGATTGATTCGACAAATAGGAAAACAAAATTGTATGGGACTGGTGAGGGGTTTTAGAGCTTGGTGGGGGAAGGGTCACAGTTGTCATA
CACTGCAGGTTTGTCTTCTTTCCCTATCGGCCGACCAATGATGAACGATTGTTCTGTAAAGCCCAACGATAAACTCTTGCTTTCTTTCGTATTTTTTATTTGTTCTGTAT
AATGTATGTTTCTTATGATTTATGAGAAGTTTATTATATTTGTAAATTCTCTCATTCTGGACTCTGTTTTTTGTTTTTGCCATGGTTTGATATGTGTTTCTACTATGTTT
GTCACGAATTCAATCTTCTGTTTGATATACTTAATCAACAAGTGTTGGGCCTCTGCTTTTATCTTACGATTTTTCCTCTATTTGTTAAATTTATGTCCCATTGTTCTGCT
TCTAATTTACGATTTATCCTCTGTTTGTACAACAAGTGGTGGGTCTCTGCTTATTGGATATGACTTGATTTTTTTTTTTTTTAGGATTTGTTTCTTCTGTCACGTTGGAT
TTAGAAAAGTTTTGAGTTCTTTGTCTGTGCATTAACTTCTTGACAAAACACATGTATTGTTAATATTTTTTTTGTAATAAATAAATATTTATATACTTATATTCCATGAA
TATTATCTTCTCAACTTCACCTACCCGAGAGTTGGTTTTCTCCTTCTGTTCAACTTATTAATTGCATTACTTAATCTAATTGTATACCTTTTTAGCTGAACCGTAAGCCT
ACTGCCTTGTTGAGTAATGAGGTTTAAATGCACTTTAATTTCCACCACTTCCCCATTCCAACTACAATTCCTATTCTCCTATTATATAAACATATGTCACATGCTTTTGT
TCTTTGAGAATAACTCCACTGCAAACATCCCCTATTGTCACCTGTGAGTACTTTTTGTTTCCCTTTTTCATGTTCTCATACTATTTTCTCTTCTGTGTTTATTCTTCAGT
TCTATTATAGGTTGGGATATCTTATATTTTGTCTTGTATTCAATAAACTCATATGTTTTTTCCACCACCATTTCATTGTTATCGTTACTGTCGTGAGGAAAGCTTACATC
AATCCCTGAGGTCGGCTTTAATATGCTTTATCTTTCACACTTGTGGTTGTTCTTGTTTTAGGTTTCACCCATTACCCGTGCAATATTCAGTTTGACAGCTCCAAGTCCAT
AACATCCCTGAAGGTCATAGGTTAAAGGACTATCCTTAACCTATTTTTTTTAGCATTTCTAAAGGCATGAACCAGTCATCTTCACCAATCTTAGTTTGAGGTTCGTTGGT
TTAGGATTGTAGTTATGTCATGCTTGTGGTTTTTTCTGTTGTATGCTAATTAAAATTAGTATGGAACTGTGTTCATTTTGGTATTTCTGTTGAACATGTTCATGTTGATA
ACATTGAATATGTGGTTTAACATTGATATTTTGTATGAGTGATTAGAAATGTTTATTATTTTTTTACTTTTCTGAACTAATATCAAATTTCATATTATGATACCAATAGT
CAGTAGAACAAATCTACTTTTAGAACAAAGTTTTTAATTACAAAGAAAATTTTAGAACAAATATGGCATCTAGAAAATGTATGTATATTATGGTTTTGGAAAATAAAAGG
ATTTAAGAAAAAAAAAACAAAGAACAAAAGTTGCTAGAAACATACTCGAACACATTGAACAAAGTTTGGGGAATCAACTAACACATTTGAATACATTTTCAATTTGGGGA
TATCAACTACTTTTTTTTTTTTTTTAAAAAAAAGTGATCTTTTCTTCAATCTAGGAACACACTTGAACAAAGTTTGTACCATTTTTTTTGTATTGAAATTTGGGGATATC
AACCTTTATGAAAGAAAATGATATTTTGTTCAACCAAGATAATGACCATACTTGTAAAAACTTGGGGTGTCTAATTGATTTAACATGATATCAACTTTCACCAATTAAAA
AAACTAGAACCAATCACCAGCGCATGCACTGATGAGCGATGGAAAAAGTTTGAGGTAATGAAATGAGGCTAAGTATGTCCATTGTTGGTGAAGATAAAAGGACCATACTT
ATTTGACATGTTTAATGATGGTTGTGATGTCTTTATTCCAAACAGAATTGTCTGGCCGCCCTAGATGGTACATATATCAAAGTGAATGTCAAGGCTGCTGATCGACTGCG
ATATAGGACGCGAAAAGGTGAAATTGCAACGAACGTACTAGGGGTTTGTTCTCCGATCGAAGAATTTATATTTGTCATGCCAGGATGGGAAGGTCGACAATCGATTCTAG
AGTTCTTAGGGATGCCATCTCTCGTTCTAACGGTTTGAAGGTTCCTAGGGGGTACTATTATTTGTGTGATGTTGGTTACCCTAATGCTGAGGGATTCCTTGCTCCTTATA
GTGGAGAACGATACCACCTTTCAGAGTGGCGTGGATCATGGAATGCACCGAGAATTCTACGAGAATTTTTCAACATGAAACACTATTCTGCAAGGAACGTGATCGAAAGA
GAGTTCATAGTCTTGAAGGGGAGGTGGGCCATTCTACGAGAAAAGTCATTTTACCCGGTCCAAATACAATGTCGAACTATAACAACATATTGTCTCATTCACAACCTAAT
CTGTAGGGAGATGAGTTCGAGCACTCTATTGGATGAGGTGGAGGAAGTCGACTCTGGTCAAATAGTAGCGAATGGGGAAAATATACAATTCATTGAAAGCTCCAACGAAT
GGACCTAATTTAGGGATGGCTTGACAAATCAAATGTTTAATGTTTGGGAACAATCATGATTACTTATGGACTGTAATAATTATTATGTCAAACACTAACTTATTTTCATG
TACTCACAATTGCTGATATTTTATGACGATCCTCTTGCTCATATGTTATGTTTTCTATTGTGCAACACTTACTTGACTTGCCTTCGTTGTGACATAAACCTAATTTGGCA
ATACACATGCATGTAGCATTATGGCAGGTACTTCGAAAAACTCCAAACATACATGGACGAAGGTCGAGGATGCGAGGTTGGTGGAGTCACTTGTACCTTTAGAATATAAT
GGGTGATGATCTGACAACGGGACCTTCAGGTCTGGCTATTTACACCATCTCCAGAAGATGCTAGTTGAGAAATTGCCAAATTCATGCCTATAACAAAACACAATCGATTG
TAAGGTCAGAACTCTAAAAAAATAATACAATGCTATTGCAGAGATGCTTAGTAATGCATGTAGTGACTTCAGCTGAAATGAAGAGTTCAAATGTGTTGAGGCAGAGAAGG
AGGTGTTTGATGCATGGGTTAAGAACCATACAAACGCAAAGGGGATGAAAAATAAGCCATTTCCGCACTATGATGACCTCGCATTTGTCTTCGGAAAGGATAGAGCTACA
GGAATAGGTGCAGAGACTCCAATGGAAATGGCATCTAGCTCTGCAGAACAAATGGATGAAGAGATTCGTTTGAGATCACAAGACTTCATGGGGGTAGAACAACGAACAAT
GGAGAATCCATGAATTTGTGACGTAGGGGAAGATGACTTGCCAGACACTTCTACTAGTAGGCGTAATACATCTGGTATGTCTTCTAGATGTACTGGGAGAAAAAGAAAAT
GATCATCCTTCCAAATTGAATTAATTGATGTTGTGCGCACAACAATGGATATGCAAACCAATCACATGCAAAAACTTCTATCCTGGCAGAAGGAGAAGTATGAGTTGAAG
GCTGCACGAAGGAAGGAAGTAGCCGATCTCTTGTATCAGATAGAAGGATTGACTGAACATGATCGTGTCTCCTTGATAGACTTGCTTGTGACTTATATCCAGAAGACTGA
CTACTTTCTACAGGTTCCACCTTAATCAAGGAGGACATATTGCATGCGCCTACTGGGAATGACTGGATGATTAGACATTGATCATTTTGTTGTTGTATTTTGTGGACATT
ACTTTGTATCTACTACTACTTTGTATTTTTTTATGGGTTTTTAACTAATTTTTTTGTTAACAATGTACGCATAAGCCATTGAATTGATATATTATAAATTTGGTGATATG
CAAGTAATACATGTCACTGAACTA
Protein sequenceShow/hide protein sequence
MGRSTIDSRVLRDAISRSNGLKVPRGYYYLCDVGYPNAEGFLAPYSGERYHLSEWRGSWNAPRILREFFNMKHYSARNVIEREFIVLKGRWAILREKSFYPVQIQCRTIT
TYCLIHNLICREMSSSTLLDEVEEVDSGQIVANGENIQFIESSNEWT