; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Clc08G07670 (gene) of Watermelon (cordophanus) v2 genome

Gene IDClc08G07670
OrganismCitrullus lanatus subsp. cordophanus (Watermelon (cordophanus) v2)
DescriptionProtein of unknown function (DUF1997)
Genome locationClcChr08:19255805..19260260
RNA-Seq ExpressionClc08G07670
SyntenyClc08G07670
Gene Ontology termsNA
InterPro domainsIPR018971 - Protein of unknown function DUF1997


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_008456550.1 PREDICTED: uncharacterized protein SYNPCC7002_A1590 isoform X1 [Cucumis melo]2.9e-10695.69Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  +DS RPSL ISTNSNPKARF+ARRSESVTVRQL RPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVE+QPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRF AQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

XP_022939661.1 uncharacterized protein LOC111445487 isoform X1 [Cucurbita moschata]4.9e-10696.6Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  DDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGT
        RQPLGT
Subjt:  RQPLGT

XP_022939662.1 uncharacterized protein LOC111445487 isoform X2 [Cucurbita moschata]6.8e-10896.65Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  DDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

XP_022992978.1 uncharacterized protein LOC111489142 isoform X2 [Cucurbita maxima]8.9e-10896.17Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  DDSPRPSLRIS NSNPKARF+ARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

XP_038883978.1 uncharacterized protein SYNPCC7002_A1590 isoform X1 [Benincasa hispida]4.0e-10896.65Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  DDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DD TFRCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTS+TVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

TrEMBL top hitse value%identityAlignment
A0A1S3C468 uncharacterized protein SYNPCC7002_A1590 isoform X11.4e-10695.69Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  +DS RPSL ISTNSNPKARF+ARRSESVTVRQL RPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVE+QPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRF AQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

A0A5D3BDM7 Uncharacterized protein1.4e-10695.69Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  +DS RPSL ISTNSNPKARF+ARRSESVTVRQL RPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVE+QPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRF AQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

A0A6J1FGJ8 uncharacterized protein LOC111445487 isoform X12.4e-10696.6Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  DDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGT
        RQPLGT
Subjt:  RQPLGT

A0A6J1FHF9 uncharacterized protein LOC111445487 isoform X23.3e-10896.65Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  DDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

A0A6J1K0U6 uncharacterized protein LOC111489142 isoform X24.3e-10896.17Show/hide
Query:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL
        S  DDSPRPSLRIS NSNPKARF+ARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVL+VRVEVQPNGCCIKL
Subjt:  SGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKL

Query:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
        LSCKLEGSPIVVAQNDKFDA MVNQISYDVNRG+SPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS
Subjt:  LSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTS

Query:  RQPLGTGEI
        RQPLGTGEI
Subjt:  RQPLGTGEI

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT5G04440.1 Protein of unknown function (DUF1997)3.8e-8874.66Show/hide
Query:  SGSGFDDSPRPS----------LRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVR
        S S FD+SP+PS          +R+S++S PKARFIAR+ +SV+VRQL RPL EYMSLPASQYSVLDAERIER+DD TFRCYVY FKFF FEVCPVL+VR
Subjt:  SGSGFDDSPRPS----------LRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVR

Query:  VEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLV
        VE QPNGCCIKLLSCKLEGSP+VVAQNDKFDA MVN++S D  +  S  Q++TSD VIEVNIEIPFAFR  PV AIE+ GTQVL+QILKLMLPRF +QL 
Subjt:  VEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRAIPVQAIESAGTQVLEQILKLMLPRFTAQLV

Query:  KDYQAWASGDTSRQPLGTGEI
        KDY AWASGDTSRQPLGTGEI
Subjt:  KDYQAWASGDTSRQPLGTGEI


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGATCAACAGAGCGATTGGGGCTACATTGATGGCTTTGTTCCTCGTGGACCTCGCCTTCGCTGCCCGATCGCCGAGGAGAGGGTTTGGTGAAGGAGGCGGTGGCGG
AAGTGGCGGTGGAGGAGGAGGAGGACTGCTTCCAGGTTCGGGTTACGGTTCTGGTTTTGGTTCTGGCGGAGGCGAAGGATACGATGAGGGAGAAGGCGACGGAGCGTTCG
GCAGAGGCGGTGGCGGTGGCGGAGGAAGCGGTGGTGGAGGTGGGGGCGGAACAGGGTCTGGATCCGGATTCGGGTCTGGATTCGGATCAGGAAGCGGTTCCGGGTTTGGA
AGAGGCGGCGGAGGCGGAGGCGGTGGGGGCAGAGGAGGAGGGGGAGGTGGAGGTTCCGGAGGCGGAAATGGATCAGGCTACGGCTCGGGATACGGCAGCGGAGGCGGATA
TGGCAGTGGGAGCGGCAAAGGAGGCGGTGGAGGAGGAGGAGGAGGTGGCGGGGGCGGAGGTTCTACCGGGAGTGGCTCTGGATTTGACGATTCTCCCAGGCCTTCGCTTC
GGATCTCCACGAATTCCAATCCAAAAGCGCGTTTCATTGCCCGGAGGAGTGAGTCCGTCACGGTTCGGCAGTTGGCGCGGCCTCTAAATGAGTATATGAGTTTGCCGGCT
AGTCAATACTCGGTGTTGGATGCGGAGAGGATTGAGCGGATTGATGACTGCACCTTTAGGTGTTATGTTTATAGATTTAAATTCTTTGCGTTTGAGGTTTGCCCTGTTTT
GGTTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTGTCGTGTAAGCTTGAGGGCTCCCCAATCGTGGTTGCACAGAATGATAAATTTGATGCTTATA
TGGTGAACCAGATATCTTATGATGTGAATCGAGGCAACTCACCCTTGCAGAAGCTCACATCGGATACTGTCATCGAGGTTAACATTGAGATTCCTTTCGCCTTCCGTGCA
ATTCCTGTACAAGCAATTGAATCAGCTGGGACCCAAGTCCTTGAACAAATATTGAAGCTCATGCTTCCCCGCTTCACAGCCCAGCTTGTGAAGGACTATCAAGCATGGGC
CTCTGGCGATACATCAAGGCAACCTCTTGGAACGGGTGAGATCTGA
mRNA sequenceShow/hide mRNA sequence
ATGGCGATCAACAGAGCGATTGGGGCTACATTGATGGCTTTGTTCCTCGTGGACCTCGCCTTCGCTGCCCGATCGCCGAGGAGAGGGTTTGGTGAAGGAGGCGGTGGCGG
AAGTGGCGGTGGAGGAGGAGGAGGACTGCTTCCAGGTTCGGGTTACGGTTCTGGTTTTGGTTCTGGCGGAGGCGAAGGATACGATGAGGGAGAAGGCGACGGAGCGTTCG
GCAGAGGCGGTGGCGGTGGCGGAGGAAGCGGTGGTGGAGGTGGGGGCGGAACAGGGTCTGGATCCGGATTCGGGTCTGGATTCGGATCAGGAAGCGGTTCCGGGTTTGGA
AGAGGCGGCGGAGGCGGAGGCGGTGGGGGCAGAGGAGGAGGGGGAGGTGGAGGTTCCGGAGGCGGAAATGGATCAGGCTACGGCTCGGGATACGGCAGCGGAGGCGGATA
TGGCAGTGGGAGCGGCAAAGGAGGCGGTGGAGGAGGAGGAGGAGGTGGCGGGGGCGGAGGTTCTACCGGGAGTGGCTCTGGATTTGACGATTCTCCCAGGCCTTCGCTTC
GGATCTCCACGAATTCCAATCCAAAAGCGCGTTTCATTGCCCGGAGGAGTGAGTCCGTCACGGTTCGGCAGTTGGCGCGGCCTCTAAATGAGTATATGAGTTTGCCGGCT
AGTCAATACTCGGTGTTGGATGCGGAGAGGATTGAGCGGATTGATGACTGCACCTTTAGGTGTTATGTTTATAGATTTAAATTCTTTGCGTTTGAGGTTTGCCCTGTTTT
GGTTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTGTCGTGTAAGCTTGAGGGCTCCCCAATCGTGGTTGCACAGAATGATAAATTTGATGCTTATA
TGGTGAACCAGATATCTTATGATGTGAATCGAGGCAACTCACCCTTGCAGAAGCTCACATCGGATACTGTCATCGAGGTTAACATTGAGATTCCTTTCGCCTTCCGTGCA
ATTCCTGTACAAGCAATTGAATCAGCTGGGACCCAAGTCCTTGAACAAATATTGAAGCTCATGCTTCCCCGCTTCACAGCCCAGCTTGTGAAGGACTATCAAGCATGGGC
CTCTGGCGATACATCAAGGCAACCTCTTGGAACGGGTGAGATCTGAGATTCGTATCCGAAGTCTACGCCTCGAATTTTGACTCTCAAAGTCGTCTGTTTCCTTCGACAAT
TTAATAGGAGTCTAGAAGCTGGAAGAATTTGTGTACTTGGAGTGTAGGACCACCCTTTTAGGCTGTTTATGCTCTTTGCAGCTTGCCAAGCCAAGACATATTCTTCAATA
TTTGGCATTAGTAAAAAATTTTTTTAAGCAGGTTGAACGAGTACATGTAAATTTCCTCAAGGTATTCTAGTCAAAGTATAGTTCATGTATGTCATTTGAACTCTATTTTG
TAGTCATTAAGTATAATTTGGATATATTGCTTAAATTATAATGTTAATTATGTGTGGCATTTTATATCTGATGTATGAACGATTGATTATCTGTAATAAATAAAATCAAA
GCTGATTAAGATTTATTTAA
Protein sequenceShow/hide protein sequence
MAINRAIGATLMALFLVDLAFAARSPRRGFGEGGGGGSGGGGGGGLLPGSGYGSGFGSGGGEGYDEGEGDGAFGRGGGGGGGSGGGGGGGTGSGSGFGSGFGSGSGSGFG
RGGGGGGGGGRGGGGGGGSGGGNGSGYGSGYGSGGGYGSGSGKGGGGGGGGGGGGGGSTGSGSGFDDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPA
SQYSVLDAERIERIDDCTFRCYVYRFKFFAFEVCPVLVVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDAYMVNQISYDVNRGNSPLQKLTSDTVIEVNIEIPFAFRA
IPVQAIESAGTQVLEQILKLMLPRFTAQLVKDYQAWASGDTSRQPLGTGEI