; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lsi08G006770 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome

Gene IDLsi08G006770
OrganismLagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
DescriptionProtein of unknown function (DUF1997)
Genome locationchr08:15119797..15122858
RNA-Seq ExpressionLsi08G006770
SyntenyLsi08G006770
Gene Ontology termsGO:0046872 - metal ion binding (molecular function)
InterPro domainsIPR018971 - Protein of unknown function DUF1997


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022939661.1 uncharacterized protein LOC111445487 isoform X1 [Cucurbita moschata]4.9e-10379.38Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQ+
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

XP_022939662.1 uncharacterized protein LOC111445487 isoform X2 [Cucurbita moschata]4.9e-10379.38Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQ+
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

XP_022939664.1 uncharacterized protein LOC111445487 isoform X3 [Cucurbita moschata]2.2e-10379.77Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQV
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

XP_038883978.1 uncharacterized protein SYNPCC7002_A1590 isoform X1 [Benincasa hispida]3.1e-10582.49Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SPSSISL CKNPRT FSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDD TF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFD                                     AYMVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTS+TVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQ+
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

XP_038883979.1 uncharacterized protein LOC120074942 isoform X2 [Benincasa hispida]1.4e-10582.88Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SPSSISL CKNPRT FSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDD TF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFD                                     AYMVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTS+TVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

TrEMBL top hitse value%identityAlignment
A0A6J1FGJ8 uncharacterized protein LOC111445487 isoform X12.4e-10379.38Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQ+
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

A0A6J1FHF9 uncharacterized protein LOC111445487 isoform X22.4e-10379.38Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQ+
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

A0A6J1FHV7 uncharacterized protein LOC111445487 isoform X31.1e-10379.77Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PRTSFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQV
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

A0A6J1JRG4 uncharacterized protein LOC111489142 isoform X11.2e-10278.6Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PR SFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQ+
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

A0A6J1K0U6 uncharacterized protein LOC111489142 isoform X21.2e-10278.6Show/hide
Query:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF
        MALS  SP+SISLH ++PR SFS+T RPF+ILASSADDSPRPSLRIS NSNPKARF+ARRSES+TVRQLARPLNEYMSLPASQYSVLDAERIER+DDCTF
Subjt:  MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTF

Query:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV
        RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDA+                                     MVNQISYDV
Subjt:  RCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDV

Query:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        NRG SPLQKLTSDTVIEVNIEIPFAFRAIP+QAIESAGTQVLEQILKLMLPRFTAQ+
Subjt:  NRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT4G31115.1 Protein of unknown function (DUF1997)1.4e-1022.99Show/hide
Query:  KNPRTSFSLTHRPFLILASSADDSPRPSLRIST----------NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC-
        + P+TS S       +L S  +  PR  + +            +S  KA   A R + + +    +     +E++  P+   +V++A+ ++    VDD  
Subjt:  KNPRTSFSLTHRPFLILASSADDSPRPSLRIST----------NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC-

Query:  -TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQIS
         T+RC + + +  +FEV PVL++RV      C ++LLSCKLEGS ++  Q+++F                                     +A M N ++
Subjt:  -TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQIS

Query:  YDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV
        +++   + P   L  D  + V +EI    F  +P+ A+E+ G  V++ ++  ++P    Q+
Subjt:  YDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQAIESAGTQVLEQILKLMLPRFTAQV

AT4G31115.2 Protein of unknown function (DUF1997)1.8e-1023.85Show/hide
Query:  NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG
        +S  KA   A R + + +    +     +E++  P+   +V++A+ ++    VDD   T+RC + + +  +FEV PVL++RV      C ++LLSCKLEG
Subjt:  NSNPKARFIARRSESVTVR---QLARPLNEYMSLPASQYSVLDAERIER---VDDC--TFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEG

Query:  SPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQAIESAGT
        S ++  Q+++F                                     +A M N +++++   + P   L  D  + V +EI    F  +P+ A+E+ G 
Subjt:  SPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPF-AFRAIPIQAIESAGT

Query:  QVLEQILKLMLPRFTAQV
         V++ ++  ++P    Q+
Subjt:  QVLEQILKLMLPRFTAQV

AT5G04440.1 Protein of unknown function (DUF1997)1.1e-7156.88Show/hide
Query:  ALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPS----------LRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAER
        +LSF S    + + +NP  SF++T       +SS D+SP+PS          +R+S++S PKARFIAR+ +SV+VRQL RPL EYMSLPASQYSVLDAER
Subjt:  ALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPS----------LRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAER

Query:  IERVDDCTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAY
        IERVDD TFRCYVY FKFF FEVCPVL+VRVE QPNGCCIKLLSCKLEGSP+VVAQNDKFDAS                                     
Subjt:  IERVDDCTFRCYVYRFKFFAFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAY

Query:  MVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQVKSE
        MVN++S D  +  S  Q++TSD VIEVNIEIPFAFR  P+ AIE+ GTQVL+QILKLMLPRF +Q+  +
Subjt:  MVNQISYDVNRGKSPLQKLTSDTVIEVNIEIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQVKSE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGCGTTGAGTTTTCGCTCTCCGTCTTCCATTTCCCTTCACTGCAAAAACCCTAGAACTTCTTTTTCTCTCACTCACAGACCATTCCTTATACTTGCTTCCTCTGCAGA
CGATTCTCCCAGGCCTTCGCTTCGAATCTCCACGAATTCCAATCCAAAAGCGCGCTTCATCGCCCGGAGAAGCGAGTCCGTCACGGTTCGGCAGCTGGCGCGGCCTCTAA
ATGAGTATATGAGTTTGCCGGCTAGTCAATACTCGGTGTTGGATGCGGAGAGGATTGAGCGAGTTGATGATTGCACTTTTAGGTGCTATGTTTATAGATTTAAATTCTTT
GCTTTTGAGGTTTGCCCTGTTTTGATTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTGTCGTGTAAGCTTGAAGGCTCCCCAATTGTGGTTGCACA
GAATGATAAGTTTGACGCCAGCTTACGCGCACCTCGATTAATCTCACAGAACAACCTGCCAGACTCTACAACATTTGAGTTTCAAATAAACCTGACTGCTTTGACATTGA
TTTGGTGTCGGAATGCAGCTTATATGGTGAACCAGATATCTTATGATGTGAATCGAGGCAAATCGCCCTTGCAGAAGCTCACATCGGATACCGTCATTGAGGTTAACATT
GAGATTCCTTTCGCCTTCCGTGCAATTCCTATACAAGCAATTGAATCAGCTGGGACCCAAGTTCTTGAACAAATATTGAAGCTTATGCTTCCCCGCTTCACAGCCCAGGT
GAAATCTGAGATTCGTATCCAAAATCTATGCCCTGATTTTCGACTCTCAAAGTCGTCTGTTTCCTTTGACATTTTAATAGGAATCTAG
mRNA sequenceShow/hide mRNA sequence
TTGAAAAATAGGTTGTTTAATTTACCATTGTCTTATCCGTCTCTCACAGCTCATCTTTGCTGATTACTTCCTTCACTGAAAGCCTCAAACATCAATATCCATACCAATTC
CTCTCTGCAAAATTCTCAAACGCGTTAATGGCGTTGAGTTTTCGCTCTCCGTCTTCCATTTCCCTTCACTGCAAAAACCCTAGAACTTCTTTTTCTCTCACTCACAGACC
ATTCCTTATACTTGCTTCCTCTGCAGACGATTCTCCCAGGCCTTCGCTTCGAATCTCCACGAATTCCAATCCAAAAGCGCGCTTCATCGCCCGGAGAAGCGAGTCCGTCA
CGGTTCGGCAGCTGGCGCGGCCTCTAAATGAGTATATGAGTTTGCCGGCTAGTCAATACTCGGTGTTGGATGCGGAGAGGATTGAGCGAGTTGATGATTGCACTTTTAGG
TGCTATGTTTATAGATTTAAATTCTTTGCTTTTGAGGTTTGCCCTGTTTTGATTGTTAGAGTTGAAGTGCAGCCTAATGGGTGTTGTATCAAGCTGCTGTCGTGTAAGCT
TGAAGGCTCCCCAATTGTGGTTGCACAGAATGATAAGTTTGACGCCAGCTTACGCGCACCTCGATTAATCTCACAGAACAACCTGCCAGACTCTACAACATTTGAGTTTC
AAATAAACCTGACTGCTTTGACATTGATTTGGTGTCGGAATGCAGCTTATATGGTGAACCAGATATCTTATGATGTGAATCGAGGCAAATCGCCCTTGCAGAAGCTCACA
TCGGATACCGTCATTGAGGTTAACATTGAGATTCCTTTCGCCTTCCGTGCAATTCCTATACAAGCAATTGAATCAGCTGGGACCCAAGTTCTTGAACAAATATTGAAGCT
TATGCTTCCCCGCTTCACAGCCCAGGTGAAATCTGAGATTCGTATCCAAAATCTATGCCCTGATTTTCGACTCTCAAAGTCGTCTGTTTCCTTTGACATTTTAATAGGAA
TCTAG
Protein sequenceShow/hide protein sequence
MALSFRSPSSISLHCKNPRTSFSLTHRPFLILASSADDSPRPSLRISTNSNPKARFIARRSESVTVRQLARPLNEYMSLPASQYSVLDAERIERVDDCTFRCYVYRFKFF
AFEVCPVLIVRVEVQPNGCCIKLLSCKLEGSPIVVAQNDKFDASLRAPRLISQNNLPDSTTFEFQINLTALTLIWCRNAAYMVNQISYDVNRGKSPLQKLTSDTVIEVNI
EIPFAFRAIPIQAIESAGTQVLEQILKLMLPRFTAQVKSEIRIQNLCPDFRLSKSSVSFDILIGI