; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

CmoCh02G011460 (gene) of Cucurbita moschata (Rifu) v1 genome

Gene IDCmoCh02G011460
OrganismCucurbita moschata Rifu (Cucurbita moschata (Rifu) v1)
Descriptiondipeptidyl aminopeptidase 4 isoform X1
Genome locationCmo_Chr02:6938209..6943527
RNA-Seq ExpressionCmoCh02G011460
SyntenyCmoCh02G011460
Gene Ontology termsGO:0006508 - proteolysis (biological process)
GO:0004177 - aminopeptidase activity (molecular function)
GO:0008236 - serine-type peptidase activity (molecular function)
InterPro domainsIPR002469 - Dipeptidylpeptidase IV, N-terminal domain
IPR011044 - Quinoprotein amine dehydrogenase, beta chain-like


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7035751.1 Dipeptidyl aminopeptidase 4 [Cucurbita argyrosperma subsp. argyrosperma]8.2e-12099.54Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK SPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNIS
        TCFEVRQLTVGASRNIS
Subjt:  TCFEVRQLTVGASRNIS

XP_022957768.1 uncharacterized protein LOC111459217 [Cucurbita moschata]1.6e-120100Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNIS
        TCFEVRQLTVGASRNIS
Subjt:  TCFEVRQLTVGASRNIS

XP_022995443.1 uncharacterized protein LOC111490979 [Cucurbita maxima]2.4e-11999.08Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDEDT+PKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK SPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNIS
        TCFEVRQLTVGASRNIS
Subjt:  TCFEVRQLTVGASRNIS

XP_023532953.1 uncharacterized protein LOC111794965 [Cucurbita pepo subsp. pepo]8.2e-12099.54Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK SPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNIS
        TCFEVRQLTVGASRNIS
Subjt:  TCFEVRQLTVGASRNIS

XP_038906550.1 dipeptidyl aminopeptidase 4 isoform X1 [Benincasa hispida]9.7e-10589.09Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDED + KNLKRSRP   NMTVT+SSVAQSLDDSFLFPVEEIVQYPLPGYVAPT ITFSPDDS +TYLFSPDSTLNKKVFAFDIKT KQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK S K+KAIMVPLPAGIYIQDF GSTPELKLSSKPSSPIMDPHLSPDGSM+AF+KDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNISVNL
        +  EVRQLTVGA+RNI+  L
Subjt:  TCFEVRQLTVGASRNISVNL

TrEMBL top hitse value%identityAlignment
A0A1S3AUE8 dipeptidyl aminopeptidase 4 isoform X13.7e-10287.27Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDED+  KNLKRSRP   NMTVT+SSVAQSLDDSFLFPVEEIVQYPLPGYVAPT ITFSPDDSF+TYLFSPD +LNKKVFAFDIKT KQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK S K+KAIMVPLPAGIYIQDF GST ELKLSSKP+SPIMD HLSPDGSM+AFVKDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNISVNL
        +  EVRQLTVGA+  IS  L
Subjt:  TCFEVRQLTVGASRNISVNL

A0A6J1DUX6 uncharacterized protein LOC111024609 isoform X13.0e-10489.35Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGV QSVDED + KNLKRSRP PYNMTVT SSVAQSLDDSFLFPVEEIVQYPLPGYVAPT ITFSPDDS +TYLFSPD +LNKKVFAFDIKT  QELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK S K+KAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSM+AFV+DGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNI
        +  EVRQLTVGA++NI
Subjt:  TCFEVRQLTVGASRNI

A0A6J1E2X7 uncharacterized protein LOC111430339 isoform X22.0e-10387.96Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDED++ ++LKRSRP  YNMTVT+SSVAQSLDDSFLFPVEEIVQYPLPGYVAPT ITFSPDDSF+TYLFSPD TLNKKVFAFDI T KQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
         PPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK S K+KAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDG+M+AFV DG+LHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNI
        +  E+RQLTVGA+RNI
Subjt:  TCFEVRQLTVGASRNI

A0A6J1H174 uncharacterized protein LOC1114592178.0e-121100Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNIS
        TCFEVRQLTVGASRNIS
Subjt:  TCFEVRQLTVGASRNIS

A0A6J1K5R9 uncharacterized protein LOC1114909791.1e-11999.08Show/hide
Query:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
        MFGVMQSVDEDT+PKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF
Subjt:  MFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIF

Query:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
        SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVK SPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL
Subjt:  SPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNL

Query:  TCFEVRQLTVGASRNIS
        TCFEVRQLTVGASRNIS
Subjt:  TCFEVRQLTVGASRNIS

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT5G24260.1 prolyl oligopeptidase family protein7.7e-6061.93Show/hide
Query:  DDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIFSPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKM
        D    F VE+IVQ PLPGYVAPT ++FSPDDS ITYLFSP+  L ++V+AFD+   +  L+FSPPDGG+DE NISPEEKLRRERLRERGLGVTRYEWVK 
Subjt:  DDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKKVFAFDIKTCKQELIFSPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKM

Query:  SPKKKAIMVPLPAGIYIQDFLGS-TPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNLTCFEVRQLTVGAS
        + K + I+VPLPAG+Y++D   S  PEL + S P+SPI+DP LSP+G  +A+V++ ELHV+NL   + +QLT GA+
Subjt:  SPKKKAIMVPLPAGIYIQDFLGS-TPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGELHVMNLTCFEVRQLTVGAS


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGATGGGCACAGAGAACGAGACAGAAGCACAGAGGTCTGCTCGATTTGTTCGAATCGAGGCGTTGACGAAAAATATGTTCGGTGTAATGCAATCGGTTGATGAGGACAC
TGAGCCAAAGAATTTGAAGCGTTCAAGGCCACCTCCATACAACATGACTGTCACTCACTCGAGTGTTGCTCAGAGTTTAGATGACTCCTTTCTTTTCCCAGTTGAAGAGA
TTGTACAATATCCATTGCCTGGATATGTTGCCCCCACTTTGATTACTTTCAGTCCAGATGACAGTTTTATCACTTACTTGTTTAGTCCTGATTCTACCTTAAATAAGAAG
GTTTTTGCTTTTGATATCAAAACTTGCAAACAGGAGTTGATTTTCAGTCCTCCTGATGGTGGGCTGGATGAGTGTAACATTTCACCTGAAGAGAAATTGAGGAGAGAAAG
ATTGAGGGAACGTGGTTTGGGAGTAACCCGGTATGAATGGGTGAAAATGAGCCCCAAAAAGAAAGCAATTATGGTGCCTCTGCCTGCTGGGATTTATATTCAGGATTTTC
TTGGCTCGACGCCAGAGCTTAAGCTTTCCAGTAAACCCTCTTCACCAATCATGGATCCACATCTCTCACCAGATGGGTCCATGGTTGCATTCGTTAAAGATGGGGAGCTT
CATGTCATGAATCTAACATGCTTTGAAGTGAGACAGTTGACTGTTGGTGCTAGCAGAAACATTTCGGTAAATCTACAGCCATTGTTTGTAAACTCTAGTTTTCTGTTGAA
GCTAATTTTTTCATCGTTCTACTTTCGGCTCAGCAATTTGGTTAGGTTTTCGGTTGGCGTCTTGGTTGAAGAAGTTCATGACAGTCATGGAATTGCAGAATATATAGCTG
AGGTGAGGATACCACCATCTGCTTTTCACACTGAATCTTGA
mRNA sequenceShow/hide mRNA sequence
TCTCCCTTTTCGTTGTGCTGTTTACTCAATGAAGCAAAAACTTGTGGGGGAAGTTCTCTTTTGTATTATGTTTTTGTTTACATTAGAGATTAAGGAAAGAGACAAACAGA
GAAAGGGGAATTTTTCCTTTCTTTATATCTCGAGATTATGATGGATTAAGAGATGATGGGCACAGAGAACGAGACAGAAGCACAGAGGTCTGCTCGATTTGTTCGAATCG
AGGCGTTGACGAAAAATATGTTCGGTGTAATGCAATCGGTTGATGAGGACACTGAGCCAAAGAATTTGAAGCGTTCAAGGCCACCTCCATACAACATGACTGTCACTCAC
TCGAGTGTTGCTCAGAGTTTAGATGACTCCTTTCTTTTCCCAGTTGAAGAGATTGTACAATATCCATTGCCTGGATATGTTGCCCCCACTTTGATTACTTTCAGTCCAGA
TGACAGTTTTATCACTTACTTGTTTAGTCCTGATTCTACCTTAAATAAGAAGGTTTTTGCTTTTGATATCAAAACTTGCAAACAGGAGTTGATTTTCAGTCCTCCTGATG
GTGGGCTGGATGAGTGTAACATTTCACCTGAAGAGAAATTGAGGAGAGAAAGATTGAGGGAACGTGGTTTGGGAGTAACCCGGTATGAATGGGTGAAAATGAGCCCCAAA
AAGAAAGCAATTATGGTGCCTCTGCCTGCTGGGATTTATATTCAGGATTTTCTTGGCTCGACGCCAGAGCTTAAGCTTTCCAGTAAACCCTCTTCACCAATCATGGATCC
ACATCTCTCACCAGATGGGTCCATGGTTGCATTCGTTAAAGATGGGGAGCTTCATGTCATGAATCTAACATGCTTTGAAGTGAGACAGTTGACTGTTGGTGCTAGCAGAA
ACATTTCGGTAAATCTACAGCCATTGTTTGTAAACTCTAGTTTTCTGTTGAAGCTAATTTTTTCATCGTTCTACTTTCGGCTCAGCAATTTGGTTAGGTTTTCGGTTGGC
GTCTTGGTTGAAGAAGTTCATGACAGTCATGGAATTGCAGAATATATAGCTGAGGTGAGGATACCACCATCTGCTTTTCACACTGAATCTTGAAAAGAATTATTCTTGCT
TGGTTGGCAGCCGGGGGAAATGAAATTTTTTCTAATGGAAGAGAGTAGAAATAATTAGTGATCTTCAACGACGTGTGGCTTCGTTTTTTTTGGATTATAGCTGGAAAATT
TTGTTTTTTCAGGAGGAAATGGATCGGAAAAATGGGTACTGGTGGTCGCTCGATAGCAAATATATTGCATTTACACAAGTTGATACCTCAAAGATTCCTCCCTTTAGAAT
CATGCATCAAGGTAAAAGTTCGATTGGTTCGGATGCACAAGAAGATCATGCTTATTCATTTGCAGGAACTTCCAATGCCATTGTTCGTCTCGGCGTTGTCTCTGTTTTTG
GAGGTCCGATTACTTGGATGGATCTTCTTTGTGGAGAAACCGAGGAAGAGGAATATCTGGCCCGAGTCTGTTGGATGCACGAAAATATTCTTATCGCTCAGATTCTAAAT
AGGTTACATACCAAGCTGAAAATTCTCAGGTTTGATATCAAGACAGGCCAGAGAAAGGTTTTGCTGGTAGAAGAACAAGATTCATGGGTTAACTTACATGATTGTTTCAC
ACCACTAGACAAAAGTATGAGCAAATATTCTGGAGGATTTATATGGGCCAGTGAAAAAACGGGATTTAGACATCTTTATTTGCACGATGGCCATGGTACGTGCTTGGGGC
CGATTACCGAAGGCAACTGGATGGTTGAACAAATTGCCGGTGTCAACGAGGCGACCGGGCTAGTTTATTTTACTGGAACTCTTGACGGGCCTCTTGAATCTCATCTTTAC
TGTACTAAACTAACCACTACCGGGAATACACCATTGGAGCCACCAACAAGATTGACTCAGGGCAAGGGGAAACATGTCGTTGTACTCGATCATCGCATGACGAGGTTTAT
AGACACTCACGATTCTCTCAATTCTCCCCCAAGGGTGTTGCTCTGCTCCTTGAATGATGGAAGTGTCATTTTGCCAATTTTTGAGCAAACACTTGCAATTCCAAGGATTC
AAAGGCTTCATCTTGAGGCTCCAGAAATCGTTGAGTTACAGACTGGTGATGGGGCATTGCTCTATGGAGCTTTATATAAGCCGAACGAGGCAATATTCGGGCCACCGCCA
TACAAAACTATGATCATTGTGTACGGTGGTCCGAGCGTACAGCTAGTTTGTGATTCATGGGTAAATACGGTCGACATGAGAGCTCAGTATCTGCGTAGCCGGGGGATCTT
AGTGTGGAAGTTAGACAACAGAGGAACCGCTCGACGTGGACTAAAGTTCGAAGCGTCTCTAAAATACAATATCGGCCATGTTGATGCAGATGATCAATTGGTTGGAGCAA
AATGGCTGATCAGGCAGGGTTTAGCAAGAGCTGGAGAGATTGGTTTATATGGATGGAGCTATGGTGGCTTTCTCTCTGCAATGAGCTTGGCCCGGTTTCCAGATATATAC
GGATGTGCTATATCTGGTGCCCCCGTTACAGCTTGGGATGGGTACGACACGTTTTACACAGAAAAGTACATGGGATTACCATCTCGAGATCCCGAAGTTTACGAGAAAAG
CTCGGTGATACATCATGTAAATAAGATGACTGGGAGGCTGTTAATCGTGCATGGGATGATCGATGAGAACGTACACTTCAGGCATACTGCAAGGCTTGTGAATGCACTGA
TATCGGCTGGAAAGACGTATGAACTACTGATATTCCCCAACGAACGACACATGCCTCGACAGCACCGTGATCGGATCTACATGGAAGAAAGAATCTGGGAATTCATTCAG
AGGAACTTGTGTAAGGTAATCTAGTCTTTGTTGTTATTTAGTAGTGGCTCTGAAATGAATGGTGTGTTTAATCCCATGTGAAATATTCTATGATTTTAAACCCTTTAGAA
ATAAAAGGCTCCACTTACTGAGTTCATGTGACTTGCTTGTTATGAATGATTGGTAAATTGTATTTTAG
Protein sequenceShow/hide protein sequence
MMGTENETEAQRSARFVRIEALTKNMFGVMQSVDEDTEPKNLKRSRPPPYNMTVTHSSVAQSLDDSFLFPVEEIVQYPLPGYVAPTLITFSPDDSFITYLFSPDSTLNKK
VFAFDIKTCKQELIFSPPDGGLDECNISPEEKLRRERLRERGLGVTRYEWVKMSPKKKAIMVPLPAGIYIQDFLGSTPELKLSSKPSSPIMDPHLSPDGSMVAFVKDGEL
HVMNLTCFEVRQLTVGASRNISVNLQPLFVNSSFLLKLIFSSFYFRLSNLVRFSVGVLVEEVHDSHGIAEYIAEVRIPPSAFHTES