; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Sgr001663 (gene) of Monk fruit (Qingpiguo) v1 genome

Gene IDSgr001663
OrganismSiraitia grosvenorii cv. Qingpiguo (Monk fruit (Qingpiguo) v1)
Descriptioncell wall protein RBR3-like isoform X2
Genome locationtig00001055:55381..62910
RNA-Seq ExpressionSgr001663
SyntenySgr001663
Gene Ontology termsNA
InterPro domainsNA


Homology Show/hide homology
GenBank top hitse value%identityAlignment
XP_022134148.1 uncharacterized protein LOC111006488 isoform X1 [Momordica charantia]8.0e-8670.48Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC
        MEA KRNLR R PLSDCTNT++SSQ      S+VIKPR+RVIKSA+KD VNN+KKGES F SAS S +L+ASNPSSD LPTEP             SSDC
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC

Query:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS
        LP EPN         P++SSDCLPTEPSS SLP E STP+RRADLPSSSG+DRVSEPQSFYSRRHP NKRKS EIA TPFIF+TASKI T+GEKRDGYSS
Subjt:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS

Query:  PSKARTVPCKK-------------RQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        PSKARTVPCKK             RQR TI+G+ ESKIELPREFVE+QKAYFSEVDAF+L VE AKSSDSE
Subjt:  PSKARTVPCKK-------------RQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

XP_022134150.1 uncharacterized protein LOC111006488 isoform X3 [Momordica charantia]1.3e-8874.03Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC
        MEA KRNLR R PLSDCTNT++SSQ      S+VIKPR+RVIKSA+KD VNN+KKGES F SAS S +L+ASNPSSD LPTEP             SSDC
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC

Query:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS
        LP EPN         P++SSDCLPTEPSS SLP E STP+RRADLPSSSG+DRVSEPQSFYSRRHP NKRKS EIA TPFIF+TASKI T+GEKRDGYSS
Subjt:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS

Query:  PSKARTVPCKKRQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        PSKARTVPCKKRQR TI+G+ ESKIELPREFVE+QKAYFSEVDAF+L VE AKSSDSE
Subjt:  PSKARTVPCKKRQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

XP_022991070.1 uncharacterized protein LOC111487776 isoform X1 [Cucurbita maxima]3.6e-7873.31Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC
        ME++KRNLRVR PL+DCTNT++SSQ      SA IKPRKRV+K A+KDVVNN+K+G S F SASTS +L+ASNPSSD LPT+PSS+  P E  P  +SD 
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC

Query:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE
        LPTEPSS SLP E STPSR  DLPSSSG+DRV EPQSFYSRRHPAN+RKS E A  PF+FSTASKI T GEKR   SSPS+ARTVP +KRQR TI+GE E
Subjt:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE

Query:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        SKIELPREFVE+QKAYFSEVDAFEL VE AKSSDSE
Subjt:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

XP_038884347.1 uncharacterized protein LOC120075210 isoform X1 [Benincasa hispida]1.1e-7973.03Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC
        ME++KR LR R PL+DCTNTI+SSQ      SA IKPRKRVIKSA+KDVVNN+KK + +  S STS +LRASNPSSD LPTEP+SD  P EPNP  S+D 
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC

Query:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKK-----RQRATI
        LP+EPSS  LPTE STP RRADLPSSSG+DRVSEPQSFYSRR P NKRKS+EIA+ PFIFST+SKI T G KR+GY SPSKA+TVPCKK     RQRAT+
Subjt:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKK-----RQRATI

Query:  HGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        + + ES IELPREFVEQQKAYFSEVDAFEL VE AKSSDSE
Subjt:  HGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

XP_038884349.1 uncharacterized protein LOC120075210 isoform X3 [Benincasa hispida]1.6e-8174.58Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC
        ME++KR LR R PL+DCTNTI+SSQ      SA IKPRKRVIKSA+KDVVNN+KK + +  S STS +LRASNPSSD LPTEP+SD  P EPNP  S+D 
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC

Query:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE
        LP+EPSS  LPTE STP RRADLPSSSG+DRVSEPQSFYSRR P NKRKS+EIA+ PFIFST+SKI T G KR+GY SPSKA+TVPCKKRQRAT++ + E
Subjt:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE

Query:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        S IELPREFVEQQKAYFSEVDAFEL VE AKSSDSE
Subjt:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

TrEMBL top hitse value%identityAlignment
A0A6J1BXA7 uncharacterized protein LOC111006488 isoform X36.4e-8974.03Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC
        MEA KRNLR R PLSDCTNT++SSQ      S+VIKPR+RVIKSA+KD VNN+KKGES F SAS S +L+ASNPSSD LPTEP             SSDC
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC

Query:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS
        LP EPN         P++SSDCLPTEPSS SLP E STP+RRADLPSSSG+DRVSEPQSFYSRRHP NKRKS EIA TPFIF+TASKI T+GEKRDGYSS
Subjt:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS

Query:  PSKARTVPCKKRQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        PSKARTVPCKKRQR TI+G+ ESKIELPREFVE+QKAYFSEVDAF+L VE AKSSDSE
Subjt:  PSKARTVPCKKRQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

A0A6J1C164 uncharacterized protein LOC111006488 isoform X13.9e-8670.48Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC
        MEA KRNLR R PLSDCTNT++SSQ      S+VIKPR+RVIKSA+KD VNN+KKGES F SAS S +L+ASNPSSD LPTEP             SSDC
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEP-------------SSDC

Query:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS
        LP EPN         P++SSDCLPTEPSS SLP E STP+RRADLPSSSG+DRVSEPQSFYSRRHP NKRKS EIA TPFIF+TASKI T+GEKRDGYSS
Subjt:  LPKEPN---------PSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSS

Query:  PSKARTVPCKK-------------RQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        PSKARTVPCKK             RQR TI+G+ ESKIELPREFVE+QKAYFSEVDAF+L VE AKSSDSE
Subjt:  PSKARTVPCKK-------------RQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

A0A6J1GKJ2 uncharacterized protein LOC111455207 isoform X13.9e-7873.31Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC
        ME++KRNLRVR PL+DCTNT++SSQ      SA IKPRKRV+KSA+KDVVNN+K+G S   SASTS +L+ASNPSS+ LPT+PSS+  P E NP  SSD 
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC

Query:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE
        LPTEPSS S+P E STPSR  DLPSSSG+DRV EPQSFYSRRHPAN+RKS E A  PFIFSTASKI + GEKR   SSPS+ARTVP +KRQR TI+GE E
Subjt:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE

Query:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        SKIELPREFVE+QKAYFSEVDAFEL VE AKSSDSE
Subjt:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

A0A6J1JPQ1 cell wall protein RBR3-like isoform X22.8e-7672.88Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC
        ME++KRNLRVR PL+DCTNT++SSQ      SA IKPRKRV+K A+KDVVNN+K+G S F SASTS +L+ASNPSSD LPT+PSS+  P E  P  +SD 
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC

Query:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE
        LPTEPSS SLP E STPSR  DLPSS  SDRV EPQSFYSRRHPAN+RKS E A  PF+FSTASKI T GEKR   SSPS+ARTVP +KRQR TI+GE E
Subjt:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE

Query:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        SKIELPREFVE+QKAYFSEVDAFEL VE AKSSDSE
Subjt:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

A0A6J1JRU8 uncharacterized protein LOC111487776 isoform X11.7e-7873.31Show/hide
Query:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC
        ME++KRNLRVR PL+DCTNT++SSQ      SA IKPRKRV+K A+KDVVNN+K+G S F SASTS +L+ASNPSSD LPT+PSS+  P E  P  +SD 
Subjt:  MEARKRNLRVRNPLSDCTNTIVSSQ------SAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDC

Query:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE
        LPTEPSS SLP E STPSR  DLPSSSG+DRV EPQSFYSRRHPAN+RKS E A  PF+FSTASKI T GEKR   SSPS+ARTVP +KRQR TI+GE E
Subjt:  LPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGE

Query:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE
        SKIELPREFVE+QKAYFSEVDAFEL VE AKSSDSE
Subjt:  SKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT3G56250.1 unknown protein2.3e-0630.6Show/hide
Query:  RNPLSDCTNTIVSS---QSAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDCLPTEPSSGSLPTE
        R PL+DCTNT+  S    S+ +K     + S+LK +V              T+   +  + ++ +   E +S  +  +  P        T   S  L + 
Subjt:  RNPLSDCTNTIVSS---QSAVIKPRKRVIKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDCLPTEPSSGSLPTE

Query:  DSTPSRRADLPSSSG-SDR-VSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQ-----TVGEK-RDGYSSPSKARTVPCKKRQRATIHGEGESKIEL
         S PSR     S  G SD+  +EP S Y+ R  A+ +K  + A +    S A++I+     + G+K R    +  K   V  KKRQR T+  E E  +  
Subjt:  DSTPSRRADLPSSSG-SDR-VSEPQSFYSRRHPANKRKSIEIAITPFIFSTASKIQ-----TVGEK-RDGYSSPSKARTVPCKKRQRATIHGEGESKIEL

Query:  P-REFVEQQKAYFSEVDAFELQVEAAKSSDSE
          ++++E+QKAYF+E+DAFEL VE   +SDS+
Subjt:  P-REFVEQQKAYFSEVDAFELQVEAAKSSDSE


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGATCGATCCCTTAAAACATCATCTCGGCCTATCCATAGTTCTTTTCCTCGCGGTGCTGATTCTACTTCGCCCGGTCGCCGGCGGCCTTCTTCTCGTAGTAGTGGTAGA
CGGCGGCGCCGGAAAGAACCGCCAACCCGGAGACTTGGCTTCAGGGGAGTCCTTGATCGGGAATAGGCCAGTGATGCTCCGATTCCAGATGCCCACAGCGCCCCTTCCCC
TGGTTTTACACACACTCCTCTGTTTTTCTTCGAAACAAGAGGCTTTTCCGTTTCCGGTTTCTTCTGCAATTCCCATCATTCTCATATCTCACTCTCAGCCGTTGGATACG
CCTCTAAACTTTGTTCTCTCTGCCAATCCACCCCAAAACGTCTGTAAGGCCCATGTTGCTGGCCCATCGGAAGCCAACCAGAAGATTCTGCCCATATGCAAAGTTCCCGT
GCTTCAGTTCATTAACATTTCACGGCAAACAACACTCCAGACATCTCTCTCAAATCTTCTCTTCGAAGTTTCAAGAACGCTTTCTTCTCGTTCTGTGAAATGGGAAGGAC
TGGAGATGGAAGCCCGGAAAAGAAATCTCAGAGTTCGAAACCCCCTCTCAGATTGCACAAACACCATCGTCTCCTCGCAATCCGCTGTAATCAAACCCCGCAAACGTGTA
ATTAAGTCTGCGCTTAAAGATGTTGTTAACAATGATAAGAAAGGCGAATCAATTTTTCCGTCTGCGTCCACATCCTTTGATTTGCGAGCTTCAAACCCTAGTTCCGATTC
CCTTCCTACAGAACCTAGCTCTGATTGTCTTCCTAAGGAACCAAACCCTAGTTCTAGTTCTGATTGTCTTCCTACAGAACCTAGTTCTGGTTCTCTTCCTACAGAAGATT
CTACTCCTTCGCGGCGTGCAGATTTGCCGTCTAGTTCAGGATCAGATCGTGTTTCGGAGCCCCAGTCATTCTACAGTCGAAGGCACCCTGCAAATAAAAGGAAGAGCATA
GAGATAGCAATTACACCATTTATTTTCTCTACCGCATCAAAAATCCAAACTGTGGGTGAGAAAAGAGATGGATACAGCAGCCCATCCAAAGCGAGGACAGTTCCTTGTAA
AAAGAGGCAGCGTGCCACAATACATGGGGAAGGTGAGTCCAAGATTGAGCTTCCACGGGAATTTGTTGAGCAGCAGAAAGCATATTTTTCAGAAGTAGATGCATTTGAGC
TACAGGTGGAGGCGGCTAAATCATCTGACTCGGAGTAG
mRNA sequenceShow/hide mRNA sequence
ATGATCGATCCCTTAAAACATCATCTCGGCCTATCCATAGTTCTTTTCCTCGCGGTGCTGATTCTACTTCGCCCGGTCGCCGGCGGCCTTCTTCTCGTAGTAGTGGTAGA
CGGCGGCGCCGGAAAGAACCGCCAACCCGGAGACTTGGCTTCAGGGGAGTCCTTGATCGGGAATAGGCCAGTGATGCTCCGATTCCAGATGCCCACAGCGCCCCTTCCCC
TGGTTTTACACACACTCCTCTGTTTTTCTTCGAAACAAGAGGCTTTTCCGTTTCCGGTTTCTTCTGCAATTCCCATCATTCTCATATCTCACTCTCAGCCGTTGGATACG
CCTCTAAACTTTGTTCTCTCTGCCAATCCACCCCAAAACGTCTGTAAGGCCCATGTTGCTGGCCCATCGGAAGCCAACCAGAAGATTCTGCCCATATGCAAAGTTCCCGT
GCTTCAGTTCATTAACATTTCACGGCAAACAACACTCCAGACATCTCTCTCAAATCTTCTCTTCGAAGTTTCAAGAACGCTTTCTTCTCGTTCTGTGAAATGGGAAGGAC
TGGAGATGGAAGCCCGGAAAAGAAATCTCAGAGTTCGAAACCCCCTCTCAGATTGCACAAACACCATCGTCTCCTCGCAATCCGCTGTAATCAAACCCCGCAAACGTGTA
ATTAAGTCTGCGCTTAAAGATGTTGTTAACAATGATAAGAAAGGCGAATCAATTTTTCCGTCTGCGTCCACATCCTTTGATTTGCGAGCTTCAAACCCTAGTTCCGATTC
CCTTCCTACAGAACCTAGCTCTGATTGTCTTCCTAAGGAACCAAACCCTAGTTCTAGTTCTGATTGTCTTCCTACAGAACCTAGTTCTGGTTCTCTTCCTACAGAAGATT
CTACTCCTTCGCGGCGTGCAGATTTGCCGTCTAGTTCAGGATCAGATCGTGTTTCGGAGCCCCAGTCATTCTACAGTCGAAGGCACCCTGCAAATAAAAGGAAGAGCATA
GAGATAGCAATTACACCATTTATTTTCTCTACCGCATCAAAAATCCAAACTGTGGGTGAGAAAAGAGATGGATACAGCAGCCCATCCAAAGCGAGGACAGTTCCTTGTAA
AAAGAGGCAGCGTGCCACAATACATGGGGAAGGTGAGTCCAAGATTGAGCTTCCACGGGAATTTGTTGAGCAGCAGAAAGCATATTTTTCAGAAGTAGATGCATTTGAGC
TACAGGTGGAGGCGGCTAAATCATCTGACTCGGAGTAG
Protein sequenceShow/hide protein sequence
MIDPLKHHLGLSIVLFLAVLILLRPVAGGLLLVVVVDGGAGKNRQPGDLASGESLIGNRPVMLRFQMPTAPLPLVLHTLLCFSSKQEAFPFPVSSAIPIILISHSQPLDT
PLNFVLSANPPQNVCKAHVAGPSEANQKILPICKVPVLQFINISRQTTLQTSLSNLLFEVSRTLSSRSVKWEGLEMEARKRNLRVRNPLSDCTNTIVSSQSAVIKPRKRV
IKSALKDVVNNDKKGESIFPSASTSFDLRASNPSSDSLPTEPSSDCLPKEPNPSSSSDCLPTEPSSGSLPTEDSTPSRRADLPSSSGSDRVSEPQSFYSRRHPANKRKSI
EIAITPFIFSTASKIQTVGEKRDGYSSPSKARTVPCKKRQRATIHGEGESKIELPREFVEQQKAYFSEVDAFELQVEAAKSSDSE