; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS005731 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS005731
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
DescriptionProtein of unknown function (DUF1442)
Genome locationscaffold254:1159890..1160646
RNA-Seq ExpressionMS005731
SyntenyMS005731
Gene Ontology termsGO:0032259 - methylation (biological process)
GO:0008168 - methyltransferase activity (molecular function)
InterPro domainsIPR009902 - Protein of unknown function DUF1442


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7018940.1 hypothetical protein SDJN02_20817, partial [Cucurbita argyrosperma subsp. argyrosperma]3.3e-9481Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  EFGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREAG+ +  E+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_022924658.1 uncharacterized protein LOC111432091 [Cucurbita moschata]3.3e-9481Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  EFGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREAG+ + PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ E VDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_022980406.1 uncharacterized protein LOC111479781 [Cucurbita maxima]1.9e-9481.45Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  EFGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREA + + PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_023528700.1 uncharacterized protein LOC111791547 [Cucurbita pepo subsp. pepo]5.5e-9480.54Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  EFGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMRE G+ + PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNS A
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_038903650.1 uncharacterized protein LOC120090187 [Benincasa hispida]4.2e-9481Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSPDRASKAYIDTVKSCEI GEFGVAELL+AMAAGWNAK IVETWSDGGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMR+AG+++ PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+AEG+DF+V D R KDF RVLRVA+ SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKS+FLPVGRGLEIAHIGS     GGSSNS A
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIKR+D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

TrEMBL top hitse value%identityAlignment
A0A0A0L7M4 Uncharacterized protein4.7e-9178.28Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSPDRASKAYIDT+KSCEI GEFGVAELL+AMAAGWNAK I ETWSDGGP+ATSVGL+IAAGH+GGRHLC+VADERSRSKYVE +R+AG+ + PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ EGVDF+V D R KDFARVLRV R SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKSVFLPVGRGLEIAHIGS     GGSSNS  
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIK  D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A1S3AWD4 uncharacterized protein LOC1034833551.1e-9279.64Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSPDRASKAYIDT+KSCEI GEFGVAELL+AMAAGWNAK IVETWSDGGP+ATSVGL+IAAGH+GGRHLC+VADERSRS+YVE MR+AG+ + PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ EGVDF+V D R KDFARVLRVAR SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKSVFLPVGRGLEIAHIGS     GGSSNS  
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A5A7TZS3 Uncharacterized protein1.1e-9279.64Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSPDRASKAYIDT+KSCEI GEFGVAELL+AMAAGWNAK IVETWSDGGP+ATSVGL+IAAGH+GGRHLC+VADERSRS+YVE MR+AG+ + PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ EGVDF+V D R KDFARVLRVAR SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKSVFLPVGRGLEIAHIGS     GGSSNS  
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A6J1ED45 uncharacterized protein LOC1114320911.6e-9481Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  EFGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREAG+ + PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ E VDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A6J1ITI4 uncharacterized protein LOC1114797819.2e-9581.45Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  EFGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREA + + PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A+ EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G12320.1 Protein of unknown function (DUF1442)1.7e-4849.55Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGI-VAAPE
        MKLVWSP+ ASKAYIDTVKSCE       AEL+AAMAAGWN K IVETWS+G  IA+S+GL +A+ H   +H+C+V + RS S Y++A++E+   +  PE
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGI-VAAPE

Query:  VEVG-EAAEAVAKAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSN
          V  E  +A+ K +GVDF+VVD R K+F A  L+ A    RGAV+VC+N       G+   R + R  +VV++V LPV  G+EIAH+ + + G  G+  
Subjt:  VEVG-EAAEAVAKAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSN

Query:  STANGGRWIKRLDKRSGEEHVF
           N  RWI  +D+RSGEEHVF
Subjt:  STANGGRWIKRLDKRSGEEHVF

AT1G62840.1 Protein of unknown function (DUF1442)6.0e-5452.42Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKL+WSP+ ASKAYIDTVKSCE  G  G AEL+AAMAAGWNA  IVETWS+G  IA SVGL IA+ HT GRH+C+V + RS++ Y++AM E      PE 
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  ----EVGEAAE-AVAKAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGG
            E GE  E  +   +G+DF+VVD  +KDF A VLR A    RGAV+VC++ + RS   F W +       VV++V LPV  GLEIAH+ +    G  
Subjt:  ----EVGEAAE-AVAKAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGG

Query:  SSNSTANGGRWIKRLDKRSGEEHVFRQ
         +NS  N  +WIK  D+RSGEEHV R+
Subjt:  SSNSTANGGRWIKRLDKRSGEEHVFRQ

AT2G45360.1 Protein of unknown function (DUF1442)4.7e-6759.91Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        MKLVWSP+ AS AYIDTVKSC+   E GVAE L+A AAGWNA+ IVETWS G PI TSVGLA+AA HTGGRH+C+V DE+S+ +YV AMR  G V    V
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAE-AVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST
         VGE+ E  + +  GVDF+VVD +R++F R LR A+ S +GAVLVCKNA  R++ GF+W  VL+RGTRVV+SVFLPVG GL+I H+G  + G G S N  
Subjt:  EVGEAAE-AVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST

Query:  ANGGRWIKRLDKRSGEEHVFRQ
        +   RWI+ +D  SGEEH+FR+
Subjt:  ANGGRWIKRLDKRSGEEHVFRQ

AT3G60780.1 Protein of unknown function (DUF1442)1.1e-6357.21Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV
        M+LVWSP+ AS AYI TV+SC+   +  VAE L+A AAGWN + IVETWS G PIATSVGLA+AA HT GRH+C+V DE SRS+Y   MR A    + EV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEV

Query:  EVGEAAE-AVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST
         V ++AE  V +  GVDF+VVD +R +F   L +A+TS+ GAVLVCKNA  +S+ GF+WQ +L+RGTRVV+SVFLPVGRGLEI H+G+     GG +   
Subjt:  EVGEAAE-AVAKAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST

Query:  ANGGRWIKRLDKRSGEEHVFRQ
            RWIK +D RSGEEH+F++
Subjt:  ANGGRWIKRLDKRSGEEHVFRQ

AT5G62280.1 Protein of unknown function (DUF1442)2.2e-1128.76Show/hide
Query:  WSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYV--EAMREAGIVAAPEVEV
        WS + A+KAY+ T+K+ + + E  VAE ++A+AAG +A+ I    +        V L  AA  T G+ +CV+   R   + +  + M E   +   +  V
Subjt:  WSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYV--EAMREAGIVAAPEVEV

Query:  GEAAEAVA---KAEGVDFVVVDCRRKDFARVL--------RVARTSERG--AVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPS
        GE+ +           DFV+VDC  ++   ++          ART      AV+V  NA+ R    F   R         K+ FLP+G GL +  +    
Subjt:  GEAAEAVA---KAEGVDFVVVDCRRKDFARVL--------RVARTSERG--AVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPS

Query:  P--GGGGSSNSTANGGRWIKRLDKRSGEEHVFR
                 +      RW+ ++DK +GEEHVFR
Subjt:  P--GGGGSSNSTANGGRWIKRLDKRSGEEHVFR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAAGCTCGTTTGGTCACCAGATAGAGCTTCCAAGGCTTATATCGACACCGTTAAATCATGTGAGATTTCCGGCGAATTCGGCGTCGCGGAGCTTCTCGCCGCCATGGC
CGCCGGCTGGAACGCGAAATTCATCGTCGAGACATGGTCGGACGGCGGGCCGATAGCCACAAGCGTCGGCCTGGCGATCGCGGCTGGCCACACCGGCGGGCGGCATCTGT
GCGTGGTGGCGGACGAACGATCGAGATCGAAGTACGTGGAGGCGATGCGGGAGGCCGGAATCGTGGCGGCGCCGGAGGTGGAGGTCGGCGAGGCGGCGGAGGCGGTGGCG
AAGGCGGAGGGCGTGGATTTTGTGGTGGTGGATTGCCGGCGGAAGGATTTCGCTAGGGTTTTGAGGGTGGCGAGGACGAGCGAGAGAGGGGCAGTTTTGGTATGCAAAAA
TGCATGGGAACGAAGTGTCGAGGGGTTCAGATGGCAGAGGGTGCTTCAGAGAGGGACACGTGTCGTTAAGTCGGTTTTTTTACCGGTCGGGCGGGGACTGGAAATTGCCC
ATATTGGAAGCCCAAGCCCCGGTGGCGGTGGAAGTTCCAACTCGACGGCAAACGGTGGCCGTTGGATCAAAAGGCTTGATAAACGGTCCGGAGAGGAACACGTGTTTCGC
CAG
mRNA sequenceShow/hide mRNA sequence
ATGAAGCTCGTTTGGTCACCAGATAGAGCTTCCAAGGCTTATATCGACACCGTTAAATCATGTGAGATTTCCGGCGAATTCGGCGTCGCGGAGCTTCTCGCCGCCATGGC
CGCCGGCTGGAACGCGAAATTCATCGTCGAGACATGGTCGGACGGCGGGCCGATAGCCACAAGCGTCGGCCTGGCGATCGCGGCTGGCCACACCGGCGGGCGGCATCTGT
GCGTGGTGGCGGACGAACGATCGAGATCGAAGTACGTGGAGGCGATGCGGGAGGCCGGAATCGTGGCGGCGCCGGAGGTGGAGGTCGGCGAGGCGGCGGAGGCGGTGGCG
AAGGCGGAGGGCGTGGATTTTGTGGTGGTGGATTGCCGGCGGAAGGATTTCGCTAGGGTTTTGAGGGTGGCGAGGACGAGCGAGAGAGGGGCAGTTTTGGTATGCAAAAA
TGCATGGGAACGAAGTGTCGAGGGGTTCAGATGGCAGAGGGTGCTTCAGAGAGGGACACGTGTCGTTAAGTCGGTTTTTTTACCGGTCGGGCGGGGACTGGAAATTGCCC
ATATTGGAAGCCCAAGCCCCGGTGGCGGTGGAAGTTCCAACTCGACGGCAAACGGTGGCCGTTGGATCAAAAGGCTTGATAAACGGTCCGGAGAGGAACACGTGTTTCGC
CAG
Protein sequenceShow/hide protein sequence
MKLVWSPDRASKAYIDTVKSCEISGEFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIVAAPEVEVGEAAEAVA
KAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTANGGRWIKRLDKRSGEEHVFR
Q