; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Moc05g03040 (gene) of Bitter gourd (OHB3-1) v2 genome

Gene IDMoc05g03040
OrganismMomordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
DescriptionProtein of unknown function (DUF1442)
Genome locationchr5:2089914..2090673
RNA-Seq ExpressionMoc05g03040
SyntenyMoc05g03040
Gene Ontology termsGO:0016740 - transferase activity (molecular function)
InterPro domainsIPR009902 - Protein of unknown function DUF1442


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG7018940.1 hypothetical protein SDJN02_20817, partial [Cucurbita argyrosperma subsp. argyrosperma]5.5e-9480.54Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  +FGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREAG+++  E+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_022924658.1 uncharacterized protein LOC111432091 [Cucurbita moschata]5.5e-9480.54Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  +FGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREAG+++ PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  E VDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_022980406.1 uncharacterized protein LOC111479781 [Cucurbita maxima]3.3e-9481Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  +FGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREA +++ PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_023528700.1 uncharacterized protein LOC111791547 [Cucurbita pepo subsp. pepo]9.5e-9480.09Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  +FGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMRE G+++ PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNS A
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

XP_038903650.1 uncharacterized protein LOC120090187 [Benincasa hispida]2.8e-9380.54Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSPDRASKAYIDTVKSCEI G+FGVAELL+AMAAGWNAK IVETWSDGGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMR+AG+ + PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A AEG+DF+V D R KDF RVLRVA+ SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKS+FLPVGRGLEIAHIGS     GGSSNS A
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIKR+D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

TrEMBL top hitse value%identityAlignment
A0A0A0L7M4 Uncharacterized protein1.8e-9077.83Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSPDRASKAYIDT+KSCEI G+FGVAELL+AMAAGWNAK I ETWSDGGP+ATSVGL+IAAGH+GGRHLC+VADERSRSKYVE +R+AG+ + PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  EGVDF+V D R KDFARVLRV R SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKSVFLPVGRGLEIAHIGS     GGSSNS  
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIK  D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A1S3AWD4 uncharacterized protein LOC1034833551.5e-9279.64Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSPDRASKAYIDT+KSCEI G+FGVAELL+AMAAGWNAK IVETWSDGGP+ATSVGL+IAAGH+GGRHLC+VADERSRS+YVE MR+AG+A+ PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  EGVDF+V D R KDFARVLRVAR SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKSVFLPVGRGLEIAHIGS     GGSSNS  
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A5A7TZS3 Uncharacterized protein1.5e-9279.64Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSPDRASKAYIDT+KSCEI G+FGVAELL+AMAAGWNAK IVETWSDGGP+ATSVGL+IAAGH+GGRHLC+VADERSRS+YVE MR+AG+A+ PEV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  EGVDF+V D R KDFARVLRVAR SERGAVLVCKNAWER+V GFRWQ VL+RGTRVVKSVFLPVGRGLEIAHIGS     GGSSNS  
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
         G RWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A6J1ED45 uncharacterized protein LOC1114320912.7e-9480.54Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  +FGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREAG+++ PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  E VDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIK +D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

A0A6J1ITI4 uncharacterized protein LOC1114797811.6e-9481Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSP+RASKAYIDTVKSCEI  +FGVAELL+AMAAGWNAK IVETWS GGP+ATSVGLAIAAGHTGGRHLC+VADERSRSKYVEAMREA +++ PE+
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA
         +G+A    A  EGVDF+V DCR KDFARVLRV R SERGAVLVCKNAWER V GFRWQ VL++GTRVVKSVFLPVGRGLEIAHIGS     GGSSNSTA
Subjt:  EVGEAAEAVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTA

Query:  NGGRWIKRLDKRSGEEHVFRQ
        NGGRWIKR D RSGEEHVFR+
Subjt:  NGGRWIKRLDKRSGEEHVFRQ

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT1G12320.1 Protein of unknown function (DUF1442)6.4e-4849.1Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAA-APE
        MKLVWSP+ ASKAYIDTVKSCE       AEL+AAMAAGWN K IVETWS+G  IA+S+GL +A+ H   +H+C+V + RS S Y++A++E+      PE
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAA-APE

Query:  VEVG-EAAEAVARAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSN
          V  E  +A+ + +GVDF+VVD R K+F A  L+ A    RGAV+VC+N       G+   R + R  +VV++V LPV  G+EIAH+ + + G  G+  
Subjt:  VEVG-EAAEAVARAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSN

Query:  STANGGRWIKRLDKRSGEEHVF
           N  RWI  +D+RSGEEHVF
Subjt:  STANGGRWIKRLDKRSGEEHVF

AT1G62840.1 Protein of unknown function (DUF1442)3.5e-5452.42Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKL+WSP+ ASKAYIDTVKSCE  G  G AEL+AAMAAGWNA  IVETWS+G  IA SVGL IA+ HT GRH+C+V + RS++ Y++AM E   +  PE 
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  ----EVGEAAE-AVARAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGG
            E GE  E  +   +G+DF+VVD  +KDF A VLR A    RGAV+VC++ + RS   F W +       VV++V LPV  GLEIAH+ +    G  
Subjt:  ----EVGEAAE-AVARAEGVDFVVVDCRRKDF-ARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGG

Query:  SSNSTANGGRWIKRLDKRSGEEHVFRQ
         +NS  N  +WIK  D+RSGEEHV R+
Subjt:  SSNSTANGGRWIKRLDKRSGEEHVFRQ

AT2G45360.1 Protein of unknown function (DUF1442)4.0e-6659.01Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        MKLVWSP+ AS AYIDTVKSC+   + GVAE L+A AAGWNA+ IVETWS G PI TSVGLA+AA HTGGRH+C+V DE+S+ +YV AMR  G      V
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAE-AVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST
         VGE+ E  +    GVDF+VVD +R++F R LR A+ S +GAVLVCKNA  R++ GF+W  VL+RGTRVV+SVFLPVG GL+I H+G  + G G S N  
Subjt:  EVGEAAE-AVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST

Query:  ANGGRWIKRLDKRSGEEHVFRQ
        +   RWI+ +D  SGEEH+FR+
Subjt:  ANGGRWIKRLDKRSGEEHVFRQ

AT3G60780.1 Protein of unknown function (DUF1442)9.8e-6558.11Show/hide
Query:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV
        M+LVWSP+ AS AYI TV+SC+   D  VAE L+A AAGWN + IVETWS G PIATSVGLA+AA HT GRH+C+V DE SRS+Y   MR A  + + EV
Subjt:  MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEV

Query:  EVGEAAE-AVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST
         V ++AE  V R  GVDF+VVD +R +F   L +A+TS+ GAVLVCKNA  +S+ GF+WQ +L+RGTRVV+SVFLPVGRGLEI H+G+     GG +   
Subjt:  EVGEAAE-AVARAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNST

Query:  ANGGRWIKRLDKRSGEEHVFRQ
            RWIK +D RSGEEH+F++
Subjt:  ANGGRWIKRLDKRSGEEHVFRQ

AT5G62280.1 Protein of unknown function (DUF1442)1.4e-1028.33Show/hide
Query:  WSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYV--EAMREAGIAAAPEVEV
        WS + A+KAY+ T+K+ + + +  VAE ++A+AAG +A+ I    +        V L  AA  T G+ +CV+   R   + +  + M E       +  V
Subjt:  WSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYV--EAMREAGIAAAPEVEV

Query:  GEAAEAVA---RAEGVDFVVVDCRRKDFARVL--------RVARTSERG--AVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPS
        GE+ +           DFV+VDC  ++   ++          ART      AV+V  NA+ R    F   R         K+ FLP+G GL +  +    
Subjt:  GEAAEAVA---RAEGVDFVVVDCRRKDFARVL--------RVARTSERG--AVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPS

Query:  P--GGGGSSNSTANGGRWIKRLDKRSGEEHVFR
                 +      RW+ ++DK +GEEHVFR
Subjt:  P--GGGGSSNSTANGGRWIKRLDKRSGEEHVFR


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGAAGCTCGTTTGGTCACCAGATAGAGCTTCCAAGGCTTATATCGACACCGTTAAATCATGTGAGATTTCCGGCGATTTCGGCGTCGCGGAGCTTCTCGCCGCCATGGC
CGCCGGCTGGAACGCGAAATTCATCGTCGAGACATGGTCGGACGGCGGGCCGATAGCCACAAGCGTCGGCCTGGCGATCGCGGCTGGCCACACCGGCGGGCGGCATCTGT
GCGTGGTGGCGGACGAACGATCGAGATCGAAGTACGTGGAGGCGATGCGGGAGGCCGGAATCGCGGCGGCGCCGGAGGTGGAGGTCGGCGAGGCGGCGGAGGCGGTGGCG
AGGGCGGAGGGCGTGGATTTTGTGGTGGTGGATTGCCGGCGGAAGGATTTCGCTAGGGTTTTGAGGGTGGCGAGGACGAGCGAGAGAGGGGCAGTTTTGGTATGCAAAAA
TGCATGGGAACGAAGTGTCGAGGGGTTCAGATGGCAGAGGGTGCTTCAGAGAGGGACACGTGTCGTCAAGTCGGTTTTTTTACCGGTCGGGCGAGGACTGGAAATTGCCC
ATATTGGAAGCCCAAGCCCCGGTGGCGGTGGAAGTTCCAACTCGACGGCGAACGGTGGCCGTTGGATCAAAAGGCTTGATAAACGGTCCGGAGAGGAACACGTGTTTCGC
CAGTGA
mRNA sequenceShow/hide mRNA sequence
ATGAAGCTCGTTTGGTCACCAGATAGAGCTTCCAAGGCTTATATCGACACCGTTAAATCATGTGAGATTTCCGGCGATTTCGGCGTCGCGGAGCTTCTCGCCGCCATGGC
CGCCGGCTGGAACGCGAAATTCATCGTCGAGACATGGTCGGACGGCGGGCCGATAGCCACAAGCGTCGGCCTGGCGATCGCGGCTGGCCACACCGGCGGGCGGCATCTGT
GCGTGGTGGCGGACGAACGATCGAGATCGAAGTACGTGGAGGCGATGCGGGAGGCCGGAATCGCGGCGGCGCCGGAGGTGGAGGTCGGCGAGGCGGCGGAGGCGGTGGCG
AGGGCGGAGGGCGTGGATTTTGTGGTGGTGGATTGCCGGCGGAAGGATTTCGCTAGGGTTTTGAGGGTGGCGAGGACGAGCGAGAGAGGGGCAGTTTTGGTATGCAAAAA
TGCATGGGAACGAAGTGTCGAGGGGTTCAGATGGCAGAGGGTGCTTCAGAGAGGGACACGTGTCGTCAAGTCGGTTTTTTTACCGGTCGGGCGAGGACTGGAAATTGCCC
ATATTGGAAGCCCAAGCCCCGGTGGCGGTGGAAGTTCCAACTCGACGGCGAACGGTGGCCGTTGGATCAAAAGGCTTGATAAACGGTCCGGAGAGGAACACGTGTTTCGC
CAGTGA
Protein sequenceShow/hide protein sequence
MKLVWSPDRASKAYIDTVKSCEISGDFGVAELLAAMAAGWNAKFIVETWSDGGPIATSVGLAIAAGHTGGRHLCVVADERSRSKYVEAMREAGIAAAPEVEVGEAAEAVA
RAEGVDFVVVDCRRKDFARVLRVARTSERGAVLVCKNAWERSVEGFRWQRVLQRGTRVVKSVFLPVGRGLEIAHIGSPSPGGGGSSNSTANGGRWIKRLDKRSGEEHVFR
Q