CuGenDBv2

Gene ID	Moc04g15570
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	myosin heavy chain-related
Genome location	chr4:11696342..11700391
RNA-Seq Expression	Moc04g15570
Synteny	Moc04g15570
Gene Ontology terms	GO:0016020 - membrane (cellular component) GO:0043167 - ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022142326.1 uncharacterized protein LOC111012467 [Momordica charantia]

1.1e-106

51.08

Show/hide

Query:  RRRKKKKTTSPLEAGARGVLPASFTDRVDDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQ
        +RRKKKK  S  E GA  VLPA F DRVDDP ARMGGTSDVTARFR+EPSSSGVRDQVSRISAASLDRCLRRASK VS PGSVL R IDYAAEAFVASIQ
Subjt:  RRRKKKKTTSPLEAGARGVLPASFTDRVDDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQ

Query:  SALAVKAELDGREVMAAREKEEFSAALEAASSAMKDELLKAHSEVGILKAEVET----------------------------------------------
        SALAVKAELDGREV+AAREKEEFSAALEAASS MKDELLKAHSEV  LKAEVE+                                              
Subjt:  SALAVKAELDGREVMAAREKEEFSAALEAASSAMKDELLKAHSEVGILKAEVET----------------------------------------------

Query:  ----------------------------------------------------------------------------------------------------
                                                                                                            
Subjt:  ----------------------------------------------------------------------------------------------------

Query:  --------------------------------------KAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVK
                                              KAELLK+E++R KA LRAA+AITKGLEKEKFQLLKEKDDMLQALE K+  +    AEL+  K
Subjt:  --------------------------------------KAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVK

Query:  ERLSNGALLEESFRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------Q
        ERL+NGALLE +FRQHPDFDGF KDFSDAGFKFLMKGIA+D+  L++DLG LKKRYAE+WASGP+GT GP +LVDKYVRDLDSDYSDL+ED        +
Subjt:  ERLSNGALLEESFRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------Q

Query:  VGTTQEGVP
        VGTTQEGVP
Subjt:  VGTTQEGVP

XP_022144034.1 uncharacterized protein LOC111013826 [Momordica charantia]

3.3e-111

79.12

Show/hide

Query:  MFEYGLRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG--------------
        MFEYGLR  LHPFVQEFLFRTGLAPAQVAPNGWGV FAL ILFWLRARD+EEAELLDVD+LLACFEAK IAKKPGRFYMCARKGAG              
Subjt:  MFEYGLRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG--------------

Query:  ---------------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFAC
                       GRSFFDVPTRFGNLVS+RPVPELTQASFDTLKYYK+ FPRGRKVGTLVTD+LLLESGLLDYNPAVRPIE SRPNS L MVC FA 
Subjt:  ---------------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFAC

Query:  NVKRKSKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE
         VKRKSKGR+HALEAAQSSKP TPAVVG ASEDPAPVIELESSGGPSREKRPRDQTEAV       DV PLGE
Subjt:  NVKRKSKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE

XP_022150343.1 uncharacterized protein LOC111018538 [Momordica charantia]

1.3e-123

85.96

Show/hide

Query:  GTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALEAASSAMKD
        G   + A+ R+EPSSSGVRDQVSRISAASLDRCLRRASK VS PGSVLQRTIDYAAEAFVASIQSALAVKAELDGREV+AAREKEEFSAALE ASS MKD
Subjt:  GTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALEAASSAMKD

Query:  ELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEESFRQHPDFD
        ELLKAHSEV  LKAEVE++AELLKKEEDRR+AQLRAA+AIT+GLE+EKFQLLKEKDDMLQALEAK++EL+HATAELET KERLSNG LLEE+FRQHPDFD
Subjt:  ELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEESFRQHPDFD

Query:  GFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEEDQVGTTQEGVPQAGS
        GF KDFSDAGFKFLMKGIASDM DLQIDL GLK+RYAE+WASGP GTPGPQALVD+YVRDLDSDYSD EEDQVG+TQEG    GS
Subjt:  GFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEEDQVGTTQEGVPQAGS

XP_022159063.1 uncharacterized protein LOC111025502, partial [Momordica charantia]

1.7e-160

83.38

Show/hide

Query:  MSSSFSSNLGFDEDLARRLKSELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFSIPENILLRIPDEGERADNPPEGWVTLYFKMFEYG
        MSSS SSNL  + DLARRL+S+LEEIEN R SDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGF+IPENILLR+P+EGERADNPPEGWVTLYFKMFEYG
Subjt:  MSSSFSSNLGFDEDLARRLKSELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFSIPENILLRIPDEGERADNPPEGWVTLYFKMFEYG

Query:  LRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG-------------------
        LR  LHPFVQEFLFRTGLAPAQVAPNGWGV FAL ILFWLRARD+EEAEL DVD+LLACFEAK IAKKPGRFYMCARKGAG                   
Subjt:  LRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG-------------------

Query:  ----------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRK
                  GRSFFDVPTRFGNLVS+RPVPELTQASFDTLKYYK+ FPRGRKVGTLVTD+LLLESGLLDYNPAVRPIESSRPNSEL MVCGFA  VKRK
Subjt:  ----------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRK

Query:  SKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAVD
        SKGR+HALEAAQSSKPATPAVVG ASEDPA VIELESSGGPSREKRPRDQTEAVD
Subjt:  SKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAVD

XP_022159252.1 uncharacterized protein LOC111025665 [Momordica charantia]

2.9e-176

69.18

Show/hide

Query:  KGAGGRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRKSKGRSH
        K   GR+FFDVPTRFGNLVS++ +PEL QA+FDTLK+YKDHFPR RK+ TLVTDKLLLESGLLDYNP VR IE+SRPNSEL MVCGF  +VKRKSKGR+H
Subjt:  KGAGGRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRKSKGRSH

Query:  ALEAAQSSKPATPAV--------VGLASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVPLKRRRKKKKTTSPLEAGARGVLPASFTDRV
        AL+    ++P TP V         G +S  P PVIEL+ SGG S EKR R+++EA+DVSPL  EVR E PL+RRRKKKKT+S  EAGARG LP S  D V
Subjt:  ALEAAQSSKPATPAV--------VGLASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVPLKRRRKKKKTTSPLEAGARGVLPASFTDRV

Query:  DDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALE
        DDPEARM GTS+V  RF +EPSSSGV+DQVSRISA  LDR LRRASK VSDPGSVLQRTID  AEAF+ASI  A+ VKAELDGRE +AA+E+E   AALE
Subjt:  DDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALE

Query:  AASSAMKDELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEES
        AA++ +K ELLKA  EV IL+AEV+ K +LLKKE ++ KA LRAA+AITKGLEKEKFQLLKEKDD+ Q LE K+  +   T EL+ +KERL+NG LLEES
Subjt:  AASSAMKDELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEES

Query:  FRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------QVGTTQEGVP--Q
        FRQHPDFDGF KDFSDAGFKFLMKGIA+DM  LQIDL GLKK+Y+E+WASGP+GTP PQ+LVDKYVR+LDSDYSD+EE+        +VGTTQE VP  Q
Subjt:  FRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------QVGTTQEGVP--Q

Query:  AGS
         GS
Subjt:  AGS

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CLV1 uncharacterized protein LOC111012467

5.3e-107

51.08

Show/hide

Query:  RRRKKKKTTSPLEAGARGVLPASFTDRVDDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQ
        +RRKKKK  S  E GA  VLPA F DRVDDP ARMGGTSDVTARFR+EPSSSGVRDQVSRISAASLDRCLRRASK VS PGSVL R IDYAAEAFVASIQ
Subjt:  RRRKKKKTTSPLEAGARGVLPASFTDRVDDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQ

Query:  SALAVKAELDGREVMAAREKEEFSAALEAASSAMKDELLKAHSEVGILKAEVET----------------------------------------------
        SALAVKAELDGREV+AAREKEEFSAALEAASS MKDELLKAHSEV  LKAEVE+                                              
Subjt:  SALAVKAELDGREVMAAREKEEFSAALEAASSAMKDELLKAHSEVGILKAEVET----------------------------------------------

Query:  ----------------------------------------------------------------------------------------------------
                                                                                                            
Subjt:  ----------------------------------------------------------------------------------------------------

Query:  --------------------------------------KAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVK
                                              KAELLK+E++R KA LRAA+AITKGLEKEKFQLLKEKDDMLQALE K+  +    AEL+  K
Subjt:  --------------------------------------KAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVK

Query:  ERLSNGALLEESFRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------Q
        ERL+NGALLE +FRQHPDFDGF KDFSDAGFKFLMKGIA+D+  L++DLG LKKRYAE+WASGP+GT GP +LVDKYVRDLDSDYSDL+ED        +
Subjt:  ERLSNGALLEESFRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------Q

Query:  VGTTQEGVP
        VGTTQEGVP
Subjt:  VGTTQEGVP

A0A6J1CR42 uncharacterized protein LOC111013826

1.6e-111

79.12

Show/hide

Query:  MFEYGLRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG--------------
        MFEYGLR  LHPFVQEFLFRTGLAPAQVAPNGWGV FAL ILFWLRARD+EEAELLDVD+LLACFEAK IAKKPGRFYMCARKGAG              
Subjt:  MFEYGLRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG--------------

Query:  ---------------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFAC
                       GRSFFDVPTRFGNLVS+RPVPELTQASFDTLKYYK+ FPRGRKVGTLVTD+LLLESGLLDYNPAVRPIE SRPNS L MVC FA 
Subjt:  ---------------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFAC

Query:  NVKRKSKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE
         VKRKSKGR+HALEAAQSSKP TPAVVG ASEDPAPVIELESSGGPSREKRPRDQTEAV       DV PLGE
Subjt:  NVKRKSKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAV-------DVSPLGE

A0A6J1D971 uncharacterized protein LOC111018538

6.3e-124

85.96

Show/hide

Query:  GTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALEAASSAMKD
        G   + A+ R+EPSSSGVRDQVSRISAASLDRCLRRASK VS PGSVLQRTIDYAAEAFVASIQSALAVKAELDGREV+AAREKEEFSAALE ASS MKD
Subjt:  GTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALEAASSAMKD

Query:  ELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEESFRQHPDFD
        ELLKAHSEV  LKAEVE++AELLKKEEDRR+AQLRAA+AIT+GLE+EKFQLLKEKDDMLQALEAK++EL+HATAELET KERLSNG LLEE+FRQHPDFD
Subjt:  ELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEESFRQHPDFD

Query:  GFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEEDQVGTTQEGVPQAGS
        GF KDFSDAGFKFLMKGIASDM DLQIDL GLK+RYAE+WASGP GTPGPQALVD+YVRDLDSDYSD EEDQVG+TQEG    GS
Subjt:  GFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEEDQVGTTQEGVPQAGS

A0A6J1DXS5 uncharacterized protein LOC111025502

8.4e-161

83.38

Show/hide

Query:  MSSSFSSNLGFDEDLARRLKSELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFSIPENILLRIPDEGERADNPPEGWVTLYFKMFEYG
        MSSS SSNL  + DLARRL+S+LEEIEN R SDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGF+IPENILLR+P+EGERADNPPEGWVTLYFKMFEYG
Subjt:  MSSSFSSNLGFDEDLARRLKSELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFSIPENILLRIPDEGERADNPPEGWVTLYFKMFEYG

Query:  LRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG-------------------
        LR  LHPFVQEFLFRTGLAPAQVAPNGWGV FAL ILFWLRARD+EEAEL DVD+LLACFEAK IAKKPGRFYMCARKGAG                   
Subjt:  LRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDRLLACFEAKMIAKKPGRFYMCARKGAG-------------------

Query:  ----------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRK
                  GRSFFDVPTRFGNLVS+RPVPELTQASFDTLKYYK+ FPRGRKVGTLVTD+LLLESGLLDYNPAVRPIESSRPNSEL MVCGFA  VKRK
Subjt:  ----------GRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRK

Query:  SKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAVD
        SKGR+HALEAAQSSKPATPAVVG ASEDPA VIELESSGGPSREKRPRDQTEAVD
Subjt:  SKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAVD

A0A6J1DZB3 uncharacterized protein LOC111025665

1.4e-176

69.18

Show/hide

Query:  KGAGGRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRKSKGRSH
        K   GR+FFDVPTRFGNLVS++ +PEL QA+FDTLK+YKDHFPR RK+ TLVTDKLLLESGLLDYNP VR IE+SRPNSEL MVCGF  +VKRKSKGR+H
Subjt:  KGAGGRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFACNVKRKSKGRSH

Query:  ALEAAQSSKPATPAV--------VGLASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVPLKRRRKKKKTTSPLEAGARGVLPASFTDRV
        AL+    ++P TP V         G +S  P PVIEL+ SGG S EKR R+++EA+DVSPL  EVR E PL+RRRKKKKT+S  EAGARG LP S  D V
Subjt:  ALEAAQSSKPATPAV--------VGLASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVPLKRRRKKKKTTSPLEAGARGVLPASFTDRV

Query:  DDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALE
        DDPEARM GTS+V  RF +EPSSSGV+DQVSRISA  LDR LRRASK VSDPGSVLQRTID  AEAF+ASI  A+ VKAELDGRE +AA+E+E   AALE
Subjt:  DDPEARMGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALE

Query:  AASSAMKDELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEES
        AA++ +K ELLKA  EV IL+AEV+ K +LLKKE ++ KA LRAA+AITKGLEKEKFQLLKEKDD+ Q LE K+  +   T EL+ +KERL+NG LLEES
Subjt:  AASSAMKDELLKAHSEVGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEES

Query:  FRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------QVGTTQEGVP--Q
        FRQHPDFDGF KDFSDAGFKFLMKGIA+DM  LQIDL GLKK+Y+E+WASGP+GTP PQ+LVDKYVR+LDSDYSD+EE+        +VGTTQE VP  Q
Subjt:  FRQHPDFDGFGKDFSDAGFKFLMKGIASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEED--------QVGTTQEGVP--Q

Query:  AGS
         GS
Subjt:  AGS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT3G42060.1 myosin heavy chain-related

8.4e-04

26.06

Show/hide

Query:  SRIPEHYLGSLRRGFSIPENILLRIPDEGERADNPPEGWVTLYFKMF-EYGLRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAE
        SR    + G        PE +   IP+  +R  + PEG++ L+   F E GL F L  F+  +  R  +A +Q++         LVIL        EE  
Subjt:  SRIPEHYLGSLRRGFSIPENILLRIPDEGERADNPPEGWVTLYFKMF-EYGLRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAE

Query:  LLDVDRLLACFEAKMIAKKPGRFYMCARKGAGGRSFFDVPTR
        ++D+D         +  K   R  +CA    G + F+   +R
Subjt:  LLDVDRLLACFEAKMIAKKPGRFYMCARKGAGGRSFFDVPTR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCCAGTTCATAGATGGATCCACCAAACCTGAAACCAAAAAACTCAATGCCGGTGCGGTGTCCCGCCTAATATACTCCGGCGCTCAAGTTAGTAATCAGAGTAAAAA
TAAGAATAAGACACCAGAGGGTTCGATGTTTTTCACTTACTTGGTGTGGAGGATCGCCCTTCCTTTTATGGCCCTGAAGGACCGACCAAGAAGGACAACAGTTGGAAGTG
GTAGGGACATCGCACGCGGTACGGTAGGACAGAGAGGTGCACATCCCCGACAGTGCAGAGTAGACTCGCTACCTGTGTTACCTGAGCATGTCGCCCAGGGCTGTTGGATG
TGCCCATCATACGCCTTCTGCTTGGTGATATCTCCAATGATAATTGATTCCCAGTGGGCCCGCGTCCGTGAAGGGGCGAACACGTGTCCTATTCGGAAGCTATCCATAAC
AATTGCAGCTCGAACTCGGCTTCCAGACCGATCTGAATACTTGGGCGGACCTGCACAAAAAGGTGAGCACTCCGACGATCAAGTCAGTATAGGTCGGATTCCCAGTTTAG
TTCGAGGACCGTCGGTTACACCCGGGGTCATCCGCGTGTCCAGGGTATTCTCTTTCCCAAACATTGGCCCCTCTCTGTCTGGTCTGATCTCGACCTGGCAGAGAAGTTCG
TTCGACTTGCTTTGGATGCGTGGCGACTTCCTATTCGTGGGAAAATATAACTGTTGCAGTAGATTTATCGTCGGAATATTCAAATATTCCGACGCTTCGGATCTTAGGGA
GGATCCTAGCCGCTCGTTGATTACACGTCTCGAACCCTTGGTAGGTCGGTCGCTTCCCTCACTTTCTCTTTCGAACGTGATTGCCATGTCGTCCTCTTTTAGCAGCAACT
TAGGATTCGATGAGGATTTAGCTCGTAGGTTAAAGTCCGAGCTCGAGGAGATAGAAAACTTTAGGTTCTCCGATGACGGGGAGGATAGTGATGCCTCCACCTCGGGTCAG
GGTTTGGAATACCCTTCTAGGATACCTGAGCACTACCTCGGATCCCTTCGTAGGGGGTTCTCTATCCCTGAGAACATCCTCCTTAGGATTCCGGATGAGGGGGAGAGAGC
TGACAATCCTCCAGAGGGATGGGTCACTCTCTACTTCAAAATGTTTGAGTACGGCCTCAGATTTACCCTTCACCCTTTCGTCCAAGAGTTTCTTTTCCGAACTGGGTTGG
CTCCGGCTCAAGTGGCCCCCAATGGGTGGGGTGTCACTTTCGCTTTGGTCATCCTTTTTTGGCTACGAGCTCGGGATAATGAAGAGGCCGAGCTGTTAGACGTAGACCGG
CTCCTCGCGTGCTTCGAAGCGAAAATGATAGCTAAGAAGCCTGGTCGGTTCTATATGTGCGCAAGGAAAGGCGCAGGCGGTCGTTCCTTCTTTGACGTTCCCACTAGGTT
TGGGAACCTAGTTTCAGTCCGACCAGTCCCCGAGCTTACGCAAGCCTCCTTCGACACGCTGAAATATTACAAGGACCATTTTCCGAGGGGTAGGAAGGTCGGAACCTTAG
TGACCGACAAGCTGTTGCTTGAGTCCGGGCTGCTAGATTACAACCCCGCAGTTCGTCCCATTGAATCCTCAAGGCCGAACTCCGAACTTGTCATGGTTTGCGGATTTGCA
TGCAACGTGAAGCGCAAGTCCAAGGGCCGATCCCATGCTCTTGAGGCCGCCCAGAGTTCGAAACCTGCCACCCCTGCTGTGGTAGGGCTAGCCTCGGAAGATCCAGCCCC
AGTGATCGAGCTGGAGTCTTCTGGGGGTCCTTCGAGGGAGAAGCGCCCCAGGGATCAGACCGAGGCGGTGGACGTCTCGCCCTTGGGCGAGGAGGTGAGGGAGGAAGTCC
CTCTGAAGCGAAGGAGGAAGAAGAAGAAGACCACCTCCCCCTTGGAGGCCGGAGCTCGTGGGGTCTTGCCTGCGAGCTTCACAGATCGGGTCGACGATCCTGAGGCCAGG
ATGGGCGGGACGTCCGATGTGACGGCACGGTTCAGAGTTGAGCCGTCAAGTTCTGGGGTGCGGGACCAGGTGTCTCGCATCTCGGCTGCAAGTTTGGACCGCTGCCTAAG
GAGGGCGTCCAAATTGGTAAGTGACCCGGGGTCCGTTCTACAGAGGACCATCGACTACGCCGCTGAGGCGTTCGTTGCTTCCATTCAATCGGCTCTGGCCGTGAAGGCCG
AGCTGGATGGGAGGGAAGTTATGGCAGCGAGGGAGAAAGAGGAGTTCTCTGCTGCCTTGGAGGCTGCTTCCTCCGCCATGAAGGATGAGCTGCTGAAGGCTCACTCTGAG
GTGGGAATTTTGAAGGCCGAGGTGGAGACCAAGGCCGAGCTGCTGAAGAAGGAAGAAGACAGACGCAAGGCCCAGCTCCGAGCTGCCAATGCTATAACCAAGGGCTTGGA
GAAGGAGAAGTTCCAACTCCTCAAGGAGAAGGACGACATGCTCCAGGCGCTTGAAGCGAAGGAGGAGGAGCTGAAGCATGCGACTGCCGAGCTAGAGACGGTGAAGGAGC
GTCTCAGCAATGGAGCCTTATTGGAGGAATCGTTTAGGCAACATCCTGACTTCGATGGATTTGGCAAAGACTTCTCTGACGCGGGCTTCAAGTTTCTCATGAAGGGCATT
GCTTCCGACATGTCTGACCTTCAGATCGATCTCGGTGGTCTAAAGAAGAGGTATGCTGAGCAGTGGGCGTCTGGGCCCAGCGGCACCCCTGGCCCCCAAGCGTTGGTGGA
TAAGTACGTCAGAGATCTGGACTCTGACTACTCCGACCTCGAAGAGGATCAGGTCGGCACCACTCAAGAGGGCGTTCCTCAAGCAGGCTCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSQFIDGSTKPETKKLNAGAVSRLIYSGAQVSNQSKNKNKTPEGSMFFTYLVWRIALPFMALKDRPRRTTVGSGRDIARGTVGQRGAHPRQCRVDSLPVLPEHVAQGCWM
CPSYAFCLVISPMIIDSQWARVREGANTCPIRKLSITIAARTRLPDRSEYLGGPAQKGEHSDDQVSIGRIPSLVRGPSVTPGVIRVSRVFSFPNIGPSLSGLISTWQRSS
FDLLWMRGDFLFVGKYNCCSRFIVGIFKYSDASDLREDPSRSLITRLEPLVGRSLPSLSLSNVIAMSSSFSSNLGFDEDLARRLKSELEEIENFRFSDDGEDSDASTSGQ
GLEYPSRIPEHYLGSLRRGFSIPENILLRIPDEGERADNPPEGWVTLYFKMFEYGLRFTLHPFVQEFLFRTGLAPAQVAPNGWGVTFALVILFWLRARDNEEAELLDVDR
LLACFEAKMIAKKPGRFYMCARKGAGGRSFFDVPTRFGNLVSVRPVPELTQASFDTLKYYKDHFPRGRKVGTLVTDKLLLESGLLDYNPAVRPIESSRPNSELVMVCGFA
CNVKRKSKGRSHALEAAQSSKPATPAVVGLASEDPAPVIELESSGGPSREKRPRDQTEAVDVSPLGEEVREEVPLKRRRKKKKTTSPLEAGARGVLPASFTDRVDDPEAR
MGGTSDVTARFRVEPSSSGVRDQVSRISAASLDRCLRRASKLVSDPGSVLQRTIDYAAEAFVASIQSALAVKAELDGREVMAAREKEEFSAALEAASSAMKDELLKAHSE
VGILKAEVETKAELLKKEEDRRKAQLRAANAITKGLEKEKFQLLKEKDDMLQALEAKEEELKHATAELETVKERLSNGALLEESFRQHPDFDGFGKDFSDAGFKFLMKGI
ASDMSDLQIDLGGLKKRYAEQWASGPSGTPGPQALVDKYVRDLDSDYSDLEEDQVGTTQEGVPQAGS

Moc04g15570 (gene) of Bitter gourd (OHB3-1) v2 genome