CuGenDBv2

Gene ID	Moc03g19980
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	myosin heavy chain-related
Genome location	chr3:13466148..13471680
RNA-Seq Expression	Moc03g19980
Synteny	Moc03g19980
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component) GO:0043167 - ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022138041.1 uncharacterized protein LOC111009298 [Momordica charantia]

6.6e-106

83.46

Show/hide

Query:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKGA GIVKG TSIKGWVRKWFYASGEWLAKDES              V+IRPVPEL QA FDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVREEAPLKRRR
        AV             MVCGFASNVKRKSKG+AHALEAAQSSKP TPAVVGPASEDP PVIELESS  PSREKRPRDQTEAVDVSPLGEEVREE PLKRRR
Subjt:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVREEAPLKRRR

Query:  KKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQ
        KKKKTTSPLEVGARG LPASFADRVDDPEARMGGT DVT RFRVE SSSGVRDQ
Subjt:  KKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQ

XP_022144034.1 uncharacterized protein LOC111013826 [Momordica charantia]

2.3e-111

80.95

Show/hide

Query:  MFEYDLRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVR
        MFEY LRLPLHPFVQE LFRTGLAPAQVAPNG                  EEAELLDVDQLLA FEAKRIAKKPGRFYMCARKGAGGIVKG TSIKGWVR
Subjt:  MFEYDLRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVR

Query:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFAS
        KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPEL QA FDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAV             MVC FAS
Subjt:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFAS

Query:  NVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAV-------DVSPLGE
         VKRKSKGRAHALEAAQSSKP TPAVVGPASEDP PVIELESSG PSREKRPRDQTEAV       DV PLGE
Subjt:  NVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAV-------DVSPLGE

XP_022150343.1 uncharacterized protein LOC111018538 [Momordica charantia]

9.9e-102

75.79

Show/hide

Query:  GTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETFVASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKD
        G   +  + R+E SSSGVRDQVSRISAASLDRCLRRASKFVS PGSVLQRTIDY AE FVASIQSALAVKAELDGRE L AREKEEFSAALE ASSTMKD
Subjt:  GTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETFVASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKD

Query:  ELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDMLQALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFD
        ELLKAH EVE LKA+V+++AELLKKEEDRR+AQLRAAHAIT+GLE+EKFQL KEKDDMLQALE K++EL+HAT ELE  KERL+NG LLEE+FRQHP+FD
Subjt:  ELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDMLQALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFD

Query:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------RDLDSDYSELEEDQVGTTQEGAPQAGS
        GFAKDFSDAGFKFLMKGIASDMPDLQIDL GLK+                        RDLDSDYS+ EEDQVG+TQEGA   GS
Subjt:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------RDLDSDYSELEEDQVGTTQEGAPQAGS

XP_022159063.1 uncharacterized protein LOC111025502, partial [Momordica charantia]

1.0e-159

84.79

Show/hide

Query:  MSSSFSSNLGSDEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVSLYFKMFEYD
        MSSS SSNL  + DLARRLES+LEEIEN R SDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFAIPENILLR+PEEGERADNPPEGWV+LYFKMFEY 
Subjt:  MSSSFSSNLGSDEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVSLYFKMFEYD

Query:  LRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVRKWFYA
        LRLPLHPFVQE LFRTGLAPAQVAPNG                  EEAEL DVDQLLA FEAKRIAKKPGRFYMCARKGAGGIVKG TSIKGWVRKWFYA
Subjt:  LRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVRKWFYA

Query:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFASNVKRK
        SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPEL QA FDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAV             MVCGFAS VKRK
Subjt:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFASNVKRK

Query:  SKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVD
        SKGRAHALEAAQSSKPATPAVVGPASEDP  VIELESSG PSREKRPRDQTEAVD
Subjt:  SKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVD

XP_022159252.1 uncharacterized protein LOC111025665 [Momordica charantia]

3.4e-171

65.67

Show/hide

Query:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKG GGIVKG TSIKGWV KWF+ASGEWLAKDESGR+FFDVPTRFGNLVSI+ +PEL QA FDTLK+YK+HFPR RK+ TLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAV--------VGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVRE
         V             MVCGF  +VKRKSKGRAHAL+    ++P TP V         GP+S  P PVIEL+ SG  S EKR R+++EA+DVSPL  EVR 
Subjt:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAV--------VGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVRE

Query:  EAPLKRRRKKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETF
        E+PL+RRRKKKKT+S  E GARG LP S AD VDDPEARM GTS+V +RF +E SSSGV+DQVSRISA  LDR LRRASKFVSDPGSVLQRTID  AE F
Subjt:  EAPLKRRRKKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETF

Query:  VASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKDELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDML
        +ASI  A+ VKAELDGREAL A+E+E   AALEAA +T+K ELLKA  EV++L+A+V AK +LLKKE ++ KA LRAAHAITKGLEKEKFQL KEKDD+ 
Subjt:  VASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKDELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDML

Query:  QALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------R
        Q LE K+  +   T EL+ +KERL NG LLEESFRQHP+FDGFAKDFSDAGFKFLMKGIA+DMP LQIDL GLKK                        R
Subjt:  QALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------R

Query:  DLDSDYSELEED--------QVGTTQEGAP--QAGS
        +LDSDYS++EE+        +VGTTQE  P  Q GS
Subjt:  DLDSDYSELEED--------QVGTTQEGAP--QAGS

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C8K9 uncharacterized protein LOC111009298

3.2e-106

83.46

Show/hide

Query:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKGA GIVKG TSIKGWVRKWFYASGEWLAKDES              V+IRPVPEL QA FDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVREEAPLKRRR
        AV             MVCGFASNVKRKSKG+AHALEAAQSSKP TPAVVGPASEDP PVIELESS  PSREKRPRDQTEAVDVSPLGEEVREE PLKRRR
Subjt:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVREEAPLKRRR

Query:  KKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQ
        KKKKTTSPLEVGARG LPASFADRVDDPEARMGGT DVT RFRVE SSSGVRDQ
Subjt:  KKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQ

A0A6J1CR42 uncharacterized protein LOC111013826

1.1e-111

80.95

Show/hide

Query:  MFEYDLRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVR
        MFEY LRLPLHPFVQE LFRTGLAPAQVAPNG                  EEAELLDVDQLLA FEAKRIAKKPGRFYMCARKGAGGIVKG TSIKGWVR
Subjt:  MFEYDLRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVR

Query:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFAS
        KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPEL QA FDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAV             MVC FAS
Subjt:  KWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFAS

Query:  NVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAV-------DVSPLGE
         VKRKSKGRAHALEAAQSSKP TPAVVGPASEDP PVIELESSG PSREKRPRDQTEAV       DV PLGE
Subjt:  NVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAV-------DVSPLGE

A0A6J1D971 uncharacterized protein LOC111018538

4.8e-102

75.79

Show/hide

Query:  GTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETFVASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKD
        G   +  + R+E SSSGVRDQVSRISAASLDRCLRRASKFVS PGSVLQRTIDY AE FVASIQSALAVKAELDGRE L AREKEEFSAALE ASSTMKD
Subjt:  GTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETFVASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKD

Query:  ELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDMLQALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFD
        ELLKAH EVE LKA+V+++AELLKKEEDRR+AQLRAAHAIT+GLE+EKFQL KEKDDMLQALE K++EL+HAT ELE  KERL+NG LLEE+FRQHP+FD
Subjt:  ELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDMLQALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFD

Query:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------RDLDSDYSELEEDQVGTTQEGAPQAGS
        GFAKDFSDAGFKFLMKGIASDMPDLQIDL GLK+                        RDLDSDYS+ EEDQVG+TQEGA   GS
Subjt:  GFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------RDLDSDYSELEEDQVGTTQEGAPQAGS

A0A6J1DXS5 uncharacterized protein LOC111025502

5.0e-160

84.79

Show/hide

Query:  MSSSFSSNLGSDEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVSLYFKMFEYD
        MSSS SSNL  + DLARRLES+LEEIEN R SDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFAIPENILLR+PEEGERADNPPEGWV+LYFKMFEY 
Subjt:  MSSSFSSNLGSDEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVSLYFKMFEYD

Query:  LRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVRKWFYA
        LRLPLHPFVQE LFRTGLAPAQVAPNG                  EEAEL DVDQLLA FEAKRIAKKPGRFYMCARKGAGGIVKG TSIKGWVRKWFYA
Subjt:  LRLPLHPFVQELLFRTGLAPAQVAPNG------------------EEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVRKWFYA

Query:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFASNVKRK
        SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPEL QA FDTLKYYKE FPRGRKVGTLVTD+LLLESGLLDYNPAV             MVCGFAS VKRK
Subjt:  SGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAV------------PMVCGFASNVKRK

Query:  SKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVD
        SKGRAHALEAAQSSKPATPAVVGPASEDP  VIELESSG PSREKRPRDQTEAVD
Subjt:  SKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESSGDPSREKRPRDQTEAVD

A0A6J1DZB3 uncharacterized protein LOC111025665

1.7e-171

65.67

Show/hide

Query:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP
        MCARKG GGIVKG TSIKGWV KWF+ASGEWLAKDESGR+FFDVPTRFGNLVSI+ +PEL QA FDTLK+YK+HFPR RK+ TLVTDKLLLESGLLDYNP
Subjt:  MCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNP

Query:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAV--------VGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVRE
         V             MVCGF  +VKRKSKGRAHAL+    ++P TP V         GP+S  P PVIEL+ SG  S EKR R+++EA+DVSPL  EVR 
Subjt:  AV------------PMVCGFASNVKRKSKGRAHALEAAQSSKPATPAV--------VGPASEDPVPVIELESSGDPSREKRPRDQTEAVDVSPLGEEVRE

Query:  EAPLKRRRKKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETF
        E+PL+RRRKKKKT+S  E GARG LP S AD VDDPEARM GTS+V +RF +E SSSGV+DQVSRISA  LDR LRRASKFVSDPGSVLQRTID  AE F
Subjt:  EAPLKRRRKKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYTAETF

Query:  VASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKDELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDML
        +ASI  A+ VKAELDGREAL A+E+E   AALEAA +T+K ELLKA  EV++L+A+V AK +LLKKE ++ KA LRAAHAITKGLEKEKFQL KEKDD+ 
Subjt:  VASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKDELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLFKEKDDML

Query:  QALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------R
        Q LE K+  +   T EL+ +KERL NG LLEESFRQHP+FDGFAKDFSDAGFKFLMKGIA+DMP LQIDL GLKK                        R
Subjt:  QALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKK------------------------R

Query:  DLDSDYSELEED--------QVGTTQEGAP--QAGS
        +LDSDYS++EE+        +VGTTQE  P  Q GS
Subjt:  DLDSDYSELEED--------QVGTTQEGAP--QAGS

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G32010.1 myosin heavy chain-related

7.8e-04

22.28

Show/hide

Query:  RLESELEEIENFRFSDDGEDSDASTSGQGLEY------PSRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVSLYFKMF-EYDLRLPLHPFVQ
        R+ ++ +   N    D+ E +D + SG+  +       P+      +G       +P  + +RIP + +R  + PEG++ L+   F E  LR P+  F+ 
Subjt:  RLESELEEIENFRFSDDGEDSDASTSGQGLEY------PSRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEGWVSLYFKMF-EYDLRLPLHPFVQ

Query:  ELLFRTGLAPAQ--VAPNGEEAEL----------LDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVRKWFYA
               +A +Q  VA     A L          L V+ +       ++  K G+ Y+ + +G   +  G +  + W+  +FYA
Subjt:  ELLFRTGLAPAQ--VAPNGEEAEL----------LDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVRKWFYA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCACAAGTGTTGCCACCCACCAAGACTCTTGGAGTAGAGCATCACCTCACAGAAGATCCATCAGAGATCAAGGAAACGAAAGATGAAAAAGAAATGGTAGAAATCAA
CACTCAATTCAACACATGGACCAACAATGATGGCCTTCTTACCTCATGGCTTCTTGGAATCATTGTTGAAGAAATGGTGGCTTTGATTAAAGGTACTGATACTGCAAAGC
AGGTTTTCTCTCCTCCAGTAGTAGATTATGAAGCCATGGGTAATAGATATGAAGGTGGCTGTTCGCTGGCCGTGGGTAGCAGATTTGAAACCTGTTTATGCAAGGATATG
CACAACAGTGTATTTCAGATTGCAGCTCGAACTCGGCCTCCGGACCGATCTGAATACTTGGGCGGACCTGCACAAAAAGGTGAGCACTCGGACGATCAAGTCAGTATAGG
TCGGATTCCCAGTTTAGTTCGAGGGTATTCTCTTCCCCAAACATTGGCCCTCTCTCTGTCTGGTCCGATCTCGACCTGGCAGAGAAGTTCATTCGACTTGCTTTGGACGC
GTGGAGACTTCCTATTCGTGGGAAAATATAACCGCTGCGGTGGATTTATCGTCGGAATATTCAAATATTCCGACGCTTCGGATCTTCGGGAGGATCCTAGCCGCTCGTTG
ATTACACGTCTCGAACCCTTGGTAGGTCGGTCTCTTCCCTCACTTTCTCTTTCGAACGTAGTTGCCATGTCGTCCTCTTTTAGCAGCAACTTAGGATCCGATGAGGATTT
AGCTCGTAGGTTAGAGTCCGAGCTCGAGGAGATAGAAAACTTTAGGTTCTCCGATGACGGGGAGGATAGTGATGCCTCCACCTCGGGTCAGGGTTTGGAATACCCTTCTA
GGATACCTGAGCACTACCTCGGATCCCTTCGTAGGGGGTTCGCTATCCCTGAGAACATCCTCCTTAGGATTCCGGAGGAGGGGGAGAGAGCTGACAATCCTCCAGAGGGA
TGGGTCTCTCTCTACTTCAAAATGTTTGAGTACGACCTCAGACTTCCCCTTCACCCTTTCGTCCAAGAGCTTCTTTTCCGAACTGGGCTGGCTCCGGCTCAAGTGGCCCC
CAATGGTGAAGAGGCCGAGCTGCTGGACGTAGACCAGCTCCTCGCAAGCTTCGAAGCGAAAAGGATAGCTAAGAAGCCTGGTCGGTTCTATATGTGCGCAAGGAAAGGCG
CAGGCGGGATAGTTAAGGGGTCGACCTCCATCAAGGGATGGGTGAGGAAGTGGTTCTACGCTTCTGGGGAATGGCTCGCAAAGGACGAGTCAGGTCGTTCCTTCTTTGAC
GTTCCCACTAGGTTTGGGAACCTGGTTTCAATCCGACCAGTCCCCGAGCTTATGCAAGCCTTCTTCGACACGTTGAAATATTACAAGGAGCATTTTCCGAGGGGTAGGAA
GGTCGGAACCTTGGTGACCGACAAGCTGCTGCTTGAGTCTGGACTGCTAGATTACAACCCTGCAGTTCCCATGGTTTGCGGATTTGCAAGCAACGTGAAGCGCAAGTCCA
AGGGTCGAGCCCATGCTCTTGAGGCCGCCCAGAGTTCGAAACCTGCCACTCCTGCTGTGGTAGGGCCAGCCTCGGAAGATCCAGTCCCAGTGATCGAGCTGGAGTCTTCT
GGGGATCCTTCGAGGGAGAAGCGCCCCAGGGATCAGACCGAGGCGGTGGACGTCTCGCCCTTGGGCGAGGAGGTGAGGGAGGAGGCCCCCCTGAAGCGAAGGAGGAAGAA
GAAGAAGACCACCTCCCCCTTGGAGGTCGGAGCTCGTGGGGCCCTGCCTGCGAGCTTCGCAGATCGGGTGGACGATCCTGAGGCCAGGATGGGCGGGACGTCCGACGTGA
CAGTACGGTTCAGAGTCGAGCTGTCAAGTTCTGGGGTGAGGGACCAGGTGTCCCGCATCTCGGCTGCAAGTTTGGACCGCTGCCTAAGGAGGGCGTCCAAATTTGTAAGT
GACCCAGGGTCCGTTCTGCAGAGGACCATCGACTACACCGCTGAGACGTTTGTTGCTTCCATTCAATCGGCTCTGGCCGTGAAGGCCGAGCTGGATGGGAGGGAAGCTCT
GGAAGCGAGGGAGAAAGAGGAGTTCTCTGCTGCCTTGGAGGCTGCTTCTTCCACCATGAAGGATGAGCTGCTGAAAGCTCACTATGAGGTGGAAGTTTTGAAGGCCAAGG
TGAAGGCCAAGGCCGAGTTGCTGAAGAAAGAAGAGGACAGGCGCAAGGCCCAGCTCCGAGCTGCCCATGCTATCACCAAGGGCTTGGAGAAGGAGAAGTTCCAACTCTTC
AAGGAGAAGGACGACATGCTCCAGGCGCTTGAAGTGAAGGAGGAGGAGTTGAAGCACGCGACTGTTGAGCTGGAGATGGTGAAGGAGCGTCTCAACAATGGAGCCCTATT
GGAGGAATCGTTCAGGCAACATCCTGAATTCGATGGATTTGCCAAAGACTTCTCTGACGCGGGCTTCAAGTTTCTCATGAAGGGCATTGCTTCCGACATGCCTGACCTTC
AGATCGATCTCGGTGGTCTGAAGAAGAGAGATCTGGACTCTGACTACTCCGAACTCGAAGAGGATCAGGTCGGCACCACTCAGGAGGGCGCTCCTCAAGCAGGCTCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSQVLPPTKTLGVEHHLTEDPSEIKETKDEKEMVEINTQFNTWTNNDGLLTSWLLGIIVEEMVALIKGTDTAKQVFSPPVVDYEAMGNRYEGGCSLAVGSRFETCLCKDM
HNSVFQIAARTRPPDRSEYLGGPAQKGEHSDDQVSIGRIPSLVRGYSLPQTLALSLSGPISTWQRSSFDLLWTRGDFLFVGKYNRCGGFIVGIFKYSDASDLREDPSRSL
ITRLEPLVGRSLPSLSLSNVVAMSSSFSSNLGSDEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGSLRRGFAIPENILLRIPEEGERADNPPEG
WVSLYFKMFEYDLRLPLHPFVQELLFRTGLAPAQVAPNGEEAELLDVDQLLASFEAKRIAKKPGRFYMCARKGAGGIVKGSTSIKGWVRKWFYASGEWLAKDESGRSFFD
VPTRFGNLVSIRPVPELMQAFFDTLKYYKEHFPRGRKVGTLVTDKLLLESGLLDYNPAVPMVCGFASNVKRKSKGRAHALEAAQSSKPATPAVVGPASEDPVPVIELESS
GDPSREKRPRDQTEAVDVSPLGEEVREEAPLKRRRKKKKTTSPLEVGARGALPASFADRVDDPEARMGGTSDVTVRFRVELSSSGVRDQVSRISAASLDRCLRRASKFVS
DPGSVLQRTIDYTAETFVASIQSALAVKAELDGREALEAREKEEFSAALEAASSTMKDELLKAHYEVEVLKAKVKAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLF
KEKDDMLQALEVKEEELKHATVELEMVKERLNNGALLEESFRQHPEFDGFAKDFSDAGFKFLMKGIASDMPDLQIDLGGLKKRDLDSDYSELEEDQVGTTQEGAPQAGS

Moc03g19980 (gene) of Bitter gourd (OHB3-1) v2 genome