CuGenDBv2

Gene ID	Moc07g21940
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	myosin heavy chain-related
Genome location	chr7:16096800..16102243
RNA-Seq Expression	Moc07g21940
Synteny	Moc07g21940
Gene Ontology terms	GO:0016021 - integral component of membrane (cellular component)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022142326.1 uncharacterized protein LOC111012467 [Momordica charantia]

3.2e-98

48.72

Show/hide

Query:  RRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------
        +R+KKKK  S  EVGAC VLPA FADRVDDP ARMGGTSDVTARFRIE SSSGVRDQVSRISAASLDRCLRRASKFVS PGSVL R IDYAAE       
Subjt:  RRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------

Query:  ------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEV------------------------------------------------
              AELD REVLAA EKEEFSAALEAASSTMKDELL+AHSE + LK EV                                                
Subjt:  ------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEV------------------------------------------------

Query:  ----------------------------------------------------------------------------------------------------
                                                                                                            
Subjt:  ----------------------------------------------------------------------------------------------------

Query:  ------------------------------------EAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAK
                                            EAKAELLK+E++R KA LRAAHAITKGLEKEKFQLLKEKDDMLQALE KD  + R   ELKA K
Subjt:  ------------------------------------EAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAK

Query:  ERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEED--------Q
        ERL N  LLE +FRQHPDFDGFAKDFSDAGFKF MKGI +D+P L +DL  LKKRYAE+WASGPNGT GP +LV+KYVRDLDSDYSDL+ED        +
Subjt:  ERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEED--------Q

Query:  VGTTQEG
        VGTTQEG
Subjt:  VGTTQEG

XP_022150343.1 uncharacterized protein LOC111018538 [Momordica charantia]

1.6e-110

Show/hide

Query:  GTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKD
        G   + A+ RIE SSSGVRDQVSRISAASLDRCLRRASKFVS PGSVLQRTIDYAAE             AELD REVLAA EKEEFSAALE ASSTMKD
Subjt:  GTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKD

Query:  ELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFD
        ELL+AHSE + LK EVE++AELLKKEEDRR+AQLRAAHAIT+GLE+EKFQLLKEKDDMLQALEAKD+EL+ AT EL+ AKERL N VLLEE+FRQHPDFD
Subjt:  ELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFD

Query:  GFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEEDQVGTTQEGAQ-TGS
        GFAKDFSDAGFKF MKGI SDMPDL IDLS LK+RYAE+WASGP GTPGPQALV++YVRDLDSDYSD EEDQVG+TQEGA  TGS
Subjt:  GFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEEDQVGTTQEGAQ-TGS

XP_022156120.1 uncharacterized protein LOC111023084 [Momordica charantia]

1.6e-94

100

Show/hide

Query:  MLIFKLERIDGFVEATAVLAGISTRCHFKLSAAMFSLYVYHHSLRCNIALQIMPPFFTTYNFFDQNPNSSFYIENFFRALLNFQRSGCSSLSFALDHHLP
        MLIFKLERIDGFVEATAVLAGISTRCHFKLSAAMFSLYVYHHSLRCNIALQIMPPFFTTYNFFDQNPNSSFYIENFFRALLNFQRSGCSSLSFALDHHLP
Subjt:  MLIFKLERIDGFVEATAVLAGISTRCHFKLSAAMFSLYVYHHSLRCNIALQIMPPFFTTYNFFDQNPNSSFYIENFFRALLNFQRSGCSSLSFALDHHLP

Query:  RVELISEGSCLTQRVIELPLSPAEEKASTEIDYSVFVSIDLQDFKPVATMFDRAPYVRVTLSHSGVRFAYEDEEITLTAQ
        RVELISEGSCLTQRVIELPLSPAEEKASTEIDYSVFVSIDLQDFKPVATMFDRAPYVRVTLSHSGVRFAYEDEEITLTAQ
Subjt:  RVELISEGSCLTQRVIELPLSPAEEKASTEIDYSVFVSIDLQDFKPVATMFDRAPYVRVTLSHSGVRFAYEDEEITLTAQ

XP_022159063.1 uncharacterized protein LOC111025502, partial [Momordica charantia]

1.3e-115

77.74

Show/hide

Query:  DEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMFEYGLRLRLHPFVQE
        + DLARRLES+LEEIEN R SDDGEDSDASTSGQGLEYPSRIPEHYLG LR+GFAIPENILLR+PEEGERADNPPEGWVTLY KMFEYGLRL LHPFVQE
Subjt:  DEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMFEYGLRLRLHPFVQE

Query:  FLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESG
        FLFRT LAPAQVAPNGWGVIFALAILFWLRARD+EEAEL DVDQLLACFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWVRKWFYASGEWLAKDESG
Subjt:  FLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESG

Query:  RSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGD--RQAAARVRVVRDYNPAVRPIETSRPNSEL
        RSFFDVPTR  +   L SI P      +S     + L+        GR +G            + DYNPAVRPIE+SRPNSEL
Subjt:  RSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGD--RQAAARVRVVRDYNPAVRPIETSRPNSEL

XP_022159252.1 uncharacterized protein LOC111025665 [Momordica charantia]

1.7e-136

56.4

Show/hide

Query:  MCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGDRQAAARV---
        MCARKG  GIVKGPTSIKGWV KWF+ASGEWLAKDESGR+FFDVPTR   + +   + P  ++A    ++H            +     DR+    V   
Subjt:  MCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGDRQAAARV---

Query:  ----RVVRDYNPAVRPIETSRPNSELDL--------------------------RVTASLRRSNPSDRAG--------VFWRSFAG-----EALRDQTEA
              + DYNP VR IE SRPNSEL +                           VT ++ R+     +G        V     +G     +  R+++EA
Subjt:  ----RVVRDYNPAVRPIETSRPNSELDL--------------------------RVTASLRRSNPSDRAG--------VFWRSFAG-----EALRDQTEA

Query:  VDVSPLGEEVGEAAPLKRRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSV
        +DVSPL E  GE +PL+RR+KKKKT+S  E GA G LP S AD VDDPEARM GTS+V  RF +E SSSGV+DQVSRISA  LDR LRRASKFVSDPGSV
Subjt:  VDVSPLGEEVGEAAPLKRRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSV

Query:  LQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKE
        LQRTID  AE             AELD RE LAA E+E   AALEAA +T+K ELL+A  E DIL+ EV+AK +LLKKE ++ KA LRAAHAITKGLEKE
Subjt:  LQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKE

Query:  KFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGT
        KFQLLKEKDD+ Q LE KD  + R TTELK  KERL N  LLEESFRQHPDFDGFAKDFSDAGFKF MKGI +DMP L IDL+ LKK+Y+E+WASGPNGT
Subjt:  KFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGT

Query:  PGPQALVNKYVRDLDSDYSDLEED--------QVGTTQE
        P PQ+LV+KYVR+LDSDYSD+EE+        +VGTTQE
Subjt:  PGPQALVNKYVRDLDSDYSDLEED--------QVGTTQE

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CLV1 uncharacterized protein LOC111012467

1.5e-98

48.72

Show/hide

Query:  RRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------
        +R+KKKK  S  EVGAC VLPA FADRVDDP ARMGGTSDVTARFRIE SSSGVRDQVSRISAASLDRCLRRASKFVS PGSVL R IDYAAE       
Subjt:  RRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------

Query:  ------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEV------------------------------------------------
              AELD REVLAA EKEEFSAALEAASSTMKDELL+AHSE + LK EV                                                
Subjt:  ------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEV------------------------------------------------

Query:  ----------------------------------------------------------------------------------------------------
                                                                                                            
Subjt:  ----------------------------------------------------------------------------------------------------

Query:  ------------------------------------EAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAK
                                            EAKAELLK+E++R KA LRAAHAITKGLEKEKFQLLKEKDDMLQALE KD  + R   ELKA K
Subjt:  ------------------------------------EAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAK

Query:  ERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEED--------Q
        ERL N  LLE +FRQHPDFDGFAKDFSDAGFKF MKGI +D+P L +DL  LKKRYAE+WASGPNGT GP +LV+KYVRDLDSDYSDL+ED        +
Subjt:  ERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEED--------Q

Query:  VGTTQEG
        VGTTQEG
Subjt:  VGTTQEG

A0A6J1D971 uncharacterized protein LOC111018538

7.9e-111

Show/hide

Query:  GTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKD
        G   + A+ RIE SSSGVRDQVSRISAASLDRCLRRASKFVS PGSVLQRTIDYAAE             AELD REVLAA EKEEFSAALE ASSTMKD
Subjt:  GTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKD

Query:  ELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFD
        ELL+AHSE + LK EVE++AELLKKEEDRR+AQLRAAHAIT+GLE+EKFQLLKEKDDMLQALEAKD+EL+ AT EL+ AKERL N VLLEE+FRQHPDFD
Subjt:  ELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFD

Query:  GFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEEDQVGTTQEGAQ-TGS
        GFAKDFSDAGFKF MKGI SDMPDL IDLS LK+RYAE+WASGP GTPGPQALV++YVRDLDSDYSD EEDQVG+TQEGA  TGS
Subjt:  GFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEEDQVGTTQEGAQ-TGS

A0A6J1DTY7 uncharacterized protein LOC111023084

8.0e-95

100

Show/hide

Query:  MLIFKLERIDGFVEATAVLAGISTRCHFKLSAAMFSLYVYHHSLRCNIALQIMPPFFTTYNFFDQNPNSSFYIENFFRALLNFQRSGCSSLSFALDHHLP
        MLIFKLERIDGFVEATAVLAGISTRCHFKLSAAMFSLYVYHHSLRCNIALQIMPPFFTTYNFFDQNPNSSFYIENFFRALLNFQRSGCSSLSFALDHHLP
Subjt:  MLIFKLERIDGFVEATAVLAGISTRCHFKLSAAMFSLYVYHHSLRCNIALQIMPPFFTTYNFFDQNPNSSFYIENFFRALLNFQRSGCSSLSFALDHHLP

Query:  RVELISEGSCLTQRVIELPLSPAEEKASTEIDYSVFVSIDLQDFKPVATMFDRAPYVRVTLSHSGVRFAYEDEEITLTAQ
        RVELISEGSCLTQRVIELPLSPAEEKASTEIDYSVFVSIDLQDFKPVATMFDRAPYVRVTLSHSGVRFAYEDEEITLTAQ
Subjt:  RVELISEGSCLTQRVIELPLSPAEEKASTEIDYSVFVSIDLQDFKPVATMFDRAPYVRVTLSHSGVRFAYEDEEITLTAQ

A0A6J1DXS5 uncharacterized protein LOC111025502

6.3e-116

77.74

Show/hide

Query:  DEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMFEYGLRLRLHPFVQE
        + DLARRLES+LEEIEN R SDDGEDSDASTSGQGLEYPSRIPEHYLG LR+GFAIPENILLR+PEEGERADNPPEGWVTLY KMFEYGLRL LHPFVQE
Subjt:  DEDLARRLESELEEIENFRFSDDGEDSDASTSGQGLEYPSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMFEYGLRLRLHPFVQE

Query:  FLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESG
        FLFRT LAPAQVAPNGWGVIFALAILFWLRARD+EEAEL DVDQLLACFEAKRIAKKPGR+YMCARKGA GIVKGPTSIKGWVRKWFYASGEWLAKDESG
Subjt:  FLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESG

Query:  RSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGD--RQAAARVRVVRDYNPAVRPIETSRPNSEL
        RSFFDVPTR  +   L SI P      +S     + L+        GR +G            + DYNPAVRPIE+SRPNSEL
Subjt:  RSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGD--RQAAARVRVVRDYNPAVRPIETSRPNSEL

A0A6J1DZB3 uncharacterized protein LOC111025665

8.4e-137

56.4

Show/hide

Query:  MCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGDRQAAARV---
        MCARKG  GIVKGPTSIKGWV KWF+ASGEWLAKDESGR+FFDVPTR   + +   + P  ++A    ++H            +     DR+    V   
Subjt:  MCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQEGRNLGDRQAAARV---

Query:  ----RVVRDYNPAVRPIETSRPNSELDL--------------------------RVTASLRRSNPSDRAG--------VFWRSFAG-----EALRDQTEA
              + DYNP VR IE SRPNSEL +                           VT ++ R+     +G        V     +G     +  R+++EA
Subjt:  ----RVVRDYNPAVRPIETSRPNSELDL--------------------------RVTASLRRSNPSDRAG--------VFWRSFAG-----EALRDQTEA

Query:  VDVSPLGEEVGEAAPLKRRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSV
        +DVSPL E  GE +PL+RR+KKKKT+S  E GA G LP S AD VDDPEARM GTS+V  RF +E SSSGV+DQVSRISA  LDR LRRASKFVSDPGSV
Subjt:  VDVSPLGEEVGEAAPLKRRKKKKKTTSPLEVGACGVLPASFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSV

Query:  LQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKE
        LQRTID  AE             AELD RE LAA E+E   AALEAA +T+K ELL+A  E DIL+ EV+AK +LLKKE ++ KA LRAAHAITKGLEKE
Subjt:  LQRTIDYAAE-------------AELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEADILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKE

Query:  KFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGT
        KFQLLKEKDD+ Q LE KD  + R TTELK  KERL N  LLEESFRQHPDFDGFAKDFSDAGFKF MKGI +DMP L IDL+ LKK+Y+E+WASGPNGT
Subjt:  KFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGITSDMPDLHIDLSSLKKRYAEQWASGPNGT

Query:  PGPQALVNKYVRDLDSDYSDLEED--------QVGTTQE
        P PQ+LV+KYVR+LDSDYSD+EE+        +VGTTQE
Subjt:  PGPQALVNKYVRDLDSDYSDLEED--------QVGTTQE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G32010.1 myosin heavy chain-related

4.7e-07

23.68

Show/hide

Query:  RLESELEEIENFRFSDDGEDSDASTSGQGLEY------PSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMF-EYGLRLRLHPFVQ
        R+ ++ +   N    D+ E +D + SG+  +       P+      +G       +P  + +RIP + +R  + PEG++ L+   F E GLR  +  F+ 
Subjt:  RLESELEEIENFRFSDDGEDSDASTSGQGLEY------PSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMF-EYGLRLRLHPFVQ

Query:  EFLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYA
         F     +A +Q+       I   A L  L AR       L V+ +       ++  K G++Y+ + +G + +  GP+  + W+  +FYA
Subjt:  EFLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYA

AT2G15420.1 myosin heavy chain-related

1.8e-06

32.09

Show/hide

Query:  PENILLRIPEEGERADNPPEGWVTLYLKMF-EYGLRLRLHPFVQEFLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIA
        P  I L  P+  +R   PPEG++ LY   F   GL   L  F+ E+  R  +A +Q+          LAIL        E    +D D         R+ 
Subjt:  PENILLRIPEEGERADNPPEGWVTLYLKMF-EYGLRLRLHPFVQEFLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIA

Query:  KKPGRYYMCARKGAEGIVKGPTS-IKGWVRKWFY
        + PG YY  A K    IV G  S I GW R++F+
Subjt:  KKPGRYYMCARKGAEGIVKGPTS-IKGWVRKWFY

AT5G38190.1 INVOLVED IN: biological_process unknown

4.0e-06

24.58

Show/hide

Query:  RFSDD-GEDSDASTSGQGLEY------PSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMF-EYGLRLRLHPFVQEFLFRTWLAPA
        R++DD  E +D + SG+  +       P+      +G       +P  + +RIP + +R  + PEG++ L+   F E GLR  +  F+  F     +A +
Subjt:  RFSDD-GEDSDASTSGQGLEY------PSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMF-EYGLRLRLHPFVQEFLFRTWLAPA

Query:  QVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYA
        Q+       I   A L  L AR       L V+ +       ++  K G++Y+ + +G + +   P+  + W+  +FYA
Subjt:  QVAPNGWGVIFALAILFWLRARDNEEAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYA

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTGATCTTCAAGCTCGAGCGGATAGACGGGTTCGTGGAGGCGACGGCAGTGCTGGCCGGAATATCGACTCGATGCCATTTCAAGTTGTCGGCGGCGATGTTCTCCCT
GTACGTGTACCACCATTCCCTCCGGTGCAACATAGCCCTCCAAATAATGCCTCCCTTCTTCACCACATACAATTTCTTCGACCAGAACCCCAACTCCTCATTCTACATCG
AAAACTTCTTCCGCGCTCTCCTCAACTTTCAGCGCAGCGGATGCTCTTCGCTGAGCTTCGCCCTCGACCACCACCTCCCCCGCGTGGAGCTGATCTCAGAAGGATCTTGC
CTCACGCAGCGCGTGATTGAATTGCCCCTCTCTCCTGCAGAGGAGAAGGCCTCCACAGAAATCGACTACTCAGTCTTTGTGTCCATTGATTTGCAAGACTTCAAGCCCGT
GGCAACCATGTTTGATCGCGCTCCTTATGTTCGCGTTACTTTGTCGCATTCGGGCGTGAGGTTTGCTTATGAAGACGAGGAGATTACTCTCACCGCACAGATGTGCCACA
CCAAGGAAAAACAGCATGGGTTGGATAGTGTTTATGCAAGAATATGCACAACAGTGTTTATTCTGATCGCAGCTCGAACTCGGTCTCCGGACCGATCTGAACACTTGGGC
GGACCTGCACAAAAAGGCGTACACTCCAACGATCAAGTCAGTATAGCTGTCCTCCACGTGTCCAGGGTATTTTCTCCCCCAAACATCGGCCCCCTCTCTGTCCGGTTCGA
TCTCGACCTGGCAGAGAAGTTCATTCGATTCGCTTCGGACACGTGGCGACTTCCTATTCGTGGAAAAATACAACCGTTGCGGTCATACCTTACGCTTCCTGAATTCTTGG
AGTTCGATCTGAAGGCAGCTCGAACCCTTGGATCCGATGAGGATTTAGCTCGTAGGTTAGAGTCCGAGCTCGAGGAGATAGAAAACTTTAGGTTCTCCGACGATGGGGAG
GATAGTGATGCTTCCACCTCGGGTCAGGGTTTGGAATACCCTTCTAGGATACCCGAGCACTACCTCGGTCCCCTTCGTAAGGGGTTCGCTATCCCTGAAAACATCCTCCT
TAGGATTCCGGAGGAGGGGGAGAGAGCTGACAATCCTCCAGAGGGATGGGTCACTCTCTACCTCAAAATGTTTGAGTACGGCCTCAGACTTCGCCTTCACCCTTTCGTAC
AAGAGTTTCTTTTCCGAACTTGGCTGGCTCCGGCTCAAGTGGCCCCCAATGGATGGGGTGTCATTTTTGCTTTGGCCATCCTTTTTTGGTTACGAGCTCGGGACAATGAA
GAGGCCGAACTATTAGATGTTGATCAGCTCCTCGCGTGCTTCGAAGCGAAAAGGATAGCTAAGAAGCCTGGTCGGTACTATATGTGTGCAAGAAAAGGCGCAGAAGGTAT
AGTTAAGGGGCCGACCTCCATCAAAGGATGGGTGAGGAAGTGGTTCTACGCTTCTGGGGAATGGCTTGCAAAGGACGAGTCAGGTCGTTCCTTCTTTGACGTTCCCACTA
GGTCTAACTCGGATTTTATCTTGTGCAGTATCAATCCGGCCAGTTCCCGAGCTTACTCAAGCCTCATTCGACACGCTGAAATATTACAAGGAGCACTTTCCGAGGGGCAG
GAAGGTCGGAACCTTGGTGACCGACAAGCTGCTGCTCGAGTCCGGGTTGTTAGAGATTACAACCCCGCAGTTCGTCCCATTGAAACCTCAAGGCCGAACTCCGAACTAGA
TTTGCGAGTAACGGCCAGCCTCAGAAGATCCAACCCGAGTGATCGAGCTGGAGTCTTTTGGAGGTCCTTCGCGGGAGAAGCGCTAAGAGATCAGACCGAGGCGGTGGACG
TCTCGCCCTTGGGTGAGGAGGTGGGGGAGGCGGCCCCTCTGAAGCGGAGGAAGAAGAAGAAGAAAACCACCTCCCCCTTGGAGGTCGGAGCATGTGGGGTCCTGCCCGCG
AGCTTCGCAGACCGGGTGGACGATCCTGAAGCCAGGATGGGCGGGACGTCCGACGTGACAGCACGGTTCAGAATTGAACTATCAAGTTCTGGGGTGAGGGACCAGGTGTC
CCGCATATCAGCTGCAAGTTTGGACCGCTGCCTCAGAAGAGCGTCCAAATTTGTAAGTGACCCGGGGTCCGTTCTGCAGAGGACCATCGACTACGCCGCTGAGGCCGAGC
TGGATAGGAGGGAAGTTCTGGCAGCGATGGAGAAGGAGGAATTCTCTGCTGCCTTGGAGGCTGCTTCCTCCACCATGAAGGATGAGCTGCTAAGGGCTCACTCTGAGGCG
GACATTCTGAAGGTCGAGGTGGAGGCTAAGGCCGAGCTGTTGAAGAAAGAAGAGGACAGACGCAAGGCCCAGCTCCGAGCCGCCCATGCCATCACCAAGGGCCTGGAGAA
GGAGAAGTTCCAACTCCTCAAGGAGAAGGACGACATGCTTCAGGCGCTTGAAGCGAAGGACGAGGAACTGAAGCGTGCGACTACCGAGCTAAAGGCGGCGAAGGAGCGTC
TCGGCAACGAAGTCCTGCTGGAGGAGTCTTTCAGGCAACATCCTGACTTCGATGGATTTGCCAAAGACTTTTCTGACGCGGGCTTCAAGTTCTTCATGAAGGGCATTACT
TCCGACATGCCCGACCTTCATATCGATCTCAGTAGTCTGAAGAAGAGATATGCCGAGCAGTGGGCTTCTGGGCCTAACGGTACCCCTGGCCCCCAAGCGTTGGTGAATAA
GTATGTCAGAGATCTGGACTCTGACTACTCCGACCTCGAAGAGGACCAGGTCGGCACCACTCAAGAGGGCGCTCAAACAGGCTCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MLIFKLERIDGFVEATAVLAGISTRCHFKLSAAMFSLYVYHHSLRCNIALQIMPPFFTTYNFFDQNPNSSFYIENFFRALLNFQRSGCSSLSFALDHHLPRVELISEGSC
LTQRVIELPLSPAEEKASTEIDYSVFVSIDLQDFKPVATMFDRAPYVRVTLSHSGVRFAYEDEEITLTAQMCHTKEKQHGLDSVYARICTTVFILIAARTRSPDRSEHLG
GPAQKGVHSNDQVSIAVLHVSRVFSPPNIGPLSVRFDLDLAEKFIRFASDTWRLPIRGKIQPLRSYLTLPEFLEFDLKAARTLGSDEDLARRLESELEEIENFRFSDDGE
DSDASTSGQGLEYPSRIPEHYLGPLRKGFAIPENILLRIPEEGERADNPPEGWVTLYLKMFEYGLRLRLHPFVQEFLFRTWLAPAQVAPNGWGVIFALAILFWLRARDNE
EAELLDVDQLLACFEAKRIAKKPGRYYMCARKGAEGIVKGPTSIKGWVRKWFYASGEWLAKDESGRSFFDVPTRSNSDFILCSINPASSRAYSSLIRHAEILQGALSEGQ
EGRNLGDRQAAARVRVVRDYNPAVRPIETSRPNSELDLRVTASLRRSNPSDRAGVFWRSFAGEALRDQTEAVDVSPLGEEVGEAAPLKRRKKKKKTTSPLEVGACGVLPA
SFADRVDDPEARMGGTSDVTARFRIELSSSGVRDQVSRISAASLDRCLRRASKFVSDPGSVLQRTIDYAAEAELDRREVLAAMEKEEFSAALEAASSTMKDELLRAHSEA
DILKVEVEAKAELLKKEEDRRKAQLRAAHAITKGLEKEKFQLLKEKDDMLQALEAKDEELKRATTELKAAKERLGNEVLLEESFRQHPDFDGFAKDFSDAGFKFFMKGIT
SDMPDLHIDLSSLKKRYAEQWASGPNGTPGPQALVNKYVRDLDSDYSDLEEDQVGTTQEGAQTGS

Moc07g21940 (gene) of Bitter gourd (OHB3-1) v2 genome