CuGenDBv2

Gene ID	Moc01g04400
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Reverse transcriptase
Genome location	chr1:2879338..2893774
RNA-Seq Expression	Moc01g04400
Synteny	Moc01g04400
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0004190 - aspartic-type endopeptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001969 - Aspartic peptidase, active site IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022155341.1 uncharacterized protein LOC111022474 [Momordica charantia]

2.9e-181

73.71

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP
        MAFRRNTRAHNYEDPNPRGE A D NVPP VP GVAPPVPQ AP+GVPQVNPQVALLAEALQVLLDNAN AGGAQ QQPRRAQIQQEEVQFIRDFKRFGP
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP

Query:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV
        PVFN                             +VRGA+FML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPVTVRNEKRAEFLRLTQGSLTV
Subjt:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV

Query:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ
         QYERKFTELSRFGMQYIPTEQLKIDKFID LRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQ                                
Subjt:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ

Query:  TVSPVSPLCPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGFLLSIST
                            QRIPATAATQGGTHRAR+FALTRGDVEH EAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGFL S+ST
Subjt:  TVSPVSPLCPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGFLLSIST

Query:  PLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVS
          GSVL  SQVVKGGQLSFD                    GMDWLAANRANIDCSKKEVSFRLPSGQNF FKGVKAGVPRVVS
Subjt:  PLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVS

XP_022156328.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111023249 [Momordica charantia]

1.3e-197

73.6

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP
        MAFRRNTRAHNYEDPN RGE A DPNV P VPGGV PPVPQAAP+GVPQVNPQVALLAEALQVLL NAN AGGAQ QQPRRAQI Q+EVQFIRDFK FGP
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP

Query:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV
        PVFN                             +VRGAVFML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPV  RNEKR EFLRLTQGSLTV
Subjt:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV

Query:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ
        AQYERKFTELSRFG QY+PTEQLKIDKFID LRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQV+GS+SGVKRKFASFS+SQ SRGH    QRQ
Subjt:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ

Query:  TVSPVSPLCP----------------------------MTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGS
        T  PV P C                             MTGSNTQAL Q+ P   ATQGGT  ARVFALTRGDVEH EAVVTGT+L+LS+PAYALFDSGS
Subjt:  TVSPVSPLCP----------------------------MTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGS

Query:  SHSFIASTFVRHADLELESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFK
        SHSFIASTFVRHADLELES GF LS+STP GSVLV SQVVKGGQLSF                     GMDWLAANRANI+CSKKEVSF L SGQNFTFK
Subjt:  SHSFIASTFVRHADLELESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFK

Query:  GVKAGVPRVVSALKANHLL
        GVKAGVPRVVSALKA++LL
Subjt:  GVKAGVPRVVSALKANHLL

XP_022156992.1 uncharacterized protein LOC111023821 [Momordica charantia]

2.9e-165

69.62

Show/hide

Query:  TMAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFG
        TMAFRRNTRAHNYEDPNPRGE A DPNVP AVPGGVAP VPQAAP+GVPQ                   N AGGAQ QQPRRAQ  QEEVQFIRDFKRFG
Subjt:  TMAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFG

Query:  PPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYY-----FPVT-VRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQYIPTEQ
        PPVFN V               E   AAE+       W R  + L+ Y      F V    NEKRAEFLRLTQGSLTVAQYERKFTELSRF MQYIP EQ
Subjt:  PPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYY-----FPVT-VRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQYIPTEQ

Query:  LKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL--------------
        LKIDKFID L REIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGH   VQRQT  PV P               
Subjt:  LKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL--------------

Query:  --------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGF
                      CPMTG NTQ LGQRIP T A QGGTHRARVFALTRGDV H EAVV GTVLVLSMPAYALFDS SSHSFIASTFVRHADLELESLGF
Subjt:  --------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGF

Query:  LLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL
        LLS+STP GSVLV SQ+VKGGQLSFD                    GMDWLAAN+ANIDCSKKE SFRLPS QNFTFKGVKA VPRVVSALKA+H L
Subjt:  LLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL

XP_022157413.1 uncharacterized protein LOC111024114 [Momordica charantia]

1.6e-203

78.31

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP
        MAFRRNTRAHNY+DPNPRGE A DPNVP  VPG VAPPVPQAAP+GVPQVNPQVALLAEALQVLLDNAN AGGAQ QQPRRAQI Q+EVQFIRDFKRFGP
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP

Query:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV
        PVFN                             +VRGAVFML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPVTVRNEKRAEFLRLTQGSLTV
Subjt:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV

Query:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ
        AQYERKFTELSRFGMQYIPTEQLKIDKFID LR EIKGLLV+KEPTTYAAA+RCALVMDKCLEEPQSQQVMGSSSGVKRKFA FSSSQ SRGH   VQRQ
Subjt:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ

Query:  TVSPVSPLCPMTGSNTQALGQRI-------PATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLG
        T  PV P C    +    LG+RI       PA AA QGGT RARVFALTRGDVEH EAVVTGT+LV+SMPAYALFDSGSSHSFIASTFVRHADLELESLG
Subjt:  TVSPVSPLCPMTGSNTQALGQRI-------PATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLG

Query:  FLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL
        FLLS+STP GSVLV SQVVKGGQLSFD                    GMDWLAANRANI+CSKKEVSFRLPSGQNFTFK VK GVPRVVSALKAN+LL
Subjt:  FLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL

XP_022158750.1 uncharacterized protein LOC111025215 [Momordica charantia]

8.6e-202

77.89

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEV--------QFI
        MAFRRNTRAHNYEDPNPRGE A DPNVPPAVPGGVAPP PQAA +GVPQVNPQVALLAEALQVLLDNAN AGGAQ QQPR AQI QEEV        +++
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEV--------QFI

Query:  RDFKR----FGPPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQY
        R+ +      G     +VRGAVFML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPVTVRNEKR EFLRLTQGSLTVA+YERKFTELSRFGMQY
Subjt:  RDFKR----FGPPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQY

Query:  IPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL---------
        IPT+QLKIDKFID LRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQV+GSSSGVKRKFASFSSSQPSR H   VQRQT  PV P          
Subjt:  IPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL---------

Query:  -------------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLEL
                           CPMTGSNTQALGQRIPATAA QGGTHRARVFALTRGDVE+ EAVVT TVLVLSMPAYALFDSGSSHSFIASTFV HADLEL
Subjt:  -------------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLEL

Query:  ESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANH
        ESLGFLLS+STP GSVLV SQVVKGGQLSFD                    GMDWLAANRANIDCSKK+VSFRLPSGQNFTFKGVKAGVPRVV ALKA+H
Subjt:  ESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANH

Query:  LL
        LL
Subjt:  LL

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DQB9 Reverse transcriptase

6.2e-198

73.6

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP
        MAFRRNTRAHNYEDPN RGE A DPNV P VPGGV PPVPQAAP+GVPQVNPQVALLAEALQVLL NAN AGGAQ QQPRRAQI Q+EVQFIRDFK FGP
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP

Query:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV
        PVFN                             +VRGAVFML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPV  RNEKR EFLRLTQGSLTV
Subjt:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV

Query:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ
        AQYERKFTELSRFG QY+PTEQLKIDKFID LRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQV+GS+SGVKRKFASFS+SQ SRGH    QRQ
Subjt:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ

Query:  TVSPVSPLCP----------------------------MTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGS
        T  PV P C                             MTGSNTQAL Q+ P   ATQGGT  ARVFALTRGDVEH EAVVTGT+L+LS+PAYALFDSGS
Subjt:  TVSPVSPLCP----------------------------MTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGS

Query:  SHSFIASTFVRHADLELESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFK
        SHSFIASTFVRHADLELES GF LS+STP GSVLV SQVVKGGQLSF                     GMDWLAANRANI+CSKKEVSF L SGQNFTFK
Subjt:  SHSFIASTFVRHADLELESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFK

Query:  GVKAGVPRVVSALKANHLL
        GVKAGVPRVVSALKA++LL
Subjt:  GVKAGVPRVVSALKANHLL

A0A6J1DRF5 uncharacterized protein LOC111022474

1.4e-181

73.71

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP
        MAFRRNTRAHNYEDPNPRGE A D NVPP VP GVAPPVPQ AP+GVPQVNPQVALLAEALQVLLDNAN AGGAQ QQPRRAQIQQEEVQFIRDFKRFGP
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP

Query:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV
        PVFN                             +VRGA+FML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPVTVRNEKRAEFLRLTQGSLTV
Subjt:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV

Query:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ
         QYERKFTELSRFGMQYIPTEQLKIDKFID LRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQ                                
Subjt:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ

Query:  TVSPVSPLCPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGFLLSIST
                            QRIPATAATQGGTHRAR+FALTRGDVEH EAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGFL S+ST
Subjt:  TVSPVSPLCPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGFLLSIST

Query:  PLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVS
          GSVL  SQVVKGGQLSFD                    GMDWLAANRANIDCSKKEVSFRLPSGQNF FKGVKAGVPRVVS
Subjt:  PLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVS

A0A6J1DTA8 uncharacterized protein LOC111024114

7.6e-204

78.31

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP
        MAFRRNTRAHNY+DPNPRGE A DPNVP  VPG VAPPVPQAAP+GVPQVNPQVALLAEALQVLLDNAN AGGAQ QQPRRAQI Q+EVQFIRDFKRFGP
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFGP

Query:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV
        PVFN                             +VRGAVFML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPVTVRNEKRAEFLRLTQGSLTV
Subjt:  PVFN-----------------------------RVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTV

Query:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ
        AQYERKFTELSRFGMQYIPTEQLKIDKFID LR EIKGLLV+KEPTTYAAA+RCALVMDKCLEEPQSQQVMGSSSGVKRKFA FSSSQ SRGH   VQRQ
Subjt:  AQYERKFTELSRFGMQYIPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQ

Query:  TVSPVSPLCPMTGSNTQALGQRI-------PATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLG
        T  PV P C    +    LG+RI       PA AA QGGT RARVFALTRGDVEH EAVVTGT+LV+SMPAYALFDSGSSHSFIASTFVRHADLELESLG
Subjt:  TVSPVSPLCPMTGSNTQALGQRI-------PATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLG

Query:  FLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL
        FLLS+STP GSVLV SQVVKGGQLSFD                    GMDWLAANRANI+CSKKEVSFRLPSGQNFTFK VK GVPRVVSALKAN+LL
Subjt:  FLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL

A0A6J1DTE5 uncharacterized protein LOC111023821

1.4e-165

69.62

Show/hide

Query:  TMAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFG
        TMAFRRNTRAHNYEDPNPRGE A DPNVP AVPGGVAP VPQAAP+GVPQ                   N AGGAQ QQPRRAQ  QEEVQFIRDFKRFG
Subjt:  TMAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFIRDFKRFG

Query:  PPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYY-----FPVT-VRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQYIPTEQ
        PPVFN V               E   AAE+       W R  + L+ Y      F V    NEKRAEFLRLTQGSLTVAQYERKFTELSRF MQYIP EQ
Subjt:  PPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYY-----FPVT-VRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQYIPTEQ

Query:  LKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL--------------
        LKIDKFID L REIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGH   VQRQT  PV P               
Subjt:  LKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL--------------

Query:  --------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGF
                      CPMTG NTQ LGQRIP T A QGGTHRARVFALTRGDV H EAVV GTVLVLSMPAYALFDS SSHSFIASTFVRHADLELESLGF
Subjt:  --------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGF

Query:  LLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL
        LLS+STP GSVLV SQ+VKGGQLSFD                    GMDWLAAN+ANIDCSKKE SFRLPS QNFTFKGVKA VPRVVSALKA+H L
Subjt:  LLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANHLL

A0A6J1DWP4 uncharacterized protein LOC111025215

4.2e-202

77.89

Show/hide

Query:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEV--------QFI
        MAFRRNTRAHNYEDPNPRGE A DPNVPPAVPGGVAPP PQAA +GVPQVNPQVALLAEALQVLLDNAN AGGAQ QQPR AQI QEEV        +++
Subjt:  MAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEV--------QFI

Query:  RDFKR----FGPPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQY
        R+ +      G     +VRGAVFML+GEAVNWWESVAAAEDH N PVTWARFKDLL+EYYFPVTVRNEKR EFLRLTQGSLTVA+YERKFTELSRFGMQY
Subjt:  RDFKR----FGPPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQY

Query:  IPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL---------
        IPT+QLKIDKFID LRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQV+GSSSGVKRKFASFSSSQPSR H   VQRQT  PV P          
Subjt:  IPTEQLKIDKFIDSLRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPL---------

Query:  -------------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLEL
                           CPMTGSNTQALGQRIPATAA QGGTHRARVFALTRGDVE+ EAVVT TVLVLSMPAYALFDSGSSHSFIASTFV HADLEL
Subjt:  -------------------CPMTGSNTQALGQRIPATAATQGGTHRARVFALTRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLEL

Query:  ESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANH
        ESLGFLLS+STP GSVLV SQVVKGGQLSFD                    GMDWLAANRANIDCSKK+VSFRLPSGQNFTFKGVKAGVPRVV ALKA+H
Subjt:  ESLGFLLSISTPLGSVLVNSQVVKGGQLSFD--------------------GMDWLAANRANIDCSKKEVSFRLPSGQNFTFKGVKAGVPRVVSALKANH

Query:  LL
        LL
Subjt:  LL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCCAACAGCAAAGATTCACGGCGGCAGCAGACCCGCGCGACCCTGACAATGACTCCACGGCGGCGACGATCTCACAACTCTGCGGTAATGGCAAGAACATATGAGGC
AAGTGACACACTTGAGTGTGCCATGGGGACCGTGTCGCAGGGGAATGCCGGGGCGAAGAGGTGCCGAATCCGGATTTCGAATCCTGGGTCTGGGGCGTTACAGTTGAATA
TGCCTCCACGTAGAAGAAGGTCTGTGAGACGGGGTGGGCTAAATAGAGATGTTGTCCCTGATACAGTAGAGCCGACGGAGAAGAACCAAACTTCAGCCCACACATCAGCC
TTGATCACCACCACGACCCATATACTCCGTGATTTGGAACATGCGGTGGTTGCCGTGGGTGAGGTTACTGCACATTTGGGCCAGTGGGCTGATACGTCACTAGTTGGGTA
CCGAGGCTCTGGGTACAAAGGTCGGGGATCGATACGTCAACTCTGGACAAAGATGAGTGTCGAGGCTTCGAATAAATGGTCGGGGGTCGGTGCAATGAATCTTAGAGGGA
AGGCAAGTATTGGGGCCTCGTGGGAAAAAGACAAGGACCAATATCCGGCGGCTCCTTTTTCTCCGGCGAAGCGGCACAGCAGTAGCAGTGAGCCCCACGCCGGCGTCCTC
CCGCAGCAGCTCGTGGCGGCGCACGAACGACGGTGTCCACTGCGGCCGCGTTCCTCAGATCCGCGACGACCCACGCGATTTTGGCTCCATCTGAACGGGTCTGTTGGAGT
TCGATGGTCGGTGACAAGCTCGGGTCGGATCCGGCAGTGCAACAGCATCTCCACGGCGGCGCGACGGTTTCTGCACCACCCTGCAGCCCTACTCGCGGCGGTGTGCGACG
AGCGGCGTTCCTTCACGGCGGCGGACGACGCACAGGTCAACTCCACGGCGGTCCCGACGACCTGCTGCTACAACCTCAACCCCGACGACGTGCGCAACTCCCGACGGCTG
CCTCCGACGAACAGCAGCTCCGGCGACTCGTTCTTTTTGCAATCCGACGCGAACAGTAGCAGATTCGCGAAGACTGTAACTCTTGTTTATGTTGTTTTGTATGCCTGGTT
AGTGTTGAATGTCCGTCGGCGAAGGATGTTTATATTGTGGAAGCACGCTGAATTGTGTTGGTCAGCTGAGAGATGCGTTGAGATCATACTAGTGGTGGTGTTGTTGATGG
GTGTTGTGATGGTTGGTGCTATTAGGGAAGTAGTACTGAAATCTTGGTTGGAGGCTAGAAATGTTATGTGGAATTATGAAAGTTATGAAGTGAATGGGTCGTCAGTGTAC
GGTCCTTGTCAGTCTCCCCATCATCACCAGATACGTTTCCGAGTTCTGGATACAATGGCTTTTCGACGGAACACGAGAGCTCACAACTACGAGGATCCGAACCCTAGGGG
TGAGGAAGCAACGGATCCAAATGTTCCCCCGGCAGTTCCTGGAGGGGTTGCACCCCCGGTCCCGCAGGCAGCACCTGAAGGAGTTCCCCAGGTGAATCCCCAGGTGGCGT
TACTAGCTGAGGCATTGCAAGTATTGCTGGATAATGCGAATGAAGCCGGTGGGGCTCAGGCGCAGCAGCCTCGCCGGGCACAGATTCAACAAGAGGAGGTCCAGTTTATC
AGGGATTTCAAACGCTTCGGACCACCCGTTTTTAACAGAGTCCGGGGAGCAGTGTTTATGCTTCAAGGAGAAGCAGTAAACTGGTGGGAGTCGGTGGCGGCAGCGGAGGA
TCACGGCAACGCACCCGTCACATGGGCGAGGTTTAAGGACCTACTCCATGAGTACTATTTCCCCGTGACTGTCAGGAACGAAAAACGGGCAGAGTTTCTCCGTCTCACTC
AAGGGAGCCTAACTGTGGCCCAATACGAGAGGAAGTTCACTGAGTTGTCCCGTTTTGGAATGCAATATATTCCTACTGAACAATTAAAGATTGACAAGTTCATTGACAGT
TTGCGTAGGGAGATCAAGGGGCTACTTGTTCTTAAGGAGCCAACTACTTATGCAGCAGCAGTCAGGTGTGCGTTGGTTATGGACAAATGTCTCGAGGAGCCTCAATCTCA
ACAGGTGATGGGCTCTAGCTCGGGGGTCAAGAGGAAATTTGCATCGTTCTCCTCCAGTCAACCCTCGAGGGGACACCTGCAGCTTGTGCAAAGGCAGACTGTTTCTCCGG
TGTCCCCTCTTTGTCCGATGACCGGCTCGAATACCCAAGCTTTAGGCCAGAGGATCCCTGCGACGGCAGCAACTCAAGGTGGAACCCATAGGGCGCGCGTCTTCGCTCTT
ACGAGGGGGGATGTTGAGCATGGCGAGGCGGTGGTCACAGGGACTGTTTTAGTACTCAGTATGCCTGCTTACGCTTTATTTGACTCGGGGTCTAGTCACTCTTTCATTGC
TTCTACCTTTGTTCGGCATGCGGACCTAGAGCTAGAATCGTTAGGCTTTTTGTTGTCGATATCCACTCCGTTAGGATCTGTGTTGGTCAATAGTCAAGTGGTGAAAGGAG
GCCAGCTCTCTTTCGATGGCATGGATTGGTTAGCTGCTAACCGGGCTAATATCGATTGCTCGAAGAAGGAAGTTAGCTTTCGCTTGCCCTCCGGACAAAACTTTACCTTT
AAAGGAGTCAAGGCCGGGGTCCCGAGGGTGGTGTCGGCATTGAAGGCCAACCATCTGCTCTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSNSKDSRRQQTRATLTMTPRRRRSHNSAVMARTYEASDTLECAMGTVSQGNAGAKRCRIRISNPGSGALQLNMPPRRRRSVRRGGLNRDVVPDTVEPTEKNQTSAHTSA
LITTTTHILRDLEHAVVAVGEVTAHLGQWADTSLVGYRGSGYKGRGSIRQLWTKMSVEASNKWSGVGAMNLRGKASIGASWEKDKDQYPAAPFSPAKRHSSSSEPHAGVL
PQQLVAAHERRCPLRPRSSDPRRPTRFWLHLNGSVGVRWSVTSSGRIRQCNSISTAARRFLHHPAALLAAVCDERRSFTAADDAQVNSTAVPTTCCYNLNPDDVRNSRRL
PPTNSSSGDSFFLQSDANSSRFAKTVTLVYVVLYAWLVLNVRRRRMFILWKHAELCWSAERCVEIILVVVLLMGVVMVGAIREVVLKSWLEARNVMWNYESYEVNGSSVY
GPCQSPHHHQIRFRVLDTMAFRRNTRAHNYEDPNPRGEEATDPNVPPAVPGGVAPPVPQAAPEGVPQVNPQVALLAEALQVLLDNANEAGGAQAQQPRRAQIQQEEVQFI
RDFKRFGPPVFNRVRGAVFMLQGEAVNWWESVAAAEDHGNAPVTWARFKDLLHEYYFPVTVRNEKRAEFLRLTQGSLTVAQYERKFTELSRFGMQYIPTEQLKIDKFIDS
LRREIKGLLVLKEPTTYAAAVRCALVMDKCLEEPQSQQVMGSSSGVKRKFASFSSSQPSRGHLQLVQRQTVSPVSPLCPMTGSNTQALGQRIPATAATQGGTHRARVFAL
TRGDVEHGEAVVTGTVLVLSMPAYALFDSGSSHSFIASTFVRHADLELESLGFLLSISTPLGSVLVNSQVVKGGQLSFDGMDWLAANRANIDCSKKEVSFRLPSGQNFTF
KGVKAGVPRVVSALKANHLL

Moc01g04400 (gene) of Bitter gourd (OHB3-1) v2 genome