CuGenDBv2

Gene ID	Moc04g00410
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	LINE-1 retrotransposable element ORF2 protein
Genome location	chr4:280870..293717
RNA-Seq Expression	Moc04g00410
Synteny	Moc04g00410
Gene Ontology terms	GO:0003824 - catalytic activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

RVW48032.1 hypothetical protein CK203_089187 [Vitis vinifera]

1.2e-05

45.16

Show/hide

Query:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK
        TSDH+PI++ET  FKW P   +FKNMWL H S  +    WW+E    G  G    R L   K
Subjt:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK

RVW70180.1 hypothetical protein CK203_057138 [Vitis vinifera]

2.1e-05

36.71

Show/hide

Query:  GGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK
        G L  +G + ++ L   TSDH+PI+++T  FKW P   +F+NMWL H S  ++   WW+     G  G    R L   K
Subjt:  GGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK

RVW90389.1 LINE-1 retrotransposable element ORF2 protein [Vitis vinifera]

1.6e-05

44.44

Show/hide

Query:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISKR
        TSDH+PI++ET  FKW P   +F+NMWL H S  ++   WW+E    G  G    R L   KR
Subjt:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISKR

RVW93496.1 hypothetical protein CK203_035058 [Vitis vinifera]

1.6e-05

40.74

Show/hide

Query:  LKGGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK
        L GG +    IL+  L   TSDH PI +ET S KW P   +F+NMWLLH    +    WW+E    G  G    R L   K
Subjt:  LKGGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK

XP_022147852.1 uncharacterized protein LOC111016689 [Momordica charantia]

6.4e-31

34.93

Show/hide

Query:  EERKCWQKCKVRWLIEGDVRTPSSSIVCST--QEERGNRDPWFNRGTLWVTLTLSLGHFPGLWARIHIKITFQVLEQVEIPDSFSFVLCICNFFNSNFLG
        EERKCWQKCKVRWLIEGD  T     V ++  + +R NRDPWFNRG LWVTLTLSLG       +I +K T  +L       +   ++         FL 
Subjt:  EERKCWQKCKVRWLIEGDVRTPSSSIVCST--QEERGNRDPWFNRGTLWVTLTLSLGHFPGLWARIHIKITFQVLEQVEIPDSFSFVLCICNFFNSNFLG

Query:  LQRGIQSPTLAREGIDPWYIRDENYLHWLFLESWIRARSRYAREWTDGHFPSLRCDQNLNLDHLSSTLTSGVLQLVFFCLVAFVICHFLCLRVSHDHLSS
          RG  S +L             NY   L    W R   +Y  +W  G FP L         HLS+                                  
Subjt:  LQRGIQSPTLAREGIDPWYIRDENYLHWLFLESWIRARSRYAREWTDGHFPSLRCDQNLNLDHLSSTLTSGVLQLVFFCLVAFVICHFLCLRVSHDHLSS

Query:  TPTSGDLQLIFLCLVVRSKSKSRSLIKYKWRSPIHFPVLLSLSMGEDTYQVLQQVERSNSTSFVLWSLSLSMGEVKVQ---IMITYQELEQVEISNL-FS
           SGD             S S S + +           LSLSM ED YQ+LQQVE            SLS  E+K Q   I ITYQ L QV+++ L + 
Subjt:  TPTSGDLQLIFLCLVVRSKSKSRSLIKYKWRSPIHFPVLLSLSMGEDTYQVLQQVERSNSTSFVLWSLSLSMGEVKVQ---IMITYQELEQVEISNL-FS

Query:  FVI--WPPSLSTSQNPNQDHLSSTSGD-LQFIFLCPVVNFLSMGNDTYLDHLSSTPTSGDLQLIFLCLVVTFLVYGSLSLPMGEDTYQDHLSSHFPCSRV
        F +  +P S   S++  + +LSST+ + L+ IFLC  V  +   +  +   LS +     +Q I  C  +      S SL M ED YQDHLSSH  C +V
Subjt:  FVI--WPPSLSTSQNPNQDHLSSTSGD-LQFIFLCPVVNFLSMGNDTYLDHLSSTPTSGDLQLIFLCLVVTFLVYGSLSLPMGEDTYQDHLSSHFPCSRV

Query:  RSKSKIKTNLSS-TTSEG
        RSK K + +LSS TTSEG
Subjt:  RSKSKIKTNLSS-TTSEG

TrEMBL top hits

e value

%identity

Alignment

A0A438EK20 Uncharacterized protein

5.9e-06

45.16

Show/hide

Query:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK
        TSDH+PI++ET  FKW P   +FKNMWL H S  +    WW+E    G  G    R L   K
Subjt:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK

A0A438EU27 Transposon TX1 uncharacterized 149 kDa protein

1.0e-05

38.27

Show/hide

Query:  LKGGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK
        L G L  +G  L   L   TSDH+PI+++T  FKW P + +F+NMWL H S  ++   WW+     G  G    R L   K
Subjt:  LKGGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK

A0A438I0Z7 LINE-1 retrotransposable element ORF2 protein

7.6e-06

44.44

Show/hide

Query:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISKR
        TSDH+PI++ET  FKW P   +F+NMWL H S  ++   WW+E    G  G    R L   KR
Subjt:  TSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISKR

A0A438I9V4 Uncharacterized protein

7.6e-06

40.74

Show/hide

Query:  LKGGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK
        L GG +    IL+  L   TSDH PI +ET S KW P   +F+NMWLLH    +    WW+E    G  G    R L   K
Subjt:  LKGGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSSLKDLEGWWKEINPWGCLGLPLSRILNISK

A0A6J1D3H5 uncharacterized protein LOC111016689

3.1e-31

34.93

Show/hide

Query:  EERKCWQKCKVRWLIEGDVRTPSSSIVCST--QEERGNRDPWFNRGTLWVTLTLSLGHFPGLWARIHIKITFQVLEQVEIPDSFSFVLCICNFFNSNFLG
        EERKCWQKCKVRWLIEGD  T     V ++  + +R NRDPWFNRG LWVTLTLSLG       +I +K T  +L       +   ++         FL 
Subjt:  EERKCWQKCKVRWLIEGDVRTPSSSIVCST--QEERGNRDPWFNRGTLWVTLTLSLGHFPGLWARIHIKITFQVLEQVEIPDSFSFVLCICNFFNSNFLG

Query:  LQRGIQSPTLAREGIDPWYIRDENYLHWLFLESWIRARSRYAREWTDGHFPSLRCDQNLNLDHLSSTLTSGVLQLVFFCLVAFVICHFLCLRVSHDHLSS
          RG  S +L             NY   L    W R   +Y  +W  G FP L         HLS+                                  
Subjt:  LQRGIQSPTLAREGIDPWYIRDENYLHWLFLESWIRARSRYAREWTDGHFPSLRCDQNLNLDHLSSTLTSGVLQLVFFCLVAFVICHFLCLRVSHDHLSS

Query:  TPTSGDLQLIFLCLVVRSKSKSRSLIKYKWRSPIHFPVLLSLSMGEDTYQVLQQVERSNSTSFVLWSLSLSMGEVKVQ---IMITYQELEQVEISNL-FS
           SGD             S S S + +           LSLSM ED YQ+LQQVE            SLS  E+K Q   I ITYQ L QV+++ L + 
Subjt:  TPTSGDLQLIFLCLVVRSKSKSRSLIKYKWRSPIHFPVLLSLSMGEDTYQVLQQVERSNSTSFVLWSLSLSMGEVKVQ---IMITYQELEQVEISNL-FS

Query:  FVI--WPPSLSTSQNPNQDHLSSTSGD-LQFIFLCPVVNFLSMGNDTYLDHLSSTPTSGDLQLIFLCLVVTFLVYGSLSLPMGEDTYQDHLSSHFPCSRV
        F +  +P S   S++  + +LSST+ + L+ IFLC  V  +   +  +   LS +     +Q I  C  +      S SL M ED YQDHLSSH  C +V
Subjt:  FVI--WPPSLSTSQNPNQDHLSSTSGD-LQFIFLCPVVNFLSMGNDTYLDHLSSTPTSGDLQLIFLCLVVTFLVYGSLSLPMGEDTYQDHLSSHFPCSRV

Query:  RSKSKIKTNLSS-TTSEG
        RSK K + +LSS TTSEG
Subjt:  RSKSKIKTNLSS-TTSEG

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGTCCTATATGAAGAAAGGAAGTGTTGGCAGAAATGTAAAGTTAGGTGGCTTATAGAAGGGGATGTGAGAACACCAAGCTCTTCCATAGTGTGCTCAACTCAAGAAGA
AAGAGGCAATAGGGATCCATGGTTTAACAGGGGAACTCTATGGGTCACTTTGACCTTGTCGCTAGGTCACTTTCCTGGTTTATGGGCGAGGATACATATCAAGATCACTT
TTCAAGTACTAGAACAAGTGGAGATCCCCGACTCATTTTCATTTGTTTTGTGTATTTGTAATTTTTTCAATTCCAATTTCTTGGGTTTGCAAAGAGGAATACAAAGTCCC
ACATTGGCTAGGGAAGGGATTGATCCATGGTATATAAGAGATGAGAATTATCTCCATTGGTTGTTCTTGGAGTCTTGGATAAGAGCACGCTCTCGTTATGCCCGAGAGTG
GACAGATGGTCACTTTCCTAGTCTACGGTGTGATCAAAATCTGAATCTAGATCACTTATCAAGTACTCTAACAAGTGGAGTTCTCCAACTGGTTTTCTTTTGTCTCGTGG
CATTTGTCATTTGTCACTTTCTTTGTCTAAGAGTTAGTCATGATCACTTATCAAGTACTCCAACAAGTGGAGATCTCCAACTCATTTTTCTCTGTCTTGTGGTGAGGTCA
AAATCCAAATCTAGATCACTTATCAAGTACAAGTGGAGATCTCCGATTCATTTTCCTGTGTTACTTTCCTTGTCTATGGGGGAGGATACATATCAAGTACTTCAACAAGT
GGAGAGGTCCAACTCGACTTCCTTTGTCTTGTGGTCACTTTCCTTGTCTATGGGTGAGGTCAAAGTCCAAATCATGATCACTTATCAAGAACTAGAGCAAGTGGAGATCT
CCAACTTATTTTCTTTCGTCATATGGCCACCTTCCTTGTCTACGAGTCAAAATCCAAATCAAGATCACTTATCATCTACAAGTGGAGATCTCCAATTCATTTTCCTTTGT
CCTGTGGTCAATTTTCTTTCCATGGGTAACGATACATATCTAGATCACTTATCAAGTACTCCAACAAGTGGAGATCTCCAACTCATTTTTCTCTGTCTTGTGGTCACTTT
CCTTGTCTATGGGTCACTTTCCTTACCTATGGGTGAGGATACATATCAAGATCACTTATCAAGTCACTTTCCTTGTTCACGGGTGAGATCAAAATCCAAAATCAAGACCA
ACTTATCAAGTACTACAAGTGAAGGCCTCCGACTCATTTTCCTTTGTCTTGCGGTCACTTCCCTTTTTATGGGTGAGGATACATATCAAGATCTTATCAAAATTCTTACA
ATAAGTGGAGATCTCAGACTCTTTTTCCTTTGTCTTGTGGTCACCTTTCTTGTCTACAGGTCACTTTCCTTATCTATGAGTAAGGCCAAAATTCAAATCAAGGTCACCTA
TCAAGTACTCCAGCAAGTAGAGATCCGCAACTCTTTTTGCCAGTACAAGTCATTTGTTCCGTCACTTTCCTTATCTATGGTTAGCATATCTTTGATCTTTCCACCTCCTC
TTCGTAGGTTACTTTTCTTGTCTATGGGTAAGGTCAATCCAAATCAAGATCACTTATCAAGTCACGTTCCTTGTCTATGGGTGAGACCAAAATCCAAATCAAGATCACTT
ATCAAGTCATTTTCTTTGTCTATGGGTGAGACCAAAATCGAAATCAAGATCGCTTATCAAGTACTACTACATGTGGAGATCTCCAACACATTTTCCTTTGTCTCATGGTC
ACTTTCCTTTTCTATGGGTGAGGATACATATCAAGATAACTTATCAAAAGTCCTACAACAAGTGAAGGTCACTTACCTTGTTTATGGGTTACTTTCCTTGTCAATAGAGA
GGCCAAAATCCAAATCAAGATTACTTATCAAGTACTACAGTCTTCAACTCATTTTCCTTTATCCTGTGGTCACTTTCCTTGTCTATAGGTCACTTTTCTTGTTTATTGGT
GAGGGTACATATCAAGATCACTTATCAAGTACTACAGCAAGTGGAGATCTCAAACTCAATTTCCTTTGTCTTGTGGTGAGGTCAAAATCCAAATCAAGATCACTTATAAG
CATATGGAGATTCCATATCATTTTCCTTTGTCCTGTGGTTACTTTCCATGTCCATGCTAGCTGGTTAAAAGGTGGATTGATTTCAGAAGGCAAGATCTTGGATATAACAC
TATCAATGCCTACCTCTGATCATTTCCCCATTCTTATGGAAACGGGAAGCTTCAAGTGGGTTCCTATATCTTCTAAGTTCAAAAACATGTGGCTCCTTCACAAGTCTTCC
CTGAAAGATCTCGAAGGCTGGTGGAAAGAAATCAACCCTTGGGGTTGCCTGGGTTTGCCCTTATCCAGGATCTTAAATATATCAAAGCGAAGTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MVLYEERKCWQKCKVRWLIEGDVRTPSSSIVCSTQEERGNRDPWFNRGTLWVTLTLSLGHFPGLWARIHIKITFQVLEQVEIPDSFSFVLCICNFFNSNFLGLQRGIQSP
TLAREGIDPWYIRDENYLHWLFLESWIRARSRYAREWTDGHFPSLRCDQNLNLDHLSSTLTSGVLQLVFFCLVAFVICHFLCLRVSHDHLSSTPTSGDLQLIFLCLVVRS
KSKSRSLIKYKWRSPIHFPVLLSLSMGEDTYQVLQQVERSNSTSFVLWSLSLSMGEVKVQIMITYQELEQVEISNLFSFVIWPPSLSTSQNPNQDHLSSTSGDLQFIFLC
PVVNFLSMGNDTYLDHLSSTPTSGDLQLIFLCLVVTFLVYGSLSLPMGEDTYQDHLSSHFPCSRVRSKSKIKTNLSSTTSEGLRLIFLCLAVTSLFMGEDTYQDLIKILT
ISGDLRLFFLCLVVTFLVYRSLSLSMSKAKIQIKVTYQVLQQVEIRNSFCQYKSFVPSLSLSMVSISLIFPPPLRRLLFLSMGKVNPNQDHLSSHVPCLWVRPKSKSRSL
IKSFSLSMGETKIEIKIAYQVLLHVEISNTFSFVSWSLSFSMGEDTYQDNLSKVLQQVKVTYLVYGLLSLSIERPKSKSRLLIKYYSLQLIFLYPVVTFLVYRSLFLFIG
EGTYQDHLSSTTASGDLKLNFLCLVVRSKSKSRSLISIWRFHIIFLCPVVTFHVHASWLKGGLISEGKILDITLSMPTSDHFPILMETGSFKWVPISSKFKNMWLLHKSS
LKDLEGWWKEINPWGCLGLPLSRILNISKRS

Moc04g00410 (gene) of Bitter gourd (OHB3-1) v2 genome