CuGenDBv2

Gene ID	Moc02g10190
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Unknown protein
Genome location	chr2:7204774..7206510
RNA-Seq Expression	Moc02g10190
Synteny	Moc02g10190
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022137317.1 uncharacterized protein LOC111008813 [Momordica charantia]

3.2e-56

42.55

Show/hide

Query:  RSEVDLLRDQFQREIEDLKRQCRLVD-PHRVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR
        R E D LR Q   ++E LK +C   + P    +  E PF+  +L+APIPP+FKAP +  YDGS D   YVEVFE  MDF AASD +KCRAF+IAL GSAR
Subjt:  RSEVDLLRDQFQREIEDLKRQCRLVD-PHRVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR

Query:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML
        LWYR+L   SI +Y QLRR F+  FS+R   K   +HL T++Q++ E+L EY+ RF +E +KV  C+DD  M YF TGL D+ LT++     PA+  E+L
Subjt:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML

Query:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA
         +A++ ID  EL +    R   +      GKD     P   K +  G  SS RA+  ++     E  P+  R   +++FTP    ++EI    E++ +E 
Subjt:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA

Query:  LFAAPEKLRRPPGKRDKRLYKR
        L   PEKLR  P +R K  Y R
Subjt:  LFAAPEKLRRPPGKRDKRLYKR

XP_022149029.1 uncharacterized protein LOC111017548 [Momordica charantia]

4.2e-101

81.25

Show/hide

Query:  MDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFT
        MDFLAASD +KCRAFQIALEGS RLWY+QLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHL TVKQRD ESLTEYIAR MDEHVKVVSCTDDI MMYFT
Subjt:  MDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFT

Query:  TGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPL
        TGLND+NLTIEF SRPPASLN+ML RARQYID LELWKA GAR S RGKDR+Q+S PPKK+ S   SSSR+A D +SRG  DE+  SD  GPKFDKFTPL
Subjt:  TGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPL

Query:  NASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR
        NASVAEIYA  E+TD++ALF AP+KL RP GKRDKRLY R
Subjt:  NASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR

XP_022152851.1 uncharacterized protein LOC111020475 [Momordica charantia]

5.6e-69

59.26

Show/hide

Query:  MNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARF
        M+SYDGSGD ISYVEVFEGKMDFLA SD MKC AFQI LEGS RLWYRQLK RSIDSYQQLRRLFINQFS RQ LKLP SHLGTVKQRD ES T YIARF
Subjt:  MNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARF

Query:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH
        MDEHVKVVSCTDDI MMYFTTGLND+NLTIEF S  PA LNEM  RARQYID LELW A+GA      +       PP+                     
Subjt:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH

Query:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKRIMATTLHAVS
                H G        +          A  T         EKLRRP GKRDKRLY R      H  S
Subjt:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKRIMATTLHAVS

XP_022156542.1 uncharacterized protein LOC111023421 [Momordica charantia]

1.3e-57

43.17

Show/hide

Query:  RSEVDLLRDQFQREIEDLKRQCRLVDPH-RVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR
        R E D LR +   ++E LK +C   D      +  E PF+  +L+APIPP+FKAP +  YDG+ D   YVEVFEG MDF AASD +KCRAFQIAL GSAR
Subjt:  RSEVDLLRDQFQREIEDLKRQCRLVDPH-RVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR

Query:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML
        LWYR+L  RSI +Y QLRR F+ QFS+R   K   +HL T++Q++ E+L EY+ RF +E +KV  C+DD  M YF TGL D+ LT++     PA+  E+L
Subjt:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML

Query:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA
         +A++ ID  EL +    R   +      GKD  +  P   K +  G  SS RA+  ++     E  P+  R   +++FTP    + EI    E++ +E 
Subjt:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA

Query:  LFAAPEKLRRPPGKRDKRLYKR
        L   PEKLR  P +R K  Y R
Subjt:  LFAAPEKLRRPPGKRDKRLYKR

XP_022158844.1 uncharacterized protein LOC111025310 [Momordica charantia]

4.7e-60

77.5

Show/hide

Query:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH
        MDEHVKVVSCTDDI MMYFTTGLND+NLTIEF SRPPASLNEM  RARQYID LELWKANGAR S RG+DR+ KSPP KK+     SSSRRADD KSR  
Subjt:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH

Query:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR
         DE+  S+ RGPKFDKFTPLNAS+AEIYA  EDTD+E LFA+PEKLRRP GKR+KRLY R
Subjt:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C7X5 uncharacterized protein LOC111008813

1.5e-56

42.55

Show/hide

Query:  RSEVDLLRDQFQREIEDLKRQCRLVD-PHRVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR
        R E D LR Q   ++E LK +C   + P    +  E PF+  +L+APIPP+FKAP +  YDGS D   YVEVFE  MDF AASD +KCRAF+IAL GSAR
Subjt:  RSEVDLLRDQFQREIEDLKRQCRLVD-PHRVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR

Query:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML
        LWYR+L   SI +Y QLRR F+  FS+R   K   +HL T++Q++ E+L EY+ RF +E +KV  C+DD  M YF TGL D+ LT++     PA+  E+L
Subjt:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML

Query:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA
         +A++ ID  EL +    R   +      GKD     P   K +  G  SS RA+  ++     E  P+  R   +++FTP    ++EI    E++ +E 
Subjt:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA

Query:  LFAAPEKLRRPPGKRDKRLYKR
        L   PEKLR  P +R K  Y R
Subjt:  LFAAPEKLRRPPGKRDKRLYKR

A0A6J1D5T3 uncharacterized protein LOC111017548

2.0e-101

81.25

Show/hide

Query:  MDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFT
        MDFLAASD +KCRAFQIALEGS RLWY+QLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHL TVKQRD ESLTEYIAR MDEHVKVVSCTDDI MMYFT
Subjt:  MDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFT

Query:  TGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPL
        TGLND+NLTIEF SRPPASLN+ML RARQYID LELWKA GAR S RGKDR+Q+S PPKK+ S   SSSR+A D +SRG  DE+  SD  GPKFDKFTPL
Subjt:  TGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPL

Query:  NASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR
        NASVAEIYA  E+TD++ALF AP+KL RP GKRDKRLY R
Subjt:  NASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR

A0A6J1DIZ8 uncharacterized protein LOC111020475

2.7e-69

59.26

Show/hide

Query:  MNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARF
        M+SYDGSGD ISYVEVFEGKMDFLA SD MKC AFQI LEGS RLWYRQLK RSIDSYQQLRRLFINQFS RQ LKLP SHLGTVKQRD ES T YIARF
Subjt:  MNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARF

Query:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH
        MDEHVKVVSCTDDI MMYFTTGLND+NLTIEF S  PA LNEM  RARQYID LELW A+GA      +       PP+                     
Subjt:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH

Query:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKRIMATTLHAVS
                H G        +          A  T         EKLRRP GKRDKRLY R      H  S
Subjt:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKRIMATTLHAVS

A0A6J1DS95 uncharacterized protein LOC111023421

6.2e-58

43.17

Show/hide

Query:  RSEVDLLRDQFQREIEDLKRQCRLVDPH-RVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR
        R E D LR +   ++E LK +C   D      +  E PF+  +L+APIPP+FKAP +  YDG+ D   YVEVFEG MDF AASD +KCRAFQIAL GSAR
Subjt:  RSEVDLLRDQFQREIEDLKRQCRLVDPH-RVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDFLAASDPMKCRAFQIALEGSAR

Query:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML
        LWYR+L  RSI +Y QLRR F+ QFS+R   K   +HL T++Q++ E+L EY+ RF +E +KV  C+DD  M YF TGL D+ LT++     PA+  E+L
Subjt:  LWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEML

Query:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA
         +A++ ID  EL +    R   +      GKD  +  P   K +  G  SS RA+  ++     E  P+  R   +++FTP    + EI    E++ +E 
Subjt:  VRARQYIDDLELWKANGARWSDR------GKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEA

Query:  LFAAPEKLRRPPGKRDKRLYKR
        L   PEKLR  P +R K  Y R
Subjt:  LFAAPEKLRRPPGKRDKRLYKR

A0A6J1E0L8 uncharacterized protein LOC111025310

2.3e-60

77.5

Show/hide

Query:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH
        MDEHVKVVSCTDDI MMYFTTGLND+NLTIEF SRPPASLNEM  RARQYID LELWKANGAR S RG+DR+ KSPP KK+     SSSRRADD KSR  
Subjt:  MDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFESRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGH

Query:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR
         DE+  S+ RGPKFDKFTPLNAS+AEIYA  EDTD+E LFA+PEKLRRP GKR+KRLY R
Subjt:  WDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAPEKLRRPPGKRDKRLYKR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGGGACGCGGTCACTTCCCGAGCCCATCCACGACTCACGTATTCTCAGGTGGCAGGAACTCCCGTCGTCAAACAACGACCCCACGCGGGGGCGGTCAAGGAGAATGG
AGGTCGGCCTGCCACATCTGATCCAGTAGCAGTCCGGGATTTCCACCTCGCCTCAGATCAATTCCCGCCACTGCAACCTCAGAGAAACGGGTTGCCACCCCGCGCACCTC
GCCTCCGCGGTTGGGGAAACACGGGCGCACGTTCCGGGGCAAGTGCTGATGCGGGCGTAGACCCCGTCATGGTAGCCGACGTGATCGTCGAGCTCAAAGAAGTCAAAGCA
AGGCTTGAGGCGGTCGAGAGAGGCAGCGAATTGTCCGGCTCTTTCGTCTCCAGGGACCCCATTCGAGGAAAGGGACCGATGCATCCTACCCAAAGAACGGAGTATCATTT
CCGACCCTGCAGGGAGGCCCGAGCTGGAGCACCCTCGCGAAAGCCACAACGAGTGACGACAGGCGGTGCTCTGGAAGCACAGATTCACGACCACCCTCGGCAGGACGATC
GGGTCGAGGGCCGGCGCCCGAGGATCCGACCAATTCGGACCCCCTTTGCATCTTTCGATAATTCCAATGCTCATCAGGGCCGAGGTGCCGAGACGCCAAGACGACGAGTA
GTGGCTCCCGAAGATCGGGAGTATTTGGTTGACGATGAGGAGGAAAGCCCAGTGGTCGACGTTCAAGAAAGGTCCTCCCACGCTGACCATTCGTTCCGGTCTGAGGTGGA
CCTCCTCCGGGATCAGTTTCAGAGGGAGATAGAAGATCTCAAGCGACAGTGCAGGCTTGTGGATCCGCATCGCGTGGCCGAGCAAGAGGAACCGCCTTTCTCCCAAGCGA
TCCTGGATGCACCTATCCCACCGAGGTTCAAGGCTCCGGTCATGAATTCTTACGACGGATCTGGAGATCTGATCTCCTATGTAGAGGTGTTCGAGGGGAAGATGGATTTC
CTGGCCGCAAGCGACCCTATGAAGTGCCGAGCATTTCAAATAGCCTTGGAAGGATCGGCAAGATTGTGGTACCGACAGTTGAAGCCCCGGTCCATCGATAGTTACCAACA
GCTAAGGAGGTTGTTCATCAACCAGTTCTCGGCTCGGCAGTTGTTGAAATTGCCACCCTCTCACCTCGGAACAGTAAAGCAACGGGACAGAGAGTCCCTGACAGAGTACA
TCGCTCGATTTATGGACGAGCATGTCAAAGTGGTAAGTTGCACCGATGACATCGTCATGATGTACTTCACCACGGGCTTGAACGACAAGAACCTAACGATAGAGTTCGAA
AGCCGACCACCGGCCTCCCTGAACGAGATGCTCGTTAGAGCTCGCCAGTACATTGACGACTTGGAGTTGTGGAAAGCCAATGGAGCACGGTGGAGCGACCGTGGTAAAGA
TCGGAACCAAAAGTCCCCTCCTCCCAAGAAGCAGCGCAGCCACGGCTGGAGCTCGTCTCGACGGGCCGACGACAGTAAGAGTAGAGGCCATTGGGATGAGAAAGCCCCTT
CAGACCATCGGGGGCCAAAATTCGACAAGTTCACTCCGTTGAATGCCTCAGTCGCGGAGATCTACGCGGCAGCCGAAGACACCGACCTGGAGGCACTCTTCGCGGCCCCA
GAAAAGCTTCGTCGACCTCCAGGGAAACGAGACAAGCGGCTCTACAAGCGGATCATGGCCACGACACTTCACGCTGTTTCCACTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MRDAVTSRAHPRLTYSQVAGTPVVKQRPHAGAVKENGGRPATSDPVAVRDFHLASDQFPPLQPQRNGLPPRAPRLRGWGNTGARSGASADAGVDPVMVADVIVELKEVKA
RLEAVERGSELSGSFVSRDPIRGKGPMHPTQRTEYHFRPCREARAGAPSRKPQRVTTGGALEAQIHDHPRQDDRVEGRRPRIRPIRTPFASFDNSNAHQGRGAETPRRRV
VAPEDREYLVDDEEESPVVDVQERSSHADHSFRSEVDLLRDQFQREIEDLKRQCRLVDPHRVAEQEEPPFSQAILDAPIPPRFKAPVMNSYDGSGDLISYVEVFEGKMDF
LAASDPMKCRAFQIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPPSHLGTVKQRDRESLTEYIARFMDEHVKVVSCTDDIVMMYFTTGLNDKNLTIEFE
SRPPASLNEMLVRARQYIDDLELWKANGARWSDRGKDRNQKSPPPKKQRSHGWSSSRRADDSKSRGHWDEKAPSDHRGPKFDKFTPLNASVAEIYAAAEDTDLEALFAAP
EKLRRPPGKRDKRLYKRIMATTLHAVST

Moc02g10190 (gene) of Bitter gourd (OHB3-1) v2 genome