CuGenDBv2

Gene ID	Moc01g15540
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrotran_gag_3 domain-containing protein
Genome location	chr1:9880440..9884876
RNA-Seq Expression	Moc01g15540
Synteny	Moc01g15540
Gene Ontology terms	NA
InterPro domains	IPR029472 - Retrotransposon Copia-like, N-terminal

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8645659.1 hypothetical protein Csa_020439 [Cucumis sativus]

1.3e-37

50.54

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPPNSTYDEWIAKDHGLMTVINATLSPAALA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK F F+DG+ P P      ++T  P  N  Y++WIAKD  LMTVINATLSP ALA
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPPNSTYDEWIAKDHGLMTVINATLSPAALA

Query:  NV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
         V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  NV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

XP_008448007.1 PREDICTED: uncharacterized protein LOC103490319 isoform X2 [Cucumis melo]

2.2e-37

51.06

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK + FIDG+ P P      S+T   PP  N +Y++WIAKD  LMTVINATLSP A
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA

Query:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LA V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

XP_008448008.1 PREDICTED: uncharacterized protein LOC103490319 isoform X3 [Cucumis melo]

2.2e-37

51.06

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK + FIDG+ P P      S+T   PP  N +Y++WIAKD  LMTVINATLSP A
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA

Query:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LA V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

XP_011658579.1 uncharacterized protein LOC105436058 [Cucumis sativus]

1.3e-37

50.54

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPPNSTYDEWIAKDHGLMTVINATLSPAALA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK F F+DG+ P P      ++T  P  N  Y++WIAKD  LMTVINATLSP ALA
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPPNSTYDEWIAKDHGLMTVINATLSPAALA

Query:  NV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
         V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  NV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

XP_022158689.1 uncharacterized protein LOC111025150 [Momordica charantia]

7.5e-38

51.3

Show/hide

Query:  MAASSS--KDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLL----ELSTTEAPPPNSTYDEWIAKDHGLMTVINAT
        MA SS   KDL+S IFLLSNICNLVS+RLDSSNFVLWKFQL +ILKAHK + FIDGS P+P+  L    + S++  P  N  + EWIAKDH LMT++NA 
Subjt:  MAASSS--KDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLL----ELSTTEAPPPNSTYDEWIAKDHGLMTVINAT

Query:  LSPAALANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LS +ALA V                                 SI++KP  SI+ Y+QR+KELK KL+NV V +D+EDLLIYTLN L  +++ F
Subjt:  LSPAALANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BI58 uncharacterized protein LOC103490319 isoform X2

1.1e-37

51.06

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK + FIDG+ P P      S+T   PP  N +Y++WIAKD  LMTVINATLSP A
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA

Query:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LA V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

A0A1S3BIR3 uncharacterized protein LOC103490319 isoform X3

1.1e-37

51.06

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK + FIDG+ P P      S+T   PP  N +Y++WIAKD  LMTVINATLSP A
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA

Query:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LA V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

A0A1S4DWT9 uncharacterized protein LOC103490319 isoform X1

1.1e-37

51.06

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK + FIDG+ P P      S+T   PP  N +Y++WIAKD  LMTVINATLSP A
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA

Query:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LA V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

A0A5D3CLI6 T4.5

1.1e-37

51.06

Show/hide

Query:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA
        ++S+ KD  S IFLLSNICNL+S+RLDS+NFVLWKFQL +ILKAHK + FIDG+ P P      S+T   PP  N +Y++WIAKD  LMTVINATLSP A
Subjt:  AASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPP--NSTYDEWIAKDHGLMTVINATLSPAA

Query:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LA V                                 +I +KP ESI+ YI+R+KE+K KL+NVS  I++EDLLIY LNGL ++Y+ F
Subjt:  LANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

A0A6J1E049 uncharacterized protein LOC111025150

3.6e-38

51.3

Show/hide

Query:  MAASSS--KDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLL----ELSTTEAPPPNSTYDEWIAKDHGLMTVINAT
        MA SS   KDL+S IFLLSNICNLVS+RLDSSNFVLWKFQL +ILKAHK + FIDGS P+P+  L    + S++  P  N  + EWIAKDH LMT++NA 
Subjt:  MAASSS--KDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLL----ELSTTEAPPPNSTYDEWIAKDHGLMTVINAT

Query:  LSPAALANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF
        LS +ALA V                                 SI++KP  SI+ Y+QR+KELK KL+NV V +D+EDLLIYTLN L  +++ F
Subjt:  LSPAALANV---------------------------------SITRKPSESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIF

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G21280.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162); Has 707 Blast hits to 705 proteins in 25 species: Archae - 0; Bacteria - 0; Metazoa - 4; Fungi - 0; Plants - 703; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink).

2.6e-04

44.74

Show/hide

Query:  DSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLEL
        D  N+V WK +  S L+  K+F FIDG++P+P P   L
Subjt:  DSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLEL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCGGCATCCTCCTCGAAGGATCTTACATCTCAAATCTTTCTTTTATCAAATATCTGTAACCTAGTATCCATTCGACTGGATTCCTCGAATTTCGTTCTATGGAAGTT
CCAATTGAACTCCATCTTGAAAGCTCATAAACAGTTCGACTTTATTGATGGCTCAATTCCTCGACCATCTCCTCTTCTGGAATTATCTACTACGGAAGCTCCTCCACCAA
ATTCGACGTATGATGAATGGATTGCCAAAGATCATGGTCTCATGACTGTTATTAATGCTACACTTTCACCTGCTGCTCTTGCGAATGTCTCTATTACCAGGAAGCCTTCA
GAATCCATTAATCAGTACATTCAGCGTGTTAAGGAACTTAAGTACAAATTATCGAATGTTTCAGTTCAAATTGATGATGAAGATTTGCTCATCTATACATTGAATGGTCT
TACTTCTGATTATAGCATCTTCGTACATCAATGCATACTTGATCACAGCTGGTTAGCTTTGAAGAACTTCATATTCTCCTTGTCTCAAAAGAAGCCACTCCTGACAAACA
GTTCCTCTTATGGTGTACCTGGTCGCGACCGTGGATCTTTTGGCACGATTCTCTTCCGCGACCCTAGCATCAACGGGTTATATCCCATTCCTTCCATTGCTCGTGTCTCG
TCTTCCTCAACTTCTACTCCTGCTCTTGCTCATGTTGCAACACCCGTGTCCTCTATTGTCTGGCATAATTGCATAGGACATCCCAGTAACTCCACTCTCAACTCTGTTCT
TCAGCTTTTACATTTTCCTTCTTGTAAATCTTCTGCTTGTAGTTGTAAACATTGTAAAGGATCTTCTTACGTACAAGAAGATACACAAGACTTTGAGGGTAGACCAGCAG
AGATGACAAACAAGGATTTGAATGAGATGGATGAGCAGGCCGTTGTGAACGTCAGAATGTCGTTGTCGATGAATGTTTGTAGTCTGGTGGCGAAAGAGACTATAACAAAG
AAATTGTTAAAGGTCTTGCAAGACAGGCCACAAGAGATCTTCTGTTATGTGTCTGAGTTTGAGGTTGCTAGGGGATTTGAGAGACATAGGATGCATAGAGTAGCTGCAGA
TGGTTCAGGGCGAGACTTGAAAGAATCAGCATCATTGACAACCAGGACAGATAAGAAGAATATGCCATCAGTTCAAGTACAACAGCTGGGAAGTAGAGGAAAGGGTAAGG
AGAACAACTCAGCGAGGTGTTCAACAGGTTGTCGGTATAATACCCCAATTGTCAGACGAATGAGCGAGCTGATGAAGTCGCACAGGCATAGTGCATTGAAGGAGAAAACT
ATAGTTGGTGCTGAAGTCAAGGGTAATGTCTCTAGAAAGGCAACAAACTTGGTTGAGAGCGCCAAGTCATCAAGGGAATCTTCCTTCAGAGGTCGTTGGCGTCTGGGGAA
CAAACCACGTAGGATTGCTCAGTCTCAGGGCAATCACAGACAGAGCTTGGGTAAGGCCGGGCAGTGTAGATCAGTTCGTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAASSSKDLTSQIFLLSNICNLVSIRLDSSNFVLWKFQLNSILKAHKQFDFIDGSIPRPSPLLELSTTEAPPPNSTYDEWIAKDHGLMTVINATLSPAALANVSITRKPS
ESINQYIQRVKELKYKLSNVSVQIDDEDLLIYTLNGLTSDYSIFVHQCILDHSWLALKNFIFSLSQKKPLLTNSSSYGVPGRDRGSFGTILFRDPSINGLYPIPSIARVS
SSSTSTPALAHVATPVSSIVWHNCIGHPSNSTLNSVLQLLHFPSCKSSACSCKHCKGSSYVQEDTQDFEGRPAEMTNKDLNEMDEQAVVNVRMSLSMNVCSLVAKETITK
KLLKVLQDRPQEIFCYVSEFEVARGFERHRMHRVAADGSGRDLKESASLTTRTDKKNMPSVQVQQLGSRGKGKENNSARCSTGCRYNTPIVRRMSELMKSHRHSALKEKT
IVGAEVKGNVSRKATNLVESAKSSRESSFRGRWRLGNKPRRIAQSQGNHRQSLGKAGQCRSVR

Moc01g15540 (gene) of Bitter gourd (OHB3-1) v2 genome