CuGenDBv2

Gene ID	Moc01g04100
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrotrans_gag domain-containing protein
Genome location	chr1:2673134..2676814
RNA-Seq Expression	Moc01g04100
Synteny	Moc01g04100
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022150863.1 uncharacterized protein LOC111018910 [Momordica charantia]

5.1e-50

53.36

Show/hide

Query:  VPIATDPEVVVPPLNVVLLADDIDREIKAYAAPTFYKFNPVITEPEIAVPKFELK------------PLMFQMLQTVGQ--FHEHPTED-----------
        VP+AT+ EV+VP LNVVLLA  IDREI+AYAAPTFY FNPVITE EI  PKFELK             L    L+   +      P+E            
Subjt:  VPIATDPEVVVPPLNVVLLADDIDREIKAYAAPTFYKFNPVITEPEIAVPKFELK------------PLMFQMLQTVGQ--FHEHPTED-----------

Query:  ------PHSHLKFFMGLCN--SFKDEGCNKEVLRLK-------------CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSD
              P  + K+   + N   F  E   +     K             CI IE YYNGLDDAT LV   S NE LLAKPY EAFNILE+ISSN HS SD
Subjt:  ------PHSHLKFFMGLCN--SFKDEGCNKEVLRLK-------------CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSD

Query:  PRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSH
         RAIQGRG+KRLNES+SYST NSKI NV DLV RSMTQQSTVGA  GKAN SH
Subjt:  PRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSH

XP_022156835.1 uncharacterized protein LOC111023669 [Momordica charantia]

1.3e-37

80.19

Show/hide

Query:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK
        +CIQIE YY GLDDAT LVIDAS N  LL KPY EAFNILE+ISSNNHSWSDPRAIQGRG K LNESESY  LNSK+ N+T+LVMRSMTQQ+TVGA  GK
Subjt:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK

Query:  ANVSHI
        ANVSHI
Subjt:  ANVSHI

XP_022157438.1 uncharacterized protein LOC111024136 [Momordica charantia]

5.9e-38

52.49

Show/hide

Query:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLKCI------QIETYYNGLDDATCLVIDASA-----------------NEVLLAKP
        MFQMLQTVG+FH H TEDPH HLKF MG+CNSFKDEG +K+V+RLK        +  T+   L   +    D  A                 NE+   + 
Subjt:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLKCI------QIETYYNGLDDATCLVIDASA-----------------NEVLLAKP

Query:  YD-------EAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSHI
        +D       EAFNILE+ISSNNHSW DP+A+QG+ SK L ESESY+TLNSKI N+TDLVMRS+TQQS  GA  G  NV+ I
Subjt:  YD-------EAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSHI

XP_022158598.1 uncharacterized protein LOC111025053 [Momordica charantia]

9.4e-36

49.48

Show/hide

Query:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLK------------------------------------------------------
        MFQM+  VGQFH H TE PH HLKFFMG+ NSFKDEG +K VLRLK                                                      
Subjt:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLK------------------------------------------------------

Query:  CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQST
         IQIETYY GLD+AT LVIDAS N  LL KPY +A NILE+ISS+NHSWSD RAI+G+ SK L ESESY+TLNSKI  +TDL  R+ +  +T
Subjt:  CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQST

XP_022159060.1 uncharacterized protein LOC111025500 [Momordica charantia]

5.9e-38

81.13

Show/hide

Query:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK
        +CIQI+TYYNGLDDAT LVIDASAN  LLAKPY EAFNILE+ISSNN SWSDPRAI G+GSK  NESES++ LN KI N+TDLVMRSMT QSTVGA AGK
Subjt:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK

Query:  ANVSHI
        ANVSHI
Subjt:  ANVSHI

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DAK9 uncharacterized protein LOC111018910

2.5e-50

53.36

Show/hide

Query:  VPIATDPEVVVPPLNVVLLADDIDREIKAYAAPTFYKFNPVITEPEIAVPKFELK------------PLMFQMLQTVGQ--FHEHPTED-----------
        VP+AT+ EV+VP LNVVLLA  IDREI+AYAAPTFY FNPVITE EI  PKFELK             L    L+   +      P+E            
Subjt:  VPIATDPEVVVPPLNVVLLADDIDREIKAYAAPTFYKFNPVITEPEIAVPKFELK------------PLMFQMLQTVGQ--FHEHPTED-----------

Query:  ------PHSHLKFFMGLCN--SFKDEGCNKEVLRLK-------------CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSD
              P  + K+   + N   F  E   +     K             CI IE YYNGLDDAT LV   S NE LLAKPY EAFNILE+ISSN HS SD
Subjt:  ------PHSHLKFFMGLCN--SFKDEGCNKEVLRLK-------------CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSD

Query:  PRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSH
         RAIQGRG+KRLNES+SYST NSKI NV DLV RSMTQQSTVGA  GKAN SH
Subjt:  PRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSH

A0A6J1DRG1 uncharacterized protein LOC111023669

6.3e-38

80.19

Show/hide

Query:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK
        +CIQIE YY GLDDAT LVIDAS N  LL KPY EAFNILE+ISSNNHSWSDPRAIQGRG K LNESESY  LNSK+ N+T+LVMRSMTQQ+TVGA  GK
Subjt:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK

Query:  ANVSHI
        ANVSHI
Subjt:  ANVSHI

A0A6J1DTD1 uncharacterized protein LOC111024136

2.8e-38

52.49

Show/hide

Query:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLKCI------QIETYYNGLDDATCLVIDASA-----------------NEVLLAKP
        MFQMLQTVG+FH H TEDPH HLKF MG+CNSFKDEG +K+V+RLK        +  T+   L   +    D  A                 NE+   + 
Subjt:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLKCI------QIETYYNGLDDATCLVIDASA-----------------NEVLLAKP

Query:  YD-------EAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSHI
        +D       EAFNILE+ISSNNHSW DP+A+QG+ SK L ESESY+TLNSKI N+TDLVMRS+TQQS  GA  G  NV+ I
Subjt:  YD-------EAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSHI

A0A6J1DWK1 uncharacterized protein LOC111025053

4.5e-36

49.48

Show/hide

Query:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLK------------------------------------------------------
        MFQM+  VGQFH H TE PH HLKFFMG+ NSFKDEG +K VLRLK                                                      
Subjt:  MFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLK------------------------------------------------------

Query:  CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQST
         IQIETYY GLD+AT LVIDAS N  LL KPY +A NILE+ISS+NHSWSD RAI+G+ SK L ESESY+TLNSKI  +TDL  R+ +  +T
Subjt:  CIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQST

A0A6J1DXK5 uncharacterized protein LOC111025500

2.8e-38

81.13

Show/hide

Query:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK
        +CIQI+TYYNGLDDAT LVIDASAN  LLAKPY EAFNILE+ISSNN SWSDPRAI G+GSK  NESES++ LN KI N+TDLVMRSMT QSTVGA AGK
Subjt:  KCIQIETYYNGLDDATCLVIDASANEVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGK

Query:  ANVSHI
        ANVSHI
Subjt:  ANVSHI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCGCTGTCACTAACGGAGCTGTCGCAGCTGCTGCACGCCGCTGTCACCAACGGGCAATTTCCTGTTGTCACCGCCGCACGCCGCTGTCACGAACAGAAACGCCACCC
GCTGCACGCTGCTGTCCCGAACAGACTGCCGCACCTGCTGTTGTGGGTTGGGGTCGCCGCTGCACGCCGCTGTCACCAACGGAGCGCTGCCCTGCTGCACGCTACTGCCC
CGAACAGAACCGTCGCACCTGCTGCCATGGGCTGGGTCGCCGTGTCGTCGCTAAATATGGTTCCTATTGCTACTGACCCTGAGGTAGTAGTGCCCCCTCTCAATGTTGTA
TTACTAGCAGATGACATCGACAGAGAGATCAAGGCATATGCAGCTCCGACATTTTATAAATTCAACCCAGTAATCACGGAGCCTGAAATTGCAGTCCCAAAGTTTGAACT
CAAGCCGTTAATGTTTCAGATGCTCCAGACAGTGGGCCAGTTTCACGAACATCCTACAGAGGACCCACATTCGCATCTGAAGTTTTTTATGGGACTATGCAATTCGTTTA
AGGATGAAGGATGCAACAAAGAAGTGTTGCGGCTTAAATGCATCCAGATCGAAACGTATTACAATGGTTTGGATGATGCTACATGCTTAGTAATTGATGCGTCAGCAAAT
GAGGTTTTGCTAGCGAAACCTTATGATGAAGCATTCAACATCTTGGAAAAGATATCATCCAACAATCATTCATGGTCTGACCCTAGAGCTATTCAAGGTAGAGGAAGCAA
GAGACTTAACGAATCTGAGTCATACTCTACTCTAAACTCGAAGATTGGGAACGTGACAGACTTAGTGATGAGAAGTATGACACAACAAAGTACAGTGGGAGCATTTGCTG
GCAAAGCAAATGTTAGCCACATCTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSLSLTELSQLLHAAVTNGQFPVVTAARRCHEQKRHPLHAAVPNRLPHLLLWVGVAAARRCHQRSAALLHATAPNRTVAPAAMGWVAVSSLNMVPIATDPEVVVPPLNVV
LLADDIDREIKAYAAPTFYKFNPVITEPEIAVPKFELKPLMFQMLQTVGQFHEHPTEDPHSHLKFFMGLCNSFKDEGCNKEVLRLKCIQIETYYNGLDDATCLVIDASAN
EVLLAKPYDEAFNILEKISSNNHSWSDPRAIQGRGSKRLNESESYSTLNSKIGNVTDLVMRSMTQQSTVGAFAGKANVSHI

Moc01g04100 (gene) of Bitter gourd (OHB3-1) v2 genome