CuGenDBv2

Gene ID	MC01g0046
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	zf-RVT domain-containing protein
Genome location	MC01:3634420..3634935
RNA-Seq Expression	MC01g0046
Synteny	MC01g0046
Gene Ontology terms	GO:0006807 - nitrogen compound metabolic process (biological process) GO:0009987 - cellular process (biological process) GO:0043170 - macromolecule metabolic process (biological process) GO:0044238 - primary metabolic process (biological process) GO:0110165 - cellular anatomical structure (cellular component) GO:0016787 - hydrolase activity (molecular function)
InterPro domains	IPR026960 - Reverse transcriptase zinc-binding domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0035739.1 hypothetical protein E6C27_scaffold403G00100 [Cucumis melo var. makuwa]

2.07e-17

34.68

Show/hide

Query:  GSFSVKSYSWFLDSALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGL
        G FS KS S  L +A  + K+L  ++ +  SP+ I++L WI++F  + ++ ILQKK P ++  PS+C LC   S+   H+ L+C  ++  WER+F LF L
Subjt:  GSFSVKSYSWFLDSALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGL

Query:  SWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGL--RETKSFLNR-KTWFEAFDLAKYKKSLWCSI
         W   +S + ++ QLL G  LP   R+IW    K LL +    R  + F ++ +   E    A    + WCS+
Subjt:  SWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGL--RETKSFLNR-KTWFEAFDLAKYKKSLWCSI

KAA0062564.1 GPI-anchor transamidase isoform X1 [Cucumis melo var. makuwa]

8.87e-14

35.25

Show/hide

Query:  ILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFLNRK
        ++Q+++  S L PS C+LC    E  +  L  C ++   WE L  LFG+ W    S   N+KQ+L G +L    RLIW N  K LL+D   E    + R 
Subjt:  ILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFLNRK

Query:  T---WFEAFDLAKYKKSLWCSI
            W E  D+AK   + WC +
Subjt:  T---WFEAFDLAKYKKSLWCSI

TYK21876.1 hypothetical protein E5676_scaffold494G00090 [Cucumis melo var. makuwa]

8.18e-19

35.26

Show/hide

Query:  GSFSVKSYSWFLDSALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGL
        G FS KS S  L +A  + K+L  ++ +  SP+ I++L WI++F  +N++ ILQKK P ++  PS+C LC   S+   H+ L+C  ++  WER+F LF L
Subjt:  GSFSVKSYSWFLDSALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGL

Query:  SWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGL--RETKSFLNR-KTWFEAFDLAKYKKSLWCSI
         W   +S + ++ QLL G  LP   R+IW    K LL +    R  + F ++ +   E    A    + WCS+
Subjt:  SWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGL--RETKSFLNR-KTWFEAFDLAKYKKSLWCSI

XP_022153214.1 uncharacterized protein LOC111020765 [Momordica charantia]

1.75e-27

40.37

Show/hide

Query:  SALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLK
        S   +PK+   +LWK  SP+ ++V  WI+  G LNT +I+QKK P   L PS C LC+ + E   H+   C FA+  W  LF  F + W     A  N+ 
Subjt:  SALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLK

Query:  QLLFGPA-LPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCSI
        QLL GP  L    R +W N VK LL++   E  S L    R+ + E+F  AK+K SLWCS+
Subjt:  QLLFGPA-LPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCSI

XP_038903695.1 uncharacterized protein LOC120090219 [Benincasa hispida]

2.43e-25

37.28

Show/hide

Query:  FSVKSYSWFLDSALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSW
        ++VKS    L     L K +  ++WK  SP+ +++L WI+LFG LN   +LQKK P   L P+VC  C  +SE  +H+   C +++  W +L C F L  
Subjt:  FSVKSYSWFLDSALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSW

Query:  VLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGL--RETKSFLNRKTWFE-AFDLAKYKKSLWC
         L N    N+ QLL  P      RL+W NAVK LLAD    R  + F N+ T  +   + A+ + S WC
Subjt:  VLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGL--RETKSFLNRKTWFE-AFDLAKYKKSLWC

TrEMBL top hits

e value

%identity

Alignment

A0A438FM03 Putative ribonuclease H protein

3.81e-13

31.82

Show/hide

Query:  GSFSVKSYSWFL----DSALKLPKKLHLSLWKLDSP-KISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFC
        GSFSVKS+ + L    +  + LP K    LW    P K+  L+W+V  G +NT + LQ + P   L P  C LC  N E   H+ L C      W RLF 
Subjt:  GSFSVKSYSWFL----DSALKLPKKLHLSLWKLDSP-KISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFC

Query:  LFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCS
        L G+ WV   S    L     G     + +++W  A   L+    +E  + +     +T    +DL ++  SLW S
Subjt:  LFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCS

A0A438JRY4 Putative ribonuclease H protein

1.96e-13

31.82

Show/hide

Query:  GSFSVKSYSWFL----DSALKLPKKLHLSLWKLDSP-KISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFC
        GSFSVKS+ + L    +  + LP K    LW    P K+ VL+W+V  G +NT + LQ + P   L P  C LC  N E   H+ L C      W +LF 
Subjt:  GSFSVKSYSWFL----DSALKLPKKLHLSLWKLDSP-KISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFC

Query:  LFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCS
        L G+ WV   S    L     G     + +++W  A   L+    +E  + +     +T    +DL ++  SLW S
Subjt:  LFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCS

A0A438KG54 Protein RETICULATA, chloroplastic

1.16e-13

32.95

Show/hide

Query:  GSFSVKSYSWFLDSALK----LPKKLHLSLWKLDSP-KISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFC
        GSFSVKS+ + L   L     LP K    LW    P K+  L+W+V  G +NT + LQ + P   L P  C LC  N E   H+ L C      W RLF 
Subjt:  GSFSVKSYSWFLDSALK----LPKKLHLSLWKLDSP-KISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFC

Query:  LFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCS
        L G+SWV   S    L     G     + +++W  A   L+    +E  + +     +T    +DL ++  SLW S
Subjt:  LFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCS

A0A5A7V5N8 GPI-anchor transamidase isoform X1

4.29e-14

35.25

Show/hide

Query:  ILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFLNRK
        ++Q+++  S L PS C+LC    E  +  L  C ++   WE L  LFG+ W    S   N+KQ+L G +L    RLIW N  K LL+D   E    + R 
Subjt:  ILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFLNRK

Query:  T---WFEAFDLAKYKKSLWCSI
            W E  D+AK   + WC +
Subjt:  T---WFEAFDLAKYKKSLWCSI

A0A6J1DIE2 uncharacterized protein LOC111020765

8.49e-28

40.37

Show/hide

Query:  SALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLK
        S   +PK+   +LWK  SP+ ++V  WI+  G LNT +I+QKK P   L PS C LC+ + E   H+   C FA+  W  LF  F + W     A  N+ 
Subjt:  SALKLPKKLHLSLWKLDSPK-ISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKNLK

Query:  QLLFGPA-LPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCSI
        QLL GP  L    R +W N VK LL++   E  S L    R+ + E+F  AK+K SLWCS+
Subjt:  QLLFGPA-LPPKARLIWSNAVKPLLADGLRETKSFL---NRKTWFEAFDLAKYKKSLWCSI

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

GGATCTTTCTCCGTCAAGTCCTACTCATGGTTTTTGGATTCTGCACTTAAATTGCCAAAAAAGCTCCATTTGTCTCTTTGGAAATTAGACAGTCCAAAAATCAGTGTTCT
ATCTTGGATAGTTCTCTTTGGCAATCTAAATACTACAAATATTCTTCAAAAGAAGATGCCGCCTTCACTCCTACAGCCCTCAGTTTGTACTCTTTGTTCAGCAAACAGTG
AATGTCAAATACATGTGCTATTATTTTGTCAATTTGCAGCAAGTTTTTGGGAGAGACTCTTCTGTCTCTTCGGCCTCAGCTGGGTTCTCTCGAATTCAGCAACAAAAAAT
TTGAAACAGCTCCTTTTTGGTCCGGCTCTACCCCCAAAAGCTCGTTTGATTTGGTCTAATGCAGTTAAACCATTGCTTGCCGATGGTTTGAGAGAAACCAAAAGCTTTTT
GAATAGAAAAACATGGTTCGAAGCTTTTGATTTAGCTAAGTATAAGAAATCCCTTTGGTGCTCGATC

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

GSFSVKSYSWFLDSALKLPKKLHLSLWKLDSPKISVLSWIVLFGNLNTTNILQKKMPPSLLQPSVCTLCSANSECQIHVLLFCQFAASFWERLFCLFGLSWVLSNSATKN
LKQLLFGPALPPKARLIWSNAVKPLLADGLRETKSFLNRKTWFEAFDLAKYKKSLWCSI

MC01g0046 (gene) of Bitter gourd (Dali-11) v1 genome