CuGenDBv2

Gene ID	Moc07g02210
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	CCHC-type domain-containing protein
Genome location	chr7:1734281..1740697
RNA-Seq Expression	Moc07g02210
Synteny	Moc07g02210
Gene Ontology terms	GO:0016020 - membrane (cellular component) GO:0003676 - nucleic acid binding (molecular function) GO:0043167 - ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAF5758504.1 putative RNA-directed DNA polymerase [Helianthus annuus]

2.3e-34

54.07

Show/hide

Query:  GGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------I
        G P   S   S G+ K    DE+WE++DLRAA+AIR  LAKN+L NV+G+STAK+LWEKLE LYQ KGISNR                           I
Subjt:  GGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------I

Query:  IFELEAIEVKIDDEDKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELV
        + ELEAI VK++DEDKALRLILSL  SYEHMKPILMYGK+ L +A+ T KLL E++RL S G TS   T L+
Subjt:  IFELEAIEVKIDDEDKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELV

QHN81458.1 Retrovirus-related Pol polyprotein [Arachis hypogaea]

3.5e-35

59.06

Show/hide

Query:  SSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDK
        S M DE+WEE+DLRAA+AIR  LAKN+L NV G+ TAKELW+KLE LYQ+KGISNR                           I+ ELEAI VKIDDEDK
Subjt:  SSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDK

Query:  ALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS
        ALRLILSL  SYE++KP+LMYGK+ LNF E  SKL+ E+RR+K+EG TS
Subjt:  ALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS

QHO24915.1 Retrovirus-related Pol polyprotein [Arachis hypogaea]

1.3e-34

58.94

Show/hide

Query:  KKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDE
        K S M DE+WEE+DLRAA+AIR  LAKN+L NV GM TAKELW KLE LYQAK ISNR                           I+ ELEAI VKIDDE
Subjt:  KKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDE

Query:  DKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS
        DKALRLILSL  SYE++KP+LMYGK+ LNF E  SKL+ E+RR+K++G TS
Subjt:  DKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS

XP_022139673.1 uncharacterized protein LOC111010521 [Momordica charantia]

2.4e-60

74.21

Show/hide

Query:  QGVEGRPSEVASEKLSSDGGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR----------
        + ++GRPSE ASEKLS DGGPMESSGGSSRGSKKSSMS EDWEEMDLRAA+AIRTSLAKNIL NV+ +STAKELWEKLEALYQAKGISNR          
Subjt:  QGVEGRPSEVASEKLSSDGGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR----------

Query:  -----------------IIFELEAIEVKIDDEDKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELV
                         IIFELEAIEVKIDDEDKALRLILSL  SYEHMKPILMYGKD LNFAE TSKLL E+RRLKSEGRTS  D+ LV
Subjt:  -----------------IIFELEAIEVKIDDEDKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELV

XP_025611318.1 LOW QUALITY PROTEIN: uncharacterized protein LOC112703916 [Arachis hypogaea]

1.3e-34

59.86

Show/hide

Query:  MSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDKAL
        M DE+WEE+DLRA +AIR  LAKN+L NV GM TAKELW+KLE L+QAKGISNR                           II ELEAIEVKIDDEDKAL
Subjt:  MSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDKAL

Query:  RLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS
         LILSL  SYE++KP+LMYGK+ LNF E  SKL+ E+RR+K+EG TS
Subjt:  RLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS

TrEMBL top hits

e value

%identity

Alignment

A0A2K3L7F8 Cytochrome p450

4.8e-30

49.09

Show/hide

Query:  SSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDK
        S M  + WEE+DLRAA+AIR  LAKN+L NVY +S+AKELWE+LE LYQAK ISNR                           I+ ELE+I+V+IDDEDK
Subjt:  SSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDK

Query:  ALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELVRQKVLVKGS
         LRLI SL  SY H+KP+L YGK+ LNF E  +K++ E+RR+KS+  TS     L R  ++ + S
Subjt:  ALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELVRQKVLVKGS

A0A2P5C765 Uncharacterized protein

3.7e-30

54.86

Show/hide

Query:  MSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDKAL
        MSD DW+++D RAA+AIR  LAKN+L NV G++TAK+LW KLE LYQAKG+SNR                           I+ ELEAI VKI+DEDKAL
Subjt:  MSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDEDKAL

Query:  RLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEG
        R I S+ PSYEHMKPIL++GK+ + F+E TSKLL E+RRL   G
Subjt:  RLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEG

A0A444XD23 Uncharacterized protein

2.7e-33

58.28

Show/hide

Query:  KKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDE
        K S M DE+ EE+DLRAA+AI   LAKN+L NV GM TAKELW+KLE LYQAKGISNR                           I+ ELEAI VKIDDE
Subjt:  KKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDE

Query:  DKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS
        DKALRLILSL  SYE++K +LMYGK+ LNF E  SKL+ E+RR+K+EG TS
Subjt:  DKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTS

A0A6A2ZV50 Scarecrow-like protein 32

5.7e-31

58.27

Show/hide

Query:  SDGGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR----IIFELEAIEVKIDDEDKALRLI
        S+G   +    SS    KS MS+E+WEE+D+RAA+ IR  LAKN+L NV   S+ KELWEKLE +YQAK +SN     I+ ELE+I V+IDDEDKALRLI
Subjt:  SDGGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR----IIFELEAIEVKIDDEDKALRLI

Query:  LSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKS
         SL  SYEHM+ +LMYGK+ +NF E TSKL+ E+RRLK+
Subjt:  LSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKS

A0A6J1CG82 uncharacterized protein LOC111010521

1.2e-60

74.21

Show/hide

Query:  QGVEGRPSEVASEKLSSDGGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR----------
        + ++GRPSE ASEKLS DGGPMESSGGSSRGSKKSSMS EDWEEMDLRAA+AIRTSLAKNIL NV+ +STAKELWEKLEALYQAKGISNR          
Subjt:  QGVEGRPSEVASEKLSSDGGPMESSGGSSRGSKKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR----------

Query:  -----------------IIFELEAIEVKIDDEDKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELV
                         IIFELEAIEVKIDDEDKALRLILSL  SYEHMKPILMYGKD LNFAE TSKLL E+RRLKSEGRTS  D+ LV
Subjt:  -----------------IIFELEAIEVKIDDEDKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTELV

SwissProt top hits

e value

%identity

Alignment

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-94

2.7e-14

32.48

Show/hide

Query:  KKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDE
        K  +M  EDW ++D RAA+AIR  L+ +++ N+    TA+ +W +LE+LY +K ++N+                           +I +L  + VKI++E
Subjt:  KKSSMSDEDWEEMDLRAANAIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNR---------------------------IIFELEAIEVKIDDE

Query:  DKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLL-EKRRLKSEGRTSRFDTE
        DKA+ L+ SL  SY+++   +++GK  +   + TS LLL EK R K E +     TE
Subjt:  DKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLL-EKRRLKSEGRTSRFDTE

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCATTTGCACAGTGTTGCGACGCTATGTTGTAACTCTGTGGTGCTGCCTCCTCCGCCAAAAGGCCCCTGCAGCCCGCTTCTTCGATCCTCTTTCATTCTGTCTTCGTC
TTGTCTCCGTTTTGTTGGATTGACGGCAAGTGCAAGTCAAGGATGTGCTGATACAATCTGGGTTACACAAGGCGTTGAAGGAAGACCGAGTGAAGTTGCTTCTGAAAAGC
TAAGCAGTGATGGTGGTCCAATGGAATCTAGTGGTGGTTCCAGTAGAGGTTCTAAAAAGTCCAGCATGAGTGATGAAGATTGGGAGGAAATGGATTTGAGGGCTGCAAAT
GCAATACGAACAAGTTTGGCTAAGAATATTCTTCTGAATGTGTATGGAATGTCGACAGCCAAAGAACTTTGGGAGAAGCTCGAAGCATTGTATCAGGCAAAGGGCATCTC
AAATCGCATCATCTTTGAGCTGGAGGCGATCGAAGTGAAGATAGATGACGAAGATAAAGCACTCAGGCTCATCTTATCACTTCTACCTTCTTATGAACACATGAAGCCGA
TCTTGATGTATGGTAAGGATCCTTTGAATTTTGCTGAGGCTACTAGTAAACTGTTGTTAGAGAAAAGAAGACTGAAGAGTGAAGGGCGTACTTCAAGATTTGACACTGAG
CTGGTTCGTCAAAAGGTTCTGGTGAAAGGATCGAATCCCAAGCGGAAGTGGTTGATCGCTTGTGATTCAACTTGGGTTAACACAACTCCGAACTCAGGCGTGCACTCGCT
GGAGCCGGATGTAATCGAAGAAGTTGCTCAGAAATTCTATCAAAAGCTCATAATATTCCCCATGCATAAGGTTGTTCTCTTTCTTATATATGGAGATAGAGACATGTTCG
AGAGAGCTTCCCCTCGCCTCAAAGGTGTATGTGCGAGTACTGATATGTCGTGCCACGGGTCTGGGGAATCACCAACATTCTCTGCTTCTCACAGTACTACGGATAGGGGG
GCTTGGTGGCATCCTAAGTGGTCTCGTGAGGTATATCACAGTTTGGATACAGAGTGTGTCAACACCATCTTGGCCACTAATTGTCCTCTGTATAGAGGACATCCAAGAGC
ACTCGACCTCATTCTCAATGTGGTCCGCGTGCCCAGTTGTTTTCTCGACTCAATCCATGTGGCTTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MHLHSVATLCCNSVVLPPPPKGPCSPLLRSSFILSSSCLRFVGLTASASQGCADTIWVTQGVEGRPSEVASEKLSSDGGPMESSGGSSRGSKKSSMSDEDWEEMDLRAAN
AIRTSLAKNILLNVYGMSTAKELWEKLEALYQAKGISNRIIFELEAIEVKIDDEDKALRLILSLLPSYEHMKPILMYGKDPLNFAEATSKLLLEKRRLKSEGRTSRFDTE
LVRQKVLVKGSNPKRKWLIACDSTWVNTTPNSGVHSLEPDVIEEVAQKFYQKLIIFPMHKVVLFLIYGDRDMFERASPRLKGVCASTDMSCHGSGESPTFSASHSTTDRG
AWWHPKWSREVYHSLDTECVNTILATNCPLYRGHPRALDLILNVVRVPSCFLDSIHVA

Moc07g02210 (gene) of Bitter gourd (OHB3-1) v2 genome