CuGenDBv2

Gene ID	Moc06g17860
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Gag/pol protein
Genome location	chr6:13966992..13972632
RNA-Seq Expression	Moc06g17860
Synteny	Moc06g17860
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008234 - cysteine-type peptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022156835.1 uncharacterized protein LOC111023669 [Momordica charantia]

4.5e-72

63.83

Show/hide

Query:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN
        ++IE YY GLDD TRLVIDA TN  LL KPYAEA NILERISSNNHSWSDPR IQG+G                                 VG S GK N
Subjt:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN

Query:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT
        V HIQ ISC F EG+HHYNN P NPESVYYLGN QNN  N+YSNTYNPGWRN PNFSWSGNQGGNN GTSN  AYQ K  Y P F+NQGQV  Q  +EG+
Subjt:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT

Query:  IASLEKSMKQYMANSDATVQSQAASLRNLELQVGQ
         ASLE  MK+ M  +D TVQSQAASLRNLE+QVGQ
Subjt:  IASLEKSMKQYMANSDATVQSQAASLRNLELQVGQ

XP_022158598.1 uncharacterized protein LOC111025053 [Momordica charantia]

1.0e-52

58.26

Show/hide

Query:  SLKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLG
        S++IETYY GLD+ TRLVIDA  N  LL KPYA+A NILERISS+NHSWSD R I+GK                 S         Y       E +  L 
Subjt:  SLKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLG

Query:  NLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQ
           NNRN +YSNTYNP  RN PNF WSGNQGG+N G SN   +Q K  Y PGFA QGQ+     ++G+I SLE  MKQYMAN+DATVQSQAASLRNLELQ
Subjt:  NLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQ

Query:  VGQLATDLKSLPYGALPS
        VGQLA DLKS P GALPS
Subjt:  VGQLATDLKSLPYGALPS

XP_022158611.1 uncharacterized protein LOC111025065 [Momordica charantia]

2.3e-60

61.4

Show/hide

Query:  LKIETYYNGLDDTTRL----VIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVY
        ++IETYY  L+D TRL     +   ++  L+    +E+   L     N        ++Q   VG  TG  NV  IQ ISC F EGDHHYNNCPGNPESVY
Subjt:  LKIETYYNGLDDTTRL----VIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVY

Query:  YLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNL
        YLGN QNNRNN YSNTYNPGWRN PNFSWSG+QGG+N GTS+  A+Q K  Y PGF NQGQ+ A++ +EG+IASLEK MKQYMAN+DATVQSQA SLRNL
Subjt:  YLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNL

Query:  ELQVGQLATDLKSLP
        +LQVGQLATDLKS P
Subjt:  ELQVGQLATDLKSLP

XP_022158740.1 uncharacterized protein LOC111025203 [Momordica charantia]

3.3e-51

68.94

Show/hide

Query:  KGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQG
        K    +  K NV HIQ IS  F EG+HHYN+CP NP+SVYYLGN  NN NN YSNTYN GW + PNFSWS NQG N+VGTSN  AYQ KG Y P  ANQG
Subjt:  KGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQG

Query:  QVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS
        Q A QKP +G+ ASLE  MKQYM  ++ TVQS AASLRNLELQVGQLATDLKS PYGALPS
Subjt:  QVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS

XP_022159060.1 uncharacterized protein LOC111025500 [Momordica charantia]

4.2e-46

47.66

Show/hide

Query:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN
        ++I+TYYNGLDD TRLVIDA  N  LLAKPYAEA NILERISSNN SWSDPR I GKG                                 VG S GK N
Subjt:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN

Query:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT
        V HIQ ISC F  G++ YNNCPGNPESV+YLGN QNN NN YS             +W+G                                      GT
Subjt:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT

Query:  IASL------EKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS
        I +L      +++M +YM N+D TVQSQA SLRNLE+QVGQLATDLKS P G LPS
Subjt:  IASL------EKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DRG1 uncharacterized protein LOC111023669

2.2e-72

63.83

Show/hide

Query:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN
        ++IE YY GLDD TRLVIDA TN  LL KPYAEA NILERISSNNHSWSDPR IQG+G                                 VG S GK N
Subjt:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN

Query:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT
        V HIQ ISC F EG+HHYNN P NPESVYYLGN QNN  N+YSNTYNPGWRN PNFSWSGNQGGNN GTSN  AYQ K  Y P F+NQGQV  Q  +EG+
Subjt:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT

Query:  IASLEKSMKQYMANSDATVQSQAASLRNLELQVGQ
         ASLE  MK+ M  +D TVQSQAASLRNLE+QVGQ
Subjt:  IASLEKSMKQYMANSDATVQSQAASLRNLELQVGQ

A0A6J1DWK1 uncharacterized protein LOC111025053

5.0e-53

58.26

Show/hide

Query:  SLKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLG
        S++IETYY GLD+ TRLVIDA  N  LL KPYA+A NILERISS+NHSWSD R I+GK                 S         Y       E +  L 
Subjt:  SLKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLG

Query:  NLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQ
           NNRN +YSNTYNP  RN PNF WSGNQGG+N G SN   +Q K  Y PGFA QGQ+     ++G+I SLE  MKQYMAN+DATVQSQAASLRNLELQ
Subjt:  NLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQ

Query:  VGQLATDLKSLPYGALPS
        VGQLA DLKS P GALPS
Subjt:  VGQLATDLKSLPYGALPS

A0A6J1DWN2 uncharacterized protein LOC111025203

1.6e-51

68.94

Show/hide

Query:  KGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQG
        K    +  K NV HIQ IS  F EG+HHYN+CP NP+SVYYLGN  NN NN YSNTYN GW + PNFSWS NQG N+VGTSN  AYQ KG Y P  ANQG
Subjt:  KGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQG

Query:  QVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS
        Q A QKP +G+ ASLE  MKQYM  ++ TVQS AASLRNLELQVGQLATDLKS PYGALPS
Subjt:  QVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS

A0A6J1DXK5 uncharacterized protein LOC111025500

2.1e-46

47.66

Show/hide

Query:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN
        ++I+TYYNGLDD TRLVIDA  N  LLAKPYAEA NILERISSNN SWSDPR I GKG                                 VG S GK N
Subjt:  LKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKG---------------------------------VGTSTGKVN

Query:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT
        V HIQ ISC F  G++ YNNCPGNPESV+YLGN QNN NN YS             +W+G                                      GT
Subjt:  VGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGT

Query:  IASL------EKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS
        I +L      +++M +YM N+D TVQSQA SLRNLE+QVGQLATDLKS P G LPS
Subjt:  IASL------EKSMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS

A0A6J1E1F3 uncharacterized protein LOC111025065

1.1e-60

61.4

Show/hide

Query:  LKIETYYNGLDDTTRL----VIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVY
        ++IETYY  L+D TRL     +   ++  L+    +E+   L     N        ++Q   VG  TG  NV  IQ ISC F EGDHHYNNCPGNPESVY
Subjt:  LKIETYYNGLDDTTRL----VIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTSTGKVNVGHIQEISCLFFEGDHHYNNCPGNPESVY

Query:  YLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNL
        YLGN QNNRNN YSNTYNPGWRN PNFSWSG+QGG+N GTS+  A+Q K  Y PGF NQGQ+ A++ +EG+IASLEK MKQYMAN+DATVQSQA SLRNL
Subjt:  YLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEKSMKQYMANSDATVQSQAASLRNL

Query:  ELQVGQLATDLKSLP
        +LQVGQLATDLKS P
Subjt:  ELQVGQLATDLKSLP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAATAGGCTGGAGTACACTCTTACCACGCTCTTAAACGAGCTGCAGACCTACCAGTCTTTTATGAAAAGTAAGGGACAAGAAGGGGAGGCAAACATTGCCACCTCAAA
AAGGTTCAACCGAGGTTCGTCCTCTGGAACCAAGTCTGCGCCCTCTTCTTCTAGAAGTAAGACTTTTAAGAAGAAGGCTGCTGGTAAGGGGTCTAAACCTGACTCCGCTG
TTGCCGCTGCCAAGAAAGGCAAGGTGAAGGTTGCAGAGAAAGGAAAGTGTTTCCACTGCAATATGGACGGGCATTGGAAGCACAACTGCCTAAAGTACTTGGCCGAAAAG
AAGAAAGCCAACGAAGGTAAATATGATTTACTTGTTCTGGAAACATGTTTAGTGGAGAACGATGACTCCGCCTGGATATTGGATTCAGGAGCCATTAATCACGTAGTGAT
TAACGAGATTTCTGAAGAGGCTACAAACACATCAACAAGAGTTGTTGATCAAACTGGCACTACAACAAGAGTTGTTGATGAAGCCAGTACATCACGTCAGTCACATCCAC
CTCAAGTGTTGAGGGTGCCTCGACGTAGTGGGAGAGTTGTGTCACAACCTGACCGCTATGTGGAAGTGTTCTGCAACAGAAAAAAGGCCTCAACGAAGAACTTCTGTGAT
TTCTCTCAATCAAGCTCTCTCCCTCAACTCTCCCTGACATTCCAAACAAAACGCTCCCACAAGCGTGTTCTCGAAACCCAAGAGGATAGCAAGGAAGACTCGGTGGTGCT
GTTCGGGTGGAAACCGTGGAAGAAAAGTTCTTTAAAGATTGAAACATACTACAATGGATTGGATGACACTACACGTTTGGTCATTGATGCCCCAACAAATGACACATTGC
TAGCAAAACCTTATGCTGAAGCTTGCAATATCTTGGAGAGGATATCATCGAACAATCATTCATGGTCAGACCCTAGAGTCATTCAAGGTAAAGGAGTGGGAACATCAACT
GGTAAGGTAAACGTCGGCCACATCCAGGAGATTTCTTGCTTATTCTTCGAGGGAGATCATCATTATAACAATTGCCCTGGCAATCCAGAGTCGGTTTACTATCTAGGGAA
TCTACAGAACAATAGAAACAACACATATTCCAACACATATAACCCCGGCTGGAGAAATCAACCCAATTTCAGTTGGAGTGGTAATCAGGGAGGAAATAATGTTGGCACCT
CCAATGGTTCAGCGTACCAGCCGAAAGGGAAATATACCCCAGGATTTGCGAATCAAGGTCAGGTAGCAGCACAGAAGCCCGCAGAAGGAACAATTGCGTCATTGGAAAAG
TCGATGAAGCAATATATGGCCAATAGCGATGCTACTGTGCAAAGCCAAGCCGCATCACTAAGAAATCTAGAACTGCAAGTAGGACAGTTAGCAACCGATTTGAAGAGCTT
ACCTTATGGAGCATTGCCAAGCTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MNRLEYTLTTLLNELQTYQSFMKSKGQEGEANIATSKRFNRGSSSGTKSAPSSSRSKTFKKKAAGKGSKPDSAVAAAKKGKVKVAEKGKCFHCNMDGHWKHNCLKYLAEK
KKANEGKYDLLVLETCLVENDDSAWILDSGAINHVVINEISEEATNTSTRVVDQTGTTTRVVDEASTSRQSHPPQVLRVPRRSGRVVSQPDRYVEVFCNRKKASTKNFCD
FSQSSSLPQLSLTFQTKRSHKRVLETQEDSKEDSVVLFGWKPWKKSSLKIETYYNGLDDTTRLVIDAPTNDTLLAKPYAEACNILERISSNNHSWSDPRVIQGKGVGTST
GKVNVGHIQEISCLFFEGDHHYNNCPGNPESVYYLGNLQNNRNNTYSNTYNPGWRNQPNFSWSGNQGGNNVGTSNGSAYQPKGKYTPGFANQGQVAAQKPAEGTIASLEK
SMKQYMANSDATVQSQAASLRNLELQVGQLATDLKSLPYGALPS

Moc06g17860 (gene) of Bitter gourd (OHB3-1) v2 genome