CuGenDBv2

Gene ID	Moc04g12190
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Transposon Ty3-G Gag-Pol polyprotein
Genome location	chr4:9216042..9221134
RNA-Seq Expression	Moc04g12190
Synteny	Moc04g12190
Gene Ontology terms	GO:0005488 - binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022138327.1 uncharacterized protein LOC111009540 isoform X1 [Momordica charantia]

6.6e-70

49.45

Show/hide

Query:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC
        MAGK+   + KG A D S  Q LSPKS   RLLL+EDSLGEVRS+VQ IH L ENL + LE I  EQERL+  L                    N DG+ 
Subjt:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC

Query:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------
                          D+ FL  +PRF R + Y   GGVRTDF+MKIDLPTFNGKMDVE FLD VKNVENFFDYTNTPEDKK                
Subjt:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------

Query:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT
                                                 YQRCRQG K IAD TE FHRLGA+ N+ + EDYKI R++DGLREDIQDQM IQPI LLT
Subjt:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT

Query:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP
        DAI MATKIEDK   KRL+ P RRTPWDK   +K  T D+GK   +G  S ST  KP DD AK  P
Subjt:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP

XP_022138328.1 uncharacterized protein LOC111009540 isoform X2 [Momordica charantia]

6.6e-70

49.45

Show/hide

Query:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC
        MAGK+   + KG A D S  Q LSPKS   RLLL+EDSLGEVRS+VQ IH L ENL + LE I  EQERL+  L                    N DG+ 
Subjt:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC

Query:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------
                          D+ FL  +PRF R + Y   GGVRTDF+MKIDLPTFNGKMDVE FLD VKNVENFFDYTNTPEDKK                
Subjt:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------

Query:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT
                                                 YQRCRQG K IAD TE FHRLGA+ N+ + EDYKI R++DGLREDIQDQM IQPI LLT
Subjt:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT

Query:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP
        DAI MATKIEDK   KRL+ P RRTPWDK   +K  T D+GK   +G  S ST  KP DD AK  P
Subjt:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP

XP_024021836.1 uncharacterized protein LOC112091747 [Morus notabilis]

2.6e-34

53.33

Show/hide

Query:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED
        L   TRT+IDA++ GA M KTE  AY+LLE+M  NNYQW SERS +K++ G+++VD I  LT Q+ASL+KQLQS+QL  NAIQ     CE+C G+H+S +
Subjt:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED

Query:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGWVPGRRNLT-KWQN
        CQ  NPF Q Q E  Q+VGN+ RQ NNP    +N GW   R +L   W+N
Subjt:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGWVPGRRNLT-KWQN

XP_024031895.1 uncharacterized protein LOC112094656 [Morus notabilis]

4.8e-36

55.03

Show/hide

Query:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED
        L   TRT+IDA++ GA M KTE  AY+LLE+M  NNYQW SERS  K++ G+++VD I  LT Q+AS +KQLQS+QL  NAIQ     CE+C  +H+S +
Subjt:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED

Query:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGWVPGRRNLTKWQN
        CQ  NPF Q Q EQ Q+VGN+ RQ NNPYSN +N GW     NL+ W+N
Subjt:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGWVPGRRNLTKWQN

XP_034899370.1 LOW QUALITY PROTEIN: uncharacterized protein LOC118037487 [Populus alba]

3.0e-38

60.58

Show/hide

Query:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED
        L+  TRT+IDAAS GAFM K++  AY+LLEEM +NNYQW +ERS QK+++GV+++D I ALT QV SLT+QL+++QL+ NAI    T C++C+GNH SE+
Subjt:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED

Query:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW
        CQVGNPF Q +H    FV N++RQ NNPYS TYNPGW
Subjt:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW

TrEMBL top hits

e value

%identity

Alignment

A0A3S3N117 Retrotrans_gag domain-containing protein

4.5e-32

55.47

Show/hide

Query:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED
        L + TRT IDAA+ G  M K+   AY+L+EEM  NNYQW S+   QK+  GV+++D I+ALT QVA+L+KQ+QS  + V+A+Q     CE+C GNH   D
Subjt:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED

Query:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW
        CQVGNPF     EQV +V N++RQ NNPYSNTYNPGW
Subjt:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW

A0A6J0ZYV0 uncharacterized protein LOC110413413

8.8e-28

52.27

Show/hide

Query:  RTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSEDCQVGN
        +TIIDAA+ GA M K    AY+LLEEM  NNYQW SERS  ++++G  ++D +  LTTQVA+L+K+L +  L V+A+Q     CE C  +H  + C   +
Subjt:  RTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSEDCQVGN

Query:  PFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW
               E VQFVGNFNRQ NNPYSNTYNPGW
Subjt:  PFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW

A0A6J1CAS9 uncharacterized protein LOC111009540 isoform X1

3.2e-70

49.45

Show/hide

Query:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC
        MAGK+   + KG A D S  Q LSPKS   RLLL+EDSLGEVRS+VQ IH L ENL + LE I  EQERL+  L                    N DG+ 
Subjt:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC

Query:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------
                          D+ FL  +PRF R + Y   GGVRTDF+MKIDLPTFNGKMDVE FLD VKNVENFFDYTNTPEDKK                
Subjt:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------

Query:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT
                                                 YQRCRQG K IAD TE FHRLGA+ N+ + EDYKI R++DGLREDIQDQM IQPI LLT
Subjt:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT

Query:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP
        DAI MATKIEDK   KRL+ P RRTPWDK   +K  T D+GK   +G  S ST  KP DD AK  P
Subjt:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP

A0A6J1CCQ8 uncharacterized protein LOC111009540 isoform X2

3.2e-70

49.45

Show/hide

Query:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC
        MAGK+   + KG A D S  Q LSPKS   RLLL+EDSLGEVRS+VQ IH L ENL + LE I  EQERL+  L                    N DG+ 
Subjt:  MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYL-------------------GNRDGQC

Query:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------
                          D+ FL  +PRF R + Y   GGVRTDF+MKIDLPTFNGKMDVE FLD VKNVENFFDYTNTPEDKK                
Subjt:  E-----------------DKDFLWGNPRFDRFD-YQNGGGVRTDFRMKIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKK----------------

Query:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT
                                                 YQRCRQG K IAD TE FHRLGA+ N+ + EDYKI R++DGLREDIQDQM IQPI LLT
Subjt:  ----------------------------------------QYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLT

Query:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP
        DAI MATKIEDK   KRL+ P RRTPWDK   +K  T D+GK   +G  S ST  KP DD AK  P
Subjt:  DAITMATKIEDKIDRKRLKNPIRRTPWDKSVTAKFFTFDSGK---VGAASTSTAPKPTDDIAKPPP

A0A6P5S0R1 Reverse transcriptase

2.9e-31

56.93

Show/hide

Query:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED
        LD  ++T+IDAA++GA M KT+  AY+LLE M  N+YQW SER+  K++ GV+DV+ I ALT Q+++L+KQL S  L VNAIQ P   CE+C  +H S D
Subjt:  LDNGTRTIIDAASQGAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSED

Query:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW
        C  GNPF     EQV  VG+FNRQ NNPYSNTYNP W
Subjt:  CQVGNPFMQGQHEQVQFVGNFNRQPNNPYSNTYNPGW

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCGGGAAGAATGCAGCGACTTCCGGCAAAGGACTCGCAGCGGATCCTTCGGCAAGTCAACCTCTGTCACCGAAATCTGCCATCGAACGTTTACTGTTGGTGGAAGA
TTCATTAGGAGAGGTTCGTTCCAGTGTACAGACAATCCACGGACTTAAGGAAAATCTTTCCAAACATCTGGAGAATATAGCAATTGAGCAAGAGCGGCTGCGTGATTATC
TAGGCAACCGCGACGGCCAATGTGAAGACAAAGACTTTCTTTGGGGAAATCCTCGTTTTGATCGTTTTGATTATCAAAATGGGGGAGGTGTTCGAACTGATTTTCGAATG
AAGATTGACCTACCAACTTTCAATGGGAAGATGGACGTTGAGGGATTCTTGGATTGGGTCAAGAATGTAGAAAATTTCTTTGATTACACTAATACCCCAGAAGATAAAAA
GCAGTATCAGCGCTGTCGACAAGGGGCAAAGAACATAGCCGATTGTACTGAGGAATTCCATCGACTAGGAGCACGAAACAACTTAACAAAGATAGAAGATTATAAGATTA
CCCGATATATTGATGGTCTTCGTGAGGATATACAAGATCAAATGTATATTCAGCCAATTAGGCTCCTGACCGATGCTATAACCATGGCTACAAAGATCGAAGACAAGATT
GATAGGAAACGCCTCAAGAATCCTATTCGACGTACGCCTTGGGATAAATCTGTAACTGCTAAATTCTTTACCTTTGATTCAGGGAAGGTTGGGGCCGCTTCTACATCAAC
GGCACCCAAACCCACTGATGATATTGCTAAACCTCCTCCTAAGCCTGCGGAGGCCGAAGAAGGTGCCTACAATCTTGATGAAGATGTTCTTGCCGACGACGACGACACTG
CCTATATAGAGCCCGATGAAGGACAAGTGACCGCTTTCGAACATCTTCCTATAACATATGACAATGACAGTGATTTCCATACCATTTGGCAACAATGCAACCAACATGTT
AATTGCAATGACTTTCATATTCTTGATGGCTATCTGTGTAAAGGAGACCGACTGTGCATTCCACATACGTCATTAAGGGAATCCTTAATTCGGGATATGCACAGTGGCGG
ACTTGAGTTGATGAAGAGGAGAAAAAGAGGAAATAAAGAAGAAAAATCGAACCAAATTCCAGTGTGTTGGACGCCTAGGCGCCGAAAATTGACAAAATGGCAGAATGTTG
GGCGCCAAGGCGCTACGAAGTTGGAAGCGGAGTTCGTGTTTGGGCGCCTAGGCCCCAAAATTGGGCGCTTAGATAATGGAACAAGAACTATAATAGATGCAGCATCACAA
GGGGCCTTCATGGGAAAAACTGAAAGTGGAGCATACGATTTGTTGGAAGAAATGACATTGAACAACTACCAGTGGCATAGTGAGAGGTCAGCTCAGAAAAGGTCGATGGG
AGTAAATGATGTGGATGTTATCGCTGCATTGACCACGCAGGTTGCTTCCCTTACCAAGCAACTTCAATCAAGTCAGCTTGCGGTAAATGCTATACAAATACCACCTACAT
TTTGTGAATATTGTTATGGTAACCATCGTAGTGAAGATTGTCAAGTGGGGAACCCATTTATGCAAGGCCAACATGAGCAAGTTCAGTTTGTTGGGAATTTTAATCGCCAG
CCAAATAACCCCTATTCCAACACCTATAATCCAGGTTGGGTGCCTGGGCGTCGAAATTTGACAAAATGGCAGAATGTTGGGTGCCTAGGCGCTTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAGKNAATSGKGLAADPSASQPLSPKSAIERLLLVEDSLGEVRSSVQTIHGLKENLSKHLENIAIEQERLRDYLGNRDGQCEDKDFLWGNPRFDRFDYQNGGGVRTDFRM
KIDLPTFNGKMDVEGFLDWVKNVENFFDYTNTPEDKKQYQRCRQGAKNIADCTEEFHRLGARNNLTKIEDYKITRYIDGLREDIQDQMYIQPIRLLTDAITMATKIEDKI
DRKRLKNPIRRTPWDKSVTAKFFTFDSGKVGAASTSTAPKPTDDIAKPPPKPAEAEEGAYNLDEDVLADDDDTAYIEPDEGQVTAFEHLPITYDNDSDFHTIWQQCNQHV
NCNDFHILDGYLCKGDRLCIPHTSLRESLIRDMHSGGLELMKRRKRGNKEEKSNQIPVCWTPRRRKLTKWQNVGRQGATKLEAEFVFGRLGPKIGRLDNGTRTIIDAASQ
GAFMGKTESGAYDLLEEMTLNNYQWHSERSAQKRSMGVNDVDVIAALTTQVASLTKQLQSSQLAVNAIQIPPTFCEYCYGNHRSEDCQVGNPFMQGQHEQVQFVGNFNRQ
PNNPYSNTYNPGWVPGRRNLTKWQNVGCLGA

Moc04g12190 (gene) of Bitter gourd (OHB3-1) v2 genome