CuGenDBv2

Gene ID	Moc06g27880
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrotrans_gag domain-containing protein
Genome location	chr6:20942408..20951618
RNA-Seq Expression	Moc06g27880
Synteny	Moc06g27880
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function)
InterPro domains	IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022151603.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111019515 [Momordica charantia]

1.9e-79

89.89

Show/hide

Query:  MFQYKRREKKSSKRRAVQAKKLTVPMNEPKTRAAKAKAAEAKKKVVAPGPVDTIELDLSEGEEVETKWNATNLATRTYLMKSRKIMTELGFDLTLGDVPD
        MFQYKRRE KSSKRRAVQ  K TVPMNEPKTRAAKAKAAEAKKKVVAPGPVD IELDLSEGE+VET WNA NLATRT LMK  KIMTELGFDLTLGDVPD
Subjt:  MFQYKRREKKSSKRRAVQAKKLTVPMNEPKTRAAKAKAAEAKKKVVAPGPVDTIELDLSEGEEVETKWNATNLATRTYLMKSRKIMTELGFDLTLGDVPD

Query:  DWRETARDKEWRPLIQPIQCEALELVREFYAAVHPESHIAIVRGKEIRFDATQINCTFNIKNIRDAVGNKILVTPTLE
        DWR+TAR KEWRPLIQPIQCEALELVREFYAA HP+SHIAIVRGKEIRFDATQIN TFNIKNI+DAVGNK+LVTPTLE
Subjt:  DWRETARDKEWRPLIQPIQCEALELVREFYAAVHPESHIAIVRGKEIRFDATQINCTFNIKNIRDAVGNKILVTPTLE

XP_022153526.1 uncharacterized protein LOC111021009 [Momordica charantia]

1.5e-52

56.68

Show/hide

Query:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV
        T+GQF GL +EDP+SHLKSF ++AN+F+LP +S DALRLK+FPFSL   A  WLNA   +SIN+W  + +KFLAKY   T+N D+RE+I+SFRQ+ENE V
Subjt:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV

Query:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIHATCRVCRGQSDCSSLSRVEP
         EAWERFKEL+R CP+  +PACVQIE FYRG D  ++MMLNTAANG    K+ NEIV IL+++ +             CS  SR +P
Subjt:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIHATCRVCRGQSDCSSLSRVEP

XP_022155016.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111022160 [Momordica charantia]

2.2e-51

60.74

Show/hide

Query:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV
        T+GQFGG  ++DP+ HLK+F +IA AF+ P ++ DALRL +FPFSL D ARTWLN     SI TW  L EKFL KY   TR+ D+ E+IV+FRQ + E V
Subjt:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV

Query:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKM
         EAWERFKELLR+CP+HGLPAC+QIE F+RGLD  ++MMLN AANG+  +K+ NEIVDIL  +
Subjt:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKM

XP_022158836.1 uncharacterized protein LOC111025302 [Momordica charantia]

3.8e-80

90.42

Show/hide

Query:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV
        TMGQFGGLTNEDPYSHLKSFIEIANAFQLP  S DALRLKMFPFSL DGARTW+NALE NSINTWAELT+KFLAKYHTLT+N DLREDIVSFRQKENEAV
Subjt:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV

Query:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH
        QEAWERFKELLRRCPSHGLP+CVQIEQFYRGLDRSS+MMLNT ANGSLLEKS NEIVD+LNKM DI+
Subjt:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH

XP_022159127.1 uncharacterized protein LOC111025557 [Momordica charantia]

1.4e-71

82.53

Show/hide

Query:  MGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAVQ
        M QFGG TNEDPYSHLKSFI+IANAFQLP VS DALRLKMFPFSL DGA TW+N LEQN I TWAELT+KFLAKYHTLTRN DL+EDIVSFRQ+E+EAVQ
Subjt:  MGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAVQ

Query:  EAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH
        EAWERFKELL+RC SHGLP CVQI+QFYRGLD   RMM +TAAN SLLEKS NEI+DILNKMIDI+
Subjt:  EAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DCL7 LOW QUALITY PROTEIN: uncharacterized protein LOC111019515

9.1e-80

89.89

Show/hide

Query:  MFQYKRREKKSSKRRAVQAKKLTVPMNEPKTRAAKAKAAEAKKKVVAPGPVDTIELDLSEGEEVETKWNATNLATRTYLMKSRKIMTELGFDLTLGDVPD
        MFQYKRRE KSSKRRAVQ  K TVPMNEPKTRAAKAKAAEAKKKVVAPGPVD IELDLSEGE+VET WNA NLATRT LMK  KIMTELGFDLTLGDVPD
Subjt:  MFQYKRREKKSSKRRAVQAKKLTVPMNEPKTRAAKAKAAEAKKKVVAPGPVDTIELDLSEGEEVETKWNATNLATRTYLMKSRKIMTELGFDLTLGDVPD

Query:  DWRETARDKEWRPLIQPIQCEALELVREFYAAVHPESHIAIVRGKEIRFDATQINCTFNIKNIRDAVGNKILVTPTLE
        DWR+TAR KEWRPLIQPIQCEALELVREFYAA HP+SHIAIVRGKEIRFDATQIN TFNIKNI+DAVGNK+LVTPTLE
Subjt:  DWRETARDKEWRPLIQPIQCEALELVREFYAAVHPESHIAIVRGKEIRFDATQINCTFNIKNIRDAVGNKILVTPTLE

A0A6J1DKX0 uncharacterized protein LOC111021009

7.3e-53

56.68

Show/hide

Query:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV
        T+GQF GL +EDP+SHLKSF ++AN+F+LP +S DALRLK+FPFSL   A  WLNA   +SIN+W  + +KFLAKY   T+N D+RE+I+SFRQ+ENE V
Subjt:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV

Query:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIHATCRVCRGQSDCSSLSRVEP
         EAWERFKEL+R CP+  +PACVQIE FYRG D  ++MMLNTAANG    K+ NEIV IL+++ +             CS  SR +P
Subjt:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIHATCRVCRGQSDCSSLSRVEP

A0A6J1DQF5 LOW QUALITY PROTEIN: uncharacterized protein LOC111022160

1.1e-51

60.74

Show/hide

Query:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV
        T+GQFGG  ++DP+ HLK+F +IA AF+ P ++ DALRL +FPFSL D ARTWLN     SI TW  L EKFL KY   TR+ D+ E+IV+FRQ + E V
Subjt:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV

Query:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKM
         EAWERFKELLR+CP+HGLPAC+QIE F+RGLD  ++MMLN AANG+  +K+ NEIVDIL  +
Subjt:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKM

A0A6J1DYY9 uncharacterized protein LOC111025557

5.4e-72

83.13

Show/hide

Query:  MGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAVQ
        M QFGG TNEDPYSHLKSFI+IANAFQLP VS DALRLKMFPFSL DGA TWLN LEQN I TWAELT+KFLAKYHTLTRN DL+EDIVSFRQ+E+EAVQ
Subjt:  MGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAVQ

Query:  EAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH
        EAWERFKELL+RC SHGLP CVQI+QFYRGLD   RMM +TAAN SLLEKS NEI+DILNKMIDI+
Subjt:  EAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH

A0A6J1E251 uncharacterized protein LOC111025302

1.8e-80

90.42

Show/hide

Query:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV
        TMGQFGGLTNEDPYSHLKSFIEIANAFQLP  S DALRLKMFPFSL DGARTW+NALE NSINTWAELT+KFLAKYHTLT+N DLREDIVSFRQKENEAV
Subjt:  TMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQKENEAV

Query:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH
        QEAWERFKELLRRCPSHGLP+CVQIEQFYRGLDRSS+MMLNT ANGSLLEKS NEIVD+LNKM DI+
Subjt:  QEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIH

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTTCAATACAAGAGGCGGGAGAAAAAGAGTTCAAAACGTCGTGCAGTTCAGGCTAAGAAGCTGACAGTGCCCATGAATGAACCTAAAACGAGAGCTGCGAAA
GCTAAAGCAGCTGAAGCTAAGAAAAAGGTAGTGGCACCTGGGCCAGTTGATACAATCGAACTGGACTTGTCTGAGGGAGAGGAGGTCGAGACGAAATGGAACGCG
ACAAATTTAGCCACTCGAACTTACTTAATGAAATCCCGTAAGATTATGACAGAATTGGGATTCGATCTCACTCTAGGAGATGTGCCTGATGATTGGAGGGAGACC
GCTAGAGATAAAGAATGGAGACCACTCATTCAGCCCATACAATGTGAGGCTTTGGAGTTAGTCAGAGAGTTCTATGCTGCTGTCCATCCCGAGTCACATATAGCC
ATAGTGCGCGGGAAGGAAATACGGTTTGATGCCACTCAGATCAACTGCACCTTCAACATTAAGAATATCAGAGATGCTGTGGGCAATAAGATTTTAGTGACTCCG
ACTCTGGAACAGCTTGATGAGGCTCTAGAATGTGTTGGGAAGCCTTCTGCCACTTGGGATTTGACTACTCATGGCAAGGTACGACTAAAACCCGAGGATGTTTCC
CTAGCTGCTGCAGGATGGTTATACATAGTCAAAAACAGAATTCTGCCAACGGAGCATGATGAGCATGTCACTCAGGATAGGGCACTGCTGGTTTATGCCATGCTA
AAGGGCATAGATGTGAATTATGGAGAATTGATCAATACCAGTATCCATGAGTGTGCCCACCGGACATGTGGTAAGCTTTATCACCCACGTTTGGTCACTTCTTTA
TGCTTGCGACAAGGTGTACAGCTCCCTGAGGATCAAATTAAGAGAGATGCCCCAATTGTGGAAGAGAAGAATATTCGGCGTATTATCGCCCATGCGTTACAAAGA
AGGGAAGCGCTAGCTGCTATCCTTGGTCATCCATCTTCCAGTACTGACACTGATCCTAGTCCACAACCTAGCTGGGCTAGTAGCCGGTCTTTTAGATGTAAAAGT
CTTAGTGTAAGGAGGGAGTGTGCAGATTCCTTAGGGGACCATTTGGGAGTGCAAATTAATCAAAAGAAGCAAAAAGTCGGAAATACCTACATGGGAGGCGTCAGG
CGCCTGGGAAGCCTGCAGAAAAACAGTTTTTCTTCCAACTTTGCCCTTAATGAAATGCGTCTTCCCATGCGTTTTGGTGGTTCCAACCGATGCATACGTGTAGAA
GAAGTGTTCCACTATCAGTTTGAGCACGATTTGACGATGGGTCAGTTCGGAGGACTGACTAATGAAGATCCTTACTCCCACCTCAAATCTTTTATTGAAATAGCT
AATGCATTTCAACTTCCTATTGTCTCTGGGGATGCACTAAGATTAAAAATGTTTCCTTTTTCTCTCATGGATGGTGCAAGGACTTGGCTAAACGCGTTAGAACAA
AATTCTATCAACACATGGGCGGAACTGACGGAGAAATTTTTGGCGAAGTACCACACTTTGACTAGGAACACAGACCTTCGAGAAGACATTGTGTCTTTTCGACAA
AAGGAAAACGAAGCAGTTCAAGAAGCTTGGGAGCGTTTTAAGGAGTTACTAAGAAGATGCCCGAGCCATGGATTACCCGCATGTGTGCAAATTGAACAATTCTAT
AGAGGATTGGATCGTTCATCAAGGATGATGTTAAACACTGCAGCCAATGGCTCATTGTTAGAAAAGTCGGCTAATGAGATCGTTGATATCTTAAACAAGATGATA
GACATACATGCCACGTGTAGGGTCTGTAGAGGTCAGAGCGACTGTAGCTCGTTGTCTAGGGTAGAGCCAAACCAAAATATGGGAGGGAACGCAGTTGCCTCAACT
TCTAGTCGAGTCAAACCCTGTCCTGAGCTTCCCCCTTCTATTTGCTCTCTGTCCAACCTGTTCAAGCTTCGGGAAGTTTACAGGATCCCTGATAACATAGAAATG
AGATTACCTCTGGTCGATAAAAGCTTAGATAACCCTTCACCTGGGTCGGTAGGTTTCTATCCCGAGATGTTCGACCATGGGGTCAGATTGCCCTTACACCCCTTT
GTACAAAGGTTCCTTTCAACTACGAACTTGGCCCCGGCTCAACTGGTACCGAACGGGTGGACCACACTACTCGATCTGTGGTTCACCTGGTGGAGCTTCAGTGCA
GGCGAAGAGAGTGTCCTCCTAGACGTAGGACAATTCTTTGACACTCACATCATCAAACCTTACAAGGAGCATCCGGGTCGGTACTACATATCGGCTCGGAATAGC
TTCTGCAAGATAGTGGACTCTCCCTCGGCCAATAAGCATTGGAGAGACAAATGGTTCCTCGTCTCGGGTCTCCTCGACGAGCTTGAACCCAACCGAGCTCGCCAC
CTCGAAATCATGGTGTTCAAACCATACAACTCTATGAACCGAAAGCGATCCACCGATCGGCCTGCAGCTGGTGATGCTTCTAAGAAACGTGGGAGGTCAGATGAG
GCTTCATCCGGGCGAAAAAGTCGATTTTCCGACCCGAAGGGGAAGCGCTTCTTCGATGCCTCGTCTCATTCTCGTTCAAAGCCAATCAGCATTCACTCGAAGGAC
GAAATGAGCACTCAGTACCTGCCGATAATGGACTTTTCATACCCCTTCAAGGGCAGTTCTGTTAGGGAGAGCATTCGTGAGGCTGCCCTGACAGCCTACAAGGCC
AGCTCGGCTCAGATGCTGGAATCAAGCCAGTCTTCTTTCTTGGAAAAGCCAAGTGATTACGTGCAGTGTCTGATTGACGACATTGCTCAGCTTCACTTTACAGCC
TTCCATACTAGGGCCATCGTCAGCCAGGAGTTGACTGCTAGGAAGGCCAGCTTCACCCGCGAATGTGAAGCTACCAAACAGACTGAGGAGCTTAGAGTTGAGGTG
GTGAAGCTCTGCAAGGCTAAGGCGACTGAAGAGCGTGTCGACAGGGAAGTGACCGAACGTGCTTCTGAAAAGGCTGACTTTGAAGCAAAGTTGAAGAACTTCGAC
TTCTTGGAATCAGCCATGAAGAAAGTTCCTAATTTTGATGACTTGGTGCGGGACTTAGATGACAGGGGCTTCGACATTGTCGTAGCCGAGGTAAAAAAGCTTGCC
TCTACACTGGACTTGGCTCCTATATATGCAGCCTTTGAGGCAGTTATGGAAGAGGATGAGGAAGGAGAAGCTCAAGCTGACCATCCTGTTGATGAGGGTACTGAA
GTGCGTGCGTTCAGCAAAACGCCCAGTCAGCGCCTCATCATTGGCTCGCTGGTCGAAATGCTCGACTCTGAAGGTGAACTGACCTTTCCTAGCAGGGACTACTTC
GATCAGGTTGAGGCCTCACTAAGCGAACGACCAATGACTGAAAATGGGTGTGAGGGGCTCCAGAGGCCGGTGCGGAATGGTGGCGAAGCGTTGACGGTTATCACA
CTTCTTCACAAACTGCTTTTTTGCAGCTCGACGCGCTACCTTCCTGGCTTCGGCACGGTCATCAAGAAGCTTCCCATTAAAGTAATCTTTGATGGGATCATCAAG
GTTAGAGAAGTTGGCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFQYKRREKKSSKRRAVQAKKLTVPMNEPKTRAAKAKAAEAKKKVVAPGPVDTIELDLSEGEEVETKWNATNLATRTYLMKSRKIMTELGFDLTLGDVPDDWRET
ARDKEWRPLIQPIQCEALELVREFYAAVHPESHIAIVRGKEIRFDATQINCTFNIKNIRDAVGNKILVTPTLEQLDEALECVGKPSATWDLTTHGKVRLKPEDVS
LAAAGWLYIVKNRILPTEHDEHVTQDRALLVYAMLKGIDVNYGELINTSIHECAHRTCGKLYHPRLVTSLCLRQGVQLPEDQIKRDAPIVEEKNIRRIIAHALQR
REALAAILGHPSSSTDTDPSPQPSWASSRSFRCKSLSVRRECADSLGDHLGVQINQKKQKVGNTYMGGVRRLGSLQKNSFSSNFALNEMRLPMRFGGSNRCIRVE
EVFHYQFEHDLTMGQFGGLTNEDPYSHLKSFIEIANAFQLPIVSGDALRLKMFPFSLMDGARTWLNALEQNSINTWAELTEKFLAKYHTLTRNTDLREDIVSFRQ
KENEAVQEAWERFKELLRRCPSHGLPACVQIEQFYRGLDRSSRMMLNTAANGSLLEKSANEIVDILNKMIDIHATCRVCRGQSDCSSLSRVEPNQNMGGNAVAST
SSRVKPCPELPPSICSLSNLFKLREVYRIPDNIEMRLPLVDKSLDNPSPGSVGFYPEMFDHGVRLPLHPFVQRFLSTTNLAPAQLVPNGWTTLLDLWFTWWSFSA
GEESVLLDVGQFFDTHIIKPYKEHPGRYYISARNSFCKIVDSPSANKHWRDKWFLVSGLLDELEPNRARHLEIMVFKPYNSMNRKRSTDRPAAGDASKKRGRSDE
ASSGRKSRFSDPKGKRFFDASSHSRSKPISIHSKDEMSTQYLPIMDFSYPFKGSSVRESIREAALTAYKASSAQMLESSQSSFLEKPSDYVQCLIDDIAQLHFTA
FHTRAIVSQELTARKASFTRECEATKQTEELRVEVVKLCKAKATEERVDREVTERASEKADFEAKLKNFDFLESAMKKVPNFDDLVRDLDDRGFDIVVAEVKKLA
STLDLAPIYAAFEAVMEEDEEGEAQADHPVDEGTEVRAFSKTPSQRLIIGSLVEMLDSEGELTFPSRDYFDQVEASLSERPMTENGCEGLQRPVRNGGEALTVIT
LLHKLLFCSSTRYLPGFGTVIKKLPIKVIFDGIIKVREVG

Moc06g27880 (gene) of Bitter gourd (OHB3-1) v2 genome