CuGenDBv2

Gene ID	Moc07g09220
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrovirus-related Pol polyprotein from transposon TNT 1-94
Genome location	chr7:7078657..7080914
RNA-Seq Expression	Moc07g09220
Synteny	Moc07g09220
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_006589923.1 uncharacterized protein LOC102667168 [Glycine max]

6.3e-25

42.68

Show/hide

Query:  TFKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNK--------VEIEKWDRKWSSTSPKTIRQRRVPLWQNSP--L
        TF ++++ N++ QVN+IP LN  NFK  KE I+IVLGCM+LDLALR +RP ST E  N+         EIE++  K        +  + + +       +
Subjt:  TFKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNK--------VEIEKWDRKWSSTSPKTIRQRRVPLWQNSP--L

Query:  QNTLVK--ETATKLKALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVDDNR
        +  +++    A+KLK+LKLE+ ED LVHLVL SLPA +   +GC+WSR PSD E FI++ D  +
Subjt:  QNTLVK--ETATKLKALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVDDNR

XP_022152232.1 uncharacterized protein LOC111020001 [Momordica charantia]

3.7e-25

90.91

Show/hide

Query:  FKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDR
        FKV NSDNMSTQVNN PRLN ANFK WKEDIQIVLGCM+LDLALRVDRPTS EENPNKVEIEKWDR
Subjt:  FKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDR

XP_022155096.1 uncharacterized protein LOC111022228 [Momordica charantia]

2.6e-31

54.22

Show/hide

Query:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP-LWQNSPLQNTLVK------------
        MSTQVNNIPRLN ANFK WKEDIQIVLGCM+LDLALRVDRPTSTEENPNKVEIEKWDR  S+     I +R +P  ++ S ++ T  K            
Subjt:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP-LWQNSPLQNTLVK------------

Query:  --------------------------------ETATKLKALKLEVSEDFLVHLVLNSLPAEYSHVR
                                          ATKLKALKL+VSE+FLVHLVLNSL AEYSH R
Subjt:  --------------------------------ETATKLKALKLEVSEDFLVHLVLNSLPAEYSHVR

XP_022156979.1 uncharacterized protein LOC111023808 [Momordica charantia]

2.8e-25

79.01

Show/hide

Query:  KVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP
        KV NSDNMSTQVNNIPRLN ANFK WKEDIQIVLGCM+LDLALRVDRPTSTEENPNKVEI+KWDR  S+     I +R +P
Subjt:  KVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP

XP_022158724.1 uncharacterized protein LOC111025186 [Momordica charantia]

3.4e-31

56.29

Show/hide

Query:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRV-PLWQNSPLQNT-----LVKETATKLK
        MSTQVNNIPRLNEANFK WKEDIQIVL CM+LDLALRVDRPTS EENPNKVEIEKWDR  S+     I +R +   ++ S ++ T     L ++     K
Subjt:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRV-PLWQNSPLQNT-----LVKETATKLK

Query:  ALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVDDNRQK
          K EV      H+ ++        ++ CIWSRPPSDAEAFIY+ DDNR K
Subjt:  ALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVDDNRQK

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DFM1 uncharacterized protein LOC111020001

1.8e-25

90.91

Show/hide

Query:  FKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDR
        FKV NSDNMSTQVNN PRLN ANFK WKEDIQIVLGCM+LDLALRVDRPTS EENPNKVEIEKWDR
Subjt:  FKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDR

A0A6J1DQP2 uncharacterized protein LOC111022228

1.3e-31

54.22

Show/hide

Query:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP-LWQNSPLQNTLVK------------
        MSTQVNNIPRLN ANFK WKEDIQIVLGCM+LDLALRVDRPTSTEENPNKVEIEKWDR  S+     I +R +P  ++ S ++ T  K            
Subjt:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP-LWQNSPLQNTLVK------------

Query:  --------------------------------ETATKLKALKLEVSEDFLVHLVLNSLPAEYSHVR
                                          ATKLKALKL+VSE+FLVHLVLNSL AEYSH R
Subjt:  --------------------------------ETATKLKALKLEVSEDFLVHLVLNSLPAEYSHVR

A0A6J1DV67 uncharacterized protein LOC111023808

1.4e-25

79.01

Show/hide

Query:  KVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP
        KV NSDNMSTQVNNIPRLN ANFK WKEDIQIVLGCM+LDLALRVDRPTSTEENPNKVEI+KWDR  S+     I +R +P
Subjt:  KVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRVP

A0A6J1E084 uncharacterized protein LOC111025186

1.7e-31

56.29

Show/hide

Query:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRV-PLWQNSPLQNT-----LVKETATKLK
        MSTQVNNIPRLNEANFK WKEDIQIVL CM+LDLALRVDRPTS EENPNKVEIEKWDR  S+     I +R +   ++ S ++ T     L ++     K
Subjt:  MSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWSSTSPKTIRQRRV-PLWQNSPLQNT-----LVKETATKLK

Query:  ALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVDDNRQK
          K EV      H+ ++        ++ CIWSRPPSDAEAFIY+ DDNR K
Subjt:  ALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVDDNRQK

A5BW89 Integrase catalytic domain-containing protein

1.3e-20

37.93

Show/hide

Query:  VNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRP-----TSTEENPNKV--------------------EIEKWDRKWSSTSPKTIRQ
        +++ ++S  +NN+P LNE NFK WKE++ I+LGCM++DLALR+ +P      ST+E+   +                    EI+K   K       T+  
Subjt:  VNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRP-----TSTEENPNKV--------------------EIEKWDRKWSSTSPKTIRQ

Query:  RRVPL-WQNSPLQNTLVKE---TATKLKALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVD
          + + ++        + E    A+KLKALKLE+S+D LVHLVL SLPA+++  +GC+  R PSDAE  IY+VD
Subjt:  RRVPL-WQNSPLQNTLVKE---TATKLKALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVD

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT5G53670.1 unknown protein

8.2e-07

37.88

Show/hide

Query:  FKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDR
        F V+   +  + V++IP L+ +NF  WKE + +VL  M+LDL+L  +RP+S +      E++ WDR
Subjt:  FKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDR

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCATAGCATTCCAAGTGAGATGCCCAAGATAAAAGGAACGAGGGAAAGAATCGACGAGGAAACCACGCAGATATTGCTACAGGAATTTGTAATTTCTACTCATGGATC
TAGGTATCTCACTTTTAAGGTTGTTAATTCTGATAATATGTCCACTCAAGTCAACAACATTCCTAGACTGAATGAGGCTAATTTTAAGGGCTGGAAAGAAGACATCCAGA
TAGTACTTGGGTGTATGAATTTAGACCTTGCATTAAGGGTAGACCGTCCTACTTCAACTGAGGAAAATCCTAATAAGGTTGAAATTGAGAAGTGGGATAGGAAATGGAGC
AGTACTTCACCAAAAACGATAAGGCAGAGGCGAGTACCCTTATGGCAAAACTCACCTCTTCAAAATACGTTGGTAAAGGAAACTGCAACAAAACTTAAGGCACTAAAGTT
GGAAGTTTCTGAAGATTTTTTAGTGCATTTGGTTTTGAACTCTCTTCCAGCAGAGTATAGCCACGTCAGGGGTTGCATTTGGAGTCGACCGCCAAGTGATGCTGAGGCTT
TCATCTACCTGGTTGACGATAATAGGCAAAAGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MHSIPSEMPKIKGTRERIDEETTQILLQEFVISTHGSRYLTFKVVNSDNMSTQVNNIPRLNEANFKGWKEDIQIVLGCMNLDLALRVDRPTSTEENPNKVEIEKWDRKWS
STSPKTIRQRRVPLWQNSPLQNTLVKETATKLKALKLEVSEDFLVHLVLNSLPAEYSHVRGCIWSRPPSDAEAFIYLVDDNRQK

Moc07g09220 (gene) of Bitter gourd (OHB3-1) v2 genome