CuGenDBv2

Gene ID	Moc02g14980
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrovirus-related Pol polyprotein from transposon RE1
Genome location	chr2:11124837..11129598
RNA-Seq Expression	Moc02g14980
Synteny	Moc02g14980
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

TXG55646.1 hypothetical protein EZV62_020902 [Acer yangbiense]

3.7e-97

41.43

Show/hide

Query:  TTEETENSSVPPQVVTNVAVPTPNPSPQFNTS--FGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQV-NP
        TT + +++  P    T         S   N S  FG+ L     +KLD +N+ LW+ MV  +++G + DG++  T   PP+FL SP T G SD     NP
Subjt:  TTEETENSSVPPQVVTNVAVPTPNPSPQFNTS--FGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQV-NP

Query:  EYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCV
        EY +W   DQ L+GWL+ SMT ++A  V+   ++  +WKALE+L+GA SK++ N +R  +Q T+K S  M EYL  MK  ++SL +AG+P   N L + +
Subjt:  EYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCV

Query:  LSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRG
        L+GL++EY+PIV  IE ++  +WQE++ TL+++++ L  +N VS A    +S  SA+   +K N+  N     +Q    QG     +        GR RG
Subjt:  LSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRG

Query:  RFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNR
        R    R NNS+P+CQ+CGK+GH A+VCY R+D+N+      ++SN N  S ++A PE V + +W ADSGAT+HVT+D  NL++KS+Y G  +L VGNG +
Subjt:  RFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNR

Query:  LEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQN
        L+ISH+G   L +  +T  ++ L  +LHVP+I++NLLS+++L  DN+ F+EFH  CCFVKDK T+  VL G LK+ LYQ+++P   S  N
Subjt:  LEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQN

TXG67243.1 hypothetical protein EZV62_008518 [Acer yangbiense]

3.4e-95

40.72

Show/hide

Query:  MTTEETENSSVPPQVVTNVAVPT----PNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQ-
        M+T   + S++ P   ++ A PT     + S   ++ FG+ L     +KLD +N+ LW+ MV  +++G + DG++  T   PP+FL SP T G       
Subjt:  MTTEETENSSVPPQVVTNVAVPT----PNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQ-

Query:  --------VNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGE
                 NPEY +W   DQ L+GWL+ SMT ++A  V+   ++  +WKALE+L+GA SK++ N +R  +Q T+K S  M EYL  MK  ++SL +AG+
Subjt:  --------VNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGE

Query:  PVAFNYLMSCVLSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSND
        P   N L +  L+GL++EY+PIV  IE ++  +WQE++ TL+++++ L  +N VS A    +S  SA+   +K N+  N     +Q    QG     +  
Subjt:  PVAFNYLMSCVLSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSND

Query:  AKNNVRGRGRGRFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG
              GR RGR    R NNS+P+CQ+CGK+GH A+VCY R+D+N+      ++SN N  S ++A PE V + +W ADSGATDHVT+D  NL++KSDY G
Subjt:  AKNNVRGRGRGRFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG

Query:  KGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQ
          +L VGNG +L+ISH+G   L +  +T  ++ L  +LHVP+I++NLLS+++L  DN+ F+EFH  CCFVKDK T   VL G LK+ LYQ+++P   S  
Subjt:  KGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQ

Query:  N
        N
Subjt:  N

TXG69253.1 hypothetical protein EZV62_004188 [Acer yangbiense]

1.3e-94

40.52

Show/hide

Query:  MTTEETENSSVPPQVVTNVAVPT----PNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQ-
        M+T   + S++ P   ++ A PT     + S   ++ FG+ L     +KLD +N+ LW+ MV  +++G + DG++  T   PP+FL SP T G       
Subjt:  MTTEETENSSVPPQVVTNVAVPT----PNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQ-

Query:  --------VNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGE
                 NPEY +W   DQ L+GWL+ SMT ++A  V+   ++  +WKALE+L+GA SK++ N +R  +Q T+K S  M EYL  MK  ++SL +AG+
Subjt:  --------VNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGE

Query:  PVAFNYLMSCVLSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSND
        P   N L +  L+GL++EY+PIV  IE ++  +WQE++ TL+++++ L  +N VS A    +S  SA+   +K N+  N     +Q    QG     +  
Subjt:  PVAFNYLMSCVLSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSND

Query:  AKNNVRGRGRGRFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG
              GR RGR    R NNS+P+CQ+CGK+GH A+VCY R+D+N+      ++SN N  S ++A PE V + +W ADSGAT+HVT+D  NL++KSDY G
Subjt:  AKNNVRGRGRGRFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG

Query:  KGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQ
          +L VGNG +L+ISH+G   L +  +T  ++ L  +LHVP+I++NLLS+++L  DN+ F+EFH  CCFVKDK T   VL G LK+ LYQ+++P   S  
Subjt:  KGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQ

Query:  N
        N
Subjt:  N

XP_022157748.1 uncharacterized protein LOC111024384 isoform X1 [Momordica charantia]

2.1e-217

99.74

Show/hide

Query:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
        MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
Subjt:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY

Query:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
        VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
Subjt:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS

Query:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
        GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGS NYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
Subjt:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF

Query:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG
        SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG
Subjt:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG

XP_022157750.1 uncharacterized protein LOC111024384 isoform X2 [Momordica charantia]

6.1e-217

99.48

Show/hide

Query:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
        MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
Subjt:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY

Query:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
        VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
Subjt:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS

Query:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
        GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGS NYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
Subjt:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF

Query:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG
        SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG+G
Subjt:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG

TrEMBL top hits

e value

%identity

Alignment

A0A5C7HHE9 Uncharacterized protein

1.8e-97

41.43

Show/hide

Query:  TTEETENSSVPPQVVTNVAVPTPNPSPQFNTS--FGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQV-NP
        TT + +++  P    T         S   N S  FG+ L     +KLD +N+ LW+ MV  +++G + DG++  T   PP+FL SP T G SD     NP
Subjt:  TTEETENSSVPPQVVTNVAVPTPNPSPQFNTS--FGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQV-NP

Query:  EYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCV
        EY +W   DQ L+GWL+ SMT ++A  V+   ++  +WKALE+L+GA SK++ N +R  +Q T+K S  M EYL  MK  ++SL +AG+P   N L + +
Subjt:  EYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCV

Query:  LSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRG
        L+GL++EY+PIV  IE ++  +WQE++ TL+++++ L  +N VS A    +S  SA+   +K N+  N     +Q    QG     +        GR RG
Subjt:  LSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRG

Query:  RFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNR
        R    R NNS+P+CQ+CGK+GH A+VCY R+D+N+      ++SN N  S ++A PE V + +W ADSGAT+HVT+D  NL++KS+Y G  +L VGNG +
Subjt:  RFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNR

Query:  LEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQN
        L+ISH+G   L +  +T  ++ L  +LHVP+I++NLLS+++L  DN+ F+EFH  CCFVKDK T+  VL G LK+ LYQ+++P   S  N
Subjt:  LEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQN

A0A5C7ID32 Uncharacterized protein

1.7e-95

40.72

Show/hide

Query:  MTTEETENSSVPPQVVTNVAVPT----PNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQ-
        M+T   + S++ P   ++ A PT     + S   ++ FG+ L     +KLD +N+ LW+ MV  +++G + DG++  T   PP+FL SP T G       
Subjt:  MTTEETENSSVPPQVVTNVAVPT----PNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQ-

Query:  --------VNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGE
                 NPEY +W   DQ L+GWL+ SMT ++A  V+   ++  +WKALE+L+GA SK++ N +R  +Q T+K S  M EYL  MK  ++SL +AG+
Subjt:  --------VNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGE

Query:  PVAFNYLMSCVLSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSND
        P   N L +  L+GL++EY+PIV  IE ++  +WQE++ TL+++++ L  +N VS A    +S  SA+   +K N+  N     +Q    QG     +  
Subjt:  PVAFNYLMSCVLSGLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSND

Query:  AKNNVRGRGRGRFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG
              GR RGR    R NNS+P+CQ+CGK+GH A+VCY R+D+N+      ++SN N  S ++A PE V + +W ADSGATDHVT+D  NL++KSDY G
Subjt:  AKNNVRGRGRGRFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNN---LSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG

Query:  KGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQ
          +L VGNG +L+ISH+G   L +  +T  ++ L  +LHVP+I++NLLS+++L  DN+ F+EFH  CCFVKDK T   VL G LK+ LYQ+++P   S  
Subjt:  KGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQ

Query:  N
        N
Subjt:  N

A0A6J1DTZ7 uncharacterized protein LOC111024384 isoform X2

2.9e-217

99.48

Show/hide

Query:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
        MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
Subjt:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY

Query:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
        VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
Subjt:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS

Query:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
        GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGS NYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
Subjt:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF

Query:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG
        SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNG+G
Subjt:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG

A0A6J1DU77 uncharacterized protein LOC111024384 isoform X1

1.0e-217

99.74

Show/hide

Query:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
        MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
Subjt:  MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY

Query:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
        VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
Subjt:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS

Query:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
        GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGS NYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF
Subjt:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRF

Query:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG
        SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG
Subjt:  SPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKG

A0A803PEH4 Uncharacterized protein

1.3e-95

42.22

Show/hide

Query:  TTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHP-LGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY
        T     NSSV     +N      N + Q   +F  P L    ++KLD  NY+LW+ MV  ++RG +  GY+ GTL  PP+F++  +T+ T      NPEY
Subjt:  TTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHP-LGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEY

Query:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS
          W   DQ L+GWL+ SMT  IA +V+   S+  + + LE LYGA SK++++  R ++Q T+K S  MSEYL   K  S  L LAG+P    +L++ VL 
Subjt:  VEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLS

Query:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSY-NSNDAKNNVRGRGRGR
        GL+AEYL IV QIE + +T+WQEL   L++F++ + RL  ++  + +  S      + +K N+ G  +  QSQ+      G + NS    N  RGRGRG 
Subjt:  GLEAEYLPIVCQIEGKDSTSWQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSY-NSNDAKNNVRGRGRGR

Query:  FSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENF----------NNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLT
             G+ S+P+CQ+ GKYGH AAVCY RFDE++           N +   NN +SA++A PE++   +W ADSGA++H+TSD +NL  K DYNGK ++ 
Subjt:  FSPYRGNNSKPSCQLCGKYGHIAAVCYKRFDENF----------NNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLT

Query:  VGNGNRLEISHIGHTCLQTKPITSGN-LQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQNQNQ
        VGNG++L I+HIG+  L    I SGN L L ++L VPKI +NL+S++KL  DNN  +EF+   C VKDK TKKV+LHGVLKDELYQ+  P   S+    Q
Subjt:  VGNGNRLEISHIGHTCLQTKPITSGN-LQLSNILHVPKIKRNLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQNQNQ

Query:  QRSMSSVQQCLASN
           +S+    + SN
Subjt:  QRSMSSVQQCLASN

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

1.7e-44

31.24

Show/hide

Query:  KLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYG
        KL   NY +W   V A+  G +  G++ G+   P      P T GT    +VNP+Y  W+  D+ +   + G+++ S+   V    ++ ++W+ L  +Y 
Subjt:  KLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYG

Query:  ATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLSGLEAEYLPIVCQIEGKDS-TSWQELFATLVTFENTLMRLNIVST
          S   + QLR  L+   K +  + +Y+  +    + L L G+P+  +  +  VL  L  EY P++ QI  KD+  +  E+   L+  E+ ++    VS+
Subjt:  ATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLSGLEAEYLPIVCQIEGKDS-TSWQELFATLVTFENTLMRLNIVST

Query:  ATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVR--GRGRGRFSPYRGNNSKP---SCQLCGKYGHIAAVCYKRFDENFNNLSS
        AT   I   +AN V  +  +  N       +  G     Y++ +  NN +   +    F P   N SKP    CQ+CG  GH A    KR  +  + LSS
Subjt:  ATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVR--GRGRGRFSPYRGNNSKP---SCQLCGKYGHIAAVCYKRFDENFNNLSS

Query:  SNNN---------RNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKR
         N+          +  A +A+    +  +WL DSGAT H+TSD +NL++   Y G   + V +G+ + ISH G T L TK   S  L L NIL+VP I +
Subjt:  SNNN---------RNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKR

Query:  NLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQ
        NL+S+ +L   N   VEF P    VKD  T   +L G  KDELY+
Subjt:  NLLSIAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQ

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

3.6e-39

28.34

Show/hide

Query:  KLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYG
        KL   NY +W   V A+  G +  G++ G+   P      P T GT    +VNP+Y  W+  D+ +   + G+++ S+   V    ++ ++W+ L  +Y 
Subjt:  KLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFRSSREVWKALEDLYG

Query:  ATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLSGLEAEYLPIVCQIEGKDS-TSWQELFATLVTFENTLMRLNIVST
          S   + QLR + +                    + L L G+P+  +  +  VL  L  +Y P++ QI  KD+  S  E+   L+  E+ L+ LN    
Subjt:  ATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLSGLEAEYLPIVCQIEGKDS-TSWQELFATLVTFENTLMRLNIVST

Query:  ATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRFSPYRGNNSKPS-----CQLCGKYGHIAAVC--YKRFDENFNNL
                 +AN V  +     N   +++Q+ +G  R   N+N+  N+ +    G     R +N +P      CQ+C   GH A  C    +F    N  
Subjt:  ATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRFSPYRGNNSKPS-----CQLCGKYGHIAAVC--YKRFDENFNNL

Query:  SSSNNN---RNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLS
         S++     +  A +A+       +WL DSGAT H+TSD +NL+    Y G   + + +G+ + I+H G   L   P +S +L L+ +L+VP I +NL+S
Subjt:  SSSNNN---RNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLS

Query:  IAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQ
        + +L   N   VEF P    VKD  T   +L G  KDELY+
Subjt:  IAKLTADNNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQ

Arabidopsis top hits

e value

%identity

Alignment

AT5G48050.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162)

5.3e-09

23.79

Show/hide

Query:  LTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFR-SSREVWKALE
        +T+ L+  NY +WR +   +       G++ G+         +P TE              W+  D  +  W++G++T S+   ++    ++R++W +LE
Subjt:  LTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEYVEWQAVDQALLGWLFGSMTPSIACDVVDFR-SSREVWKALE

Query:  DLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLSGLEAEYLPIVCQIEGKDS-TSWQELFATLVTFENTLMRLN
        +L+    +AR  Q  N L+ T  + L + EY   +K  S+ L     P++   L+  +L+GL  +Y  I+  I+ K    S+ E  + L+  E+ L   +
Subjt:  DLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLSGLEAEYLPIVCQIEGKDS-TSWQELFATLVTFENTLMRLN

Query:  IVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRFSPYRGNNS
          S +     S  +  +   +Q     +++H + S  G+GR     +  KN   G   GR   Y  NN+
Subjt:  IVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRFSPYRGNNS

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGACCGAAGAAACCGAAAATTCATCTGTTCCTCCACAAGTGGTCACAAATGTGGCTGTCCCAACACCAAATCCTTCACCACAATTTAATACCTCCTTTGGTCATCC
CCTGGGCACTGTTTTAACAGTAAAGTTGGATGACAAAAATTATTCTCTTTGGAGAGGAATGGTGCTCGCTGTCTTAAGGGGTCAAAAATTTGATGGGTATGTGCTGGGAA
CCTTGGCCAAACCACCACAGTTTCTTGTCTCACCAGAAACTGAAGGAACTTCAGACCATCTTCAAGTGAATCCTGAATATGTGGAGTGGCAAGCAGTTGATCAAGCTCTA
CTTGGTTGGCTTTTTGGATCAATGACTCCTTCTATTGCCTGCGATGTCGTTGACTTCAGAAGTTCAAGAGAAGTATGGAAAGCTCTTGAGGATCTCTATGGAGCAACAAG
TAAGGCACGCATAAATCAGTTGCGGAATGTTCTTCAAAATACCAAGAAAAACTCTCTGAAGATGTCAGAATATCTTGGACTTATGAAACAAGCCTCTGAAAGTCTCAAAT
TAGCAGGTGAGCCTGTTGCTTTTAATTATTTAATGTCTTGTGTACTCTCAGGTTTAGAGGCAGAATATCTTCCAATTGTCTGTCAAATTGAAGGGAAAGATTCAACTTCA
TGGCAAGAGTTGTTTGCTACACTAGTGACGTTTGAAAACACTTTAATGAGGCTAAATATTGTTTCTACCGCTACTGCTGAGGGCATCTCTGATGGGAGTGCTAATTATGT
ACATTCAAAGCAAAATTCAGTTGGGAATAGACAGTTCCATCAGTCTCAATCAGGACAAGGACAAGGAAGAGGCAGTTACAACTCAAATGATGCTAAAAACAACGTGAGAG
GAAGAGGTCGTGGCAGATTCAGTCCTTATAGAGGAAATAACTCTAAACCAAGTTGTCAACTATGTGGCAAATATGGGCATATAGCAGCTGTTTGTTACAAAAGGTTTGAT
GAAAACTTCAATAATTTGTCTAGCTCCAACAACAACCGTAATTCTGCATATATGGCTATCCCAGAGATTGTTGCTGAACCTAGTTGGTTAGCAGATAGTGGGGCTACAGA
TCATGTCACTTCAGACCTCTCAAACTTGAATGTTAAGTCTGATTACAATGGTAAAGGTACATTAACTGTTGGTAATGGTAATAGGCTAGAAATTTCACATATTGGGCACA
CTTGTTTGCAAACCAAACCTATTACTTCTGGCAATTTACAACTCAGCAATATACTTCATGTTCCAAAAATTAAAAGAAACCTCTTGAGTATTGCCAAACTCACTGCTGAT
AATAATTGTTTTGTTGAATTTCATCCGACTTGTTGTTTTGTGAAGGACAAGGAAACAAAGAAGGTGGTGCTGCACGGAGTTCTCAAAGATGAACTATACCAAGTCAAGTT
ACCTCTCCAAACCAGCAATCAAAATCAAAACCAGCAGCGTTCAATGTCTTCTGTTCAACAATGTTTAGCTAGCAACAATCTGTCTTTGTCTACTAGCAATAGCACCTTCA
GAACCACTATCCTCTTTGTTGCCAAGTCCAGAGCATACAATTGGGAGCCAAAGTCAAGGCCACGTTTTACGAATGGTTGGATGATCGATAGGCCAAGGTCGGGTGTCTTG
TCAGATTTCATCCCTATAAATAGGGATGCATGCCCCTTGTGCAAGTTACGCAAATCCATTTGCATTCTGAGAGTTAGATAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MTTEETENSSVPPQVVTNVAVPTPNPSPQFNTSFGHPLGTVLTVKLDDKNYSLWRGMVLAVLRGQKFDGYVLGTLAKPPQFLVSPETEGTSDHLQVNPEYVEWQAVDQAL
LGWLFGSMTPSIACDVVDFRSSREVWKALEDLYGATSKARINQLRNVLQNTKKNSLKMSEYLGLMKQASESLKLAGEPVAFNYLMSCVLSGLEAEYLPIVCQIEGKDSTS
WQELFATLVTFENTLMRLNIVSTATAEGISDGSANYVHSKQNSVGNRQFHQSQSGQGQGRGSYNSNDAKNNVRGRGRGRFSPYRGNNSKPSCQLCGKYGHIAAVCYKRFD
ENFNNLSSSNNNRNSAYMAIPEIVAEPSWLADSGATDHVTSDLSNLNVKSDYNGKGTLTVGNGNRLEISHIGHTCLQTKPITSGNLQLSNILHVPKIKRNLLSIAKLTAD
NNCFVEFHPTCCFVKDKETKKVVLHGVLKDELYQVKLPLQTSNQNQNQQRSMSSVQQCLASNNLSLSTSNSTFRTTILFVAKSRAYNWEPKSRPRFTNGWMIDRPRSGVL
SDFIPINRDACPLCKLRKSICILRVR

Moc02g14980 (gene) of Bitter gourd (OHB3-1) v2 genome