CuGenDBv2

Gene ID	Moc04g10310
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	CCHC-type domain-containing protein
Genome location	chr4:7632718..7650678
RNA-Seq Expression	Moc04g10310
Synteny	Moc04g10310
Gene Ontology terms	GO:0005488 - binding (molecular function)
InterPro domains	IPR025724 - GAG-pre-integrase domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA8519786.1 hypothetical protein F0562_014124 [Nyssa sinensis]

5.1e-43

38.14

Show/hide

Query:  TRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNS-GNFGGRGRHSSTVPFGV
        T+S++++ EE + +L  EE  I + HK++     P A++A+N++     PN S  RGY+      +  GR + S+ G   +S G F       S +P+  
Subjt:  TRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNS-GNFGGRGRHSSTVPFGV

Query:  -QPNRPFSDS-AQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS
         QP +    S   H +VC ICN+ GH+ALDCY+RM++++QG  P  QL AM A  N  +  + N  W TD+G   HIT DL  LN   EY  +D IT+ +
Subjt:  -QPNRPFSDS-AQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS

Query:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVP
        G +L I++SG   +     +  L ++  VP++ATNLLSVH+ C DN C  +F ++ F +QDK++ Q+LF GPS +GLYP+ + S +  S P
Subjt:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVP

KAA8524269.1 hypothetical protein F0562_010692 [Nyssa sinensis]

1.1e-48

Show/hide

Query:  TRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNS-GNFGGRGRHSSTVPFGV
        T+S++++ EE + +L  EE  I + HK++     P A++A+N++     PN S  RGY+      +  GR + S+ G   +S G F       S +P+  
Subjt:  TRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNS-GNFGGRGRHSSTVPFGV

Query:  -QPNRPFSDS-AQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS
         QP +    S   H +VC ICN+ GH+ALDCY+RM++++QG  P  QL AM A  N  +  + N  W TD+G   HIT DL  LN   EY  +D IT+ +
Subjt:  -QPNRPFSDS-AQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS

Query:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVP---------
        G +L I++SG   +     +  L ++  VP++ATNLLSVH+ C DN C  +F ++ F +QDK++ Q+LF GPS +GLYP+ + S +  S P         
Subjt:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVP---------

Query:  -------------------RSHVAHVGAQTSSSIWHNRLGHPSDPVLHSV
                             H A++G Q S+ +WH+RLGHPS   L S+
Subjt:  -------------------RSHVAHVGAQTSSSIWHNRLGHPSDPVLHSV

KAA8535282.1 hypothetical protein F0562_030285 [Nyssa sinensis]

8.7e-43

38.14

Show/hide

Query:  TRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNS-GNFGGRGRHSSTVPFGV
        T+S++++ EE + +L  EE  I + HK++     P A++A+N++     PN S  RGY+      +  GR + S+ G   +S G F       S +P+  
Subjt:  TRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNS-GNFGGRGRHSSTVPFGV

Query:  -QPNRPFSDS-AQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS
         QP +    S   H +VC ICN+ GH+ALDCY+RM++++QG  P  QL AM A  N  +  + N  W TD+G   HIT DL  LN   EY  +D IT+ +
Subjt:  -QPNRPFSDS-AQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS

Query:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVP
        G +L I++SG   +     +  L ++  VP++ATNLLSVH+ C DN C  +F ++ F +QDK++ Q+LF GPS +GLYP+ + S +  S P
Subjt:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVP

RWR76373.1 putative polyprotein [Cinnamomum micranthum f. kanehirae]

6.9e-48

38.91

Show/hide

Query:  RSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASN--FKAQN-VNPNISHGRGYNG-GKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPF
        +S  VS    H LL++ E  IA  H    IF+Q  +  A+   F  +N  N N +HG G  G G+G+ QN GR  + S   + NS       + ++ V  
Subjt:  RSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASN--FKAQN-VNPNISHGRGYNG-GKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPF

Query:  GVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS
        G   NR        R+ C ICNR GH+ALDCY+RM++ +QGSHPP +LAAM A+  ++        W TD+G   HIT+++  L+  S+Y R D+++VG+
Subjt:  GVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGS

Query:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVPRSHVAHVGA
        G  L I++ G   ++TP+S+  L ++  VP+I+TNL+SVHR   DN C  +F +  F ++DK+SG+ LF G S NGLYP         S    H A VG 
Subjt:  GHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVPRSHVAHVGA

Query:  QTSSSIWHNRLGHPSDPVLHSVFRIMNLP
        + ++SIWH+RLGHP+  V   +     LP
Subjt:  QTSSSIWHNRLGHPSDPVLHSVFRIMNLP

XP_022156563.1 uncharacterized protein LOC111023438 [Momordica charantia]

8.4e-54

53.68

Show/hide

Query:  NVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPFGVQPNRPFSDSAQH----RLVCHICNRPGHTALDCYNRMNYNFQGSHPP
        N NPN+  GRG   GK  F    ++K+ +   TGN     GRGR       G+ P  P   S+Q      + C IC + GH+ALDC+NRMNY+FQG HPP
Subjt:  NVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPFGVQPNRPFSDSAQH----RLVCHICNRPGHTALDCYNRMNYNFQGSHPP

Query:  AQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLD
         QL AMVA  NYA + +SN  WLTDSGCN H+T DL+QL+ ASEYS ++QI VG+G SLPI ++  GIL T TSSL L +L HVP I++NLLSVH+LC+D
Subjt:  AQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLD

Query:  NICLVVFYADQFFLQDKSSGQILFHGPSVNG
        N C VVF  + F++QDK SG ILF GPS NG
Subjt:  NICLVVFYADQFFLQDKSSGQILFHGPSVNG

TrEMBL top hits

e value

%identity

Alignment

A0A2N9ECA1 Uncharacterized protein

1.5e-53

33.89

Show/hide

Query:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGG--KGKFQNSGRSKTSSLGNTGNSGNFGGRGRHS---S
        M T+S+ VSFEE HVL++++E  + N  +  +          ++  A   N   S    +N    +G FQN GR   +S G + N G F  RG ++   +
Subjt:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGG--KGKFQNSGRSKTSSLGNTGNSGNFGGRGRHS---S

Query:  TVPFGV---------------------QPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNT
         V  G                      Q N  FS+   +R  C IC + GHTALDCYNRMN+++QG HPPA+LAA+ +A   A  + S   W++D+G   
Subjt:  TVPFGV---------------------QPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNT

Query:  HITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVN
        H T DL  L  +S Y+    ++VG+G  LPI++ G   L T +    LK++  VP++A+NLLSV+R C DN C   F +D F +QD+ +G+ L+ G S +
Subjt:  HITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVN

Query:  GLYPIN----------SVSTSVKSVPRSHVAHVGAQTSSSIWHNRLGHPSDPVLHSVFR---------------------------IMNLPRCTAVTFNL
        GLYP++          S+S+S   V   H A     ++SS+WH R GHP D VL  V                              +  P    +T ++
Subjt:  GLYPIN----------SVSTSVKSVPRSHVAHVGAQTSSSIWHNRLGHPSDPVLHSVFR---------------------------IMNLPRCTAVTFNL

Query:  VSNPP--PYAAVDPPPCEPNNTSSISANDTVVRNAHPMQTRGKSGISKKKAFLASSI---PNGSKSEPSSYTAASKLP
          N P  P A  DPP   P  +SS  A      N HPM TR K+GISKKK    ++    P+  ++EP ++T AS++P
Subjt:  VSNPP--PYAAVDPPPCEPNNTSSISANDTVVRNAHPMQTRGKSGISKKKAFLASSI---PNGSKSEPSSYTAASKLP

A0A2N9FT70 Reverse transcriptase Ty1/copia-type domain-containing protein

2.1e-50

32.44

Show/hide

Query:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNS-----GRSKTSSLGNTGNS-GNFGGRGRHS
        M T++++V FEE H L+ +EE  + +     +  A   A++A+    +N+ P+ S    ++G +G+ +NS     G  +  S    G S GNF   G   
Subjt:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNS-----GRSKTSSLGNTGNS-GNFGGRGRHS

Query:  STVPFGVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQ
        ST     Q ++ ++ S   R  C IC++ GHTA+DCY RMNY FQG HPPA+LAAM  A   A  +++   W++D+G   H T DL+ +     Y+    
Subjt:  STVPFGVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQ

Query:  ITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPIN-----------SVS
        ++VG+G+ LPI++ G   L T     +L+ + HVP++ +NLLSV R C DN C   F AD F +QD+ +G++L+ G S  GLYPI+           S S
Subjt:  ITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPIN-----------SVS

Query:  TSVKSVPRSHVAHVGAQTS-------SSIWHNRLGHPS-----------------------------------DPVLHSVFRIMN------------LPR
         S  + P SH ++   + S       +S+WH RLGHP                                     P++H +  ++              P 
Subjt:  TSVKSVPRSHVAHVGAQTS-------SSIWHNRLGHPS-----------------------------------DPVLHSVFRIMN------------LPR

Query:  CTAVTFNLVSNPPPYAAVDPPPC-EPNNTSSISANDTVVRNAHPMQTRGKSGISKKKAFLASSIPNGSKSEPSSYTAASKLPSKQLA
           V  N   NP      D PP   P    ++ A    V  +HPMQTR KSGI KKK F AS+  +  ++EP S++ ASK+P  + A
Subjt:  CTAVTFNLVSNPPPYAAVDPPPC-EPNNTSSISANDTVVRNAHPMQTRGKSGISKKKAFLASSIPNGSKSEPSSYTAASKLPSKQLA

A0A2N9H9M1 Uncharacterized protein

1.2e-50

31.82

Show/hide

Query:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTS--------SLGNTGNSGNFGGRGR
        M T++++V FEE HVL++++E  +    K  +  ++  +++A    A  VN + S G  +N G+G F N GR            +  N G   + GG  +
Subjt:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTS--------SLGNTGNSGNFGGRGR

Query:  HSSTVPFGV-----------QPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLN
          S  P              Q N  FS+   +R  C ICN+PGH ALDCYNRMNY++QG HPPA+LAAM  A +Y   + S   W++D+    H T DL 
Subjt:  HSSTVPFGV-----------QPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLN

Query:  QLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINS
         L  +S Y+    ++VG+G  LPI++ G   L T +    L+++  VP++A+NLLSV++ C DN C   F +D+F +QD+ SG+ L+ G S +GLYP++ 
Subjt:  QLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINS

Query:  VSTSVKS-----VPRSHVAHVGAQ-TSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVT------FNLVSNPP---PYAAVDP-----------------
         S  ++S      P +  A + A   +SS+WH R GHP D VL  +      P  +  +        ++S+PP   P   + P                 
Subjt:  VSTSVKS-----VPRSHVAHVGAQ-TSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVT------FNLVSNPP---PYAAVDP-----------------

Query:  ------PPC----------------------EPNNTSSISANDT--------------VVRNAHPMQTRGKSGISKKKAF---LASSIPNGSKSEPSSYT
              PP                       +P +TS++  + T              ++ N HPM TR KSGISKKK     +    PN  ++EP S T
Subjt:  ------PPC----------------------EPNNTSSISANDT--------------VVRNAHPMQTRGKSGISKKKAF---LASSIPNGSKSEPSSYT

Query:  AASKLP
         AS++P
Subjt:  AASKLP

A0A2N9HW05 Uncharacterized protein

6.5e-52

33.98

Show/hide

Query:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNG---------GKGKFQNSGRSKTSSLG--------NTGN
        M T++  VSF E H LL +EE  I N H      ++ T+L+A     QN +P  SH + YN          G+ +F   GR    +          N GN
Subjt:  MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNG---------GKGKFQNSGRSKTSSLG--------NTGN

Query:  SGNFGGRGRHSSTVPFGVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNAS---NMPWLTDSGCNTHITTDL
        S N    G  +  VP  V P  PF++++  R  C IC + GHTALDCY RMNY +QG  PPA+LAAM +A   + ++ S      W++DSG   H T D+
Subjt:  SGNFGGRGRHSSTVPFGVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNAS---NMPWLTDSGCNTHITTDL

Query:  NQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLY---
        + L   S Y+   Q++VG+G  LPI+  G   L T +   +LK + HVP+++++LLSV+R C DN C   F AD F +QD+ +G+ L+ GPS +GLY   
Subjt:  NQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLY---

Query:  --------PIN-------SVSTSVKSVPRSHVAHVGAQTSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVTFNLVSNP-----PPYAAVDPPPCEPNNT
                PIN       S S+S +S P S   +    +  ++WH RLGHP   VL+ V R   LP       +   +P     PP    +P P  P+  
Subjt:  --------PIN-------SVSTSVKSVPRSHVAHVGAQTSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVTFNLVSNP-----PPYAAVDPPPCEPNNT

Query:  SS--------------------------------ISANDTVVRNAHPMQTRGKSGISKKKAFLASSIPNGSKSEPSSYTAASKLP---SKQLAEVKPRSA
        SS                                  A  ++  N HPM T  KSGIS KK F ASS+ +  + EP + T AS++P   +   AE +    
Subjt:  SS--------------------------------ISANDTVVRNAHPMQTRGKSGISKKKAFLASSIPNGSKSEPSSYTAASKLP---SKQLAEVKPRSA

Query:  KAKTRLAEAKPR
        ++   L  A PR
Subjt:  KAKTRLAEAKPR

A0A6J1DQZ0 uncharacterized protein LOC111023438

4.1e-54

53.68

Show/hide

Query:  NVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPFGVQPNRPFSDSAQH----RLVCHICNRPGHTALDCYNRMNYNFQGSHPP
        N NPN+  GRG   GK  F    ++K+ +   TGN     GRGR       G+ P  P   S+Q      + C IC + GH+ALDC+NRMNY+FQG HPP
Subjt:  NVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPFGVQPNRPFSDSAQH----RLVCHICNRPGHTALDCYNRMNYNFQGSHPP

Query:  AQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLD
         QL AMVA  NYA + +SN  WLTDSGCN H+T DL+QL+ ASEYS ++QI VG+G SLPI ++  GIL T TSSL L +L HVP I++NLLSVH+LC+D
Subjt:  AQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLD

Query:  NICLVVFYADQFFLQDKSSGQILFHGPSVNG
        N C VVF  + F++QDK SG ILF GPS NG
Subjt:  NICLVVFYADQFFLQDKSSGQILFHGPSVNG

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

1.2e-23

28.3

Show/hide

Query:  TSSLGNTGNSGN-FGGRGRHSSTVPF-----GVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNY--NFQGSHPPAQLAAMVAAQNYAAVNA-SNMP
        T++  N GN  N +  R  ++++ P+        PN   + S  +   C IC   GH+A  C    ++  +     PP+         N A  +  S+  
Subjt:  TSSLGNTGNSGN-FGGRGRHSSTVPF-----GVQPNRPFSDSAQHRLVCHICNRPGHTALDCYNRMNY--NFQGSHPPAQLAAMVAAQNYAAVNA-SNMP

Query:  WLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQ
        WL DSG   HIT+D N L+    Y+  D + V  G ++PI+++G   L+T +  L+L ++ +VPNI  NL+SV+RLC  N   V F+   F ++D ++G 
Subjt:  WLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQ

Query:  ILFHGPSVNGLY--PINSVSTSVKSVPRSHVAHVGAQTSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVTFNLVSNPPPYAAVDPPPCEPNNTSSISAN
         L  G + + LY  PI S      S P S  A   ++ + S WH RLGHP+  +L+SV             ++L    P +  +    C  N ++ +  +
Subjt:  ILFHGPSVNGLY--PINSVSTSVKSVPRSHVAHVGAQTSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVTFNLVSNPPPYAAVDPPPCEPNNTSSISAN

Query:  DTVVRNAHPMQ
         + + +  P++
Subjt:  DTVVRNAHPMQ

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

2.3e-22

27.93

Show/hide

Query:  SFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPFGVQPNRPFS
        S  E H  L++ ES +   +  + +      +   N        N    R YN       N+ RS      N+    + G R  +    P+  +      
Subjt:  SFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPFGVQPNRPFS

Query:  DSAQHRLVCHICNRPGHTALDC-----YNRMNYNFQGSHP--PAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGH
                C IC+  GH+A  C     +       Q + P  P Q  A +A    +  NA+N  WL DSG   HIT+D N L+    Y+  D + +  G 
Subjt:  DSAQHRLVCHICNRPGHTALDC-----YNRMNYNFQGSHP--PAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGH

Query:  SLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLY--PI-NSVSTSVKSVPRSHVAHVG
        ++PIT++G   L T + SL L  + +VPNI  NL+SV+RLC  N   V F+   F ++D ++G  L  G + + LY  PI +S + S+ + P S   H  
Subjt:  SLPITYSGYGILTTPTSSLSLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLY--PI-NSVSTSVKSVPRSHVAHVG

Query:  AQTSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVTFNLVSNPPPYAAVDPPPCEPNNTSSISANDTVVRNAHPMQ
             S WH+RLGHPS  +L+SV    +LP         V N P +  +    C  N +  +  +++ + ++ P++
Subjt:  AQTSSSIWHNRLGHPSDPVLHSVFRIMNLPRCTAVTFNLVSNPPPYAAVDPPPCEPNNTSSISANDTVVRNAHPMQ

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTGCACCCGCTCTCAGTCCGTTTCATTTGAAGAATTCCATGTTCTTCTGGTCTCTGAAGAATCTGCTATTGCAAATCAACACAAGAAGGATGAGATATTTGCTCAACC
TACTGCTCTTCTTGCTAGCAATTTTAAGGCTCAGAATGTTAATCCAAACATCTCGCATGGTCGAGGTTATAATGGTGGTAAGGGAAAATTTCAAAACTCTGGTCGATCGA
AGACTTCTTCCCTTGGTAATACCGGTAATTCTGGAAATTTCGGAGGCCGTGGACGTCACTCTTCGACGGTCCCCTTTGGTGTTCAGCCAAATCGACCTTTCTCTGATTCT
GCACAGCATCGCCTTGTCTGTCATATTTGCAACCGTCCAGGCCACACTGCACTTGACTGTTATAATAGAATGAATTATAACTTTCAAGGAAGTCATCCACCTGCCCAACT
TGCGGCAATGGTTGCTGCGCAAAATTATGCTGCTGTAAATGCTTCCAATATGCCATGGTTGACTGATTCCGGCTGCAACACTCATATTACCACCGATTTAAATCAATTGA
ACGGCGCATCTGAGTACTCTAGAGAAGATCAGATCACTGTAGGCAGTGGTCATTCATTACCCATCACCTATTCAGGTTATGGTATTCTTACCACTCCTACCTCTTCTCTT
TCACTTAAACATCTCTTCCATGTTCCTAACATTGCTACAAATCTTCTTTCAGTTCATCGTCTGTGCTTAGATAATATTTGTCTTGTTGTTTTTTATGCTGACCAATTTTT
TCTTCAGGACAAGTCTTCGGGCCAGATTCTTTTTCACGGCCCCAGTGTTAATGGGCTCTATCCCATTAACTCTGTTTCTACCTCTGTCAAATCTGTTCCGCGGTCCCATG
TTGCTCATGTTGGTGCACAAACGTCTTCTTCTATCTGGCATAATAGGTTAGGTCATCCTAGTGACCCTGTTCTTCATTCTGTCTTTCGTATCATGAATTTACCTCGTTGT
ACTGCTGTTACTTTCAATTTGGTTTCAAATCCACCACCTTATGCAGCCGTTGATCCTCCGCCTTGTGAACCTAATAATACTTCATCTATCTCAGCCAATGATACTGTTGT
TCGTAATGCTCATCCTATGCAGACAAGGGGGAAATCTGGTATCTCTAAGAAGAAAGCCTTCTTGGCCTCTTCGATTCCTAATGGTTCAAAATCTGAGCCTTCTTCCTATA
CAGCAGCCTCAAAACTTCCTTCCAAGCAATTAGCCGAGGTGAAACCCAGATCTGCTAAGGCGAAAACCAGATTGGCCGAGGCGAAGCCCAGATCTACCGAGGTGACACCC
AGATCTGAGGAAGGTGGAATGGAGCATGTCGACGTAAACCCAGGTGAGGGTTGGCAACGTTTCGAAAAGAAGAGTCGGGTCGAAGTTGCTGACCACTCAGGAGAGGCAAG
CCCGAGCCTTGGTCATCAACTAAGTCCGACCACCCCCGATAGGGGAGAGATAGCTGCGAAGGTGGAATCTATCCCCCTGACGTCCAAGGATCGACGAGTCAACATCGAAA
TCAGGATGGGGGATGAAGAAAGAAAGAGCCTTATAAACTTCCTACGGAACAGTGTGTTTGATTCCAGATCATCAAGTTTGCTGCGTATTGGATATAAGAATCGGAATTGT
CGAAGTTCACGCATCAACAGCATGGATTATTCTCTTCTCTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MCTRSQSVSFEEFHVLLVSEESAIANQHKKDEIFAQPTALLASNFKAQNVNPNISHGRGYNGGKGKFQNSGRSKTSSLGNTGNSGNFGGRGRHSSTVPFGVQPNRPFSDS
AQHRLVCHICNRPGHTALDCYNRMNYNFQGSHPPAQLAAMVAAQNYAAVNASNMPWLTDSGCNTHITTDLNQLNGASEYSREDQITVGSGHSLPITYSGYGILTTPTSSL
SLKHLFHVPNIATNLLSVHRLCLDNICLVVFYADQFFLQDKSSGQILFHGPSVNGLYPINSVSTSVKSVPRSHVAHVGAQTSSSIWHNRLGHPSDPVLHSVFRIMNLPRC
TAVTFNLVSNPPPYAAVDPPPCEPNNTSSISANDTVVRNAHPMQTRGKSGISKKKAFLASSIPNGSKSEPSSYTAASKLPSKQLAEVKPRSAKAKTRLAEAKPRSTEVTP
RSEEGGMEHVDVNPGEGWQRFEKKSRVEVADHSGEASPSLGHQLSPTTPDRGEIAAKVESIPLTSKDRRVNIEIRMGDEERKSLINFLRNSVFDSRSSSLLRIGYKNRNC
RSSRINSMDYSLL

Moc04g10310 (gene) of Bitter gourd (OHB3-1) v2 genome