CuGenDBv2

Gene ID	Moc09g00710
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Retrovirus-related Pol polyprotein from transposon TNT 1-94
Genome location	chr9:704838..711922
RNA-Seq Expression	Moc09g00710
Synteny	Moc09g00710
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0026100.1 uncharacterized protein E6C27_scaffold19G00360 [Cucumis melo var. makuwa]

1.9e-77

50.43

Show/hide

Query:  SSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAG
        +SS  T   VN L+E WVTTD LLLGWLYNSMTP+VA Q+MG+ N  DLW A Q+ FGVQS+AEED+LRQ+ Q TRKG+ KM ++L VMK++ DNLGQ G
Subjt:  SSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAG

Query:  SPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNN---SVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGG
        SPVP R+LISQVLLGLDE YN V+  IQGK  ISW +MQ++LL+FEK L+ QN+ K      N   S ++NMA R       N ++N +++  +  NR  
Subjt:  SPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNN---SVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGG

Query:  GRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHV
         ++    R N N+   CQ+CGK GHSAL CY+RF+KE+ +           D N+  +N S       F +TQN  PF A P+TV+DPNWY+DSGA+NHV
Subjt:  GRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHV

Query:  TPDYNSMVQPTEYGGMERVTDIRSGKVVLKGALKDGLYRLNTVGVVI
        T + ++M  PTEY G         G+ +L+G L+DG Y+L  VGV I
Subjt:  TPDYNSMVQPTEYGGMERVTDIRSGKVVLKGALKDGLYRLNTVGVVI

XP_022148963.1 uncharacterized protein LOC111017501 [Momordica charantia]

1.3e-92

84.62

Show/hide

Query:  MFVQQSIGNMETSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGS
        MFVQQSIGNMETSQTNISAPSSSSIATEAA+NPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGS
Subjt:  MFVQQSIGNMETSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGS

Query:  LKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGG
        LKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAE                                RSVSGG
Subjt:  LKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGG

Query:  NQRQNQNSRPPFNNNRGGGRN
        NQRQNQNS+PPFNNNRGGGRN
Subjt:  NQRQNQNSRPPFNNNRGGGRN

XP_022151683.1 uncharacterized protein LOC111019598 [Momordica charantia]

1.1e-61

43.26

Show/hide

Query:  TNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHA
        TNI   +SS   +   +NP YE+W+  D+LLLGWLYNSM  +VA QVMG+  + +LW A+QELFGVQS+AE DYL+QVFQQT KGSL+M ++L++MKSHA
Subjt:  TNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHA

Query:  DNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVSVNMANRSRSVSGGNQRQNQNSRPPF
        DNL  AGS V  R L+SQVL GLDEEYNP+V  +QGK  +SW EM AELL +EKRLE QNS K+ +  N   + SVN  +  RS     +  N N+    
Subjt:  DNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVSVNMANRSRSVSGGNQRQNQNSRPPF

Query:  NNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDS
        N +RGGG  RG     N                           R    +Q KNF   SN G N  +   TS   T           PETVIDP+WY DS
Subjt:  NNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDS

Query:  GASNHVTPDYNSMVQPTEYGGME---------------------------------RVTDI------RSGKVVLKGALKDGLYRLN
        GA++HVT + N++ Q  +Y G E                                 RV DI       SG+ +LKG LKD LYRL+
Subjt:  GASNHVTPDYNSMVQPTEYGGME---------------------------------RVTDI------RSGKVVLKGALKDGLYRLN

XP_038905161.1 uncharacterized protein LOC120091275 isoform X1 [Benincasa hispida]

7.4e-77

50.87

Show/hide

Query:  MFVQQSIGN-----------METSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYL
        MF+Q +IG               S    S   +SS  T   VNP YESW+  DQLLLGWLYNSMTPEVA QVMG E A DLW +I +LFGVQS+ EEDYL
Subjt:  MFVQQSIGN-----------METSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYL

Query:  RQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVS
        R VFQ TRKG+LKM ++L+ MK + DNL QAGSP+P R+L+SQVLLGLDEEYN +VA IQG+  +SW +MQ+ELL++E+RLE Q++ K TV FN  ++ S
Subjt:  RQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVS

Query:  VNMANRSRSVSGGNQRQNQNSRPPFNNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAF
        VNM N +R V+  N+  + N         GGG  RGRGR  NN + +CQVCGK GH A  C++R+ +++  N+  Q K     +NQ  N    Q    A 
Subjt:  VNMANRSRSVSGGNQRQNQNSRPPFNNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAF

Query:  TATQNNNPFLANPETVIDPNWYVDSGASNHVTPDYNSMVQPTEYGG
             +NPFL   E + D NWY DSGASNHVT D+N++  P EY G
Subjt:  TATQNNNPFLANPETVIDPNWYVDSGASNHVTPDYNSMVQPTEYGG

XP_038905164.1 uncharacterized protein LOC120091275 isoform X4 [Benincasa hispida]

2.5e-77

Show/hide

Query:  MFVQQSIGN-----------METSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYL
        MF+Q +IG               S    S   +SS  T   VNP YESW+  DQLLLGWLYNSMTPEVA QVMG E A DLW +I +LFGVQS+ EEDYL
Subjt:  MFVQQSIGN-----------METSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYL

Query:  RQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVS
        R VFQ TRKG+LKM ++L+ MK + DNL QAGSP+P R+L+SQVLLGLDEEYN +VA IQG+  +SW +MQ+ELL++E+RLE Q++ K TV FN  ++ S
Subjt:  RQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVS

Query:  VNMANRSRSVSGGNQRQNQNSRPPFNNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAF
        VNM N +R V+  N+  + N         GGG  RGRGR  NN + +CQVCGK GH A  C++R+ +++  N+  Q K     +NQ  N    Q    A 
Subjt:  VNMANRSRSVSGGNQRQNQNSRPPFNNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAF

Query:  TATQNNNPFLANPETVIDPNWYVDSGASNHVTPDYNSMVQPTEYGGMERVTDIRSG
             +NPFL   E + D NWY DSGASNHVT D+N++  P EY G    T+   G
Subjt:  TATQNNNPFLANPETVIDPNWYVDSGASNHVTPDYNSMVQPTEYGGMERVTDIRSG

TrEMBL top hits

e value

%identity

Alignment

A0A1S4E1V2 uncharacterized protein LOC107991581 isoform X3

2.3e-60

44.35

Show/hide

Query:  SSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAG
        +SS  T   VNPL+E WVTTD LLLGWLYNSMTP+VA Q+MG+ N  DLW A Q+ FGVQS+AEED+LRQ+ Q TRK                       
Subjt:  SSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAG

Query:  SPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSH-KNTVSFNNSVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGGGR
                      GLDE YN V+  IQGK  ISW +MQ++LL+FEKRL+ QN+  KNT +   S ++NMA R       N ++NQ+++  +  NR   +
Subjt:  SPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSH-KNTVSFNNSVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGGGR

Query:  NRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHVTP
        +    R N N+   CQ+CGK GHSAL CY+RF+KE+ +           + N+  +N S       F +TQN  PF A P+TV+DPNWY+DSGA+NHVT 
Subjt:  NRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHVTP

Query:  DYNSMVQPTEYGGMERVTDIRSGKVVLKGALKDGLYRLNTVGVVI
        + ++M  PTEY G         G+ +L+G L+DG Y+L  VGV I
Subjt:  DYNSMVQPTEYGGMERVTDIRSGKVVLKGALKDGLYRLNTVGVVI

A0A5A7SIT7 Uncharacterized protein

9.4e-78

50.43

Show/hide

Query:  SSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAG
        +SS  T   VN L+E WVTTD LLLGWLYNSMTP+VA Q+MG+ N  DLW A Q+ FGVQS+AEED+LRQ+ Q TRKG+ KM ++L VMK++ DNLGQ G
Subjt:  SSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAG

Query:  SPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNN---SVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGG
        SPVP R+LISQVLLGLDE YN V+  IQGK  ISW +MQ++LL+FEK L+ QN+ K      N   S ++NMA R       N ++N +++  +  NR  
Subjt:  SPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNN---SVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGG

Query:  GRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHV
         ++    R N N+   CQ+CGK GHSAL CY+RF+KE+ +           D N+  +N S       F +TQN  PF A P+TV+DPNWY+DSGA+NHV
Subjt:  GRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHV

Query:  TPDYNSMVQPTEYGGMERVTDIRSGKVVLKGALKDGLYRLNTVGVVI
        T + ++M  PTEY G         G+ +L+G L+DG Y+L  VGV I
Subjt:  TPDYNSMVQPTEYGGMERVTDIRSGKVVLKGALKDGLYRLNTVGVVI

A0A5D3C373 Retrovirus-related Pol polyprotein from transposon TNT 1-94

8.8e-60

42.78

Show/hide

Query:  VATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISW
        +A Q+MG+ NA DLW A Q+LFGVQS+AEED+LRQ+FQ TRK      D+LR+MK+++D LGQAGSPVP R+ ISQ LLGLDE YNPV+A IQGK  ISW
Subjt:  VATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISW

Query:  PEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMA---NRSRSVSGGNQRQNQNSRPPFNNNRGG---GRNRGRGRWNNNSRQICQVCGKPGHSALTCYH
         +MQ+ELL FEKRLE Q++ KNT +   +V VN+A   N S      N + + N+R      RGG   GR RG+GR N   +  CQVC K GHSAL CY+
Subjt:  PEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMA---NRSRSVSGGNQRQNQNSRPPFNNNRGG---GRNRGRGRWNNNSRQICQVCGKPGHSALTCYH

Query:  RFDKEYRN----NTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHVTPDYNSMVQPTEYGGMERVT----DIRS
        RF+KE+ +    +  +Q  NF+  SN  V               Q+ N F A  +TVI+ NWY+DSGA+NH+T +Y+++  P+EY G+E++     D   
Subjt:  RFDKEYRN----NTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHVTPDYNSMVQPTEYGGMERVT----DIRS

Query:  GKVVLKGALKDGLYRLNTVGVVIGSTSTPVDCGLELAANKTICSVSLPKSSSSINVVFIDMGG-----EIRESVGVMVNRTFCHGMVH
           +    L DG+  LN   V+     T           K + SVS     +  N V+I+  G     + +++   ++NRT   G+ H
Subjt:  GKVVLKGALKDGLYRLNTVGVVIGSTSTPVDCGLELAANKTICSVSLPKSSSSINVVFIDMGG-----EIRESVGVMVNRTFCHGMVH

A0A6J1D5J0 uncharacterized protein LOC111017501

6.1e-93

84.62

Show/hide

Query:  MFVQQSIGNMETSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGS
        MFVQQSIGNMETSQTNISAPSSSSIATEAA+NPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGS
Subjt:  MFVQQSIGNMETSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGS

Query:  LKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGG
        LKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAE                                RSVSGG
Subjt:  LKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGG

Query:  NQRQNQNSRPPFNNNRGGGRN
        NQRQNQNS+PPFNNNRGGGRN
Subjt:  NQRQNQNSRPPFNNNRGGGRN

A0A6J1DCW4 uncharacterized protein LOC111019598

5.5e-62

43.26

Show/hide

Query:  TNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHA
        TNI   +SS   +   +NP YE+W+  D+LLLGWLYNSM  +VA QVMG+  + +LW A+QELFGVQS+AE DYL+QVFQQT KGSL+M ++L++MKSHA
Subjt:  TNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHA

Query:  DNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVSVNMANRSRSVSGGNQRQNQNSRPPF
        DNL  AGS V  R L+SQVL GLDEEYNP+V  +QGK  +SW EM AELL +EKRLE QNS K+ +  N   + SVN  +  RS     +  N N+    
Subjt:  DNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFN--NSVSVNMANRSRSVSGGNQRQNQNSRPPF

Query:  NNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDS
        N +RGGG  RG     N                           R    +Q KNF   SN G N  +   TS   T           PETVIDP+WY DS
Subjt:  NNNRGGGRNRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDS

Query:  GASNHVTPDYNSMVQPTEYGGME---------------------------------RVTDI------RSGKVVLKGALKDGLYRLN
        GA++HVT + N++ Q  +Y G E                                 RV DI       SG+ +LKG LKD LYRL+
Subjt:  GASNHVTPDYNSMVQPTEYGGME---------------------------------RVTDI------RSGKVVLKGALKDGLYRLN

SwissProt top hits

e value

%identity

Alignment

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

9.9e-16

26.95

Show/hide

Query:  SSIATEAA--VNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQA
        ++I T+AA  VNP Y  W   D+L+   +  +++  V   V     A  +W  +++++   S      LR   +Q  KG+  + D+++ + +  D L   
Subjt:  SSIATEAA--VNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQA

Query:  GSPVPTRSLISQVLLGLDEEYNPVVATIQGK-RGISWPEMQAELLVFEKRLELQN------------SHKNTVSFNNSVSVNMANRSRSVSGGNQRQNQN
        G P+     + +VL  L EEY PV+  I  K    +  E+   LL  E ++   +            SH+NT + NN+ + N  NR       N+  N N
Subjt:  GSPVPTRSLISQVLLGLDEEYNPVVATIQGK-RGISWPEMQAELLVFEKRLELQN------------SHKNTVSFNNSVSVNMANRSRSVSGGNQRQNQN

Query:  SRPPFNNNRGGGRNRGRGRWNNNSRQI---CQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQ-NNNPFLANPETV
        S+P   ++     N      NN S+     CQ+CG  GHSA  C             SQ ++F       +++ + Q     FT  Q   N  L +P + 
Subjt:  SRPPFNNNRGGGRNRGRGRWNNNSRQI---CQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQ-NNNPFLANPETV

Query:  IDPNWYVDSGASNHVTPDYNSMVQPTEYGGMERV
           NW +DSGA++H+T D+N++     Y G + V
Subjt:  IDPNWYVDSGASNHVTPDYNSMVQPTEYGGMERV

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

6.8e-09

24.55

Show/hide

Query:  SSIATEAA--VNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQA
        ++I T+A   VNP Y  W   D+L+   +  +++  V   V     A  +W  +++++   S      LR +                   +  D L   
Subjt:  SSIATEAA--VNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQA

Query:  GSPVPTRSLISQVLLGLDEEYNPVVATIQGK-RGISWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGGG
        G P+     + +VL  L ++Y PV+  I  K    S  E+   L+  E +L   NS +      N V+    N +R+ +     +N N+    NNNR   
Subjt:  GSPVPTRSLISQVLLGLDEEYNPVVATIQGK-RGISWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGGG

Query:  RNRGRGRWNNNSRQ------ICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQN------NNPFLANPETVIDPN
                 +++RQ       CQ+C   GHSA  C              Q   F   +NQ       Q ++  FT  Q       N+P+ AN       N
Subjt:  RNRGRGRWNNNSRQ------ICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQN------NNPFLANPETVIDPN

Query:  WYVDSGASNHVTPDYNSMVQPTEYGGMERV
        W +DSGA++H+T D+N++     Y G + V
Subjt:  WYVDSGASNHVTPDYNSMVQPTEYGGMERV

Arabidopsis top hits

e value

%identity

Alignment

AT1G34070.1 CONTAINS InterPro DOMAIN/s: Retrotransposon gag protein (InterPro:IPR005162)

5.2e-04

25.63

Show/hide

Query:  SWVTTDQLLLGWLYNSMTP-EVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLL
        +W   D ++   LY ++TP +     +    + D+W  I+  F     A    L    +    G +++ D+ R MK  AD+L     PV  R+L+  VL 
Subjt:  SWVTTDQLLLGWLYNSMTP-EVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVMKSHADNLGQAGSPVPTRSLISQVLL

Query:  GLDEEYNPVVATIQGKRGI-SWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGGNQRQNQNSRPPFNN-NRGGGRN---RGRGRWNN
        GL+ +++ ++  I+ ++   S+ +    L   E RL+       T   ++S S  +A               +  PP  N  R GG     RGRGR NN
Subjt:  GLDEEYNPVVATIQGKRGI-SWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGGNQRQNQNSRPPFNN-NRGGGRN---RGRGRWNN

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTTGTGCAACAGTCGATTGGTAATATGGAAACAAGCCAAACGAACATATCTGCACCATCGAGTTCCTCTATAGCAACAGAAGCAGCCGTCAATCCACTATATGAGTC
ATGGGTAACTACCGACCAGCTACTTCTTGGTTGGTTGTACAACTCTATGACTCCAGAAGTTGCAACACAGGTGATGGGGTACGAAAATGCTTGTGATTTATGGGCTGCCA
TACAAGAACTCTTTGGAGTACAGTCTCAGGCGGAAGAAGATTATCTCCGTCAGGTATTTCAACAAACTCGAAAAGGTTCTCTTAAAATGACTGATTTTTTGCGTGTTATG
AAGTCTCATGCAGACAATTTGGGTCAAGCTGGAAGCCCCGTACCCACTCGATCTTTGATTTCTCAAGTTCTGCTAGGATTAGATGAAGAGTATAATCCTGTGGTAGCAAC
GATCCAAGGAAAACGAGGCATTTCGTGGCCTGAAATGCAAGCCGAATTGTTGGTATTTGAGAAAAGGTTAGAACTTCAGAATTCTCATAAAAATACAGTATCTTTTAACA
ACTCTGTTTCTGTGAATATGGCTAATCGTAGCAGAAGTGTAAGTGGTGGAAACCAACGTCAAAATCAAAACTCTCGGCCACCATTCAACAACAATCGGGGGGGTGGTCGA
AATCGAGGTAGAGGACGGTGGAACAACAATAGTCGGCAAATTTGTCAGGTGTGTGGTAAACCTGGACATTCAGCACTAACGTGCTACCATCGATTTGATAAGGAGTATAG
GAACAATACACAAAGCCAGGGTAAAAACTTCAATGGCGACTCTAACCAGGGGGTTAACAACAACTCTGGACAAGGTACATCTTATGCCTTCACAGCAACCCAAAATAACA
ATCCTTTTTTGGCCAATCCAGAAACAGTGATAGACCCGAATTGGTATGTGGATAGTGGTGCTTCAAATCATGTTACCCCCGACTACAATAGTATGGTTCAACCTACTGAA
TATGGAGGTATGGAAAGAGTTACAGATATACGTTCGGGCAAGGTGGTGCTGAAAGGGGCTCTTAAGGATGGACTTTACCGCCTCAATACTGTTGGAGTAGTCATTGGGAG
TACTTCGACTCCAGTTGACTGTGGCTTGGAGTTGGCTGCTAATAAAACTATTTGTTCTGTGTCTCTTCCCAAATCATCCAGTAGTATAAATGTTGTGTTCATAGATATGG
GGGGGGAGATTAGGGAGTCTGTCGGGGTCATGGTCAATAGAACCTTCTGCCACGGGATGGTTCACGAAAAGTTCAGCTTCTGCAAGGATTCCTTTGATGCGGTTGCGGTA
AGTAACCTTTGTTCCGTTCAAGAAATCTCAAAATACAAAGACGTCTTCTCTTTTGCTCTCTCTCTGAAAAGGATGAGAGAAGAATCTCGAGATGTGTATTCTGATTTGGG
AACCATAACCTCTGTAACCGACCAAAAAATCATTGTCCATCATTGCATGAAGAAGAAGAAACGACAGAGTCTTTGGAGTTGCACTTCCGGATGTCCCCATGATGGGGATG
AAAAATCCTATTGCCACGTGGAAGACGGGGATTTGCCATTGAGAAAAGATTTGAAAGAACAATTTATGGAGGTCCATCTCGGAACCTTCCGAGAGGGTCTCATTTCACCA
TCAGTTATCGAATTTCTCCTCGAACTTAATATTGAGTCCGAGCTGTTTACTGACTTGACCATCGAAGATTTTGCTCTCTCTTCCCGCTTCGGATCGGAGCAAGGACCCAA
GCTAAATTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFVQQSIGNMETSQTNISAPSSSSIATEAAVNPLYESWVTTDQLLLGWLYNSMTPEVATQVMGYENACDLWAAIQELFGVQSQAEEDYLRQVFQQTRKGSLKMTDFLRVM
KSHADNLGQAGSPVPTRSLISQVLLGLDEEYNPVVATIQGKRGISWPEMQAELLVFEKRLELQNSHKNTVSFNNSVSVNMANRSRSVSGGNQRQNQNSRPPFNNNRGGGR
NRGRGRWNNNSRQICQVCGKPGHSALTCYHRFDKEYRNNTQSQGKNFNGDSNQGVNNNSGQGTSYAFTATQNNNPFLANPETVIDPNWYVDSGASNHVTPDYNSMVQPTE
YGGMERVTDIRSGKVVLKGALKDGLYRLNTVGVVIGSTSTPVDCGLELAANKTICSVSLPKSSSSINVVFIDMGGEIRESVGVMVNRTFCHGMVHEKFSFCKDSFDAVAV
SNLCSVQEISKYKDVFSFALSLKRMREESRDVYSDLGTITSVTDQKIIVHHCMKKKKRQSLWSCTSGCPHDGDEKSYCHVEDGDLPLRKDLKEQFMEVHLGTFREGLISP
SVIEFLLELNIESELFTDLTIEDFALSSRFGSEQGPKLN

Moc09g00710 (gene) of Bitter gourd (OHB3-1) v2 genome