CuGenDBv2

Gene ID	Lag0041535
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Retrotran_gag_3 domain-containing protein
Genome location	chr13:19839541..19842301
RNA-Seq Expression	Lag0041535
Synteny	Lag0041535
Gene Ontology terms	GO:0097159 - organic cyclic compound binding (molecular function) GO:1901363 - heterocyclic compound binding (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAE8645659.1 hypothetical protein Csa_020439 [Cucumis sativus]

1.5e-95

51.07

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKLFGF+DG+ P P +S  TT        S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  +N N  RG+G+     G+  G GR  F    R    GH +    KP  D 
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        +++   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+H+TSDMN+ + + ++ G++QV VG+GQ+ PI+
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HSGCGILPTPTSSLKLFDLLC
        HSG   L   + S  +    C
Subjt:  HSGCGILPTPTSSLKLFDLLC

XP_008448007.1 PREDICTED: uncharacterized protein LOC103490319 isoform X2 [Cucumis melo]

4.0e-93

50.36

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKL+GFIDG+ P P    RT  SSS   +S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  ++ N  RG+G+     G+  G GR  F    RG       G++P+ Q   
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        + +   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+ +TSDMN+ + + ++ G++QV +G+GQ+ P++
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HSGCGILPTPTSSLKLFDLLC
        HSG       + S  +  L C
Subjt:  HSGCGILPTPTSSLKLFDLLC

XP_008448008.1 PREDICTED: uncharacterized protein LOC103490319 isoform X3 [Cucumis melo]

4.0e-93

51.86

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKL+GFIDG+ P P    RT  SSS   +S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  ++ N  RG+G+     G+  G GR  F    RG       G++P+ Q   
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        + +   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+ +TSDMN+ + + ++ G++QV +G+GQ+ P++
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HSG
        HSG
Subjt:  HSG

XP_011658579.1 uncharacterized protein LOC105436058 [Cucumis sativus]

8.5e-96

52.61

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKLFGF+DG+ P P +S  TT        S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  +N N  RG+G+     G+  G GR  F    R    GH +    KP  D 
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        +++   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+H+TSDMN+ + + ++ G++QV VG+GQ+ PI+
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HSG
        HSG
Subjt:  HSG

XP_022150845.1 uncharacterized protein LOC111018892 [Momordica charantia]

2.2e-99

52.67

Show/hide

Query:  STARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKP----ASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLI
        +T +DL+SPIFLLSNICNL                      AHKLFGFIDGS   P    ASS  T +  ++T S   +   NP +EDWIAKD AL TLI
Subjt:  STARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKP----ASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLI

Query:  NATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSL
        NATLS  ALAY+V   T++Q+WE LEKHYSS SRTNVVNLKS+LQ+I KK+ ESI  Y++RIKE+KDK ANVS+TI+ E L+IY ++GL  EYNT  TS+
Subjt:  NATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSL

Query:  RTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQT--SSNRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQP
        RTR+QSV+FE+LHV + SEESA+EKQ+KR++   QP  L A +  S NR+  ++PN     G  G + GRG+    P F N GRGR  G+   +      
Subjt:  RTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQT--SSNRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQP

Query:  DQYSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQN--YNVVANTSVSHPSPWLANSGCNSHVTSDMNHF---TNSSDFTGDDQVTVGS
         Q  +R  CQIC + GH+A+DCYNRMN +FQGRHPP QLAAMVA QN  Y  V N+S   P+ WLA+S CN+H+T+D+++    + +SD+ G++ ++VGS
Subjt:  DQYSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQN--YNVVANTSVSHPSPWLANSGCNSHVTSDMNHF---TNSSDFTGDDQVTVGS

Query:  GQSLPITHSGCG
        GQS PITH GCG
Subjt:  GQSLPITHSGCG

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BI58 uncharacterized protein LOC103490319 isoform X2

1.9e-93

50.36

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKL+GFIDG+ P P    RT  SSS   +S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  ++ N  RG+G+     G+  G GR  F    RG       G++P+ Q   
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        + +   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+ +TSDMN+ + + ++ G++QV +G+GQ+ P++
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HSGCGILPTPTSSLKLFDLLC
        HSG       + S  +  L C
Subjt:  HSGCGILPTPTSSLKLFDLLC

A0A1S3BIR3 uncharacterized protein LOC103490319 isoform X3

1.9e-93

51.86

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKL+GFIDG+ P P    RT  SSS   +S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  ++ N  RG+G+     G+  G GR  F    RG       G++P+ Q   
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        + +   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+ +TSDMN+ + + ++ G++QV +G+GQ+ P++
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HSG
        HSG
Subjt:  HSG

A0A1S4DWT9 uncharacterized protein LOC103490319 isoform X1

1.9e-93

50.36

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKL+GFIDG+ P P    RT  SSS   +S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  ++ N  RG+G+     G+  G GR  F    RG       G++P+ Q   
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        + +   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+ +TSDMN+ + + ++ G++QV +G+GQ+ P++
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HSGCGILPTPTSSLKLFDLLC
        HSG       + S  +  L C
Subjt:  HSGCGILPTPTSSLKLFDLLC

A0A5D3CLI6 T4.5

9.5e-93

51.74

Show/hide

Query:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA
        + S  +D  SPIFLLSNICNL                      AHKL+GFIDG+ P P    RT  SSS   +S+   Q NP YEDWIAKD AL T+INA
Subjt:  ADSTARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINA

Query:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT
        TLSP ALAY+VG  +++Q+W+ L K YSS SR+NVVNLKS+LQTI KK  ESI  YI+RIKE+KDKLANVS  I+ EDL+IY ++GLP EYNTF+TS+RT
Subjt:  TLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRT

Query:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ
        RSQ VTFE+LHVLL +EESAL KQ K D+++ QPTVLL+ + S  + +  ++ N  RG+G+     G+  G GR  F    RG       G++P+ Q   
Subjt:  RSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSS--NRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQ

Query:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT
        + +   CQIC R GH+A+DC+NRMN NFQGRHPP QLAAMVA+QN   ++  + S     L +SGCN+ +TSDMN+ + + ++ G++QV +G+GQ+ P++
Subjt:  YSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPIT

Query:  HS
        HS
Subjt:  HS

A0A6J1D9L6 uncharacterized protein LOC111018892

1.0e-99

52.67

Show/hide

Query:  STARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKP----ASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLI
        +T +DL+SPIFLLSNICNL                      AHKLFGFIDGS   P    ASS  T +  ++T S   +   NP +EDWIAKD AL TLI
Subjt:  STARDLNSPIFLLSNICNL----------------------AHKLFGFIDGSFPKP----ASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLI

Query:  NATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSL
        NATLS  ALAY+V   T++Q+WE LEKHYSS SRTNVVNLKS+LQ+I KK+ ESI  Y++RIKE+KDK ANVS+TI+ E L+IY ++GL  EYNT  TS+
Subjt:  NATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSL

Query:  RTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQT--SSNRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQP
        RTR+QSV+FE+LHV + SEESA+EKQ+KR++   QP  L A +  S NR+  ++PN     G  G + GRG+    P F N GRGR  G+   +      
Subjt:  RTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQT--SSNRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQP

Query:  DQYSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQN--YNVVANTSVSHPSPWLANSGCNSHVTSDMNHF---TNSSDFTGDDQVTVGS
         Q  +R  CQIC + GH+A+DCYNRMN +FQGRHPP QLAAMVA QN  Y  V N+S   P+ WLA+S CN+H+T+D+++    + +SD+ G++ ++VGS
Subjt:  DQYSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQN--YNVVANTSVSHPSPWLANSGCNSHVTSDMNHF---TNSSDFTGDDQVTVGS

Query:  GQSLPITHSGCG
        GQS PITH GCG
Subjt:  GQSLPITHSGCG

SwissProt top hits

e value

%identity

Alignment

P10978 Retrovirus-related Pol polyprotein from transposon TNT 1-94

1.8e-08

24.23

Show/hide

Query:  EDWIAKDHALQTLINATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTM
        EDW   D    + I   LS   +  I+  +TA+ +W  LE  Y S + TN + LK +L  +    G +   ++     L  +LAN+ V I+ ED  I  +
Subjt:  EDWIAKDHALQTLINATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTIAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTM

Query:  SGLPAEYNTFKTSLRTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSSNRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIP
        + LP+ Y+   T++     ++  + +   L+  E   +K   + +A           +  R ++Y     R   N G S  RG+   R            
Subjt:  SGLPAEYNTFKTSLRTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSSNRSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIP

Query:  GHPVGNTPKPQPDQYSSRIQ-CQICQRAGHSAIDCYN--RMNDNFQGRHPPAQLAAMVATQNYNVVANTS-------VSHP-SPWLANSGCNSHVTSDMN
                        SR++ C  C + GH   DC N  +      G+      AAMV   N NVV   +       +S P S W+ ++  + H T   +
Subjt:  GHPVGNTPKPQPDQYSSRIQ-CQICQRAGHSAIDCYN--RMNDNFQGRHPPAQLAAMVATQNYNVVANTS-------VSHP-SPWLANSGCNSHVTSDMN

Query:  HFTNSSDFTGDDQVTVGSGQSLPITHSGCGILPTPTS---SLKLFDLLCVPHISSNLLS
         F     +   D  TV  G +     +G G +   T+   +L L D+  VP +  NL+S
Subjt:  HFTNSSDFTGDDQVTVGSGQSLPITHSGCGILPTPTS---SLKLFDLLCVPHISSNLLS

Q94HW2 Retrovirus-related Pol polyprotein from transposon RE1

2.6e-31

28.51

Show/hide

Query:  HKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQT
        ++L GF+DGS          TT   +T  + A  + NP Y  W  +D  + + +   +S +    +    TA Q+WETL K Y++ S  +V  L+++L+ 
Subjt:  HKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQT

Query:  IAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSSN
          K + ++I  Y+Q +    D+LA +   +D ++ V   +  LP EY      +  +    T  ++H  L++ ES   K +    A   P    A +  N
Subjt:  IAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSSN

Query:  RSQNYNPNIPRGHGNSGNS-RGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQYSSRIQCQICQRAGHSAIDCYNRMN--DNFQGRHPPAQLAAMVAT
         +   N N    +GN  N    R       P+  S       HP  N  KP         +CQIC   GHSA  C    +   +   + PP+        
Subjt:  RSQNYNPNIPRGHGNSGNS-RGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQYSSRIQCQICQRAGHSAIDCYNRMN--DNFQGRHPPAQLAAMVAT

Query:  QNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPITHSGCGILPTPTSSLKLFDLLCVPHISSNLLSVNRLCADNNCVC
         N   +A  S    + WL +SG   H+TSD N+ +    +TG D V V  G ++PI+H+G   L T +  L L ++L VP+I  NL+SV RLC  N    
Subjt:  QNYNVVANTSVSHPSPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPITHSGCGILPTPTSSLKLFDLLCVPHISSNLLSVNRLCADNNCVC

Query:  VFDSDFFLIQDKSSGKILFQGPSVNGLYPINPAGCCWAISAS
         F    F ++D ++G  L QG + + LY        W I++S
Subjt:  VFDSDFFLIQDKSSGKILFQGPSVNGLYPINPAGCCWAISAS

Q9ZT94 Retrovirus-related Pol polyprotein from transposon RE2

6.9e-32

28.28

Show/hide

Query:  HKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQT
        ++L GF+DGS P P +++ T           AV + NP Y  W  +D  + + I   +S +    +    TA Q+WETL K Y++ S  +V  L+     
Subjt:  HKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQT

Query:  IAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSSN
                   +I R     D+LA +   +D ++ V   +  LP +Y      +  +    +  ++H  L++ ES   K +  + A   P      T  N
Subjt:  IAKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSSN

Query:  RSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQYSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNY
         + N N N    + N  N+  R   +             P      +   QP  Y  R  CQIC   GHSA  C       FQ      Q  +      +
Subjt:  RSQNYNPNIPRGHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQYSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNY

Query:  NVVANTSVSHP---SPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPITHSGCGILPTPTSSLKLFDLLCVPHISSNLLSVNRLCADNNCVC
           AN +V+ P   + WL +SG   H+TSD N+ +    +TG D V +  G ++PITH+G   LPT + SL L  +L VP+I  NL+SV RLC  N    
Subjt:  NVVANTSVSHP---SPWLANSGCNSHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPITHSGCGILPTPTSSLKLFDLLCVPHISSNLLSVNRLCADNNCVC

Query:  VFDSDFFLIQDKSSGKILFQGPSVNGLYPINPAGCCWAISAS
         F    F ++D ++G  L QG + + LY        W I++S
Subjt:  VFDSDFFLIQDKSSGKILFQGPSVNGLYPINPAGCCWAISAS

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTATGAGGACCCATGGATGCCTAAAGTCTCCACTTTTAAGCCTGTTAGTATTAATGGAATCATATCTCAGGAGAGAGTTGCTGATTTCATAACACATTCTGGGGAGTG
GGACTTGAGGAAATTAAGGGATTCGGTGATGAGTGAAGACTATGAAATAATTAGAAGAATTCCAATAAACATAAGGCTTAAGGATAAATTAGTTTGGCATTTTGATAAAA
CTGGAATCTACTCTGCAAAGAGTGGCTACAAGCTTTTTATGCAAGGAAAAATAAATGAGGCCTCTTCTAAGATTTGGAGGCTTACCATTAATCGAGTTTTCTTAGAGGAA
GATTTCAACGGGAGCTTCATTGACAGATGGATGAAGATTAATTCACGGTTGGACATTCAGGAGTTGGAGCTGGTAGCTGTTACCTGTTGGTTGATTTGGAATGATAGGAA
CAAATTCATTAATGGTTTTTTGAAAATCAATGTGGACGCCGACTGGATCCCTTCTCCTCCGTCGACAAGGGTGGGTATTGTTTGCAGAAATGATGTTGGTGGTGCAGTGC
CTACTATTTTTGGTGACTCACGTCTCGATCCTTCCACGCTTCTGCATTTCTTAGCAATTTTCTTACCAATGGCTGATTCTACTGCCAGAGATCTCAATTCTCCTATTTTT
CTTCTTTCAAATATTTGTAATCTGGCGCACAAATTGTTTGGATTCATTGATGGATCCTTTCCGAAACCGGCTTCATCTGTACGTACTACCACTTCTTCTTCGTCTACTGA
TTCTTCATCTGCTGTTTCTCAGCCAAATCCACAATATGAGGACTGGATTGCCAAAGATCACGCACTACAAACTCTGATTAATGCAACTCTTTCTCCCACTGCCTTGGCCT
ATATTGTTGGTTGTGAGACTGCACAACAAATGTGGGAAACTCTAGAGAAACACTACTCTTCTACTTCGCGAACAAATGTCGTTAACCTAAAATCAGAGTTGCAAACTATT
GCGAAGAAATCTGGTGAAAGCATCACACAATACATCCAACGCATCAAGGAGTTGAAAGATAAATTGGCCAATGTTTCCGTCACGATTGATGTAGAGGATCTGGTGATCTA
CACGATGAGTGGCTTACCTGCTGAATACAACACTTTCAAGACGTCTCTGCGTACTAGATCTCAGTCGGTCACCTTCGAAAAACTTCATGTTCTTCTTGTTTCTGAAGAGT
CTGCCCTTGAGAAGCAGATTAAACGTGATGAGGCCTTTGCTCAGCCTACTGTTTTACTTGCACAAACTTCTTCAAATCGCAGTCAGAACTACAATCCAAATATACCTCGA
GGTCATGGAAATTCTGGAAATTCTCGAGGCCGTGGAAGAGGTTTTGGTCGTCCTCCTTTTTGTAACTCTGGTCGTGGACGTATACCTGGACATCCTGTTGGTAATACTCC
GAAACCTCAACCTGATCAGTACTCTTCTCGTATTCAATGTCAGATTTGTCAGCGAGCAGGTCATAGTGCGATTGATTGTTATAATCGCATGAATGACAATTTTCAAGGTC
GTCATCCACCTGCTCAGTTAGCCGCTATGGTTGCTACTCAAAATTATAATGTTGTGGCCAACACTTCTGTTTCTCATCCATCACCTTGGCTTGCTAATTCTGGTTGCAAC
TCTCATGTTACCTCTGATATGAATCATTTTACTAATTCTTCTGATTTTACTGGTGATGATCAGGTAACTGTTGGCAGTGGACAGTCCCTTCCTATAACACATTCAGGTTG
TGGCATTCTTCCTACTCCTACTTCCTCTCTTAAACTCTTTGATTTACTTTGTGTTCCTCATATTTCTTCAAATCTTTTATCTGTTAACCGTCTTTGTGCCGATAATAATT
GTGTGTGCGTCTTCGATTCTGACTTTTTTCTCATTCAGGACAAGTCTTCGGGCAAGATCCTTTTTCAAGGACCTAGTGTCAATGGGTTGTATCCTATCAATCCCGCTGGC
TGTTGTTGGGCGATATCCGCAAGCGCACGGGCCACAAGTAATATAAAACGGAAAGTATTCCGAGTATCGAATCCACAGGGAGGCGAAGCGAAACTTAAGCAATTAATTAA
AATTCTCTTGAGCACTGAAAATACTGAGGCGAAATAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MYEDPWMPKVSTFKPVSINGIISQERVADFITHSGEWDLRKLRDSVMSEDYEIIRRIPINIRLKDKLVWHFDKTGIYSAKSGYKLFMQGKINEASSKIWRLTINRVFLEE
DFNGSFIDRWMKINSRLDIQELELVAVTCWLIWNDRNKFINGFLKINVDADWIPSPPSTRVGIVCRNDVGGAVPTIFGDSRLDPSTLLHFLAIFLPMADSTARDLNSPIF
LLSNICNLAHKLFGFIDGSFPKPASSVRTTTSSSSTDSSSAVSQPNPQYEDWIAKDHALQTLINATLSPTALAYIVGCETAQQMWETLEKHYSSTSRTNVVNLKSELQTI
AKKSGESITQYIQRIKELKDKLANVSVTIDVEDLVIYTMSGLPAEYNTFKTSLRTRSQSVTFEKLHVLLVSEESALEKQIKRDEAFAQPTVLLAQTSSNRSQNYNPNIPR
GHGNSGNSRGRGRGFGRPPFCNSGRGRIPGHPVGNTPKPQPDQYSSRIQCQICQRAGHSAIDCYNRMNDNFQGRHPPAQLAAMVATQNYNVVANTSVSHPSPWLANSGCN
SHVTSDMNHFTNSSDFTGDDQVTVGSGQSLPITHSGCGILPTPTSSLKLFDLLCVPHISSNLLSVNRLCADNNCVCVFDSDFFLIQDKSSGKILFQGPSVNGLYPINPAG
CCWAISASARATSNIKRKVFRVSNPQGGEAKLKQLIKILLSTENTEAK

Lag0041535 (gene) of Sponge gourd (AG-4) v1 genome