CuGenDBv2

Gene ID	Lag0039107
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Gag protease polyprotein
Genome location	chr2:36145452..36147617
RNA-Seq Expression	Lag0039107
Synteny	Lag0039107
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0004190 - aspartic-type endopeptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001878 - Zinc finger, CCHC-type IPR001969 - Aspartic peptidase, active site IPR005162 - Retrotransposon gag domain IPR021109 - Aspartic peptidase domain superfamily IPR036875 - Zinc finger, CCHC-type superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022156067.1 uncharacterized protein LOC111023035 [Momordica charantia]

2.9e-91

53.12

Show/hide

Query:  MLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIV
        MLR +A  WW+S+A AEDHAN PV+W +FKDLLY++YFP TV+++K  E L LTQG++TV QY+RKFTELSRF    +   + KI +F+ GL+ EI+ ++
Subjt:  MLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIV

Query:  ALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPI
         L   TT+A A+R AL+MDK    + Q Q    S+SGVKRK   F         Q    +  A P C SC K H GP  +G R+CF+C KEGH+AR+CP+
Subjt:  ALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPI

Query:  KNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQV
                      AAAAQGG QRARVFALT+ +    + VVTGTILV+++PA+ LFDSGSSHSF++S FV    LELE LG++LSVSTP GS+L+  QV
Subjt:  KNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQV

Query:  IKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        +K G++S  GQ    KLI+LDM DFDVILGMDWLA+N
Subjt:  IKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

8.8e-112

55.44

Show/hide

Query:  ESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKE
        E++F++DF+RYGPPTFDG SE   A E WI +LEA+Y Y+ C+D+  V+GA+FMLR +A  WW S+A AED+AN P+ W +FK+LLYD+Y+PETVKD KE
Subjt:  ESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKE

Query:  TELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRK-PPPFV
         E LHL QG ++V QYERKFTELSRFA +L+     KIKRFVKGL++ IR  V L  PTT+AEA+R AL+MDK+V+ K  P     S+SGVKRK P  + 
Subjt:  TELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRK-PPPFV

Query:  GQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKV-QAAAAQGGNQRARVFALTKEESNEQDTVVTGT
            +AP++Q Q +    P+C +C K H G    G + CF+CG+EGH+AR+CP+ + AN +R   ++    + QG NQRARVFALT++E+ + +TVVTGT
Subjt:  GQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKV-QAAAAQGGNQRARVFALTKEESNEQDTVVTGT

Query:  ILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDM
        +LV +VPA+VLFDSGSSH+F+SS FV Q  LELEPLG++LSVSTP GSIL+A Q ++  E+S   Q   A+LI+LDM
Subjt:  ILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDM

XP_022156328.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111023249 [Momordica charantia]

8.8e-112

49.11

Show/hide

Query:  VVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNC
        VVP  + PPVP AAP         + +  EALQ +  N       Q + P RA     E QF+RDF+ +GPP F+G SE P AAE W+ +LEA+Y Y+ C
Subjt:  VVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNC

Query:  DDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFV
         D   VRGA+FMLR +A  WW+S+A AEDHAN PV+W +FKDLLY++YFP   +++K  E L LTQG++TV QYERKFTELSRF    V   + KI +F+
Subjt:  DDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFV

Query:  KGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCG
         GL+ EI+ ++ L  PTT+A A+R AL+MDK    + Q Q    S SGVKRK   F         Q    +  A P+C SC K H  P  +G ++CFKC 
Subjt:  KGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCG

Query:  KEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVST
        KEGH+ R+C +              A A QGG Q ARVFALT+ +    + VVTGTIL++++PA+ LFDSGSSHSF++S FV    LELE  G+ LSVST
Subjt:  KEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVST

Query:  PPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        P GS+L+  QV+K G++S GGQ     LI+L+M DFDVILGMDWLA+N
Subjt:  PPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

XP_022157413.1 uncharacterized protein LOC111024114 [Momordica charantia]

3.3e-111

49.46

Show/hide

Query:  AHPPVPHHRRGVVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP
        A P VP     +VP  +APPVP AAP         + +  EALQ + DN       Q + P RA     E QF+RDF+R+GPP F+G SE P A E W+ 
Subjt:  AHPPVPHHRRGVVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP

Query:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV
        +LEA+Y Y+ C D   VRGA+FMLR +A  WW+S+A AEDH N PV+W +FKDLLY++YFP TV+++K  E L LTQG++TV QYERKFTELSRF    +
Subjt:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV

Query:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPS
           + KI +F+ GL+ EI+ ++ +  PTT+A A+R AL+MDK    + Q Q    S+SGVKRK   F         Q    +  A P+C SC K H GP 
Subjt:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPS

Query:  QVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLEL
         +G R+CF+C K                        AAAAQGG QRARVFALT+ +    + VVTGTILV+++PA+ LFDSGSSHSF++S FV    LEL
Subjt:  QVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLEL

Query:  EPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        E LG++LSVSTP GS+L+  QV+K G++S  GQ F  KLI+LDM DFDVILGMDWLA+N
Subjt:  EPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

XP_022158750.1 uncharacterized protein LOC111025215 [Momordica charantia]

1.2e-105

48.59

Show/hide

Query:  DPLVPP-VHQEAHPPVPHHRRGVVPLAPPVPHAAPMLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP
        DP VPP V     PP P      VP   P      + +  EALQ + DN       Q + P R A+ P E                  SE P AAE W+ 
Subjt:  DPLVPP-VHQEAHPPVPHHRRGVVPLAPPVPHAAPMLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP

Query:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV
        +LEA+Y Y+ C D   VRGA+FMLR +A  WW+S+A AEDHAN PV+W +FKDLLY++YFP TV+++K  E L LTQG++TV +YERKFTELSRF    +
Subjt:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV

Query:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPF-VGQPQKAPRQQVQGKAPALPLCNSCDKYHFGP
           + KI +F+ GL+ EI+ ++ L  PTT+A A+R AL+MDK    + Q Q    S+SGVKRK   F   QP +  +  VQ +  A P+C SC K H GP
Subjt:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPF-VGQPQKAPRQQVQGKAPALPLCNSCDKYHFGP

Query:  SQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQA-AAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKL
          VG R+C++C KEGH+AR+CP+   +N +    ++ A AAAQGG  RARVFALT+ +    + VVT T+LV+++PA+ LFDSGSSHSF++S FV    L
Subjt:  SQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQA-AAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKL

Query:  ELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        ELE LG++LSVSTP GS+L+  QV+K G++S  GQ    KLI+LDM DFDVILGMDWLA+N
Subjt:  ELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DQB9 Reverse transcriptase

4.2e-112

49.11

Show/hide

Query:  VVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNC
        VVP  + PPVP AAP         + +  EALQ +  N       Q + P RA     E QF+RDF+ +GPP F+G SE P AAE W+ +LEA+Y Y+ C
Subjt:  VVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNC

Query:  DDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFV
         D   VRGA+FMLR +A  WW+S+A AEDHAN PV+W +FKDLLY++YFP   +++K  E L LTQG++TV QYERKFTELSRF    V   + KI +F+
Subjt:  DDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFV

Query:  KGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCG
         GL+ EI+ ++ L  PTT+A A+R AL+MDK    + Q Q    S SGVKRK   F         Q    +  A P+C SC K H  P  +G ++CFKC 
Subjt:  KGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCG

Query:  KEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVST
        KEGH+ R+C +              A A QGG Q ARVFALT+ +    + VVTGTIL++++PA+ LFDSGSSHSF++S FV    LELE  G+ LSVST
Subjt:  KEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVST

Query:  PPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        P GS+L+  QV+K G++S GGQ     LI+L+M DFDVILGMDWLA+N
Subjt:  PPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

A0A6J1DR22 uncharacterized protein LOC111023035

1.4e-91

53.12

Show/hide

Query:  MLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIV
        MLR +A  WW+S+A AEDHAN PV+W +FKDLLY++YFP TV+++K  E L LTQG++TV QY+RKFTELSRF    +   + KI +F+ GL+ EI+ ++
Subjt:  MLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIV

Query:  ALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPI
         L   TT+A A+R AL+MDK    + Q Q    S+SGVKRK   F         Q    +  A P C SC K H GP  +G R+CF+C KEGH+AR+CP+
Subjt:  ALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPI

Query:  KNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQV
                      AAAAQGG QRARVFALT+ +    + VVTGTILV+++PA+ LFDSGSSHSF++S FV    LELE LG++LSVSTP GS+L+  QV
Subjt:  KNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQV

Query:  IKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        +K G++S  GQ    KLI+LDM DFDVILGMDWLA+N
Subjt:  IKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

A0A6J1DTA8 uncharacterized protein LOC111024114

1.6e-111

49.46

Show/hide

Query:  AHPPVPHHRRGVVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP
        A P VP     +VP  +APPVP AAP         + +  EALQ + DN       Q + P RA     E QF+RDF+R+GPP F+G SE P A E W+ 
Subjt:  AHPPVPHHRRGVVP--LAPPVPHAAP---------MLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP

Query:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV
        +LEA+Y Y+ C D   VRGA+FMLR +A  WW+S+A AEDH N PV+W +FKDLLY++YFP TV+++K  E L LTQG++TV QYERKFTELSRF    +
Subjt:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV

Query:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPS
           + KI +F+ GL+ EI+ ++ +  PTT+A A+R AL+MDK    + Q Q    S+SGVKRK   F         Q    +  A P+C SC K H GP 
Subjt:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPS

Query:  QVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLEL
         +G R+CF+C K                        AAAAQGG QRARVFALT+ +    + VVTGTILV+++PA+ LFDSGSSHSF++S FV    LEL
Subjt:  QVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLEL

Query:  EPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        E LG++LSVSTP GS+L+  QV+K G++S  GQ F  KLI+LDM DFDVILGMDWLA+N
Subjt:  EPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

A0A6J1DUM2 uncharacterized protein LOC111023247

4.2e-112

55.44

Show/hide

Query:  ESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKE
        E++F++DF+RYGPPTFDG SE   A E WI +LEA+Y Y+ C+D+  V+GA+FMLR +A  WW S+A AED+AN P+ W +FK+LLYD+Y+PETVKD KE
Subjt:  ESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKE

Query:  TELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRK-PPPFV
         E LHL QG ++V QYERKFTELSRFA +L+     KIKRFVKGL++ IR  V L  PTT+AEA+R AL+MDK+V+ K  P     S+SGVKRK P  + 
Subjt:  TELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRK-PPPFV

Query:  GQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKV-QAAAAQGGNQRARVFALTKEESNEQDTVVTGT
            +AP++Q Q +    P+C +C K H G    G + CF+CG+EGH+AR+CP+ + AN +R   ++    + QG NQRARVFALT++E+ + +TVVTGT
Subjt:  GQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKV-QAAAAQGGNQRARVFALTKEESNEQDTVVTGT

Query:  ILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDM
        +LV +VPA+VLFDSGSSH+F+SS FV Q  LELEPLG++LSVSTP GSIL+A Q ++  E+S   Q   A+LI+LDM
Subjt:  ILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDM

A0A6J1DWP4 uncharacterized protein LOC111025215

5.9e-106

48.59

Show/hide

Query:  DPLVPP-VHQEAHPPVPHHRRGVVPLAPPVPHAAPMLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP
        DP VPP V     PP P      VP   P      + +  EALQ + DN       Q + P R A+ P E                  SE P AAE W+ 
Subjt:  DPLVPP-VHQEAHPPVPHHRRGVVPLAPPVPHAAPMLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIP

Query:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV
        +LEA+Y Y+ C D   VRGA+FMLR +A  WW+S+A AEDHAN PV+W +FKDLLY++YFP TV+++K  E L LTQG++TV +YERKFTELSRF    +
Subjt:  DLEAMYDYMNCDDRVMVRGAIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLV

Query:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPF-VGQPQKAPRQQVQGKAPALPLCNSCDKYHFGP
           + KI +F+ GL+ EI+ ++ L  PTT+A A+R AL+MDK    + Q Q    S+SGVKRK   F   QP +  +  VQ +  A P+C SC K H GP
Subjt:  SKPERKIKRFVKGLQEEIRRIVALSGPTTFAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPF-VGQPQKAPRQQVQGKAPALPLCNSCDKYHFGP

Query:  SQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQA-AAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKL
          VG R+C++C KEGH+AR+CP+   +N +    ++ A AAAQGG  RARVFALT+ +    + VVT T+LV+++PA+ LFDSGSSHSF++S FV    L
Subjt:  SQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQA-AAAQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKL

Query:  ELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN
        ELE LG++LSVSTP GS+L+  QV+K G++S  GQ    KLI+LDM DFDVILGMDWLA+N
Subjt:  ELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDVILGMDWLASN

SwissProt top hits

e value

%identity

Alignment

Q86TG7 Retrotransposon-derived protein PEG10

4.7e-07

22.03

Show/hide

Query:  AAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNCD---DRVMVRGAIFMLRDDARMWWKSIAEAEDHA--NNPVSWEKFKDLLYDH
        A   P+E +   D     P  FDG   NP     ++   +   +    D   DRV V     M+   A  W  +  E   +   N P    + K +  D 
Subjt:  AAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNCD---DRVMVRGAIFMLRDDARMWWKSIAEAEDHA--NNPVSWEKFKDLLYDH

Query:  YFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIVA-LSGPTTFAEALRDALIMDKNVARKVQPQWGEASA
           E  K     ++  L QG  +V+ Y   F      AQDL       I ++ +GL + I+  ++ L    + +  +   + +++ +AR        A+A
Subjt:  YFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIVA-LSGPTTFAEALRDALIMDKNVARKVQPQWGEASA

Query:  SGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGR--VCFKCGKEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKE
        +   R PP  +  P  A   QV    P  P+  +  +      +   +  +C  CG  GHYA  CP K  A+   P  K+   A +G +  A    + + 
Subjt:  SGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGR--VCFKCGKEGHYARQCPIKNEANAERPVPKVQAAAAQGGNQRARVFALTKE

Query:  ESNEQDTVVTGTILVMNVPA----FV--LFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHD---
          ++  +     +L +++P     FV  + DSG+S +F+   +V+Q  + L    + + V    G  + +  V+      +       +++  D+     
Subjt:  ESNEQDTVVTGTILVMNVPA----FV--LFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHD---

Query:  FDVILGMDWLASN
        F V+LG+ WL+++
Subjt:  FDVILGMDWLASN

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCGAGATCTGACCCGTATCCTGTTTGTAGTTGTTCTGTGGAGTTGTGGAGTTGAATGGATCAATATAGAAGTGTTGTTGAGTTTATCAGATGATTTAAAATTTTTTGT
TTCGTCTTATGCATGTCGTTATGTTGCCAAAATTTTTGGAGCTCTCGGATCTGTGGTCTTCCTCGTTCTCCTCTCCATCACCAGGATTAGGATGCTACCTAGTCAGATGT
TAGAGCTTGTATCCTTGGTTGCTATCTGTTCGTTGACCTTAGTGCACCACCTTCTCAGTAGATGGCTCGTGGTTGTGGTCGAGCAAGACCCTCTAGTCCCTCCCGTCCAC
CAAGAGGCTCACCCTCCGGTTCCTCACCATCGACGAGGAGTTGTACCCCTGGCACCTCCTGTTCCTCATGCAGCCCCAATGCTGATCACACTGGAAGCACTTCAGACCAT
GTTCGATAACATGGCTCAAAGAAATGCCAGACAGCCGAGGTACCCCAATCGGGCAGCTGAAGACCCAATGGAGTCTCAATTCCTTCGAGATTTTAGGCGTTATGGCCCTC
CTACTTTTGATGGGCGGTCAGAGAATCCTGTGGCGGCCGAGCGTTGGATCCCCGATTTGGAAGCCATGTACGACTACATGAATTGTGATGACCGTGTGATGGTCAGAGGG
GCGATATTTATGCTGAGGGATGATGCCCGCATGTGGTGGAAATCCATAGCTGAAGCGGAAGATCATGCTAACAACCCAGTCTCGTGGGAGAAGTTCAAGGACCTTCTATA
CGATCATTATTTTCCTGAGACTGTCAAGGATGATAAGGAGACAGAACTTTTACACCTAACTCAAGGAAATATGACAGTGGTGCAATATGAGAGGAAATTCACTGAGCTCT
CCCGTTTTGCTCAGGATTTGGTTAGCAAGCCAGAACGAAAAATCAAGAGGTTCGTCAAAGGCCTCCAGGAGGAAATTAGACGTATCGTTGCCTTGAGCGGACCCACAACT
TTTGCTGAGGCACTCAGGGATGCTTTGATTATGGACAAGAACGTGGCACGGAAAGTGCAGCCTCAGTGGGGAGAAGCTTCAGCATCAGGAGTCAAAAGAAAACCTCCACC
TTTTGTTGGACAACCTCAGAAGGCCCCACGACAGCAGGTTCAGGGGAAAGCTCCTGCTCTTCCCTTATGCAATTCTTGTGATAAGTACCACTTTGGACCATCCCAGGTGG
GTGGAAGGGTATGCTTCAAGTGTGGGAAGGAAGGGCATTATGCAAGGCAGTGTCCGATCAAGAATGAAGCCAACGCAGAAAGACCAGTTCCAAAAGTCCAAGCTGCGGCA
GCGCAGGGTGGTAATCAGAGGGCGCGTGTCTTTGCCCTCACAAAAGAAGAATCTAATGAGCAGGATACTGTGGTCACAGGAACTATTCTCGTTATGAATGTCCCTGCCTT
TGTATTGTTTGACTCGGGGTCGAGTCATTCTTTCGTTTCTTCGGCATTTGTTAGCCAAACAAAGCTCGAGCTTGAGCCTCTAGGGTATATTCTGTCGGTGTCTACACCCC
CAGGTTCAATATTGCTTGCTCAACAAGTGATTAAGTTGGGTGAAGTTTCTGTTGGGGGCCAGGCCTTTGGGGCAAAGTTGATCAAGTTAGATATGCATGACTTTGATGTA
ATCCTAGGCATGGATTGGTTGGCTAGTAATTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MRDLTRILFVVVLWSCGVEWINIEVLLSLSDDLKFFVSSYACRYVAKIFGALGSVVFLVLLSITRIRMLPSQMLELVSLVAICSLTLVHHLLSRWLVVVVEQDPLVPPVH
QEAHPPVPHHRRGVVPLAPPVPHAAPMLITLEALQTMFDNMAQRNARQPRYPNRAAEDPMESQFLRDFRRYGPPTFDGRSENPVAAERWIPDLEAMYDYMNCDDRVMVRG
AIFMLRDDARMWWKSIAEAEDHANNPVSWEKFKDLLYDHYFPETVKDDKETELLHLTQGNMTVVQYERKFTELSRFAQDLVSKPERKIKRFVKGLQEEIRRIVALSGPTT
FAEALRDALIMDKNVARKVQPQWGEASASGVKRKPPPFVGQPQKAPRQQVQGKAPALPLCNSCDKYHFGPSQVGGRVCFKCGKEGHYARQCPIKNEANAERPVPKVQAAA
AQGGNQRARVFALTKEESNEQDTVVTGTILVMNVPAFVLFDSGSSHSFVSSAFVSQTKLELEPLGYILSVSTPPGSILLAQQVIKLGEVSVGGQAFGAKLIKLDMHDFDV
ILGMDWLASN

Lag0039107 (gene) of Sponge gourd (AG-4) v1 genome