CuGenDBv2

Gene ID	Lag0022080
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Reverse transcriptase
Genome location	chr7:17672813..17683925
RNA-Seq Expression	Lag0022080
Synteny	Lag0022080
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022155341.1 uncharacterized protein LOC111022474 [Momordica charantia]

8.6e-19

36.02

Show/hide

Query:  RTKAEAGGHVTPEVRRGESSCPPPAPP----------VLAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWT
        R +  A  +V P V RG +   P   P           L AEALQ +L NA      Q      A    EEVQFI+ F +  PP F+G SE   A  EW 
Subjt:  RTKAEAGGHVTPEVRRGESSCPPPAPP----------VLAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWT

Query:  GALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY
          LEA++ +L  + + +V+GA FML+G A  WW++V   ++    P++W+ FK L+ +++       E  AEF+ L QG L+V QY
Subjt:  GALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY

XP_022156172.1 uncharacterized protein LOC111023126 [Momordica charantia]

1.1e-18

34.54

Show/hide

Query:  AEAGGHVTPEVRRGESSCPPPAPPV-LAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEA
        A  GG V P  +      P   P V L AEALQ +L NA      Q      A    EEVQFI+ F +  P  F+G SE   A  EW   LEA+  +L  
Subjt:  AEAGGHVTPEVRRGESSCPPPAPPV-LAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEA

Query:  NAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQYVGGSKSCPVVSQSWLPPRKL
        + + +V+GA FML+G    WWK+V   ++    P++W+ FK L+ +++       E  AEF+ L QG L+V QY             ++P ++L
Subjt:  NAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQYVGGSKSCPVVSQSWLPPRKL

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

1.9e-18

44.83

Show/hide

Query:  EVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVE
        E +FIK F +  PP+FDG SE + AV EW   LEA++ +L    Q +V+GA FML+G A  WW +V   ++    PI W+ FK L+ D++         E
Subjt:  EVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVE

Query:  AEFVSLVQGILSVEQY
        AEF+ LVQG LSV QY
Subjt:  AEFVSLVQGILSVEQY

XP_022156546.1 uncharacterized protein LOC111023424 [Momordica charantia]

3.9e-19

38.36

Show/hide

Query:  PPAPPVLAAEALQAMLGNAILNNVQHVGA--NEAPAH----GEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKG
        PP PP  A E        A++NN   VG    + P H      E QFIK F +  PP+F G SE +    EW   LEA++ +L    Q +V+GA FML+ 
Subjt:  PPAPPVLAAEALQAMLGNAILNNVQHVGA--NEAPAH----GEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKG

Query:  YARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY
         A  WW +V  T++    P+ W+ FK L+ DH+         E EF+ LVQG L+V QY
Subjt:  YARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY

XP_022158749.1 uncharacterized protein LOC111025213 [Momordica charantia]

6.6e-19

Show/hide

Query:  GCGSGRTKAEAGGHVTPEVRRGESSCPPPAPPVLAAEALQAMLGNAILNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAI
        G G+G+   E     T      +    PP PP  A E     +  A+  +              E +FIK F +  PP+FDG SE + A  EW   LEA+
Subjt:  GCGSGRTKAEAGGHVTPEVRRGESSCPPPAPPVLAAEALQAMLGNAILNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAI

Query:  FQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY
        + +L    Q +V+GA FML+G A  WW +V   ++    PI W+ FK L+ D++         EAEF+ LVQG LSV QY
Subjt:  FQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DRB3 uncharacterized protein LOC111023126

5.4e-19

34.54

Show/hide

Query:  AEAGGHVTPEVRRGESSCPPPAPPV-LAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEA
        A  GG V P  +      P   P V L AEALQ +L NA      Q      A    EEVQFI+ F +  P  F+G SE   A  EW   LEA+  +L  
Subjt:  AEAGGHVTPEVRRGESSCPPPAPPV-LAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEA

Query:  NAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQYVGGSKSCPVVSQSWLPPRKL
        + + +V+GA FML+G    WWK+V   ++    P++W+ FK L+ +++       E  AEF+ L QG L+V QY             ++P ++L
Subjt:  NAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQYVGGSKSCPVVSQSWLPPRKL

A0A6J1DRF5 uncharacterized protein LOC111022474

4.2e-19

36.02

Show/hide

Query:  RTKAEAGGHVTPEVRRGESSCPPPAPP----------VLAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWT
        R +  A  +V P V RG +   P   P           L AEALQ +L NA      Q      A    EEVQFI+ F +  PP F+G SE   A  EW 
Subjt:  RTKAEAGGHVTPEVRRGESSCPPPAPP----------VLAAEALQAMLGNAI-LNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWT

Query:  GALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY
          LEA++ +L  + + +V+GA FML+G A  WW++V   ++    P++W+ FK L+ +++       E  AEF+ L QG L+V QY
Subjt:  GALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY

A0A6J1DUM2 uncharacterized protein LOC111023247

9.3e-19

44.83

Show/hide

Query:  EVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVE
        E +FIK F +  PP+FDG SE + AV EW   LEA++ +L    Q +V+GA FML+G A  WW +V   ++    PI W+ FK L+ D++         E
Subjt:  EVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVE

Query:  AEFVSLVQGILSVEQY
        AEF+ LVQG LSV QY
Subjt:  AEFVSLVQGILSVEQY

A0A6J1DVA0 uncharacterized protein LOC111023424

1.9e-19

38.36

Show/hide

Query:  PPAPPVLAAEALQAMLGNAILNNVQHVGA--NEAPAH----GEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKG
        PP PP  A E        A++NN   VG    + P H      E QFIK F +  PP+F G SE +    EW   LEA++ +L    Q +V+GA FML+ 
Subjt:  PPAPPVLAAEALQAMLGNAILNNVQHVGA--NEAPAH----GEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKG

Query:  YARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY
         A  WW +V  T++    P+ W+ FK L+ DH+         E EF+ LVQG L+V QY
Subjt:  YARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY

A0A6J1E0B4 uncharacterized protein LOC111025213

3.2e-19

Show/hide

Query:  GCGSGRTKAEAGGHVTPEVRRGESSCPPPAPPVLAAEALQAMLGNAILNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAI
        G G+G+   E     T      +    PP PP  A E     +  A+  +              E +FIK F +  PP+FDG SE + A  EW   LEA+
Subjt:  GCGSGRTKAEAGGHVTPEVRRGESSCPPPAPPVLAAEALQAMLGNAILNNVQHVGANEAPAHGEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAI

Query:  FQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY
        + +L    Q +V+GA FML+G A  WW +V   ++    PI W+ FK L+ D++         EAEF+ LVQG LSV QY
Subjt:  FQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQGILSVEQY

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCTCCCCCTACTGGCGCCGACGACGAAATAAGAAGACAAAGACGTCGAGCAGCGTGGGACTGGGTGGCCAAACGAAGAAGAAGAGTCAAATGATTGGGTGGCTTAG
ATCCGTTGGGGCTGCTGCGGGGACTGGCCGTTTTCGCGCCGCCGCCGCTCAGCTCGCGTCGCCGCCGGTCATCGCGCCGCCGCCCTCTGCAGTTGCCGCCGCCTGTCGTG
TAGTCGCGCCGTCGCCGGTTCGTGCAGCGCCGCCGTCTCCGTACTCGTCGCGCATATCTCTCTCACTCTGCGCGTCTCTCTCTCTCCTCCGTCGCAGCTCGAGTGTCGCC
GCCACTACCCTTGCCGCCGTCGCCAGCCCCGGTCTCTCTGCTTCTCCGCGTGTTCTTCGTCGTGGATCTCGCGCGGACAGCAGCCCAGAGTCTTTGTTTCTCGCGTTTTC
GTCGCTGTCCAGCAGCGTCATTGGGCGTATCCGGCATCAATTAGCCGCCGTAAAAGTGTTCGATAAGGTTCGAAACACTTCAGCTTGGATACCCATTGCCCAAGGCCTAG
TAAGTGGGTTTTGGCTTTTCAAGCTTTTCTTAAGCCTGTTGGATATCTGTGGTTGCATAAGCATGATGCTTGCTTGTGGTTGTGAAAGCATGTTGGATGCGTGTGTAAGG
CATGTTGATTGCGTTGTTGATGTTTGTGGTTTGGTGAAAAAAATGGGTTCAGGCATTTTACGCCGTTATGCTGCCGAAATTTTCGGTACATCCGGTTTAAGTGGTTCAGT
TCCATATTGGTATCAGAGCGAAACCTCTCCAGTAGGATGTGGTTCGGGACGAACCAAGGCGGAAGCTGGTGGGCATGTGACGCCCGAGGTTAGGAGGGGCGAATCCTCAT
GTCCTCCCCCAGCGCCTCCTGTGCTGGCAGCAGAGGCATTGCAGGCGATGCTTGGCAATGCAATCCTGAACAACGTACAGCACGTCGGTGCTAACGAAGCCCCTGCTCAT
GGCGAAGAGGTGCAGTTTATCAAGAGTTTCGTGAAGGCGAAGCCTCCTTCATTTGATGGACGCTCGGAAGGTTCTGAAGCAGTTGTAGAATGGACTGGCGCGTTGGAAGC
GATATTTCAATTTCTTGAAGCTAATGCCCAGCAACGGGTCCAAGGAGCCACCTTTATGCTTAAGGGTTACGCTCGCACTTGGTGGAAGGCAGTGGGTCAAACCAAGAATC
GCCCGGAGAACCCCATTTCCTGGTCAGGGTTCAAGGGTCTGGTGCAAGACCATTTTGGCTGCCGTTTTGCTGGAGTTGAGGTAGAAGCGGAATTTGTCTCTCTGGTTCAA
GGGATTTTGTCCGTAGAGCAATACGTCGGAGGTTCGAAGAGTTGTCCTGTCGTGTCCCAGAGTTGGTTGCCACCGAGGAAATTAGGATCAACCGATTCGTTAACGGGCTC
CGCGCAGAAATTCGAGATAGAGCAGTCCCAAGAGGTTGGCACGTCATCTGGTGCCAAGAAGAAGCACGAAGAGGAAGCGTTTGTGCCTAGTCAGAAGGTTAGAAGATCTC
CATCAGGATCTCGCAAGTGCGCTGATGAGTTCTGGCCCTGTGTCACCGATGAGGAGCTCAAGGCAGAGTACCCAGAACTTTACGATGACGATGACTCTGATGATGAGGAA
AGCTCCTAA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSSPYWRRRRNKKTKTSSSVGLGGQTKKKSQMIGWLRSVGAAAGTGRFRAAAAQLASPPVIAPPPSAVAAACRVVAPSPVRAAPPSPYSSRISLSLCASLSLLRRSSSVA
ATTLAAVASPGLSASPRVLRRGSRADSSPESLFLAFSSLSSSVIGRIRHQLAAVKVFDKVRNTSAWIPIAQGLVSGFWLFKLFLSLLDICGCISMMLACGCESMLDACVR
HVDCVVDVCGLVKKMGSGILRRYAAEIFGTSGLSGSVPYWYQSETSPVGCGSGRTKAEAGGHVTPEVRRGESSCPPPAPPVLAAEALQAMLGNAILNNVQHVGANEAPAH
GEEVQFIKSFVKAKPPSFDGRSEGSEAVVEWTGALEAIFQFLEANAQQRVQGATFMLKGYARTWWKAVGQTKNRPENPISWSGFKGLVQDHFGCRFAGVEVEAEFVSLVQ
GILSVEQYVGGSKSCPVVSQSWLPPRKLGSTDSLTGSAQKFEIEQSQEVGTSSGAKKKHEEEAFVPSQKVRRSPSGSRKCADEFWPCVTDEELKAEYPELYDDDDSDDEE
SS

Lag0022080 (gene) of Sponge gourd (AG-4) v1 genome