CuGenDBv2

Gene ID	Lag0014797
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Retrotransposon gag protein
Genome location	chr12:4734277..4736947
RNA-Seq Expression	Lag0014797
Synteny	Lag0014797
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0025725.1 retrotransposon gag protein [Cucumis melo var. makuwa]

1.8e-25

62.73

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K++S + SRMKRK SV INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQG
        II TNP ++G
Subjt:  IILTNPTSQG

KAA0044978.1 retrotransposon gag protein [Cucumis melo var. makuwa]

1.4e-25

59.83

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K+ S + SRMKRK SV INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQGPDQDHDK
        II TNP ++G ++  D+
Subjt:  IILTNPTSQGPDQDHDK

KAA0050734.1 gag protease polyprotein [Cucumis melo var. makuwa]

3.1e-25

62.73

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K+ S + SRMKRK SV INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQG
        II TNP ++G
Subjt:  IILTNPTSQG

KAA0063700.1 ty3-gypsy retrotransposon protein [Cucumis melo var. makuwa]

4.1e-25

55.04

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +S A  +EENQC TST+TR SAF+RLS+STSKK++PST  FDR+K+T+ Q +R+M +L+ KLF E N D  + S + SRMKRK S+ INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQGPDQ---DHDKIRAFKISFS
        II TNPT++G +Q   +++  R F   FS
Subjt:  IILTNPTSQGPDQ---DHDKIRAFKISFS

TYK18884.1 gag protease polyprotein [Cucumis melo var. makuwa]

3.1e-25

58.97

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K+ S + SRMKRK S+ INT+GSL VKP L
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQGPDQDHDK
        II TNP ++G ++  D+
Subjt:  IILTNPTSQGPDQDHDK

TrEMBL top hits

e value

%identity

Alignment

A0A5A7SMQ5 Retrotransposon gag protein

8.9e-26

62.73

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K++S + SRMKRK SV INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQG
        II TNP ++G
Subjt:  IILTNPTSQG

A0A5A7TQ06 Retrotransposon gag protein

6.8e-26

59.83

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K+ S + SRMKRK SV INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQGPDQDHDK
        II TNP ++G ++  D+
Subjt:  IILTNPTSQGPDQDHDK

A0A5A7V935 Ty3-gypsy retrotransposon protein

2.0e-25

55.04

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +S A  +EENQC TST+TR SAF+RLS+STSKK++PST  FDR+K+T+ Q +R+M +L+ KLF E N D  + S + SRMKRK S+ INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQGPDQ---DHDKIRAFKISFS
        II TNPT++G +Q   +++  R F   FS
Subjt:  IILTNPTSQGPDQ---DHDKIRAFKISFS

A0A5D3BBF9 Gag protease polyprotein

1.5e-25

62.73

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K+ S + SRMKRK SV INTEGSL VKP  
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQG
        II TNP ++G
Subjt:  IILTNPTSQG

A0A5D3D5Q0 Gag protease polyprotein

1.5e-25

58.97

Show/hide

Query:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL
        +SMA  +EENQC TST+ R SAF+RLS+STSKK +PSTS FDRLK+T+DQ +R+M +L+ K F E N D K+ S + SRMKRK S+ INT+GSL VKP L
Subjt:  MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNL

Query:  IILTNPTSQGPDQDHDK
        II TNP ++G ++  D+
Subjt:  IILTNPTSQGPDQDHDK

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGCATGGCCGCGACAAAAGAAGAAAATCAATGTTCAACGTCCACCTTCACTCGACCTTCAGCTTTCCAAAGGCTAAGTGTCTCCACATCGAAGAAAAGTCAACCTTC
GACATCTGTTTTTGATCGCCTCAAAGTAACAAGCGATCAACCTAAAAGAAAGATGGATAACTTGGAGGTGAAACTTTTCGATGAAGTAAACAGCGACAAGAAGCTTCAAA
GTAGCATCCTGTCACGTATGAAGAGGAAGTTCTCTGTTCTCATAAATACAGAAGGTTCCTTGAAGGTGAAACCAAATCTCATTATCTTGACCAATCCTACAAGTCAAGGA
CCTGATCAAGACCATGATAAGATAAGAGCTTTTAAAATTTCCTTCTCTCCAAGTTCGAGGGTCCTTACACTGTACGCTATTGCGTTGTTCCTTCTCCAAGTTCGAAGGTT
CTTCGTTGTATCCTGTTGCGTTGTTCATTCTCCAAGTTCGAGGTTCTCAGTTGTACAACTGCTACGTTGTTCCTCCTCCAAGTGCGAAGGATCTTATGTGGTGCGTTGTT
GCATTGTTCCCTCTTCTCTCAAGTTCGATGGTTCTCACGCAACTTTGCTGGAGTTTCTTCTCCCCAAGTTCGAAGGTTCTCACGCGCTCCGTTGCAGTTCCTTCTTTCCA
AGGTCGAAGGTTCTCACTCGCTGCGTTGAAGTTCTTTCTCCCCAAGTTCGAAGGTTCACGCACTTCGCTGTTCCCCTTCCTCCAAGTTCGAAGGTTCTCACGCGCATCGC
CACAGTTCCTTCCTCCAAGTTCGAAGGTTCACACGCGCATCGCCACAGTTCCTTCCTCCAAGTTCGAAGGTTCTCACGCGCATCGCCACAGTTCCTTCCTCCAAGTTCGA
ATCCTTCCTCCAAGTTCGAAGGTTCTCACGCGCATCGCCACAGTTCTTTCCTCCAAGTTCGAAGGTTCTCACGCGCATCGCCACAGTTCCTTCCTCCAAGTTCGAAGGTT
CTCACGCGCATCGCCGCAGTTCCTTCCTCCAAGTTCGAAGGTTCTCACGTGTTTCACTGCAGTTCTTTCCTCACAGTTCGAAGGTTCTCATGCGCTTCGCTGCAGTTCCT
TCTTCCAAGTTTGAAGGTTCTCACATCGCTTCGCTGCGATCCTTCCTCCAAGTTCGAAGGTTCTCACGCGCTTCGCTCTGCAATTCATTCCCCAAGTTCGAAGGTTCTCA
TGCGCTTCGTGCAGTTCCTTCCTCCAAATTCGAAGGTTCTCACGCGCTTCGTTGCATTTCCTTCCCCCAAATTCGAAGGTTCTCACGTGCTTCGCTGCAGTTCCTTCCTC
CAAGTTCGAAGGTTCTCACGCGCTTCGCTCTGCAATTCCTTCCCCAAGTTAGAAGGTTCTCACGCGCTTCGTGCAGTTCCTTCCTCCAAATTCGAAGATTCTCACGCGCT
TCGTTGCATTTCCTTCCCCCCAAGTTCGAAGGTTCTCACGTGTTTCGCTGCATTTCCTTCCCCCCAAATTCGAAGGTTCTCACGCGCTTCGCTGCAGTTCCTTCCCCCAA
GTTCGAAGGTTCTCACGCGCTTCGCTACAGTTCCTTCCTCCAAGTTCAAAGGTTATCACGTCGCTTCGCTGCGCTCATGCGCTTCGCTGCAGTTCCTTCCTCCAAGTTTG
AAGGTTCTCACATCGCTTCGCTGCGATCCTTCCTCCAAGTTCGAAGGTTCTCACGCGCTTCGCTCTGCAATTCCTTCCCCAAGTTCGAAGGTTCTCATGCGCTTCGTGCA
GTTCCTTCCTCCAAATTCGAAGGTTCTCACGCGTTTCGTTGCATTTCCTTCCCCCCAAATTCGAAGGTTCTCACGCGCTTCGCTGCAGTTCCTTCCTCCAAGTTCGAAGG
TTCTCACGCGCTTCGCTCTGCAATTCCTTCCCCCAAGTTCGAAGGTTCTCACGCGCTTCGTGCAGTTCCTTCCTCCAAATTCGAAGGTTCTCACGCGCTTCGTTGCAGTT
CCTTCCCCCAAATTCGAAGGTTCTCACGCGCTTCGCTGCAGTTCCTTCCCCCAAGTTCGAAGGTTCTCACGCACTTCGCTGCAGTTCCTTCCTCCAAGTTCAAAGGTTCT
CACGCGCTTCGCTGCACTCCAGCGCTACTTCCTAAAGTCCAAAGACGTCAATTGTCCTCACGCTGCGCTGCTTCCTTCTCCAAGTTCGAGGGTCCTCATGCTACGCTCGG
CTACATTGCTGCTCTACTTCCTAAAGTCCAAAGACGTCAATTGTCCCTGCACTCATGCTGAAAAGGGCATGGCGGCGACACAAGTCCAAGGACATGTCCCAAAGCGAGGA
ACATGTCCTTGTACTCGTGCTGAAAGGCGCGGCGGCGGCACAAGTCCAAGGAACATGTCCCAACTCAAGGAACATGTCCGTGCACTCGTGCTGAAAGGCGTGGCGGCGGC
ACAAGTCCAAGGAACATGTCCCAACTCAAGGAACACGTCCTTGCACTCGTGCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSMAATKEENQCSTSTFTRPSAFQRLSVSTSKKSQPSTSVFDRLKVTSDQPKRKMDNLEVKLFDEVNSDKKLQSSILSRMKRKFSVLINTEGSLKVKPNLIILTNPTSQG
PDQDHDKIRAFKISFSPSSRVLTLYAIALFLLQVRRFFVVSCCVVHSPSSRFSVVQLLRCSSSKCEGSYVVRCCIVPSSLKFDGSHATLLEFLLPKFEGSHALRCSSFFP
RSKVLTRCVEVLSPQVRRFTHFAVPLPPSSKVLTRIATVPSSKFEGSHAHRHSSFLQVRRFSRASPQFLPPSSNPSSKFEGSHAHRHSSFLQVRRFSRASPQFLPPSSKV
LTRIAAVPSSKFEGSHVFHCSSFLTVRRFSCASLQFLLPSLKVLTSLRCDPSSKFEGSHALRSAIHSPSSKVLMRFVQFLPPNSKVLTRFVAFPSPKFEGSHVLRCSSFL
QVRRFSRASLCNSFPKLEGSHALRAVPSSKFEDSHALRCISFPPSSKVLTCFAAFPSPQIRRFSRASLQFLPPSSKVLTRFATVPSSKFKGYHVASLRSCASLQFLPPSL
KVLTSLRCDPSSKFEGSHALRSAIPSPSSKVLMRFVQFLPPNSKVLTRFVAFPSPQIRRFSRASLQFLPPSSKVLTRFALQFLPPSSKVLTRFVQFLPPNSKVLTRFVAV
PSPKFEGSHALRCSSFPQVRRFSRTSLQFLPPSSKVLTRFAALQRYFLKSKDVNCPHAALLPSPSSRVLMLRSATLLLYFLKSKDVNCPCTHAEKGMAATQVQGHVPKRG
TCPCTRAERRGGGTSPRNMSQLKEHVRALVLKGVAAAQVQGTCPNSRNTSLHSC

Lag0014797 (gene) of Sponge gourd (AG-4) v1 genome