CuGenDBv2

Gene ID	Lag0038449
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Retrotransposon gag protein
Genome location	chr2:17701729..17707290
RNA-Seq Expression	Lag0038449
Synteny	Lag0038449
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0036008.1 Retrotransposon gag protein [Cucumis melo var. makuwa]

3.3e-21

66.67

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC MST  R SAF+RLS+STSKK R STS FDRLK+TNDQ +R+M + + K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

KAA0044978.1 retrotransposon gag protein [Cucumis melo var. makuwa]

5.6e-21

66.67

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC  ST  R SAF+RLS+STSKK R STS FDRLK+TNDQ +R+M +L+ K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

KAA0050734.1 gag protease polyprotein [Cucumis melo var. makuwa]

5.6e-21

66.67

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC  ST  R SAF+RLS+STSKK R STS FDRLK+TNDQ +R+M +L+ K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

KAA0050736.1 retrotransposon gag protein [Cucumis melo var. makuwa]

2.8e-20

64.58

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC MST TR SAF+RLS+S SKK R STS FDRLK+TNDQ +R+M +L+ K F E N D K++S +PSR+KRK S+ INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

TYK16519.1 retrotransposon gag protein [Cucumis melo var. makuwa]

1.6e-20

65.62

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC  ST  R SAF+RLS+STSKK R STS FDRLK+TN+Q KR+M + + K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

TrEMBL top hits

e value

%identity

Alignment

A0A5A7SZJ7 Retrotransposon gag protein

1.6e-21

66.67

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC MST  R SAF+RLS+STSKK R STS FDRLK+TNDQ +R+M + + K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

A0A5A7TQ06 Retrotransposon gag protein

2.7e-21

66.67

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC  ST  R SAF+RLS+STSKK R STS FDRLK+TNDQ +R+M +L+ K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

A0A5A7U974 Retrotransposon gag protein

1.4e-20

64.58

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC MST TR SAF+RLS+S SKK R STS FDRLK+TNDQ +R+M +L+ K F E N D K++S +PSR+KRK S+ INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

A0A5D3BBF9 Gag protease polyprotein

2.7e-21

66.67

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC  ST  R SAF+RLS+STSKK R STS FDRLK+TNDQ +R+M +L+ K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

A0A5D3D209 Retrotransposon gag protein

7.9e-21

65.62

Show/hide

Query:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV
        +SMA  EEENQC  ST  R SAF+RLS+STSKK R STS FDRLK+TN+Q KR+M + + K F E N D K+HS +PSRMKRK SV INTEGSL V
Subjt:  MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKV

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGTATGGCCGCGACAGAGGAAGAAAATCAATGTTCGATGTCCACCTCCACTCGACCTTCAGCTTTCCAAAGGCTAAGTGTCTCCACATCGAAGAAAAGTCGATCTTC
GACATCTGTCTTTGATCGCCTCAAAGTAACAAACGATCAACCTAAAAGAAAGATGAACAACTTGGAGTTGAAACTTTTCGATGAAGTAAACAGTGACAAGAAGCTTCATA
GTAGCATCCCGTCACGTATGAAGAGGAAGTTTTCTGTTCTCATAAATACGGAAGGTTCCTTGAAGGTTCCCACATTGCGCTGTTGTGCTGCTTCCTTCTCCAAGTTCGAA
GGTTCTGACGCTGCGCTGCTACCTTCCTCCAAGTTCGAAGGTTTTCATGCGCTTTGTTGCAGTTCCTTCTCTCCAAACTCGAAGGTGTTCTCACGCGCGCCGCTGCAGTT
CCTTCTCTCCAAGTTTGAAGGTTCTCTCAAGTTGCTTCGCTGCAGTTCCTTCCTCCAAGTTCGAAGGTTTTCATGCGCTTTGTTGCAGTTCCTTCTCTCCAAGTTCGAAG
GTGTTCTCGCGCACTTTGCTGCCGTTCCTTCCTCTCAAATTCGAAGGTTCTCTCACGCGCTTCGTTGCAGTTCCTTCCTCCCAAATTTGAAGGTTCTCACGACGCTCCGC
TGCAGTTCCTTCTCTCTCCAAATTCGAAGGTTCTCACGCGCTCCGCTGCAGTTCCTTCGCTTCCGCTGCAGTTCATTCTCTCTCCAAATTCGAAGGTTCTCACGCGCTCC
GCTGCAGTTCCTTCGCTTTCGCTGCAATTCCTTCTCTCCGAGTTCGAAGGTTCTCACGACGTTTCGTTGCAGTTCCTTCCTCCCAAATTCGAAGGTTCTCACGACGCTCC
GCTATAGTTCCTTCTCTCCAAATTTGAAGGTGTTCTCACGCGCGCCGCTGCAGTTCCATCTCTCCAAGTTCGAAGGTGTTCTCGCGCGCTTCGCTGCAGTTCCTTCCTCC
CAAATTCGAAGGTTCTCTCACGCGCTTCGTTACAGTTCCTTCTCTCCAAGTATGAAGGTTCTCTCCTCCAAGTCGAAGGTTCTCACGTTGCTTCACTGCAGTTCCTTCCT
CCAAGTTCGAAGGTTCTCACGTTGCTTCGTCGTAGTTCCTTCTCTCCAAGTACGAAGGTTCTCTCCTCCAAGTCTGAAGGTGCTCACGTGCTTCGGTAAAGTTCCTTCCT
CCCAAGTTCGAAGTTTCTTCTCCCTAAGTTCGAAGGTTCTCACGCGCTTCGCTGCAGTTCCTTCCTCCCTAAGTTCGAAGGTTCTCACGCGCTTCGCTGCAGTTCCTTCC
CCCAAATTCGAAAGTTTCAAAGGCCCTCACGCGCTGCGCTTCGTTGCAGTTCCTTCTTCCAAGTTCGAAGGTTCTCATGCGTTTCGATGCTACCTTCCTCCAAGTTCGAA
GGTTCTCTCACGCGCTGCTGCAGTTCCTGCCTCCAAGTTTGAAGGTTCCCTCACGCGCTTCGCTCGCTCCTTCTCCAAGTTCGAAGGCGCTTCTCTCCGTTGCTCCTTCT
CCAAGTTCGAAGGCGCTTCTCTCTACTGCTCCTTCTCCAAGTTCGAAGGCGCTTCTCTCCGTTGCTACCTTCCTCCAAGTTCGAAGTTCCTTCCTCCAAGTTTGAAGGTT
CCCTCACGCGCTTCGCTCGCTCCTTCTCCAAGTTCGAAGGCGCTTCTCTCCGTTGCTACTTCTCCAAGTTCGAAGGCGCTTCTCTCCACTGCTCCTTCTCCAAGTTCGAA
GGCGCTTCTCTCCACTGCTCCTTCTCCAAGTTCGAAGGTGCTTCTCTCCACCCCTCTTTTTGAAGGTTCGCCACTGAGGTTCTCCTTCTCCAAGTTCGAAGGTTCACCGT
TGCTCCTTTTCAAATGTTTGGCGGAGGTTGACGTCCTCGTTCCGCTTCATCTTCAAATGTTGGTAGTTGACGGCGTCTGCTGCGCTTCATCTTCAAATGTTGGCAGAAAC
TACAGTCATCAAAGTGACTGGTCTAGACAGGTGGTGAAGTCACTGCAATTGAATCTGATGACGACCGTTGAAGGCGAGTCGGGTCTGGTGACCACCCCTGCAGGTTACTC
AAATCACCCAATAAAATGGGGACTGGGTCTAGCAGGAGTGCATGAGGCGAATCTGGTGACTACCCCTGCAGGTTACTCAGATCACCCAATAAAATGGGGACTGGGTCTAG
CAGGAGTGCATCGCTGTTACTCAGATCACCCAATAAAATGGGGACTGGGTCTAGCAGGAGTGCATGAAGGCGAATCTGGTGACTACCCCTGCAGACTGAAGACTCCTTCA
AGATTTGGAAGACTTCAAGCTCCAAGAGATCAACAAGCCAACCGACCGATCAAGAAGATCAACAAGTCAGCAGGCCGATCATCCAAGAAGATCAACAAGCCAACCGATCG
AACAGATCATCAAGCTAACCGACCGATCAAGAAGATCAACAACCGACAGGCAGATCCAAGAGATCAACAAGCCAACCGACCGATCAAGAAGATCAACAAGTCAGCAGGCC
GATCATCCAAGAGATCAACAAGCCAACCGACCGATCAAGAAGATCAACAAGTCAGCAGGCCGATCATCCAGAAGATCAACAAGTCAGCAGGCCGATCATCCAAGAGATCA
ACAAGCCAACCGACCGATCAAGAAGATCAACAAGTCAGCAGGCCGATCATCCAAGAGATCAACAAGCCAACAGGCCGATCATCCAAGAGGATCAACAAGCTAACAAGCCG
ATCCAACAGATCATCAAGCCAACAGGCCGATCCAAGAGATCAACAAGCCAACCGACCGATCAAGAAGATCAACAAGTCAGCAGGCCGATCATCCAAGAGATCAACAAGCC
AACCGACCGATCAAGAAGATCAACAAGTCAGCAGGCCGATCATCCAAGAGGATCAACAAGCTAACAAGCCGATCCAACAGATCATCAAGCCAACAGGCTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MSMAATEEENQCSMSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPKRKMNNLELKLFDEVNSDKKLHSSIPSRMKRKFSVLINTEGSLKVPTLRCCAASFSKFE
GSDAALLPSSKFEGFHALCCSSFSPNSKVFSRAPLQFLLSKFEGSLKLLRCSSFLQVRRFSCALLQFLLSKFEGVLAHFAAVPSSQIRRFSHALRCSSFLPNLKVLTTLR
CSSFSLQIRRFSRAPLQFLRFRCSSFSLQIRRFSRAPLQFLRFRCNSFSPSSKVLTTFRCSSFLPNSKVLTTLRYSSFSPNLKVFSRAPLQFHLSKFEGVLARFAAVPSS
QIRRFSHALRYSSFSPSMKVLSSKSKVLTLLHCSSFLQVRRFSRCFVVVPSLQVRRFSPPSLKVLTCFGKVPSSQVRSFFSLSSKVLTRFAAVPSSLSSKVLTRFAAVPS
PKFESFKGPHALRFVAVPSSKFEGSHAFRCYLPPSSKVLSRAAAVPASKFEGSLTRFARSFSKFEGASLRCSFSKFEGASLYCSFSKFEGASLRCYLPPSSKFLPPSLKV
PSRASLAPSPSSKALLSVATSPSSKALLSTAPSPSSKALLSTAPSPSSKVLLSTPLFEGSPLRFSFSKFEGSPLLLFKCLAEVDVLVPLHLQMLVVDGVCCASSSNVGRN
YSHQSDWSRQVVKSLQLNLMTTVEGESGLVTTPAGYSNHPIKWGLGLAGVHEANLVTTPAGYSDHPIKWGLGLAGVHRCYSDHPIKWGLGLAGVHEGESGDYPCRLKTPS
RFGRLQAPRDQQANRPIKKINKSAGRSSKKINKPTDRTDHQANRPIKKINNRQADPRDQQANRPIKKINKSAGRSSKRSTSQPTDQEDQQVSRPIIQKINKSAGRSSKRS
TSQPTDQEDQQVSRPIIQEINKPTGRSSKRINKLTSRSNRSSSQQADPRDQQANRPIKKINKSAGRSSKRSTSQPTDQEDQQVSRPIIQEDQQANKPIQQIIKPTG

Lag0038449 (gene) of Sponge gourd (AG-4) v1 genome