CuGenDBv2

Gene ID	Spg011043
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Retrotransposon gag protein
Genome location	scaffold4:29499948..29505824
RNA-Seq Expression	Spg011043
Synteny	Spg011043
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0040811.1 retrotransposon gag protein [Cucumis melo var. makuwa]

3.1e-33

51.52

Show/hide

Query:  IEHLKSQIENQHIAESSQTQRQRSKKFSQPRQPVTVKELFSRTF---HKKEKENFA---TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPS
        I H K    N+ + +S    + + + F QPRQ +T+ E F R+F   H KE        T+  +E        EEVDNS + +QRTS+FDRIKP TT  S
Subjt:  IEHLKSQIENQHIAESSQTQRQRSKKFSQPRQPVTVKELFSRTF---HKKEKENFA---TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPS

Query:  VFQRMSMTATEEENQCVVSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        VFQR+S+T  EEENQC  ST TR SAF+ LS+STSKK R STS FDRLK+ NDQ +R++ +L VK F+E   D K+ S +PSRMKRK SV INTEGSL
Subjt:  VFQRMSMTATEEENQCVVSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

KAA0044978.1 retrotransposon gag protein [Cucumis melo var. makuwa]

2.4e-33

55.29

Show/hide

Query:  QPRQPVTVKELFSRTF---HKKEKENFATSYCI----------EEEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTSTRPSAFQ
        QPRQ +T+ E F R+F   H +E     T +              EEVDNS + +QRTS+FDRIKP TT  SVFQR+SM   EEENQC  ST  R SAF+
Subjt:  QPRQPVTVKELFSRTF---HKKEKENFATSYCI----------EEEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTSTRPSAFQ

Query:  RLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        RLS+STSKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ S +PSRMKRK SV INTEGSL
Subjt:  RLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

KAA0050734.1 gag protease polyprotein [Cucumis melo var. makuwa]

4.5e-32

52.84

Show/hide

Query:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST
        + + F QPR+ +T+ E   R+F +   E         T+  +E        EEVDNS + +QRTSIFDRIKP TT   VFQR+SM   EEENQC  ST  
Subjt:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST

Query:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        R SAF+RLS+STSKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ S +PSRMKRK SV INTEGSL
Subjt:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

KAA0050736.1 retrotransposon gag protein [Cucumis melo var. makuwa]

8.2e-34

52.25

Show/hide

Query:  RQRSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVST
        +++ +KF QPR+ +T+ E F R+F +   E         T+  +E        EEVDNS + +QRTS+FDRIKP TT  SVFQR+SM   EEENQC +ST
Subjt:  RQRSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVST

Query:  STRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
         TR SAF+RLS+S SKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ S +PSR+KRK S+ INTEGSL
Subjt:  STRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

TYK08944.1 retrotransposon gag protein [Cucumis melo var. makuwa]

2.0e-32

52.27

Show/hide

Query:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST
        + + F QPR+ +T+ E  SR+F +   E         T+  +E        EEVDNS + +QRTS+FDRIKP TT  SVFQR+SM   EE+NQC  ST  
Subjt:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST

Query:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        R SAF+RLS+STSKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ + +PSRMKRK SV INTEGSL
Subjt:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

TrEMBL top hits

e value

%identity

Alignment

A0A5A7TGM1 Retrotransposon gag protein

1.5e-33

51.52

Show/hide

Query:  IEHLKSQIENQHIAESSQTQRQRSKKFSQPRQPVTVKELFSRTF---HKKEKENFA---TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPS
        I H K    N+ + +S    + + + F QPRQ +T+ E F R+F   H KE        T+  +E        EEVDNS + +QRTS+FDRIKP TT  S
Subjt:  IEHLKSQIENQHIAESSQTQRQRSKKFSQPRQPVTVKELFSRTF---HKKEKENFA---TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPS

Query:  VFQRMSMTATEEENQCVVSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        VFQR+S+T  EEENQC  ST TR SAF+ LS+STSKK R STS FDRLK+ NDQ +R++ +L VK F+E   D K+ S +PSRMKRK SV INTEGSL
Subjt:  VFQRMSMTATEEENQCVVSTSTRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

A0A5A7TQ06 Retrotransposon gag protein

1.2e-33

55.29

Show/hide

Query:  QPRQPVTVKELFSRTF---HKKEKENFATSYCI----------EEEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTSTRPSAFQ
        QPRQ +T+ E F R+F   H +E     T +              EEVDNS + +QRTS+FDRIKP TT  SVFQR+SM   EEENQC  ST  R SAF+
Subjt:  QPRQPVTVKELFSRTF---HKKEKENFATSYCI----------EEEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTSTRPSAFQ

Query:  RLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        RLS+STSKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ S +PSRMKRK SV INTEGSL
Subjt:  RLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

A0A5A7U974 Retrotransposon gag protein

4.0e-34

52.25

Show/hide

Query:  RQRSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVST
        +++ +KF QPR+ +T+ E F R+F +   E         T+  +E        EEVDNS + +QRTS+FDRIKP TT  SVFQR+SM   EEENQC +ST
Subjt:  RQRSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVST

Query:  STRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
         TR SAF+RLS+S SKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ S +PSR+KRK S+ INTEGSL
Subjt:  STRPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

A0A5D3BBF9 Gag protease polyprotein

2.2e-32

52.84

Show/hide

Query:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST
        + + F QPR+ +T+ E   R+F +   E         T+  +E        EEVDNS + +QRTSIFDRIKP TT   VFQR+SM   EEENQC  ST  
Subjt:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST

Query:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        R SAF+RLS+STSKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ S +PSRMKRK SV INTEGSL
Subjt:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

A0A5D3CCI8 Retrotransposon gag protein

9.8e-33

52.27

Show/hide

Query:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST
        + + F QPR+ +T+ E  SR+F +   E         T+  +E        EEVDNS + +QRTS+FDRIKP TT  SVFQR+SM   EE+NQC  ST  
Subjt:  RSKKFSQPRQPVTVKELFSRTFHKKEKENFA------TSYCIE-------EEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTST

Query:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL
        R SAF+RLS+STSKK R STS FDRLK+TNDQ +R++ +L  K F+E   D K+ + +PSRMKRK SV INTEGSL
Subjt:  RPSAFQRLSVSTSKKSRSSTSVFDRLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSL

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGTTCTACTGCCCATTGTTGCTTCAATGAACTGAGGTTACAAGAAGATAAAGCTTCTATCATTGCAAGCGAAGAAACAACATTGCAGGGGGCATGTACCAATGACAA
GTTTCTTGCTAAGTATAACCCTTTGTTTGAACCTGATTCTGACATAGTGACCGTTATGATGACTGAGACAAGAACTATGGAAGAAAGAATGGCTGAGATGCAAGAGCACA
TCAACACCTTGATGAAGGCAATTGAAGAAAAAGATTCTCAAATTGAGCACCTAAAGAGTCAGATTGAGAACCAACATATCGCCGAATCAAGTCAAACCCAAAGGCAGAGA
AGTAAAAAGTTTTCTCAACCTCGACAACCGGTGACAGTGAAGGAACTCTTCTCCAGAACTTTCCACAAAAAAGAAAAAGAAAACTTTGCAACTTCCTACTGCATCGAGGA
GGAAGAAGTTGACAATTCCAAGAAGGGTGAACAAAGGACCTCCATCTTCGATCGCATCAAGCCTCCAACTACTTGTCCTTCGGTATTCCAAAGAATGAGTATGACCGCGA
CAGAAGAAGAAAATCAATGTGTGGTGTCCACCTCCACTCGACCTTCGGCTTTCCAAAGACTAAGTGTCTCCACATCGAAGAAAAGTCGATCTTCAACATCTGTCTTTGAT
CGCCTCAAAGTAACAAACGATCAACCTCGAAGAAAGATAGATAACTTAGATGTGAAATTGTTCAATGAAGTAGGCAGTGACAAGAAGCTTCAAAGTAGCATCCCGTCACG
TATGAAGAGGAAGTTCTCTGTTCTCATAAATACAGAAGGTTCCTTGAAGCAAATGGAGGTTATGCATCGTTATGGATGTGAAGCTACGAGTTGGATGAATAAAAGAAAAC
TTCATTCCTCCAAGTTCAATGTCTCGCTAGCCTCAAGTTCGGTGTTTCACTCACCCTATGTTCGTTGTTCTCTCTTCTTCAAGTTTGAAGGTTCTTACGCTGCACTGCTT
CCTTCACCAAGTTTGAAGGTTATCATGCTGCGCTGTTTCGCTGTTCCTTCTCCAAGTTCGAAGGTTCCCACATTGCGCTGTTGTGCTGCTTCCTTCTCCAAGTTTGAAGG
TCCTGACACTGGATCCTCCAAGTCGAAGGTTCTCAAGTGGCTTCGTTGCAGTTCCTTCCTCCAAGTTCGAAGGTTCTCACGTTGCTTCGCTGCAGTTTCCTTCCTCCAAG
TTCGAAGGTTCTCAGTTCCTTCCTCCAAGTTCGAGAAGGTTCTCATCCGCTTCGCTGGAGTTCTTTCTCCCCAAGTTTTAAACTTCTCATGTGCTTCGTTGCAGTTCGAA
GGTTTCAAGTTGCTTCGCTGCAGTTTCCTTCCTCCAACTTCGAAGGATCCTCCAGGTCGAAGGTTCTCAGGTTCTCATCCGCTTCACTGGAGTTCTTTCTCCCCAAGTTT
GAAACTTCTCATGCGCTCGTGTTCTCACGTTGCTTCGCTGCAGTTCCTTCCTCCAAGTTCGAGAAGGTTCTCATCCGCTTTGCTGGAGTTCTTCTTTCTCCCCAAGTTTG
AAACTTCTCATGTGCTTCGTTGCAGTTCGAAGGTTTCAAAGTTGCTTCGCTGCGTGTTTCTCACGTTGCTTCGCTGTAGTTCCTTCCTCCAAGTTCGAGAAGGTTCTCAT
CCGCTTCGCTGGAGTTCTTCTTTCTCCCCAAGTTTGAAACTTCTCATGTGCTTCGTTGAAGGTTTCAAGTTGCTTCGCTGCAGTTTCCTTCCTCCAAAGGCAAATCTGGT
GACCACCCCTGCAGGAAACTACAGTCATCAAAGTGACTGGTCTAGACAGGTGGTAAAATCACTACAAGTGAAGTTGATGACGACCGTGGTGACCACCCCTGCAGGAAACT
ACAGTCATCAAAGTGACTGGTCTAGACAGGTGGTGAAATCACTACAAGAGAAGTTGATGACGACCGTGGTGACCACCCCTGCAGGAAACTACAGTCATCAAAGTGACTGG
TCTAGACAGGTGGTGAAATCACTGCAAGTGAAGTTGATGACGACCGTGGTGACCACCCCTGCAGGAAACTACAGTCATCAAAGTGGCTGGTCTAGACAGGTGGTGGTGAA
ATCACTGCAAGTGAAGCTGATGACGACCGTGGTGACCACCCCTGCAGGAAACTACAGTCATCAAAGTGACTGGTCTAGACAGGTGGTGAAATCACTGCAAGTGAAGCTGA
TGACGACCGTGGTGACCACCCCTGCAGGAAACTACAGTCATCAAAGTGACTGGTCTAGACAGGTGGTGAAATCATTGCAAGTGAAGCTGATGACGACCGTGGTGACCACC
CCTGGAGGAAACTACAGTCATCAAAGTGACTGGGAAAGAGGAGGAGTTGGAAGCTCTCAGCCAGAGTCAGAGAATTCAGAGAAACTCCACCAAGACTTCTTGAAGACTGA
AGACCCTTCAAGACTAGAAGACTTCAACGATCCTTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGSTAHCCFNELRLQEDKASIIASEETTLQGACTNDKFLAKYNPLFEPDSDIVTVMMTETRTMEERMAEMQEHINTLMKAIEEKDSQIEHLKSQIENQHIAESSQTQRQR
SKKFSQPRQPVTVKELFSRTFHKKEKENFATSYCIEEEEVDNSKKGEQRTSIFDRIKPPTTCPSVFQRMSMTATEEENQCVVSTSTRPSAFQRLSVSTSKKSRSSTSVFD
RLKVTNDQPRRKIDNLDVKLFNEVGSDKKLQSSIPSRMKRKFSVLINTEGSLKQMEVMHRYGCEATSWMNKRKLHSSKFNVSLASSSVFHSPYVRCSLFFKFEGSYAALL
PSPSLKVIMLRCFAVPSPSSKVPTLRCCAASFSKFEGPDTGSSKSKVLKWLRCSSFLQVRRFSRCFAAVSFLQVRRFSVPSSKFEKVLIRFAGVLSPQVLNFSCASLQFE
GFKLLRCSFLPPTSKDPPGRRFSGSHPLHWSSFSPSLKLLMRSCSHVASLQFLPPSSRRFSSALLEFFFLPKFETSHVLRCSSKVSKLLRCVFLTLLRCSSFLQVREGSH
PLRWSSSFSPSLKLLMCFVEGFKLLRCSFLPPKANLVTTPAGNYSHQSDWSRQVVKSLQVKLMTTVVTTPAGNYSHQSDWSRQVVKSLQEKLMTTVVTTPAGNYSHQSDW
SRQVVKSLQVKLMTTVVTTPAGNYSHQSGWSRQVVVKSLQVKLMTTVVTTPAGNYSHQSDWSRQVVKSLQVKLMTTVVTTPAGNYSHQSDWSRQVVKSLQVKLMTTVVTT
PGGNYSHQSDWERGGVGSSQPESENSEKLHQDFLKTEDPSRLEDFNDP

Spg011043 (gene) of Sponge gourd (cylindrica) v1 genome