CuGenDBv2

Gene ID	Spg017536
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Transposon Ty3-I Gag-Pol polyprotein
Genome location	scaffold4:35387744..35402565
RNA-Seq Expression	Spg017536
Synteny	Spg017536
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_023522102.1 LOW QUALITY PROTEIN: uncharacterized protein LOC111785979 [Cucurbita pepo subsp. pepo]

1.4e-32

48.22

Show/hide

Query:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRGT-NKKVKSVLEVDGVSTIRADLAMIANALKNVTVISHQQ-PPVVEPAAVV---------MMKE
        +VDASA  A+L++T+NEAYEILE I++N+CQW+DVR    +K + VLEVD +S+I A LA + N L+N+ +         V  AAV+         ++KE
Subjt:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRGT-NKKVKSVLEVDGVSTIRADLAMIANALKNVTVISHQQ-PPVVEPAAVV---------MMKE

Query:  FMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEERKE------PSKTQDIDDNCDR--NVVVEKE
        +MA+ D AIQS QAS+R LE+QVGQLANEL+ RP  KLP+DTE P+REG EQ +A+ LRSGK +  R E       S++Q+  D   R    VV++E
Subjt:  FMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEERKE------PSKTQDIDDNCDR--NVVVEKE

XP_030494802.1 uncharacterized protein LOC115710583 [Cannabis sativa]

1.6e-23

34.9

Show/hide

Query:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVTVISHQQPPVV--------------------
        ++DASA  A+L++++NEA+EILE I++N+ QWS  R  T++KV  VLEVD ++ + A +A + N LKN+ +    QP                       
Subjt:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVTVISHQQPPVV--------------------

Query:  --EPAAVV--------------------------------------------MMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEH
           PA+V                                             +M+++MA+ D  IQS  AS++ LE+Q+GQLAN+LK RPQG LPSDTE+
Subjt:  --EPAAVV--------------------------------------------MMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEH

Query:  PRREGKEQVKAVTLRSGKPLEER------KEPSKTQDIDDNCDRNVVVEKELETG
        PRR+GKE  KAVTLRSGK +E        KE S  Q   +   +  +   E+  G
Subjt:  PRREGKEQVKAVTLRSGKPLEER------KEPSKTQDIDDNCDRNVVVEKELETG

XP_030494874.1 uncharacterized protein LOC115710657 [Cannabis sativa]

6.0e-23

36.21

Show/hide

Query:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKN--------------VTVISHQQ----------
        ++DAS   A+L++++NE +EILE I++N+ QWS+ R  T++KV  VLEVD ++ + A +A + N LKN              V  + +Q           
Subjt:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKN--------------VTVISHQQ----------

Query:  --------------------------------PP-------------VVEPAAV-VMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPS
                                        PP               +P+++  +M+++MA+ D  IQS  AS+R LELQ+G LANELKARPQG LPS
Subjt:  --------------------------------PP-------------VVEPAAV-VMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPS

Query:  DTEHPRREGKEQVKAVTLRSGKPLEERKEPSK
        DTE+PRR+GKEQ  A+ LRSGK L+  +E  K
Subjt:  DTEHPRREGKEQVKAVTLRSGKPLEERKEPSK

XP_030503898.1 uncharacterized protein LOC115719117 [Cannabis sativa]

1.0e-22

36.29

Show/hide

Query:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVTV-------------IS--------------
        ++DASA  A+L++++NEA+EILE I++N+ QWS  R  T++KV  VLEVD ++ + A +A + N LKN+ +             IS              
Subjt:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVTV-------------IS--------------

Query:  ------------------------------------------HQQPPVVEP---------AAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKA
                                                   QQP   +P         +   +M+++MA+ D  IQS  AS+R LE+Q+GQLAN+LK 
Subjt:  ------------------------------------------HQQPPVVEP---------AAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKA

Query:  RPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEER------KEPSKTQ
        RPQG LPSDTE+PRR+GKE  KAVTLRSGK +E        KEPS  Q
Subjt:  RPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEER------KEPSKTQ

XP_030509265.1 uncharacterized protein LOC115723943 [Cannabis sativa]

3.1e-27

43.92

Show/hide

Query:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVTVISH--------------------QQP---
        ++DASA  A+L++++NEA+EILE I++N+ QWS+ R  T++KV  VLEVD ++ + A +A + N   N++                        QQP   
Subjt:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVTVISH--------------------QQP---

Query:  ---PVVEPAAV-VMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEERKEPSK
              +P+++  +M+++MA+ D  IQS  AS+R LELQ+G LANELKARPQG LPSDTE+PRR+GKEQ K++ LRSGK L+  +E  K
Subjt:  ---PVVEPAAV-VMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEERKEPSK

TrEMBL top hits

e value

%identity

Alignment

A0A061EW79 Retrotrans_gag domain-containing protein

2.6e-16

35.29

Show/hide

Query:  VDASAGVALLARTFNEAYEILEIISTNSCQWSDVRGTNKKVKSVLEVDGVSTIRADLAMIANALKNVTVISHQ---------------------QPPVVE
        +DA+   AL++++ ++AY++LE I +N+ QW   R   +K+  + E+D ++T+   L   A  +  ++V + Q                     + P++E
Subjt:  VDASAGVALLARTFNEAYEILEIISTNSCQWSDVRGTNKKVKSVLEVDGVSTIRADLAMIANALKNVTVISHQ---------------------QPPVVE

Query:  --PAAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTE-HPRREGKEQVKAVTLRSGKPLEERKEPSKTQD
          P+   +  +FM +T+  IQ+   S+R LE+QVGQLA+ L  RPQG LPSDTE +PRREGKE   A+TL +GK   E K P   +D
Subjt:  --PAAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTE-HPRREGKEQVKAVTLRSGKPLEERKEPSKTQD

A0A5B6UYR6 Aspartic proteinase CDR1-like

3.8e-15

35.79

Show/hide

Query:  HERSAWGMVDASAGVALLARTFNEAYEILEIISTNSCQWSDVR-GTNKKVKSVLEVDGVSTIRADLAMIANALK--NVTVISHQQPPVVE--PAAVV---
        H R A   V AS    LL + +NEAY+ILE I+ N  Q+  +R GT ++V  V+E+D ++++ A   ++   +K   +T +  ++  V +  P+ +    
Subjt:  HERSAWGMVDASAGVALLARTFNEAYEILEIISTNSCQWSDVR-GTNKKVKSVLEVDGVSTIRADLAMIANALK--NVTVISHQQPPVVE--PAAVV---

Query:  ----------------------MMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPL
                              M +E+MA+ +  IQS  A++RALE QV Q+AN L +R QG LPS+TE+ R +GKE  KA+TLRSG  L
Subjt:  ----------------------MMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPL

A0A5B6VNY6 Gag-asp_proteas domain-containing protein

2.4e-17

42.24

Show/hide

Query:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVT--VISH--QQPPVVEPAAVVMMKEFMARTD
        +VDASA   LL++++NEAY I++ I++ +CQW   R  + ++V  V EVD ++++ A +  I++ LK  T   ++H   QPP       V+   +MA+ D
Subjt:  MVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRG-TNKKVKSVLEVDGVSTIRADLAMIANALKNVT--VISH--QQPPVVEPAAVVMMKEFMARTD

Query:  TAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEER
          IQ   A+++ LE +VGQLA EL  RPQG  PSD ++PR  GKE  K V LRSGK LE +
Subjt:  TAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEER

A0A6J1G7Q6 uncharacterized protein LOC111451598

1.2e-16

Show/hide

Query:  KGANSVLEQSWE------RKLPRVSLVH-----------ERSAWGMVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRGT-NKKVKSVLEVDGVSTI
        K  N  L ++WE      RK P   L H             +   +VDASA   +L++T+NEAYEILE I++N+CQW DVR    KK + VLEVD +S+I
Subjt:  KGANSVLEQSWE------RKLPRVSLVH-----------ERSAWGMVDASAGVALLARTFNEAYEILEIISTNSCQWSDVRGT-NKKVKSVLEVDGVSTI

Query:  RADLAMIANALKNV---------------TVI------------------------------------------------------------------SH
         A LA + N L+N+               TV+                                                                  + 
Subjt:  RADLAMIANALKNV---------------TVI------------------------------------------------------------------SH

Query:  QQPP---------------------------------VVEPAAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKE
        Q PP                                 +       ++KE+MAR D  IQS Q S+R LE+QVGQLANEL+ RP GKLP+DTE P+REG E
Subjt:  QQPP---------------------------------VVEPAAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKE

A0A6J1H7K8 uncharacterized protein LOC111461167

1.1e-14

49.56

Show/hide

Query:  QQPPVVEPAAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEERKE------PSKTQDIDD
        Q   + E +   ++KE+MA+ D  IQS QAS+R LE+QVGQLANEL+ RP GKLPSDTE P+REG EQ +A+ LRSGK +  R+E       S++Q+  D
Subjt:  QQPPVVEPAAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLPSDTEHPRREGKEQVKAVTLRSGKPLEERKE------PSKTQDIDD

Query:  NCDR--NVVVEKE
           R    VV++E
Subjt:  NCDR--NVVVEKE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAAACGTCACTCCACTTCTCAGTCGAAAAACCCCACTCCATCCCAGAAACCGCCTAAGGGTTCTTCTTCTGAGAGGTTGAAGGTGGTTTCTAAAACTTCTCCTTTTCC
ACGGCTAATGAGTACCCACGATTTCGAACGTTCGGCCTCCCTAAGGTCGAAAACTCAAGAGGAGGAAGAAGAGGAAGTAACACATGCAAGGATGCCAAAACCAGTGAGGG
ATGAGGAGAGAAAGAGAGTAGGAATCAAGTACGTGAGAAGGAAAATCAAGGAGCAAGCTAAGCCAAACAGCCCAGTGGCGGCCGCAAATGCGGTGCAAACTGGTGTTTCT
TTTGCAGGAAATCAGGAATTTGCAGCCGCAAATGTGGCCCAACCAGAGAAAGAAGTGCCAGCTTCTTGTTGTGCTCCTGCAAGCGTACGGTTGCCCAACAAATCCAAGCC
AAAAACCCGAGAGGACAGCGTCTTGACGCCACAAACTAGCGTCTCGACGGTGTCGTCGGGAGCCAACCACGCAATTTGGTGTTATTTCGGCCCAATTATTGAGTTTTGGA
GCCATCTCGGTGTTCTTGGACGGCAAGGAGACAAAACTGAGAAAAAAGGTAGCAAGGCTCGGATTGGGGACGGCGTCGAGACGCTGCCTGATAAGGAAAAACAGAGGAAA
ACTGGAAAACCCCAGAAATGCGACCACATTTATGGGAAGGCAAAATCCAAATGCGACCGCATTTCTGGGCAGACAGAGGCAGTTTCGAGTCCGTCGCGGGTCGTTAAGCA
GCCGCAGAAGAACTTTCAACCAGTCAAAGTACAGAATCAAGAGTCAAATCTAGAGGCTCTGATGAAGGAGTACATGGCAAGAAATGATGTCGCTGTCAGGAATTTGGAAG
TACATATTGGTAAGGAGCAGTGCGAGGCCGTCACCTTGAGAAGTATATTAGAATACGATGGACCAGAATACCCCGTGAATCAAGAAGTAAGGAAAATCCCAAAAAAAGCT
CCAAAAGAAGTTCCAGAAAAGAAGTCAAAAGTTACCACCGAAGTTTTTCAGAATAAGGAAAATAAAGAAAAGACCAAGGAATTAGAAACCTTGGAAGAAAAAAGTGAAAG
TTCAAGTTCAGAGAAAAAGCAGGAAAATGCAACCGCAAAGCCTAAAAAGTTTATTATAGATCCAGATTACAGACCACCACCTCCATATCCTCAGAGATTCAAATATGCCT
CACAAGACGCACAGTTTAAAAAGTTTCTAGATATCCTCAAGCTGAAGTGTCTTCCCTACTATTCTCCGAGCCAAGAACGACTAGTGGGAGTCTATAGAGATAGGGAATGG
GAAGGGAATGCTAGAAGAGCAAATCCTTGCACCTTGGAGTCTCAAGTTGAAGGACACATGGTGGTAATGCAAGCCAAAGTGGATTCTAGAATTGAGTTAGAAGTGGTGAT
TATTTGTCCATGCCGAAAGAATTATTTTGCTGCAGCAGAGCTTGGTTTTGCAGAATGCTCAGAATCTGTTGCTGGGCGACTTAAGGGAGCAAACTCTGTGCTGGAGCAAA
GCTGGGAGCGAAAACTGCCACGTGTGAGTTTGGTGCATGAGCGATCCGCCTGGGGTATGGTTGATGCTTCGGCTGGAGTGGCCCTTTTGGCAAGAACTTTTAACGAAGCC
TATGAAATTTTAGAAATAATATCTACTAATAGTTGTCAGTGGTCGGATGTTAGAGGCACAAATAAAAAGGTTAAGAGTGTATTAGAAGTTGATGGTGTGTCCACCATTAG
GGCTGATCTTGCAATGATTGCTAACGCTCTTAAGAATGTGACAGTGATTAGTCATCAGCAGCCGCCAGTTGTGGAGCCTGCTGCAGTGGTAATGATGAAAGAATTTATGG
CTCGTACAGACACCGCAATTCAAAGTAATCAAGCTTCAATGAGAGCCCTGGAATTGCAAGTGGGTCAGCTAGCCAATGAGCTGAAGGCAAGGCCTCAAGGGAAACTTCCC
TCAGATACTGAACACCCTAGAAGGGAAGGTAAGGAGCAGGTAAAGGCAGTGACTCTTAGGAGTGGTAAGCCACTAGAAGAAAGAAAAGAGCCTAGTAAAACCCAGGATAT
AGATGATAATTGTGATAGAAATGTTGTTGTTGAGAAAGAGTTGGAGACTGGTCAGGGTGCTGGAGGCAGCAATAAAGATGCTGGAGCATCTGAAGGTTGTTACGGCAAAG
TTATGGCTGAAGCAAATCTTCCGTCCGGATGGAAAGGGTTGTTGTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MKRHSTSQSKNPTPSQKPPKGSSSERLKVVSKTSPFPRLMSTHDFERSASLRSKTQEEEEEEVTHARMPKPVRDEERKRVGIKYVRRKIKEQAKPNSPVAAANAVQTGVS
FAGNQEFAAANVAQPEKEVPASCCAPASVRLPNKSKPKTREDSVLTPQTSVSTVSSGANHAIWCYFGPIIEFWSHLGVLGRQGDKTEKKGSKARIGDGVETLPDKEKQRK
TGKPQKCDHIYGKAKSKCDRISGQTEAVSSPSRVVKQPQKNFQPVKVQNQESNLEALMKEYMARNDVAVRNLEVHIGKEQCEAVTLRSILEYDGPEYPVNQEVRKIPKKA
PKEVPEKKSKVTTEVFQNKENKEKTKELETLEEKSESSSSEKKQENATAKPKKFIIDPDYRPPPPYPQRFKYASQDAQFKKFLDILKLKCLPYYSPSQERLVGVYRDREW
EGNARRANPCTLESQVEGHMVVMQAKVDSRIELEVVIICPCRKNYFAAAELGFAECSESVAGRLKGANSVLEQSWERKLPRVSLVHERSAWGMVDASAGVALLARTFNEA
YEILEIISTNSCQWSDVRGTNKKVKSVLEVDGVSTIRADLAMIANALKNVTVISHQQPPVVEPAAVVMMKEFMARTDTAIQSNQASMRALELQVGQLANELKARPQGKLP
SDTEHPRREGKEQVKAVTLRSGKPLEERKEPSKTQDIDDNCDRNVVVEKELETGQGAGGSNKDAGASEGCYGKVMAEANLPSGWKGLL

Spg017536 (gene) of Sponge gourd (cylindrica) v1 genome