CuGenDBv2

Gene ID	Spg020386
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Retrotrans_gag domain-containing protein
Genome location	scaffold1:34274419..34281832
RNA-Seq Expression	Spg020386
Synteny	Spg020386
Gene Ontology terms	GO:0006508 - proteolysis (biological process) GO:0090304 - nucleic acid metabolic process (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0004190 - aspartic-type endopeptidase activity (molecular function) GO:0008270 - zinc ion binding (molecular function) GO:0016740 - transferase activity (molecular function)
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0052218.1 uncharacterized protein E6C27_scaffold207G00290 [Cucumis melo var. makuwa]

5.3e-31

39.26

Show/hide

Query:  PQIEQPGPAAEPVTV-------DAIQAISTGFSSKAGGSLVFSAVFEHSGVYKMHKKLYLVSCRVFENEEFDVYVINFGSVLRKLWVLEVRPEAIWYRVH
        P I + G   +P+ V       + ++  ST F SK+GG LVFS                                            L + P      +H
Subjt:  PQIEQPGPAAEPVTV-------DAIQAISTGFSSKAGGSLVFSAVFEHSGVYKMHKKLYLVSCRVFENEEFDVYVINFGSVLRKLWVLEVRPEAIWYRVH

Query:  TGR-DRA-----PVPNTLPTSAKSSRTSSNV------GSVQIELAEYGLSIVESES---------------------------------RVMPPRTGRRR
        TG+ D+      PVP+TLPTSA+SS+++S+        SV +E+  Y  S V   S                                  VMPPRT RRR
Subjt:  TGR-DRA-----PVPNTLPTSAKSSRTSSNV------GSVQIELAEYGLSIVESES---------------------------------RVMPPRTGRRR

Query:  RQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR
        RQNQDG Q PTQ QSE GSST       GSERFARSAQEI RPERA PSD +KMYGIE+LKKL A VF+GSTDPADAEVWLNMLE        P+ ++
Subjt:  RQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR

KAA0056353.1 DNA/RNA polymerases superfamily protein [Cucumis melo var. makuwa]

9.7e-33

62.5

Show/hide

Query:  PVPNTLPTSAKSSRTSSNVGSVQIELAE-------------YGLSIVESESRVMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQ
        PVP+TLPTSA+SS ++S+ GSV I   +              G+        VMPPRT +R RQNQDGTQDPTQ QSE GSST       GSERF+RSAQ
Subjt:  PVPNTLPTSAKSSRTSSNVGSVQIELAE-------------YGLSIVESESRVMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQ

Query:  EIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLN
        EIGRPE+AGPSD EKMYGIERLKKLEA VF+GSTD ADAEVW N
Subjt:  EIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLN

TYK01041.1 uncharacterized protein E5676_scaffold264G00470 [Cucumis melo var. makuwa]

2.5e-33

53.76

Show/hide

Query:  PVPNTLPTSAKSSRTSSNVGSVQIELAEYGLSIVESESR--------------------------VMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVI
        PVP+TLPTS +SS ++S+  + Q+    + +  +  ES                           VMPPRT RR +QNQD TQDPTQ QSE GSST    
Subjt:  PVPNTLPTSAKSSRTSSNVGSVQIELAEYGLSIVESESR--------------------------VMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVI

Query:  MRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR
           GSERFARSAQEIGRPER GPSD EKMYGIERLKKL A VFEGSTDPA+AEVWLNMLE        P++R+
Subjt:  MRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR

XP_008448403.1 PREDICTED: uncharacterized protein LOC103490604 [Cucumis melo]

6.9e-31

72.9

Show/hide

Query:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE
        MPPRT RR +QNQD TQDPTQ QSE GSST       GSERFARSAQEIGRPER GPSD EKMYGIERLKKL A VFEGSTDPA+AEVWLNMLE      
Subjt:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE

Query:  GFPERRR
          P++R+
Subjt:  GFPERRR

XP_016901625.1 PREDICTED: uncharacterized protein LOC107991320 [Cucumis melo]

4.1e-31

72.9

Show/hide

Query:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE
        MPPRT +R RQNQDGTQDPTQ QSE GSST       GSERF+RSAQEIGRPE+AGPSD EKMYGIERLKKLEA VF+GSTD ADAEVWLNMLE      
Subjt:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE

Query:  GFPERRR
          P+ R+
Subjt:  GFPERRR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3BJ07 uncharacterized protein LOC103490604

3.4e-31

72.9

Show/hide

Query:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE
        MPPRT RR +QNQD TQDPTQ QSE GSST       GSERFARSAQEIGRPER GPSD EKMYGIERLKKL A VFEGSTDPA+AEVWLNMLE      
Subjt:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE

Query:  GFPERRR
          P++R+
Subjt:  GFPERRR

A0A1S4E0X6 uncharacterized protein LOC107991320

2.0e-31

72.9

Show/hide

Query:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE
        MPPRT +R RQNQDGTQDPTQ QSE GSST       GSERF+RSAQEIGRPE+AGPSD EKMYGIERLKKLEA VF+GSTD ADAEVWLNMLE      
Subjt:  MPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDE

Query:  GFPERRR
          P+ R+
Subjt:  GFPERRR

A0A5A7UAH6 CCHC-type domain-containing protein

2.6e-31

39.26

Show/hide

Query:  PQIEQPGPAAEPVTV-------DAIQAISTGFSSKAGGSLVFSAVFEHSGVYKMHKKLYLVSCRVFENEEFDVYVINFGSVLRKLWVLEVRPEAIWYRVH
        P I + G   +P+ V       + ++  ST F SK+GG LVFS                                            L + P      +H
Subjt:  PQIEQPGPAAEPVTV-------DAIQAISTGFSSKAGGSLVFSAVFEHSGVYKMHKKLYLVSCRVFENEEFDVYVINFGSVLRKLWVLEVRPEAIWYRVH

Query:  TGR-DRA-----PVPNTLPTSAKSSRTSSNV------GSVQIELAEYGLSIVESES---------------------------------RVMPPRTGRRR
        TG+ D+      PVP+TLPTSA+SS+++S+        SV +E+  Y  S V   S                                  VMPPRT RRR
Subjt:  TGR-DRA-----PVPNTLPTSAKSSRTSSNV------GSVQIELAEYGLSIVESES---------------------------------RVMPPRTGRRR

Query:  RQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR
        RQNQDG Q PTQ QSE GSST       GSERFARSAQEI RPERA PSD +KMYGIE+LKKL A VF+GSTDPADAEVWLNMLE        P+ ++
Subjt:  RQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR

A0A5A7UKD3 DNA/RNA polymerases superfamily protein

4.7e-33

62.5

Show/hide

Query:  PVPNTLPTSAKSSRTSSNVGSVQIELAE-------------YGLSIVESESRVMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQ
        PVP+TLPTSA+SS ++S+ GSV I   +              G+        VMPPRT +R RQNQDGTQDPTQ QSE GSST       GSERF+RSAQ
Subjt:  PVPNTLPTSAKSSRTSSNVGSVQIELAE-------------YGLSIVESESRVMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSAQ

Query:  EIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLN
        EIGRPE+AGPSD EKMYGIERLKKLEA VF+GSTD ADAEVW N
Subjt:  EIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLN

A0A5D3BMJ4 Retrotrans_gag domain-containing protein

1.2e-33

53.76

Show/hide

Query:  PVPNTLPTSAKSSRTSSNVGSVQIELAEYGLSIVESESR--------------------------VMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVI
        PVP+TLPTS +SS ++S+  + Q+    + +  +  ES                           VMPPRT RR +QNQD TQDPTQ QSE GSST    
Subjt:  PVPNTLPTSAKSSRTSSNVGSVQIELAEYGLSIVESESR--------------------------VMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVI

Query:  MRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR
           GSERFARSAQEIGRPER GPSD EKMYGIERLKKL A VFEGSTDPA+AEVWLNMLE        P++R+
Subjt:  MRQGSERFARSAQEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGAGTCGCTCGCCGCCGACGGTAAAGCTTCGCTCTCTCTCACGTGTGGGTTTCTTTGTTTCTTCCCCTCGCCCGTTCTCACTCTCTCTCTCTCTTATGTATCAGTTGC
CGCCGTCACCTTCTCCGTTGAGAACCGCCGCACGTCGATTTTTACCTCACGCCCGCCGTCTGCTTCACCACGCGTCGCCGTCTATTCGCCGTCGCACACGAGCCGCCGCC
GATCTGTTCATTGCCTTTCAGATCTGTCCGTCGCTGCCGTTCGATTTTTAAGCTTTGCTTCTAAAGAATTAGTTGGtagtggttccgctttagagatcatgcctccccgt
gaacgaggccgtggaagaggtcgtggaaaaggccgtggtaggggtcgtacagcccctgaagcagttgtgccaccattggggcatggagataatctaccagaagatccgca
aattgaacagccgggacctgcagcagaacctgtcacagtggatgccatccaggcaattagcacaggattttcgagcaaagcaggaggatctctggttttctctgctgttt
ttgagcattctggggtgtacaagatgcataagaagctctatttggtaagttgtagagtgttcgaaaatgaagagtttgatgtgtatgtcattaattttggttcagtattg
aggaagttatgggtgttggaagttaggcccgaggctatatggtaccgtgtgcacacaggtagagatcgagctccggtgcctaatacactgccaacgtctgctaaaagttc
cagaacaagttccaacgttgggtcagttcagatagaactagcggagtatggtctgagtattgtcgagagtgagtccagagtcatgccaccacgtaccggcagacgacgca
ggcagaatcaggacgggacgcaggatcctacccaaagtcaatctgaaagtggatccagtacccgagaggtcataatgaggcaggggagtgagcgatttgctagatctgct
caggagatcggtaggccagagagagcagggcctagtgattcggaaaagatgtatgggatagaacggttgaagaagttagaagccgcagtgtttgagggttccacggatcc
agctgacgccgaggtctggttgaatatgttggagaatgcttcgagtgatgaaggatttcctgagaggaggcgagag

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MESLAADGKASLSLTCGFLCFFPSPVLTLSLSYVSVAAVTFSVENRRTSIFTSRPPSASPRVAVYSPSHTSRRRSVHCLSDLSVAAVRFLSFASKELVGSGSALEIMPPR
ERGRGRGRGKGRGRGRTAPEAVVPPLGHGDNLPEDPQIEQPGPAAEPVTVDAIQAISTGFSSKAGGSLVFSAVFEHSGVYKMHKKLYLVSCRVFENEEFDVYVINFGSVL
RKLWVLEVRPEAIWYRVHTGRDRAPVPNTLPTSAKSSRTSSNVGSVQIELAEYGLSIVESESRVMPPRTGRRRRQNQDGTQDPTQSQSESGSSTREVIMRQGSERFARSA
QEIGRPERAGPSDSEKMYGIERLKKLEAAVFEGSTDPADAEVWLNMLENASSDEGFPERRRE

Spg020386 (gene) of Sponge gourd (cylindrica) v1 genome