CuGenDBv2

Gene ID	Spg030583
Organism	Luffa cylindrica (Sponge gourd (cylindrica) v1)
Description	Gag protease polyprotein
Genome location	scaffold6:34445759..34449948
RNA-Seq Expression	Spg030583
Synteny	Spg030583
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001584 - Integrase, catalytic core IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022151688.1 uncharacterized protein LOC111019603 [Momordica charantia]

5.7e-62

55.94

Show/hide

Query:  MLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETV
        + + SEA    DF+RYGPP+F+G+SE     E WI +LEAL+  + C+D LK++GAVFML+ +   WW  VA  EDH + PI+W   KDLLYDYYFP+T+
Subjt:  MLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETV

Query:  KDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKV
        KD+KE EFLHL Q ++ V QYE+KFT  SRFA DL+ T  RKIKRF++GL + I+G I L RP T+AEA+ GAL+MDK+V +KAQP  + GL+ G+KRKV
Subjt:  KDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKV

Query:  SP
         P
Subjt:  SP

XP_022155000.1 uncharacterized protein LOC111022144 [Momordica charantia]

3.3e-62

Show/hide

Query:  AVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFP
        AV  +  SEA    DFKRYGPP+FDG+SE   AAE WI +LEA +  + C D  K++GAVFML+ +   WW S+AAAEDHA+  I W RFKDLLYDYY+ 
Subjt:  AVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFP

Query:  ETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIK
        ETVKD KEAEFLHL QG++SV QYERKFT LSRFA +L+     KIKRF+KGL + IRG + L RPA++AEA+ GALIMDK+VS KA    E G + G+K
Subjt:  ETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIK

Query:  RKVSP
        RK  P
Subjt:  RKVSP

XP_022155925.1 uncharacterized protein LOC111022925 [Momordica charantia]

4.1e-52

53.03

Show/hide

Query:  ITSEALQTM-DFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVK
        I+ E +Q + DFKR+GPP F+G SE P AAE W+ +LEAL+  + C+D  K+RGAVFML+ +   WW+SVAAAEDHA+ P++W RFKDLLY+YYFP TV+
Subjt:  ITSEALQTM-DFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVK

Query:  DDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRK
        ++K AEFL L Q S+ V QYERKFT LSRF    + T + KI +FI GL  EI+G + L  P T+A A+  AL+MDK + ++ Q     G + G+KRK
Subjt:  DDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRK

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

1.5e-62

58.37

Show/hide

Query:  PPGQHKVDPPPPPPPPAPSAVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHA
        P G   V  PPP     P        SEA    DFKRYGPP+FDG+SE   A E WI +LEAL+  + C D  K++GAVFML+ +   WW SVAAAED+A
Subjt:  PPGQHKVDPPPPPPPPAPSAVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHA

Query:  SRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDK
        + PI W RFK+LLYDYY+PETVKD KEAEFLHL QG++SV QYERKFT LSRFA +L+ T   KIKRF+KGL + IRG + L RP T+AEA+ GAL+MDK
Subjt:  SRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDK

Query:  NVSKKAQPHLEKGLAFGIKRK
        +VS KA P  E G + G+KRK
Subjt:  NVSKKAQPHLEKGLAFGIKRK

XP_022156546.1 uncharacterized protein LOC111023424 [Momordica charantia]

9.6e-62

50.38

Show/hide

Query:  EVNPLIPPGQHKVDPPPPP--------PPPAPSAVPMLI----------------------TSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALF
        +V+P  P G++  DPPPPP        PP  P+A   L                        SEA    DFKRYGPP+F G SE    AE W+ +LEAL+
Subjt:  EVNPLIPPGQHKVDPPPPP--------PPPAPSAVPMLI----------------------TSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALF

Query:  DLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK
          + C D  K++GAVFML+ +   WW SVAA EDHA+ P+ W RFK+LLYD+Y+ ETV+D KE EFLHL QG+++V QYERKFT LS FA +L+ T   K
Subjt:  DLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK

Query:  IKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKVSP
        IKRF+KGLH+ IRGS+ L RP T+AEA+ G LIMDK+VS + QP +E G + G+KRKV P
Subjt:  IKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKVSP

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DCW8 uncharacterized protein LOC111019603

2.7e-62

55.94

Show/hide

Query:  MLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETV
        + + SEA    DF+RYGPP+F+G+SE     E WI +LEAL+  + C+D LK++GAVFML+ +   WW  VA  EDH + PI+W   KDLLYDYYFP+T+
Subjt:  MLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETV

Query:  KDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKV
        KD+KE EFLHL Q ++ V QYE+KFT  SRFA DL+ T  RKIKRF++GL + I+G I L RP T+AEA+ GAL+MDK+V +KAQP  + GL+ G+KRKV
Subjt:  KDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKV

Query:  SP
         P
Subjt:  SP

A0A6J1DL73 uncharacterized protein LOC111022144

1.6e-62

Show/hide

Query:  AVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFP
        AV  +  SEA    DFKRYGPP+FDG+SE   AAE WI +LEA +  + C D  K++GAVFML+ +   WW S+AAAEDHA+  I W RFKDLLYDYY+ 
Subjt:  AVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFP

Query:  ETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIK
        ETVKD KEAEFLHL QG++SV QYERKFT LSRFA +L+     KIKRF+KGL + IRG + L RPA++AEA+ GALIMDK+VS KA    E G + G+K
Subjt:  ETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIK

Query:  RKVSP
        RK  P
Subjt:  RKVSP

A0A6J1DNV8 uncharacterized protein LOC111022925

2.0e-52

53.03

Show/hide

Query:  ITSEALQTM-DFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVK
        I+ E +Q + DFKR+GPP F+G SE P AAE W+ +LEAL+  + C+D  K+RGAVFML+ +   WW+SVAAAEDHA+ P++W RFKDLLY+YYFP TV+
Subjt:  ITSEALQTM-DFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVK

Query:  DDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRK
        ++K AEFL L Q S+ V QYERKFT LSRF    + T + KI +FI GL  EI+G + L  P T+A A+  AL+MDK + ++ Q     G + G+KRK
Subjt:  DDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRK

A0A6J1DUM2 uncharacterized protein LOC111023247

7.2e-63

58.37

Show/hide

Query:  PPGQHKVDPPPPPPPPAPSAVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHA
        P G   V  PPP     P        SEA    DFKRYGPP+FDG+SE   A E WI +LEAL+  + C D  K++GAVFML+ +   WW SVAAAED+A
Subjt:  PPGQHKVDPPPPPPPPAPSAVPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHA

Query:  SRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDK
        + PI W RFK+LLYDYY+PETVKD KEAEFLHL QG++SV QYERKFT LSRFA +L+ T   KIKRF+KGL + IRG + L RP T+AEA+ GAL+MDK
Subjt:  SRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDK

Query:  NVSKKAQPHLEKGLAFGIKRK
        +VS KA P  E G + G+KRK
Subjt:  NVSKKAQPHLEKGLAFGIKRK

A0A6J1DVA0 uncharacterized protein LOC111023424

4.7e-62

50.38

Show/hide

Query:  EVNPLIPPGQHKVDPPPPP--------PPPAPSAVPMLI----------------------TSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALF
        +V+P  P G++  DPPPPP        PP  P+A   L                        SEA    DFKRYGPP+F G SE    AE W+ +LEAL+
Subjt:  EVNPLIPPGQHKVDPPPPP--------PPPAPSAVPMLI----------------------TSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALF

Query:  DLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK
          + C D  K++GAVFML+ +   WW SVAA EDHA+ P+ W RFK+LLYD+Y+ ETV+D KE EFLHL QG+++V QYERKFT LS FA +L+ T   K
Subjt:  DLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK

Query:  IKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKVSP
        IKRF+KGLH+ IRGS+ L RP T+AEA+ G LIMDK+VS + QP +E G + G+KRKV P
Subjt:  IKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKVSP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGAGGCACCCAAGGGTGCCCTTTTATAGGCCTGGAATAGGGGTAGCGTCGCGACGCTACCTTGCTCAGCGTTGCGACGCTGCTGCGCACGCGGCTTGGGCAACACGAAA
GGGTAGCGTCGCGACGCTGCCTTACTTAGCGTCTCGACGCTGTCCCAAAATTCCAGATTTTTCAGCTTCCTTTTGGGCTGATTTTTGGGTCTTCTTCTTCATTTCTTTTG
GTCATTTCTTCATGGTTGACTTCTTTGGGCCTCCAATTGCTTCAAGCTTTGATTTGGGTTTCTCTTCCATCGTCTCTCTCTCCCTCTTCCGTGTCTTGTCGCCGACAGCA
GCAGTTCAGAGGCGCCGTCTTCGCGTGCGTCGGCTAGCACTCACAGTTCCTTTTTTTCTCCTTCAAGCTCGCAACGTGAGATTCCTTCGCTGTTCGGAGCCGTTTTGGGT
TCGAAATCATCCCTGTTTGGTGACCCATCGTCCGTGGAGCCTTAAACTTGAACACCCAGTGCTTAGGGCCTCTAAGCAAGTGGTTTTAGACCTCTTCGCTTGCTGGACAG
CACGTGTTCGAGGTCGTTCGGACAGTGAACGCGTGTTGGTTCGGTTTTGCATTCAAGAGTCAAACATGAGTTTAGAGATGTGGTCATGTGAATGCTTAGTGGGCGTGAAT
CATGAGTCTAGAAGCATGTTGCAGGGCATATGCATTCTAGGAGATGTGAGATATAGGGTCGGTGTGATGAGGCTTGAGGCAAGTACTGAGGCCTTGGGTATAAATGGTCA
AGGGTCAATATGTTGTTTAGTCATCGAGGCCTTGGGTATAAATGGTCAAGGGTCGAATGCCGAGCTCTGTAGAGAAGTGTCGAGGCCCTGGGTAGGGGCTGCTTACCAGT
ACCTTAGTGTTAAAGTAAAATTTTGGGTTAGTCCAATGTACGTCGTTATGCTGCCGAAATTTTTGGTGCGCACGGTTTGTTTTGGTCTAGAAGTTAGTAATGTCACTGGG
TTAGCTTTTAAAATCCTGGGGCGTTACAGTTGGTATCAGAGTAGAGTTGTTCCTGTAGACTGGCCTAGGAAATCTAGGTTGTTTAGGAGTTTAGGGTTATGGTCTTCCTT
GTTCTCCTCTCCATCACCAGTACCACCTTCTCAGGCAATGTCCCGTGGTCATGATCCTGAGGTTCCAATTGTAAGGCAAGATGACCAAGCAGAGGAAGTTACTACACAGC
AGAGGGTCGATCCTTTGGCTCCCCCTCTGCAGGAGGTTAATCCCCTGATTCCTCCCGGTCAGCACAAAGTTGATCCTCCTCCTCCTCCGCCTCCTCCGGCCCCTTCTGCA
GTTCCTATGCTGATCACTTCGGAAGCCCTCCAGACCATGGACTTCAAGCGCTACGGGCCTCCCTCCTTTGATGGGCAATCCGAAAATCCGTTGGCAGCAGAGCGATGGAT
CGCTGATTTAGAGGCACTGTTTGACCTCATGAATTGTAATGATTCCTTGAAGATCAGAGGAGCAGTCTTCATGCTCAAGGATGACGTTCGCACGTGGTGGCAATCGGTGG
CAGCAGCCGAAGACCATGCTAGTCGACCGATCTCGTGGGAAAGGTTCAAGGATCTGTTGTACGATTATTACTTCCCGGAGACAGTCAAGGATGACAAAGAAGCAGAATTC
CTTCATTTGGCCCAGGGAAGTATGTCTGTAGTGCAGTATGAGAGGAAGTTCACTGCACTATCACGCTTTGCTCCTGACCTAGTCAGCACGCCAGAGCGGAAGATCAAGAG
GTTCATTAAAGGTCTCCATGAGGAAATTCGTGGCTCTATAGCCCTGAGCAGGCCTGCGACCTTTGCTGAAGCACTCACGGGGGCATTGATCATGGATAAGAATGTTTCCA
AAAAGGCACAACCTCATCTTGAAAAGGGATTAGCTTTTGGAATTAAAAGGAAAGTCTCCCCCAAGGAACCCACCTATTGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MRHPRVPFYRPGIGVASRRYLAQRCDAAAHAAWATRKGSVATLPYLASRRCPKIPDFSASFWADFWVFFFISFGHFFMVDFFGPPIASSFDLGFSSIVSLSLFRVLSPTA
AVQRRRLRVRRLALTVPFFLLQARNVRFLRCSEPFWVRNHPCLVTHRPWSLKLEHPVLRASKQVVLDLFACWTARVRGRSDSERVLVRFCIQESNMSLEMWSCECLVGVN
HESRSMLQGICILGDVRYRVGVMRLEASTEALGINGQGSICCLVIEALGINGQGSNAELCREVSRPWVGAAYQYLSVKVKFWVSPMYVVMLPKFLVRTVCFGLEVSNVTG
LAFKILGRYSWYQSRVVPVDWPRKSRLFRSLGLWSSLFSSPSPVPPSQAMSRGHDPEVPIVRQDDQAEEVTTQQRVDPLAPPLQEVNPLIPPGQHKVDPPPPPPPPAPSA
VPMLITSEALQTMDFKRYGPPSFDGQSENPLAAERWIADLEALFDLMNCNDSLKIRGAVFMLKDDVRTWWQSVAAAEDHASRPISWERFKDLLYDYYFPETVKDDKEAEF
LHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLHEEIRGSIALSRPATFAEALTGALIMDKNVSKKAQPHLEKGLAFGIKRKVSPKEPTY

Spg030583 (gene) of Sponge gourd (cylindrica) v1 genome