CuGenDBv2

Gene ID	Lag0039041
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Reverse transcriptase
Genome location	chr2:34388617..34400851
RNA-Seq Expression	Lag0039041
Synteny	Lag0039041
Gene Ontology terms	GO:0015074 - DNA integration (biological process) GO:0003676 - nucleic acid binding (molecular function) GO:0008270 - zinc ion binding (molecular function)
InterPro domains	IPR001584 - Integrase, catalytic core IPR005162 - Retrotransposon gag domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022151688.1 uncharacterized protein LOC111019603 [Momordica charantia]

7.3e-63

49.6

Show/hide

Query:  APMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQ
        A + +   ALQ + DN     A     P        E+QFIRDF+RYGPP+F+G+SE     E WI +LEAL   + C+D LK++GAVFML+ +A  WW 
Subjt:  APMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQ

Query:  SVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEA
         VA  EDH N+PI+W   KDLLYD YFP+T+KD+KE EFLHL Q ++ V QYE+KFT  SRFA DL+ T  RKIKRF++GL + I+G + L RP T+AEA
Subjt:  SVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEA

Query:  LTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRR
        + GAL+MDK+V +K QP  + G +SG KRK+ P+ +   +P++  P++
Subjt:  LTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRR

XP_022155000.1 uncharacterized protein LOC111022144 [Momordica charantia]

2.8e-62

59.35

Show/hide

Query:  ESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKE
        E+ FI+DFKRYGPP+FDG+SE   AAE WI +LEA    + C D  K++GAVFML+ +A  WW S+AAAEDHAN  I W RFKDLLYD Y+ ETVKD KE
Subjt:  ESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKE

Query:  AEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSP-LR
        AEFLHL QG++SV QYERKFT LSRFA +L+     KIKRF+KGL + IRG V L RPA++AEA+ GALIMDK+VS K     E GS+SG KRK  P   
Subjt:  AEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSP-LR

Query:  NPPIEPTQQQPRRQ
        +P +   Q Q + +
Subjt:  NPPIEPTQQQPRRQ

XP_022155925.1 uncharacterized protein LOC111022925 [Momordica charantia]

9.2e-58

49.61

Show/hide

Query:  PPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDD
        PP  P   +L+  EALQ + DN         + P+    + EE QFIRDFKR+GPP F+G SE P AAE W+ +LEAL   + C+D  K+RGAVFML+ +
Subjt:  PPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDD

Query:  ARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRP
        A  WW+SVAAAEDHAN P++W RFKDLLY+ YFP TV+++K AEFL L Q S+ V QYERKFT LSRF    + T + KI +FI GLR EI+G + L  P
Subjt:  ARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRP

Query:  ATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPL-RNPPIEPTQQQPRRQVS
         T+A A+  AL+MDK + ++PQ     GS+SG KRK +    + P    Q   +RQ +
Subjt:  ATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPL-RNPPIEPTQQQPRRQVS

XP_022156326.1 uncharacterized protein LOC111023247 [Momordica charantia]

2.3e-64

58.59

Show/hide

Query:  PPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLY
        PP      P++  E++FI+DFKRYGPP+FDG+SE   A E WI +LEAL   + C D  K++GAVFML+ +A  WW SVAAAED+AN PI W RFK+LLY
Subjt:  PPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLY

Query:  DNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGS
        D Y+PETVKD KEAEFLHL QG++SV QYERKFT LSRFA +L+ T   KIKRF+KGLR+ IRG V L RP T+AEA+ GAL+MDK+VS K  P  E GS
Subjt:  DNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGS

Query:  TSGDKRKL-SPLRNPPIEPTQQQPRRQ
        +SG KRK  S   +  +   Q+Q + Q
Subjt:  TSGDKRKL-SPLRNPPIEPTQQQPRRQ

XP_022156546.1 uncharacterized protein LOC111023424 [Momordica charantia]

2.5e-63

50.36

Show/hide

Query:  PPGQRRVDPPPPP-------PPPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALL
        P G+   DPPPPP        PP PPAA   +       + +N A       + P  +     E+QFI+DFKRYGPP+F G SE    AE W+ +LEAL 
Subjt:  PPGQRRVDPPPPP-------PPPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALL

Query:  DLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK
          + C D  K++GAVFML+ +A  WW SVAA EDHAN P+ W RFK+LLYD+Y+ ETV+D KE EFLHL QG+++V QYERKFT LS FA +L+ T   K
Subjt:  DLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK

Query:  IKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRRQ
        IKRF+KGL + IRGSV L RP T+AEA+ G LIMDK+VS + QP +E GS+ G KRK+ P          Q+P +Q
Subjt:  IKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRRQ

TrEMBL top hits

e value

%identity

Alignment

A0A6J1DCW8 uncharacterized protein LOC111019603

3.5e-63

49.6

Show/hide

Query:  APMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQ
        A + +   ALQ + DN     A     P        E+QFIRDF+RYGPP+F+G+SE     E WI +LEAL   + C+D LK++GAVFML+ +A  WW 
Subjt:  APMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQ

Query:  SVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEA
         VA  EDH N+PI+W   KDLLYD YFP+T+KD+KE EFLHL Q ++ V QYE+KFT  SRFA DL+ T  RKIKRF++GL + I+G + L RP T+AEA
Subjt:  SVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEA

Query:  LTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRR
        + GAL+MDK+V +K QP  + G +SG KRK+ P+ +   +P++  P++
Subjt:  LTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRR

A0A6J1DL73 uncharacterized protein LOC111022144

1.3e-62

59.35

Show/hide

Query:  ESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKE
        E+ FI+DFKRYGPP+FDG+SE   AAE WI +LEA    + C D  K++GAVFML+ +A  WW S+AAAEDHAN  I W RFKDLLYD Y+ ETVKD KE
Subjt:  ESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKE

Query:  AEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSP-LR
        AEFLHL QG++SV QYERKFT LSRFA +L+     KIKRF+KGL + IRG V L RPA++AEA+ GALIMDK+VS K     E GS+SG KRK  P   
Subjt:  AEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSP-LR

Query:  NPPIEPTQQQPRRQ
        +P +   Q Q + +
Subjt:  NPPIEPTQQQPRRQ

A0A6J1DNV8 uncharacterized protein LOC111022925

4.5e-58

49.61

Show/hide

Query:  PPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDD
        PP  P   +L+  EALQ + DN         + P+    + EE QFIRDFKR+GPP F+G SE P AAE W+ +LEAL   + C+D  K+RGAVFML+ +
Subjt:  PPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDD

Query:  ARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRP
        A  WW+SVAAAEDHAN P++W RFKDLLY+ YFP TV+++K AEFL L Q S+ V QYERKFT LSRF    + T + KI +FI GLR EI+G + L  P
Subjt:  ARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRP

Query:  ATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPL-RNPPIEPTQQQPRRQVS
         T+A A+  AL+MDK + ++PQ     GS+SG KRK +    + P    Q   +RQ +
Subjt:  ATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPL-RNPPIEPTQQQPRRQVS

A0A6J1DUM2 uncharacterized protein LOC111023247

1.1e-64

58.59

Show/hide

Query:  PPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLY
        PP      P++  E++FI+DFKRYGPP+FDG+SE   A E WI +LEAL   + C D  K++GAVFML+ +A  WW SVAAAED+AN PI W RFK+LLY
Subjt:  PPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLY

Query:  DNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGS
        D Y+PETVKD KEAEFLHL QG++SV QYERKFT LSRFA +L+ T   KIKRF+KGLR+ IRG V L RP T+AEA+ GAL+MDK+VS K  P  E GS
Subjt:  DNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGS

Query:  TSGDKRKL-SPLRNPPIEPTQQQPRRQ
        +SG KRK  S   +  +   Q+Q + Q
Subjt:  TSGDKRKL-SPLRNPPIEPTQQQPRRQ

A0A6J1DVA0 uncharacterized protein LOC111023424

1.2e-63

50.36

Show/hide

Query:  PPGQRRVDPPPPP-------PPPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALL
        P G+   DPPPPP        PP PPAA   +       + +N A       + P  +     E+QFI+DFKRYGPP+F G SE    AE W+ +LEAL 
Subjt:  PPGQRRVDPPPPP-------PPPAPPAAPMLITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALL

Query:  DLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK
          + C D  K++GAVFML+ +A  WW SVAA EDHAN P+ W RFK+LLYD+Y+ ETV+D KE EFLHL QG+++V QYERKFT LS FA +L+ T   K
Subjt:  DLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPISWERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERK

Query:  IKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRRQ
        IKRF+KGL + IRGSV L RP T+AEA+ G LIMDK+VS + QP +E GS+ G KRK+ P          Q+P +Q
Subjt:  IKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGSTSGDKRKLSPLRNPPIEPTQQQPRRQ

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGGCTTATTTGTAGCTCAAGTCGTCATTCTTGATGATGACATACAAGATTCATTATTTTTTAGAAAGAAAATGAATGATGTTGACAAGGATCAATGGTTTAAAGTCAT
CGACCTGGAAATGAAGTCTTTGCATTTCAATTCCATCTGGGGTCTTGTAAATTTGCTTGATGAGACACCTCAAGAAGTTGAGGACATGAGACATATGCCCTATGCAGTAG
GGTTGTCAGTGAGTTTCAATCAATTCCAAGATTTGATCTCTGGAGTGTCGTTACATACATCCTCCAGTATCTTAGGAGAACGAGGATACACTGACACAGATGTTTTAACT
GATAAGGATTTGATGAAATCTACATCAGTGTCTGTCTTCACTCTTAATGGAAAAGCTATACTGATCAATCTCGTATCGTTGGAGCTTCTGATCTCCGCAACCCCTCCCCT
TCTGCGTTTTCTTCAGCCGCCAGCCGCAGATCCTCCTCTCTGCCGTGTGTTGCGCCGCCGCCAGCCGCTCTCCGCGTCTTCCCTCGCTCTCTCCGAGTCCTTCTCGCGCC
GCCTCCTCGCAAGCAGTCGCCTCGCGCGTCCTTCTCCTCTGCGCGTCTCTCCCGCGAATCTCCCTCTCTCTCGTTTCTGGTTCGTGTGGAGCCGCGGCCCAGCTTCGCTC
CGAGCTTGTCAGCCGTCACGTGAGTCCTCTTTCGCCGTTTTTGCAGAACTCTGGGTAAGTCTCATCCTCTGTGTATTCGTTAAGGCCGATCTAACTCCTCTTGGTTTGCG
GCAGCAGTCGGAGTCTCCTTTCCTCGCGTTTTCGTTGCTGTCCAGCAGCGTCATTGGGCGTTTCCGGCGTCGGTTAGCGTGTCGGGCCTCGGGTATAAAAGGTCGGGGAC
TGATATATCACTATTGGTGTCGATGCCTCGGGTATAAATGGTCGAGGGTCGATATGCCAATGTTAGATAAAGAGGAGCATCGAGGCCTTGGGTATAAATGGTCAAGGGTC
GGTGTGATGAGTCCTGAGGCAAGTATTGAGGCCTTGGGTATAAATGGTCAAGGGTCAGGTCGAATGCCGAGCTCTGTAGAGAAGTGTCGAGGCCCTGGGTATAAATGGTC
AGGGGTCGGTACAACTCGAAGGGTAGGGGCTGCTTACCAGTACCTTAGTGTACTGACCCCCTCCCCTCTCTCTCCCCCCAACTACCAGATTTTGCAGGTTATGAGGACTG
CGTGGACCGTGGCTGTTGGTTCTGTGGATATTCTGTTGCGTTGTAGAATGGCGGAGTCGTTTAATTTGTTAAATAGAAGTGTTTTATGCATAACAGTTGGTATCAGAGCG
AAACCTCTCCCAGTAGGATGTGGTTCGGGGACGAACCAAGGCGGAAGCTGGTGGGCATGTGACGCCCGAGGGAGGTGTAGGGATGCCGTGAGCTGCCTCGTTCGATCCTC
TGGCGTTACATGTATCAGCCAGGCAATGTCTCGCGGTCATGACCCTGAAGTTCCAATTGTCAATCAAGATGATCAAGTAGAGGAAGTTACTACTCAGCAAGGGGTCGATC
CTCTGGCTCCCCCTATGCAGGAGGCTAATCCCCTGATTCCTCCCGGTCAGCGCAGGGTTGATCCTCCTCCTCCCCCGCCTCCTCCGGCCCCTCCTGCGGCTCCTATGCTG
ATCACTCCGGAAGCCCTCCAGACCATGTTCGATAACATGGCCCAGAAGAATGCTAGGCCACCGCGAAACCCTAATTGGGTACCTGAGAACGCGGAGGAATCCCAGTTCAT
TAGGGACTTCAAGCGCTACGGGCCTCCCTCTTTTGATGGGCAATCCGAAAATCCTTTAGCAGCAGAGCGATGGATCACTGATTTGGAGGCACTGTTGGACCTCATGAACT
GTAATGATTCCTTGAAAATCAGAGGGGCAGTTTTCATGCTCAAGGATGACGCTCGCACGTGGTGGCAATCGGTGGCAGCAGCCGAAGACCATGCTAATCAACCGATCTCG
TGGGAAAGGTTCAAGGATCTATTGTATGATAATTACTTCCCGGAGACAGTCAAGGACGACAAAGAAGCGGAATTTCTTCATTTGGCCCAGGGGAGTATGTCTGTAGTGCA
GTATGAGAGGAAGTTCACTGCACTATCACGCTTTGCTCCTGACCTGGTCAGCACGCCAGAGCGGAAGATTAAGAGGTTCATTAAAGGTCTTCGTGAGGAAATTCGAGGCT
CTGTAGCCCTAAGCAGGCCCGCGACCTTTGCTGAAGCACTCACAGGTGCATTGATCATGGATAAGAATGTTTCTAAGAAGCCACAACCTCATCTCGAGAAGGGATCAACC
TCTGGAGATAAAAGAAAGTTGTCTCCCCTGAGGAACCCACCTATTGAGCCTACTCAGCAACAGCCCAGACGCCAAGTGTCCAAGGAGGTTAGCCAAGCAAGCATCAATGG
AGTCCTTACAGGTGGGAAGTCGGTTTCACCTCTCATTTCCAGATCGTGCAAGATCCGAGTTCGGTTTGGTCTTTGTCAGACCCTTAGTGTTCTTAATGCACTTGGTCAAG
TTGCCTGTAAGCGAGCTTTGCTTCAAGTGTTGCACCAGCCGCAGGTCTCCTCCTCTCTGTCGTGTGTTGCGCCGCCGCCAGCCCCTTCTCCGGCGTCTTTCCCCCCCCCC
GCGAGCTCTCTCCGTGAGTTCTCTTTCGCTCGCGCCGCCTCCGTCGTCAAGGCCGAGCCATGGGTCACGCGTCCTTCTCCCTCTGCGCGTCTCTCTCCGCGAATCTCCCT
CTCTCTCGATTTCTGGTTCGTGTGGAAGCCGCCGCCGCCAAGCCTGTCGCTGCCGGAGCTTGTGCAACGCCGTCATCGAGCCCGATCTAACTCCTTCTTGCCCGTATTGC
GCGGACAGCAGCTCGGAGTCTCCTTTCCTCGCGTTTTCGTTGCTGTCCAGCAGCGTCATTGGGCGTTTCCGGCGTCAGTTAGCGTGTCCGCGCCGTCTAGGTGTTCGATT
AAGTTCGAAACACTTCAACTTGGGTACCCACTGCTCAAAGAGCGTTCTAGCTCATTGGTTGTGGTTGGTGTAACCCGTCTAGCGCAGAAGCAGGTCCGTTGGCGAGCGTT
TGATCTCAAATATCATGTTCAGCGAATACCCACAACTCGAAAGACCTTGATTTTGGTTACCCATAACCCGGTGACTTGGGTTCTTGGTTGTTGGGTCGTTTCGAACACAA
GTCAGCTTGTTCTCAAGCATGAGTTGAGAGCCTGTGATTACATGTATATGCTTGGTGGGCATAATACGGTCAATACGTTGCTTAGTCATCGAGGCCTTGGGTATAAATGG
TCAAGGGTCGGTGTGATGAGTCCTGAGGCAAGTATTGGGCTTGGGTATAAATGGTCAAGGGTCAATACGTTGCTTAGTCGTCGAGGCCTTGAGTATAAATGGTCAAGGGT
CGATGCACAGTTCGAGGCCTTGGGTATAAATGGTCAAGGGTCGAATGTCGAGCTCTGTAGAGAAGTGTCGAGGCCCTGGGTAGGGGCTGCTTACCAGTACCTTAGTGTAC
TGACCCCCTCCCCTCTCTCTCCCCCCAACTACCAGATTTTGCAGGTTATGAGGACTGCGTGGACCGTGGTGATGCGGAGGAGGCGTATGAGGAAGGACCTTAGTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MGLFVAQVVILDDDIQDSLFFRKKMNDVDKDQWFKVIDLEMKSLHFNSIWGLVNLLDETPQEVEDMRHMPYAVGLSVSFNQFQDLISGVSLHTSSSILGERGYTDTDVLT
DKDLMKSTSVSVFTLNGKAILINLVSLELLISATPPLLRFLQPPAADPPLCRVLRRRQPLSASSLALSESFSRRLLASSRLARPSPLRVSPANLPLSRFWFVWSRGPASL
RACQPSRESSFAVFAELWVSLILCVFVKADLTPLGLRQQSESPFLAFSLLSSSVIGRFRRRLACRASGIKGRGLIYHYWCRCLGYKWSRVDMPMLDKEEHRGLGYKWSRV
GVMSPEASIEALGINGQGSGRMPSSVEKCRGPGYKWSGVGTTRRVGAAYQYLSVLTPSPLSPPNYQILQVMRTAWTVAVGSVDILLRCRMAESFNLLNRSVLCITVGIRA
KPLPVGCGSGTNQGGSWWACDARGRCRDAVSCLVRSSGVTCISQAMSRGHDPEVPIVNQDDQVEEVTTQQGVDPLAPPMQEANPLIPPGQRRVDPPPPPPPPAPPAAPML
ITPEALQTMFDNMAQKNARPPRNPNWVPENAEESQFIRDFKRYGPPSFDGQSENPLAAERWITDLEALLDLMNCNDSLKIRGAVFMLKDDARTWWQSVAAAEDHANQPIS
WERFKDLLYDNYFPETVKDDKEAEFLHLAQGSMSVVQYERKFTALSRFAPDLVSTPERKIKRFIKGLREEIRGSVALSRPATFAEALTGALIMDKNVSKKPQPHLEKGST
SGDKRKLSPLRNPPIEPTQQQPRRQVSKEVSQASINGVLTGGKSVSPLISRSCKIRVRFGLCQTLSVLNALGQVACKRALLQVLHQPQVSSSLSCVAPPPAPSPASFPPP
ASSLREFSFARAASVVKAEPWVTRPSPSARLSPRISLSLDFWFVWKPPPPSLSLPELVQRRHRARSNSFLPVLRGQQLGVSFPRVFVAVQQRHWAFPASVSVSAPSRCSI
KFETLQLGYPLLKERSSSLVVVGVTRLAQKQVRWRAFDLKYHVQRIPTTRKTLILVTHNPVTWVLGCWVVSNTSQLVLKHELRACDYMYMLGGHNTVNTLLSHRGLGYKW
SRVGVMSPEASIGLGYKWSRVNTLLSRRGLEYKWSRVDAQFEALGINGQGSNVELCREVSRPWVGAAYQYLSVLTPSPLSPPNYQILQVMRTAWTVVMRRRRMRKDLS

Lag0039041 (gene) of Sponge gourd (AG-4) v1 genome