CuGenDBv2

Gene ID	Lag0037389
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Transposon TX1 uncharacterized 149 kDa protein
Genome location	chr2:5784319..5785972
RNA-Seq Expression	Lag0037389
Synteny	Lag0037389
Gene Ontology terms	GO:0009987 - cellular process (biological process)
InterPro domains	IPR036691 - Endonuclease/exonuclease/phosphatase superfamily

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

CAN66330.1 hypothetical protein VITISV_000598 [Vitis vinifera]

9.0e-48

38.58

Show/hide

Query:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT
        T  M+ F+ FI  + L D PL N  +TWS+ + SP    +DRFL S+     F  +    L R TSDH+PI L      WGP+PFRF N WL HH+F  +
Subjt:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT

Query:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE
          SWW+     GW GH F++KL+ +K +L+ WN   FG  KE+K ++  E+A ID  E+   LS      RA  K EL  L   EEI W+Q+ K KW  E
Subjt:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE

Query:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP
        GD NS  FH++    R K+ I  + +  G+ +     I  E L ++++LYS         +  DW+P
Subjt:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP

RVW28221.1 hypothetical protein CK203_083720 [Vitis vinifera]

3.1e-48

36.28

Show/hide

Query:  IDAVGASGGITILWSDPTFKVLEVV------------EAPTR------------GMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDS
        + A GASGGI ILW    FK  E V            +   R             M+ F++FI  + L D PL N  +TWS+ +  P    +DRFL S  
Subjt:  IDAVGASGGITILWSDPTFKVLEVV------------EAPTR------------GMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDS

Query:  IPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLG
          + F  +    L R TSDH PICL      WGP+PFRF N WL H  F      WW+     GW GH F++KLK +K++L+ WNI  FG  +E+K ++ 
Subjt:  IPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLG

Query:  RELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQR
         +L  ID  E+   L+      R   + EL  L   EE+ WRQ+ + KW  EGD NS FFHR+    R +  I  ++S  G +L +   I  E ++F+  
Subjt:  RELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQR

Query:  LYSKKANRMPIPDIDDW
        LYSK       P+ D W
Subjt:  LYSKKANRMPIPDIDDW

RVW96808.1 Transposon TX1 uncharacterized 149 kDa protein [Vitis vinifera]

9.0e-48

37.63

Show/hide

Query:  IDAVGASGGITILWSDPTFKVLEVVEAPTRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPIC
        + A GASGGI ILW    F+  E V        KFN      A    PL N  +TWS+ +  P    +DRFL S      F  +    L R TSDH PIC
Subjt:  IDAVGASGGITILWSDPTFKVLEVVEAPTRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPIC

Query:  LTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRA
        L      WGP+PFRF N WL H  F      WW+     GW GH F++KLK +K +L+ WNI  FG  KE+K  +  +L+ ID  E+   L+      R 
Subjt:  LTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRA

Query:  EIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP
          + EL  +   EE+ WRQ+ + KW  EGD NS FFHR+    R +  I  ++S  G +L +  +I  E ++F+  LYSK        +  DW P
Subjt:  EIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP

RVX20162.1 Transposon TX1 uncharacterized 149 kDa protein [Vitis vinifera]

9.0e-48

38.58

Show/hide

Query:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT
        T  M+ F+ FI  + L D PL N  +TWS+ + S     +DRFL S+     F  +    L R TSDH+PI L      WGP+PFRF N WL HHSF  +
Subjt:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT

Query:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE
          SWW+     GW GH F++KL+ +K +L+ WN   FG  KE+K  +  E+AIID  E+   LS     +RA  K EL  +   EEI WRQ+ K KW  +
Subjt:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE

Query:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP
        GD NS  FH++    R ++ I  + +  G+ L +   I  E L ++++LYS         +  DW+P
Subjt:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP

XP_022158956.1 uncharacterized protein LOC111025405 [Momordica charantia]

2.4e-53

44.35

Show/hide

Query:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT
        T+ M  FN FIE ++L D+PL+NG++TWS    + + +LID FL+++   +K     A+R+ R TSDH+PI L  G+ +WG +PFRF N WLSH +F   
Subjt:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT

Query:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSW---NIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKW
        +++WW   P +GWPGHG + KLK LK  ++ W   + +    QKE  TNL   L   D  E   P++    R R + K +L+ + A EE  WRQRCK KW
Subjt:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSW---NIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKW

Query:  FVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSF
          EGD N+ FFHR +A  RR+S I+EILS  GI L    +IE EF+ F
Subjt:  FVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSF

TrEMBL top hits

e value

%identity

Alignment

A0A438CYG1 Uncharacterized protein

1.5e-48

36.28

Show/hide

Query:  IDAVGASGGITILWSDPTFKVLEVV------------EAPTR------------GMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDS
        + A GASGGI ILW    FK  E V            +   R             M+ F++FI  + L D PL N  +TWS+ +  P    +DRFL S  
Subjt:  IDAVGASGGITILWSDPTFKVLEVV------------EAPTR------------GMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDS

Query:  IPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLG
          + F  +    L R TSDH PICL      WGP+PFRF N WL H  F      WW+     GW GH F++KLK +K++L+ WNI  FG  +E+K ++ 
Subjt:  IPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLG

Query:  RELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQR
         +L  ID  E+   L+      R   + EL  L   EE+ WRQ+ + KW  EGD NS FFHR+    R +  I  ++S  G +L +   I  E ++F+  
Subjt:  RELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQR

Query:  LYSKKANRMPIPDIDDW
        LYSK       P+ D W
Subjt:  LYSKKANRMPIPDIDDW

A0A438IJB1 Transposon TX1 uncharacterized 149 kDa protein

4.3e-48

37.63

Show/hide

Query:  IDAVGASGGITILWSDPTFKVLEVVEAPTRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPIC
        + A GASGGI ILW    F+  E V        KFN      A    PL N  +TWS+ +  P    +DRFL S      F  +    L R TSDH PIC
Subjt:  IDAVGASGGITILWSDPTFKVLEVVEAPTRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPIC

Query:  LTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRA
        L      WGP+PFRF N WL H  F      WW+     GW GH F++KLK +K +L+ WNI  FG  KE+K  +  +L+ ID  E+   L+      R 
Subjt:  LTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRA

Query:  EIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP
          + EL  +   EE+ WRQ+ + KW  EGD NS FFHR+    R +  I  ++S  G +L +  +I  E ++F+  LYSK        +  DW P
Subjt:  EIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP

A0A438KG26 Transposon TX1 uncharacterized 149 kDa protein

4.3e-48

38.58

Show/hide

Query:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT
        T  M+ F+ FI  + L D PL N  +TWS+ + S     +DRFL S+     F  +    L R TSDH+PI L      WGP+PFRF N WL HHSF  +
Subjt:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT

Query:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE
          SWW+     GW GH F++KL+ +K +L+ WN   FG  KE+K  +  E+AIID  E+   LS     +RA  K EL  +   EEI WRQ+ K KW  +
Subjt:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE

Query:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP
        GD NS  FH++    R ++ I  + +  G+ L +   I  E L ++++LYS         +  DW+P
Subjt:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP

A0A6J1E2G6 uncharacterized protein LOC111025405

1.2e-53

44.35

Show/hide

Query:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT
        T+ M  FN FIE ++L D+PL+NG++TWS    + + +LID FL+++   +K     A+R+ R TSDH+PI L  G+ +WG +PFRF N WLSH +F   
Subjt:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT

Query:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSW---NIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKW
        +++WW   P +GWPGHG + KLK LK  ++ W   + +    QKE  TNL   L   D  E   P++    R R + K +L+ + A EE  WRQRCK KW
Subjt:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSW---NIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKW

Query:  FVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSF
          EGD N+ FFHR +A  RR+S I+EILS  GI L    +IE EF+ F
Subjt:  FVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSF

A5C3T9 Uncharacterized protein

4.3e-48

38.58

Show/hide

Query:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT
        T  M+ F+ FI  + L D PL N  +TWS+ + SP    +DRFL S+     F  +    L R TSDH+PI L      WGP+PFRF N WL HH+F  +
Subjt:  TRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHT

Query:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE
          SWW+     GW GH F++KL+ +K +L+ WN   FG  KE+K ++  E+A ID  E+   LS      RA  K EL  L   EEI W+Q+ K KW  E
Subjt:  VDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKWFVE

Query:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP
        GD NS  FH++    R K+ I  + +  G+ +     I  E L ++++LYS         +  DW+P
Subjt:  GDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNP

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G43760.1 DNAse I-like superfamily protein

8.7e-17

25.4

Show/hide

Query:  PTRGMKKFNKFIESAALQDIPLSNGKYTWSSFR-PSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTL-GKESWGPSPFRFINAWLSHHSF
        P RG+++F   +  + L DIP     YTWS+ +  +P +  +DR + +    + F SA A       SDH P  + L          FR+ +   +H +F
Subjt:  PTRGMKKFNKFIESAALQDIPLSNGKYTWSSFR-PSPTMTLIDRFLISDSIPNKFVSAKARRLDRVTSDHYPICLTL-GKESWGPSPFRFINAWLSHHSF

Query:  LHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKW
        L ++   W+     G       + LK  K   +  N Q FG  + K       L  I  +    P S+  FR     + +  F +A  E  +RQ+ + KW
Subjt:  LHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRRAEIKAELIFLSANEEIMWRQRCKSKW

Query:  FVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRL
          +GD N+ FFH+++ AN+ K+ I  +     + + +  +++   +++Y  L
Subjt:  FVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRL

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGCAAGATGATCAGATCCCCCTTGTCGAAAATCCCACTCCGTTAAGGATTGAAGACCCGAATAGTAAAAGCTTGCACTTGAGCCACCAAGAGGAAGAGATAGCTTTTGC
TGAAAATTACACGGAAGACATAGAAGAAGATGAATCAGACACAGAGAATGAAGTGTCTGACCCAACAGCTTTTTTGCCCTATCTTTTCCCATGGTTGGCTGAACATGGGA
TGTGTATTATGCCTATCCCAAACAGACAAAAACTGTCATCTGCCGCAAAGAAGAAGAAAAATTGGATCAAGGAATTGGAGAACCTTCAGACTTCTGTTAATTACAACAGA
CCTTCAGCTATTTCCCATATGGGAGGGTCGAGAATTCTCAATGATTATTATATCCTGGAACCAATTGATGCAGTGGGAGCTTCGGGAGGGATCACCATTTTATGGTCGGA
TCCCACATTCAAAGTGCTGGAAGTTGTAGAAGCTCCCACTCGGGGTATGAAAAAATTCAACAAATTCATAGAATCAGCTGCCCTCCAAGATATCCCCCTCTCAAATGGCA
AGTACACATGGTCCAGCTTTCGCCCAAGTCCCACCATGACCCTTATTGATCGATTCTTGATCTCAGATAGCATCCCCAACAAGTTTGTTTCTGCAAAGGCCCGAAGACTT
GATAGAGTCACCTCGGACCACTATCCTATTTGTCTCACTTTGGGTAAAGAATCTTGGGGACCATCTCCTTTTCGCTTTATCAATGCTTGGCTCTCCCATCATTCATTCTT
GCATACAGTAGATTCTTGGTGGAAGGCAAACCCTTATTATGGTTGGCCGGGTCATGGTTTCATTCAGAAATTAAAGGGCTTGAAAACAGAATTAAGAAGCTGGAATATAC
AGATTTTCGGACAACAAAAAGAGAAAAAAACCAATTTGGGTCGGGAACTTGCTATTATTGATAAAAAAGAGGAATGTGCACCTTTATCTGAACAAGACTTCAGAAGAAGA
GCCGAGATTAAAGCAGAATTAATTTTTTTATCAGCTAACGAAGAGATTATGTGGCGCCAAAGATGCAAATCAAAATGGTTTGTCGAGGGAGATGTAAATTCTGCTTTCTT
CCACCGCATTGTTGCTGCTAATAGAAGGAAAAGCTCTATTTCGGAGATCCTATCATCCTCGGGTATTAGCCTTGTTGATGATATAGAAATTGAAAATGAATTTCTCTCCT
TTTATCAAAGGCTTTACTCCAAAAAAGCCAACAGAATGCCTATCCCTGATATTGATGACTGGAACCCATCTCCATGGATCAAATGA

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MQDDQIPLVENPTPLRIEDPNSKSLHLSHQEEEIAFAENYTEDIEEDESDTENEVSDPTAFLPYLFPWLAEHGMCIMPIPNRQKLSSAAKKKKNWIKELENLQTSVNYNR
PSAISHMGGSRILNDYYILEPIDAVGASGGITILWSDPTFKVLEVVEAPTRGMKKFNKFIESAALQDIPLSNGKYTWSSFRPSPTMTLIDRFLISDSIPNKFVSAKARRL
DRVTSDHYPICLTLGKESWGPSPFRFINAWLSHHSFLHTVDSWWKANPYYGWPGHGFIQKLKGLKTELRSWNIQIFGQQKEKKTNLGRELAIIDKKEECAPLSEQDFRRR
AEIKAELIFLSANEEIMWRQRCKSKWFVEGDVNSAFFHRIVAANRRKSSISEILSSSGISLVDDIEIENEFLSFYQRLYSKKANRMPIPDIDDWNPSPWIK

Lag0037389 (gene) of Sponge gourd (AG-4) v1 genome