CuGenDBv2

Gene ID	Lag0002091
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Retrovirus-related Pol polyprotein from transposon TNT 1-94
Genome location	chr4:39182995..39190974
RNA-Seq Expression	Lag0002091
Synteny	Lag0002091
Gene Ontology terms	NA
InterPro domains	NA

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_038897352.1 uncharacterized protein LOC120085457 isoform X1 [Benincasa hispida]

1.9e-55

39.79

Show/hide

Query:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER
        KRK+ +   KK VD   +K            SI   L+C L GITE  KL +E  LL + KRF++S D ++KITF   D+   + +T DY  LL GG+  
Subjt:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER

Query:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE
        S+IDL+  +L LR+ L+E+++EY +ILQGK S KNK+DVLQ IV +RREL+ AEKVYL+  R    RY     T  +   SK+S  ++ LL +MI +K+E
Subjt:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE

Query:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD
        MMKLEGEYV LL+A  T   D LS+YS+D+LQR                                                   SL ER D MY NL  D
Subjt:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD

Query:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI
          IDYK NRL+ +VNLRKEYL +EDEYLW+L++R TKNH NTSTSF V+Q +S+YV  WE +      W +DL LLE+  ARKL            G + 
Subjt:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI

Query:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI
        + K + E   L       EE E+L+ EL          +        LI  ++  LT+ ND     +  I+ +YI
Subjt:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI

XP_038897355.1 uncharacterized protein LOC120085457 isoform X2 [Benincasa hispida]

1.9e-55

39.79

Show/hide

Query:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER
        KRK+ +   KK VD   +K            SI   L+C L GITE  KL +E  LL + KRF++S D ++KITF   D+   + +T DY  LL GG+  
Subjt:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER

Query:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE
        S+IDL+  +L LR+ L+E+++EY +ILQGK S KNK+DVLQ IV +RREL+ AEKVYL+  R    RY     T  +   SK+S  ++ LL +MI +K+E
Subjt:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE

Query:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD
        MMKLEGEYV LL+A  T   D LS+YS+D+LQR                                                   SL ER D MY NL  D
Subjt:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD

Query:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI
          IDYK NRL+ +VNLRKEYL +EDEYLW+L++R TKNH NTSTSF V+Q +S+YV  WE +      W +DL LLE+  ARKL            G + 
Subjt:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI

Query:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI
        + K + E   L       EE E+L+ EL          +        LI  ++  LT+ ND     +  I+ +YI
Subjt:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI

XP_038897356.1 uncharacterized protein LOC120085457 isoform X3 [Benincasa hispida]

1.9e-55

39.79

Show/hide

Query:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER
        KRK+ +   KK VD   +K            SI   L+C L GITE  KL +E  LL + KRF++S D ++KITF   D+   + +T DY  LL GG+  
Subjt:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER

Query:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE
        S+IDL+  +L LR+ L+E+++EY +ILQGK S KNK+DVLQ IV +RREL+ AEKVYL+  R    RY     T  +   SK+S  ++ LL +MI +K+E
Subjt:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE

Query:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD
        MMKLEGEYV LL+A  T   D LS+YS+D+LQR                                                   SL ER D MY NL  D
Subjt:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD

Query:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI
          IDYK NRL+ +VNLRKEYL +EDEYLW+L++R TKNH NTSTSF V+Q +S+YV  WE +      W +DL LLE+  ARKL            G + 
Subjt:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI

Query:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI
        + K + E   L       EE E+L+ EL          +        LI  ++  LT+ ND     +  I+ +YI
Subjt:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI

XP_038897357.1 uncharacterized protein LOC120085457 isoform X4 [Benincasa hispida]

1.9e-55

39.79

Show/hide

Query:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER
        KRK+ +   KK VD   +K            SI   L+C L GITE  KL +E  LL + KRF++S D ++KITF   D+   + +T DY  LL GG+  
Subjt:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER

Query:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE
        S+IDL+  +L LR+ L+E+++EY +ILQGK S KNK+DVLQ IV +RREL+ AEKVYL+  R    RY     T  +   SK+S  ++ LL +MI +K+E
Subjt:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE

Query:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD
        MMKLEGEYV LL+A  T   D LS+YS+D+LQR                                                   SL ER D MY NL  D
Subjt:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD

Query:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI
          IDYK NRL+ +VNLRKEYL +EDEYLW+L++R TKNH NTSTSF V+Q +S+YV  WE +      W +DL LLE+  ARKL            G + 
Subjt:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI

Query:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI
        + K + E   L       EE E+L+ EL          +        LI  ++  LT+ ND     +  I+ +YI
Subjt:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI

XP_038897359.1 uncharacterized protein LOC120085457 isoform X5 [Benincasa hispida]

1.9e-55

39.79

Show/hide

Query:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER
        KRK+ +   KK VD   +K            SI   L+C L GITE  KL +E  LL + KRF++S D ++KITF   D+   + +T DY  LL GG+  
Subjt:  KRKNKEVDTKKSVDIASSK------------SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHD-SDKITFTEYDKFILENSTRDYLCLLQGGEER

Query:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE
        S+IDL+  +L LR+ L+E+++EY +ILQGK S KNK+DVLQ IV +RREL+ AEKVYL+  R    RY     T  +   SK+S  ++ LL +MI +K+E
Subjt:  SYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHS--HEDLLKRMISQKKE

Query:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD
        MMKLEGEYV LL+A  T   D LS+YS+D+LQR                                                   SL ER D MY NL  D
Subjt:  MMKLEGEYVELLKAVVTV-GDALSQYSKDVLQRTA-------------------------------------------------SLRERQDQMYLNLAYD

Query:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI
          IDYK NRL+ +VNLRKEYL +EDEYLW+L++R TKNH NTSTSF V+Q +S+YV  WE +      W +DL LLE+  ARKL            G + 
Subjt:  LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSH---WTDDLALLENIHARKLKEVDACNAASMFGREI

Query:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI
        + K + E   L       EE E+L+ EL          +        LI  ++  LT+ ND     +  I+ +YI
Subjt:  TEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYI

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CR17 uncharacterized protein LOC111013441

6.9e-35

33.44

Show/hide

Query:  LKGIWDEYISYRPGCSCGRCNCGGHTTIQEFLQFEYLMIFLMGLNESFGHIRSQILLMDPPPTISKAFHWLY--KKNINVLFPAPLPTTTALA-------
        LK +WDE   +RP C+C  C CGG  ++ EFLQ EY++  LMGL+E +G  R+++LLMDPPP+++KA   +   ++  ++   A +PT  + A       
Subjt:  LKGIWDEYISYRPGCSCGRCNCGGHTTIQEFLQFEYLMIFLMGLNESFGHIRSQILLMDPPPTISKAFHWLY--KKNINVLFPAPLPTTTALA-------

Query:  -------------------------GQRPYQPKTETASLVTSSTQLASASSTDTAEALTKCHNLLTMLQSKLTAAK--TDTDVATYYLAGTCSSLTSWII
                                 GQR + P ++      SS   A A+S   + A++    L  +LQS+L+  K   DTD  T Y   T     S I+
Subjt:  -------------------------GQRPYQPKTETASLVTSSTQLASASSTDTAEALTKCHNLLTMLQSKLTAAK--TDTDVATYYLAGTCSSLTSWII

Query:  DSGASTHICFDKTLFTIIFPVSTSFL-LPDNTRFSVQFAGTVTILGSVCLQRVLFVPQFQYNLISISALTSD-AFITVQFSTNCCDIQERSTLRTISRGS
        D GAS HIC  + LF  I  +S   + LP+  RF V+++G V +   + +  VL++P+F +NLIS++ L  D   ++V+F+ + C IQ++S  +TI +G 
Subjt:  DSGASTHICFDKTLFTIIFPVSTSFL-LPDNTRFSVQFAGTVTILGSVCLQRVLFVPQFQYNLISISALTSD-AFITVQFSTNCCDIQERSTLRTISRGS

Query:  LQNGFFMLDDQAISDTNPVVCASTTQ
        L +G ++LD       N   C+ST Q
Subjt:  LQNGFFMLDDQAISDTNPVVCASTTQ

A0A6J1CWM1 uncharacterized protein LOC111015471 isoform X1

2.6e-34

37.81

Show/hide

Query:  LENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSK
        L+N T DY CLL+GGE  SY DL+  IL  RNQL + EDEY  ILQGK S  N+ DVLQ+IV SRREL++AEKVYL I+R R + Y    K+        
Subjt:  LENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSK

Query:  HSHEDLLKRMISQKKEMMKLEGEYVELLKAVVTVG-DALSQYSKDVLQRTASLRE---------------------------------------------
         + E+LLK+M+S K+E+ KLEGEYV LL+A  T    ALS YSK VLQ   S R                                              
Subjt:  HSHEDLLKRMISQKKEMMKLEGEYVELLKAVVTVG-DALSQYSKDVLQRTASLRE---------------------------------------------

Query:  -RQDQMYLNLAYD-LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTS-TSFDVYQRYSDYVREW-EKIMSHWTDDLALLENIHARKLKEV
         ++++MY +   D  NI YKI  L+ +V LR+++L LED+YL LL+DR  KN   TS   F++   YS+Y+ E+  +I+ +W + L LLE+ +  KL+  
Subjt:  -RQDQMYLNLAYD-LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTS-TSFDVYQRYSDYVREW-EKIMSHWTDDLALLENIHARKLKEV

Query:  DACNAASMFGREITEKAAEEVRSLLGKGITEEEAEELRSE---LVIAWILNSVSRNISSSIISLI
         +C                   S L  G+   E +++  E   L+  W L S   NISS  ++ I
Subjt:  DACNAASMFGREITEKAAEEVRSLLGKGITEEEAEELRSE---LVIAWILNSVSRNISSSIISLI

A0A6J1CYL4 uncharacterized protein LOC111015471 isoform X2

2.6e-34

37.81

Show/hide

Query:  LENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSK
        L+N T DY CLL+GGE  SY DL+  IL  RNQL + EDEY  ILQGK S  N+ DVLQ+IV SRREL++AEKVYL I+R R + Y    K+        
Subjt:  LENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSK

Query:  HSHEDLLKRMISQKKEMMKLEGEYVELLKAVVTVG-DALSQYSKDVLQRTASLRE---------------------------------------------
         + E+LLK+M+S K+E+ KLEGEYV LL+A  T    ALS YSK VLQ   S R                                              
Subjt:  HSHEDLLKRMISQKKEMMKLEGEYVELLKAVVTVG-DALSQYSKDVLQRTASLRE---------------------------------------------

Query:  -RQDQMYLNLAYD-LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTS-TSFDVYQRYSDYVREW-EKIMSHWTDDLALLENIHARKLKEV
         ++++MY +   D  NI YKI  L+ +V LR+++L LED+YL LL+DR  KN   TS   F++   YS+Y+ E+  +I+ +W + L LLE+ +  KL+  
Subjt:  -RQDQMYLNLAYD-LNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTS-TSFDVYQRYSDYVREW-EKIMSHWTDDLALLENIHARKLKEV

Query:  DACNAASMFGREITEKAAEEVRSLLGKGITEEEAEELRSE---LVIAWILNSVSRNISSSIISLI
         +C                   S L  G+   E +++  E   L+  W L S   NISS  ++ I
Subjt:  DACNAASMFGREITEKAAEEVRSLLGKGITEEEAEELRSE---LVIAWILNSVSRNISSSIISLI

A0A6J1GQA4 uncharacterized protein LOC111456533 isoform X1

5.3e-43

42.15

Show/hide

Query:  SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFK-ASHDSDKITFTEYDKFILENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKC
        SI T LSC L G  E KKL +E  LL      K +S+   +ITF    +  L + + DY  LLQGG ERS ID+ME +L LR QL+E EDEY  IL+GK 
Subjt:  SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFK-ASHDSDKITFTEYDKFILENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKC

Query:  SKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHSHEDLLKRMISQKKEMMKLEGEYVELLK-AVVTVGDALSQYSKDVLQR
        S KNK+DVL+++V +RREL+ AEKVYL ISR R+ R  +  +   +   SK S E+ L  MI +KKEMMKLE  +V LL+ +   + + L  YSKDVL  
Subjt:  SKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHSHEDLLKRMISQKKEMMKLEGEYVELLK-AVVTVGDALSQYSKDVLQR

Query:  TAS---------------LRER-----------------------QDQMYLNLAYDLNID--YKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNT
          S               LRE+                       Q Q+Y NL  +++ D  Y+I  L+ +VNLR++YL +EDEYLW+LE+R TK H NT
Subjt:  TAS---------------LRER-----------------------QDQMYLNLAYDLNID--YKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNT

Query:  STSFDVYQRYSDYVREWEKIMS---HWTDDLALLENIHARKLKE
         TSFDV+Q + +Y+  WEK++    +W +D  L  + + R+L++
Subjt:  STSFDVYQRYSDYVREWEKIMS---HWTDDLALLENIHARKLKE

A0A6J1GQF8 uncharacterized protein LOC111456533 isoform X2

5.3e-43

42.15

Show/hide

Query:  SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFK-ASHDSDKITFTEYDKFILENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKC
        SI T LSC L G  E KKL +E  LL      K +S+   +ITF    +  L + + DY  LLQGG ERS ID+ME +L LR QL+E EDEY  IL+GK 
Subjt:  SIATGLSCNLHGITEWKKLHLEDRLLIYQKRFK-ASHDSDKITFTEYDKFILENSTRDYLCLLQGGEERSYIDLMENILGLRNQLMEHEDEYFSILQGKC

Query:  SKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHSHEDLLKRMISQKKEMMKLEGEYVELLK-AVVTVGDALSQYSKDVLQR
        S KNK+DVL+++V +RREL+ AEKVYL ISR R+ R  +  +   +   SK S E+ L  MI +KKEMMKLE  +V LL+ +   + + L  YSKDVL  
Subjt:  SKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHSHEDLLKRMISQKKEMMKLEGEYVELLK-AVVTVGDALSQYSKDVLQR

Query:  TAS---------------LRER-----------------------QDQMYLNLAYDLNID--YKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNT
          S               LRE+                       Q Q+Y NL  +++ D  Y+I  L+ +VNLR++YL +EDEYLW+LE+R TK H NT
Subjt:  TAS---------------LRER-----------------------QDQMYLNLAYDLNID--YKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNT

Query:  STSFDVYQRYSDYVREWEKIMS---HWTDDLALLENIHARKLKE
         TSFDV+Q + +Y+  WEK++    +W +D  L  + + R+L++
Subjt:  STSFDVYQRYSDYVREWEKIMS---HWTDDLALLENIHARKLKE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGATGACAACAAGGAGGATCTCACATTAATGATGAAAAGAAAAAACAAGGAAGTGGATACAAAGAAATCTGTTGACATCGCATCTTCAAAAAGCATTGCAACTGGGCT
TAGTTGTAATTTGCATGGAATTACAGAATGGAAAAAGCTGCACTTAGAAGATCGTCTGCTCATCTACCAAAAGAGATTCAAGGCATCACATGATAGCGATAAAATTACAT
TTACTGAATATGATAAATTCATATTGGAAAATTCCACAAGAGATTATCTTTGTCTCCTGCAAGGAGGAGAAGAACGTTCCTACATAGATTTGATGGAAAATATATTGGGT
TTGAGAAATCAATTGATGGAGCATGAGGATGAATACTTTTCCATATTGCAAGGGAAATGCTCAAAGAAGAATAAAAAGGATGTATTACAAAAGATAGTCCTTTCAAGGAG
AGAGTTGAAGGATGCAGAAAAAGTATATCTGATGATCTCACGATGGAGGGATTGGAGATATAGTACCGATAAAAAGACTATGTTCAATCATAAATGTTCAAAACACTCCC
ATGAAGATTTATTAAAAAGGATGATAAGTCAGAAAAAAGAAATGATGAAGTTGGAAGGTGAGTATGTTGAGTTATTGAAAGCTGTGGTGACGGTTGGCGATGCACTTTCA
CAATACTCTAAAGATGTATTACAAAGGACAGCATCTTTGAGAGAACGACAAGATCAAATGTACCTAAATTTGGCATACGACTTGAACATAGACTACAAAATAAATAGATT
ACAACTCATCGTAAATTTGAGAAAAGAATATTTGGAGTTGGAAGATGAATATTTATGGCTATTGGAAGATAGACAAACCAAGAACCATGACAACACATCAACGTCATTTG
ATGTCTACCAACGTTATTCAGATTATGTTCGAGAATGGGAAAAAATTATGTCACACTGGACGGATGATTTGGCATTGTTAGAAAATATTCATGCTCGCAAACTAAAGGAG
GTAGACGCGTGCAATGCAGCTTCTATGTTTGGAAGAGAGATAACGGAGAAAGCGGCCGAAGAAGTTCGTTCTTTGCTTGGGAAAGGGATAACGGAGGAAGAGGCCGAAGA
ACTTCGTTCTGAGCTCGTTATTGCCTGGATTTTGAATTCTGTTTCCAGAAACATATCCTCAAGCATCATTTCTTTGATTCGACTCAGACGATCTGGCTTGACCTTAAGGA
ACGATTCCAACGAAAGAACGCTGAAAGGAATTTGGGATGAGTATATCTCCTATCGCCCTGGTTGTTCTTGTGGACGGTGTAATTGTGGCGGACATACGACAATTCAAGAA
TTTCTTCAGTTCGAGTACCTGATGATCTTTCTTATGGGTTTGAACGAATCTTTTGGCCATATTCGTTCTCAAATCCTTCTCATGGATCCTCCGCCTACTATCTCGAAGGC
TTTTCATTGGTTGTACAAGAAGAACATCAACGTTCTCTTCCCTGCTCCACTACCCACTACGACTGCTCTTGCGGGCCAACGACCATATCAACCGAAGACAGAAACTGCTT
CATTAGTCACATCCTCGACTCAGCTTGCTTCTGCTTCTTCAACTGACACCGCTGAGGCTCTTACTAAATGCCATAATCTTCTCACCATGTTGCAATCCAAATTGACCGCT
GCCAAGACAGACACTGATGTTGCCACTTATTACCTGGCAGGTACATGTTCCTCTCTTACCTCTTGGATTATTGACTCTGGTGCTTCCACCCATATTTGCTTTGATAAGAC
CTTGTTTACAATCATATTTCCGGTTTCTACGTCATTTCTTCTACCTGATAACACAAGGTTTTCAGTACAGTTTGCTGGTACTGTTACTATACTTGGTTCAGTGTGTCTTC
AACGGGTCTTATTTGTGCCACAATTTCAATATAATCTCATATCCATCAGTGCCCTGACATCTGATGCCTTTATTACCGTTCAATTCTCTACTAATTGTTGCGATATTCAG
GAAAGGTCCACTTTGAGGACGATTAGCAGGGGTAGTCTACAAAATGGCTTCTTTATGCTGGATGATCAAGCCATTTCTGATACTAATCCTGTTGTTTGCGCGTCTACTAC
ACAGAAAGCTCCTCCTGTTTTGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MDDNKEDLTLMMKRKNKEVDTKKSVDIASSKSIATGLSCNLHGITEWKKLHLEDRLLIYQKRFKASHDSDKITFTEYDKFILENSTRDYLCLLQGGEERSYIDLMENILG
LRNQLMEHEDEYFSILQGKCSKKNKKDVLQKIVLSRRELKDAEKVYLMISRWRDWRYSTDKKTMFNHKCSKHSHEDLLKRMISQKKEMMKLEGEYVELLKAVVTVGDALS
QYSKDVLQRTASLRERQDQMYLNLAYDLNIDYKINRLQLIVNLRKEYLELEDEYLWLLEDRQTKNHDNTSTSFDVYQRYSDYVREWEKIMSHWTDDLALLENIHARKLKE
VDACNAASMFGREITEKAAEEVRSLLGKGITEEEAEELRSELVIAWILNSVSRNISSSIISLIRLRRSGLTLRNDSNERTLKGIWDEYISYRPGCSCGRCNCGGHTTIQE
FLQFEYLMIFLMGLNESFGHIRSQILLMDPPPTISKAFHWLYKKNINVLFPAPLPTTTALAGQRPYQPKTETASLVTSSTQLASASSTDTAEALTKCHNLLTMLQSKLTA
AKTDTDVATYYLAGTCSSLTSWIIDSGASTHICFDKTLFTIIFPVSTSFLLPDNTRFSVQFAGTVTILGSVCLQRVLFVPQFQYNLISISALTSDAFITVQFSTNCCDIQ
ERSTLRTISRGSLQNGFFMLDDQAISDTNPVVCASTTQKAPPVL

Lag0002091 (gene) of Sponge gourd (AG-4) v1 genome