CuGenDBv2

Gene ID	Lag0023167
Organism	Luffa acutangula AG-4 (Sponge gourd (AG-4) v1)
Description	Ulp1-like peptidase
Genome location	chr7:45282619..45286392
RNA-Seq Expression	Lag0023167
Synteny	Lag0023167
Gene Ontology terms	NA
InterPro domains	IPR015410 - Domain of unknown function DUF1985

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022146372.1 uncharacterized protein LOC111015600 [Momordica charantia]

3.4e-51

43.93

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFRQT FGPI+D  ++FNG LIHHLL  EVE+PRQDVISF++F  RVSFGK+EFDLITG  H     + +  G RLR  YFKDSV+   +++EK FLE  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE
        F  DED VKV + YFIELAM G+ERKQ  +   +G++D WE FCN DWS +IF+ TI SLK  L  + +  +     + + VE Y+LYGF +        
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE

Query:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAP
             ++RV                         L+SE+F  T +KV   L+ +DAE +HM R++  P+  V       P
Subjt:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAP

XP_022153201.1 uncharacterized protein LOC111020757 [Momordica charantia]

9.6e-78

44.1

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFRQT FGPI+D +++FNG LIHHLL REVE+PRQDVISF++FG RVSFGK+EFDLITG  H     D +  G RLR  YFKD V+   +++EK FLE  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE
        F  DED VKV + YFIELAM G+ERKQ  +  LLG++D WE+FCNYDWS +IF+ TI SLK AL  + +  +     + S VE Y+LYGF +AFQVWAYE
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE

Query:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKA------PVFSPQSEAPFFPPQPELVNNANV
        TIS+        L+ DAIPR  RWSC +S  +  L+SE+F  T +KV   L+ +DA+ +HM R++  P+       P    ++  P  P  PE       
Subjt:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKA------PVFSPQSEAPFFPPQPELVNNANV

Query:  DRVVSDRGSDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYLRRLSKVMNSDKG
           V D  +D        P+  VD   +DE     S  +G G   R       + + R++K ++  V  I++ L      LK I+ YL++L+K     K 
Subjt:  DRVVSDRGSDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYLRRLSKVMNSDKG

Query:  KDRVKEEGYGGVSED
         D  K  G GG  +D
Subjt:  KDRVKEEGYGGVSED

XP_022154561.1 uncharacterized protein LOC111021802 [Momordica charantia]

9.1e-52

36.58

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFR+T F  ++D +++FNG LIH++L REVE+   + ISFN+F  R+SF + +F LI+G ++ R     N    RL  LYF D     ++D EK +   +
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQRDDVVGETSRVERYNLYGFTHAFQVWAYETI
        FE D D VKV + Y + + + GRER  KF+  LLGI+DDWE+ CNY+W+ + FE TI SL++     ++      +    + Y+LYGF   FQVWAY+TI
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQRDDVVGETSRVERYNLYGFTHAFQVWAYETI

Query:  SSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAPFFPPQPELVNNANVDRVVSDRG
        SSL  RVANK+  D +P   +W   HS ++  L  +IF  T+ +    L  +D E   + R    P     S   +        E  +NA    V     
Subjt:  SSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAPFFPPQPELVNNANVDRVVSDRG

Query:  SDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYL
         D+ S  RG    +V+MV  D EL +E   E  GK   C      + +++ +K M+  + E   D   I+ +LKSIKK+L
Subjt:  SDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYL

XP_022155158.1 uncharacterized protein LOC111022300 [Momordica charantia]

4.2e-49

60.37

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFRQT FGPI+D +++FNG LIHHLL REVE+PRQD+ISF++FG RVSFGK+EFDLITG  +     D +  G RLR  YFKDSV+   +++EK F+E  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL
        F  DEDAVKV + YF+ELAM G+ERKQ  +  LLG++D WE+FCN+DWS +IFE T+ SLK A+
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL

XP_022157020.1 uncharacterized protein LOC111023847 [Momordica charantia]

1.4e-76

56.81

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MF QT FGPI+  N++FNG L+HHLL REVE+P+ D+ISFN+FGNRVSFGK+EFDLITG RH     D +    RLR LYF+D      +++EK FLE  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQ--RDDVVGETSRVERYNLYGFTHAFQVWAYE
        FE DEDAVK+A+ YFIELAM G+ERK K +  LLGI+D WE+FCNYDWS +IFE T+ SLK AL+   +  +  V  ++S VE Y+LY F +AFQVWAYE
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQ--RDDVVGETSRVERYNLYGFTHAFQVWAYE

Query:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAE
        TIS+L  RVA +LN DAIPR  RWSC++S ++  L  E+F   ++KV+V+L  +D E
Subjt:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAE

TrEMBL top hits

e value

%identity

Alignment

A0A6J1CZE8 uncharacterized protein LOC111015600

1.7e-51

43.93

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFRQT FGPI+D  ++FNG LIHHLL  EVE+PRQDVISF++F  RVSFGK+EFDLITG  H     + +  G RLR  YFKDSV+   +++EK FLE  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE
        F  DED VKV + YFIELAM G+ERKQ  +   +G++D WE FCN DWS +IF+ TI SLK  L  + +  +     + + VE Y+LYGF +        
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE

Query:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAP
             ++RV                         L+SE+F  T +KV   L+ +DAE +HM R++  P+  V       P
Subjt:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAP

A0A6J1DJX9 uncharacterized protein LOC111020757

4.7e-78

44.1

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFRQT FGPI+D +++FNG LIHHLL REVE+PRQDVISF++FG RVSFGK+EFDLITG  H     D +  G RLR  YFKD V+   +++EK FLE  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE
        F  DED VKV + YFIELAM G+ERKQ  +  LLG++D WE+FCNYDWS +IF+ TI SLK AL  + +  +     + S VE Y+LYGF +AFQVWAYE
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL--RAATQRDDVVGETSRVERYNLYGFTHAFQVWAYE

Query:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKA------PVFSPQSEAPFFPPQPELVNNANV
        TIS+        L+ DAIPR  RWSC +S  +  L+SE+F  T +KV   L+ +DA+ +HM R++  P+       P    ++  P  P  PE       
Subjt:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKA------PVFSPQSEAPFFPPQPELVNNANV

Query:  DRVVSDRGSDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYLRRLSKVMNSDKG
           V D  +D        P+  VD   +DE     S  +G G   R       + + R++K ++  V  I++ L      LK I+ YL++L+K     K 
Subjt:  DRVVSDRGSDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYLRRLSKVMNSDKG

Query:  KDRVKEEGYGGVSED
         D  K  G GG  +D
Subjt:  KDRVKEEGYGGVSED

A0A6J1DM82 uncharacterized protein LOC111022300

2.0e-49

60.37

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFRQT FGPI+D +++FNG LIHHLL REVE+PRQD+ISF++FG RVSFGK+EFDLITG  +     D +  G RLR  YFKDSV+   +++EK F+E  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL
        F  DEDAVKV + YF+ELAM G+ERKQ  +  LLG++D WE+FCN+DWS +IFE T+ SLK A+
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKAL

A0A6J1DP34 uncharacterized protein LOC111021802

4.4e-52

36.58

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MFR+T F  ++D +++FNG LIH++L REVE+   + ISFN+F  R+SF + +F LI+G ++ R     N    RL  LYF D     ++D EK +   +
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQRDDVVGETSRVERYNLYGFTHAFQVWAYETI
        FE D D VKV + Y + + + GRER  KF+  LLGI+DDWE+ CNY+W+ + FE TI SL++     ++      +    + Y+LYGF   FQVWAY+TI
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQRDDVVGETSRVERYNLYGFTHAFQVWAYETI

Query:  SSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAPFFPPQPELVNNANVDRVVSDRG
        SSL  RVANK+  D +P   +W   HS ++  L  +IF  T+ +    L  +D E   + R    P     S   +        E  +NA    V     
Subjt:  SSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAPFFPPQPELVNNANVDRVVSDRG

Query:  SDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYL
         D+ S  RG    +V+MV  D EL +E   E  GK   C      + +++ +K M+  + E   D   I+ +LKSIKK+L
Subjt:  SDEASWDRGYPIKEVDMVGLDEELTHESLFEGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYL

A0A6J1DRZ7 uncharacterized protein LOC111023847

6.7e-77

56.81

Show/hide

Query:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ
        MF QT FGPI+  N++FNG L+HHLL REVE+P+ D+ISFN+FGNRVSFGK+EFDLITG RH     D +    RLR LYF+D      +++EK FLE  
Subjt:  MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQ

Query:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQ--RDDVVGETSRVERYNLYGFTHAFQVWAYE
        FE DEDAVK+A+ YFIELAM G+ERK K +  LLGI+D WE+FCNYDWS +IFE T+ SLK AL+   +  +  V  ++S VE Y+LY F +AFQVWAYE
Subjt:  FETDEDAVKVALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQ--RDDVVGETSRVERYNLYGFTHAFQVWAYE

Query:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAE
        TIS+L  RVA +LN DAIPR  RWSC++S ++  L  E+F   ++KV+V+L  +D E
Subjt:  TISSLKNRVANKLNQDAIPRFSRWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT2G07240.1 cysteine-type peptidases;cysteine-type peptidases

3.3e-07

30.98

Show/hide

Query:  KYLRRLSKVMNSDKGKDRVKEEGYGGVSEDAMVE--DRDMH---KVIDSLFMFVRKKLQQRSDLHRWKFVIADIVVTEFMRRHDHISEEFKKVQDPSLIT
        +Y R LSK+    KGK  +   G   +S   + +  +R  H   KV+D L  F R  L  R+D    + +  D++ ++F+ +   +  +F K   P    
Subjt:  KYLRRLSKVMNSDKGKDRVKEEGYGGVSEDAMVE--DRDMH---KVIDSLFMFVRKKLQQRSDLHRWKFVIADIVVTEFMRRHDHISEEFKKVQDPSLIT

Query:  FDWSTTKTVMDYVMGR-HSDHDAHWSTVDAIYNHSTSEGNHWVMVCVDLQVGKLTVLDSFIALASDATL-KELSTL-AMLMLLF
         D+     ++D ++G   S+    ++  D +Y     +  HWV +CVDL+  K+T+LDS I L  DA L  EL  L AML  LF
Subjt:  FDWSTTKTVMDYVMGR-HSDHDAHWSTVDAIYNHSTSEGNHWVMVCVDLQVGKLTVLDSFIALASDATL-KELSTL-AMLMLLF

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTTTAGGCAAACCATATTTGGGCCTATAGTGGATAGTAACATCATATTTAATGGTCAGTTAATCCACCATCTATTGCGTAGGGAGGTTGAGGATCCTAGACAGGATGT
CATTAGTTTCAATATATTTGGAAATAGGGTGTCCTTTGGCAAGCAAGAATTTGACCTAATCACAGGATTTAGACACCATAGAAGGATATTTGATAGAAATAAGTCAGGGG
TTAGATTGAGGCGTCTGTACTTTAAAGATAGTGTCAAAGATACAGTAGCAGATGTTGAAAAAAGGTTCTTAGAAATACAATTTGAGACTGATGAAGATGCGGTGAAGGTA
GCTCTCGCATATTTCATTGAGCTAGCAATGTTTGGGCGGGAGAGGAAGCAGAAGTTCAATTGGTTTCTATTGGGTATTATGGATGATTGGGAGATATTCTGCAACTATGA
TTGGAGCAAGGTAATTTTTGAGATGACTATCAGGAGCTTGAAAAAAGCACTTAGGGCTGCCACCCAAAGAGACGACGTGGTTGGAGAGACTAGTCGAGTGGAAAGATATA
ATCTTTACGGCTTTACACATGCTTTTCAGGTATGGGCGTATGAGACTATATCATCTCTGAAAAACCGTGTTGCGAACAAACTGAACCAGGATGCGATCCCACGCTTTTCT
CGGTGGTCATGCTCCCATTCTCCTTCGTACACCCAACTTAGCAGTGAGATATTTGGCTTGACGGAGGCAAAGGTGATAGTACAATTGGTGCCGAGCGATGCAGAACTCGA
ACACATGTGTCGCATCGTTGGTGCACCAAAGGCCCCTGTTTTTTCGCCACAATCAGAGGCCCCTTTTTTTCCGCCACAACCAGAACTAGTGAATAATGCAAACGTAGATC
GTGTCGTGAGTGATAGAGGGTCAGATGAGGCTAGTTGGGATAGGGGTTATCCAATAAAAGAGGTAGATATGGTTGGGCTCGATGAAGAATTGACACATGAGAGTCTATTT
GAAGGCGTGGGCAAGACTTGTCGGTGTGACTGCAAGCATTCATACGAGTCACTAGACCGACAGATGAAGGAGATGGAATTTGAAGTGAAGGAAATAAAAAACGATTTAAA
AGGGATAAAAACTGATCTAAAGTCAATTAAGAAGTACTTGCGTCGATTATCGAAGGTGATGAACTCTGATAAAGGAAAGGATCGTGTCAAGGAGGAGGGGTATGGTGGGG
TTTCAGAAGATGCGATGGTAGAGGACCGTGATATGCATAAGGTCATTGACTCGCTTTTTATGTTCGTTCGGAAGAAACTGCAACAACGGTCGGACTTGCATCGTTGGAAA
TTTGTCATTGCAGATATTGTTGTTACCGAGTTTATGAGACGTCACGACCATATATCTGAAGAGTTCAAGAAGGTGCAAGATCCTTCATTGATTACGTTCGACTGGAGTAC
GACTAAGACTGTGATGGATTACGTTATGGGTCGACACTCGGACCATGATGCACATTGGAGTACAGTTGACGCGATCTACAACCATTCAACCTCGGAGGGAAACCATTGGG
TTATGGTATGTGTTGATCTCCAGGTGGGCAAGTTGACCGTCCTTGATTCATTCATAGCACTGGCATCTGATGCAACCTTGAAGGAGTTGAGCACTTTAGCCATGCTAATG
CTACTGTTCAATGTTGTAGAGCTTATGATGATAAATTTGAGAGTGTATTTTTTCTGTTTTTCAGAAACGAAGGGGGAAAACCCCATTCGATTCCGGCGCCGGAGAGGGAG
GAGGGAGGAACGAGGATGGAGGAGAACGAAGAGGGAGGAGGGAGGAACGAGGAGGGAGGAGGGTCCTCCCTCCTCTGTCTCGTCGCCGGAGACGGAGGAGGGTCCTCCCT
CCTCTGTCTCGTCGCCGGAGACGGAGGAGGGTTCCCTCTCCGGCGCCGGAATCGAAGGGGGTTTTCCCCTTTCGTTTCTGTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MFRQTIFGPIVDSNIIFNGQLIHHLLRREVEDPRQDVISFNIFGNRVSFGKQEFDLITGFRHHRRIFDRNKSGVRLRRLYFKDSVKDTVADVEKRFLEIQFETDEDAVKV
ALAYFIELAMFGRERKQKFNWFLLGIMDDWEIFCNYDWSKVIFEMTIRSLKKALRAATQRDDVVGETSRVERYNLYGFTHAFQVWAYETISSLKNRVANKLNQDAIPRFS
RWSCSHSPSYTQLSSEIFGLTEAKVIVQLVPSDAELEHMCRIVGAPKAPVFSPQSEAPFFPPQPELVNNANVDRVVSDRGSDEASWDRGYPIKEVDMVGLDEELTHESLF
EGVGKTCRCDCKHSYESLDRQMKEMEFEVKEIKNDLKGIKTDLKSIKKYLRRLSKVMNSDKGKDRVKEEGYGGVSEDAMVEDRDMHKVIDSLFMFVRKKLQQRSDLHRWK
FVIADIVVTEFMRRHDHISEEFKKVQDPSLITFDWSTTKTVMDYVMGRHSDHDAHWSTVDAIYNHSTSEGNHWVMVCVDLQVGKLTVLDSFIALASDATLKELSTLAMLM
LLFNVVELMMINLRVYFFCFSETKGENPIRFRRRRGRREERGWRRTKREEGGTRREEGPPSSVSSPETEEGPPSSVSSPETEEGSLSGAGIEGGFPLSFL

Lag0023167 (gene) of Sponge gourd (AG-4) v1 genome