CuGenDBv2

Gene ID	Moc03g08050
Organism	Momordica charantia cv. OHB3-1 (Bitter gourd (OHB3-1) v2)
Description	Integrase catalytic domain-containing protein
Genome location	chr3:5627477..5632409
RNA-Seq Expression	Moc03g08050
Synteny	Moc03g08050
Gene Ontology terms	NA
InterPro domains	IPR005162 - Retrotransposon gag domain IPR041588 - Integrase zinc-binding domain

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

XP_022137317.1 uncharacterized protein LOC111008813 [Momordica charantia]

3.2e-78

42.11

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP
        E PF+  +L+APIPP+FKA  +  YDGS DP  Y+EVFE  MDF AASDA+KCRAF IAL GSARLWYR+L   SI +Y QLRR F+  FS+R   K   
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP

Query:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN------------------------------------GARRSNRGKD--RDRKSSPPKK----------QH
        ++L T++Q++ ++L EY+  F +E +KVA+                                     A++   G++  R +   P +K          ++
Subjt:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN------------------------------------GARRSNRGKD--RDRKSSPPKK----------QH

Query:  VDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS-----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------
         D +S  + +    +    R E  P+  R  +  +P   P +       E+    LL  P    G+  R     +  F  E     SD            
Subjt:  VDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS-----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------

Query:  PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALV
         +GY KK+VG   +     + ++E+R++S  P R+ DRPA+INTI GGPSGGQSG+KRK LAR A  EVC    + P   I FD  D EEVHLPHNDALV
Subjt:  PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALV

Query:  IAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK
        IAPLIDHV V RVLVDGG SANILS  TY ALGW R  LK+SPTPLV F+GE+V  EG I LPVT+G+   Q+T+
Subjt:  IAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK

XP_022150760.1 uncharacterized protein LOC111018823 [Momordica charantia]

2.8e-74

40.11

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLL----
        E PF+  +L+AP         + SYDGS DP  Y+EVFEG MDF AASDA+KCRAF IAL GSARLW+++ + +   S       +     A + L    
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLL----

Query:  -KLPPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS
         K  P+    V Q+  K         +D    +     R  RG DR R     K +  D +S  + +    +    R    P+  R  +  +P   P + 
Subjt:  -KLPPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS

Query:  -----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIIN
              E+    LL  P    G+  R     +  F  E     SD             + Y KK+VG   +     + ++E+R+ S  P R+ DRPA+IN
Subjt:  -----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIIN

Query:  TIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSP
        TI GGPSGGQSG KRK LAR A  EVC    + P   I FD  D EEVHLPHNDALVIAPLIDHV VRRVLVD G SANI+S  TY ALGW R  LK+S 
Subjt:  TIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSP

Query:  TPLVSFAGETVSVEGCISLPVTVGEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTC
        TPLV F+ E+V  EGCI LPVT+G    Q+T+                         +A+PST HQVLKY T   V  VRGEQ  SR+CY +A++G++ C
Subjt:  TPLVSFAGETVSVEGCISLPVTVGEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTC

Query:  A--TIMEPDAIPPPHIDKAEPSRGAPAEELELVPLL
        A  T++  D       +       AP EELELVPLL
Subjt:  A--TIMEPDAIPPPHIDKAEPSRGAPAEELELVPLL

XP_022152854.1 uncharacterized protein LOC111020479 [Momordica charantia]

2.0e-80

38.94

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP
        E  FS  IL+A IPP+FK   M  YDGS DP  Y+EVFE  MDF AA+DA+KC AF IAL GSARLWYR+L  R I +Y QLR+ FI+QFS+R   +  P
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP

Query:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN---------------------------------------------------------GARRSNRGKDRDR
        ++L T++Q++ ++L EY+  F +E +KVA+                                                            +   GKD+ +
Subjt:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN---------------------------------------------------------GARRSNRGKDRDR

Query:  KSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPK----FDSPRKAPQTSRE---ARQATLLPIPHGSQLRHFTLFQPEGAGRGSD---------
          S  K +     SSS R D  ++    ++  P +H  P     F+      +T  E    R   L   P       +  F  +     S+         
Subjt:  KSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPK----FDSPRKAPQTSRE---ARQATLLPIPHGSQLRHFTLFQPEGAGRGSD---------

Query:  ---PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHND
            +GY KK+V G+ R+       E KR ++PP  R++DRPA+IN             K+K LAREA  EVC    + P  SI F+  D E VHLPHND
Subjt:  ---PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHND

Query:  ALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK----------------------
        ALVIAPLID V VRR+LVDGGASANILS STY ALGW R  LK+SPTPLV F+GE++S+EGCI LPV++ + D Q+T+                      
Subjt:  ALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK----------------------

Query:  -DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA
           +AVPST HQVLKY T   V TVRGE +TSR+CY +  + ++ CA
Subjt:  -DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA

XP_022155139.1 uncharacterized protein LOC111022280 [Momordica charantia]

3.4e-88

45.82

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP
        E PF+  I++APIPP+FK   M  YDGS DP  Y+EVFEG MDF AA+DA+KC AF IAL GSARLW R+L  RSI +Y QLR+ FI QFS R   +   
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP

Query:  SNLGTVKQRDNKSLT-----EYIAWFMDEHVKVANGARRSNRGKDRDR-KSSPPKKQHVDDR-SSSRRADDNKNRVCRDERAPSDHRGPKFDSPRKAPQT
        ++L T++Q+++++LT     E  A F     +V   A++   G++  R K+  P+KQ    R S  +R DD+K+   +D+ + S     ++      P  
Subjt:  SNLGTVKQRDNKSLT-----EYIAWFMDEHVKVANGARRSNRGKDRDR-KSSPPKKQHVDDR-SSSRRADDNKNRVCRDERAPSDHRGPKFDSPRKAPQT

Query:  SREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAA
        SR   +   L      Q+                 + Y KK+V G+ R+       E KR ++PP  R+EDRPA+INTI GGPSGGQ   KRK LA EA 
Subjt:  SREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAA

Query:  HEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTV
         +V     ++P  SI F D D E VHLPHNDALVIAPLIDHV VRRVLVDGGASANILS  TY AL   R  LK+SPTPLV F+ E+VS EGCI LPVT+
Subjt:  HEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTV

Query:  GEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA
        G+   Q+T+                         +AVPS  HQVLKY T   V TVRGEQ+TSR+CY +A++ ++ CA
Subjt:  GEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA

XP_022158844.1 uncharacterized protein LOC111025310 [Momordica charantia]

9.0e-89

47.64

Show/hide

Query:  PPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPKFD--SPRKA------
        PP++L  +  R  + +     W        ANGARRS+RG+DRD KS P KK+  DDRSSSRRADD+K+R  RDER  S+ RGPKFD  +P  A      
Subjt:  PPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPKFD--SPRKA------

Query:  ---PQTSREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPE---------------GYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTI
             T  E   A+   +   S  R+  L+       G D                 GYLKKYVG RE+AE EGSAREEKRE+S PPR KEDRPA+INTI
Subjt:  ---PQTSREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPE---------------GYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTI

Query:  HGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTP
        HGGPSG +SGQKRKALARE AHEVC SYPK P + ILFD++D E VH+PHNDALVIAPLIDHVKVRRV VDGGASANI SFSTYTALGWER+HLK   T 
Subjt:  HGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTP

Query:  LVSFAGETVSVEGCISLPVTVGEGDQQMTKDLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCATIMEPDAIPPPHIDKAEPSRGAPA
        LV FA E+VS EGCISLPVT+ EG+ Q+T+           V +++   R +  +      RDC       + +C T        P H  +         
Subjt:  LVSFAGETVSVEGCISLPVTVGEGDQQMTKDLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCATIMEPDAIPPPHIDKAEPSRGAPA

Query:  EELELVPLLGPDKQVP--------------RSENSNTDVLARLASAYEIDLPRTVPVEVLAELSID
           ELVPLLGPD+QV               R   SN+DV A        D+P   P  ++  L+++
Subjt:  EELELVPLLGPDKQVP--------------RSENSNTDVLARLASAYEIDLPRTVPVEVLAELSID

TrEMBL top hits

e value

%identity

Alignment

A0A6J1C7X5 uncharacterized protein LOC111008813

1.6e-78

42.11

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP
        E PF+  +L+APIPP+FKA  +  YDGS DP  Y+EVFE  MDF AASDA+KCRAF IAL GSARLWYR+L   SI +Y QLRR F+  FS+R   K   
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP

Query:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN------------------------------------GARRSNRGKD--RDRKSSPPKK----------QH
        ++L T++Q++ ++L EY+  F +E +KVA+                                     A++   G++  R +   P +K          ++
Subjt:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN------------------------------------GARRSNRGKD--RDRKSSPPKK----------QH

Query:  VDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS-----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------
         D +S  + +    +    R E  P+  R  +  +P   P +       E+    LL  P    G+  R     +  F  E     SD            
Subjt:  VDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS-----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------

Query:  PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALV
         +GY KK+VG   +     + ++E+R++S  P R+ DRPA+INTI GGPSGGQSG+KRK LAR A  EVC    + P   I FD  D EEVHLPHNDALV
Subjt:  PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALV

Query:  IAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK
        IAPLIDHV V RVLVDGG SANILS  TY ALGW R  LK+SPTPLV F+GE+V  EG I LPVT+G+   Q+T+
Subjt:  IAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK

A0A6J1D9E1 uncharacterized protein LOC111018823

1.4e-74

40.11

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLL----
        E PF+  +L+AP         + SYDGS DP  Y+EVFEG MDF AASDA+KCRAF IAL GSARLW+++ + +   S       +     A + L    
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLL----

Query:  -KLPPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS
         K  P+    V Q+  K         +D    +     R  RG DR R     K +  D +S  + +    +    R    P+  R  +  +P   P + 
Subjt:  -KLPPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRA-DDNKNRVCRDERAPSDHRGPKFDSPRKAPQTS

Query:  -----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIIN
              E+    LL  P    G+  R     +  F  E     SD             + Y KK+VG   +     + ++E+R+ S  P R+ DRPA+IN
Subjt:  -----REARQATLLPIP---HGSQLRH----FTLFQPEGAGRGSD------------PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIIN

Query:  TIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSP
        TI GGPSGGQSG KRK LAR A  EVC    + P   I FD  D EEVHLPHNDALVIAPLIDHV VRRVLVD G SANI+S  TY ALGW R  LK+S 
Subjt:  TIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSP

Query:  TPLVSFAGETVSVEGCISLPVTVGEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTC
        TPLV F+ E+V  EGCI LPVT+G    Q+T+                         +A+PST HQVLKY T   V  VRGEQ  SR+CY +A++G++ C
Subjt:  TPLVSFAGETVSVEGCISLPVTVGEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTC

Query:  A--TIMEPDAIPPPHIDKAEPSRGAPAEELELVPLL
        A  T++  D       +       AP EELELVPLL
Subjt:  A--TIMEPDAIPPPHIDKAEPSRGAPAEELELVPLL

A0A6J1DHB3 uncharacterized protein LOC111020479

9.7e-81

38.94

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP
        E  FS  IL+A IPP+FK   M  YDGS DP  Y+EVFE  MDF AA+DA+KC AF IAL GSARLWYR+L  R I +Y QLR+ FI+QFS+R   +  P
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP

Query:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN---------------------------------------------------------GARRSNRGKDRDR
        ++L T++Q++ ++L EY+  F +E +KVA+                                                            +   GKD+ +
Subjt:  SNLGTVKQRDNKSLTEYIAWFMDEHVKVAN---------------------------------------------------------GARRSNRGKDRDR

Query:  KSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPK----FDSPRKAPQTSRE---ARQATLLPIPHGSQLRHFTLFQPEGAGRGSD---------
          S  K +     SSS R D  ++    ++  P +H  P     F+      +T  E    R   L   P       +  F  +     S+         
Subjt:  KSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPK----FDSPRKAPQTSRE---ARQATLLPIPHGSQLRHFTLFQPEGAGRGSD---------

Query:  ---PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHND
            +GY KK+V G+ R+       E KR ++PP  R++DRPA+IN             K+K LAREA  EVC    + P  SI F+  D E VHLPHND
Subjt:  ---PEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHND

Query:  ALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK----------------------
        ALVIAPLID V VRR+LVDGGASANILS STY ALGW R  LK+SPTPLV F+GE++S+EGCI LPV++ + D Q+T+                      
Subjt:  ALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTK----------------------

Query:  -DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA
           +AVPST HQVLKY T   V TVRGE +TSR+CY +  + ++ CA
Subjt:  -DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA

A0A6J1DPC9 uncharacterized protein LOC111022280

1.7e-88

45.82

Show/hide

Query:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP
        E PF+  I++APIPP+FK   M  YDGS DP  Y+EVFEG MDF AA+DA+KC AF IAL GSARLW R+L  RSI +Y QLR+ FI QFS R   +   
Subjt:  EPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKLPP

Query:  SNLGTVKQRDNKSLT-----EYIAWFMDEHVKVANGARRSNRGKDRDR-KSSPPKKQHVDDR-SSSRRADDNKNRVCRDERAPSDHRGPKFDSPRKAPQT
        ++L T++Q+++++LT     E  A F     +V   A++   G++  R K+  P+KQ    R S  +R DD+K+   +D+ + S     ++      P  
Subjt:  SNLGTVKQRDNKSLT-----EYIAWFMDEHVKVANGARRSNRGKDRDR-KSSPPKKQHVDDR-SSSRRADDNKNRVCRDERAPSDHRGPKFDSPRKAPQT

Query:  SREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAA
        SR   +   L      Q+                 + Y KK+V G+ R+       E KR ++PP  R+EDRPA+INTI GGPSGGQ   KRK LA EA 
Subjt:  SREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAA

Query:  HEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTV
         +V     ++P  SI F D D E VHLPHNDALVIAPLIDHV VRRVLVDGGASANILS  TY AL   R  LK+SPTPLV F+ E+VS EGCI LPVT+
Subjt:  HEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTV

Query:  GEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA
        G+   Q+T+                         +AVPS  HQVLKY T   V TVRGEQ+TSR+CY +A++ ++ CA
Subjt:  GEGDQQMTK-----------------------DLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCA

A0A6J1E0L8 uncharacterized protein LOC111025310

2.6e-89

47.85

Show/hide

Query:  PPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPKFD--SPRKA------
        PP++L  +  R  + +     W        ANGARRS+RG+DRD KS P KK+  DDRSSSRRADD+K+R  RDER  S+ RGPKFD  +P  A      
Subjt:  PPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPKFD--SPRKA------

Query:  ---PQTSREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPE---------------GYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTI
             T  E   A+   +   S  R+  L+       G D                 GYLKKYVG RE+AE EGSAREEKRE+S PPR KEDRPA+INTI
Subjt:  ---PQTSREARQATLLPIPHGSQLRHFTLFQPEGAGRGSDPE---------------GYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTI

Query:  HGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTP
        HGGPSG +SGQKRKALARE AHEVC SYPK P + ILFD++D E VH+PHNDALVIAPLIDHVKVRRV VDGGASANI SFSTYTALGWER+HLK   T 
Subjt:  HGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSILFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTP

Query:  LVSFAGETVSVEGCISLPVTVGEGDQQMTKDLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCATIMEPDAIPPPHIDKAEPSRGAPA
        LV FA E+VS EGCISLPVT+ EG+ Q+T+           V +++   R +  +      RDC       + +C T        P H  +         
Subjt:  LVSFAGETVSVEGCISLPVTVGEGDQQMTKDLKAVPSTYHQVLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCATIMEPDAIPPPHIDKAEPSRGAPA

Query:  EELELVPLLGPDKQVP--------------RSENSNTDVLARLASAYEIDLPRTVPVEVLAELSID
           ELVPLLGPD+QV               R   SN+DV A        D+P   P  ++  L++D
Subjt:  EELELVPLLGPDKQVP--------------RSENSNTDVLARLASAYEIDLPRTVPVEVLAELSID

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits	e value	%identity	Alignment
No hits found

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGGCCCAAACCCGCTCCCAGCAGTCACGATCTCAACTTTCACCAATCCGCTCTCCGGTGAGGGATGCTGCCACTTCCCGTGCCCATCCTCGGCCCACGTACTCT
CAGGTGGCCGGGACTCCTGTCATCGAACGACGACCCCAGGCGGCGGTGGTAAAGGAAAATGGAGGTCGGCCGGCCACATCCGATCCCATAGCAGCCGAGACTTCC
ATTTCACCTCAGATCAGTTTCCACCACTACAGCCTCAGAGGAACGGGTTGCCGCCCCGTGCACCTCGTCTCTGCAGCTGGGGGAACACAGTCAAGGCGAGGCTCA
AAGCGATCGAGAGAAGCAGCGAGGTGTCCGGCTCTTCCGTCTCCAGGGATCCCATTCGAGGAAATGGGCCGATGCATCCGACCCAAAGAACGGAGTATTAGTTTC
AACCTCGTAGCGAGACCGGAGCTGGATCACCCTCACAAAGGCCACAACGAGTGGGGACAGGCGGTGCCCTGGGAGCACAAGTACGTAACCACCCTCAGCAGGACA
ACCAGGGCCGAGGTGAGGGGCCACCAAGACGACGAGGGGTGGCGCCCGAAGATCGGGAGTACCGGATCGATGAGGAGGAGGGAAGCCTGGAGGCCTGTAGATCCA
CATCGCGTGGCCGAGCAAGAGGAGCCGCCTTTCTCCCAAGCAATCCTGGATGCACCTATCCCGCCGAGGTTCAAGGCTCTGGTCATGAGCTCCTACGACGGTTCT
GGAGATCCAATCTCTTACATGGAGGTGTTTGAGGGGAAGATGGATTTCCTGGCTGCGAGCGACGCCATGAAGTGCCGGGCATTTCTAATAGCCTTGGAAGGCTCG
GCAAGGTTGTGGTATCGACAGTTGAAGCCCCGATCCATCGACAGTTATCAACAGCTGAGAAGGTTGTTCATCAACCAGTTCTCAGCTCGGCAATTGTTGAAATTG
CCGCCCTCTAACCTCGGAACAGTGAAACAACGGGACAACAAGTCCCTGACAGAGTACATCGCTTGGTTCATGGACGAGCATGTCAAGGTGGCCAATGGAGCCAGG
CGGAGCAACCGCGGTAAAGATCGGGACCGGAAGTCCTCTCCTCCCAAGAAGCAACATGTTGATGATCGGAGCTCGTCTCGGCGGGCCGACGACAACAAGAACAGA
GTCTGTCGCGATGAAAGAGCCCCTTCAGACCATCGGGGGCCGAAGTTTGACAGCCCCAGAAAAGCTCCGCAGACCTCTAGGGAAGCGAGACAAGCGACTCTACTG
CCGATTCCACATGGATCACAACTACGACACTTCACGCTGTTTCAACCTGAAGGAGCAGGTCGAGGATCTGATCCGGAGGGTTATCTGAAAAAATACGTCGGCGGA
CGTGAAAGGGCTGAGCCAGAGGGGTCGGCTCGGGAGGAGAAGCGAGAGAAGTCGCCACCGCCGAGACGGAAGGAAGATCGCCCCGCCATTATAAACACCATCCAT
GGGGGTCCGAGTGGCGGGCAGTCTGGGCAGAAGAGGAAAGCCCTGGCCAGAGAAGCCGCGCACGAAGTCTGTGCCTCGTACCCGAAGGAGCCCGCAGTGTCGATC
TTATTCGATGACGAAGACAGCGAAGAAGTGCACCTGCCTCATAACGACGCTCTGGTGATCGCCCCACTGATAGACCATGTAAAGGTCCGAAGAGTTCTTGTTGAT
GGCGGGGCGTCGGCTAATATACTGTCCTTCTCGACCTACACGGCTCTAGGATGGGAGAGGAAACATTTGAAGCGTAGCCCGACGCCTTTGGTCAGCTTTGCCGGG
GAGACGGTTAGCGTGGAAGGATGCATCTCACTCCCTGTCACTGTCGGCGAAGGAGATCAGCAAATGACCAAGGACCTCAAAGCGGTCCCGTCTACTTACCACCAA
GTGTTGAAGTACCTGACCTCGGCTAGAGTCGCCACAGTCCGAGGAGAGCAAAGAACGTCGAGAGATTGCTACACGGCCGCGATGAGGGGGACTAACACTTGCGCG
ACAATCATGGAGCCAGATGCAATCCCGCCACCACATATCGACAAAGCAGAGCCCAGCCGCGGCGCCCCAGCCGAGGAACTAGAGCTTGTCCCCTTGTTGGGGCCA
GATAAACAGGTGCCGAGGTCCGAAAACTCCAACACCGACGTACTGGCTCGCCTAGCCTCGGCCTACGAGATCGACCTACCGAGGACGGTTCCAGTTGAGGTACTC
GCCGAGTTGTCCATCGACCAGCCTGAGTACCTCGACCCAGAGGAGGCGAGGTATGTTATACACAAGATTCATGAAGGAGTCTGCGGAAGTCCCGAAGGAGCTCGG
TCCATGGCTGCCAAGGTCGTCCACCAGGGCTACTATTGGCCGACGATTGAACGCGACACCAAGGAGTTCGCCAAGACATGCGACAAATGCCAACGCTTTGAGAGC
ATCTTGAGACAACCCCCGGAGATGCTGACGCCGATCTCGAGCCCCTGGCCTTTCGCTTAG

mRNA sequence

Show/hide mRNA sequence

Protein sequence

Show/hide protein sequence

MAQTRSQQSRSQLSPIRSPVRDAATSRAHPRPTYSQVAGTPVIERRPQAAVVKENGGRPATSDPIAAETSISPQISFHHYSLRGTGCRPVHLVSAAGGTQSRRGS
KRSREAARCPALPSPGIPFEEMGRCIRPKERSISFNLVARPELDHPHKGHNEWGQAVPWEHKYVTTLSRTTRAEVRGHQDDEGWRPKIGSTGSMRRREAWRPVDP
HRVAEQEEPPFSQAILDAPIPPRFKALVMSSYDGSGDPISYMEVFEGKMDFLAASDAMKCRAFLIALEGSARLWYRQLKPRSIDSYQQLRRLFINQFSARQLLKL
PPSNLGTVKQRDNKSLTEYIAWFMDEHVKVANGARRSNRGKDRDRKSSPPKKQHVDDRSSSRRADDNKNRVCRDERAPSDHRGPKFDSPRKAPQTSREARQATLL
PIPHGSQLRHFTLFQPEGAGRGSDPEGYLKKYVGGRERAEPEGSAREEKREKSPPPRRKEDRPAIINTIHGGPSGGQSGQKRKALAREAAHEVCASYPKEPAVSI
LFDDEDSEEVHLPHNDALVIAPLIDHVKVRRVLVDGGASANILSFSTYTALGWERKHLKRSPTPLVSFAGETVSVEGCISLPVTVGEGDQQMTKDLKAVPSTYHQ
VLKYLTSARVATVRGEQRTSRDCYTAAMRGTNTCATIMEPDAIPPPHIDKAEPSRGAPAEELELVPLLGPDKQVPRSENSNTDVLARLASAYEIDLPRTVPVEVL
AELSIDQPEYLDPEEARYVIHKIHEGVCGSPEGARSMAAKVVHQGYYWPTIERDTKEFAKTCDKCQRFESILRQPPEMLTPISSPWPFA

Moc03g08050 (gene) of Bitter gourd (OHB3-1) v2 genome