CuGenDBv2

Gene ID	Lsi05G000520
Organism	Lagenaria siceraria USVL1VR-Ls (Bottle gourd (USVL1VR-Ls) v1)
Description	MSC domain-containing protein
Genome location	chr05:1049753..1056432
RNA-Seq Expression	Lsi05G000520
Synteny	Lsi05G000520
Gene Ontology terms	GO:0005637 - nuclear inner membrane (cellular component) GO:0016021 - integral component of membrane (cellular component) GO:0003682 - chromatin binding (molecular function)
InterPro domains	IPR044780 - Heh2/Src1-like

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAA0038534.1 MSC domain-containing protein [Cucumis melo var. makuwa]

3.2e-168

78.03

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPKKRTK KRNPNSDVGSG DSS SSS++LLKS+KEPPRDFFPSKDDLAAL TVL IA LVFV+CNFFVSRLSSRHP PFCDTDADSLD LSDVCEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKL EWLES LCE+NAKFLCDGIGIVWVKE++IWDDLDGKELV+SIGSDNTTLMYAKSKALETIG
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         L QTRQNS GIKELKCPDLLAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL++RQ LTNRAEDLYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIENGGS
                              VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSK+KKLASKS+S       KA+GV+ D MYHKIENG S
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIENGGS

XP_004148518.1 uncharacterized protein LOC101208017 isoform X1 [Cucumis sativus]

5.4e-168

77.83

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGG----DSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSD
        MSSTPKKRTK KRNPNSDVGSG     DSS SSS++LLKSIKEPPRDFFPSKDDLAAL TVL IAC VFV+CNFFVSRLSSRHP PFCDTDADS DF+SD
Subjt:  MSSTPKKRTKFKRNPNSDVGSGG----DSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSD

Query:  VCEPCPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKAL
        VCEPCPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKL EWLES LCEANAKFLCDGIGIVWVKE++IWDDLDGKELV+SIGSDNTTLMYAKSKAL
Subjt:  VCEPCPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKAL

Query:  ETIGRLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ--------------------
        ETIG L QTRQNSLGIKELKCPDLLAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL++RQYLTNRAEDLYNQ                    
Subjt:  ETIGRLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ--------------------

Query:  --------------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN
                                  VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSS +KKLASKS+S       KA+GV+ D MYHKIEN
Subjt:  --------------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN

XP_008465930.1 PREDICTED: uncharacterized protein LOC103503505 isoform X3 [Cucumis melo]

2.1e-167

78.12

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPKKRTK KRNPNSDVGSG DSS SSS++LLKS+KEPPRDFFPSKDDLAAL TVL IA LVFV+CNFFVSRLSSRHP PFCDTDADSLD LSDVCEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKL EWLES LCE+NAKFLCDGIGIVWVKE++IWDDLDGKELV+SIGSDNTTLMYAKSKALETIG
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         L QTRQNS GIKELKCPDLLAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL++RQ LTNRAEDLYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN
                              VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSK+KKLASKS+S       KA+GV+ D MYHKIEN
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN

XP_023533380.1 uncharacterized protein LOC111795284 isoform X2 [Cucurbita pepo subsp. pepo]

1.6e-156

73.59

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPK+RTKFK N NSDV S  DS  SSS VLL S+K PPRDFFPSKDDL  L TVLFIA LVFV+CNFFVSRL +R PRPFCD+DADS D LSD CEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CP HGEC +GKLEC HGYR+HGRLCIEDGVIN+AV KL EWLES LCEANAKFLCDGIGIVWV+ED IWDDLDGK LV++I SDNTT+MYAKSKALETIG
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         LFQ RQN+LGIKELKCPD LAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL +RQYLTNRAEDLYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSRKAMGVSTDRMYHKIENGGS
                              VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEK+LASKSSSR AMGV++D +Y K+ENGGS
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSRKAMGVSTDRMYHKIENGGS

XP_038888162.1 uncharacterized protein LOC120078048 [Benincasa hispida]

5.2e-171

79.33

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPKKRTK KRN NSDVGS GDSS SSST+LLKSIKEPPRDFFPSKDDLAAL TVLFIACL+FV+C+FFVSRL+SR PRPFCDTDADSLD LSDVCEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CPRHGECRDGKL+CLHGYRKHGRLCIEDGVINEAVNKL EWLES LCEANAKFLCDGIGIVWVKED+IWDDLDGKELV+SIGSDNTTL YAKSKALETIG
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         LFQTRQNSLGIKELKCPDLLAESYKPF CRI HWVLQHAF VLPV LLLVGCTWLLWKL++RQY+TNRAEDLYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSRKAMGVSTDRMYHKIEN
                              VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEK+LA+KS+S KAMGVSTD+M+ K+EN
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSRKAMGVSTDRMYHKIEN

TrEMBL top hits

e value

%identity

Alignment

A0A0A0LI89 MSC domain-containing protein

2.6e-168

77.83

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGG----DSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSD
        MSSTPKKRTK KRNPNSDVGSG     DSS SSS++LLKSIKEPPRDFFPSKDDLAAL TVL IAC VFV+CNFFVSRLSSRHP PFCDTDADS DF+SD
Subjt:  MSSTPKKRTKFKRNPNSDVGSGG----DSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSD

Query:  VCEPCPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKAL
        VCEPCPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKL EWLES LCEANAKFLCDGIGIVWVKE++IWDDLDGKELV+SIGSDNTTLMYAKSKAL
Subjt:  VCEPCPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKAL

Query:  ETIGRLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ--------------------
        ETIG L QTRQNSLGIKELKCPDLLAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL++RQYLTNRAEDLYNQ                    
Subjt:  ETIGRLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ--------------------

Query:  --------------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN
                                  VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSS +KKLASKS+S       KA+GV+ D MYHKIEN
Subjt:  --------------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN

A0A1S3CQ15 uncharacterized protein LOC103503505 isoform X3

1.0e-167

78.12

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPKKRTK KRNPNSDVGSG DSS SSS++LLKS+KEPPRDFFPSKDDLAAL TVL IA LVFV+CNFFVSRLSSRHP PFCDTDADSLD LSDVCEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKL EWLES LCE+NAKFLCDGIGIVWVKE++IWDDLDGKELV+SIGSDNTTLMYAKSKALETIG
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         L QTRQNS GIKELKCPDLLAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL++RQ LTNRAEDLYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN
                              VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSK+KKLASKS+S       KA+GV+ D MYHKIEN
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIEN

A0A1S3CRG1 uncharacterized protein LOC103503505 isoform X1

7.4e-155

79.04

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPKKRTK KRNPNSDVGSG DSS SSS++LLKS+KEPPRDFFPSKDDLAAL TVL IA LVFV+CNFFVSRLSSRHP PFCDTDADSLD LSDVCEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKL EWLES LCE+NAKFLCDGIGIVWVKE++IWDDLDGKELV+SIGSDNTTLMYAKSKALETIG
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         L QTRQNS GIKELKCPDLLAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL++RQ LTNRAEDLYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVE
                              VEELVQEDSRIDRYPRLVKGDGKEVWEWQ E
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVE

A0A5A7T509 MSC domain-containing protein

1.5e-168

78.03

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPKKRTK KRNPNSDVGSG DSS SSS++LLKS+KEPPRDFFPSKDDLAAL TVL IA LVFV+CNFFVSRLSSRHP PFCDTDADSLD LSDVCEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKL EWLES LCE+NAKFLCDGIGIVWVKE++IWDDLDGKELV+SIGSDNTTLMYAKSKALETIG
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         L QTRQNS GIKELKCPDLLAESYKPF CRI HWVLQHAFVVLPV LLLVGCTWLLWKL++RQ LTNRAEDLYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIENGGS
                              VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSK+KKLASKS+S       KA+GV+ D MYHKIENG S
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSR------KAMGVSTDRMYHKIENGGS

A0A6J1E026 uncharacterized protein LOC111026156 isoform X1

8.8e-156

72.02

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        MSSTPK+R K K NP+SD GS GDSSASSSTVLLKS+K+PPRDFFPS++DL  L TVLFIACLVF++CNFFVSRL+SR P PFCDTDADSLD LSD C+P
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CP HGECR G+LEC+ GYRKHGRLCIEDGVINEAV KL EWLES LCEANAKF+CDG+G VWVKED+IWDDLDG+ LV++IGSDNTT MYAK KALETI 
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         LFQT+QNSLGI+ELKCPDLLAESYKPF CRIHHWVL+HAFVVLPV LLLVGCTWLLWKL++RQ+LTNRAE+LYNQ                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSRKAMGVSTDRMYHKIE
                              VEELVQEDSRIDRYPRLVKG+GKEVWEWQVEGSLSSSKEK+LASK SSR AM V++DR+Y K++
Subjt:  ----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSRKAMGVSTDRMYHKIE

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT5G46560.1 CONTAINS InterPro DOMAIN/s: Inner nuclear membrane protein MAN1 (InterPro:IPR018996); Has 58 Blast hits to 58 proteins in 29 species: Archae - 0; Bacteria - 4; Metazoa - 11; Fungi - 15; Plants - 20; Viruses - 0; Other Eukaryotes - 8 (source: NCBI BLink).

2.9e-71

38.16

Show/hide

Query:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP
        M S P+KR      P S+  +G    +SSS+  ++S+ EPP+  FPSK +   L  VL +AC V  TCNF    LSS   + FCD++ + +D   D+CEP
Subjt:  MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEP

Query:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG
        CP +GEC  GKL+C  GY+    LC+EDG INE+  KLV + E ++CE+ A   C G G +WV E+++W +L     + ++  D +   + K KA+E + 
Subjt:  CPRHGECRDGKLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIG

Query:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------
         L + R NS GI ELKCP+ +A+SYKP  CR+H W+L+H  ++     +LVG   L  ++ ++Q  + R E+LY+Q                        
Subjt:  RLFQTRQNSLGIKELKCPDLLAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQ------------------------

Query:  -----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSK-EKKLASKSSSRKAMGVST
                               VEEL++EDSRIDRY +L+KG+ K VWEWQVEGSLS SK +K+  ++   RK++  ST
Subjt:  -----------------------VEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSK-EKKLASKSSSRKAMGVST

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGTCTTCAACTCCGAAGAAGCGAACGAAATTCAAGCGTAATCCGAACTCCGATGTCGGTTCTGGAGGCGATTCCTCTGCTTCATCTTCTACAGTGTTGCTGAAGTCTAT
CAAGGAACCGCCTCGCGATTTCTTCCCCTCGAAGGATGATCTTGCTGCGCTATTTACTGTACTTTTCATCGCCTGCTTGGTTTTTGTGACTTGTAACTTCTTCGTATCTA
GACTTTCAAGTCGCCACCCGAGGCCTTTCTGTGATACCGACGCCGATTCTTTGGATTTTCTTTCTGATGTTTGTGAGCCTTGTCCAAGGCATGGAGAATGTCGTGATGGT
AAGTTGGAATGCCTTCATGGTTATAGAAAGCATGGAAGGTTATGTATAGAAGATGGAGTAATCAATGAAGCAGTTAATAAACTTGTAGAATGGCTAGAATCTCGCCTCTG
TGAAGCAAATGCCAAGTTTTTATGCGATGGAATTGGGATAGTTTGGGTTAAAGAGGACAATATATGGGATGATCTAGATGGTAAAGAACTGGTGGACAGTATTGGCTCTG
ACAATACCACTCTTATGTATGCAAAGAGCAAGGCGTTGGAAACTATTGGTAGGTTATTTCAGACGCGACAAAATTCTCTTGGGATCAAGGAATTGAAATGCCCAGATCTG
CTAGCTGAAAGTTACAAGCCTTTTCGTTGCCGTATTCATCACTGGGTTTTGCAGCATGCTTTTGTTGTTTTACCAGTTCTCTTACTGCTTGTGGGATGCACATGGTTACT
ATGGAAACTTTTCCAAAGACAATATCTAACAAATAGAGCTGAAGATCTGTACAACCAGGTAGAGGAGTTGGTTCAGGAAGACTCACGAATAGATCGTTACCCGAGACTAG
TTAAGGGTGATGGAAAAGAAGTATGGGAATGGCAAGTAGAAGGCTCTTTGAGCTCTTCTAAGGAAAAGAAACTGGCCAGCAAATCCAGTTCCAGGAAGGCAATGGGAGTA
AGTACTGATCGAATGTATCATAAAATAGAGAACGGTGGATCCTGTAGATTAGCTGGATCATCTGTCTAG

mRNA sequence

Show/hide mRNA sequence

AAAGAAGCTGTAAGAGAAGGCAGGCGCAGGCCGTGAAGAACGACGTTAATCGATGTCTTCAACTCCGAAGAAGCGAACGAAATTCAAGCGTAATCCGAACTCCGATGTCG
GTTCTGGAGGCGATTCCTCTGCTTCATCTTCTACAGTGTTGCTGAAGTCTATCAAGGAACCGCCTCGCGATTTCTTCCCCTCGAAGGATGATCTTGCTGCGCTATTTACT
GTACTTTTCATCGCCTGCTTGGTTTTTGTGACTTGTAACTTCTTCGTATCTAGACTTTCAAGTCGCCACCCGAGGCCTTTCTGTGATACCGACGCCGATTCTTTGGATTT
TCTTTCTGATGTTTGTGAGCCTTGTCCAAGGCATGGAGAATGTCGTGATGGTAAGTTGGAATGCCTTCATGGTTATAGAAAGCATGGAAGGTTATGTATAGAAGATGGAG
TAATCAATGAAGCAGTTAATAAACTTGTAGAATGGCTAGAATCTCGCCTCTGTGAAGCAAATGCCAAGTTTTTATGCGATGGAATTGGGATAGTTTGGGTTAAAGAGGAC
AATATATGGGATGATCTAGATGGTAAAGAACTGGTGGACAGTATTGGCTCTGACAATACCACTCTTATGTATGCAAAGAGCAAGGCGTTGGAAACTATTGGTAGGTTATT
TCAGACGCGACAAAATTCTCTTGGGATCAAGGAATTGAAATGCCCAGATCTGCTAGCTGAAAGTTACAAGCCTTTTCGTTGCCGTATTCATCACTGGGTTTTGCAGCATG
CTTTTGTTGTTTTACCAGTTCTCTTACTGCTTGTGGGATGCACATGGTTACTATGGAAACTTTTCCAAAGACAATATCTAACAAATAGAGCTGAAGATCTGTACAACCAG
GTAGAGGAGTTGGTTCAGGAAGACTCACGAATAGATCGTTACCCGAGACTAGTTAAGGGTGATGGAAAAGAAGTATGGGAATGGCAAGTAGAAGGCTCTTTGAGCTCTTC
TAAGGAAAAGAAACTGGCCAGCAAATCCAGTTCCAGGAAGGCAATGGGAGTAAGTACTGATCGAATGTATCATAAAATAGAGAACGGTGGATCCTGTAGATTAGCTGGAT
CATCTGTCTAG

Protein sequence

Show/hide protein sequence

MSSTPKKRTKFKRNPNSDVGSGGDSSASSSTVLLKSIKEPPRDFFPSKDDLAALFTVLFIACLVFVTCNFFVSRLSSRHPRPFCDTDADSLDFLSDVCEPCPRHGECRDG
KLECLHGYRKHGRLCIEDGVINEAVNKLVEWLESRLCEANAKFLCDGIGIVWVKEDNIWDDLDGKELVDSIGSDNTTLMYAKSKALETIGRLFQTRQNSLGIKELKCPDL
LAESYKPFRCRIHHWVLQHAFVVLPVLLLLVGCTWLLWKLFQRQYLTNRAEDLYNQVEELVQEDSRIDRYPRLVKGDGKEVWEWQVEGSLSSSKEKKLASKSSSRKAMGV
STDRMYHKIENGGSCRLAGSSV

Lsi05G000520 (gene) of Bottle gourd (USVL1VR-Ls) v1 genome