; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

Lag0030455 (gene) of Sponge gourd (AG-4) v1 genome

Gene IDLag0030455
OrganismLuffa acutangula AG-4 (Sponge gourd (AG-4) v1)
DescriptionUPF0301 protein
Genome locationchr8:47390502..47394798
RNA-Seq ExpressionLag0030455
SyntenyLag0030455
Gene Ontology termsNA
InterPro domainsIPR003774 - Protein of unknown function UPF0301


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6578309.1 hypothetical protein SDJN03_22757, partial [Cucurbita argyrosperma subsp. sororia]5.7e-18990.66Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSP NGDHS+PGDD
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD

Query:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
        AKSNNISDG+K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA++++QS +A ES+ LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
Subjt:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG

Query:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
        +RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
Subjt:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM
        GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM

XP_022939198.1 uncharacterized protein LOC111445188 isoform X2 [Cucurbita moschata]9.8e-18990.93Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSP NGDHS+PGDD
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD

Query:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
        AKSNNISD +K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA+++VQS +A ESK LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
Subjt:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG

Query:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
        +RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
Subjt:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM
        GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM

XP_022993089.1 uncharacterized protein LOC111489210 isoform X1 [Cucurbita maxima]3.3e-18482.02Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPG----------
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSPG          
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPG----------

Query:  --------------------------------NGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESK
                                        NGDHS+PGDDAKSNNISDG+K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA+++VQS +A ESK
Subjt:  --------------------------------NGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESK

Query:  PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK
         LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG+RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK
Subjt:  PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK

Query:  SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSR
        SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSR
Subjt:  SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSR

Query:  KPKQDM
        KPKQDM
Subjt:  KPKQDM

XP_022993090.1 uncharacterized protein LOC111489210 isoform X2 [Cucurbita maxima]2.0e-18991.21Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSP NGDHS+PGDD
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD

Query:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
        AKSNNISDG+K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA+++VQS +A ESK LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
Subjt:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG

Query:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
        +RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
Subjt:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM
        GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM

XP_023550640.1 uncharacterized protein LOC111808722 isoform X2 [Cucurbita pepo subsp. pepo]2.6e-18990.93Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSP NGDHS+PGDD
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD

Query:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
        AKSNNISDG+K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA++++QS +A ESK LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
Subjt:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG

Query:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
        +RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
Subjt:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM
        GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM

TrEMBL top hitse value%identityAlignment
A0A5A7T638 UPF0301 protein4.0e-18085.95Show/hide
Query:  MDLFAVNVKNTAT-------PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDH
        MDLFA NVKNTA        P+PFSLKHSFPDRPIS  LA T+RRFSSS+PFGAELLRLLEIR+F+PKL     +S +FL+RA AKKNHDNSPSP NGDH
Subjt:  MDLFAVNVKNTAT-------PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDH

Query:  SIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVI
        S+PGDDAKS NISDGN++NETSS+K HH+NLDWREFRANLFAREQAEKVEA+V  Q+A+A ESK L LKWAHPIP+PETGCVLVATEKLDGVRTFERTV+
Subjt:  SIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVI

Query:  LLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQ
        LLLRSG+RHPQEGPFGVVINRPLHKKIKHMKPTN+DLATTFS+CSLHFGGPLEASMFLLKTGEKSKLHGFEEV+PGLCFGARNSLDEAAVLVKKGILKPQ
Subjt:  LLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQ

Query:  DFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM
        DFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLI G +SDSSSEGLWEEILQLMGGHYSELSRKPKQDM
Subjt:  DFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM

A0A6J1FG48 uncharacterized protein LOC111445188 isoform X17.8e-18481.77Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPG----------
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSPG          
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPG----------

Query:  --------------------------------NGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESK
                                        NGDHS+PGDDAKSNNISD +K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA+++VQS +A ESK
Subjt:  --------------------------------NGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESK

Query:  PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK
         LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG+RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK
Subjt:  PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK

Query:  SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSR
        SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSR
Subjt:  SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSR

Query:  KPKQDM
        KPKQDM
Subjt:  KPKQDM

A0A6J1FL02 uncharacterized protein LOC111445188 isoform X24.7e-18990.93Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSP NGDHS+PGDD
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD

Query:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
        AKSNNISD +K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA+++VQS +A ESK LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
Subjt:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG

Query:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
        +RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
Subjt:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM
        GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM

A0A6J1JXJ8 uncharacterized protein LOC111489210 isoform X29.6e-19091.21Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSP NGDHS+PGDD
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDD

Query:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
        AKSNNISDG+K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA+++VQS +A ESK LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG
Subjt:  AKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG

Query:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
        +RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV
Subjt:  TRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFV

Query:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM
        GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSRKPKQDM
Subjt:  GYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPKQDM

A0A6J1JZ91 uncharacterized protein LOC111489210 isoform X11.6e-18482.02Show/hide
Query:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPG----------
        MDLFAVNVKNTAT P PFSLKHSFPDRPIS  LAK +RRFS SHPFGA+LLRLLEIR+FRP++CS  S SRSFL+RAIAKKN DNSPSPG          
Subjt:  MDLFAVNVKNTAT-PTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPG----------

Query:  --------------------------------NGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESK
                                        NGDHS+PGDDAKSNNISDG+K+NETSS+K+HHINLDWREFRANLF+REQAEKVEA+++VQS +A ESK
Subjt:  --------------------------------NGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESK

Query:  PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK
         LGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSG+RHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK
Subjt:  PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEK

Query:  SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSR
        SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGG YSELSR
Subjt:  SKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSR

Query:  KPKQDM
        KPKQDM
Subjt:  KPKQDM

SwissProt top hitse value%identityAlignment
A1BEV6 UPF0301 protein Cpha266_08851.3e-1828.12Show/hide
Query:  ETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCS--LHFGGPLEASMFLLKTGEKSKLHGFEEVIP
        ++G +L+A+  L     F+RTV+++      H + G  G ++NRP+  K+        +    F +    LH GGP++             + G  E+ P
Subjt:  ETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCS--LHFGGPLEASMFLLKTGEKSKLHGFEEVIP

Query:  GLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK
        GL +G     ++ + L+  G+++P + RFF+GY+GW   QL EE E   WY+A  S ++I   A     E +W   ++  GG Y  ++  P+
Subjt:  GLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK

B3QMC9 UPF0301 protein Cpar_06625.0e-1828.12Show/hide
Query:  ETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIP
        + G +L+A+  L     F+RTV+L+      H  EG  G ++N+P+  K+        +  + F   D  LH GGP++             +   +EV+P
Subjt:  ETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIP

Query:  GLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK
        GL +G     ++ + L+  G+++P + RFF+GYAGW   QL++E E   WY A  S+  +         E +W   ++  GG Y  ++  P+
Subjt:  GLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK

Q3AQ69 UPF0301 protein Cag_16011.1e-2031.21Show/hide
Query:  FERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKK
        F+RTV+L+      H +EG  G ++NRPL  K++       D+     D  LH GGP++ +           +H  +EV+PG+ +G     DE + L+  
Subjt:  FERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKK

Query:  GILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK
        G++ P + RF++GYAGW   QL  E E   WY A  + ++I   A     E +W   ++  GG Y  ++  P+
Subjt:  GILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK

Q3B561 UPF0301 protein Plut_06374.5e-1929.14Show/hide
Query:  FERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLV
        F+RTV+++      H  +G  G ++NRP+  +++       +    F   D  LH GGP++++           + G E+++PGL +G     +E   L+
Subjt:  FERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLV

Query:  KKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK
          G+LKP + RFF+GYAGW   QL  E E   WY A  +  ++  G      E +W   ++  GG Y  ++  P+
Subjt:  KKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK

Q8KEM4 UPF0301 protein CT06635.0e-1830.29Show/hide
Query:  FERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLV
        F+RTV+L+      H +EG  G ++N+P+  K+        +  + F   D  LH GGP++     +       + G  EVIPGL +G     ++ + L+
Subjt:  FERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFS--DCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLV

Query:  KKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK
          G++K  + RFF+GYAGW   QL  E E   WY A  SS  +         E +W   ++  GG Y  ++  P+
Subjt:  KKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMGGHYSELSRKPK

Arabidopsis top hitse value%identityAlignment
AT1G33780.1 Protein of unknown function (DUF179)3.5e-12067.88Show/hide
Query:  FSSSHP-----FGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANL
        FSSS P     F  +L   LE R    K+ ++P   RS ++RA +KK++D+S S        PGD ++ N  S+GNK+ ++++ KS  +N DWREFRANL
Subjt:  FSSSHP-----FGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDDAKSNNISDGNKTNETSSQKSHHINLDWREFRANL

Query:  FAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATT
        F +EQ EK EAE         ES+P+GLKWAHPIP PETGCVLVATEKLDG RTF RTV+LLLR+GTRHPQEGPFGVVINRPLHK IKHMK T  +LATT
Subjt:  FAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKIKHMKPTNLDLATT

Query:  FSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGAS
        FS+CSL+FGGPLEASMFLLKTG+K+K+ GFEEV+PGL FG RNSLDEAAVLVKKG+LKPQ+FRFFVGYAGWQLDQLREEIESDYW+VAACSS+LICG   
Subjt:  FSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICGGAS

Query:  DSSSEGLWEEILQLMGGHYSELSRKPKQDM
         +SSE LWEEILQLMGG YSELSRKPK D+
Subjt:  DSSSEGLWEEILQLMGGHYSELSRKPKQDM

AT3G19780.1 LOCATED IN: endomembrane system9.0e-1530.04Show/hide
Query:  NNISDGNKTNETSSQKSHHINLDWREF-RANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTR
        N   + NK +++SS   ++   D  +     L  RE AE+   EVN    ++Q      L  A   P  +TG VLVATEKL    TF ++ IL++++G  
Subjt:  NNISDGNKTNETSSQKSHHINLDWREF-RANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTR

Query:  HPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRF
         P+ G  G++ N+ +  K     P   + A    +  L FGGP+       + L +  + S  H   E+ PG+ F    S+      +K   L P ++ F
Subjt:  HPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRF

Query:  FVGYAGWQLDQLREEIESDYWYV
        F+GY+ W  +QL +EI    W V
Subjt:  FVGYAGWQLDQLREEIESDYWYV

AT3G19780.2 LOCATED IN: endomembrane system9.0e-1530.04Show/hide
Query:  NNISDGNKTNETSSQKSHHINLDWREF-RANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTR
        N   + NK +++SS   ++   D  +     L  RE AE+   EVN    ++Q      L  A   P  +TG VLVATEKL    TF ++ IL++++G  
Subjt:  NNISDGNKTNETSSQKSHHINLDWREF-RANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTR

Query:  HPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRF
         P+ G  G++ N+ +  K     P   + A    +  L FGGP+       + L +  + S  H   E+ PG+ F    S+      +K   L P ++ F
Subjt:  HPQEGPFGVVINRPLHKKIKHMKPTNLDLATTFSDCSLHFGGPLE----ASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRF

Query:  FVGYAGWQLDQLREEIESDYWYV
        F+GY+ W  +QL +EI    W V
Subjt:  FVGYAGWQLDQLREEIESDYWYV

AT3G29240.1 Protein of unknown function (DUF179)1.3e-5048.12Show/hide
Query:  DWREFRANLFAREQAEKVEAEVNVQS-----ADAQESK----PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRP
        DWREFRA L A EQA   E +    S      D Q S      +G KWAH I  PETGC+L+ATEKLDGV  FE+TVILLL  G      GP GV++NRP
Subjt:  DWREFRANLFAREQAEKVEAEVNVQS-----ADAQESK----PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRP

Query:  LHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLR
            IK  K T LD+A TFSD  L FGGPLE  +FL+        E  K   F +V+ GL +G R S+  AA +VK+ ++   + RFF GY GW+ +QL+
Subjt:  LHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLR

Query:  EEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMG
         EI   YW VAACSS ++  G S   S GLW+E+L L+G
Subjt:  EEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMG

AT3G29240.2 Protein of unknown function (DUF179)1.3e-5048.12Show/hide
Query:  DWREFRANLFAREQAEKVEAEVNVQS-----ADAQESK----PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRP
        DWREFRA L A EQA   E +    S      D Q S      +G KWAH I  PETGC+L+ATEKLDGV  FE+TVILLL  G      GP GV++NRP
Subjt:  DWREFRANLFAREQAEKVEAEVNVQS-----ADAQESK----PLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRP

Query:  LHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLR
            IK  K T LD+A TFSD  L FGGPLE  +FL+        E  K   F +V+ GL +G R S+  AA +VK+ ++   + RFF GY GW+ +QL+
Subjt:  LHKKIKHMKPTNLDLATTFSDCSLHFGGPLEASMFLLK-----TGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLR

Query:  EEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMG
         EI   YW VAACSS ++  G S   S GLW+E+L L+G
Subjt:  EEIESDYWYVAACSSNLICGGASDSSSEGLWEEILQLMG


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGATCTCTTTGCTGTAAATGTCAAGAACACCGCCACCCCTACCCCCTTCTCACTCAAACACTCCTTTCCCGATAGACCCATTTCTTCCATTTTGGCGAAGACTACAAG
GAGATTCTCTTCTTCACATCCCTTTGGCGCTGAACTTCTGCGCCTGCTTGAGATCCGACTATTCAGGCCCAAGCTCTGCTCTACCCCTTCTGCTTCTCGCTCTTTTCTGC
TCAGGGCGATTGCCAAGAAGAATCACGACAATTCTCCCTCTCCTGGAAATGGAGATCACTCAATTCCTGGAGATGACGCTAAATCAAACAATATCTCTGATGGCAACAAA
ACTAATGAAACTTCTTCCCAGAAATCGCACCATATTAATTTGGACTGGCGAGAATTCAGAGCAAACCTATTTGCTCGTGAGCAGGCAGAAAAGGTGGAAGCTGAAGTGAA
CGTGCAGAGTGCAGATGCTCAGGAATCTAAGCCTCTTGGCCTGAAGTGGGCACATCCTATTCCTGTACCTGAGACTGGCTGTGTCCTTGTTGCCACAGAGAAGTTGGATG
GTGTACGCACTTTTGAGCGAACAGTCATCCTTCTCCTCAGATCTGGAACCAGACATCCTCAGGAGGGGCCTTTCGGGGTTGTGATTAATCGCCCACTCCACAAAAAGATC
AAGCATATGAAACCAACCAATCTTGATTTAGCAACTACATTTTCTGATTGCTCTCTACATTTTGGGGGGCCTCTTGAGGCGAGCATGTTTTTGCTGAAAACAGGAGAAAA
GTCGAAACTCCATGGCTTTGAAGAAGTGATCCCAGGCCTCTGCTTTGGCGCTCGAAACAGCCTCGATGAAGCTGCGGTGCTGGTGAAGAAGGGAATCCTTAAACCTCAGG
ATTTCAGATTCTTTGTGGGTTATGCTGGGTGGCAACTGGATCAACTGAGGGAGGAGATTGAATCAGATTACTGGTATGTGGCAGCTTGTAGCTCAAATCTAATTTGTGGA
GGCGCATCAGATTCCTCATCAGAGGGACTGTGGGAGGAGATTTTGCAGTTAATGGGTGGTCACTATTCAGAGTTGAGCAGAAAGCCTAAGCAAGATATGTAG
mRNA sequenceShow/hide mRNA sequence
ATGGATCTCTTTGCTGTAAATGTCAAGAACACCGCCACCCCTACCCCCTTCTCACTCAAACACTCCTTTCCCGATAGACCCATTTCTTCCATTTTGGCGAAGACTACAAG
GAGATTCTCTTCTTCACATCCCTTTGGCGCTGAACTTCTGCGCCTGCTTGAGATCCGACTATTCAGGCCCAAGCTCTGCTCTACCCCTTCTGCTTCTCGCTCTTTTCTGC
TCAGGGCGATTGCCAAGAAGAATCACGACAATTCTCCCTCTCCTGGAAATGGAGATCACTCAATTCCTGGAGATGACGCTAAATCAAACAATATCTCTGATGGCAACAAA
ACTAATGAAACTTCTTCCCAGAAATCGCACCATATTAATTTGGACTGGCGAGAATTCAGAGCAAACCTATTTGCTCGTGAGCAGGCAGAAAAGGTGGAAGCTGAAGTGAA
CGTGCAGAGTGCAGATGCTCAGGAATCTAAGCCTCTTGGCCTGAAGTGGGCACATCCTATTCCTGTACCTGAGACTGGCTGTGTCCTTGTTGCCACAGAGAAGTTGGATG
GTGTACGCACTTTTGAGCGAACAGTCATCCTTCTCCTCAGATCTGGAACCAGACATCCTCAGGAGGGGCCTTTCGGGGTTGTGATTAATCGCCCACTCCACAAAAAGATC
AAGCATATGAAACCAACCAATCTTGATTTAGCAACTACATTTTCTGATTGCTCTCTACATTTTGGGGGGCCTCTTGAGGCGAGCATGTTTTTGCTGAAAACAGGAGAAAA
GTCGAAACTCCATGGCTTTGAAGAAGTGATCCCAGGCCTCTGCTTTGGCGCTCGAAACAGCCTCGATGAAGCTGCGGTGCTGGTGAAGAAGGGAATCCTTAAACCTCAGG
ATTTCAGATTCTTTGTGGGTTATGCTGGGTGGCAACTGGATCAACTGAGGGAGGAGATTGAATCAGATTACTGGTATGTGGCAGCTTGTAGCTCAAATCTAATTTGTGGA
GGCGCATCAGATTCCTCATCAGAGGGACTGTGGGAGGAGATTTTGCAGTTAATGGGTGGTCACTATTCAGAGTTGAGCAGAAAGCCTAAGCAAGATATGTAG
Protein sequenceShow/hide protein sequence
MDLFAVNVKNTATPTPFSLKHSFPDRPISSILAKTTRRFSSSHPFGAELLRLLEIRLFRPKLCSTPSASRSFLLRAIAKKNHDNSPSPGNGDHSIPGDDAKSNNISDGNK
TNETSSQKSHHINLDWREFRANLFAREQAEKVEAEVNVQSADAQESKPLGLKWAHPIPVPETGCVLVATEKLDGVRTFERTVILLLRSGTRHPQEGPFGVVINRPLHKKI
KHMKPTNLDLATTFSDCSLHFGGPLEASMFLLKTGEKSKLHGFEEVIPGLCFGARNSLDEAAVLVKKGILKPQDFRFFVGYAGWQLDQLREEIESDYWYVAACSSNLICG
GASDSSSEGLWEEILQLMGGHYSELSRKPKQDM