CuGenDBv2

Gene ID	MC04g1978
Organism	Momordica charantia cv. Dali-11 (Bitter gourd (Dali-11) v1)
Description	DNA-directed RNA polymerase II protein
Genome location	MC04:26555858..26563603
RNA-Seq Expression	MC04g1978
Synteny	MC04g1978
Gene Ontology terms	GO:0035493 - SNARE complex assembly (biological process) GO:0000323 - lytic vacuole (cellular component) GO:0005768 - endosome (cellular component) GO:0000149 - SNARE binding (molecular function)
InterPro domains	IPR018791 - UV radiation resistance protein/autophagy-related protein 14

Homology

Show/hide homology

GenBank top hits

e value

%identity

Alignment

KAG7015913.1 hypothetical protein SDJN02_21017 [Cucurbita argyrosperma subsp. argyrosperma]

1.56e-293

87.79

Show/hide

Query:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL
        NRKFCNCAICENSNQA IC  CVN+RLNDYNSTLKSL+ RRD LYSRLSDVLVAKGKADDQLNWR+TRNEKL+RLREKL+R REQLE+GKAEIEMTSYDL
Subjt:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL

Query:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL
        KLK+AMLESARSVLEKQRVEQLEK+YPDLISTK LGHMAITSERLHKQSVVVKQICKLFPQRRVLV G+  EG GEQFDQICNV LPRRLDPHSV P+EL
Subjt:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL

Query:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF
        +ASLGYMVQLLNLIV NLAAPALHNSGFAGSCSRIWQR+SYW+A PSS+SNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ SF
Subjt:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF

Query:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM
        NYSSAS HSIETHKDLQ GIALLKKSVACITAY YNSL LDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM SSRSPKHVQKLNKSAWNV+S   SSM
Subjt:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM

Query:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR
        LL+S H+ IMK N ESN PSSA+SYLYATEFSD  KND +IEGWDL+EHPTFPPPPSQAEDIEHWTRAMFIDAT+
Subjt:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR

XP_008441240.1 PREDICTED: uncharacterized protein LOC103485428 isoform X2 [Cucumis melo]

6.15e-292

86.19

Show/hide

Query:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
        M NRKFCNCAICENSNQA ICT CVN RLNDYN++LKSL+ARRD LYSRLSDVLVAKGKADDQLNWRVTRNEKL RLREKL+RSREQLE+GKAEIEM S+
Subjt:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY

Query:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
        DL+LKYAMLESARSVLEKQRVEQLEK+YPDLISTKNLGHMAITSERLHKQSVV+KQ+CKLFPQRRVLV G K  G GE FDQICNV LPR LDPHSV P 
Subjt:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN

Query:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
        EL+ASLGYMVQLLNL+VQ LAAPALHNSGFAGSCSRIWQRDSYWNA PSSRSNEYP+F+PRQ+YCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ 
Subjt:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS

Query:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
        SFNYSSASPHSIE+HKDLQKGIALLKKSVAC+TAY YNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM+SSRS KH+QK  KS WNV+S   S
Subjt:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS

Query:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
        SML +S H+ IMK N ESNLPSSA+SYLYATEFSD GKND +IEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDAT++
Subjt:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

XP_022152465.1 uncharacterized protein LOC111020186 isoform X1 [Momordica charantia]

0.0

100

Show/hide

Query:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
        MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
Subjt:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY

Query:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
        DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
Subjt:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN

Query:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
        ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
Subjt:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS

Query:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
        SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
Subjt:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS

Query:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
        SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
Subjt:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

XP_022939132.1 uncharacterized protein LOC111445131 [Cucurbita moschata]

1.52e-294

Show/hide

Query:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL
        NRKFCNCAICENSNQA IC  CVN+RLNDYNSTLKSL+ RRD LYSRLSDVLVAKGKADDQLNWRVTRNEKL+RLREKL+R REQLE+GKAEIEMTSYDL
Subjt:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL

Query:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL
        KLK+AMLESARSVLEKQRVEQLEK+YPDLISTK LGHMAITSERLHKQSVVVKQICKLFPQRRVLV G+  EG GEQFDQICNV LPRRLDPHSV P+EL
Subjt:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL

Query:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF
        +ASLGYMVQLLNLIV NLAAPALHNSGFAGSCSRIWQR+SYW+A PSS+SNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ SF
Subjt:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF

Query:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM
        NYSSAS HSIETHKDLQ GIALLKKSVACITAY YNSL LDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM SSRSPKHVQKLNKSAWNV+S   SSM
Subjt:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM

Query:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR
        LL+S H+ IMK N ESN PSSA+SYLYATEFSD  KND +IEGWDL+EHPTFPPPPSQAEDIEHWTRAMFIDAT+
Subjt:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR

XP_023549965.1 uncharacterized protein LOC111808299 [Cucurbita pepo subsp. pepo]

2.64e-295

88.21

Show/hide

Query:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL
        NRKFCNCAICENSNQA IC  CVN+RLNDYNSTLKSL+ARRD LYSRLSDVLVAKGKADDQLNWRVTRNEKL+RLREKL+R REQLE+GKAEIEMTSYDL
Subjt:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL

Query:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL
        KLK+AMLESARSVLEKQRVEQLEK+YPDLISTK LGHMAITSERLHKQSVVVKQICKLFPQRRVLV G+  EG GEQFDQICNV LPRRLDPHSV P+EL
Subjt:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL

Query:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF
        +ASLGYMVQLLNLIV NLAAPALHNSGFAGSCSRIWQR+SYW+A PSS+SNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ SF
Subjt:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF

Query:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM
        NYSSAS HSIETHKDLQ GIALLKKSVACITAY YNSL LDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM SSRSPKHVQKLNKSAWNV+S   SSM
Subjt:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM

Query:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR
        LL+S H+ IMK N ESN PSSA+SYLYATEFSD  KND +IEGWDL+EHPTFPPPPSQAEDIEHWTRAMFIDAT+
Subjt:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR

TrEMBL top hits

e value

%identity

Alignment

A0A1S3B2Y9 uncharacterized protein LOC103485428 isoform X1

4.02e-292

86.19

Show/hide

Query:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
        M NRKFCNCAICENSNQA ICT CVN RLNDYN++LKSL+ARRD LYSRLSDVLVAKGKADDQLNWRVTRNEKL RLREKL+RSREQLE+GKAEIEM S+
Subjt:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY

Query:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
        DL+LKYAMLESARSVLEKQRVEQLEK+YPDLISTKNLGHMAITSERLHKQSVV+KQ+CKLFPQRRVLV G K  G GE FDQICNV LPR LDPHSV P 
Subjt:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN

Query:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
        EL+ASLGYMVQLLNL+VQ LAAPALHNSGFAGSCSRIWQRDSYWNA PSSRSNEYP+F+PRQ+YCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ 
Subjt:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS

Query:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
        SFNYSSASPHSIE+HKDLQKGIALLKKSVAC+TAY YNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM+SSRS KH+QK  KS WNV+S   S
Subjt:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS

Query:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
        SML +S H+ IMK N ESNLPSSA+SYLYATEFSD GKND +IEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDAT++
Subjt:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

A0A1S3B3M2 uncharacterized protein LOC103485428 isoform X2

2.98e-292

86.19

Show/hide

Query:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
        M NRKFCNCAICENSNQA ICT CVN RLNDYN++LKSL+ARRD LYSRLSDVLVAKGKADDQLNWRVTRNEKL RLREKL+RSREQLE+GKAEIEM S+
Subjt:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY

Query:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
        DL+LKYAMLESARSVLEKQRVEQLEK+YPDLISTKNLGHMAITSERLHKQSVV+KQ+CKLFPQRRVLV G K  G GE FDQICNV LPR LDPHSV P 
Subjt:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN

Query:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
        EL+ASLGYMVQLLNL+VQ LAAPALHNSGFAGSCSRIWQRDSYWNA PSSRSNEYP+F+PRQ+YCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ 
Subjt:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS

Query:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
        SFNYSSASPHSIE+HKDLQKGIALLKKSVAC+TAY YNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM+SSRS KH+QK  KS WNV+S   S
Subjt:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS

Query:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
        SML +S H+ IMK N ESNLPSSA+SYLYATEFSD GKND +IEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDAT++
Subjt:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

A0A5A7T0W2 UV radiation resistance protein/autophagy-related protein 14

2.98e-292

86.19

Show/hide

Query:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
        M NRKFCNCAICENSNQA ICT CVN RLNDYN++LKSL+ARRD LYSRLSDVLVAKGKADDQLNWRVTRNEKL RLREKL+RSREQLE+GKAEIEM S+
Subjt:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY

Query:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
        DL+LKYAMLESARSVLEKQRVEQLEK+YPDLISTKNLGHMAITSERLHKQSVV+KQ+CKLFPQRRVLV G K  G GE FDQICNV LPR LDPHSV P 
Subjt:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN

Query:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
        EL+ASLGYMVQLLNL+VQ LAAPALHNSGFAGSCSRIWQRDSYWNA PSSRSNEYP+F+PRQ+YCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ 
Subjt:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS

Query:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
        SFNYSSASPHSIE+HKDLQKGIALLKKSVAC+TAY YNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM+SSRS KH+QK  KS WNV+S   S
Subjt:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS

Query:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
        SML +S H+ IMK N ESNLPSSA+SYLYATEFSD GKND +IEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDAT++
Subjt:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

A0A6J1DE02 uncharacterized protein LOC111020186 isoform X1

0.0

100

Show/hide

Query:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
        MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
Subjt:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY

Query:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
        DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
Subjt:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN

Query:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
        ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS
Subjt:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESS

Query:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
        SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS
Subjt:  SFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPS

Query:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
        SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
Subjt:  SMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

A0A6J1FFY6 uncharacterized protein LOC111445131

7.38e-295

Show/hide

Query:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL
        NRKFCNCAICENSNQA IC  CVN+RLNDYNSTLKSL+ RRD LYSRLSDVLVAKGKADDQLNWRVTRNEKL+RLREKL+R REQLE+GKAEIEMTSYDL
Subjt:  NRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDL

Query:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL
        KLK+AMLESARSVLEKQRVEQLEK+YPDLISTK LGHMAITSERLHKQSVVVKQICKLFPQRRVLV G+  EG GEQFDQICNV LPRRLDPHSV P+EL
Subjt:  KLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNEL

Query:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF
        +ASLGYMVQLLNLIV NLAAPALHNSGFAGSCSRIWQR+SYW+A PSS+SNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVAS+ESE+KPHL SLE+ SF
Subjt:  AASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSF

Query:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM
        NYSSAS HSIETHKDLQ GIALLKKSVACITAY YNSL LDVPSEASTFEAFAKLLATLSSSKEVRSV+SLKM SSRSPKHVQKLNKSAWNV+S   SSM
Subjt:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM

Query:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR
        LL+S H+ IMK N ESN PSSA+SYLYATEFSD  KND +IEGWDL+EHPTFPPPPSQAEDIEHWTRAMFIDAT+
Subjt:  LLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATR

SwissProt top hits	e value	%identity	Alignment
No hits found

Arabidopsis top hits

e value

%identity

Alignment

AT1G77890.1 DNA-directed RNA polymerase II protein

8.5e-114

52.33

Show/hide

Query:  KFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDLKL
        K   CA+C  S +  IC  CVN  LN+Y   L SLK+ R+  Y RLS +LV K KA  Q  W+  +NEKLA+LREKLQ   E+L++ K      S +LK 
Subjt:  KFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDLKL

Query:  KYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNELAA
        +Y ++ES    LE+ RV QLE  Y D I    L ++ +TSERL+KQ++V+KQICKLFP  RV V+GQ  +G+  Q+DQICN  LP+ L+P SVPP ELAA
Subjt:  KYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNELAA

Query:  SLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEK--KPHLGSLESSSF
        SLGYMVQLLNL+V  L+ PALHN GFAGSCSRIW+RDSYWN+ PSS SN YPLF+P  ++ S   ++SW+ + ++NFGV S++S+   +     L+    
Subjt:  SLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEK--KPHLGSLESSSF

Query:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM
        + SSASPHS+ET ++LQ+GIA LK+SVA +T Y Y SLSL+VPS  STFE FAKLLATLSS KEV+S  SL + SS   +H  + NKS WN++S   SS 
Subjt:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM

Query:  LLDSVHTL-IMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHP
        LL+S HT     N+   N+P+   SY+   EF DV K+  SI  W+LVE+P
Subjt:  LLDSVHTL-IMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHP

AT1G77890.2 DNA-directed RNA polymerase II protein

3.5e-107

50.78

Show/hide

Query:  KFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDLKL
        K   CA+C  S +  IC  CVN  LN+Y   L SLK+ R+  Y RLS +LV K KA  Q  W+  +NEKLA+LREKLQ   E+L++ K      S +LK 
Subjt:  KFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDLKL

Query:  KYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNELAA
        +Y ++ES    LE+ RV QLE  Y D I    L +           ++V+KQICKLFP  RV V+GQ  +G+  Q+DQICN  LP+ L+P SVPP ELAA
Subjt:  KYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNELAA

Query:  SLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEK--KPHLGSLESSSF
        SLGYMVQLLNL+V  L+ PALHN GFAGSCSRIW+RDSYWN+ PSS SN YPLF+P  ++ S   ++SW+ + ++NFGV S++S+   +     L+    
Subjt:  SLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEK--KPHLGSLESSSF

Query:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM
        + SSASPHS+ET ++LQ+GIA LK+SVA +T Y Y SLSL+VPS  STFE FAKLLATLSS KEV+S  SL + SS   +H  + NKS WN++S   SS 
Subjt:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM

Query:  LLDSVHTL-IMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHP
        LL+S HT     N+   N+P+   SY+   EF DV K+  SI  W+LVE+P
Subjt:  LLDSVHTL-IMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHP

AT1G77890.3 DNA-directed RNA polymerase II protein

2.1e-112

52.33

Show/hide

Query:  KFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDLKL
        K   CA+C  S +  IC  CVN  LN+Y   L SLK+ R+  Y RLS +LV K KA  Q  W+  +NEKLA+LREKLQ   E+L++ K      S +LK 
Subjt:  KFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDLKL

Query:  KYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNELAA
        +Y ++ES    LE+ RV QLE  Y D I    L  + +TSERL+KQ++V+KQICKLFP  RV V+GQ  +G+  Q+DQICN  LP+ L+P SVPP ELAA
Subjt:  KYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNELAA

Query:  SLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEK--KPHLGSLESSSF
        SLGYMVQLLNL+V  L+ PALHN GFAGSCSRIW+RDSYWN+ PSS SN YPLF+P  ++ S   ++SW+ + ++NFGV S++S+   +     L+    
Subjt:  SLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEK--KPHLGSLESSSF

Query:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM
        + SSASPHS+ET ++LQ+GIA LK+SVA +T Y Y SLSL+VPS  STFE FAKLLATLSS KEV+S  SL + SS   +H  + NKS WN++S   SS 
Subjt:  NYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSM

Query:  LLDSVHTL-IMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHP
        LL+S HT     N+   N+P+   SY+   EF DV K+  SI  W+LVE+P
Subjt:  LLDSVHTL-IMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHP

AT4G08540.1 DNA-directed RNA polymerase II protein

2.4e-180

68.68

Show/hide

Query:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY
        MT R   NCAIC+N+N+  ICT CVN+RL +YN+ LKSLK RRD L SR +++L +KGKADDQ NWR+ +NEK+++L++KL+ ++E + +GK +IE  S 
Subjt:  MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSY

Query:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN
        DLK+KY +L+SARS LEK RVEQ+EK +P+LI T++LGHMAI+SERLHKQSVVVKQICKLFP RRV  DG+   G+  Q+D ICN RLP  LDPHS+P  
Subjt:  DLKLKYAMLESARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPN

Query:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKK-PHLGSLES
        ELA SLGYMVQLLNL+V NLAAPALH+SGFAGSCSRIWQRDSYW+ R S+RSNEYPLFIPR+NYCSTS ENSW+DK+SSNFGVASMES++K P L S  S
Subjt:  ELAASLGYMVQLLNLIVQNLAAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKK-PHLGSLES

Query:  SSFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFP
        +SF YSSASPHSIE+H+DLQKGIALLKKSVAC+TAY YNSL L+VP EASTFEAFAKLLATLSSSKEVRSV+SLKM SSRS K  Q+LNKS WN  S   
Subjt:  SSFNYSSASPHSIETHKDLQKGIALLKKSVACITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFP

Query:  SSMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK
        SS LL+S H  + +N   +  P+S ASYL ATE S    ND  + GWDLVEHP +PPPPSQ+ED+EHWTRAMFIDA +K
Subjt:  SSMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKNDCSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

Sequences

Show/hide sequences

CDS sequence

Show/hide CDS sequence

ATGACGAATCGAAAGTTCTGCAACTGTGCTATCTGTGAGAATTCAAATCAAGCTTTCATTTGCACTATTTGCGTTAATTACAGATTGAATGACTACAACTCAACGTTAAA
ATCATTGAAAGCTCGGCGGGATTGGTTGTATTCGAGGCTGAGTGACGTGCTTGTGGCAAAGGGTAAGGCAGACGATCAATTAAACTGGAGAGTGACTCGGAATGAGAAAC
TTGCAAGGTTAAGGGAGAAACTCCAACGTAGTAGAGAGCAACTCGAGCGAGGGAAGGCTGAGATTGAGATGACGTCCTATGATCTCAAGTTGAAATATGCAATGCTTGAA
TCAGCCCGTTCAGTGTTGGAAAAACAGCGAGTTGAACAACTGGAAAAGTCCTATCCTGACCTTATTAGCACCAAGAATCTGGGACATATGGCAATTACCTCCGAACGCCT
TCACAAGCAGTCTGTGGTTGTTAAACAAATATGCAAATTGTTTCCACAACGGCGAGTGTTGGTTGATGGACAGAAAAATGAGGGAACTGGTGAGCAATTTGATCAAATCT
GTAATGTGCGCTTACCAAGAAGACTGGATCCCCACTCTGTTCCACCAAATGAACTTGCTGCTTCTTTGGGATACATGGTGCAACTTCTAAATCTTATTGTTCAAAATTTG
GCTGCTCCTGCACTTCACAACTCAGGTTTTGCGGGTTCTTGTTCACGCATATGGCAAAGGGACTCGTATTGGAATGCTCGTCCATCTTCTCGTAGCAATGAGTATCCACT
TTTTATACCACGCCAAAACTACTGTTCAACAAGTGGGGAAAATTCATGGTCTGATAAAAGCTCTAGTAACTTTGGTGTTGCTTCGATGGAATCAGAGAAGAAACCACATT
TAGGTTCACTAGAAAGTAGTAGCTTCAATTATTCTTCAGCTTCTCCGCATTCTATTGAAACACACAAGGATTTGCAGAAAGGGATTGCCCTCCTCAAGAAAAGTGTAGCA
TGCATCACTGCATACTTTTATAACTCTCTGTCTTTAGATGTTCCTTCTGAAGCTTCTACTTTTGAAGCATTTGCTAAATTATTGGCTACTCTTTCTTCATCCAAGGAAGT
GCGTTCTGTTTATTCCCTCAAAATGGATTCTTCCAGGTCCCCTAAGCACGTTCAGAAACTGAACAAATCTGCATGGAACGTGGATTCTGACTTTCCATCAAGCATGCTGC
TCGATAGCGTGCATACGTTAATAATGAAAAACAATTGTGAGAGTAACCTTCCAAGTTCTGCTGCGAGTTACCTTTATGCCACTGAATTTTCCGATGTTGGAAAGAATGAT
TGCAGCATAGAAGGATGGGATCTCGTGGAGCATCCAACTTTTCCTCCTCCACCTTCCCAAGCTGAAGATATTGAGCATTGGACTCGAGCAATGTTCATCGATGCCACCAG
AAAGTAA

mRNA sequence

Show/hide mRNA sequence

CACGAAAGCTTATAATTTAATCTAGGATTTGTAATAAACCTTTTAAACCATATTTACACGATACCAACTCCCAAAGTTACGGGACAAAACGTACGGGCTATAATTTAACC
TACTATTTATTTATTTGAAGAAAGAACGGCGATCCAGAGTTTTCTTGTTAATGCTAAATTCCAGTTTCCAGACGATCAGCTCCCGCGGTTCAAGCTTTCCCCCACCCTTC
TGGCCCAACTTCGAATTCAGAATTTGAAGTTATCATTCCCAAAGCTTCAGCATCATCATCTGATTCAATTCCTCCGAGTAGCATGATTAGAAATTGATCGATGACGAATC
GAAAGTTCTGCAACTGTGCTATCTGTGAGAATTCAAATCAAGCTTTCATTTGCACTATTTGCGTTAATTACAGATTGAATGACTACAACTCAACGTTAAAATCATTGAAA
GCTCGGCGGGATTGGTTGTATTCGAGGCTGAGTGACGTGCTTGTGGCAAAGGGTAAGGCAGACGATCAATTAAACTGGAGAGTGACTCGGAATGAGAAACTTGCAAGGTT
AAGGGAGAAACTCCAACGTAGTAGAGAGCAACTCGAGCGAGGGAAGGCTGAGATTGAGATGACGTCCTATGATCTCAAGTTGAAATATGCAATGCTTGAATCAGCCCGTT
CAGTGTTGGAAAAACAGCGAGTTGAACAACTGGAAAAGTCCTATCCTGACCTTATTAGCACCAAGAATCTGGGACATATGGCAATTACCTCCGAACGCCTTCACAAGCAG
TCTGTGGTTGTTAAACAAATATGCAAATTGTTTCCACAACGGCGAGTGTTGGTTGATGGACAGAAAAATGAGGGAACTGGTGAGCAATTTGATCAAATCTGTAATGTGCG
CTTACCAAGAAGACTGGATCCCCACTCTGTTCCACCAAATGAACTTGCTGCTTCTTTGGGATACATGGTGCAACTTCTAAATCTTATTGTTCAAAATTTGGCTGCTCCTG
CACTTCACAACTCAGGTTTTGCGGGTTCTTGTTCACGCATATGGCAAAGGGACTCGTATTGGAATGCTCGTCCATCTTCTCGTAGCAATGAGTATCCACTTTTTATACCA
CGCCAAAACTACTGTTCAACAAGTGGGGAAAATTCATGGTCTGATAAAAGCTCTAGTAACTTTGGTGTTGCTTCGATGGAATCAGAGAAGAAACCACATTTAGGTTCACT
AGAAAGTAGTAGCTTCAATTATTCTTCAGCTTCTCCGCATTCTATTGAAACACACAAGGATTTGCAGAAAGGGATTGCCCTCCTCAAGAAAAGTGTAGCATGCATCACTG
CATACTTTTATAACTCTCTGTCTTTAGATGTTCCTTCTGAAGCTTCTACTTTTGAAGCATTTGCTAAATTATTGGCTACTCTTTCTTCATCCAAGGAAGTGCGTTCTGTT
TATTCCCTCAAAATGGATTCTTCCAGGTCCCCTAAGCACGTTCAGAAACTGAACAAATCTGCATGGAACGTGGATTCTGACTTTCCATCAAGCATGCTGCTCGATAGCGT
GCATACGTTAATAATGAAAAACAATTGTGAGAGTAACCTTCCAAGTTCTGCTGCGAGTTACCTTTATGCCACTGAATTTTCCGATGTTGGAAAGAATGATTGCAGCATAG
AAGGATGGGATCTCGTGGAGCATCCAACTTTTCCTCCTCCACCTTCCCAAGCTGAAGATATTGAGCATTGGACTCGAGCAATGTTCATCGATGCCACCAGAAAGTAATTT
AATGGGTGCCATGGAGATAGCGCGAGAGAAGTTCTTGGAACAACTCAATGCATCTCTGGTGCATGATCGATCAGCTTTGGACCTGTAAATATGGAGACTTAAAAAGGGTA
CAGATCTGAACATATTTAGATTTAGACGAACTACTACTATTATTCCATCATCTTATATTCTGGATATATTTTAGATTTAGGAAAATTTCTATTGTTGTTCTATAATCTTA
GACAATAGCCATAGTATTCGGAAAATTCTTAAATGGGTGCACATGGAGGCAGGAGTTGGGTTGTGGGGATGTGATGTCTTTCAAATGTACATATAAATTGGCTAGAACTG
GTTGAATTGAACAAAGGAACTTCAATATAATATAAAACCATCTGCATACAAACGCTATGACTCTAAGATAGCGATGCATTGTTTAGTCAAATTGTCTTGTTGAGAGCTTT
TAGTCTCCAAAACGTACAATTGGAGGCATGTCTCATTAGTCCGGAAACATAATTAGAAAGTGCTTTCACAGTTAGCATATTTCTTGCCTCTTCATTACTCTTTTACTTCT
TTCTCTTCTTTGGTGGTGGGAGGGTTTCTTCGTCCTCTTCTCCTTCAAAGTTGTCTTCTTCTTCTGCATCTGCATCATCTTCATCAACGTCTTCATCGTCCTCATTATTG
TCTTCATCGTTATCGTCGCTCCCACCATCATCATTATCGTCGTCACCACCATCACCGCTGTTATCACTTCCACCATCGTCATTATCGTTGCTGTTGCCAGCATCTCCTCC
TCCATTAGCGCCTTCTTTAATGGGGGCATTTTTACCTTCCTCTTCTCCATTTTCAAGCACATCTTCATCTTCTCCGAGATCATTATCACTGTAGTTGTTTTCATTTTCAT
TTCCTTCTCCATCCACTGGTTTCCTCTGGCATTTCCTTTTCTCGTTGGCATTCGAATTCAGGAACTGTACGCAAAAGAAATTTGAATTTCACGGGGAAGAAAAAGCTACA
ATGAATTATCAAAAAAACCAAAAGGGGACCAAAATATAAAACCAGAAAGTGACCAAATAAAATGGAACTACGGAAAGTGGGGCGTTGTCCCCTCCCTGAATCTGCATGGG
ATTCTTTCCTGGTCCACTATGGTCTGGTTAGGACAAATTTGGCCACACAGAGCTTATAGATAAAAGAAAATTGCAGCGTATCACCCATCTTATAATACTAAATGATACTT
ATCTAGTTTCAAAATTAACTATAAACGAGAAACATATCATCTGTCACTCTT

Protein sequence

Show/hide protein sequence

MTNRKFCNCAICENSNQAFICTICVNYRLNDYNSTLKSLKARRDWLYSRLSDVLVAKGKADDQLNWRVTRNEKLARLREKLQRSREQLERGKAEIEMTSYDLKLKYAMLE
SARSVLEKQRVEQLEKSYPDLISTKNLGHMAITSERLHKQSVVVKQICKLFPQRRVLVDGQKNEGTGEQFDQICNVRLPRRLDPHSVPPNELAASLGYMVQLLNLIVQNL
AAPALHNSGFAGSCSRIWQRDSYWNARPSSRSNEYPLFIPRQNYCSTSGENSWSDKSSSNFGVASMESEKKPHLGSLESSSFNYSSASPHSIETHKDLQKGIALLKKSVA
CITAYFYNSLSLDVPSEASTFEAFAKLLATLSSSKEVRSVYSLKMDSSRSPKHVQKLNKSAWNVDSDFPSSMLLDSVHTLIMKNNCESNLPSSAASYLYATEFSDVGKND
CSIEGWDLVEHPTFPPPPSQAEDIEHWTRAMFIDATRK

MC04g1978 (gene) of Bitter gourd (Dali-11) v1 genome