; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; CuGenDBv2

MS021277 (gene) of Bitter gourd (TR) v1 genome

Gene IDMS021277
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
DescriptionARM repeat superfamily protein
Genome locationscaffold358:676941..688045
RNA-Seq ExpressionMS021277
SyntenyMS021277
Gene Ontology termsGO:0043248 - proteasome assembly (biological process)
InterPro domainsIPR011989 - Armadillo-like helical
IPR016024 - Armadillo-type fold
IPR019538 - 26S proteasome non-ATPase regulatory subunit 5


Homology Show/hide homology
GenBank top hitse value%identityAlignment
KAG6607893.1 26S proteasome non-ATPase regulatory subunit 5, partial [Cucurbita argyrosperma subsp. sororia]6.7e-25587.81Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEFAVDDPTQLLEAAADFA+YPGVRTDASVKEF  RFPLPV+INALQ KAE PGLENTLVACLDRIFKTKYGAS IPH+MPF+QVGL+A+SQ VR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LLEE+D    LA QLI+DY IYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGME+IFPTN+TEATHLGT+ASTCSSLGRVRVMAL+VKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YNSNLLNLLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPRTS LQLLSSIISN S ESILRSRAMVISGRLLSKEN++ LVDESCVRILI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SAIDE LGSSEGQDVNVCESAFEALGQIGS+  GATLLLSS+ TCVK +I+AAFDRHEHGKQLAAMHALGNI GETRSENDIMLND AEENLRDL+YQ A
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRS K+ PSGL LAVLQQDSEIRLASYRMITGLV RPWCLMEICSKQ+IINIV+DASTETTKIGMEARYNCC+AIHK FMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AV+NGPYL+RR  ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

XP_022139463.1 uncharacterized protein LOC111010386 isoform X1 [Momordica charantia]4.1e-289100Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AVRNGPYLTRRNFETQPAVMTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

XP_022940916.1 uncharacterized protein LOC111446360 [Cucurbita moschata]1.6e-25688.38Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEFAVDDPTQLLEAAADFA+YPGVRTDASVKEF  RFPLPV+INALQ KAE PGLENTLVACLDRIFKTKYGAS IPH+MPF+QVGL+ADSQ VR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LLEE+D    LA QLI+DY IYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGME+IFPTN+TEATHLGT+ASTCSSLGRVRVMAL+VKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YNSNLLNLLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPRTS LQLLSSIISN S ESILRSRAMVISGRLLSKEN++ LVDESCVRILI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SAIDE LGSSEGQDVNVCESAFEALGQIGS+  GATLLLSS+ TCVK +I+AAFDRHEHGKQLAAMHALGNI GETRSENDIMLND AEENLRDL+YQ A
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRS K+ PSGL LAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQ+IINIV+DASTETTKIGMEARYNCC+AIHKAFMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AV+NGPYL+RR  ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

XP_022981236.1 uncharacterized protein LOC111480433 [Cucurbita maxima]6.7e-25587.81Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEFAVDDPTQLLEAAADFA+YPGVRTD SVKEF  RFPLPV+INALQ KAE PGLENTLVACLDRIFKTKYGAS IPH+MPF+QVGL+ADSQ VR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LLEE+D    LA QLI+DY IYPLL+ECLLNGNEQVANSSMDA+KKLAAFPKGME+IFPTN+TEATHLGT+ASTCSSLGRVRVMAL+VKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YNSNLLNLLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPRTS LQLLSSIISN S ESILRSRAMVISGRLLSKEN++ LVDESCVRILI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        S+IDE LGSSEGQDVNVCESAFEALGQIGS+  GATLLLSS+ TCVK +I+AAFDRHEHGKQLAAMHALGNI GETRSENDIMLND AEENL DL+YQ A
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRS KI PSGL LAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQ+IINIV+DASTETTKIGMEARYNCC+AIHKAFMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AV+NGPYL+RR  ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

XP_038898234.1 uncharacterized protein LOC120085959 isoform X1 [Benincasa hispida]9.3e-25788.57Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEF+VDDPT+LLEAAADFA+YPGVRTDASVKEFLDRFPLP IINALQTKAE P LENTLVACLDRIFKTKYGAS IPH+MPF+QVGLRADSQ VR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LL+ESD   +LAIQLIIDYGIYPLLL+CL+NGNEQVANSSMDAIK LAAFP GME+IFPTN+TEATHLGT+ASTCSSLGRVRVMALVVKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YN+NLL LLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTS + LLSSIISNSS ESILRSRAMVI GRLLSK+N++ LVDESCVR LI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SAID  LGSSEGQDVNVCE+AFEALGQIGS+  GATLLLSSF TCVK +I+AAFDRHEHGKQLAAMHALGNI GETRSEND+MLND AEENLRDL+YQIA
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRSSK+MPSGLFLAVLQQDSEIRLASYRM+TGLVARPWCLMEICSKQ+IINIV+DASTETTKIGMEARYNCC+AIHKAFMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AVRNGPYL RRN ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

TrEMBL top hitse value%identityAlignment
A0A0A0L246 Uncharacterized protein1.0e-24885.9Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEF+V+DPT+LL+AAA+FA+YPGVRTDASVKEFLDRFPLP IINALQTKAE PGLE+TLVACLDRIFKTKYGAS IPH+MPF+QVGL+ADSQTVR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LL+ESD  A+  IQLIIDYGIYPLLL+CLLNGNEQVANSSMD+IK LAAFP+GME+I P+N+TEATHLGT+ASTCSSLGRVRVMALVVKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YN+NLL+LLESEINNS DTLVTLSVLELLYELVEIEHGTKFLPRTS LQLL SIISNSS ESILRSRAMVI GRLLSKEN++ LVDESC+R LI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SA+D  LGSSEG+DVNV E+A EALGQIGS+  GATLLLSSF TCVK +I+AAFDRHEHGKQLAAMHALGNI GE RSENDIMLND AEENLRDL+YQIA
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRSSK+ PSGLFLAVLQQDSEIRLASYRMITGLVARPWCL EICSKQ+I+NIV DAS+ETTKIGMEARYNCC+AIHKAFMSS RLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AVRNGPYL RRN ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

A0A1S3CKC0 uncharacterized protein LOC103501781 isoform X11.1e-24785.52Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        ME+F+V+DPTQLL+AAA+FA+YPGVRTDASVKEFLDRFPLP IINALQTKAE PG+E+TLVACLDRIFKTKYGAS IPH+MPF+QVGL+ADSQTVR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LL+ESD     AIQLIIDYGIYPLLL+CLLNGNEQVANSSMD+IK LAAFP+GME+I P+N+TEATHLG +ASTCSSLGRVRVMALVVKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YN+NLL+LLESEINNS DTLVTLSVLELLYELVEIEHGTKFLPRTS LQLLSSIISNSS ESILRSRAMVI GRLLSKEN++ LVDESCVR LI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SA+D  LGSSEG+DVNV E+A EALGQIGS+  GATLLLSSF TCVK  I+ AFDRHEHGKQLAAMHALGNI GE+RSENDI+LND AEENLRDL+YQIA
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRSSK+ PSGLFLAVLQQDSEIRLASYRMITGLVARPWCL EICSKQEI+NIV DAS+ETTKIGMEARYNCC++IHKAFMSS RLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AVRNGPYL RRN ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

A0A6J1CFN3 uncharacterized protein LOC111010386 isoform X12.0e-289100Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AVRNGPYLTRRNFETQPAVMTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

A0A6J1FJQ7 uncharacterized protein LOC1114463607.7e-25788.38Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEFAVDDPTQLLEAAADFA+YPGVRTDASVKEF  RFPLPV+INALQ KAE PGLENTLVACLDRIFKTKYGAS IPH+MPF+QVGL+ADSQ VR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LLEE+D    LA QLI+DY IYPLL+ECLLNGNEQVANSSMDAIKKLAAFPKGME+IFPTN+TEATHLGT+ASTCSSLGRVRVMAL+VKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YNSNLLNLLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPRTS LQLLSSIISN S ESILRSRAMVISGRLLSKEN++ LVDESCVRILI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        SAIDE LGSSEGQDVNVCESAFEALGQIGS+  GATLLLSS+ TCVK +I+AAFDRHEHGKQLAAMHALGNI GETRSENDIMLND AEENLRDL+YQ A
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRS K+ PSGL LAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQ+IINIV+DASTETTKIGMEARYNCC+AIHKAFMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AV+NGPYL+RR  ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

A0A6J1IVZ7 uncharacterized protein LOC1114804333.2e-25587.81Show/hide
Query:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC
        MEEFAVDDPTQLLEAAADFA+YPGVRTD SVKEF  RFPLPV+INALQ KAE PGLENTLVACLDRIFKTKYGAS IPH+MPF+QVGL+ADSQ VR LAC
Subjt:  MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLAC

Query:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR
        KTVT LLEE+D    LA QLI+DY IYPLL+ECLLNGNEQVANSSMDA+KKLAAFPKGME+IFPTN+TEATHLGT+ASTCSSLGRVRVMAL+VKLFSVS 
Subjt:  KTVTFLLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSR

Query:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI
        SVASA+YNSNLLNLLESEI+NSNDTLVTLSVLELLYELVEIEHGT FLPRTS LQLLSSIISN S ESILRSRAMVISGRLLSKEN++ LVDESCVRILI
Subjt:  SVASAIYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILI

Query:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA
        S+IDE LGSSEGQDVNVCESAFEALGQIGS+  GATLLLSS+ TCVK +I+AAFDRHEHGKQLAAMHALGNI GETRSENDIMLND AEENL DL+YQ A
Subjt:  SAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIA

Query:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE
        SRS KI PSGL LAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQ+IINIV+DASTETTKIGMEARYNCC+AIHKAFMSSTRLTGDPALAGIASKLQE
Subjt:  SRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQE

Query:  AVRNGPYLTRRNFETQPAVMTAERF
        AV+NGPYL+RR  ETQPA+MTAERF
Subjt:  AVRNGPYLTRRNFETQPAVMTAERF

SwissProt top hitse value%identityAlignment
No hits found
Arabidopsis top hitse value%identityAlignment
AT3G15180.1 ARM repeat superfamily protein3.3e-16757.69Show/hide
Query:  VDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLACKTVTF
        ++D  QL +AA +FA YPG + + SVKEFLDRFPLPVI NALQT  + PG ENTLV CL+R+FKTKYGAS IP +MP +QVGL+ADS  V+ LACKTV  
Subjt:  VDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLACKTVTF

Query:  LLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSRSVASA
        LLE+ D + V ++QL+++ GIYPLLL+ ++N +++VAN++ + IK LA FP  M VIFP+   + THL  LA+ CSSL RVRV++L+VKLFS+SR VAS 
Subjt:  LLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSRSVASA

Query:  IYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILISAIDE
        +  S LL+LLE+E+  + DTLV L+VLEL YEL+E+EH ++F+P+TS++QLL SIIS +ST    + RAM+ISGRLLSKEN+Y +V+E+ V+ LISAID 
Subjt:  IYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILISAIDE

Query:  ALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIASRSSK
        +L S E  D +  E+A +ALGQ+GST +GA L+LS+     + ++ +AFDR+ HGKQLAA+HAL NI GETR +++ +++  AEE+LR L+Y  A++S+K
Subjt:  ALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIASRSSK

Query:  IMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQEAVRNG
        + PSGLFL+VLQQ SEIRLA YR +T LVARPWCL+EI +K+EIINIVTDA+TET KI MEARYNCC AIH+AF+ S     DP       KLQEAVR+G
Subjt:  IMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQEAVRNG

Query:  PYLTRRNFETQPAVMTAERF
        PY+++++   +P VMT E F
Subjt:  PYLTRRNFETQPAVMTAERF

AT3G15180.2 ARM repeat superfamily protein2.2e-16354.53Show/hide
Query:  VDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLACKTVTF
        ++D  QL +AA +FA YPG + + SVKEFLDRFPLPVI NALQT  + PG ENTLV CL+R+FKTKYGAS IP +MP +QVGL+ADS  V+ LACKTV  
Subjt:  VDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLACKTVTF

Query:  LLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSRSVASA
        LLE+ D + V ++QL+++ GIYPLLL+ ++N +++VAN++ + IK LA FP  M VIFP+   + THL  LA+ CSSL RVRV++L+VKLFS+SR VAS 
Subjt:  LLEESDNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSRSVASA

Query:  IYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDES-----------
        +  S LL+LLE+E+  + DTLV L+VLEL YEL+E+EH ++F+P+TS++QLL SIIS +ST    + RAM+ISGRLLSKEN+Y +V+E+           
Subjt:  IYNSNLLNLLESEINNSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDES-----------

Query:  ---------------------CVRILISAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNIC
                             CV+ LISAID +L S E  D +  E+A +ALGQ+GST +GA L+LS+     + ++ +AFDR+ HGKQLAA+HAL NI 
Subjt:  ---------------------CVRILISAIDEALGSSEGQDVNVCESAFEALGQIGSTNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNIC

Query:  GETRSENDIMLNDMAEENLRDLMYQIASRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCM
        GETR +++ +++  AEE+LR L+Y  A++S+K+ PSGLFL+VLQQ SEIRLA YR +T LVARPWCL+EI +K+EIINIVTDA+TET KI MEARYNCC 
Subjt:  GETRSENDIMLNDMAEENLRDLMYQIASRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQEIINIVTDASTETTKIGMEARYNCCM

Query:  AIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLTRRNFETQPAVMTAERF
        AIH+AF+ S     DP       KLQEAVR+GPY+++++   +P VMT E F
Subjt:  AIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLTRRNFETQPAVMTAERF


Sequences Show/hide sequences
CDS sequenceShow/hide CDS sequence
ATGGAGGAATTTGCAGTGGATGATCCCACTCAACTGCTCGAAGCAGCTGCGGACTTCGCAAGCTACCCCGGTGTTCGGACTGATGCCTCGGTGAAGGAATTTCTCGACCG
TTTTCCTCTCCCCGTCATCATCAATGCTTTACAAACAAAAGCAGAAACTCCTGGTCTGGAAAACACGTTGGTTGCTTGTCTCGACAGGATATTCAAAACCAAATATGGTG
CTTCCTTTATCCCACATTTTATGCCTTTTATACAGGTTGGACTGCGAGCAGATTCTCAAACAGTTAGAGATCTAGCTTGTAAAACGGTCACTTTCCTTTTAGAGGAGTCT
GATAATGATGCGGTTTTGGCCATACAACTAATTATTGACTATGGAATTTATCCACTTTTGCTCGAGTGCCTTCTGAATGGTAATGAACAAGTTGCTAACTCATCAATGGA
TGCAATAAAGAAATTGGCTGCATTTCCAAAGGGAATGGAAGTTATCTTCCCAACAAATGAAACGGAAGCAACTCACCTAGGAACTCTAGCTTCAACATGTTCATCTCTGG
GAAGAGTTCGAGTTATGGCACTGGTAGTGAAACTATTTTCTGTTTCTAGATCTGTGGCATCAGCAATATACAATTCAAATTTACTAAATCTACTGGAAAGTGAAATCAAC
AACTCAAATGACACACTTGTAACTTTAAGCGTGTTGGAACTCTTGTACGAGTTAGTGGAGATTGAACATGGTACAAAGTTCTTGCCAAGGACCAGCATTCTCCAACTACT
AAGTTCTATAATCAGCAACTCATCAACGGAGTCTATCTTAAGGTCAAGAGCAATGGTCATCAGTGGAAGACTTCTATCAAAAGAGAATATGTACTTGCTTGTAGATGAAT
CTTGCGTAAGGATTCTAATATCTGCTATAGATGAAGCTCTTGGGTCATCAGAAGGTCAAGATGTAAATGTATGTGAATCTGCATTTGAAGCACTGGGTCAAATAGGGTCA
ACTAATCGGGGAGCTACTTTACTGCTGTCAAGTTTCTCAACTTGTGTGAAGCTTTTAATTCATGCAGCATTTGATCGGCATGAACATGGTAAACAGCTGGCAGCCATGCA
TGCTCTTGGCAATATCTGTGGAGAAACCCGATCTGAGAATGATATTATGCTGAATGATATGGCAGAAGAAAATTTGCGGGACTTGATGTATCAAATTGCATCCAGAAGTT
CAAAAATTATGCCATCAGGCCTTTTTCTAGCTGTCCTTCAGCAGGACTCTGAGATTCGACTGGCGAGTTATAGAATGATAACTGGGTTGGTGGCTCGACCTTGGTGCCTT
ATGGAAATCTGCTCGAAACAAGAAATAATAAATATAGTGACTGATGCAAGTACTGAGACTACGAAAATAGGAATGGAAGCTAGATATAATTGTTGTATGGCTATCCACAA
GGCCTTCATGTCTTCAACTAGGCTTACTGGCGATCCTGCCCTTGCAGGAATAGCTTCGAAGTTGCAGGAAGCTGTTAGAAATGGTCCATATCTTACTAGGAGGAATTTTG
AAACTCAACCAGCAGTTATGACAGCTGAGAGATTT
mRNA sequenceShow/hide mRNA sequence
ATGGAGGAATTTGCAGTGGATGATCCCACTCAACTGCTCGAAGCAGCTGCGGACTTCGCAAGCTACCCCGGTGTTCGGACTGATGCCTCGGTGAAGGAATTTCTCGACCG
TTTTCCTCTCCCCGTCATCATCAATGCTTTACAAACAAAAGCAGAAACTCCTGGTCTGGAAAACACGTTGGTTGCTTGTCTCGACAGGATATTCAAAACCAAATATGGTG
CTTCCTTTATCCCACATTTTATGCCTTTTATACAGGTTGGACTGCGAGCAGATTCTCAAACAGTTAGAGATCTAGCTTGTAAAACGGTCACTTTCCTTTTAGAGGAGTCT
GATAATGATGCGGTTTTGGCCATACAACTAATTATTGACTATGGAATTTATCCACTTTTGCTCGAGTGCCTTCTGAATGGTAATGAACAAGTTGCTAACTCATCAATGGA
TGCAATAAAGAAATTGGCTGCATTTCCAAAGGGAATGGAAGTTATCTTCCCAACAAATGAAACGGAAGCAACTCACCTAGGAACTCTAGCTTCAACATGTTCATCTCTGG
GAAGAGTTCGAGTTATGGCACTGGTAGTGAAACTATTTTCTGTTTCTAGATCTGTGGCATCAGCAATATACAATTCAAATTTACTAAATCTACTGGAAAGTGAAATCAAC
AACTCAAATGACACACTTGTAACTTTAAGCGTGTTGGAACTCTTGTACGAGTTAGTGGAGATTGAACATGGTACAAAGTTCTTGCCAAGGACCAGCATTCTCCAACTACT
AAGTTCTATAATCAGCAACTCATCAACGGAGTCTATCTTAAGGTCAAGAGCAATGGTCATCAGTGGAAGACTTCTATCAAAAGAGAATATGTACTTGCTTGTAGATGAAT
CTTGCGTAAGGATTCTAATATCTGCTATAGATGAAGCTCTTGGGTCATCAGAAGGTCAAGATGTAAATGTATGTGAATCTGCATTTGAAGCACTGGGTCAAATAGGGTCA
ACTAATCGGGGAGCTACTTTACTGCTGTCAAGTTTCTCAACTTGTGTGAAGCTTTTAATTCATGCAGCATTTGATCGGCATGAACATGGTAAACAGCTGGCAGCCATGCA
TGCTCTTGGCAATATCTGTGGAGAAACCCGATCTGAGAATGATATTATGCTGAATGATATGGCAGAAGAAAATTTGCGGGACTTGATGTATCAAATTGCATCCAGAAGTT
CAAAAATTATGCCATCAGGCCTTTTTCTAGCTGTCCTTCAGCAGGACTCTGAGATTCGACTGGCGAGTTATAGAATGATAACTGGGTTGGTGGCTCGACCTTGGTGCCTT
ATGGAAATCTGCTCGAAACAAGAAATAATAAATATAGTGACTGATGCAAGTACTGAGACTACGAAAATAGGAATGGAAGCTAGATATAATTGTTGTATGGCTATCCACAA
GGCCTTCATGTCTTCAACTAGGCTTACTGGCGATCCTGCCCTTGCAGGAATAGCTTCGAAGTTGCAGGAAGCTGTTAGAAATGGTCCATATCTTACTAGGAGGAATTTTG
AAACTCAACCAGCAGTTATGACAGCTGAGAGATTT
Protein sequenceShow/hide protein sequence
MEEFAVDDPTQLLEAAADFASYPGVRTDASVKEFLDRFPLPVIINALQTKAETPGLENTLVACLDRIFKTKYGASFIPHFMPFIQVGLRADSQTVRDLACKTVTFLLEES
DNDAVLAIQLIIDYGIYPLLLECLLNGNEQVANSSMDAIKKLAAFPKGMEVIFPTNETEATHLGTLASTCSSLGRVRVMALVVKLFSVSRSVASAIYNSNLLNLLESEIN
NSNDTLVTLSVLELLYELVEIEHGTKFLPRTSILQLLSSIISNSSTESILRSRAMVISGRLLSKENMYLLVDESCVRILISAIDEALGSSEGQDVNVCESAFEALGQIGS
TNRGATLLLSSFSTCVKLLIHAAFDRHEHGKQLAAMHALGNICGETRSENDIMLNDMAEENLRDLMYQIASRSSKIMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCL
MEICSKQEIINIVTDASTETTKIGMEARYNCCMAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLTRRNFETQPAVMTAERF