ابزار و کتابخانه هااخبارچارچوب های پردازش کلان دادههدوپ و فناوریهای مرتبط

آپاچی اَپکس : چارچوب پردازش داده سازمانی

در ادامه مباحث آشنایی با چارچوب‌های پردازش داده‌های جریانی بنیاد آپاچی، در این نوشتار به معرفی آپاچی اَپکس می‌پردازیم. شرکت DataTorrent یکی از شرکتهای فعال در حوزه پردازش جریان و مستقر در دره سیلیکون آمریکاست. این شرکت در سال ۲۰۱۵ تصمیم گرفت یکی از محصولات تجاری پردازش جریان خود را به بنیاد آپاچی واگذار کند که نتیجه آن تولد آپاچی اپکس در سال ۲۰۱۶ بود. این پروژه به عنوان جایگزینی برای استورم و اسپارک مطرح شده است.

در مقایسه با اسپارک، اپکس با قابلیت­‌های سازمانی و حرفه­‌ای پردازش رخداد، تضمین ترتیب پردازش رخدادها و تحمل خطا به صورت توکار ارائه شده است. برخلاف اسپارک که زبان اصلی آن اسکالا است، برای اپکس، آشنایی با جاوا کافیست. اپکس به خوبی می­تواند با کلاسترهای موجود هدوپ و اکوسیستم آن منطبق شود، از Yarn برای مدیریت منابع استفاده کند و HDFS را برای تحمل خطای خود استفاده کند.

اپکس به عنوان تنها موتورپردازشی سطح سازمانی متن­‌باز با قابلیت پردازش توامان داده­‌های زمان­مند و داده­‌های جریانی شناخته می­شود. اپکس بستر پردازش داده-در-حرکت است که پردازش داده­‌های نامحدود(جریان داده) و داده­-در-سکون (داده­‌های ذخیره شده یا زمان­‌مند) را به صورت همزمان ممکن می­سازد. یعنی امکانات مورد نیاز سازمان‌ها در سطح کلان را ارائه می‌دهد. امکاناتی که در ادامه به آنها اشاره خواهیم کرد. هدف اصلی اپکس، کاهش پیچیدگی­ پروژه­‌های کلان داده در یک سازمان است.

نمونه‌ای از معماری سازمانی

این موتور پردازشی، به راحتی به انواع منابع داده­‌ای موجود مانند سیستم فایل، بانک­های اطلاعاتی، پیام­رسان­‌هایی مانند کافکا متصل می­شود و چون اکثر پروژه‌­های حوزه کلان­داده با جاوا هم نوشته شده­‌اند، مشکلی در برقراری ارتباط با آنها ندارد. کتابخانه اصلی اپکس، Malhar نام دارد که حاوی عملگرهایی برای کار با انواع منابع داده­ ای و انجام انواع پردازش­ها برروی آنهاست که مجموعه این عملگرها، یک روش یکپارچه و سازمانی را برای مدیریت داده‌­ها فراهم می­کند.

مشابه با استورم و هِرون، عملگرها نقش اصلی را در معماری اَپکس دارند (منبع)

از طرفی، استفاده از Yarn در هسته اصلی اپکس برای مدیریت منابع، امکان استفاده از این کتابخانه را برای سامانه­‌های موجود هدوپ راحت­تر می­کند. نیز با توجه به تاکید بر پردازش­های زمان­‌مند و جریانی به صورت همزمان و وجود امکاناتی مانند تغییر توپولوژی شبکه بدون نیاز به متوقف کردن آن، تشخیص سریع ماشین­های دچار اشکال شده و اجرای خودکار کدهای اجرا شونده بر روی آنها و نیز قابلیت ترمیم خودکار در صورت خرابی بخشی از شبکه (امکاناتی که باعث شده اپکس به عنوان یک چارچوب پردازشی سازمانی مطرح شود)، باعث می­شود برای پروژه­‌های عمومی وکاربردهای سازمانی، بخصوص زمانی که کاربرد ترکیبی پردازش جریان و پردازش داده‌­های موجود، مد نظر ما باشد، اپکس به عنوان یک پروژه نوپا، گزینه ایده­‌آل ما خواهد بود.

مزایای اصلی اپکس در شکل زیر خلاصه شده است :

مزایای آپاچی اَپکس در یک نگاه

منبع اصلی این مقاله : راهنمای توصیفی تمامی پروژه های پردازش جریان بنیاد آپاچی

مجتبی بنائی

دانشجوی دکترای نرم‌افزار دانشگاه تهران (yun.ir/smbanaie)، مدرس دانشگاه و فعال در حوزه توسعه نرم‌افزار و مهندسی داده که تمرکز کاری خود را در چند سال اخیر بر روی مطالعه و تحقیق در حوزه کلان‌داده و زیرساخت‌های پردازش داده و تولید محتوای تخصصی و کاربردی به زبان فارسی و انتشار آنها در سایت مهندسی داده گذاشته است. مدیریت پروژه‌های نرم‌افزاری و طراحی سامانه‌های مقیاس‌پذیر اطلاعاتی از دیگر فعالیتهای صورت گرفته ایشان در چند سال گذشته است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

دکمه بازگشت به بالا