آشنایی با دیتابیس تحلیلی آپاچی دروید

وبینار کارگاه عملی آپاچی دروید - موسسه نیک آموز - یلدای ۱۴۰۰

۰ 708 زمان تقریبی مطالعه 2 دقیقه

یکی از دیتابیس‌هایی که اخیرا و به صورت روزانه با آن سروکار دارم و به کارگیری آنرا در بسیاری از شرکتهای متوسط و بزرگ ایران برای ذخیره و پاسخگویی به حجم عظیم داده‌های ورودی ، یک ضرورت میدانم ، دیتابیس تحلیلی آپاچی دروید است.

این دیتابیس که در رسته بانک‌های اطلاعاتی تحلیلی به عنوان نسل جدید دیتاویرهوس‌ها قرار میگیرد، ویژگی های کاربردی بسیار خوبی دارد. به عنوان نمونه،

یک دیتابیس تحلیلی است و ذخیره داده‌ها به صورت ستونی در آن، هم حجم داده‌ها را بسیار کم میکند و هم سرعت پاسخگویی به کوئری های تحلیلی که معمولا ترکیبی از گروه‌بندی و فیلترینگ داده‌ها هستند را بسیار بهبود می بخشد.
همزمان یک دیتابیس سری زمانی و یک موتور جستجوی پیشرفته هم هست.
معماری توزیع شده بسیار پیشرفته ای دارد که مقیاس پذیری و پاسخ گویی به هر حجمی از داده‌ها در زمان مناسب (زیر یک ثانیه) تضمین میکند (البته نیاز به تخصیص منابع و پایش دارد )
یک دیتابیس سری زمانی است و تمامی داده‌ها باید حاوی مهر زمان یا تایم استمپ باشند.
بخش دریافت داده یا اینجسشن بسیار پیشرفته ای دارد و کافی است داده‌های خود را به Kafka/MinIo/HDFS/ … منتقل کنید و ادامه کار یعنی دریافت از کافکا – و سایر منابع-، فیلترینگ و پردازش اولیه داده ها و ذخیره آنها به صورت بلادرنگ را به دروید بسپارید.
امکان تجمیع داده ها به صورت خودکار در آن فراهم شده است یعنی مثلا داده های هر پنج دقیقه را تجمیع کرده ، آمار مورد نیاز آن بازه زمانی را به صورت خلاصه برای شما محاسبه میکند.
الگوریتم های تقریبی پیشرفته ای دارد که همزمان با تجمیع داده‌ها میتوانید با تقریب بسیار مناسبی، آماره هایی راجع به داده هایی که در حین تجمیع، حذف می شوند را ذخیره کنید.
….

دروید : ترکیبی از انباره های داده/موتورهای جستجو و دیتابیس های سری زمانی

به مناسبت شب یلدای ۱۴۰۰ ،‌ به دعوت موسسه آموزشی نیک آموز وبینار یکساعته ای را راجع به این دیتابیس برگزار کرده ام که محوریت این وبینار، نصب و راه اندازی و کار عملی با آن بوده است.

ساختار دیتاسورس ها در دروید : هر رکورد از سه بخش مهر زمانی، ابعاد یا ویژگی ها و متریک ها یا سنجه های آماری تشکیل شده است.

بعد از حدود بیست دقیقه معرفی آن، به صورت عملی به نصب و راه اندازی آپاچی دروید پرداخته ام. در انتها هم با تولید داده‌های نمونه در کافکا، فرآیند دریافت خودکار این داده ها در دروید و تجمیع آنها را به علاقه مندان به صورت عملی نشان داده ام.
اگر به این حوزه علاقه مند هستید، می توانید فیلم های آموزشی این وبینار را از آدرسهای زیر دریافت کنید و پس از مشاهده آن، با اجرای مراحل انجام شده به صورت لوکال، کار با این دیتابیس خوش آتیه را استارت بزنید.
فیلم های این وبینار از آدرس های زیر قابل دریافت است :

بخش اول : معرفی معماری و مفاهیم پایه آپاچی دروید در دیدئو ببینید
بخش دوم : کارگاه عملی در دیدئو ببینید
بخش سوم : پرسش و پاسخ

مطالب بخش عملی این وبینار نیز در آدرس زیر قرار گرفته است :

https://github.com/irbigdata/workshops

برچسب ها

مجتبی بنائی 1400/10/16

۰ 708 زمان تقریبی مطالعه 2 دقیقه

بعدی را بخوانید

دیدگاهتان را بنویسید لغو پاسخ

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

Behnam Yazdanpanahi
مطلب بسیار مفید و‌ارزشمندی هست، ممنون...
مجتبی بنائی
سلام. امروزه خیلی هدوپ به صورت عملی استفاده نمیشه . اگر نیاز...
فاطمه
سلام برای کار با hortonworks در حد ابتدایی و شروع کار باابزا...
اصغر
از خواندن نظرات برخی افراد خیلی تعجب میکنم. متن بسیار کلی، ب...

آشنایی با دیتابیس تحلیلی آپاچی دروید

وبینار کارگاه عملی آپاچی دروید - موسسه نیک آموز - یلدای ۱۴۰۰

مجتبی بنائی

بعدی را بخوانید

ابزارهای نوین پردازش داده در یک نگاه – معرفی سایت OSS Insight

معرفی RAY : کتابخانه ای برای پردازش توزیع شده

معماری پیشنهادی برای پردازش لحظه‌ای داده‌های بورس

نگاهی به مفاهیم و ابزار جریان‌پردازی

ابزارهای نوین پردازش داده در یک نگاه – معرفی سایت OSS Insight

معرفی RAY : کتابخانه ای برای پردازش توزیع شده

معماری پیشنهادی برای پردازش لحظه‌ای داده‌های بورس

نگاهی به مفاهیم و ابزار جریان‌پردازی

دیدگاهتان را بنویسید لغو پاسخ

مجتبی بنائی

بعدی را بخوانید

ابزارهای نوین پردازش داده در یک نگاه – معرفی سایت OSS Insight

معرفی RAY : کتابخانه ای برای پردازش توزیع شده

معماری پیشنهادی برای پردازش لحظه‌ای داده‌های بورس

نگاهی به مفاهیم و ابزار جریان‌پردازی

ابزارهای نوین پردازش داده در یک نگاه – معرفی سایت OSS Insight

معرفی RAY : کتابخانه ای برای پردازش توزیع شده

معماری پیشنهادی برای پردازش لحظه‌ای داده‌های بورس

نگاهی به مفاهیم و ابزار جریان‌پردازی

با عضویت در خبرنامه ما

آخرین مطالب سایت را سریع تر از دیگران دریافت کنید

معرفی RAY : کتابخانه ای برای پردازش توزیع شده

مخزن کدی برای ابزارهای متن باز مهندسی داده

دیدگاهتان را بنویسید لغو پاسخ