ویدئو : آموزش اصول پایه اسپارک – لیندا
اگر از دنبال کنندگان مباحث علم داده در دنیا باشید، می دانید که نسل دوم سامانه های پردازشی کلان داده با ابداع و رواج اسپارک ، رقم خورد به گونه ای که امروزه کار با اسپارک ، به عنوان یک ضرورت برای دانشمندان داده تبدیل شده است.
اسپارک با تمرکز بر پردازش های درون حافظه ای و ابداع مکانیزمی برای بازیابی محاسبات و تبدیلات انجام شده بر روی مجموعه داده ها در صورت رخداد خطا، محبوبیت زیادی در بین جامعه فعلی دانشمندان و تحلیلگران داده دارد.
این مجموعه آموزشی که به صورت روان و توسط سایت معتبر لیندا در سال ۲۰۱۷ تهیه شده است، با تکیه بر زبان پایتون و محیط تحت وب سایت DataBricks مفاهیم اصلی این چارچوب پردازشی را در یک آموزش یک ساعت و نیمی به شما ارائه خواهد کرد.
توصیه می کنیم ابتدا، دو مقاله زیر را در سایت مهندسی داده مرور کرده ، اکانت لازم را برای خود در سایت Databricks ایجاد کرده، با مفاهیم اصلی این چارچوب آشنا شده و سپس با مشاهده این آموزش ساده و روان و البته مختصر، گام های اولیه را در حوزه پردازش کلان داده بردارید.
سرفصلهای دوره :
- آشنایی با اسپارک
- مروری بر مولفه های اصلی اسپارک
- بررسی نقاط قوت اسپارک
- ارتباط با داده ها
- کار با فایلهای متنی
- بارگزاری فایلهای CSV در DataFrame ها
- استفاده از Spark SQL برای تحلیل داده ها
- اجرای الگوریتم های یادگیری ماشین با کتابخانه MLib
- کار با داده های جریانی و پیوسته
- نحوه اتصال ابزارهای هوش تجاری با اسپارک
مشخصات دوره :
- ناشر : لیندا
- زبان : انگلیسی – روان و ساده
- سطح : متوسط
- طول دوره : ۸۷ دقیقه
- مدرس : Ben Sullins
- تاریخ انتشار : ۴/۳/۲۰۱۷
- پیش نیاز : آشنایی اولیه با پایتون، SQL، هدوپ و هایو (Hive)