آموزش های ویدئویی

ویدئو : آموزش اصول پایه اسپارک – لیندا

اگر از دنبال کنندگان مباحث علم داده در دنیا باشید، می دانید که نسل دوم سامانه های پردازشی کلان داده با ابداع و رواج اسپارک ، رقم خورد به گونه ای که امروزه کار با اسپارک ، به عنوان یک ضرورت برای دانشمندان داده تبدیل شده است.

اسپارک با تمرکز بر پردازش های درون حافظه ای و ابداع مکانیزمی برای بازیابی محاسبات و تبدیلات انجام شده بر روی مجموعه داده ها در صورت رخداد خطا، محبوبیت زیادی در بین جامعه فعلی دانشمندان و تحلیلگران داده دارد.

این مجموعه آموزشی که به صورت روان و توسط سایت معتبر لیندا در سال ۲۰۱۷ تهیه شده است، با تکیه بر زبان پایتون و محیط تحت وب سایت DataBricks مفاهیم اصلی این چارچوب پردازشی را در یک آموزش یک ساعت و نیمی  به شما ارائه خواهد کرد.

 

توصیه می کنیم ابتدا، دو مقاله زیر را در سایت مهندسی داده مرور کرده ، اکانت لازم را برای خود در سایت Databricks ایجاد کرده، با مفاهیم اصلی این چارچوب آشنا شده و  سپس با مشاهده این آموزش ساده و روان و البته مختصر، گام های اولیه را در حوزه پردازش کلان داده بردارید.

  1. آشنایی با اسپارک – راه اندازی محیط کار
  2. آموزش اسپارک – مفاهیم پایه

سرفصلهای دوره :

  • آشنایی با اسپارک
  • مروری بر مولفه های اصلی اسپارک
  • بررسی نقاط قوت اسپارک
  • ارتباط با داده ها
  • کار با فایلهای متنی
  • بارگزاری فایلهای CSV در DataFrame‌ ها
  • استفاده از Spark SQL برای تحلیل داده ها
  • اجرای الگوریتم های یادگیری ماشین با کتابخانه MLib
  • کار با داده های جریانی و پیوسته
  • نحوه اتصال ابزارهای هوش تجاری با اسپارک

 

مشخصات دوره :

  • ناشر : لیندا
  • زبان :  انگلیسی – روان و ساده
  • سطح : متوسط
  • طول دوره : ۸۷ دقیقه
  • مدرس : Ben Sullins
  • تاریخ انتشار : ۴/۳/۲۰۱۷
  • پیش نیاز : آشنایی اولیه با پایتون، SQL‌، هدوپ و هایو (Hive)

 

 

امتیاز کاربران: اولین نفری باشید که امتیاز می دهد!

مجتبی بنائی

دانشجوی دکترای نرم‌افزار دانشگاه تهران (yun.ir/smbanaie)، مدرس دانشگاه و فعال در حوزه توسعه نرم‌افزار و مهندسی داده که تمرکز کاری خود را در چند سال اخیر بر روی مطالعه و تحقیق در حوزه کلان‌داده و زیرساخت‌های پردازش داده و تولید محتوای تخصصی و کاربردی به زبان فارسی و انتشار آنها در سایت مهندسی داده گذاشته است. مدیریت پروژه‌های نرم‌افزاری و طراحی سامانه‌های مقیاس‌پذیر اطلاعاتی از دیگر فعالیتهای صورت گرفته ایشان در چند سال گذشته است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

دکمه بازگشت به بالا