تحلیل اکتشافی داده ها در پایتون
یکی از اولین گامهایی که یک مهندس داده در بررسی و تحلیل داده ها باید بردارد، تحلیل اکتشافی داده هاست (Exploratory data Analysis) که در آن به کشف زوایای مختلف داده ای که قصد کار با آنرا دارد، می پردازد.
از جمله مسایلی که در این مرحله به آن پرداخته می شود، اطلاعات آماری است که می توان راجع به داده ها استخراج کرد مانند میانگین ، بیشینه و کمینه و انحراف معیار هر کدام از اجزای داده ها. از طرفی روابط داخلی داده مانند ارتباط بین سن و وزن و جنسیت و …. نیز به کمک نمودارهای مختلف بررسی می شود.مجموعه این مراحل باعث می شود دید بهتری نسبت به داده های جمع آوری شده داشته باشیم و برای ادامه مسیر که استخراج اطلاعات مفید و ساخت مدلهای پیش بینی کننده با بینش بهتری گام برداریم .
سعی خواهیم کرد به صورت عملی مباحث تحلیل اکتشافی داده ها را در زبانهای مختلف در سایت مهندسی داده بررسی کنیم . برای شروع یک اینفوگرافیک از سایت analyticsvidhya را در زیر مشاهده می کنید که با فرض آشنایی شما با پایتون و نصب کتابخانه های لازم (می توانید از سایتهای آنلاینی مانند Sense هم استفاده کنید)، راه انداز و مرجعی برای مراجعه شما در مراحل بعدی خواهد بود .