ابزار و کتابخانه ها

مجموعه داده های کگل : یک سرویس حرفه ای برای میزبانی داده

سایت کگل را به عنوان یک سایت حرفه ای برگزار کننده مسابقات بین المللی پردازش داده قبلاً معرفی کرده ایم . این سایت که رتبه هر کاربر در آن، معیاری موثق برای سنجش میزان آشنایی یک فرد با علم پردازش و مهندسی داده است، جدیداً سرویسی ارائه کرده است برای میزبانی داده های عمومی که تحلیلگران و محققان بتوانند با امکانات کامل، مجموعه داده های میزبان شده را بررسی و تحلیل کنند.

این سرویس که به عنوان Kaggle Datasets به عنوان بخشی از سایت کگل ارائه شده است ، امکانات زیر را برای هر مجموعه داده، فراهم کرده است :

  • دسترسی به داده ها به صورت منظم و با توضیحات کامل
  • تحلیل بر خط داده ها بدون نیاز به دانلود آنها و مشاهده کدهای سایرین
  • مشاهده نتایج بررسی سایر افراد و اشتراک گذاری نتایج
  • انجمن های تخصصی گفت و گو برای هر مجموعه داده

110

در هر صورت ، اگر قصد ورود به حوزه تحلیل داده ها را دارید و نمی دانید نمونه مثالهای کاربردی و عملی را از کجا شروع کنید، می توانید از این مجموعه داده های عمومی کگل ، سفر به دنیای مهندسی داده خود را شروع کنید البته آشنایی با زبانهای مثل پایتون یا R یا جولیا برای شروع شاید لازم باشد .

 

datasetsblog_2

مجتبی بنائی

دانشجوی دکترای نرم‌افزار دانشگاه تهران (yun.ir/smbanaie)، مدرس دانشگاه و فعال در حوزه توسعه نرم‌افزار و مهندسی داده که تمرکز کاری خود را در چند سال اخیر بر روی مطالعه و تحقیق در حوزه کلان‌داده و زیرساخت‌های پردازش داده و تولید محتوای تخصصی و کاربردی به زبان فارسی و انتشار آنها در سایت مهندسی داده گذاشته است. مدیریت پروژه‌های نرم‌افزاری و طراحی سامانه‌های مقیاس‌پذیر اطلاعاتی از دیگر فعالیتهای صورت گرفته ایشان در چند سال گذشته است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

دکمه بازگشت به بالا