ابزار و کتابخانه ها
فناوریهای حوزه کلان داده در یک نگاه
سایت InsightDataEngineering یک نمودار تعاملی ساده و جمع و جور برای آشنایی با فناوریهای حوزه کلان داده منتشر کرده است که در نه گروه مختلف این فناوری ها را طبقه بندی کرده است . این طبقه بندی به صورت فهرست وار طبق این نمودار از قرار زیر است :
- ابزار تزریق داده : ابزار و فناوریهای که به کمک آنها می توان داده ها را وارد سامانه های کلان داده نمود .
- قالب های فایلی ذخیره و بازیابی اطلاعات : گاهی اوقات نیاز داریم بعضی اطلاعات را که در قالب های مختلف هستند درون فایل ذخیره کنیم .
- سیستم های فایلی ذخیره و بازیابی اطلاعات :
- HDFS
- AWS S3
- Tachyon
- پردازش دسته ای :
- Hadoop Map/Reduce
- Spark
- AWS EMR
- TEZ
- یادگیری ماشین
- H2O
- Mahout
- Spark MLib
- پردازش گراف
- GraphLab
- Giraph
- Spark GraphX
- اجرای SQL
- Hive
- Presto
- Drill
- پردازش جریانهای داده
- Storm
- Spark Streaming
- Samza
- NiFi
- بانکهای اطلاعاتی
- بانکهای اطلاعاتی رابطه ای
- بانکهای سندگرا
- بانکهای سطر گسترده
- بانکهای کلید مقدار
- بانکهای گراف محور
- ابزارهای مدیریت شبکه وکلاستر
- YARN
- Mesos
- Zookeeper
- Oozie
- ابزارهای نظارت و مانیتورینگ
- Hue
- Ambari
- Lipstick
- Ganglia
- داشبوردهای تحلیلی و تولید برنامه های کاربر
- Flask
- D3
- AngularJS
- Django
- Highcharts
جزییات کامل این گروه بندی و نمودار را در این آدرس می توانید مشاهده کنید .