مقالاتی که دنیای کلان داده را تغییر دادند
در حوزه کلان داده در سالهای اخیر مقالات بسیار زیادی منتشر شده است و با توجه به گرایشات جهانی به این حوزه ، سال به سال نیز در حال افزایش است اما در این بین ، بعضی مقالات نقش پایه ای و اساسی در این حوزه ایفا کرده اند مانند مقاله ای که گوگل در سال ۲۰۰۶ با موضوع کلان جدول یا BigTable منتشر کرد و پایه ای شد برای طراحی بانکهای سطر گسترده ای مانند آمازون داینامو و کاساندرا .
در این مقاله این مقالات که نقطه عطفی در حوزه کلان داده بوده اند به صورت زیر فهرست شده اند که برای دانشجویان و محققین این حوزه توصیه میشود برای شروع کار ، از این مقالات پایه ای استفاده کنند :
- MapReduce: Simplified Data Processing on Large Clusters
- The Google File System
- Bigtable: A Distributed Storage System for Structured Data
- Dynamo: Amazon’s Highly Available Key-value Store
- The Chubby lock service for loosely-coupled distributed systems
- Chukwa: A large-scale monitoring system
- Cassandra – A Decentralized Structured Storage System
- HadoopDB: An Architectural Hybrid of MapReduce and DBMS Technologies for Analytical Workloads
- S4: Distributed Stream Computing Platform.
- Dremel: Interactive Analysis of Web-Scale Datasets
- Large-scale Incremental Processing Using Distributed Transactions and Notifications
- Pregel: A System for Large-Scale Graph Processing
- Spanner: Google’s Globally-Distributed Database
- Shark: Fast Data Analysis Using Coarse-grained Distributed Memory
- The PageRank Citation Ranking: Bringing Order to the Web
- A Few Useful Things to Know about Machine Learning
- Random Forests
- A Relational Model of Data for Large Shared Data Banks
- Map-Reduce for Machine Learning on Multicore
- Megastore: Providing Scalable, Highly Available Storage for Interactive Services
- Finding a needle in Haystack: Facebook’s photo storage
- Spark: Cluster Computing with Working Sets
- The Unified Logging Infrastructure for Data Analytics at Twitter
- F1: A Distributed SQL Database That Scales
- MLbase: A Distributed Machine-learning System
- Scalable Progressive Analytics on Big Data in the Cloud
- Big data: The next frontier for innovation, competition, and productivity
- The Promise and Peril of Big Data
- TDWI Checklist Report: Big Data Analytics
در صورت نیاز به دانلود این مقالات ، می توانید از سایت تراپیپر یا PaperDL استاده کنید.
یک فهرست ۳۸ تایی از مقالات پایه ای حوزه کلان داده هم در سایت DataScienceCentral برای علاقه مندان تهیه شده است .
فهرستی دیگر از مقالات مفید و ضروری حوزه کلان داده رادر این آدرس به تفکیک سال می توانید مشاهده کنید.