تغییر جهان با تحلیل کلان داده
امروزه، هر بار که آنلاین میشویم، هربار که گوشیهای هوشمند مجهز به GPS را با خودمان حمل میکنیم، هربار که از طریق رسانههای اجتماعی و اپلیکیشنهای چت با دوستانمان ارتباط برقرار میکنیم و حتی زمانی که خرید میکنیم، در اصل دیتای جدید تولید میکنیم. بهتر است بگوییم هر عملی که شامل انجام فعالیتهای دیجیتالی شود، ردپای دیجیتالی کاربر را در آنجا بر جای خواهد گذاشت. موضوع مهمتر مقدار دادههای تولید شده از سوی ماشینها است که با سرعت بسیار زیاد در حال افزایش است. زمانی که تجهیزات هوشمند منازل با یکدیگر یا با سرور مرکزی منزل ارتباط برقرار میکنند، دادهها تولید و به اشتراک گذاشته میشود. در سراسر دنیا، هر روز تعداد بیشتری از ماشینآلات صنعتی کارخانهها به سنسورهایی که دادهها را مخابره میکنند، مجهز میشوند. به زودی نیز خودروهای بدون راننده به خیابانها میآیند و به سرعت نقشه چهاربعدی فضای اطراف خودرو را به سرورهای مرکزی انتقال خواهند داد.
وظیفه کلان دادهها چیست؟
اطلاعات روزافزون بهدست آمده از سنسورها، تصاویر، متن، اطلاعات صوتی و ویدئویی، همگی تشکیلدهنده کلان دادههایی هستند که امروزه میتوانیم از آنها به روشهایی که چند سال پیش غیرممکن بود، استفاده کنیم. در حال حاضر، پروژههای مرتبط با تحلیل کلان دادهها در بخشهای زیر در حال کمکرسانی هستند :
- درمان بیماریها و جلوگیری از سرطان: داروهای داده محور (Data-Driven) شامل تحلیل حجم گستردهای از سوابق دارویی برای یافتن الگوهای با قابلیت کمک به دانشمندان برای شناسایی بیماریها در مراحل ابتدایی و تولید داروهای جدید میشود.
- غذارسانی به گرسنگان: به لطف دادهها، کشاورزی در حال متحول شدن است و به زودی با استفاده از کلان دادهها میتوان تولید محصولات را به حداکثر و حجم آلایندههای ورودی به محیط زیست را به حداقل رساند و استفاده از ماشینها و ابزارآلات را بهینهسازی کرد.
- جستوجوی سیارههای دوردست: ناسا با آنالیز میلیونها داده از آنها برای مدلسازی تمامی امکانات ممکن برای فرود مریخنوردهای خود روی این سیاره و برنامهریزی جهت انجام ماموریتهای آینده استفاده میکند.
- پیشبینی و مقابله با بلایای طبیعی و انسانی: با تحلیل دادههای به دست آمده از سنسورها میتوان محل احتمالی زمینلرزههای بعدی را پیشبینی و با آنالیز الگوهای رفتاری انسانها میتوان به سرنخهایی که قادر است به سازمانها برای نجات جان افراد و کمکرسانی بیشتر به بازماندگان کمک کنند، دست پیدا کرد. همچنین با بهکارگیری تکنولوژی تحلیل کلان دادهها میتوان برای حفاظت از جان مهاجران در مناطق جنگی سراسر دنیا استفاده کرد.
- جلوگیری از وقوع جرم: نیروهای پلیس بر اساس استراتژیهای برگرفته شده از دادههای قبلی و مجموعه دادههای عمومی، قادر خواهند بود نیروهای خود را موثرتر وارد عملیات کرده و در مواقع ضروری با بازدارندگی بیشتری در مقابل مجرمان وارد عمل شوند. همچنین به لطف وجود کلان دادهها، امکان خرید آنلاین، انتخاب بهترین وسیله و مکان برای سفر، انتخاب بهترین زمان برای رزرو بلیت هواپیما و تصمیمگیری برای انتخاب فیلم مناسب برای تماشا در سینما و در کل زندگی به شکل ساده و راحتتر امکانپذیر شده است. قاعده اصلی کلان دادهها به این شکل است که هرچه بیشتر درمورد یک مساله یا یک موقعیت اطلاعات بهدست بیاورید، بینش درونی شما نسبت به آن بیشتر و پیشبینیهای شما درباره اتفاقات بعدی با اطمینان بیشتری حاصل میشود.
با مقایسه دادهها، روابطی که در گذشته غیرقابل تشخیص بود کمکم آشکار میشوند و در ادامه، این روابط درک و آگاهی ما از تصمیمات آینده را برایمان امکان پذیر خواهند کرد. عموما، این نتایج از طریق مدلسازی بر اساس دادههای جمعآوری شده، انجام مراحل شبیهسازی، محاسبه مقدار دادهها در هر مرحله و بررسی تاثیر آنها روی نتایج کسب شده، بهدست میآیند. امروزه این مراحل بهصورت اتوماتیک و از طریق تکنولوژیهای تحلیلی پیشرفته انجام میگیرد که قادرند شبیهسازی را میلیونهابار بهصورت مکرر انجام دهند و تمامی متغیرها را تا زمانی که به یک الگوی قابلفهم دست پیدا کنند، جابهجا کنند و از این طریق مساله مورد نظر را در مدت کوتاهی حل کنند.
هرروز، دادهها به شکل سازماندهی نشده وارد زندگیمان میشوند. منظور از سازماندهی نشده این است که نمیتوان آنها را به راحتی در جدولهای دستهبندی شده قرار داد. بخش اعظم این دادهها به شکل تصاویر و ویدئوهایی هستند که از تصاویر بهدست آمده از ماهوارهها گرفته تا عکسهای آپلود شده در فیسبوک و توییتر را تشکیل میدهند. ایمیلها، پیامهای متنی اپیلیکیشنهای پیامرسان و مکالمات تلفنی ضبط شده نیز بخش دیگر این دادهها را تشکیل میدهند. برای درک تمامی این دادهها، پروژههای تحلیلی کلان دادهها با استفاده از بهروزترین تکنولوژیهای تحلیل اطلاعات از جمله هوش مصنوعی و یادگیری ماشینی انجام میشوند. با آموزش کامپیوترها به منظور درک این دادهها از طریق تشخیص تصاویر و پردازش به زبان طبیعی، کامپیوترها میتوانند الگوها را با سرعت و اطمینان بیشتری نسبت به انسانها تشخیص دهند.
روند پیشگرفته شده در چند سال اخیر موجب پیشرفتهای چشمگیری در این زمینه و ارائه ابزارهای تحلیل کلان دادهها بهعنوان پلتفرمی برای خدمترسانی شده است. سازمانها و شرکتها فضای سرور، سیستمهای نرمافزاری و پردازشگرها را از ارائهدهندگان سرویسهای کلود اجاره میکنند. تمامی مراحل تحلیل دادهها از طریق سیستمهای شرکت ارائهدهنده این سرویسها انجام میشود و مشتریان تنها هزینه انجام آن را پرداخت میکنند. این نوع همکاریها، تحلیل و تبدیل کلان دادهها را برای تمامی سازمانها ممکن ساخته و از صرف هزینههای هنگفت برای خرید سختافزار، نرمافزار و استخدام کارکنان تخصصی جدید جلوگیری میکند.
نگرانیها (چالشها) درباره کلان دادهها
امروزه، کلان دادهها بینش و فرصتهای بیسابقهای را در اختیارمان قرار میدهند اما در این میان سوالات و نگرانیهایی وجود دارند که باید به آنها اشاره کرد.
- حریم خصوصی دادهها: کلان دادههایی که امروزه تولید میکنیم حاوی حجم زیادی از اطلاعات زندگی شخصی افراد که باید در حریم خصوصی محافظت شوند، هستند. در حال حاضر هم اطلاعات خصوصی افراد را فاش میکنیم و هم از فضای راحتی که برنامهها و سرویسهای مرتبط با کلان دادهها فراهم کردهاند استفاده میکنیم. حقیقتا چه کسی اجازه دسترسی به این اطلاعات را دارد؟
- امنیت دادهها: حتی اگر با بهکارگیری اطلاعاتمان برای مقاصد بهخصوص مشکلی نداشته باشیم، آیا حفظ این اطلاعات توسط افراد تضمین میشود؟ آیا قوانین و مقررات مرتبط با حفظ اطلاعات خصوصی برای این مقیاس از دادهها نیز کاربرد دارند؟
- تبعیض اطلاعاتی: زمانی که همهچیز مشخص شد، آیا تبعیض قائل شدن برای برخی افراد بر اساس اطلاعاتی که از زندگی شخصی آنها به دست آوردهایم قابل قبول خواهد بود؟ در حال حاضر، بانکها بر اساس ردهبندی اعتبار افراد، تصمیم میگیرند که به چه افرادی وام اعطا کنند و سازمانهای بیمه نیز شدیدا به دادهها اتکا کردهاند. باید انتظار داشته باشیم که اطلاعات با جزئیات گستردهتری ارزیابی و تحلیل شوند و از اینکه در اختیار داشتن اطلاعات فردی موجب سختتر شدن معیشت افرادی که از منابع و دسترسی به اطلاعات محدودتری برخوردارند نمیشود، اطمینان حاصل کنیم.
مواجهه با چنین چالشهایی، بخشی از مشکلات کلان دادهها محسوب میشوند. بدون شک اختلافات گستردهای بین دانشمندان و متفکران دانشگاهها وجود دارد و افرادی که قصد استفاده از کلان دادهها را دارند، باید از مخاطرات و ایرادات این کار از سوی این افراد باخبر شوند. در غیر این صورت، کسبوکارها با صدمات جدی روبهرو شده و در ادامه بحرانهای مالی و جریمههای سنگین را به همراه خواهد داشت. اوایل که افراد درباره کلان دادهها صحبت میکردند، بسیاری آن را تکنولوژی زودگذری میدانستند که قرار است تنها برای مدتی کوتاه مورد توجه قرار بگیرد و زمانی که تکنولوژی جدیدتری ظهور کند، کلان دادهها نیز فراموش میشوند. اما تا به امروز چنین اتفاقی نیفتاده است و در حقیقت، با ظهور تکنولوژیهای جدید، میبینیم که نیروی محرکه اصلی تمامی آنها کلان دادهها هستند. در آینده نزدیک، مقدار دادههای در اختیار ما گسترش پیدا میکنند و تکنولوژیهای تحلیل دادهها نیز پیشرفتهتر میشوند. پس اگر کلان دادهها امروزه قادر به انجام چنین کارهای بزرگی هستند، تصور کنید در آینده قادر به انجام چه کارهای بزرگتری خواهند بود.
منبع : وب سایت دنیای اقتصاد