آموزش و راهنماییابزار و کتابخانه هاابزارهای هوش تجاری

معرفی سرویسهای تحلیل داده مایکروسافت

برای باقی ماندن و راضی نگه داشتن کاربران در دنیای بسیار رقابتی امروز نیاز به سرعت بالای پردازش اطلاعات و شناسایی سریع گلوگاه ها و برطرف کردن آنها هستیم. مثالهای زیر بخوبی اهمیت این مساله را بازگو می کنند :

  • کاربران سایت شما، عکسهای مختلفی را آپلود می کنند و قبل از انتشار عمومی آنها باید تک تک بررسی شوند که مشکل قانونی برای انتشار نداشته باشند
  • برای ثبت نام کاربران، عکس پروفایل آنها را باید دریافت کنید اما این عکس باید حتماً شرایط خاصی داشته باشد مثلاً پشت زمینه آن روشن و بدون عینک و … باشد
  • می خواهید کاربران سایتتان را در انتخاب منوی غذا راهنمایی کنید چه به صورت چت و چه به صورت صوتی .
  • نظرات مختلفی که در سایت شما روزانه وارد میشوند نیاز به تحلیل دارند بخصوص زمانی که نارضایتی از یک محصول فراگیر میشود باید سریعاً در جریان قرار بگیرید اما اگر هزاران محصول مختلف داشته باشید، بررسی تک تک نظرات به صورت دستی ، کار عاقلانه ای نخواهد بود .
  • قصد طراحی سرویسی را دارید که متن های داخل یک عکس را برایتان استخراج کند یا عکسهای مختلف ارسالی کاربران را برایتان گروه بندی کند .
  • می خواهید عکس های ارسالی را کراپ کنید اما برای برش دقیق عکس به گونه ای که اطلاعات اصلی عکس باقی بماند، نیاز به بازبینی انسانی دارید .
  • روزانه تماس های مختلفی با واحد پشتیبانی شرکت شما گرفته میشود و می خواهید ببینید که در کدام یک از مکالمات صدای طرفین بالا رفته است تا بتوانید جلوی تکرار آنرا بگیرید.

مثالهای بالا گوشه ای از نیازهای رو به رشد سامانه های اطلاعاتی در دنیای معاصر است که در همه آنها پردازش متن یا صدا یا ویدئو بخشی از راه حل خواهد بود. برای انجام هر کدام از موارد بالا، علاوه بر وجود یک تیم متخصص، نیاز به سرورهای قوی و امکانات سخت افزاری هم داریم . هر چند ممکن است تا زمانی که الگوریتم مناسب را بیابیم و تست کنیم، بازار را از دست بدهیم و یا با هزینه بسیار بالایی به این مهم دست یابیم .

چندسالیست که شرکتهای بزرگ دنیا مانند مایکروسافت، گوگل ، IBM‌  و آمازون، سرویسهای تحلیل و پردازش داده خود را به صورت آنلاین و مبتنی بر رایانش ابری ارائه کرده اند تا شرکتها و سازمانهای نیازمند به انواع الگوریتمهای یادگیری ماشین و هوش مصنوعی، تمام نیازهای خود را با صدازدن چند سرویس ساده و بدون درگیر شدن در جزییات فنی آنها، به دست آورند.  در این مقاله به سرویس جدید مایکروسافت به نام Cognitive Service  می پردازیم

مقدمه ای بر اکوسیستم پردازشی مایکروسافت

مایکروسافت به عنوان یکی از شرکتهای پیشرو در زمینه رایانش ابری، چند سالیست علاوه بر سرویس پایه رایانش ابری آژور (Azure)، سرویسهای بسیار متنوعی را هم ارائه می کند از اجرای کانتینرهای داکر و اجرای ماشین های مجازی لینوکس تا انواع سرویسهای پردازش عکس و ویدئو و سرویسهای یادگیری ماشین و هوش مصنوعی. این سرویسها امروزه به ۶۷ سرویس مختلف می رسد که به کمک آنها می توانید تمام نیازهای ذخیره و پردازش داده خود را برطرف کنید. از بین این سرویسهای متنوع ، سه سرویس برای تحلیل و پردازش داده اهمیت ویژه ای دارند : سرویس یادگیری ماشین ، سرویس هوش تجاری کورتانا و سرویس علوم شناختی (Cognitive)

به این سه سرویس به صورت دقیق تر در ادامه نوشتار حاضر، می پردازیم.

سرویس هوش تجاری کورتانا

شالوده و محور سرویسهای داده مایکروسافت، سرویس کورتانا است که در حقیقت یک چارچوب و معماری کامل برای ذخیره سازی، پردازش و نمایش اطلاعات است و تمام سرویس های دیگر مایکروسافت در این زمینه، جزئی از این چهارچوب هستند .

033016_0449_fromanalyti4

البته لیست محصولات کورتانا بسیار بیشتر از این تصویر فوق است که در این صفحه می توانید لیست کامل آنها را ببینید بخصوص امکاناتی که برای هدوپ و پردازش جریان و دریاچه های داده ارائه می کند قابل توجه است .

سرویس یادگیری ماشین

سرویس یادگیری ماشین هم بخشی از سرویس کورتانای مایکروسافت است که به کاربر یک استودیو و پنلی برای بارگزاری و پردازش داده های خود ارائه می دهد. کافیست با اکانت مایکروسافت خود (اکانتهای هات میل یا اوت لوک) وارد این استودیو شوید تا یک محیط یکپارچه پردازشی در اختیار شما قرار گیرد تا هم بتوانید داده های خود را بارگذاری کنید و هم مدلهای مختلف یادگیری ماشین خود را روی این داده ها امتحان کرده و در صورت موفقیت مدل، آنرا وارد فاز عملیاتی نمایید.

azureml_studio

در این محیط  می توانید  یک پروژه ایجاد کنید، داده های خود را وارد کنید، وب سرویسهایی را به پروژه معرفی کنید و با کتابچه های پایتون و R به تحلیل داده های خود بپردازید اما بخش جذاب این محیط ، قسمت تجربه عملی اون هست با نام Experiment که به شما کمک می کنه روال کار خودتان را به صورت Drag and Drop‌ و به صورت فلوچارتی طراحی کنید .

drag

در هر بخش ازاین فلوچارت هم از سری کارها و الگوریتمهای آماده شده مایکروسافت می توانید انتخاب کرده و آنها را به سمت مستطیل مربوطه بکشید و رها کنید . بخشی از این لیست آماده را میتوانید در شکل زیر ببینید :

menu

همانطور که می بینید لیست تقریباً کاملی از الگوریتم  و کارهایی که ممکن است مورد نیاز شما باشد را در این فهرست میبینید که البته خودتان به کمک ماژول های برنامه نویسی می توانید هر جا که نیاز به الگوریتم یا کدنویسی خاص منظوره داشتید از آنها استفاده کنید . توصیه می کنم حتما مثالهای آماده مایکروسافت را مشاهده کنید . نمونه ای از مثالهای آماده مایکروسافت را در شکل زیر می توانید ببینید :

azureml_studio3

سرویس علوم شناختی Cognitive Service

یکی دیگر از سرویسهای پردازش داده جذاب و کاربردی مایکروسافت، سرویس علوم شناختی آن است که به کمک آن می توانید پردازش صدا ، متن ، تصویر ، ویدئو و بسیاری کارهای دیگر را به راحتی انجام دهید. این سرویسها که به صورت API‌ ارائه می شود، به شما امکان این را میدهد که تنها با چند خط کد بتوانید سرویس مربوطه را از مایکروسافت فراخوانی کنید و جوابتان را به صورت لحظه ای  وبلادرنگ دریافت کنید . امری که باعث میشود شما تمرکزتان را روی برنامه اصلیتان بگذارید و تمام کارهای پردازشی اصلی را به مایکروسافت بسپرید.

microsoft_cognitive_services

بخش پردازش متن و تحلیل زبان طبیعی آن هنوز زبان فارسی را پشتیبانی نمی کند اما بخش پردازش تصویر آن را که تست کردم بسیار جذاب و دقیق بود. مثلا عکس دو تا دخترم را به این سرویس دادم و خروجی زیر را مشاهده کردم :

2

علاوه بر تشخیص موجودیت های حاضر در عکس و تشخیص چهره و سن اشخاص، دسته عکس و اینکه محتوای مستهجن دارد یا نه را هم تشخیص می دهد. عکسی از پخت شله زرد یکی از اقوام را هم که برای تحلیل به سرویس captionbot که توسط همین API‌ مایکروسافت نوشته شده است دادم ، خروجی زیر را گرفتم :

imaagebot

و وقتی تصویر حسن روحانی و فرانسوا اولاند را آپلود کردم ، هر دو را تشخیص داد :

captionbot

سرویس بات مایکروسافت هم آینده درخشانی دارد و حتماً در طراحی سامانه های اطلاعاتی آنرا هم درنظر بگیرید این که یک دستیار هوشمند مشابه یک انسان به راهنمایی مشتری بپردازد، با اون صحبت و یا چت کند و به جای شما شکایات و درخواستها را پذیرا باشد .

مجتبی بنائی

دانشجوی دکترای نرم‌افزار دانشگاه تهران (yun.ir/smbanaie)، مدرس دانشگاه و فعال در حوزه توسعه نرم‌افزار و مهندسی داده که تمرکز کاری خود را در چند سال اخیر بر روی مطالعه و تحقیق در حوزه کلان‌داده و زیرساخت‌های پردازش داده و تولید محتوای تخصصی و کاربردی به زبان فارسی و انتشار آنها در سایت مهندسی داده گذاشته است. مدیریت پروژه‌های نرم‌افزاری و طراحی سامانه‌های مقیاس‌پذیر اطلاعاتی از دیگر فعالیتهای صورت گرفته ایشان در چند سال گذشته است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

دکمه بازگشت به بالا