چرا فناوری کلان داده در ایران بازار چندانی پیدا نکرده است؟
این نوشتار از ویژه نامه کلان داده ماهنامه پیوست بخش میزگرد بررسی دلایل عدم رونق کلان داده در ایران ،با هدف جمع آوری مطالب مفید حوزه کلان داده، عیناً بازنشر شده است.
«صنعت آیتی بیش از دنیای مد زنان مدام با تغییر ذائقهها متحول میشود.» شاید همین جمله ریچارد استالمن پدر دنیای متنباز کافی باشد تا بفهمیم چرا زنان به مباحث مد و سطوح بالاتر فناوری، بیش از حوزههای زیرساختی آن علاقه نشان میدهند. مبحث کلاندادهها هم از این وضعیت مستثنی نیست و به دلیل تحولات سریع آن، زنان تمایل بیشتری برای فعالیت در آن دارند. این موضوع به وضوح در ترکیب میزگرد ما با برخی از صاحبنظران و فعالان این حوزه هم نمایان بود، میزگردی که در آن سعی کردیم وضعیت بازار کلاندادها را از زبان کسانی بشنویم که در کوره کار و عمل این حوزه پختهاند و به خوبی با نقاط ضعف و قوت آن آشنایی دارند.
مقوله کلاندادهها در بسیاری از سازمانهای بزرگ کشور بیشتر در حد یک اسم یا یک ژست باقی مانده است. سازمانهایی نیز که قدری جدیتر در این حوزه فعالیت کردهاند به ندرت از فاز تحقیق و توسعه پیش رفتهاند. به نظر شما چرا چنین جهشی در ایران رخ نداده است؟
لیلی میرطاهری: در ایران بسیاری از دانشگاهها و صنایع از کلاندادهها صحبت میکنند، اما نتیجه قابل توجهی که برای افراد کارایی داشته باشد چندان به چشم نمیخورد. همانگونه که در دورههای مختلفی مبحث محاسبات ابری، محاسبات گرید، اَبَر رایانش ملی و سیستمعامل ملی را مطرح کردند، حالا از کلاندادهها سخن میگویند. علت این نوع رویکرد به خصوص از سمت دولتیها این است که بتوانند برای یک پروژه جدید بودجهای تامین کنند، اما در نهایت همین بودجه یا صرف پروژههای نیمهتمام قبلی میشود یا در سیستم به هدر میرود. یکی از دلایل این وضعیت سوءمدیریت است و دلیل دیگر ناآشنایی و بینیازی. اساساً باید ببینیم آیا در ایران به کلاندادهها نیاز داریم؟ در ایران هنوز نمیدانیم چه خروجی خاصی را در هر پروژه جدید دنبال میکنیم و قصد داریم چه مسالهای را حل کنیم. اگر اینها را بدانیم میتوانیم هدفگذاری درستی انجام دهیم و در نهایت با یک برنامهریزی مدون و مشخص به آن هدف برسیم.
به نظر میرسد اهمیتی برای داده و پردازش آن قائل نیستم و به آن نیازی نداریم تا بر اساس آن پروژه را تعریف و بودجه را تامین کنیم، به همین دلیل در همین سطح باقی مانده است. آیا این پیشفرض درستی است؟
قربان خردمندیان: وقتی صحبت کلاندادهها پیش میآید بحث گرفتن و مدیریت داده و بعد تحلیل آن مطرح میشود. من بیشتر از جنبه تحلیل آن صحبت میکنم. تجربه ما در دادهکاوان هوشمند نشان میدهد این نیاز به تحلیل کلاندادهها حس میشود. ما با بانکها کار میکنیم و اطلاعات خیلی خوبی دارند. آنها در مقولههایی همچون نرمافزارهای تشخیص تقلب، مبارزه با پولشویی و هوش تجاری به این تحلیلها نیاز دارند. اما هنوز نمیدانند این موارد نیاز به کلاندادهها دارد یا نه. به نظر ما در برخی موارد کلاندادهها میتواند برایشان کارآمد باشد، هرچند حجم دادههای آنها شاید در حد چند ۱۰ ترابایت باشد، در حالی که در بحث کلاندادهها ۴۲V مطرح میشود. در دادهکاوی برای تشخیص تقلب، یادگیریهای ناظر و غیرناظر داریم که پیچیدگی محاسباتی بالایی دارند. برای پردازشهای حجیم روی هفت میلیون داده غیر تکبعدی، الگوریتمها و سختافزارهای فعلی پاسخگوی نیستند. اگر الگوریتمهای ما توزیع شده باشند، خوشهبندی ساده در مراحل ابتدایی تحلیل دادهها بهتر انجام میشود. با این حال مهاجرت به سمت کلاندادهها به خاطر این قبیل نیازها پیشنهادی نیست که ما به آنها بدهیم.
طاهره صاحب:
در ایران مقوله کلاندادهها به تازگی مطرح شده است. طبق مقالات نشریههایی همچون هاروارد بیزینس، کلاندادهها برخلاف سایر فناوریها رشد میکنند، چون به شرکتها کمک میکنند تا درکی از مشتریان خود داشته باشند. توجه به کلاندادهها تا حدی به سیستم اقتصادی کشورها بستگی دارد که آیا اساساً مشتری در بازار وجود دارد یا نه. با وجود اینکه داده در ایران زیاد وجود دارد و بانکها تاحدود زیادی داده تولید میکنند، اما در ایران رقابت قابل توجهی در بازار وجود ندارد. در آمریکا کسبوکار جدیدی راهاندازی شده تحت عنوان کلاندادهها به مثابه خدمات BDAS (Big Data As a Service)، بسیاری از سازمانها دادههایی تولید میکنند و آنها را میفروشند. علاوه بر این، نیاز زمانی مشخص میشود که طراحی مفهومی وجود داشته باشد. در آمریکا هر شرکتی برای اینکه بفهمد آیا به مقوله کلاندادهها در یک پروژه نیاز دارد یا نه، معماری مفهومی آن را ایجاد میکند. معماری مفهومی به آنها نشان میدهد چه فرایندهای کسبوکاری دارند و آیا با کمک کلاندادهها میتوانند به اهداف کسبوکاری خود برسند یا نه. یکی دیگر از مشکلات ایران این است که در سازمانها و ادارات دولتی به عنوان مهمترین تولیدکنندگان و صاحبان داده، سیلوهای اطلاعاتی وجود دارد. سطح بلوغ کلاندادهها در هر سازمانی با همین سیلوهای اطلاعاتی شروع میشود. اگر این دادههای جزیرهای متمرکز شوند، به طور مسلم ادارات دولتی هم متوجه خواهند شد که ما داده برای تحلیل داریم. اما زمانی که این سیلوها مجزا باشند ادارات دولتی احساس نیاز پیدا نمیکنند.
با فرض وجود نیاز و علاقه سازمانها به کلاندادهها، چقدر لوازم استفاده درست از آنها، پردازش موازی و محاسبات ابری در ایران وجود دارد؟ لوازمی همچون زیرساخت، سختافزار، نیروی انسانی و…
شادی امیدواران: برای درک داده، باید ابتدا کسبوکار را بشناسید. از زمانی که من شروع به فعالیت در حوزه پایگاه داده تحلیلی، هوش تجاری و بعد کلاندادهها کردهام همیشه متخصص خوب در کشور داشتهایم. ایرانیها در وارد شدن به تکنولوژی خیلی خوب هستند، کافی است به کسی که تا به حال در حوزه پایگاه تحلیلی داده کار میکرده بگوییم از امروز در حوزه کلاندادهها کار کند. تاکنون مشکل تکنولوژی هم نداشتهایم. به طور کلی تیمی که روی این موضوع کار میکند باید این کسبوکار را بشناسد. این میتواند ابزار خوبی در کنار تکنولوژی و سختافزارها باشد. پیدا کردن زبان مشترک با حامیان مالی آن پروژه هم باعث ثمربخش شدن آن میشود. برخلاف سایر پروژههای نرمافزاری که فرایندها را ابتدا تعریف میکنیم، بعد انجام میدهیم و در نهایت با چند تست کار به خوبی پیش میرود، در کلاندادهها باید بعد از گرفتن جواب از آن استفاده و کسب درآمد کنیم. در غیر این صورت پروژه موفقی نمیشود و هزینه زیادی در آن مسدود میماند.
پس به نظر شما کلید این موضوع در تجاریسازی آن نهفته است؟
باید نگاه تجاریسازی وجود داشته باشد تا همه پای آن بایستند و سرانجام پولی به دست بیاید. علت کارسازی هوش تجاری در حوزه بانکداری و تلکام این است که آنجا توانسته به کسب درآمد برسد.
ریکامندر طی سالهای فعالیتهای خود مجبور به تعریف این بازار در کنار خود بوده است. شاید سختترین قسمت ماجرا همین باشد. چگونه این مشکل را حل میکنید؟
امیر صدیقی: نقطه ورود به کسبوکارهای حوزه داده تنها مربوط به کسبکارهایی است که در حال له شدن زیر فشار رقابت هستند. وقتی سازمانی ثروت عظیمی دارد، با یک بودجه دولتی و رانت تامین میشود، انگیزهای برای بهبود و ترقی ندارد، مشتریان آن همیشه به وفور حاضر هستند و رقیبی ندارد، نیازی به تحلیل داده، معیارهای اندازهگیری و افزایش همگرایی هم ندارد. قبل از ریکامندر راهحل دیگری تحت عنوان هلیو داشتیم که کار تشخیص تقلب انجام میداد. فکر میکردیم این محصول گل سرسبد ماست، اما نتوانستیم وارد بانکها شویم، چون انگیزهای برای این کار نداشتند. وقتی رقابت جدی و واقعی وجود داشته باشد، آن زمان ریسک را میپذیرند تا راهکارتان را برایشان پیادهسازی کنید. کسبوکارهای کوچک از جمله استارتآپها و کسبوکارهایی که استرس دارند و زندگی خود را ریسک کردهاند بیشتر به این موضوع علاقه نشان میدهند. آنها به هر دری میزنند تا پیشرفتی حاصل شود. برای یک بار هم که شده حاضرند راهکار شما را امتحان کنند. شما باید برای آن موقع آماده باشید، باید ادغامها را به نهایت سادگی رسانده باشید و اسناد را برای صاحبان کسبوکار و بازار هدف آماده کرده باشید تا یکپارچگی سریعتر اتفاق بیفتد.
مقوله داده در ایران حتی در یک کسبوکار خصوصی و رقابتی به شدت امنیتی تلقی میشود و نسبت به انتشار و از دست رفتن آن حساسیت نشان داده میشود. در نتیجه سیلوهای داده تبدیل به مرداب اطلاعاتی میشوند. این وضعیت چگونه حل خواهد شد؟
این موضوع یکی از اشکالات بحث تحلیل داده و کلاندادههاست. ما یک سیستم مدیریت حقوق اساسی درست نداریم و افراد خود را نسبت به این مساله آگاه و مطمئن نمیکنیم که این حجم عظیم دادهها قابلیت سطوحبندی دارند و میتوان قابلیتهای دسترسی متفاوتی برایشان تعریف کرد. باید فضا، سیستم و ابزارهایی برای سازمانهای خود فراهم کنیم. به آنها اطمینان دهیم که این داده در یک ساختار مشخص و بر اساس دسترسی مشخصی در اختیار افراد قرار خواهد گرفت. سامانه سنحاب بیمه مرکزی ایران یکی از این نمونهها بود. سازمان بیمه مرکزی حجم وسیعی از دادهها را از تمام کارگزاران خود جمعآوری کرده است. یک دیتاسنتر دارد که ما به بخشی از دادههای آن دسترسی داریم و برای این دسترسیها سطوح مختلفی از پروتکلهای امنیتی را مهیا کردهایم. بحث دیگر مربوط به قراردادهاست. سازمانها باید یک واحد حقوقی درست داشته باشند و با پیمانکاران قراردادهایی امضا کنند تا از امنیت اطلاعات خود مطمئن باشند. با یک قرارداد محکمتر و یک سیستم منسجم و یکپارچهتر میتوانید این ارتباط را برقرار کنید. اما این یک ارتباط دوطرفه است.
طاهره صاحب: یکی دیگر از مشکلات میتواند بحث مالکیت فکری دادهها باشد.
بحث قراردادها و تفاهمنامههای محکم میتواند این مساله را حل کند.
این موضوع در حوزه بانکی فوق حساس است، چون شامل دو بحث میشود: حساسیت داده مشتری بانک و حریم شخصی. دادهکاوان هوشمند توسن چگون ه این معضل را حل کرده است؟
حریم شخصی و محرمانگی افراد همیشه یکی از جنبههای دادهکاوی بوده است. یکسری تکنیکها تحت عنوان محافظت از محرمانگی در دادهکاوی وجود دارد که میتواند داده کدگذاریشده را تحلیل کند.
پس شما به اصل داده دسترسی ندارید؟
بله همینطور است، اما این بحث حالت صد درصدی ندارد. در تعاملی که با بانک داریم هیچگاه به ما داده نمیدهند. ما تکنیکهای تحلیلی خود را با همین اسکیمها روی دادههای جعلی پیاده میکنیم؛ یعنی به جداول و موضوعات آنها نگاه میکنیم اما محتوایشان جعلی هستند؛ با همان اسکیمها مدلهای خود را میسازیم اما برای تست نهایی در بانک اجرا میکنیم.
بسیاری از این تکنیکها در یک فضای از پیش تعیینشده درست عمل میکنند، اما وقتی وارد سیستم واقعی میشوید جوابگو نیستند. آیا این دو مقوله در کنار یکدیگر حل نمیشوند؟
اولین گام ما درک کسبوکار است و بعد درک داده و ارزیابی مدل. در حوزه درک کسبوکار نیروهای بسیار خوبی داریم که کسبوکار بانکی را از خود بانکیها بهتر میشناسند و حتی بسیاری از آنها پیشتر در بانکها مشغول به کار بودهاند. برخی نرمافزارها هستند که بدون درک کسبوکار مدلهای تحلیلی ارائه و دادهای را تحت عنوان تقلب استخراج میکنند، اما خروجی آنها لزوماً معنادار نیست. ما درک از کسبوکار داریم و اگر روی دادهای کار میکنیم میدانیم که آن فیلد مربوط به انتقال وجه، کارت، سپرده و… است، فقط محتوای آن برای ما نامشخص است.
آیا بحث اعتماد در مکانیسم ذهنی مدیران به ویژه در حوزه مالی هنوز بیشتر جنبه انسانی دارد تا حقوقی یا فنی؟
قربان خردمندیان: بله همینطور است.
من مشاور چند پروژه کلانداده هستم، اما مدیر پروژه دیتا را در اختیار من نمیگذارد. از من تعهد میخواهد. در ایران حساسیت زیادی در این خصوص وجود دارد، در حالی که مبحث کلاندادهها یک موضوع کاملاً میانرشتهای است. شغلهای مختلفی در این حوزه شکل گرفته است: از علوم داده و مهندسی داده گرفته تا مدیریت هدوپ، کارشناس آمار و برنامهنویس. بنابراین پیادهسازی هر پروژه در این زمینه نیازمند حضور تخصصهای مختلف در آن تیم است. در ایران متاسفانه هنوز این روحیه کار تیمی و مهارتهای خاص وجود ندارد. شاید یکی از دلایل شکست پروژههای کلاندادهها همین موضوع باشد. با وجود اینکه حجم سرمایهگذاری روی کلاندادهها (مثلاً برای راهاندازی سیستم هدوپ) بالاست، اما تا زمانی که مدیریت به اهمیت این موضوع پی نبرده باشد به دنبال سرمایهگذاری برای آن نمیروند. بسیاری از پروژههای کلاندادهها در آمریکا نیز از لایه مدیران ارشد شروع شده است.
پیمانکار، تیم فنی، ارائهکننده سرویس یا صاحب داده بودن چقدر میتواند در جلب این اعتماد تاثیرگذار باشد؟
برخی از کسبوکارها و صنایع ممکن است برخلاف سایرین هنوز حساسیتهای خاصی در برخی مسائل داشته باشند. بانکها و سایر کسبوکارهایی که سرویسدهی آنها روی تبادل داده متمرکز است و منفعت عینی بیشتری از آن دارند، چون مدتها با دادهها سر و کار داشتهاند سیاستگذاری حمایت از داده را به خوبی میشناسند. حتی اگر رقبایی داشته باشند میدانند چگونه با خیال آسوده دادههای دیتابیس خود را در اختیار دیگران قرار بدهند. هرچند ارائهکنندگان سرویس به حمایت از دادهها اطمینان دارند، اما تصمیم خود را در اختیار پیمانکار نمیگذارند. کار کردن در کنار کارفرمایان و صاحبان داده شما را از تصمیم آنها مطلع میکند. هر اندازه داده داشته باشید تا زمانی که تصمیم را ندانید فقط میتوانید یک بستر خوب فراهم کنید و این کافی نیست.
به نظر شما قرار گرفتن سمت صاحب داده شما را در فرایند تصمیم شریک میکند؟
گارتنر نیز در زمینه هوش تجاری و کلاندادهها پیشنهاد میکند بهتر است این مقولات درونسازمانی شوند و نهایت برونسپاری آنها نیرو گرفتن از خارج سازمان باشد. اما نظارت حامی مالی هم میتواند بسیار تاثیرگذار باشد. آنها با تشکیل کمیتههایی متشکل از فعالان آن کسبوکار و تیم تکنولوژیک تصمیمسازی میکنند. برنامهریزی برای آن بسیار مشکل است، چون رفت و بازگشت آن پرهزینه است و امکان دارد اعتبار را از بین ببرد. همه تجربهها و شناختها برای جلوگیری از این رفت و بازگشت است. ممکن است ۵۰۰ میلیون تومان در همین رفت و بازگشت از بین برود. این در حالی است که اجرای آن بسیار آسان است، چون شما فناوریهای مختلفی برای استفاده در اختیار دارید که به خوبی با هم یکپارچه میشوند. نمیتوان گفت اعتمادی به پیمانکار وجود ندارد، اما باید در کنار بستر محکمی نزد کارفرما از آن استفاده شود.
در چنین شرایطی به نظر میرسد مجموعههایی که به طور مشخص در حوزه تحلیل کلاندادهها فعالیت میکنند به راهاندازی نرمافزار محدود میمانند…
این به نوعی برونسپاری است. چون هر قدر شما در حوزهای خوب عمل کنید اگر کسی را پیدا کنند که از شما حرفهایتر، بهتر و ارزانتر کار کند، حتماً برونسپاری میکنند. در چنین شرایطی اگر موضوع محرمانگی را رعایت کنید و در اطلاعات مشتری سرک نکشید، خوشنام میشوید. با انبارداری، ساخت ابزارها، فعالیت در سایر کسبوکارها، تبدیل مزایای کسبوکاری آنها به الگوریتم سیستم خود و سادهسازی یکپارچه کردن آن میتوانید ارزش بسیار خوبی را ارزانتر و سریعتر از تیم خودشان عرضه کنید. سرمایهگذاری روی فناوریهایی همچون کلاندادهها که مدام روند آنها تغییر میکند ریسک بسیار زیادی برای کسبوکارهای بزرگ دارد. این بیثباتی باعث میشود شرکتها تنها گوشهای از کسب وکار خود را در اختیار حوزه کلاندادهها بگذارند. البته در کسبوکارهایی که درون خود نیروهای قوی دارند، ایمان به ارزش چنین سرویسهایی از قبل به طور خودکار شکل گرفته است. علاوه بر این، پدیدهای به نام API economy در دنیای امروز وجود دارد؛ مثلاً گوگل بخشی از زیرساخت خود را از آمازون دریافت میکند. شرکتها باید تیمهای قدرتمندی درون خود داشته باشند و سرویسهایی را هم از بیرون دریافت کنند. با ترکیب اینها ارزشهای جدیدتری متولد میشود. بعدها ممکن است آن را به صورت پلتفرم در اختیار دیگران بگذارند و در این میان کسبوکار دیگری نیز خلق شود.
در آمریکا به جای کلانداده از اصطلاح اسمک (smac) استفاده میکنند، یعنی شبکههای اجتماعی و سنسورها، موبایل، تحلیلهای پیشرفته و سیستم ابری. برای داشتن بیشترین منفعت در کسبوکار باید این چهار مورد با هم ادغام شوند. بیشتر کسبوکارهای آمریکا تحلیلهای خود را به سمت فضای ابری میبرند، اما در ایران موضوع امنیتی است و این مساله باعث شده بسیاری از بانکها به سمت فضای ابری نروند.
تحریم تکنولوژی نیز ضربه مهلکی به این حوزه زد. اساساً کلاندادهها مساوی داده و پردازش است، اما در ایران همه دادهها را در مشت خود نگه میدارند. اگر نیاز به فضای ابری دارید آمازون به شما ظرف ۳۰ ثانیه نُد هدوپ یا اسپارک میدهد. چنین ظرفیتی به صورت آزاد در تمام دیتاسنترهای ایران وجود ندارد. این ظرفیتها باید روی فضاهای ابری بینالمللی ارائه شود. تحریم تکنولوژی به طور خودکار این پردازش را از ما گرفته است. حتی اگر بانک ثروتمندی ۵۰۰ سرور G9 بخرد و دیتای عظیمی را در آن نگهداری کند، با پردازش همین دادهها، دادههای ثانویه ایجاد میشود. باید در مورد ذخیره و پردازش قابلیت ارتجاعی داشته باشیم. نباید محدودیتی وجود داشته باشد در غیر این صورت آن کارکردی که در خارج وجود دارد در ایران به وجود نخواهد آمد.
بانکها در مورد مهاجرت از روش سنتی به کلاندادهها محافظهکار هستند، حتی اگر نیاز آن را حس کنند و این موضوع به طور کامل برای آنها جا بیفتد.
با توجه به اینکه دست سطوح بالایی حکومت برای هزینه کردن و پردازش اطلاعات همیشه باز بوده است، به نظر شما چرا کلانداده وارد آن لایه نشده است؟
یکی از ارزش افزودههایی که کلاندادهها دارند، علاوه بر جنبه مالی، بحث امنیتی است اما نه در سازمانهای دولتی، چون هنوز مدیران ارشد کشور به اهمیت فناوریهای نو پی نبردهاند. یا اینکه هنوز ترجیح میدهند سیستم ما به روال سنتی خود پیش برود. از تکنولوژی و دنیای جدید میترسند. ترجیح میدهند فاصله بگیرند تا اتفاقی خارج از کنترلشان رخ ندهد. علاوه بر این چون تحریمها باعث میشود زیرساختهای نرمافزاری و سختافزاریای که خارجی هستند یکباره از دسترس خارج شوند و علیه خودمان استفاده شوند، مدیران چندان به این مهاجرتها خوشبین نیستند.
دانشی که آنها از طریق جیمیل یا گوگل باکس از ما دارند، از دانش خود ما بیشتراست.
از طریق بومیسازی تکنولوژی و تربیت و تقویت نیروی انسانی میتوانیم ضمن رفع این نگرانیها اشتغالزایی کنیم.
با وجود موانع متعددی که برای کلاندادهها در کشور وجود دارد چگونه این صنعت راه خود را پیش برده است؟
مزیت رقابتی عامل اصلی است. این مزیت رقابتی به راحتی به دست نمیآید و از جنس تکنولوژی است. اگر بهرهبرداری از اطلاعات، به وجود آوردن تیمها و حتی استفاده از سرویسهای طرف سوم به خوبی انجام شود، اینها مزیت ایجاد میکند. جنس دادههایی که شرکتهای بزرگ و اپراتورها با آنها مواجه هستند مثل سابق نیست و نمیتوان آنها را در سامانههای قدیمی نگهداری و پردازش کرد، اما فناوری کلاندادهها به سازمانهای بزرگ B2C در این زمینه کمک میکند
امیر صدیقی
مدیرعامل recommender.ir
دارای مدرک کارشناسی ارشد نرم افزار و ۲۵ سال سابقه در توسعه نرمافزار
لیلی میرطاهری
عضو هیات علمی دانشگاه خوارزمی و مشاورمرکز تحقیقات فوق پیشرفته سوپرکامپیوتر ایتالیا، دارای مدرک دکترای تحقیق در عملیات از دانشگاه کالابریای ایتالیا و مدرک دکترای نرم افزار از دانشگاه علم و صنعت ایران
شادی امیدواران
مدیریت پروژه BI شرکت شاتل با استفاده از تحلیلهای پیشرفته بیگ دیتا
مهندس کامپیوتر نرم افزار
فعالیت در حوزه پایگاه داده تحلیلی از سال ۸۴
طاهره صاحب
عضو هیات علمی دانشگاه تربیت مدرس
استاد مدعو دانشگاه spjain بمبئی هندوستان
دارای مدرک دکترای مطالعات علم و فناوری از دانشگاه رنسلیر آمریکا
قربان خردمندیان
عضو تیم دادهکاوی در شرکت دادهکاوان هوشمند توسن
مدرک دکترای هوش مصنوعی از دانشگاه صنعتی امیرکبیر. حوزههای تخصصی مورد علاقه دادهکاوی، کاوش کلاندادهها، کاوش متن، پردازش زبان طبیعی