پردازش زبان طبیعی

دست به کد: طبقه‌بندی متن به کمک کتابخانه یادگیری عمیق کراس

چندی پیش در کانال @machine_learning_world مطلبی منتشر شد حاوی کدهای لازم برای طبقه‌بندی متن با استفاده از زبان پایتون و کتابخانه محبوب کراس (آدرس مطلب).

حیفم آمد این کد و توضیحات مفید آنرا که برای سایر علاقه‌مندان این حوزه هم قابل استفاده است، منتشر نکنم. هر چند نام نویسنده مطلب مشخص نیست اما سپاسگزار تمام عزیزانی هستم که نتایج یافته‌های خود را به رایگان در اختیار سایرین قرار می‌دهند.

به عادت مالوف، کد و داده‌های این پروژه را در فضای کاری کتابچه‌های آژور مایکروسافت آپلود کردم که علاقه‌مندان بتوانند به سرعت و به صورت آنلاین، پروژه را کلون کرده و همانجا اجرا کنند.

http://imuhammad.ir/2018/11/25/299/

نمونه پروژه اصلی هم در این آدرس قابل دانلود است.

مجتبی بنائی

دانشجوی دکترای نرم‌افزار دانشگاه تهران (yun.ir/smbanaie)، مدرس دانشگاه و فعال در حوزه توسعه نرم‌افزار و مهندسی داده که تمرکز کاری خود را در چند سال اخیر بر روی مطالعه و تحقیق در حوزه کلان‌داده و زیرساخت‌های پردازش داده و تولید محتوای تخصصی و کاربردی به زبان فارسی و انتشار آنها در سایت مهندسی داده گذاشته است. مدیریت پروژه‌های نرم‌افزاری و طراحی سامانه‌های مقیاس‌پذیر اطلاعاتی از دیگر فعالیتهای صورت گرفته ایشان در چند سال گذشته است.

۲ دیدگاه

  1. با سلام  و عرض ادب دوباره خدمت شما 
    چند مدتی است که در حال طراحی یک سرور stateful(برای گیم سرور) هستم و از اونجایی که ممکنه کرش کنه باید هرچند ثانیه یکبار داده رو یکجای دیگه ذخیره کنم تا اگر سرور کرش کرد از اونجا دوباره به داده دسترسی داشته باشم ! 
    تقریبا اکثر دیتابیس های موجود رو برررسی کردم ولی هنوز به نتیجه نرسیدم ! شما چه پیشنهادی میدید ؟ 
    داده ای که از طرف کلاینت ارسال میشه تقریبا در این حالته : 
    pos = 

    1. به نظرم بهتره که شما از دیتابیس‌هایی که حالت مستر/اسلیو نداره و کرش یک نود هیچ تاثیری روی داده‌ها نداره، مثل کاساندرا در کنار ردیس در حالت توزیع شده، استفاده کنید که خیالتون از داشتن بکاپ از داده‌ها و از بین نرفتن اطلاعات راحت باشه و بتونید روی الگوریتم‌ها و خود بازی تمرکز کنید. timescaledb‌ را هم به جای کاساندرا توصیه می کنم.
      کپی اطلاعات در هر چند ثانیه یک باراز یک سرور به سرور دیگر، راه حل مهندسی این کار نیست و مثل این میمونه که شما بخواهید چرخ توزیع شدگی داده‌ها را برای دیتابیس‌های امروزی دوباره اختراع کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

دکمه بازگشت به بالا