وکا (Weka) یک نرم افزار داده کاوی متنباز میباشد که بسیاری از الگوریتمهای یادگیری ماشین را پشتیبانی میکند. تمام قسمتهای این نرمافزار به زبان جاوا نوشته شده است و در نتیجه میتواند بر روی هر پلتفرمی اجرا گردد. در ادامه توضیحاتی در خصوص قسمت های مختلف این نرم افزار ذکر شده است و همچنین قابلیت های اصلی آن به صورت جزئی بررسی شده است که با مراجعه به آن ها می توانید بررسی کنید که آیا این نرم افزار به منظور اجرای پروزه شما مناسب می باشد یا خیر . همچنین لینک دانلود نرم افزار و کتاب آموززشی آن نیز در انتهای متن موجود است.
این پکیج شامل چهار واسط کاربری متفاوت میباشد:
حال شاید بخواهید با قابلیت های نرم افزار بیشتر آشنا شوید. در ادامه عملگرهای مختلف موجود در این نرم افزار تشریح شده اند.
برخی از توابع وکا به منظور آماده سازی دادهها به شرح زیر می باشد:به منظور مشاهده فهرست تمامی توابع آمادهسازی دادهها در وکا به اینجا مراجعه نمایید.
روشهای خوشهبندی در این نرم افزار نیز به شرح زیر هستند:
روشهای کشف قواعد انجمنی نیز به شرح زیر هستند:
برخی از روشهای ردهبندی معمول و جمعی موجود در این نرم افزار نیز به شرح زیر هستند:
روش های انتخاب متغیرها (ویژگی) در این نرمافزار به دو دسته فیلتری و پوشاننده تقسیم بندی شده اند. از میان روشهای فیلتری موجود میتوان به روشهای chi-squared، سود اطلاعاتی، شاخص جینی و روش relief اشاره نموده. همچنین در روشهای پوشاننده نیز امکان استفاده از روشهای ردهبندی وجود دارد. همچنین به منظور جسجوی مجموعه متغیرهای بهینه در روشهای پوشاننده نیز روشهای جستجوی متفاوتی ارائه شده است که از جمله آنها میتوان به best-first(اولین بهترین ها)، forward selection (انتخاب روبه جلو)، الگوریتم ژنتیک و الگوریتم ازدحام ذرات اشاره نمود.
در نرم افزار وکا همچنین قابلیت کار با مجموعه دادههای بزرگ و به اصطلاح Big Data وجود دارد. در هنگام مواجه با این مسائل بهترین پیشنهاد استفاده از پکیج command-line میباشد. همچنین امکان نوشتن کد مستقیما در جاوا یا زبانهای بر پایه جاوا مانند Groovy یا Jython نیز وجود دارد.
به طور کلی محاسن این نرم افزار عبارتند از:
برخی از معایب آن نیز عبارند از:
برای یادگیری این نرمافزار منابع زیادی وجود دارد. یکی از این منابع که قسمت command line و بسیاری از عملگرهای این نرم افزار را به منظور پیش پردازش داده ها و مدلسازی یطور جامع تشریح کرده است توسط Witten و Frank نوشته شده است. لینک دانلود این کتاب در انتهای متن موجود است. از فصل نهم به بعد این کتاب در خصوص نرم افزار توضیحاتی ارائه شده است.
نرم افزار وکا یک نرم افزار متن باز است و می توانید آنرا از این لینک دانلود نمایید.
برگرفته ار سایت irandatamining
تحلیل نهایی:
به قول یکی از دوستان "عزیزان در تحلیل نهایی" می توان گفت که نرم افزار وکا به منظور اجرای مدل های رده بندی علی رقم سرعت پایین آن، یکی از حرفه ای ترنی نرم افزارهای موجود است. تعداد بیشماری از مقالات منتشر شده تاکنون از این نرم افزار به منظور مدلسازی های خود استفاده نموده اند. همچنین این نرم افزار با داشتن دامنه وسیعی از روش های انتخاب ویژگی بسیار مناسب برای تحقیقاتی است که می خواهند از این روش ها استفاده کنند. یک ضعف اصلی این نرم افزار عدم وجود تحلیل کافی در خصوص روش های خوشه بندی است و همچنین عدم وجود شاخص های ارزیابی برای این روش ها است. در نهایت وکا با وجود محیط های مختلف در کوتاهترین زمان قابل یادگیری است و این یکی از مزیت های اصلی آن نیز می باشد.