مرحله سوم: پس از محاسبه مجدد چگالی برای هر نقطه از داده‌ها مرکز بعدی انتخاب می‌شود و دوباره همه‌ی محاسبات برای چگالی نقاط داده‌ها اصلاح می‌شود. این روند تا زمانی ادامه می‌یابد که تعداد کافی از نقاط مراکز خوشه‌ها تولید گردد.
پایان نامه
مرحله چهارم و پنجم: حیاتی‌ترین بخش الگوریتم، خوشه‌بندی فازی است و عملکرد این خوشه‌بندی وابستگی شدید به حدس پارامترهای اولیه دارد. (برای بهینه‌سازی این روند در ابتدا از الگوریتم خوشه‌بندی تفاضلی جهت تعیین تعداد مراکز استفاده شده است که خود این الگوریتم نیز پارامترهایی نظیر شعاع همسایگی دارد که به عنوان ورودی به الگوریتم اعمال می‌شود که انتخاب این پارامتر بنا به حساسیت کار و ساختار داده‌ها تعیین می‌گردد).
همانطور که اشاره شد خروجی این الگوریتم تعداد مراکز خوشه‌ها خواهد بود که به عنوان ورودی الگوریتم خوشه‌بندی فاز اعمال خواهد شد. در زیر روند الگوریتم خوشه‌بندی فازی ارائه شده است.
مقدار دهی اولیه ، و خوشه‌های اولیه
محاسبه‌ی مراکز خوشه‌ها
محاسبه‌ی ماتریس تعلق از روی خوشه‌های محاسبه شده در مرحله‌ی ۲.
اگر شرط خاتمه برقرار شوددر تکرارهای مختلف تغییر چندانی نکند) الگوریتم پایان می‌یابد. در غیر اینصورت الگوریتم از فاز ۲ ادامه می‌یابد.
در این الگوریتم C به عنوان تعداد مراکز خوشه‌ها ،m به عنوان پارامتر فازی سازی و در واقع پراکندگی مراکز را نشان می‌دهد که در این کار از m=1.2 جهت افزایش پراکندگی استفاده شده است و U ماتریس تعلق مطرح هستند. ماتریس U میزان تعلق هر داده نسبت به خوشه را نشان می‌دهد که در این کار ما از این ماتریس جهت انتخاب داده‌ها بهره گرفته ایم به این نحو که با تعیین یک مقدار تعلق خاص با نام K و مقایسه آن با میزان تعلق هر خوشه که در واقع هر سطر ماتریس U یک داده را به عنوان کاندید داده‌ی آموزشی انتخاب می‌کنیم البته می‌توان تعداد نقاط بیشتری را نیز انتخاب کرد ولی در الگوریتم پیشنهادی فقط یک نقطه انتخاب می‌گردد . بنابراین به تعداد خوشه‌ها داده‌های آموزشی خواهیم داشت.
مرحله ششم: پس انتخاب داده‌های آموزشی نوبت به آموزش SVM می‌رسد، در ابتدا برای انتخاب پارامترهای کرنل (کرنل پیشنهادی کرنل RBFمی‌باشد) و SVM از الگوریتم GRID SEARCH استفاده شده و به این ترتیب دو پارامتر پنالتی C و پهنای کرنل بدست می‌آیند.
الگوریتم Grid search یک روش جستجو است که همه حالات ممکن را بررسی می کند و معمولا برای کارهایی است که نمی‌توان در آنها منطقی پیدا کرد. این روش شامل شمارش نظام مند تمام نامزدهای ممکن برای حل و چک کردن اینکه کدام نامزد قادر به اجرای شرط مساله است. به عنوان مثال امتحان کردن همه حالات چهار رقمی برای پیدا کردن رمز عابر بانک. حال اگر نتیجه بدست آمده از الگوریتم Grid search مقبول نبود می‌توان الگوریتم را مجدد با پارامترهای مناسب ارزیابی کرده و به نتیجه‌ی مطلوب رسید.
این طرح در واقع نمونه‌ی بهبود یافته‌ی الگوریتم‌هایی است که تنها از خوشه‌بندی فازی استفاده کرده‌اند و در واقع در این طرح کلیه روند اعم از تعداد خوشه و تعداد داده آموزشی قابل کنترل می‌باشد و با این اختیارات می‌توان روند آموزش ماشین بردار پشتیبان را به صورت کاملا کنترل شده بهینه ساخت. در این پژوهش مشکل زیاد بودن SV ها که منجر به زیاد شدن تعداد قوانین SVM می‌شود با انجام این مراحل حل می‌شود.
فصل چهارم: نتایج شبیه‌سازی
۴-۱ مقدمه
در این فصل نتایج تجربی برای ارزیابی روش پیشنهادی روی مجموعه داده‌های مختلف و پارامترهای مورد استفاده گزارش شده است. مجموعه داده‌های مورد استفاده شامل مجموعه داده‌های استاندارد یو سی ای می باشد[۲۱]. همچنین نتایج آزمایش ها که نشان از کارایی نسبتا بالای روش پیشنهادی می‌باشد در این فصل ارائه شده است.
۴-۲ پایگاه داده و پارامترهای شبیه سازی
در این بخش مشخصات پایگاه داده استفاده شده و همچنین پارامتر های شبیه سازی ارائه شده است:
جدول ۴-۱ : مشخصات داده‌های مورد استفاده

 

 

 

 

Fourclass

 

Svmguide1

 

Votes.84

 

 

 

Records

 

۸۶۲

 

۴۰۰۰

 

۴۳۵

 

 

 

Features

 

۲

 

۴

 

۱۶

 

 

 

class

 

۲

 

۲

 

۲

 

 

 

جدول ۴-۲ : پارامترهای کرنل

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...