مطالب پژوهشی درباره : خوشهبندی فازی دادهها بر اساس منطق فازی- فایل ۶ |
![]() |
مرحله سوم: پس از محاسبه مجدد چگالی برای هر نقطه از دادهها مرکز بعدی انتخاب میشود و دوباره همهی محاسبات برای چگالی نقاط دادهها اصلاح میشود. این روند تا زمانی ادامه مییابد که تعداد کافی از نقاط مراکز خوشهها تولید گردد.
مرحله چهارم و پنجم: حیاتیترین بخش الگوریتم، خوشهبندی فازی است و عملکرد این خوشهبندی وابستگی شدید به حدس پارامترهای اولیه دارد. (برای بهینهسازی این روند در ابتدا از الگوریتم خوشهبندی تفاضلی جهت تعیین تعداد مراکز استفاده شده است که خود این الگوریتم نیز پارامترهایی نظیر شعاع همسایگی دارد که به عنوان ورودی به الگوریتم اعمال میشود که انتخاب این پارامتر بنا به حساسیت کار و ساختار دادهها تعیین میگردد).
همانطور که اشاره شد خروجی این الگوریتم تعداد مراکز خوشهها خواهد بود که به عنوان ورودی الگوریتم خوشهبندی فاز اعمال خواهد شد. در زیر روند الگوریتم خوشهبندی فازی ارائه شده است.
مقدار دهی اولیه ، و خوشههای اولیه
محاسبهی مراکز خوشهها
محاسبهی ماتریس تعلق از روی خوشههای محاسبه شده در مرحلهی ۲.
اگر شرط خاتمه برقرار شود ( در تکرارهای مختلف تغییر چندانی نکند) الگوریتم پایان مییابد. در غیر اینصورت الگوریتم از فاز ۲ ادامه مییابد.
در این الگوریتم C به عنوان تعداد مراکز خوشهها ،m به عنوان پارامتر فازی سازی و در واقع پراکندگی مراکز را نشان میدهد که در این کار از m=1.2 جهت افزایش پراکندگی استفاده شده است و U ماتریس تعلق مطرح هستند. ماتریس U میزان تعلق هر داده نسبت به خوشه را نشان میدهد که در این کار ما از این ماتریس جهت انتخاب دادهها بهره گرفته ایم به این نحو که با تعیین یک مقدار تعلق خاص با نام K و مقایسه آن با میزان تعلق هر خوشه که در واقع هر سطر ماتریس U یک داده را به عنوان کاندید دادهی آموزشی انتخاب میکنیم البته میتوان تعداد نقاط بیشتری را نیز انتخاب کرد ولی در الگوریتم پیشنهادی فقط یک نقطه انتخاب میگردد . بنابراین به تعداد خوشهها دادههای آموزشی خواهیم داشت.
مرحله ششم: پس انتخاب دادههای آموزشی نوبت به آموزش SVM میرسد، در ابتدا برای انتخاب پارامترهای کرنل (کرنل پیشنهادی کرنل RBFمیباشد) و SVM از الگوریتم GRID SEARCH استفاده شده و به این ترتیب دو پارامتر پنالتی C و پهنای کرنل بدست میآیند.
الگوریتم Grid search یک روش جستجو است که همه حالات ممکن را بررسی می کند و معمولا برای کارهایی است که نمیتوان در آنها منطقی پیدا کرد. این روش شامل شمارش نظام مند تمام نامزدهای ممکن برای حل و چک کردن اینکه کدام نامزد قادر به اجرای شرط مساله است. به عنوان مثال امتحان کردن همه حالات چهار رقمی برای پیدا کردن رمز عابر بانک. حال اگر نتیجه بدست آمده از الگوریتم Grid search مقبول نبود میتوان الگوریتم را مجدد با پارامترهای مناسب ارزیابی کرده و به نتیجهی مطلوب رسید.
این طرح در واقع نمونهی بهبود یافتهی الگوریتمهایی است که تنها از خوشهبندی فازی استفاده کردهاند و در واقع در این طرح کلیه روند اعم از تعداد خوشه و تعداد داده آموزشی قابل کنترل میباشد و با این اختیارات میتوان روند آموزش ماشین بردار پشتیبان را به صورت کاملا کنترل شده بهینه ساخت. در این پژوهش مشکل زیاد بودن SV ها که منجر به زیاد شدن تعداد قوانین SVM میشود با انجام این مراحل حل میشود.
فصل چهارم: نتایج شبیهسازی
۴-۱ مقدمه
در این فصل نتایج تجربی برای ارزیابی روش پیشنهادی روی مجموعه دادههای مختلف و پارامترهای مورد استفاده گزارش شده است. مجموعه دادههای مورد استفاده شامل مجموعه دادههای استاندارد یو سی ای می باشد[۲۱]. همچنین نتایج آزمایش ها که نشان از کارایی نسبتا بالای روش پیشنهادی میباشد در این فصل ارائه شده است.
۴-۲ پایگاه داده و پارامترهای شبیه سازی
در این بخش مشخصات پایگاه داده استفاده شده و همچنین پارامتر های شبیه سازی ارائه شده است:
جدول ۴-۱ : مشخصات دادههای مورد استفاده
Fourclass
Svmguide1
Votes.84
Records
۸۶۲
۴۰۰۰
۴۳۵
Features
۲
۴
۱۶
class
۲
۲
۲
جدول ۴-۲ : پارامترهای کرنل
فرم در حال بارگذاری ...
[چهارشنبه 1400-08-05] [ 09:48:00 ق.ظ ]
|