۳۵۳۵۵۲

 

۰

 

۴۰

 

۰

 

۳۴۵۷۳۶۳۴

 

 

 

ستون اول از سمت چپ شماره نشستهای مختلف میباشد.
ستون دوم مدت زمان سپری شده از شروع جلسه است.
ستون سوم نوع فعالیت کاربر را نشان میدهد. مثلاً اینکه کلیک اتفاق افتاده یا فعالیت کاربر پرس و جو است.
ستون چهارم یک شناسه منحصر به فرد از موتور جستجویی که صفحه وب مورد نظر را پیدا کرده نشان میدهد.
ستون پنجم یک شناسه منحصر به فرد از کاربر را نشان میدهد.
در این پایان نامه قصد داریم تا بر اساس شماره نشست صفحات وب را خوشه بندی نماییم.
فاکتور اصلی در انتخاب روش خوشه بندی، مقیاس پذیری روش در برابر دیتاستهای بزرگ است. برای اکثر روش های مدلسازی، زمان مورد نیاز برای کامپایل داده ها در یک مدل میتواند، زیاد باشد. بنابراین باید مستقل از پارامترهای کنترل کاربر باشد. علاوه بر این تکنیک مدلهای مطلوب باید در برابر نویز مقاوم باشد. رفتار کاربر در وب نامعین است، هر کاربر ممکن است صفحاتهای مشابهای را برای اهداف مختلف ملاقات کند و هر زمانی که کاربر به سایت دسترسی دارد، او ممکن است اهداف مختلفی داشته باشد. علاوه بر این کاربر مشابه در یک دوره مشابه ممکن است اهداف مختلف داشته باشد. در نتیجه الگوریتمهای خوشهبندی فازی برای حل این مسائل و کندوکاو مناسب است. بنابراین ما در این تحقیق برروی روش خوشه بندی فازی تمرکز داریم. بنابراین برای خوشهبندی این داده ها با بهره گرفتن از الگوریتم فازی- سی مینز میپردازیم.
پایان نامه - مقاله - پروژه
در مرحله تعیین تابع عضویت فازی، از الگوریتم ژنتیک برای بهینه سازی پارامترها و ورودیها استفاده میکنیم. الگوریتم ژنتیک ،یک نوع الگوریتم جستجو و بهینه سازی با مزیت هوش مصنوعی و خودیادگیری میباشد که فرایند تکاملی بیولوژیکی را شبیهسازی میکند(Ya-ling Tang & Feng Qin,2010). جمعیت اولیه ژنتیک به طور تصادفی انتخاب میشود .سپس تابع شایستگی با بهره گرفتن از جمعیت اولیه و پارامترهای ورودی تابع عضویت محاسبه میشود. به منظور حل هر مسئله با بهره گرفتن از الگوریتم‏های ژنتیکی, ابتدا باید یک تابع شایستگی برای آن مسئله ابداع شود. برای هر کروموزوم, این تابع عددی غیر منفی را برمی‏گرداند که نشان دهنده شایستگی یا توانایی فردی آن کروموزوم است.در این پایان نامه،تابع شایستگی، KNN Classify میباشد.
در الگوریتم‏های ژنتیکی, در طی مرحله تولیدمثل[۸] ازعملگرهای ژنتیکی استفاده می‏شود. با تأثیر این عملگرها بر روی یک جمعیت, نسل[۹] بعدی آن جمعیت تولید می‏شود. عملگرهای انتخاب[۱۰] , آمیزش[۱۱] و جهش[۱۲] معمولاً بیشترین کاربرد را در الگوریتم‏های ژنتیکی دارند.
پس از مرحله تعیین شایستگی هر کروموزوم، با بهره گرفتن از عملگر انتخاب، از بین کروموزوم‏های موجود در یک جمعیت, تعدادی کروموزوم را برای تولید مثل انتخاب میکند. Elitist Selectionروشی است که برای انتخاب در نظر گرفته شده است. در این روش، مناسب‌ترین عضو هر اجتماع انتخاب می‌شود. با توجه به مقدار شایستگی که از تابع شایستگی دریافت کرده است.
عملگر بعدی، کراس اور است که این عملگر به صورت اتفاقی بخشهایی از کروموزوم را با یکدیگر تعویض میکند.این عملگر باعث میشود که فرزند ترکیبی از خصوصیات والدین خود را داشته باشد .در این تحقیق از کراس اور چهار نقطهای استفاده میشود، یعنی در این مرحله کروموزومها به چهار گروه تقسیم میشوند و در هر مرحله این عملیات ادامه می یابد.
در مرحله بعد عملگرجهش انجام میشود و دوباره تابع شایستگی برروی داده های مرحله قبل اجرا میشود. در عملیات جهش، عملگر جهش به صورت تصادفی کروموزومی را از فرزندان انتخاب میکند و شکل آن را تغییر میدهد. وجود این عملگر به منظور اجتناب از نقاط بهینهی محلی ضروری است. از جمله روش های جهش میتوان به دو روش تبادلی و تصادفی اشاره کرد. در جهش تبادلی، دو ژن[۱۳] از یک کروموزوم انتخاب و با هم جابه جا میشوند. در جهش تصادفی مقدار ژن انتخابی با مقداری تصادفی جایگزین میگردد(Gonzales & Mabu & Taboada & Hirasawa,2010).
از آنجا که الگوریتم ژنتیک یک روش جستجوی تصادفی است، نمیتوان از رسیدن به بهترین جواب مطمئن بود . لذا، وجود شرایطی برای توقف الگوریتم ضروری است. بنابراین شرط توقف الگوریتم ژنتیک به صورت زیر است:
If 1/iteration_fitness(i) < 0.000001
break;
end
یعنی اگر مقدار تابع شایستگی که در هر مرحله محاسبه میشود از مقدار ۰.۰۰۰۰۰۱ کمتر باشد، الگوریتم متوقف میشود. در نهایت یک جمعیت نهایی در خروجی دست می آید که این همان مقادیر بهینه برای ورودی تابع عضویت است. در مرحله بعد ادامه الگوریتم خوشهبندی فازی ادامه مییابد، تا خوشهها مشخص شوند. در این مرحله خوشههای مشخص شده در یک جدول به نام جدول ایندکس نگه داشته میشود.
با توجه به این مثال جدول ایندکس داده های آموزشی به صورت زیر به دست می آید:

 

 

خوشه ۱

 

 

 

۱۰۵۰۹۸۱۳

 

۰

 

۲۰

 

۰

 

۳۴۵۷۳۶۳۰

 

 

 

۳۴۱۷۵۲۶۷

 

۰

 

۳۱

 

۶

 

۳۴۵۷۳۶۳۰

 

 

 

۲۳۳۸۸۲۳

 

۱

 

۴۰

 

۲۵۰

 

۳۴۵۷۳۶۳۰

 

 

 

۱۰۰۰۰۰۰

 

۲۲

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...