• گام دوم: پرس‌و‌جوها در دو گروه انتخاب شدند.گروه اول شامل اصطلاحاتی بامعانی مختلف و دارای متافور مانند “Jaguar”,”java” ,”beetle”,”puma”.”platform” است و گروه دوم شامل اصطلاحاتی با زیر طبقه های چند سطحی مثل “Operated system”،” “Neural network ، “Computer architecture”،” Data base” “Web mining”, می‌باشد.در جدول ۴-۲ زیر طبقه های” Data base” آورده شده‌است.

 

جدول ۴-۲ زیر طبقه های کلمه ی Data base

 

Data base
Concept

 

Commerical tools

 

Course

 

 

به طور کلی پس از نوشتن” Data base”، موتور جستجو صفحات مرتبط با موضوع را در سه شاخه ی Concept، Cmmerical tools وCourse به کاربر ارائه می‌دهدودرهرشاخه مرتبط‌ترین لینک ها براساس آزمایشات انجام شده قرار می‌گیرد.

 

    • گام سوم: برای رسیدن به یک شخصی‌سازی موتور جستجودر آزمایش اول بیست و سه هزار و چهارصدونودوسه صفحه با بهره گرفتن از موتورجستجوی گوگل بررسی گردید. جستجوی دانلودهای مربوط به آزمایش، در طی ماه های آبان و آذر سال ۱۳۹۳ انجام شده‌است.پس از حذف صفحات با پسوند ppt ، pptx، pps، ppsx، pdf پنجاه لینک برای هر پرس‌و‌جو باقی ماند . با انجام آزمایشات مربوط شخصی‌سازی برای موتور جستجوانجام شد که [۸۰]PSEFiL نامیده شد. معماری این موتور جستجودر شکل۴-۱ نشان داده شده‌است.

پایان نامه - مقاله - پروژه

 

Sub Category Maker
Database Loading (Meta Approach)
Clean link Extraction
Google
Web Pages
Snippet
Link Filtering
Answer Set (Upper Part)
Answer Set (Lower Part)
Tree Representation

شکل ۴-۱.معماری موتور جستجوی پیشنهادی PSEFiL
درموتور جستجوی PSEFiL دو مجموعه جواب وجود دارد که نتیجه نهایی، از اشتراک این دو مجموعه جواب به‌دست می ٱید .در ادامه، اجزای این معماری شرح داده می‌شود.

 

  • مجموعه جواب بخش بالایی:

      • Sub category maker: در این بخش با توجه به محتوای صفحات وب و اسنیپت های هر صفحه زیر طبقات هر پرس‌و‌جو استخراج شده‌است.

     

      • :Database loading(Meta approach)نتایج استخراجی از پنج موتور جستجو در این پایگاه داده بارگذاری می‌گردد.

     

      • Tree representation: این بخش وظیفه نمایش درختی زیر طبقات را بعد از کلیک کاربر دارد.

     

     

 

  • مجموعه جواب بخش پایینی:

      • Clean link extraction:در این بخش لینک های مرتبط داخلی و خارجی با بهره گرفتن از موتور جستجوی Google استخراج می‌گردد که جداول آن در صفحات بعد آورده شده‌است.

     

      • Link filtering: در این بخش نسبت لینک های خارجی مرتبط به کل لینک های خارجی محاسبه شده و لینک های بزرگتر از صفر استخراج شده و در واقع فیلتر سازی لینک ها انجام می‌گیرد.

     

     

 

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...