فرمت فایل : power point (لینک دانلود پایین صفحه) تعداد اسلایدها 34 اسلاید
فهرست :
•کاوشگر وب
•وب معنایی
•چالش های کاوشگر های سنتی برای وب معنایی
•کاوشگر های وب معنایی
•کاوشگر های متمرکز برای وب معنایی
•نتیجه گیری
•برنامه ای است که به صورت خودکار، وب را از طریق دانلود کردن صفحات و دنبال کردن پیوند ها، از صفحه ای به صفحه ای دیگر، پیمایش می کند.
•جمع آوری داده
•اولین مولفه مورد نیاز برای ایجاد شاخص گذاری و بازیابی اسناد وب
•crawler، spider، robot، ...
رفتار کاوشگر :
•چه صفحاتی باید دانلود شوند؟ (سیاست انتخاب صفحه)
–محبوبیت محور
–علاقه محور
•چگونه صفحات باید به روز شوند؟ (سیاست به روز رسانی)
–بررسی به روز بودن صفحه
–اولویت به روز رسانی
•چگونه باید سربار کاوش را بر روی سایت ها به حداقل رساند؟ (سیاست politeness)
–مجوز کاوش سایت: فایل robot.txt
–رعایت یک میزان تاخیر، بین ارسال درخواست های متوالی به یک سایت
•چگونه باید فرآیند کاوش را موازی کرد؟ (سیاست موازی سازی)
–یک صفحه یکسان چندین بار توسط کاوشگرهای مختلف کاوش نشود.
پاورپوینت درباره آشنایی با کاوشگر های وب معنایی