اختصاصی از
فی ژوو پاورپوینت دادهکاوی جریاندادهها با درختهای تصمیمگیری دانلود با لینک مستقیم و پر سرعت .
18 اسلاید
■ فرایندی دو مرحله ای است :
■ساخت مدل :
■تحلیل یک مجموعه آموزشی که مجموعهای از تاپلهای پایگاه است و مشخص کردن برچسب کلاسهای مربوط به این تاپلها .
■ یک تاپل X با یک بردار صفت X=(x1,x2,…,xn) نمایش داده میشود . فرض می شود که هر تاپل به یک کلاس از پیش تعریف شده متعلق است .
■هرکلاس با یک صفت که به آن صفت برچسب کلاس میگوییم مشخص میشود .
■ مجموعه آموزشی به صورت تصادفی از پایگاه انتخاب می شود .
■به این مرحله ، مرحله یادگیری نیز می گویند .
■استفاده از مدل :
■از طریق یک تابع y=f(X) برچسب کلاس هر تاپل X از پایگاه را پیش بینی می شود .
■این تابع به صورت قواعد کلاسهبندی ، درختهای تصمیم گیری یا فرمولهای ریاضی است . ■یکی از روش های کارآمد و با کاربرد گسترده کلاسه بندی است .
■مدل حاصل از این روش به صورت درختهای تصمیم گیری است :
■هر گره در این درخت نشان دهنده یک آزمون بر روی یک صفت است .
■هر شاخه خارج شونده از یک گره نشان دهنده خروجی های ممکن آزمون است .
■هر برگ نشان دهنده یک برچسب کلاس است .
■نحوه استفاده از درخت تصمیم گیری :
■اگر تاپلی چون X که برچسب کلاس آن نامشخص است داشته باشیم صفات این تاپل در درخت مورد آزمون قرار می گیرند و یک مسیر از ریشه به سمت یک برگ که برچسب یک کلاس را دارد ایجاد می شود .■الگوریتم پایه
■درخت به صورت بالا-پایین بازگشتی ساخته می شود .
■در آغاز تمام مجموعه آموزشی در ریشه قرار دارند .
■فرض می کنیم صفات مقادیر گسسته دارند .
■صفات به صورت بازگشتی بر حسب صفات انتخاب شده بخش بندی می شوند .
■صفات آزمون بر اساس یک روال هیوریستیک مانند بهره اطلاعاتی ، شاخص جینی یا نسبت بهره انتخاب می شوند .
■شرایط توقف الگوریتم
■تمام نمونه های مربوط به یک نود متعلق به یک کلاس باشند .
■صفتی برای بخش بندی بیشتر باقی نمانده باشد .
■نمونه ای باقی نمانده باشد .
دانلود با لینک مستقیم
پاورپوینت دادهکاوی جریاندادهها با درختهای تصمیمگیری