مهندسی نرم افزار · دسامبر 3, 2023 0

پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری

پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری

دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری

🔹 بهترین کیفیت

🔹 قابل ویرایش

🟢 پشتیبانی 24 ساعته

پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری

دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری

مشخصات فایل

تعداد صفحات 18
حجم 33/234 کیلوبایت
فرمت فایل اصلی pptx

توضیحات کامل

دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری جهت رشته مهندسی نرم افزار در قالب 18 اسلايد و pptx بصورت کامل و جامع و با قابليت ويرايش

 

 

 فرايندی دو مرحله ای است :
ساخت مدل :
تحليل يک مجموعه آموزشی که مجموعه‌ای از تاپل‌های پايگاه است و مشخص کردن برچسب کلاس‌های مربوط به اين تاپل‌ها .
 يک تاپل X با يک بردار صفت X=(x1;x2;…;xn) نمايش داده می‌شود . فرض می شود که هر تاپل به يک کلاس از پيش تعريف شده متعلق است .
هرکلاس با يک صفت که به آن صفت برچسب کلاس می‌گوييم مشخص می‌شود .
 مجموعه آموزشی به صورت تصادفی از پايگاه انتخاب می شود .
به اين مرحله ، مرحله يادگيری نيز می گويند .
استفاده از مدل :
از طريق يک تابع y=f(X) برچسب  کلاس هر تاپل X از پايگاه را پيش بينی می شود .
اين تابع به صورت قواعد کلاسه‌بندی ، درخت‌های تصميم گيری يا فرمول‌های رياضی است .

 

 

يکی از روش های کارآمد و با کاربرد گسترده کلاسه بندی است .
مدل حاصل از اين روش به صورت درختهای تصميم گيری است :
هر گره در اين درخت نشان دهنده يک آزمون بر روی يک صفت است .
هر شاخه خارج شونده از يک گره نشان دهنده خروجی های ممکن آزمون است .
هر برگ نشان دهنده يک برچسب کلاس است .
نحوه استفاده از درخت تصميم گيری :
اگر تاپلی چون X که برچسب کلاس آن نامشخص است داشته باشيم صفات اين تاپل در درخت مورد آزمون قرار می گيرند و يک مسير از ريشه به سمت يک برگ که برچسب يک کلاس را دارد ايجاد می شود .

 

 

برابری‌‌ها :
وقتی که دو يا بيشتر صفت در G بسيار شبيه هستند نمونه‌های زيادی برای تصميم‌گيری بين آنها ، با اطمينان بالا نياز است .
در اين مورد ، اينکه چه صفتی انتخاب می شود اختلاف اندکی را بوجود می‌آورد .VFDT  بصورت انتخابی تصميم می‌گيرد که يک برابری وجود دارد و شکاف را روی يکی از بهترين صفت‌های جاری انجام می‌دهد .
محاسبه G:
بخش قابل توجهی از زمان به ازای هر نمونه برای محاسبه G صرف می شود .
محاسبه دوباره G برای هر نمونه جديد ناکارا است ، چون احتمال تصميم برای شکاف در آن نقطه مشخص غير محتمل است .
 بنابراين VFDT به کاربر اجازه می‌دهد تا يک حداقل تعداد برای نمونه های جديد يا nmin  را مشخص کند که بايد در هر برگ انباشته شود قبل از اينکه G دوباره محاسبه شود .

 

 

فهرست مطالب
کلاسه بندی
درخت های تصميم گيری
مجموعه داده های آموزشی
درخت تصميم گيری برای buys_computer
الگوريتم برای درخت های تصميم گيری
چالش ها
نکات کليدی
چه تعداد نمونه کافی است ؟
الگوريتم Hoeffding Tree
درختان تصميم گيری بسيار سريع VFDT
مقايسه‌ای بين VFDT وC4.5
منابع (1)
منابع (2)


توضیحات بیشتر و دانلود



صدور پیش فاکتور، پرداخت آنلاین و دانلود