تعداد صفحات: 25 کد محصول :3180 حجم فایل:277,1 KB نوع فایل :rar
فایل ورد قابل ویرایش
توضیحی مختصر از مقاله :
کلاسه بندي با درختهاي تصميمگيري در پايگاهدادهها
کلاسهبندي دادهها يک فرآيند دو مرحلهاي است :
1. در مرحله اول يک مدل ساختهميشود که مجموعهاي از کلاسهاي دادهاي يا مفاهيم را مشخص ميکند . اين مرحله را مرحله يادگيري گوييم که در آن يک الگوريتم کلاسهبندي يک مدل را با تحليل يک مجموعه آموزشي که مجموعهاي از تاپلهاي پايگاه است مي سازد و برچسب کلاسهاي مربوط به اين تاپلها را مشخص ميکند . يک تاپل X با يک بردار صفت X=(x1,x2,…,xn) نمايش داده ميشود . فرض مي شود که هر تاپل به يک کلاس از پيش تعريف شده متعلق است و کلاس با يک صفت که به آن صفت برچسب کلاس ميگوييم مشخص ميشود . مجموعه آموزشي به صورت تصادفي از پايگاه انتخاب مي شود .
2. در مرحله دوم ، يادگيري از طريق يک تابع y=f(X) انجام ميشود که ميتواند برچسب کلاس هر تاپل X از پايگاه را پيش بيني کند . اين تابع به صورت قواعد کلاسهبندي ، درختهاي تصميم گيري يا فرمولهاي رياضي است .آنچه ما در اينجا براي کلاسهبندي بررسي ميکنيم کلاسه بندي با درختان تصميمگيري است .
درختهاي تصميمگيري
بر اساس مجموعه آموزشي يک درخت ايجاد ميکنيم که در اين درخت هر گره داخلي يک آزمون را روي يک صفت نشان ميدهد ، هر شاخه نتيجهاي از تست را نشان ميدهد و هر برگ برچسب يک کلاس را نگهداري ميکند . نمونهاي از درخت تصميم گيري در شکل زير آمده است :
نمونه اي از درخت تصميم گيري
درخت تصميم در شکل بالا مفهوم buys_computer را نشان ميدهد ، اينکه آيا يک مشتري در يک فروشگاه لوازم الکترونيکي علاقمند به خريد کامپيوتر است يا خير ؟ همانطور که در شکل ديده مي شود اين درخت داراي دو برچسب کلاس متمايز در برگهاي خود است که yes و no مي باشند .
نحوه استفاده از درخت تصميم گيري به اين صورت است : اگر تاپلي چون X که برچسب کلاس آن نامشخص است داشته باشيم صفات اين تاپل در درخت مورد آزمون قرار مي گيرند و يک مسير از ريشه به سمت يک برگ که برچسب يک کلاس را دارد ايجاد مي شود .
دانلود مقاله دادهکاوي جرياندادهها با درختهاي تصميمگيري
نظرات شما عزیزان: