پروژه درختان تصمیم گیری و مساله یادگیری

پروژه درختان تصمیم گیری و مساله یادگیری


چکیده:
یادگیری درخت تصمیم یکی از رایج ترین تکنیک های یادگیری ماشین می باشد که به دلیل سادگی و کارامدی باعث شده است علی رغم مشکلاتی که در استفاده از آن همچون صفات دارای نویز و یا صفات فاقد مقدار یا ... وجود دارد به شکل گسترده ای در مسائل مربوط به یادگیری ماشین استفاده شود. در این تحقیق سعی شده است به مسائل اصلی مطرح در زمینهء درخت طراحی مانند بازنمایی، طراحی، عام سازی و مشکلات و راه کارهای برخورد با آنها که توسعه یافته اند پرداخته شود و همچنین از برخی مسائل غیراصلی مانند درختان رگراسیون، نرم افزارهای آزمایشگاهی و تست آماری χ2  نیز ذکری به میان آید. 

فهرست مطالب:
چکیده    
مقدمه     
1-1- اهداف اصلی درخت‌های تصمیم‌گیری دسته‌بندی کننده    
1-2- جذابیت درختان تصمیم    
1-3- انواع درختان تصمیم    
1-3-1- درختان رگراسیون    
2- بازنمایی درخت تصمیم    
2-1- توسعهء درختان تصمیم با گراف های تصمیم    
3- مسائل مناسب برای یادگیری درخت تصمیم    
4- چه صفتی بهترین طبقه بندی کننده است؟    
4-1-1- بی نظمی همگونی مثال ها را اندازه گیری می کند 
4-1-2- نفع اطلاعات، کاهش مورد انتظار در بی نظمی را اندازه گیری می کند
4-2- یک مثال تشریحی    
4-3- حالت خاصی از ساخت درخت تصمیم    
5- جستجوی فضای فرضیه در یادگیری درخت تصمیم    
5-1- قابلیت ها و محدودیت های الگوریتم ID3    
6- بایاس قیاسی (استنتاجی) در یادگیری درخت تصمیم    
6-1- بایاس های محدودیت و بایاس های ارجحیت    
6-2- چرا فرضیات کوتاهتر را ترجیح می دهیم؟    
7- مسائل در یادگیری درخت تصمیم    
7-1- اورفیتینگ داده ها    
7-2- روشهای موجود برای ممانعت از اورفیتینگ    
7-2-1- انواع روش های هرس کردن    
7-2-1-1- تست chi-Square    
7-2-2- هرس خطای کاهش یافته    
7-2-3- هرس بعدی قانون    
7-3- بکاربردن صفات با مقادیر پیوسته    
7-4- معیارهای دیگر برای انتخاب صفات     
7-5- بکاربردن مثال های آموزشی با صفات فاقد مقدار    
7-6- بکاربردن صفات با هزینه های متفاوت    
8- عام سازی درخت     
8-1- طراحی یک دسته بندی کنندهء درخت تصمیم    
8-2- روش‌های اصلی برای طراحی دسته بندی کنندهء درخت تصمیم    
9- انواع یادگیری در درخت تصمیم گیری    
10- مزایا و معایب درخت تصمیم    
10-1- مزایای درختان تصمیم نسبت به روش های دیگر داده کاوی    
10-2- معایب درختان تصمیم    
11- نرم افزارهای مفید برای درخت تصمیم    
12- الگوریتم یادگیری درخت تصمیم پایه    
13- جمع بندی    
14- لغت نامه     
15- مراجع

تعداد مشاهده: 2580 مشاهده

فرمت فایل دانلودی:.doc

فرمت فایل اصلی: doc

تعداد صفحات: 45

حجم فایل:755 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب برای دانشجویان رشته مهندسی کامپیوتر



  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    به همراه اشکال و نمودارها

نقش داده کاوی در تجارت الکترونیک

نقش داده کاوی در تجارت الکترونیک


چکیده:
فناوری اطلاعات و ارتباطات خصوصا اینترنت، به صورت فعال حکومت ها را در قرن بیست و یکم به شدت تغیرداده است. داده-کاوی یکی از دستاورد های فناوری اطلاعات و ارتباطات برای بهبود تحلیل ها و تصمیمات سازمانی و استراتژی های مدیریتی می باشد. ادبیات بسیار وسیعی روی داده کاوی و تکنولوژی های بکارگیری موثر آن وجود دارد.
فرآیندهای تجارت الکترونیک و ابزارهای داده کاوی در بسیاری از شرکت ها انقلابی ایجاد کرده اند. داده هایی که، کسب و کارها درباره مشتریان و معاملات آنها جمع آوری می کنند بزرگترین سرمایه ی کسب و کارها هستند. داده کاوی مجموعه ای از تکنیک های خودکار استفاده شده برای استخراج اطلاعات ناشناخته از پایگاه داده های بزرگ است.
در این تحقیق انواع داده های موجود در وب سایت های تجارت الکترونیک را بررسی کرده و موارد استفاده از آنها در داده کاوی را ذکر می کنیم، همچنین نقش داده کاوی را در جهت بهبود ابعاد مختلف تجارت الکترونیک از جمله مدیریت ریسک، بازاریابی هدفمند، مدیریت مشتری، سیستم های پیشنهاد دهنده و شخصی سازی وب بیان می شود.

فهرست مطالب:
چکیده
مقدمه
تعریف کشف دانش داده کاوی
تاریخچه داده کاوی
روشهای گردآوری اطلاعات
آمار و داده کاوی
تفاوت داده کاوی و آنالیز های آماری
مقایسه روش های سنتی آماری با داده کاوی- مثال 1
مقایسه روش های سنتی آماری با داده کاوی- مثال 2
مراحل داده کاوی
یادگیری و بررسی حوزه کاربرد (شناسایی هدف)
انتخاب داده
آماده سازی داده ها
ارزیابی داده ها
قالب بندی پاسخ
انتخاب ابزار
مدلسازی
اعتبار سازی یافته‌ها
ارائه نتایج
استفاده از نتایج
انواع داده کاوی
فعالیت های داده کاوی
مراحل فرایند کشف دانش از پایگاه داده ها
انبارش داده ها
انتخاب داده ها
تبدیل داده ها
کاوش در داده ها
تفسیر نتیجه
نقش وهدف داده کاوی
ایده اصلی داده کاوی
استراتژی های داده کاوی
تکنیک های داده کاوی
درخت تصمیم گیری (Decision tree)
شبکه های عصبی (Neural networks)
نزدیک ترین همسایه (Nearest neighbor)
الگوریتمهای ژنتیک (Genetic algorithms
عملیات های داده کاوی
مدلسازی پیشگویی کننده
تقطیع پایگاه داده ها
تحلیل پیوند
تشخیص انحراف
چرخه تعالی داده کاوی
الگوریتمهای داده کاوی
شبکه های عصبی
درخت های انتخاب
استنتاج قانون
الگوریتمهای ژنتیک
مدل های فرآیند داده کاوی
مدل فرآیند دو سویه
تعریف مساله
ساختن یک پایگاه داده داده کاوی
جستجوی داده
آماده سازی داده برای مدل سازی
ساختن مدل داده کاوی
تائید اعتبارساده
ارزیابی و تفسیر
تایید اعتبار مدل
ایجاد معماری مدل و نتایج
معماری یک نمونه سیستم داده کاوی
برنامه های کاربردی داده کاوی
نرم افزارهای داده کاوی
مقدمه ای بر تجارت الکترونیکی
شناسایی فرصت های تجاری
مفاهیم پایه در تجارت الکترونیک
تعاریف تجارت الکترونیکی
تاریخچه تجارت الکترونیک
طبقه‌های مختلف تجارت الکترونیکی
تفاوت تجارت الکترونیکی با تجارت سنتی
فروشگاه همیشه باز است
ارتباط با مشتری از طریق ابزارهای الکترونیکی
مشتریان تعاملات انجام شده را تحت کنترل دارند
شناخت رفتار مشتری
نقش دولت در تجارت الکترونیک
هوشمندی کسب و کار
تعریف هوشمندی کسب‌ و کار
اهداف اصلی هوشمندی کسب و کار
نتایج فنی سیستمهای هوشمندی کسب و کار
تحلیل مزیتها و معایب رقبا
انبوه داده ها و اطلاعات
فرآیند هوشمندی کسب و کار در سازمان‌ها و شرکت‌ها
هوشمندی کسب و کار ۲.۰
جمع بندی  هوشمندی کسب و کار
انواع داده های موجود در یک سایت تجارت الکترونیک
اطلاعات کوکی و سرور
پروفایل ها / داده های ورودی کاربر
اسناد وب و وب متا دیتا ها
داده کاوی در تجارت الکترونیک
کاربردهای داده کاوی در تجارت الکترونیک
مدیریت ریسک و بازاریابی هدفمند
مدیریت مشتری
سیستم های پیشنهاد دهنده
شخصی سازی وب
جمع بندی و نتیجه گیری
مراجع
فهرست جدول ها
فهرست شکل ها

تعداد مشاهده: 3090 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 67

حجم فایل:713 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    گزارش تخصصی و کمیاب مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش

بررسی متدهای داده کاوی در محیط های توزیع شده، موازی و چند عامله

بررسی متدهای داده کاوی در محیط های توزیع شده، موازی و چند عامله


چکیده:
امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره­ گیری از روشهایی همچون داده­ کاوی برای استخراج دانش و اطلاعات نهفته در داده­ ها، امری غیرقابل اجتناب می­باشد. بدلیل حجم بسیار بالای داده ­ها در بسیاری از کاربردها و اهمیت بیشتر داده­ های جدید، ذخیره­ سازی این داده ­ها امری مقرون به صرفه نیست، لذا داده­ هایی که باید مورد پردازش قرار گیرند، همواره بصوت پویا در حال تغییر و تحول هستند. مساله دیگری که امروزه در بحث داده­ کاوی وجود دارد، بحث توزیع شدگی ذاتی داده ­ها است. معمولا پایگاه هایی که این داده­ ها را ایجاد یا دریافت می­کنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود می­باشند و حاضر نیستند دانش خود را بطور رایگان در اختیار دیگران قرار دهند.
با توجه به سیستم های چند عامله و مناسب بودن آنها برای محیط های پویا و توزیع شده بنظر می­رسد که بتوان از قابلیت های آنها برای داده ­کاوی در محیط های پویا و محیط های توزیع شده بهره برد. اکثر کارهایی که تاکنون در زمینه بهره ­گیری از عامل و سیستمهای چندعامله انجام شده است. خصوصیتهایی همانند خود آغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، یادگیری، قابلیت استدلال، هدف گرایی و قابلیتهای اجتماعی عاملها مورد بررسی قرار نگرفته است. در این تحقیق ما قصد داریم تا به بررسی کارهای موجود در زمینه کاربرد عامل و سیستمهای چند عامله در داده­ کاوی پرداخته و بحث طبقه­ بندی جریان داده ­ها را در یک محیط پویا را مورد بررسی قرار دهیم.
کلمات کلیدی: داده­ کاوی، طبقه ­بندی، جریان داده، عامل محیط توزیع شده

فهرست مطالب:
چکیده
1. فصل اول: معرفی و آشنایی با مفاهیم اولیه
1-1- مقدمه­ای بر داده­ کاوی
1-1-1- خوشه­ بندی
1-1-2- کشف قواعد وابستگی
1-1-3- طبقه ­بندی
1-1-3-1- طبقه ­بندی مبتنی بر قواعد
1-2- داده ­کاوی توزیع ­شده
1-3- عاملها و سیستمهای چند عامله
1-3-1- عامل
1-3-1-1- مقایسه عامل با شی
1-3-1-2- معماری عاملها
1-3-1-3- معماری BDI
1-3-2- سیستم­ های چند عامله
1-3-2-1- مذاکره
1-4- بهره­ گیری از عامل برای داده­ کاوی
1-4-1- سیستم­ های چند عامله، بستری برای داده­ کاوی توزیع شده
1-5- جمع­ بندی
2. فصل دوم: داده­ کاوی پویا
2-1- مقدم ه­ای بر داده­ کاوی پویا
2-2- جریان داده
2-3- طبقه ­بندی جریان داده24
2-3-1- موضوعات پژوهشی
2-4- جمع­ بندی
3. فصل سوم: مروری بر کارهای انجام شده
3-1- مقدمه
3-2- داده­ کاوی توزیع ­شده
3-2-1- روشهای غیرمتمرکز
3-2-2- روشهای مبتنی بر توزیع ذاتی داده­ ها
3-3- کارهای مهم انجام شده در زمینه داده ­کاوی با استفاده از عامل
3-4- کارهای انجام شده در زمینه طبقه­ بندی جریان داده­ ها
3-4-1- روشهای طبقه­ بندی Ensemble-based
3-4-2- درختهای تصمیم بسیار سریع
3-4-3- طبقه­ بندی On-Demand
3-4-4- OLIN
3-4-5- الگوریتمهای LWClass
3-4-6- الگوریتم ANNCAD
3-4-7- الگوریتم SCALLOP
3-4-8- طبقه­ بندی جریان داده­ها با استفاده از یک روش Rule-based
3-5- جمع ­بندی
 فهرست مراجع

تعداد مشاهده: 1948 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 60

حجم فایل:259 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته مهندسی کامپیوتر و فناوری اطاعات


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    همراه با شکل، نمودار، جدول، فهرست شکل ها و منابع

مدیریت اعتبارسنجی مشتریان دریافت تسهیلات بانکی با رویکرد داده کاوی

مدیریت اعتبارسنجی مشتریان دریافت تسهیلات بانکی با رویکرد داده کاوی


چکیده:
پیشرفت شگفت انگیز فن آوری رایانه ای و مجهز شدن بشر به این ابزار، سبب پیشرفت فوق العاده در کسب و ذخیره سازی داده های عددی و همچنین بوجود آمدن پایگاه داده های  بزرگ در زمینه های مختلف شده است. داده های تبادلات تجاری، کشاورزی، ترافیک، اینترنت، داده های نجومی، جزئیات مکالمات تلفنی، داده های پزشکی و درمانگاهی مثالهایی از چنین پایگاه داده ها میباشند.  در واقع تکنیکهای تولید و جمع آوری پایگاه داده ها بسیار سریعتر از توانایی ما در درک و استفاده از آنها رشد کرده است. از اواخر دهة 80 بشر به فکر دستیابی به اطلاعات نهفته در این داده های حجیم، که با بکار بردن سیستم های سنتی استفاده از پایگاه داده ها میسر نبود، افتاد و تلاشها برای انجام این کار را شروع کرد.
داده کاوی  فرآیندی است که در آغاز دهة 90 پا به عرصه ظهور گذاشته و با نگرشی نو، به مسئله ی استخراج اطلاعات از پایگاه داده ها می پردازد.
در سال 1996، اولین شمارة مجلة کشف دانش و معرفت از پایگاه داده ها منتشر شد . در حال حاضر، داده کاوی مهمترین فناوری جهت بهره برداری موثر از داده های حجیم بوده و اهمیت آن رو به فزونی است.
بانک ها به منظور تعیین ریسک اعتباری و ارائه خدمات مالی به مشتریان خود نیازمند شناسایی دقیق آن ها هستند. مدل های اعتبارسنجی می توانند در این زمینه به پشتیبانی از بانک ها بپردازند. درختان تصمیم گیری به عنوان یکی از تکنیک های داده کاوی کاربرد زیادی در اعتبارسنجی مشتریان بانک ها و اعطای تسهیلات اعتباری به آنها دارند. مسئله اصلی شامل دقت طبقه بندی، پیچیدگی، اندازه بیش از حد و عدم انعطاف پذیری درختان تصمیم گیری در طبقه بندی و اعتبار سنجی مشتریان است. هدف از این پژوهش ارائه مدل تلفیقی پیشنهادی برای حل مسائل فوق و بهینه سازی درختان تصمیم گیری با بکارگیری تکنیک های خوشه بندی و الگوریتم ژنتیک است. می توان با انتخاب ویژگی های مناسب توسط الگوریتم ژنتیک و ساخت درختان تصمیم گیری به کاهش پیچیدگی، افزایش انعطاف پذیری و دقت طبقه بندی پرداخت.
در مدل تلفیقی پیشنهادی ابتدا عمل خوشه بندی برروی مجموعه داده اعتباری صورت می گیرد.سپس توسط الگوریتم طبقه بندی متا و الگوریتم انتخاب ویژگی مبتنی بر درخت تصمیم گیری ژنتیکی، درخت تصمیم گیری C4.5 در هر خوشه ساخته می شود. در نهایت با اتخاذ یک استراتژی مناسب، بهترین درختان تصمیم گیری در هر خوشه برای اعتبارسنجی مشتریان انتخاب  می شوند. ابزار یادگیری ماشین وکا و نرم افزار GATree برای تحلیل نتایج بکار می رود. نتایج نشان می دهد که مدل تلفیقی پیشنهادی دقت طبقه بندی بالاتری نسبت به اکثر الگوریتم های طبقه بندی مور مقایسه در این پژوهش دارد و مشتریان اعتباری بانک را با پیچیدگی کمتری طبقه بندی می کند.

فهرست مطالب:
چکیده 
کلید واژه ها
فصل اول: داده کاوی
مقدمه 
داده کاوی چیست؟
تاریخچه داده کاوی
ویژگی های داده کاوی
مزایای داده کاوی
مراحل داده کاوی
عملیات داده کاوی
نرم افزارهای داده کاوی
نمونه های از نرم افزارهای داده کاوی
کاربردهای داده کاوی
کاربرد داده کاوی در بانکداری الکترونیکی
نمونه ای از کاربرد داده کاوی در بانکداری
مراحل عمل داده کاوی از یک پایگاه داده
فصل دوم: داده کاوی و بانکداری
تشریح داده کاوی در بانک
شناسایی و طبقه‏ بندی مشتریان کلیدی
اهمیت دستیابی به رضایت‏مندی مشتری
فرایند داده کاوی در مدیریت ارتباط با مشتری
استخراج داده
تکنیک های استخراج داده
کاربردهای استخراج داده در بخش بانکداری
تعیین اعتبار مشتریان بانک
مجموعه داده 
ریسک اعتباری و اعتبار سنجی
طبقه بندی و درختان تصمیم گیری
خوشه بندی
انتخاب ویژگی ها 
الگوریتم ژنتیک
مدل تلفیقی پیشنهادی
آموزش، تست مدل
مقایسه نتایج درخت تصمیم گیری مدل تلفیقی پیشنهادی با سایر درختان تصمیم گیری
فصل سوم: استنتاج
نتیجه گیری
فصل چهارم: پیوست ها
پیوست 
فصل پنجم: منابع
منابع
فهرست جدولها
فهرست شکل ها

تعداد مشاهده: 1371 مشاهده

فرمت فایل دانلودی:.doc

فرمت فایل اصلی: doc

تعداد صفحات: 75

حجم فایل:2,145 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب برای دانشجویان رشته مهندسی کامپیوتر
    اختصاصی سایت فایلود و بدون مشابه


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش