سمینار خوشه بندی داده ها

سمینار خوشه بندی داده ها



گزارش تخصصی، منظم، ویرایش شده و بدون مشابه در سایر سایت ها می باشد

مقدمه:
در این پروژه روش های خوشه بندی مورد برسی قرار می گیرد  هدف از خوشه بندی یافتن خوشه های مشابه از اشیاء در بین نمونه های ورودی می باشد تفاوت های خوشه بندی وطبقه بندی مورد مطالعه قرار میگیرد همچنین خوشه بندی در مقابل چندی سازی برداری قرار دارد در خوشه بندی نوعی سازمان داریم ولی در روشهای ارتباطی از چندی سازی استفاده میشود ،در خوشه بندی از روشهای فازی استفاده می شود( kmeans ,cmens)
خوشه بندی به انتخاب اولیه خوشه ها بستگی دارد واین باعث می شود که نتایج خوشه بندی در تکرارهای مختلف از الگوریتم متفاوت شود که این در بسیاری از کاربردها قابل استفاده نیست ،برای رفع مشکل روش فازی cmens از الگوریتم LBG  استفاده می شود.

فهرست مطالب:
مقدمه
خوشه بندی چیست
هدف از خوشه بندی چیست
خوشه بندی در مقابل طبقه بندی
یادگیری با نظارت در مقابل یادگیری بدون‌نظارت
کاربردها
مسائل درگیر با روش‌های خوشه‌بندی موجود
خوشه‌بندی در مقابل چندی‌سازی برداری
روش‌های خوشه‌بندی
روش خوشه‌بندی(K-Means یا C-Means
مثالی برای خوشه‌بندی K-Means
مشکلات روش خوشه‌بندی K-Means
الگوریتم خوشه‌بندی LBG.
خوشه بندی فازی چیست
روشهای خوشه‌بندی سلسله مراتبی
خوشه‌بندی با روش Single-Link
خوشه‌بندی با روش Link Complete
خوشه‌بندی با روش Average-Link
خوشه‌بندی بر اساس چگالی
 الگوریتم خوشه‌بندی براساس چگالی
مثالی از الگوریتم خوشه‌بندی براساس چگالی
الگوریتم سلسله مراتبی خوشه‌بندی براساس چگالی
معیارهای کارایی
خلاصه و نتیجه گیری
مراجع




تعداد مشاهده: 1183 مشاهده

فرمت فایل دانلودی:.doc

فرمت فایل اصلی: doc

تعداد صفحات: 56

حجم فایل:762 کیلوبایت

 قیمت: 20,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته کامپیوتر


  • محتوای فایل دانلودی:
    در قالب word و قابل ویرایش

مدیریت اعتبارسنجی مشتریان دریافت تسهیلات بانکی با رویکرد داده کاوی

مدیریت اعتبارسنجی مشتریان دریافت تسهیلات بانکی با رویکرد داده کاوی


چکیده:
پیشرفت شگفت انگیز فن آوری رایانه ای و مجهز شدن بشر به این ابزار، سبب پیشرفت فوق العاده در کسب و ذخیره سازی داده های عددی و همچنین بوجود آمدن پایگاه داده های  بزرگ در زمینه های مختلف شده است. داده های تبادلات تجاری، کشاورزی، ترافیک، اینترنت، داده های نجومی، جزئیات مکالمات تلفنی، داده های پزشکی و درمانگاهی مثالهایی از چنین پایگاه داده ها میباشند.  در واقع تکنیکهای تولید و جمع آوری پایگاه داده ها بسیار سریعتر از توانایی ما در درک و استفاده از آنها رشد کرده است. از اواخر دهة 80 بشر به فکر دستیابی به اطلاعات نهفته در این داده های حجیم، که با بکار بردن سیستم های سنتی استفاده از پایگاه داده ها میسر نبود، افتاد و تلاشها برای انجام این کار را شروع کرد.
داده کاوی  فرآیندی است که در آغاز دهة 90 پا به عرصه ظهور گذاشته و با نگرشی نو، به مسئله ی استخراج اطلاعات از پایگاه داده ها می پردازد.
در سال 1996، اولین شمارة مجلة کشف دانش و معرفت از پایگاه داده ها منتشر شد . در حال حاضر، داده کاوی مهمترین فناوری جهت بهره برداری موثر از داده های حجیم بوده و اهمیت آن رو به فزونی است.
بانک ها به منظور تعیین ریسک اعتباری و ارائه خدمات مالی به مشتریان خود نیازمند شناسایی دقیق آن ها هستند. مدل های اعتبارسنجی می توانند در این زمینه به پشتیبانی از بانک ها بپردازند. درختان تصمیم گیری به عنوان یکی از تکنیک های داده کاوی کاربرد زیادی در اعتبارسنجی مشتریان بانک ها و اعطای تسهیلات اعتباری به آنها دارند. مسئله اصلی شامل دقت طبقه بندی، پیچیدگی، اندازه بیش از حد و عدم انعطاف پذیری درختان تصمیم گیری در طبقه بندی و اعتبار سنجی مشتریان است. هدف از این پژوهش ارائه مدل تلفیقی پیشنهادی برای حل مسائل فوق و بهینه سازی درختان تصمیم گیری با بکارگیری تکنیک های خوشه بندی و الگوریتم ژنتیک است. می توان با انتخاب ویژگی های مناسب توسط الگوریتم ژنتیک و ساخت درختان تصمیم گیری به کاهش پیچیدگی، افزایش انعطاف پذیری و دقت طبقه بندی پرداخت.
در مدل تلفیقی پیشنهادی ابتدا عمل خوشه بندی برروی مجموعه داده اعتباری صورت می گیرد.سپس توسط الگوریتم طبقه بندی متا و الگوریتم انتخاب ویژگی مبتنی بر درخت تصمیم گیری ژنتیکی، درخت تصمیم گیری C4.5 در هر خوشه ساخته می شود. در نهایت با اتخاذ یک استراتژی مناسب، بهترین درختان تصمیم گیری در هر خوشه برای اعتبارسنجی مشتریان انتخاب  می شوند. ابزار یادگیری ماشین وکا و نرم افزار GATree برای تحلیل نتایج بکار می رود. نتایج نشان می دهد که مدل تلفیقی پیشنهادی دقت طبقه بندی بالاتری نسبت به اکثر الگوریتم های طبقه بندی مور مقایسه در این پژوهش دارد و مشتریان اعتباری بانک را با پیچیدگی کمتری طبقه بندی می کند.

فهرست مطالب:
چکیده 
کلید واژه ها
فصل اول: داده کاوی
مقدمه 
داده کاوی چیست؟
تاریخچه داده کاوی
ویژگی های داده کاوی
مزایای داده کاوی
مراحل داده کاوی
عملیات داده کاوی
نرم افزارهای داده کاوی
نمونه های از نرم افزارهای داده کاوی
کاربردهای داده کاوی
کاربرد داده کاوی در بانکداری الکترونیکی
نمونه ای از کاربرد داده کاوی در بانکداری
مراحل عمل داده کاوی از یک پایگاه داده
فصل دوم: داده کاوی و بانکداری
تشریح داده کاوی در بانک
شناسایی و طبقه‏ بندی مشتریان کلیدی
اهمیت دستیابی به رضایت‏مندی مشتری
فرایند داده کاوی در مدیریت ارتباط با مشتری
استخراج داده
تکنیک های استخراج داده
کاربردهای استخراج داده در بخش بانکداری
تعیین اعتبار مشتریان بانک
مجموعه داده 
ریسک اعتباری و اعتبار سنجی
طبقه بندی و درختان تصمیم گیری
خوشه بندی
انتخاب ویژگی ها 
الگوریتم ژنتیک
مدل تلفیقی پیشنهادی
آموزش، تست مدل
مقایسه نتایج درخت تصمیم گیری مدل تلفیقی پیشنهادی با سایر درختان تصمیم گیری
فصل سوم: استنتاج
نتیجه گیری
فصل چهارم: پیوست ها
پیوست 
فصل پنجم: منابع
منابع
فهرست جدولها
فهرست شکل ها

تعداد مشاهده: 1371 مشاهده

فرمت فایل دانلودی:.doc

فرمت فایل اصلی: doc

تعداد صفحات: 75

حجم فایل:2,145 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب برای دانشجویان رشته مهندسی کامپیوتر
    اختصاصی سایت فایلود و بدون مشابه


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش