داده کاوی و کاربرد آن درتشخیص بیماری ها

داده کاوی و کاربرد آن درتشخیص بیماری ها


چکیده:
امروزه در دانش پزشکی جمع آوری داده های فراوان در مورد بیماری های مختلف از اهمیت فراوانی برخوردار است. مراکز پزشکی با مقاصد گوناگونی به جمع آوری این داده ها می پردازند. تحقیق روی این داده ها و به دست آوردن نتایج و الگوهای مفید در رابطه با بیماری ها ، یکی از اهداف استفاده از این داده ها است. حجم زیاد این داده ها و سردرگمی حاصل از آن مشکلی است که مانع رسیدن به نتایج قابل توجه می شود. بنابراین از داده کاوی برای غلبه بر این مشکل و به دست آوردن روابط مفید بین عوامل خطر زا در بیماری ها استفاده می شود.
این مقاله به معرفی داده کاوی وکاربردآن در صنعت پزشکی (پیش بینی بیماری) با استفاده از الگوریتم های داده کاوی به همراه نرم افزارهای مرتبط با آن پرداخته است.
کلمات کلیدی: داده کاوی، درخت تصمیم، پیش بینی بیماری، دیابت

فهرست مطالب:
چکیده
مقدمه
بیان مسئله
هدف تحقیق
موضوع داده کاوی چیست؟
مدیریت ذخیره سازی و دستیابی اطلاعات
تعاریف داده کاوی
کاربردهای داده کاوی
چند مثال در مورد مفهوم داده کاوی
مراحل داده کاوی
شکل 1: مراحل داده کاوی
عناصر داده کاوی
تکنیک های داده کاوی
تکنولوژی های مرتبط با داده کاوی
محدودیت ها
داده کاوی درعرصه ی سلامت
استراتژی های داده کاوی
نمونه هایی از کاربرد های داده کاوی درسلامت
مقایسه الگوریتمهای هوشمند در شناسایی بیماری دیابت
گام های لازم برای طراحی یک درخت تصمیم گیری
جذابیت درختان تصمیم
بازنمایی درخت تصمیم
مسائل در یادگیری درخت تصمیم
مزایای درختان تصمیم نسبت به روش های دیگر داده کاوی
معایب درختان تصمیم
نرم افزارهای داده کاوی
پیاده سازی نرم افزار وکا
شکل 2: نمودار ستونی برای فراوانی مقادیرمختلف ستون ها در بازه هایی با طول یکسان
شکل 4: اجرای الگوریتم Decision Trees
شکل 5: اجرای مدل خوشه بندی
بحث
نتیجه گیری
پیشنهادات
منابع

تعداد مشاهده: 1430 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 41

حجم فایل:1,256 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب برای دانشجویان مهندسی کامپیوتر و فناوری اطلاعات

  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    به همراه شکل و لیست منابع

ابزارها و راهکارهای داده کاوی

ابزارها و راهکارهای داده کاوی


بخشی از مقدمه:
ما به تدریج با این واقعیت رشد کرده ایم که حجم عظیمی از داده ها وجود دارد که کامپیوترها، شبکه ها و در حقیقت تمام زندگی مارا فرا گرفته است. سازمان های دولتی، مؤسسات علمی و تجاری ،سرمایه هنگفتی را برای جمع آوری و ذخیره این داده ها اختصاص داده اند. در حالی که فقط مقدار کمی از این داده ها مورد استفاده قرار می گیرند. زیرا، در بسیاری از موارد، حجم داده های لازم  برای سازماندهی بسیار بالا بوده یا ساختار آن ها بسیار پیچیده است.
ضرورت درک مجموعه داده های بزرگ، پیچیده و اطلاعات کامل و غنی در زمینه تجارت،علوم و مهندسی کم و بیش رایج است. توانایی استخراج دانش و اطلاعات مفید موجود در این داده ها و امکان استفاده از این دانش در جهان رقابتی امروز بیش از پیش حائز اهمیت است. به کل فرآیند به کارگیری متدولو‍ژی مبتنی بر کامپیوتر از جمله روش های جدید برای دریافت دانش و اطلاعات از داده ها را داده کاوی می گویند.
داده کاوی دراواخر دهه 1980پدیدار گشت در سال 1990گام های بلندی  دراین شاخه ازعلم برداشته شد. درزمانی طلا یازغال سنگ ارزشمند ترین چیزی بودند که انسان ها برای بالا بردن کیفیت زندگی شان به جستجو آن می پرداختند. دردنیای امروزه داده ها حکم طلا را دارند و با ارزش ترین ماده خام دنیای کنونی محسوب می شوند.
اصطلاح داده کاوی برگرفته از (gold mining) یا استخراج طلا از صخره های سنگی است. در رابطه با استخراج و اکتشاف طلا  از واژه Rock mining استفاده نشده است و بنابراین شاید نام  مناسب برای Data mining  نیز واژه Knowledge mining frim data بود اما از انجا که این واژه طولانی بود ازواژه Data mining استفاده می شود. ...

فهرست مطالب:

فصل اول مفاهیم داده کاوی
1-1 مقدمه
1-2 ریشه های داده کاوی
1-3 برای انجام داده کاوی به چه چیزهایی نیاز است
1-4 فرآیندداده کاوی
1-5 عناصر داده کاوی
1-6 روش های داده کاوی
1-7 مراحل اصلی داده کاوی
1-8 فنون داده کاوی
1-9 دلایل استفاده از داده کاوی
1-10 استراتژی های داده کاوی
1-11 تکنیک های داده کاوی
1-12 ضرورت داده کاوی
1-13 کارکردها ووظایف داده کاوی
1-14 کاربردهای داده کاوی
1-15 مثالی کلاسیک از داده کاوی
1-16 فواید ونقش داده کاوی درفعالیت شرکت ها
1-17 نمونه های اجرایی داده کاوی
7-1- درزمینه صنعت
7-3- در مدیریت ریسک
1-18 انبار های داده
1-19روش آنالیز آماری
1-20 تفاوت داده کاوی وآنالیزهای آماری
فصل دوم: آماده سازی داده ها
2-1 نمایش داده های خام
2-2 ویژگی های داده های اولیه(خام)
2-3 تبدیل داده های خام
2-4 تحلیل داده های نا منطبق
فصل سوم: روشهای آمار
3-1 استنتاج آماری
3-2 تشخیص تفاوت ها درمجموعه داده
3-3 رگرسیون پیشگو
3-4 تحلیل واریانس
3-5 تحلیل ممیز خطی
فصل چهارم: درختان تصمیم و قوانین تصمیم
4-1 مقدمه
4-2 درخت تصمیم
4-3 الگوریتمc4.5 :تولیددرخت تصمیم
4-4 مقادیرویژگی ناشناخته
4-5 هرس کردن درخت تصمیم
4-6 تولید قوانین تصمیم
4-7 محدودیتهای درختان تصمیم وقوانین تصمیم
فصل پنجم: قوانین انجمنی
5-1 مقدمه
5-2 تحلیل سبدخرید
5-3 الگوریتم APRIORI
5-4 مجموعه اقلام های تکراری وروابط انجمنی
5-5 افزایش راندمان وکارایی الگوریتمApriori
5-6 کاوش قوانین انجمنی چند بعدی
5-7 کاوش وب( وب کاوی )
5-8 کاوش متن
فصل ششم: شبکه های عصبی مصنوعی
6-1 مقدمه
6-2 مدل یک نورون مصنوعی
6-3 معماری های شبکه های عصبی مصنوعی
6-4 فرآیندیادگیری
6-5 وظایف یادگیری
6-6 مفاهیم چندلایه ای
6-7 شبکه های رقابتی ویادگیری رقابتی
فصل هفتم: الگوریتم های ژنتیک
7-1 اصول الگوریتم ژنتیک
7-2پیوندزنی
7-3 نمایش ساده ای برای یک الگوریتم ژنتیک
فصل هشتم: روشهای تجسم سازی
8- 1 ادراک وتجسم ساز ی فکری
8-2تجسم سازی علمی وتجسم سازی اطلاعات
8-3 سیستم های تجسم سازی برای داده کاوی
 نتیجه گیری   
منابع

تعداد مشاهده: 1641 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 71

حجم فایل:937 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان و مهندسین کامپیوتر و IT

  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش

پیش بینی ارزش دوره عمر مشتری با زنجیره مارکوف بر اساس مدل داده کاوی

پیش بینی ارزش دوره عمر مشتری با زنجیره مارکوف بر اساس مدل داده کاوی


خلاصه:
مطالعه حاضردر تلاش برای ایجاد یک چارچوب محاسباتی ارزش طول عمر مشتری برای یک شرکت تعمیر و نگهداری خودرو در تایوان است.ارزش دوره عمر مشتری از ارزش کنونی و آینده مشتریان تشکیل شده است که شامل برآورد طول عمر،رفتار خرید در آینده و سود مرتبط با هر رفتار است.
این چارچوب از سه تکنیک برای تخمین ارزش دوره عمر مشتری با استفاده از پایگاه داده معاملات مشتریان استفاده می کند که عبارتند از:
1-  مدل  رگرسیون لجستیک و مدل درخت تصمیم گیری به منظور برآورد احتمال رویگردانی مشتری و پیش بینی طول عمر مشتری
2-  آنالیز رگرسیون برای شناسایی متغییر های مهم مؤثر بر رفتار خرید مشتریان و زنجیره مارکوف که مدل احتمال تغییر رفتار مشتری را بیان می کند.
3-    شبکه های عصبی برای پیش بینی سود ارائه شده توسط مشتری تحت رفتارهای مختلف خرید.

تعداد مشاهده: 1636 مشاهده

فرمت فایل دانلودی:.rar

فرمت فایل اصلی: docx, pptx, pdf

حجم فایل:887 کیلوبایت

 قیمت: 4,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته و فناوری اطلاعات


  • محتوای فایل دانلودی:
    محتوای فایل: پاورپوینت 19 اسلاید، فایل ورد 9 صفحه فایل مقاله لاتین (منبع)

پروژه درختان تصمیم گیری و مساله یادگیری

پروژه درختان تصمیم گیری و مساله یادگیری


چکیده:
یادگیری درخت تصمیم یکی از رایج ترین تکنیک های یادگیری ماشین می باشد که به دلیل سادگی و کارامدی باعث شده است علی رغم مشکلاتی که در استفاده از آن همچون صفات دارای نویز و یا صفات فاقد مقدار یا ... وجود دارد به شکل گسترده ای در مسائل مربوط به یادگیری ماشین استفاده شود. در این تحقیق سعی شده است به مسائل اصلی مطرح در زمینهء درخت طراحی مانند بازنمایی، طراحی، عام سازی و مشکلات و راه کارهای برخورد با آنها که توسعه یافته اند پرداخته شود و همچنین از برخی مسائل غیراصلی مانند درختان رگراسیون، نرم افزارهای آزمایشگاهی و تست آماری χ2  نیز ذکری به میان آید. 

فهرست مطالب:
چکیده    
مقدمه     
1-1- اهداف اصلی درخت‌های تصمیم‌گیری دسته‌بندی کننده    
1-2- جذابیت درختان تصمیم    
1-3- انواع درختان تصمیم    
1-3-1- درختان رگراسیون    
2- بازنمایی درخت تصمیم    
2-1- توسعهء درختان تصمیم با گراف های تصمیم    
3- مسائل مناسب برای یادگیری درخت تصمیم    
4- چه صفتی بهترین طبقه بندی کننده است؟    
4-1-1- بی نظمی همگونی مثال ها را اندازه گیری می کند 
4-1-2- نفع اطلاعات، کاهش مورد انتظار در بی نظمی را اندازه گیری می کند
4-2- یک مثال تشریحی    
4-3- حالت خاصی از ساخت درخت تصمیم    
5- جستجوی فضای فرضیه در یادگیری درخت تصمیم    
5-1- قابلیت ها و محدودیت های الگوریتم ID3    
6- بایاس قیاسی (استنتاجی) در یادگیری درخت تصمیم    
6-1- بایاس های محدودیت و بایاس های ارجحیت    
6-2- چرا فرضیات کوتاهتر را ترجیح می دهیم؟    
7- مسائل در یادگیری درخت تصمیم    
7-1- اورفیتینگ داده ها    
7-2- روشهای موجود برای ممانعت از اورفیتینگ    
7-2-1- انواع روش های هرس کردن    
7-2-1-1- تست chi-Square    
7-2-2- هرس خطای کاهش یافته    
7-2-3- هرس بعدی قانون    
7-3- بکاربردن صفات با مقادیر پیوسته    
7-4- معیارهای دیگر برای انتخاب صفات     
7-5- بکاربردن مثال های آموزشی با صفات فاقد مقدار    
7-6- بکاربردن صفات با هزینه های متفاوت    
8- عام سازی درخت     
8-1- طراحی یک دسته بندی کنندهء درخت تصمیم    
8-2- روش‌های اصلی برای طراحی دسته بندی کنندهء درخت تصمیم    
9- انواع یادگیری در درخت تصمیم گیری    
10- مزایا و معایب درخت تصمیم    
10-1- مزایای درختان تصمیم نسبت به روش های دیگر داده کاوی    
10-2- معایب درختان تصمیم    
11- نرم افزارهای مفید برای درخت تصمیم    
12- الگوریتم یادگیری درخت تصمیم پایه    
13- جمع بندی    
14- لغت نامه     
15- مراجع

تعداد مشاهده: 2580 مشاهده

فرمت فایل دانلودی:.doc

فرمت فایل اصلی: doc

تعداد صفحات: 45

حجم فایل:755 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب برای دانشجویان رشته مهندسی کامپیوتر



  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    به همراه اشکال و نمودارها