کاوش قوانین وابستگی در جریانات سریع داده

کاوش قوانین وابستگی در جریانات سریع داده


چکیده:
مسئله کاوش الگوهای تکراری در پایگاهای داده در سال 1993 توسط آگروال و دیگران ارائه شد[ 1]. این مسئله به علت کاربرد وسیع در تجارت، صنعت و علوم مختلف، موضوعی مهم و اساسی در زمینه کشف دانش و داده کاوی است. در سال های اخیر تحقیقات بسیار زیادی در مورد این مسئله انجام گرفته و پیشرفت های چشمگیری صورت گرفته است که حاصل آنها ارائه الگوریتم های کارا و مقیاس پذیر از یک طرف و مطرح شدن آن در کاربرد های مختلف بوده است. تحقیقات انجام شده عموماً در مورد کاوش الگوهای تکراری در پایگاه داده های ایستا بوده است به طوری که الگوریتم های مختلفی در این مورد ارائه شده اند.
کاوش الگوهای تکراری علاوه بر داده های ایستا، اخیراً در پایگاه داده های پویا و  جریان های داده 2 نیز مطرح شده است [8]. در داده های جریانی فرض بر این است که داده ها به صورت پشت سرهم و بی وقفه به سیستم می رسند. در یک جریان داده، داده ها با سرعت و به شکلی بی پایان دریافت می شوند.
انجام محاسبات مختلف آماری و داده کاوی، از جمله مسائل مطرح در مدل جریانی می باشند. در جریان های داده، در هرلحظه، حجم داده هایی که تاکنون رسیده و در آینده نیز خواهد رسید، بسیار زیاد است، بنابراین ذخیره آن امکانپذیر نیست.
در این تحقیق مدل های مختلف بررسی و شناسایی الگو در جریان داده ها مورد بررسی قرار گرفته و الگوریتم های ارائه شده قبلی در هر مدل مورد بررسی قرار می گیرد.
کلید واژه: کاوش الگوهای پرتکرار، داده کاوی، جریان سریع داده، الگوهای توالی

فهرست مطالب:
چکیده
فصل اول: معرفی مساله    
1-2- مقدمه    
1-3- کاوش قوانین وابستگی    
1-4- ضرورت انجام تحقیق    
1-5- سرفصل مطالب    
2- بیان مساله    
2-2- مقدمه    
2-3- مشکلات مساله یافتن الگوهای پرتکرار    
فصل سوم: ادبیات موضوع    
3-2- مقدمه    
3-3- مدل‌های پردازش و کاوش جریان‌های داده    
3-4- جریان کاوی مجموعه اقلام تکراری در مدل نشانه    
3-4-1- الگوریتم شمارش پر اتلاف    
3-4-2- الگوریتم جنگل مجموعه اقلام تکراری پسوندی    
3-5- کاوش مجموعه اقلام تکراری در مدل زوال    
3-5-1- محو زمانی به‌وسیله وزن دادن مستقیم    
3-5-2- الگوریتم استماکس    
3-6- کاوش مجموعه اقلام تکراری در مدل پنجره‌ای    
3-7- الگوریتم‌های بر اساس درخواست    
3-7-1- روش MFI-TRANSW    
3-7-2- الگوریتم استماکس+    
3-7-3- الگوریتم دی. اس. تری    
3-7-4- الگوریتم سی. پی. اس. تری    
3-8- سایر الگوریتم ها    
3-8-1- الگوریتم Moment    
فصل چهارم: جمع بندی    
فهرست منابع و مآخذ    
فهرست شکل ها

تعداد مشاهده: 1846 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 57

حجم فایل:10,782 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات

  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    همراه با شکل، نمودار، جدول، پاورقی، فهرست شکل ها، منابع

پیش بینی ارزش دوره عمر مشتری با زنجیره مارکوف بر اساس مدل داده کاوی

پیش بینی ارزش دوره عمر مشتری با زنجیره مارکوف بر اساس مدل داده کاوی


خلاصه:
مطالعه حاضردر تلاش برای ایجاد یک چارچوب محاسباتی ارزش طول عمر مشتری برای یک شرکت تعمیر و نگهداری خودرو در تایوان است.ارزش دوره عمر مشتری از ارزش کنونی و آینده مشتریان تشکیل شده است که شامل برآورد طول عمر،رفتار خرید در آینده و سود مرتبط با هر رفتار است.
این چارچوب از سه تکنیک برای تخمین ارزش دوره عمر مشتری با استفاده از پایگاه داده معاملات مشتریان استفاده می کند که عبارتند از:
1-  مدل  رگرسیون لجستیک و مدل درخت تصمیم گیری به منظور برآورد احتمال رویگردانی مشتری و پیش بینی طول عمر مشتری
2-  آنالیز رگرسیون برای شناسایی متغییر های مهم مؤثر بر رفتار خرید مشتریان و زنجیره مارکوف که مدل احتمال تغییر رفتار مشتری را بیان می کند.
3-    شبکه های عصبی برای پیش بینی سود ارائه شده توسط مشتری تحت رفتارهای مختلف خرید.

تعداد مشاهده: 1636 مشاهده

فرمت فایل دانلودی:.rar

فرمت فایل اصلی: docx, pptx, pdf

حجم فایل:887 کیلوبایت

 قیمت: 4,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته و فناوری اطلاعات


  • محتوای فایل دانلودی:
    محتوای فایل: پاورپوینت 19 اسلاید، فایل ورد 9 صفحه فایل مقاله لاتین (منبع)

نقش داده کاوی در تجارت الکترونیک

نقش داده کاوی در تجارت الکترونیک


چکیده:
فناوری اطلاعات و ارتباطات خصوصا اینترنت، به صورت فعال حکومت ها را در قرن بیست و یکم به شدت تغیرداده است. داده-کاوی یکی از دستاورد های فناوری اطلاعات و ارتباطات برای بهبود تحلیل ها و تصمیمات سازمانی و استراتژی های مدیریتی می باشد. ادبیات بسیار وسیعی روی داده کاوی و تکنولوژی های بکارگیری موثر آن وجود دارد.
فرآیندهای تجارت الکترونیک و ابزارهای داده کاوی در بسیاری از شرکت ها انقلابی ایجاد کرده اند. داده هایی که، کسب و کارها درباره مشتریان و معاملات آنها جمع آوری می کنند بزرگترین سرمایه ی کسب و کارها هستند. داده کاوی مجموعه ای از تکنیک های خودکار استفاده شده برای استخراج اطلاعات ناشناخته از پایگاه داده های بزرگ است.
در این تحقیق انواع داده های موجود در وب سایت های تجارت الکترونیک را بررسی کرده و موارد استفاده از آنها در داده کاوی را ذکر می کنیم، همچنین نقش داده کاوی را در جهت بهبود ابعاد مختلف تجارت الکترونیک از جمله مدیریت ریسک، بازاریابی هدفمند، مدیریت مشتری، سیستم های پیشنهاد دهنده و شخصی سازی وب بیان می شود.

فهرست مطالب:
چکیده
مقدمه
تعریف کشف دانش داده کاوی
تاریخچه داده کاوی
روشهای گردآوری اطلاعات
آمار و داده کاوی
تفاوت داده کاوی و آنالیز های آماری
مقایسه روش های سنتی آماری با داده کاوی- مثال 1
مقایسه روش های سنتی آماری با داده کاوی- مثال 2
مراحل داده کاوی
یادگیری و بررسی حوزه کاربرد (شناسایی هدف)
انتخاب داده
آماده سازی داده ها
ارزیابی داده ها
قالب بندی پاسخ
انتخاب ابزار
مدلسازی
اعتبار سازی یافته‌ها
ارائه نتایج
استفاده از نتایج
انواع داده کاوی
فعالیت های داده کاوی
مراحل فرایند کشف دانش از پایگاه داده ها
انبارش داده ها
انتخاب داده ها
تبدیل داده ها
کاوش در داده ها
تفسیر نتیجه
نقش وهدف داده کاوی
ایده اصلی داده کاوی
استراتژی های داده کاوی
تکنیک های داده کاوی
درخت تصمیم گیری (Decision tree)
شبکه های عصبی (Neural networks)
نزدیک ترین همسایه (Nearest neighbor)
الگوریتمهای ژنتیک (Genetic algorithms
عملیات های داده کاوی
مدلسازی پیشگویی کننده
تقطیع پایگاه داده ها
تحلیل پیوند
تشخیص انحراف
چرخه تعالی داده کاوی
الگوریتمهای داده کاوی
شبکه های عصبی
درخت های انتخاب
استنتاج قانون
الگوریتمهای ژنتیک
مدل های فرآیند داده کاوی
مدل فرآیند دو سویه
تعریف مساله
ساختن یک پایگاه داده داده کاوی
جستجوی داده
آماده سازی داده برای مدل سازی
ساختن مدل داده کاوی
تائید اعتبارساده
ارزیابی و تفسیر
تایید اعتبار مدل
ایجاد معماری مدل و نتایج
معماری یک نمونه سیستم داده کاوی
برنامه های کاربردی داده کاوی
نرم افزارهای داده کاوی
مقدمه ای بر تجارت الکترونیکی
شناسایی فرصت های تجاری
مفاهیم پایه در تجارت الکترونیک
تعاریف تجارت الکترونیکی
تاریخچه تجارت الکترونیک
طبقه‌های مختلف تجارت الکترونیکی
تفاوت تجارت الکترونیکی با تجارت سنتی
فروشگاه همیشه باز است
ارتباط با مشتری از طریق ابزارهای الکترونیکی
مشتریان تعاملات انجام شده را تحت کنترل دارند
شناخت رفتار مشتری
نقش دولت در تجارت الکترونیک
هوشمندی کسب و کار
تعریف هوشمندی کسب‌ و کار
اهداف اصلی هوشمندی کسب و کار
نتایج فنی سیستمهای هوشمندی کسب و کار
تحلیل مزیتها و معایب رقبا
انبوه داده ها و اطلاعات
فرآیند هوشمندی کسب و کار در سازمان‌ها و شرکت‌ها
هوشمندی کسب و کار ۲.۰
جمع بندی  هوشمندی کسب و کار
انواع داده های موجود در یک سایت تجارت الکترونیک
اطلاعات کوکی و سرور
پروفایل ها / داده های ورودی کاربر
اسناد وب و وب متا دیتا ها
داده کاوی در تجارت الکترونیک
کاربردهای داده کاوی در تجارت الکترونیک
مدیریت ریسک و بازاریابی هدفمند
مدیریت مشتری
سیستم های پیشنهاد دهنده
شخصی سازی وب
جمع بندی و نتیجه گیری
مراجع
فهرست جدول ها
فهرست شکل ها

تعداد مشاهده: 3090 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 67

حجم فایل:713 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    گزارش تخصصی و کمیاب مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش

بررسی متدهای داده کاوی در محیط های توزیع شده، موازی و چند عامله

بررسی متدهای داده کاوی در محیط های توزیع شده، موازی و چند عامله


چکیده:
امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره­ گیری از روشهایی همچون داده­ کاوی برای استخراج دانش و اطلاعات نهفته در داده­ ها، امری غیرقابل اجتناب می­باشد. بدلیل حجم بسیار بالای داده ­ها در بسیاری از کاربردها و اهمیت بیشتر داده­ های جدید، ذخیره­ سازی این داده ­ها امری مقرون به صرفه نیست، لذا داده­ هایی که باید مورد پردازش قرار گیرند، همواره بصوت پویا در حال تغییر و تحول هستند. مساله دیگری که امروزه در بحث داده­ کاوی وجود دارد، بحث توزیع شدگی ذاتی داده ­ها است. معمولا پایگاه هایی که این داده­ ها را ایجاد یا دریافت می­کنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود می­باشند و حاضر نیستند دانش خود را بطور رایگان در اختیار دیگران قرار دهند.
با توجه به سیستم های چند عامله و مناسب بودن آنها برای محیط های پویا و توزیع شده بنظر می­رسد که بتوان از قابلیت های آنها برای داده ­کاوی در محیط های پویا و محیط های توزیع شده بهره برد. اکثر کارهایی که تاکنون در زمینه بهره ­گیری از عامل و سیستمهای چندعامله انجام شده است. خصوصیتهایی همانند خود آغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، یادگیری، قابلیت استدلال، هدف گرایی و قابلیتهای اجتماعی عاملها مورد بررسی قرار نگرفته است. در این تحقیق ما قصد داریم تا به بررسی کارهای موجود در زمینه کاربرد عامل و سیستمهای چند عامله در داده­ کاوی پرداخته و بحث طبقه­ بندی جریان داده ­ها را در یک محیط پویا را مورد بررسی قرار دهیم.
کلمات کلیدی: داده­ کاوی، طبقه ­بندی، جریان داده، عامل محیط توزیع شده

فهرست مطالب:
چکیده
1. فصل اول: معرفی و آشنایی با مفاهیم اولیه
1-1- مقدمه­ای بر داده­ کاوی
1-1-1- خوشه­ بندی
1-1-2- کشف قواعد وابستگی
1-1-3- طبقه ­بندی
1-1-3-1- طبقه ­بندی مبتنی بر قواعد
1-2- داده ­کاوی توزیع ­شده
1-3- عاملها و سیستمهای چند عامله
1-3-1- عامل
1-3-1-1- مقایسه عامل با شی
1-3-1-2- معماری عاملها
1-3-1-3- معماری BDI
1-3-2- سیستم­ های چند عامله
1-3-2-1- مذاکره
1-4- بهره­ گیری از عامل برای داده­ کاوی
1-4-1- سیستم­ های چند عامله، بستری برای داده­ کاوی توزیع شده
1-5- جمع­ بندی
2. فصل دوم: داده­ کاوی پویا
2-1- مقدم ه­ای بر داده­ کاوی پویا
2-2- جریان داده
2-3- طبقه ­بندی جریان داده24
2-3-1- موضوعات پژوهشی
2-4- جمع­ بندی
3. فصل سوم: مروری بر کارهای انجام شده
3-1- مقدمه
3-2- داده­ کاوی توزیع ­شده
3-2-1- روشهای غیرمتمرکز
3-2-2- روشهای مبتنی بر توزیع ذاتی داده­ ها
3-3- کارهای مهم انجام شده در زمینه داده ­کاوی با استفاده از عامل
3-4- کارهای انجام شده در زمینه طبقه­ بندی جریان داده­ ها
3-4-1- روشهای طبقه­ بندی Ensemble-based
3-4-2- درختهای تصمیم بسیار سریع
3-4-3- طبقه­ بندی On-Demand
3-4-4- OLIN
3-4-5- الگوریتمهای LWClass
3-4-6- الگوریتم ANNCAD
3-4-7- الگوریتم SCALLOP
3-4-8- طبقه­ بندی جریان داده­ها با استفاده از یک روش Rule-based
3-5- جمع ­بندی
 فهرست مراجع

تعداد مشاهده: 1948 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 60

حجم فایل:259 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته مهندسی کامپیوتر و فناوری اطاعات


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    همراه با شکل، نمودار، جدول، فهرست شکل ها و منابع

مدیریت اعتبارسنجی مشتریان دریافت تسهیلات بانکی با رویکرد داده کاوی

مدیریت اعتبارسنجی مشتریان دریافت تسهیلات بانکی با رویکرد داده کاوی


چکیده:
پیشرفت شگفت انگیز فن آوری رایانه ای و مجهز شدن بشر به این ابزار، سبب پیشرفت فوق العاده در کسب و ذخیره سازی داده های عددی و همچنین بوجود آمدن پایگاه داده های  بزرگ در زمینه های مختلف شده است. داده های تبادلات تجاری، کشاورزی، ترافیک، اینترنت، داده های نجومی، جزئیات مکالمات تلفنی، داده های پزشکی و درمانگاهی مثالهایی از چنین پایگاه داده ها میباشند.  در واقع تکنیکهای تولید و جمع آوری پایگاه داده ها بسیار سریعتر از توانایی ما در درک و استفاده از آنها رشد کرده است. از اواخر دهة 80 بشر به فکر دستیابی به اطلاعات نهفته در این داده های حجیم، که با بکار بردن سیستم های سنتی استفاده از پایگاه داده ها میسر نبود، افتاد و تلاشها برای انجام این کار را شروع کرد.
داده کاوی  فرآیندی است که در آغاز دهة 90 پا به عرصه ظهور گذاشته و با نگرشی نو، به مسئله ی استخراج اطلاعات از پایگاه داده ها می پردازد.
در سال 1996، اولین شمارة مجلة کشف دانش و معرفت از پایگاه داده ها منتشر شد . در حال حاضر، داده کاوی مهمترین فناوری جهت بهره برداری موثر از داده های حجیم بوده و اهمیت آن رو به فزونی است.
بانک ها به منظور تعیین ریسک اعتباری و ارائه خدمات مالی به مشتریان خود نیازمند شناسایی دقیق آن ها هستند. مدل های اعتبارسنجی می توانند در این زمینه به پشتیبانی از بانک ها بپردازند. درختان تصمیم گیری به عنوان یکی از تکنیک های داده کاوی کاربرد زیادی در اعتبارسنجی مشتریان بانک ها و اعطای تسهیلات اعتباری به آنها دارند. مسئله اصلی شامل دقت طبقه بندی، پیچیدگی، اندازه بیش از حد و عدم انعطاف پذیری درختان تصمیم گیری در طبقه بندی و اعتبار سنجی مشتریان است. هدف از این پژوهش ارائه مدل تلفیقی پیشنهادی برای حل مسائل فوق و بهینه سازی درختان تصمیم گیری با بکارگیری تکنیک های خوشه بندی و الگوریتم ژنتیک است. می توان با انتخاب ویژگی های مناسب توسط الگوریتم ژنتیک و ساخت درختان تصمیم گیری به کاهش پیچیدگی، افزایش انعطاف پذیری و دقت طبقه بندی پرداخت.
در مدل تلفیقی پیشنهادی ابتدا عمل خوشه بندی برروی مجموعه داده اعتباری صورت می گیرد.سپس توسط الگوریتم طبقه بندی متا و الگوریتم انتخاب ویژگی مبتنی بر درخت تصمیم گیری ژنتیکی، درخت تصمیم گیری C4.5 در هر خوشه ساخته می شود. در نهایت با اتخاذ یک استراتژی مناسب، بهترین درختان تصمیم گیری در هر خوشه برای اعتبارسنجی مشتریان انتخاب  می شوند. ابزار یادگیری ماشین وکا و نرم افزار GATree برای تحلیل نتایج بکار می رود. نتایج نشان می دهد که مدل تلفیقی پیشنهادی دقت طبقه بندی بالاتری نسبت به اکثر الگوریتم های طبقه بندی مور مقایسه در این پژوهش دارد و مشتریان اعتباری بانک را با پیچیدگی کمتری طبقه بندی می کند.

فهرست مطالب:
چکیده 
کلید واژه ها
فصل اول: داده کاوی
مقدمه 
داده کاوی چیست؟
تاریخچه داده کاوی
ویژگی های داده کاوی
مزایای داده کاوی
مراحل داده کاوی
عملیات داده کاوی
نرم افزارهای داده کاوی
نمونه های از نرم افزارهای داده کاوی
کاربردهای داده کاوی
کاربرد داده کاوی در بانکداری الکترونیکی
نمونه ای از کاربرد داده کاوی در بانکداری
مراحل عمل داده کاوی از یک پایگاه داده
فصل دوم: داده کاوی و بانکداری
تشریح داده کاوی در بانک
شناسایی و طبقه‏ بندی مشتریان کلیدی
اهمیت دستیابی به رضایت‏مندی مشتری
فرایند داده کاوی در مدیریت ارتباط با مشتری
استخراج داده
تکنیک های استخراج داده
کاربردهای استخراج داده در بخش بانکداری
تعیین اعتبار مشتریان بانک
مجموعه داده 
ریسک اعتباری و اعتبار سنجی
طبقه بندی و درختان تصمیم گیری
خوشه بندی
انتخاب ویژگی ها 
الگوریتم ژنتیک
مدل تلفیقی پیشنهادی
آموزش، تست مدل
مقایسه نتایج درخت تصمیم گیری مدل تلفیقی پیشنهادی با سایر درختان تصمیم گیری
فصل سوم: استنتاج
نتیجه گیری
فصل چهارم: پیوست ها
پیوست 
فصل پنجم: منابع
منابع
فهرست جدولها
فهرست شکل ها

تعداد مشاهده: 1371 مشاهده

فرمت فایل دانلودی:.doc

فرمت فایل اصلی: doc

تعداد صفحات: 75

حجم فایل:2,145 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب برای دانشجویان رشته مهندسی کامپیوتر
    اختصاصی سایت فایلود و بدون مشابه


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش