داده کاوی چیست و چگونه کار میکند

behzad-hr

عضو جدید
کاربر ممتاز
سلام دوستان
من چند روزی هست که یه مقاله از داده کاوی دارم میخونم و به نظر خودم خیلی کامل و جالب توضیح داده و به علت درخواست ایمان جان سعی میکنم هر قسمتشو به طور خلاصه برای شما هم بگم
امیدوارم مفید باشه و غیر تکراری :gol::gol:
 

behzad-hr

عضو جدید
کاربر ممتاز
مقدمه :
به طور کلی استفاده همگانی از وب و اینترنت ما را مواجه با حجم زیادی داده و اطلاعات میکند و رشد انفجاری این داده ها ی ذخیره شده نیاز مبرم به تکنولوژی های جدید کرده تا این حجم زیاد داده ها را به اطلاعات و دانش تبدیل کند که داده کاوی به عنوان یه راه حل برای این مسأله مطرح می باشد .
داده کاوی به طور همزمان از چندین رشته علمی بهره می گیرد نظیر : تکنولوژی پایگاه داده ، هوش مصنوعی ، یادگیری ماشین ، شبکه های عصبی و ...
داده ها اغلب حجیم ، اما بدون ارزش می باشند و تنهایی قابل استفاده نیستند بلکه دانش نهفته در داده ها قابل استفاده می باشد به این دلیل اغلب به داده کاوی ، تحلیل داده ای ثانویه گفته می شود .
------------------------------------
------------------------------
----------------------
ادامه دارد ...
 
آخرین ویرایش:

Iman Gom

مدیر بازنشسته
کاربر ممتاز
فرض کنید در یک واحد crm با تعداد مشتری خیلی خیلی بالا میخواید بدونید چه کسانی مشتریان وفاداری شدن ، یا چقدر مشتری ها رو از دست دادید و به سمت رقبا رفتن ...

یا مثلا در تراکنش های مالی می تونید پی ببرید کدام ها جعلی بودن ، کدام مشتری های امکان تخلف کردن دارن ، کدومشون تخلف کردن اصلا ...

در یک مجموعه افرادی رو که به پیشنهادات فروش بیشتر ممکن هست پاسخ مثبت بدن شناسایی کنید ...

اینا مثال هایی هست که از داده کاوی کمک گرفته می شه.
 

behzad-hr

عضو جدید
کاربر ممتاز
چه چیزی سبب پیدایش داده کاوی شده است ؟؟
اصلی ترین دلیلی که باعث شد داده کاوی کانون توجهات در صنعت قرار بگیرد ، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها اطلاعات و دانش سودمند استخراج کنیم . اطلاعات و دانش بدست آمده در کاربردهای وسیعی از مدیریت کسب و کار و کنترل تولید و تحقیقات علمی مورد استفاده قرار می گیرد .
داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست
ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای داده ای را کشف می کنند.
نتیجه : شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم .
----------------------------------
-----------------------------
---------------------
ادامه دارد ...
 

behzad-hr

عضو جدید
کاربر ممتاز
مراحل کشف دانش :
کشف دانش دارای مراحل تکراری زیر است : ( سعی کردم تا جایی که بشه خلاصه بگم )
1. پاکسازی داده ها ( از بین بردن نویز و ناسازگاری داده ها )
2. یکپارچه سازی داده ها ( چندین منبع داده ترکیب می شوند )
3. انتخاب داده ها ( داده های مرتبط با آنالیز از پایگاه داده بازیابی می شوند )
4. تبدیل کردن داده ها ( تبدیل داده ها به فرمی که مناسب برای داده کاوی باشند مثل خلاصه سازی و همسان سازی )
5. داده کاوی ( فرآیند اصلی که روالهای هوشمند برای استخراج الگوها از داده ها به کار گرفته می شوند )
6. ارزیابی الگو ( برای مشخص کردن الگوهای صحیح و مورد نظر به وسیله معیارهای اندازه گیری )
7. ارایه دانش ( یعنی نمایش بصری )
توجه شود که بر طبق این دیدگاه داده کاوی تنها یک مرحله از کل فرآیند است ، البته به نوان یک مرحله اساسی که الگوهای مخفی را آشکار می سازد .
-------------------------------
--------------------------
------------------
ادامه دارد ...
 

behzad-hr

عضو جدید
کاربر ممتاز
جایگاه داده کاوی در میان علوم مختلف :
ریشه های داده کاوی در میان سه خانواده از علوم قابل پیگیری می باشد .
مهمترین آن آمار کلاسیک می باشد . بدون آمار هیچ داده کاوی وجود نخواهد داشت ، بطوریکه آمار اساس اغلب تکنولوژی هایی می باشد که داده کاوی بر روی آنها بنا می شود .
دومین خانواده هوش مصنوعی می باشد . هوش مصنوعی که بر پایه روشهای ابتکاری می باشد و با آمار ضدیت دارد ، تلاش دارد تا فرایندی مانند فکر انسان را برای حل مسایل آماری بکار بندد
سومین خانواده یادگیری ماشین می باشد که به مفهوم دقیقتر اجتماع آمار و هوش مصنوعی می باشد . از یادگیری ماشین به عنوان تحول هوش مصنوعی یاد می شود .
--------------------------
---------------------
----------------
ادامه دارد...
 
آخرین ویرایش:

Iman Gom

مدیر بازنشسته
کاربر ممتاز
اسلاید فارسی

اسلاید فارسی

سلام

این اسلاید ها رو قرار میدم . چندین سری دیگه هم دارم که به مرور آپلود میکنم . اسلاید ها فارسی هستند...
 

پیوست ها

  • 20120526195717383.pdf
    220 کیلوبایت · بازدیدها: 0

behzad-hr

عضو جدید
کاربر ممتاز
داده کاوی و آمار :
در حالی که تکنیک های آماری پیشرفته در داده کاوی استفاده می شود با این حال تفاوت های معنی داری بین دنیای استنتاج آماری سنتی و داده کاوی وجود دارد .
یک تفاوت این دو در نوع داده ها است . آماردان ها با داده های دست اول که برای تحقیق درستی فرض های خاصی جمع آوری و تولید شده اند ، کار می کنند . اما داده کاوها با تحلیل های دست دوم که اغلب از منابع مختلفی گرد آوری شده اند کار می کنند .
حجم داده ها در آمار کوچک یا متوسط است در حالی که در داده کاوی حجم داده ها بزرگ است
در آمار داده ها برای آزمون یک مدل یا پاسخ دادن به یک سوال خاص جمع آوری شده اند که طراحی آزمایش ها ، کنترل موردی از آن جمله هستند. لیکن در داده کاوی داده ها به صورت الکترونیکی برای استفاده های ممکن در آینده نگهداری می شوند .
در آمار پردازش داده توسط انسان به کمک کامپیوتر صورت می گیرد لیکن در داده کاوی توسط الگوریتم های کامپیوتری با کمک انسان صورت می گیرد
( موارد دیگری هم وجود دارد که برای مختصر شدن مطالب از آن ها چشم پوشی کردم )
----------------------------
-----------------------
-----------------
ادامه دارد ...
 

behzad-hr

عضو جدید
کاربر ممتاز
داده کاوی و انبار داده ها :
معمولا داده هایی که در داده کاوی مورد استفاده قرار می گیرند از یک انبار داده استخراج می گردند و در یک پایگاه داده یا مرکز داده ای ویژه برای داده کاوی قرار می گیرند .
اگر داده های انتخابی جزیی از انبار داده ها باشند بسیار مفید است چون بسیاری از اعمالی که برای ساختن انبار داده ها انجام می گیرد با اعمال مقدماتی داده کاوی مشترک است و در نتیجه نیاز به انجام مجدد این اعمال وجود ندارد ، از جمله این اعمال پاکسازی داده ها می باشد .
پایگاه داده مربوط به داده کاوی می تواند جزیی از سیستم انبار داده ها باشد و یا می تواند یک پایگاه داده جدا باشد .
---------------------------
-----------------------
------------------
ادامه دارد ...
 

behzad-hr

عضو جدید
کاربر ممتاز
دلایل اهمیت داده کاوی :
منافع احتمالی داده کاوی از طریق کشف دانش ( کشف اطلاعات مرتبط و قابل پیگیری درباره مشتریان سابق و فعلی به علاوه مشتریان احتمالی )حاصل می شوند . برخی منافع حاصل از داده کاوی شامل موارد زیر می شوند :
**افزایش درآمد از طریق فروش متقاطع و ترغیب مشتری
**افزایش درآمد از طریق کاهش میزان مشتری از دست رفته
**دستیابی به نتایج قابل اندازه گیری
((هر کدام از این موارد دارای توضیحات می باشد که برای مختصر شدن مطالب از آنها چشم پوشی شد))
-----------------------
-------------------
----------------
ادامه دارد...
 

behzad-hr

عضو جدید
کاربر ممتاز
چگونگی استفاده از داده کاوی :
داده کاوی توسط سازمان ها در صنایع متعددی استفاده می شود . نیاز اصلی برای این نوع تجزیه وتحلیل داده ها ی مشتری ، دارا بودن توان محاسباتی مناسب و الگوریتم های نرم افزاری تخصصی است. هر سازمان با دارا بودن پایگاه داده های مشتری و کسی که دانش در مورد مشتری برای تصمیم گیری او مهم است ، می تواند منافعی از داده کاوی به دست آورد .اما چگونه از آن استفاده می شود؟سناریو ذیل را در نظر بگیرید.یک موسسه مالی چندین نوع داده از مشتریانش دارد:تعداد حساب هایی که آنها در موسسه دارند،انواع حساب ها،مانده هر حساب ،طول مدتی که حساب نگهداری شده است ،مکان جغرافیایی موسسه و غیره.اکنون فرض کنید که ما متوجه می شویم که نرخ مشتریان از دست رفته (نرخی که مشتریان حساب هایشان را می بندند)به دلیل افزایش عدم رضایت است. یک رویه داده کاوی می تواند برای برخوردبا این مشکل استفاده شود.پروژه تعیین خواهد کرد آیا وجه اشتراک هایی در میان مشتریانی که حساب هایشان را بسته اند ،وجود دارند:حق تصدی مشابه ،انواع حساب های مشابه ،تتمه حساب های مشابه یا ترکیبی از این موارد؟ اگر این چنین الگو هایی قابل رویت هستند،می توان سیاست هایی جهت کاهش نرخ مشتریان از دست رفته به کار گرفت.
-----------------------------------
----------------------------
---------------------
ادامه دارد ...
 
آخرین ویرایش:

behzad-hr

عضو جدید
کاربر ممتاز
کاربردهای داده کاوی :
1. خرده فروشی(کاربرد کلاسیک داده کاوی) :
- تعیین الگو های خرید مشتریان
- تجزیه و تحلیل سبد خریدبازار
- بخش بندی بازار و تقسیم بندی مشتریان
- بازاریابی برای محصولات جدید
- قیمت گذاری محصولات و خدمات جدید
- تعیین و شناسایی بازار هدف
- شناسایی نارضایتی های مشتریان
- پیش بینی میزان خرید مشتریان از طریق پست (فروش الکترونیکی)
2. بیمه :
- پیش بینی میزان خرید بیمه نامه های جدید توسط مشتریان
- تجزیه و تحلیل دعاوی
- کشف کلاهبرداری
3. مخابرات :
- شناسایی مشتریان خوش حساب وبد حساب
- تحلیل ویژگی های مشترکین
4. صنایع برق،گاز،آب :
- شناسایی الگوی رفتار مشترکین
- پیش بینی میزان مصرف
5. پزشکی :
-
کشف ارتباط علاﺋم و بیماری
- تحلیل نسخه های پزشکی (با استفاده از متن کاوی)
- تحلیل آرایه های DNA و زیست پزشکی
- تعیین نوع رفتار با بیماران و پیش بینی میزان موفقیت اعما ل جراحی
- تعیین میزان موفقیت روش های درمانی در برخورد با بیماری های سخت
- تحلیل های ژنتیکی
- تحلیل اطلاعات زیستی
6. پلیس :
-
تشخیص جراﺌم مختلف
- شناسایی و دسته بندی ویژگی های مجرمی
- تحلیل حوادث رانندگی
7. حوادث طبیعی :
- پیش بینی سیل
- پیش بینی زلزله
8. وب کاوی :
- تشخیص نفوذ به صفحات وب
- چگونگی ارتباط بین صفحات گوناگون
- چگونگی مشخصات صفحه وب
- پیشنهاد صفحات مرتبط
9. بانکداری :
- تشخیص مشتریان ثابت
- تحلیل ریسک پرداخت وام
- رتبه بندی اعتباری
- کشف کلاهبرداری
- کشف تراکنش های مشکوک مالی(پول شویی)
(( البته چند مورد دیگر هم هست که در پست های بعدی مفصل توضیح داده خواهد شد ))
--------------------------------
---------------------------
-----------------
ادامه دارد ..
 
آخرین ویرایش:

100af

مدیر تالار مهندسی صنایع
مدیر تالار
کاربر ممتاز
سلام دوستان
من چند روزی هست که یه مقاله از داده کاوی دارم میخونم و به نظر خودم خیلی کامل و جالب توضیح داده و به علت درخواست ایمان جان سعی میکنم هر قسمتشو به طور خلاصه برای شما هم بگم
امیدوارم مفید باشه و غیر تکراری :gol::gol:
به نظرم جالب و کاربردیه .
 

behzad-hr

عضو جدید
کاربر ممتاز
کاربرد داده کاوی در مدیریت ارتباط با مشتری :
[FONT=&quot] مدیریت ارتباط با مشتری یکی از سیستم های هوشمندی کسب و کار است که به جنبه های مختلف مشتری می پردازد، از جمله اینکه به دنبال آن است تا رفتار مشتری را مبتنی بر داده های در دسترس گذشته پیش بینی نموده و همچنین با شناسایی الگو های رفتاری مشتریان رابطه مناسبی را با آنها بر قرار نماییم .[/FONT]
[FONT=&quot]رابطه مشتری با زمان تغییر می کند و چنانچه کسب و کار ومشتری درباره یکدیگر بیشتر بدانند این رابطه تکامل و رشد می یابد. شما هر چقدر بیشتر درباره مشتریان خود بدانید ، توانایی شما با اراﺌه استدلال برای خدمت دهی به آنها بیشتر می شود . این موضوع در عوض به روابط قوی تر مشتری کسب و کار و افزایش درآمد منجر می شود.
[/FONT][FONT=&quot]علاوه بر اتوماسیون سیستم های اطلاعاتی ،نیروی فروش و توسعه زیر ساختار اتوماسیون سیستم بازار یابی یک عنصر مهم [/FONT][FONT=&quot]CRM[/FONT][FONT=&quot]، بخش تحلیلی است. بخش تحلیل ، شامل استفاده از چندین تکنیک علمی برای تحلیل داده های در دسترس مشتری می شود و بر اساس اطلاعات پیش بینی از آن استفاده می کند که به تصمیم گیری های کسب و کار کمک خواهد کرد . برای مثال ،این تحلیل ها به سوالاتی همچون کدام مشتریان در اولویت هستند ،چه چیزی به کدام مشتری فروخته شود و احتمال اینکه یک مشتری هر پیشنهادی را بپذیرد، چقدر است؟پاسخ می دهند.[/FONT]
[FONT=&quot]همگام با پیشرفت تکنولوژی بسیاری از ابزارهای[/FONT][FONT=&quot]CRM[/FONT][FONT=&quot]، ابزارهای آماری و سنتی در قا لب یک سیستم یکپارچه شده و امکان تحلیل قوی تری را فراهم می کنند. در حال حاضر گزینه های موجود ، استفاده از بیش از یک ابزار به صورت همزمان را برای تامین مناسب ترین راه حل برای نیاز ما فراهم می کنند.[/FONT]
[FONT=&quot]از این رو، یکپارچگی منا سب ابزار های پیش بینی برای[/FONT][FONT=&quot]CRM[/FONT][FONT=&quot] جهت استخراج اطلاعات از داده های موجود ضروری است .[/FONT]
[FONT=&quot]در همه ی سیستم های توسعه داده شده در سال های اخیر،تکنیک های داده کاوی بخش یکپارچه شده ای از [/FONT][FONT=&quot] [/FONT][FONT=&quot]CRM[/FONT][FONT=&quot]بوده اند . تکنیک های داده کاوی به تحلیل داده ها کمک کرده و مقدار قابل توجهی اطلاعات مفید از آن استخراج می شود ، این داده های استخراج شده توسط سیستم های پشتیبانی تصمیم برای کمک به تصمیمات کسب و کار استفاده می شود. طول عمر مشتری چارچوب خوبی برای به کار گیری داده کاوی در مدیریت ارتباط با مشتری فراهم می کند .در بخش ورودی داده کاوی ، طول عمر مشتری می گوید چه اطلاعاتی در دسترس است و در بخش خروجی آن طول عمر می گوید چه چیزی احتمالا جا لب توجه است و چه تصمیماتی باید گرفته شود
[/FONT][FONT=&quot]در محیط کسب و کار رقابتی امروزی قابلیت شناسایی مشتریان سود آور حفظ وفاداری آنها در بلند مدت وتوسعه روابط موجود از عوامل رقابتی کلیدی برای یک شرکت است . [/FONT][FONT=&quot]CRM[/FONT][FONT=&quot] به شرکت ها کمک می کند تا ارزش مشتریان را درک نموده ،سودآورترین مشتریان خود را هدف گذاری کرده ،روابط بسیارخوب خود را که منجر به افزایش سود آوری و وفاداری می شود با مشتریان حفظ کنند. ارزیابی دقیق سود آوری مشتری و هدف گذاری سود آور ترین مشتریان از عناصر حیاتی در موفقیت[/FONT][FONT=&quot]CRM[/FONT][FONT=&quot] هستند . بنابراین می توان از طریق داده کاوی ارزش مشتریان را تعیین ،رفتار آینده آنها را پیش بینی وتصمیما ت آگاهانه ای را در این رابطه اتخاذ کرد .[/FONT]
---------------------------------
--------------------------
---------------------
ادامه دارد ...
 

behzad-hr

عضو جدید
کاربر ممتاز
تحلیل میزان طول عمر مشتری :
[FONT=&quot][/FONT][FONT=&quot][FONT=&quot]یکی دیگر از کاربردهای داده کاوی در تحلیل میزان طول عمر مشتری[/FONT] ( CLV) می باشد. ارزش مشتری تحت عناوینی همچون ارزش طول عمر،میزان طول عمر مشتری،تساوی حقوق مشتری و سود آوری مشتری مطالعه شده است. میزان عمر مورد انتظار از یک مشتری یا مشتری احتمالی می تواند ابزاری مفید برای کشف الگوهایی باشد که قابل پی گیری هستند. ارزش عمر، ارزش مورد انتظار از یک مشتری احتمالی یا یک مشتری در یک دوره زمانی خاص برآورد شده بر مبنای قیمت های امروزی است . یک دلیل برای تجزیه و تحلیل میزان عمر این است که تامین کننده می تواند با شناسایی میزان عمر بالقوه یک مشتری،آن مشتریانی که احتمالا در طول زمان با ارزش تر هستند ،تعیین کرده و روابط قوی تری با آن مشتریان برقرار کند[/FONT]
--------------------------------
---------------------------
-----------------------
ادامه دارد ...
 

zohreh91

عضو جدید
یا سلام
ضمن عرض تشکر از دوستانی که مطالب مفیدی در این تاپیک قرار دادن،اجازه میخواستم تا منم مطالبی در این خصوص قرار بدم.این مطالب برگرفته از کتاب داده کاوی دکتر شهرابی عضو هیئت علمی دانشگاه امیرکبیر و دبیر کنفرانس داده کاوی ایران است.امیدوارم مورد استفاده قرار بگیره
 

zohreh91

عضو جدید
داده­ کاوی چیست؟

داده­ کاوی به بررسی و تجزیه و تحلیل مقادیر عظیمی از داده­ها به منظور کشف الگوها و قوانین پنهان و معنی­ دار درون داده­ ها اطلاق می­شود.
بر اساس اعلام دانشگاه MIT[1]امروزه مرز و محدودیتی برای دانش داده­کاوی متصور نبوده و مرز آن را از اعماق اقیانوس­ها تا بیکران فضا می­دانند. بعبارت دیگر کاربرد دانش داده­کاوی در تمامی حوزه­ های برخوردار از داده بوده و تنها محدودیت دانش داده­ کاوی نبود داده است.

در حقیقت هیچ کدام از الگوریتم­های داده­ کاوی، در ابتدا با کاربردهای تجاری در ذهن به وجود نیامدند. داده­ کاوهای تجاری از یک سری تکنیک­های وام گرفته شده از آمار و علوم کامپیوتر[2] استفاده می­کنند. انتخاب مجموعه­ای از تکنیک­ها برای به کارگیری در موقعیت خاص بستگی به سه عامل "ماهیت عمل داده­ کاوی"، "ماهیت داده­ های موجود" و "مهارت­ها و ترجیحات داده­ کاوان" دارد.
 

zohreh91

عضو جدید
حال سؤال اینجاست که با داده­ کاوی چه کارهایی می­توان انجام داد؟ داده ­کاوی با همه عظمت و بزرگی خود که امروزه در تمامی موضوعات جهان ورود پیدا کرده است شامل شش عمل و وظیفه مهم است که می­توان بسیاری از مسائل محیط اطراف خود را در قالب یکی از این شش عمل و وظیفه زیر گنجاند:

· دسته­ بندی

· تخمین

· پیش­ بینی

· گروه­ بندی شباهت

· خوشه­ بندی

· توصیف و نمایه­ سازی

سه مورد اول همگی داده­ کاوی هدایت شده هستند که هدف آنها یافتن ارزش یک متغیر هدف خاص است. گروه­ بندی شباهت و خوشه­بندی جزو داده­کاوی غیر هدایت شده هستند که در آن هدف، یافتن ساختار پنهان درون داده­ ها بدون توجه به یک متغیر هدف خاص است. نمایه سازی عملی توصیفی است که می­تواند هم هدایت شده و هم غیر هدایت شده باشد.
 

zohreh91

عضو جدید
داده کاوی و دسته­ بندی
به نظر می­رسد دسته­ بندی که یکی از معمول­ترین کارکردهای داده­ کاوی است، یکی از واجبات بشر باشد. تمامی خلقت خداوند بر پایه دسته­ بندی ایجاد گردیده است. ما برای شناخت و برقراری رابطه دربارۀ دنیا، بطور مداوم دسته­ بندی، طبقه­ بندی و درجه­ بندی می­کنیم. ما موجودات زنده را به شاخه­ هاو گونه­ ها، مواد را به عناصر وحیوانات و انسان را به نژادها تقسیم می­کنیم.
دسته­ بندی شامل بررسی ویژگی­های یک شی جدید و تخصیص آن به یکی از مجموعه­ های از قبل تعیین شده می­باشد. عمل دسته­ بندی با تعریف درستی از دسته­ ها و مجموعه­ ای از ویژگی­ها که حاوی موارد از پیش دسته­ بندی شده هستند مشخص می­گردد؛ این عمل شامل ساختن مدلی است که بتوان از آن برای دسته­ بندی کردن داده­ های دسته­ بندی نشده، استفاده نمود. اشیایی که باید دسته­ بندی شوند، معمولاً به وسیلۀ اطلاعاتی در جدول پایگاه داده­ ها یا یک فایل ارائه می­شوند و عمل دسته­ بندی شامل افزودن ستون جدیدی با کد دسته­ بندی خاصی است. مثال­هایی از دسته­ بندی که با استفاده از تکنیک­های توصیف شده در این کتاب به دست آمده­ اند، در زیر ارائه شده است:
· دسته­ بندی متقاضیان وام و اعتبار به عنوان کم خطر، متوسط و پرخطر
· انتخاب محتویات یک صفحۀ وب برای قرار دادن در شبکۀ اینترنت
· تعیین شماره تلفن­ های متصل به دستگاه­های فکس
· تشخیص مدعیان غیر واقعی دریافت خسارت از بیمه
در همۀ این مثال­ها تعداد محدود و از پیش تعیین شده­ ای از دسته­ ها وجود دارد و انتظار داریم بتوانیم هر اطلاعاتی را به یک یا دو مورد از آنها تخصیص دهیم. تکنیک­های درخت تصمیم و نزدیکترین همسایه از جمله تکنیک­های دسته­ بندی می­باشند؛ شبکه­ های عصبی و تحلیل پیوند نیز در شرایط خاصی عمل دسته­ بندی را انجام می­دهند.
 

zohreh91

عضو جدید
داده کاوی و تخمین
تخمین، با نتایج مجزایی که با ارقام پیوسته نشان داده شده­ اند، سروکار دارد. در تخمین، داده­ های ورودی در قالب متغیرهای ورودی مختلف به سیستم داده می­شود و متغیرهای خروجی آن رقمی چون درآمد یا تراز کارت اعتباری می­باشد.
در عمل، تخمین اغلب برای انجام دسته­ بندی استفاده می­شود. یک شرکت کارت­های اعتباری که مایل است یک فضای تبلیغاتی را در پاکت­های صورت­حساب به یک تولید کنندۀ پوتین اسکی بفروشد، باید مدل دسته­ بندی تهیه کند که همۀ دارندگان کارت­ها را در یکی از دو دستۀ اسکی­ باز یا غیر اسکی­ باز قرار دهد. روش دیگر ایجاد مدل تخمین این است که به هر دارندۀ کارت، یک امتیاز تمایل به اسکی تخصیص می­دهد؛ این ارقام می­تواند صفر و یک باشد که نشانگر احتمال تخمین زده شده برای اسکی­ باز بودن یا نبودن دارندۀ کارت است. عمل دسته­ بندی، اکنون به ایجاد امتیازی آستانه ­ای منجر می­گردد. هر کسی که امتیازی بیشتر یا مساوی با امتیاز آستانه داشته باشد به عنوان اسکی­ باز قلمداد می­شود و هر کسی که امتیازی کمتر از امتیاز مورد نظر داشته باشد اسکی­باز محسوب نمی­گردد.
روش تخمین فواید زیادی دارد که مهم­ترین آن این است که در آن اطلاعات را می­توان مطابق تخمین به دست آمده مرتب نمود. برای پی­ بردن به اهمیت آن فرض کنید که شرکت تولید پوتین­های اسکی، برای ارسال پانصد هزار آگهی تبلیغاتی محصول جدید خود بودجه­ ریزی نموده است. فرض کنید از روش دسته­ بندی استفاده شده و یک و نیم میلیون نفر اسکی باز تعیین شده­ اند، پس به راحتی می­توان به صورت تصادفی، تبلیغات را برای پانصد هزار نفر منتخب از آن افراد ارسال نمود؛ در حالیکه اگر مدل تخمین، امتیاز تمایل به اسکی را برای کلیه افراد تعیین نماید شایسته است که تبلیغات را برای پانصدهزار از محتمل­ ترین کاندیداها فرستاد. پر واضح است که احتمال پاسخ­گیری از ارسال تبلیغات بر اساس مدل تخمین بسیار بیشتر از ارسال تصادفی تبلیغات می­باشد. برخی دیگر از مثال­های تخمین در زیر آمده است:
· تخمین تعداد فرزندان در یک خانواده
· تخمین درآمد کل یک خانواده
· تخمین دوره عمر یک مشتری
· تخمین احتمال پاسخ فردی خاص به یک پیشنهاد بیمۀ عمر
مدل­های رگرسیون و شبکه­ های عصبی از جمله تکنیک­های مناسب داده­ کاوی برای تخمین می­باشند.
 

zohreh91

عضو جدید
داده کاوی و پیش­ بینی
پیش­ بینی مانند دسته­ بندی یا تخمین است با این تفاوت که اطلاعات، مطابق برخی از رفتارهای پیش­ بینی شدۀ آینده یا ارقام تخمین­ زدۀ آینده دسته­ بندی می­شوند. در عمل پیش­ بینی، تنها روش برای بررسی صحت دسته­ بندی، انتظار دیدن آینده است.
هر یک از تکنیک­های استفاده شده در دسته­ بندی و تخمین را می­توان برای استفاده در پیش­ بینی تطبیق داد، جایی که متغیری که باید پیش­ بینی شود از قبل معلوم است و داده­ های پیشین برای آن وجود دارد. از داده­ های پیشین برای تهیۀ یک مدل که بیانگر رفتار مشاهده شدۀ کنونی است استفاده می­شود؛ وقتی این مدل برای ورودی­های کنونی به کار رفت؛ نتیجۀ کار، پیش­ بینی رفتار آینده خواهد بود. مثالهایی از پیش­ بینی که از طریق تکنیک­های داده­ کاوی بحث شده در این کتاب به آنها پرداخته می­شود، از این قرارند:
· پیش­ بینی اینکه کدام مشتریان در طول 6 ماه آینده، بازار محصول ما را ترک خواهند کرد.
· پیش­ بینی اینکه کدام مشترکین تلفن، متقاضی خدمات ویژه مانند مکالمۀ سه جانبه یا پیغام­ گیر خواهند شد.
بیشتر تکینک­های داده­ کاوی که در این کتاب بیان شده­ اند در صورت وجود داده­ های مناسب، برای استفاده در پیش­ بینی مناسبند. انتخاب تکنیک به ماهیت داده­ های ورودی و نوع متغیری که باید پیش­ بینی شود بستگی دارد.
 

zohreh91

عضو جدید
داده کاوی و گروه­بندی شباهت یا قوانین وابستگی
عمل گروه­ بندی شباهت برای تعیین ویژگی­های همزمانی هستند که در وقوع یک پدیده رخ می­دهند. بعبارت دیگرعمل گروه­ بندی شباهت احتمال وقوع و یا عدم وقوع همزمان ویژگی­ها را تعیین می­نماید. بعبارت ساده­ تر عمل گروه­ بندی شباهت تعیین می­کند که چه چیزهایی با هم جورند؛ مثال معمول این موضوع تعیین کالاهایی است که با هم در یک چرخ دستی خرید در سوپر مارکت قرار می­گیرند، چیزی که آن را تحلیل سبد بازار می­ نامیم. فروشگاه­های زنجیره­ای خرده­ فروشی می­توانند از گروه­ بندی شباهت برای تعیین چیدمان کالاها در قفسه­ های فروشگاه، در یک کاتالوگ و یا صفحه وب فروش اینترنتی استفاده کنند، تا اقلامی که اغلب با هم خریده می­شوند در کنار هم قرار گیرند. از گروه­ بندی شباهت می­توان برای تعیین شرایط فروش­های متقابل و همزمان و همچنین برای طراحی بسته­ بندی­ های جذاب و یا دسته­ بندی محصولات و خدمات استفاده کرد.
گروه­ بندی شباهت یک روش ساده برای ایجاد قوانین از داده­ هاست. اگر دو قلم کالا مثلاً شیر خشک و پوشک نوزاد در یک قفسه و کنار هم چیده شوند، می­توان دو قانون وابستگی ایجاد کرد:
· افرادی که شیر خشک نوزاد می­خرند همچنین با احتمال P1 پوشک نوزاد را هم می­خرند.
· افرادی که پوشک نوزاد می­خرند همچنین با احتمال P2 شیر خشک نوزاد را هم می­خرند.
 

zohreh91

عضو جدید
داده کاوی و خوشه­ بندی
خوشه­ بندی به عمل تقسیم جمعیت ناهمگن به تعدادی از زیر مجموعه­ ها یا خوشه­ های همگن گفته می­شود. وجه تمایز خوشه­ بندی از دسته­ بندی این است که خوشه­ بندی به دسته­ های از پیش تعیین شده تکیه ندارد. در دسته­ بندی بر اساس یک مدل هر کدام از داده­ ها به دسته­ ای از پیش تعیین شده اختصاص می­ یابد؛ این دسته­ ها یا از ابتدا در طبیعت وجود داشته­ اند(مثل جنسیت، رنگ پوست و مثال­هایی از این قبیل) یا از طریق یافته­ های پژوهش­های پیشین تعیین گردیده­ اند.
در خوشه­ بندی هیچ دستۀ از پیش تعیین شده­ ای وجود ندارد و داده­ ها صرفاً براساس تشابه گروه­ بندی می­ شوند و عناوین هر گروه نیز توسط کاربر تعیین می­گردد. به طور مثال خوشه­ های علائم بیماری­ها ممکن است بیماری­های مختلفی را نشان دهند و خوشه­ های ویژگی­های مشتریان ممکن است حاکی از بخش­های مختلف بازار باشد.
خوشه­ بندی معمولاً به عنوان پیش درآمدی برای بکارگیری سایر تحلیل­ های داده­ کاوی یا مدل­سازی به کار می­رود. به عنوان مثال، خوشه ­بندی ممکن است اولین گام در تلاش برای تقسیم­ بندی بازار باشد؛ برای ایجاد یک قانون که در همۀ موارد کاربرد داشته باشد و به این سؤال پاسخ دهد که مشتریان به چه نوع تبلیغاتی به بهترین نحو پاسخ می­دهند اول باید مشتریان را به خوشه­ های متشکل از افرادی با عادات مشابه خرید تقسیم نمود و سپس پرسید که چه نوع تبلیغاتی برای هر خوشه به بهترین نحو عمل می­کند.
 

Similar threads

بالا