نام كتاب: داده‌کاوی و کشف دانش درMicrosoft SQL SERVER 2008

ناشر: انتشارات انديشه‌سرا (با ﻣﺴﺅوليت بهزاد پاكروح)

مولف: فاطمه باقرزاده

فهرست

فصل اول

مقدمه‌ای بر داده کاوی

داده کاوی چیست؟

چه چیزی برای داده کاوی نیاز است؟

ضرورت داده کاوی برای مسائل تجاری

وظایف داده کاوی

Classification

Clustering

Association

Regression

Forcasting

Sequence Analysis

Deviation Analysis

تکنیک‌های داده کاوی

جریان داده

چرخه پروژه داده کاوی

مرحله 1: جمع‌آوری داده

مرحله 2: پاکسازی و تبدیل داده‌ها

مرحله 3: ساخت مدل

مرحله 4: ارزیابی مدل

مرحله 5: گزارش گیری

مرحله 6: پیش‌بینی (امتیازدهی)

مرحله 7: تجمیع کاربردی

مرحله 8: مدیریت مدل

فرآیند داده کاوی

CRISP-DM

درک کسب و کار

درک اطلاعات

آماده سازی داده

مدل سازی

ارزیابی

Deployment

SEMMA

مراحل فرآیند SEMMA

داده کاوی و بازار آن

وسعت بازار داده کاوی

عرضه کنندگان و محصولات عمده

مسائل و چالش‌های کنونی

استانداردهای داده کاوی

خلاصه

فصل دوم

استفاده از OLE DB برای داده کاوی

معرفی OLE DB

چرا برای داده کاوی از OLE DB استفاده می‌شود؟

مفاهیم اولیه در OLE DB برای داده کاوی

Case

Case Key

Nested Key

Case Table و Nested Table

ستونهای عددی و ستونهای جدولی

مدل داده کاوی

ایجاد مدل

آموزش مدل

پیش‌بینی مدل

DMX

سه مرحله داده کاوی

مرحله 1: ساخت مدل

مرحله 2: آموزش مدل

مرحله 3: پیش‌بینی مدل

Singleton Queries

خلاصه

فصل سوم

داده کاوی در SQL Server

معرفی Business Intelligence Development Studio

درک رابط گرافیکی کاربر

حالت آفلاین و حالت فوری

حالت فوری

نحوه کار در حالت فوری

حالت آفلاین

شروع در حالت آفلاین

ساخت اشیای داده کاوی

Data Source

استفاده از Data Source View

ایجاد و ویرایش مدلها

ساختار‌ها و مدل‌ها

استفاده از Data Mining Wizard

استفاده از Data Mining Designer

کار با Mining Structure Editor

کار با Mining Models Editor

پردازش

استفاده از مدل‌ها

درک نماهای مدل

استفاده از Mining Accuracy Chart

ایجاد گزارش‌های داده کاوی

استفاده از SQL Server Management Studio

درک رابط کاربری Management Studio

استفاده از Object Explorer

خلاصه

فصل چهارم

Microsoft Naïve Bayes

معرفی الگوریتم Naïve Bayes

درک اصول Naïve Bayes

پارامترهای Naïve Bayes

DMX

درک محتوای Naïve Bayes

کاوش درمدل Naïve Bayes

Dependency Net

Attribute Profiles

Attribute Characteristics

Attribute Discrimination

خلاصه

فصل پنجم

درختان تصمیم مایکروسافت

معرفی درخت تصمیم

اصول درخت تصمیم

مفاهیم اولیه رشد درخت

طرز کار در یک متغیر با حالت‌های زیاد

اجتناب از Overtraining

در بر گرفتن دانش قبلی

انتخاب مشخصه

استفاده از ورودی‌های پیوسته

رگرسیون

آنالیز انجمنی با درخت تصمیم مایکروسافت

پارامترهای الگوریتم

استفاده از درخت تصمیم

جستجوهای DMX

مدل طبقه‌بندی

مدل رگرسیون

مدل انجمن

محتوای مدل

تفسیر مدل

خلاصه

فصل ششم

خوشه‌بندی مایکروسافت

معرفی الگوریتم خوشه‌بندی مایکروسافت

معرفی اصول خوشه‌بندی

خوشه‌بندی سخت در مقابل خوشه‌بندی نرم

خوشه‌بندی گسسته

خوشه‌بندی توسعه پذیر

پیش‌بینی خوشه بندی

پارامترهای الگوریتم

استفاده از مدل خوشه‌بندی

خوشه‌بندی به عنوان یک گام تحلیلی

DMX

Cluster

ClusterProbability

PredictHistogram

CaseLikelihood

محتوای مدل

درک مدل‌های خوشهبندی

انجام یک بررسی سطح بالا

انتخاب یک خوشه و تعیین تفاوت آن

تعیین تفاوت یک خوشه با خوشه‌های مجاور خود

تایید درست بودن اظهارات شما

برچسب زدن خوشه‌ها

خلاصه

پیوست A

+ نوشته شده در شنبه بیست و ششم فروردین 1391ساعت 1:32 توسط معرفی کتاب |