НОУ ИНТУИТ | Интеллектуальный анализ данных средствами MS SQL Server 2008

Автор: Сергей Нестеров | Санкт-Петербургский государственный политехнический университет

Сергей
Нестеров

Форма обучения:

дистанционная

Стоимость самостоятельного обучения:

бесплатно

Доступ:

свободный

Документ об окончании:

сертификат

Вам нравится? Нравится 39 студентам

Уровень:

Специалист

Длительность:

10:52:00

Студентов:

2006

Выпускников:

188

Качество курса:

4.00 | 4.00

Купить курс [?]

Поддержать курс

Курс посвящен использованию технологии интеллектуального анализа данных (Data Mining) и ее реализации в Microsoft SQL Server 2008 и связанных программных продуктах.

Рассматриваются все алгоритмы DM, поддерживаемые Microsoft SQL Server 2008, надстройки интеллектуального анализа данных для Microsoft Office, основы языка DMX.

Темы: Базы данных

Специальности: Системный архитектор

Дополнительные курсы

2 часа 30 минут

Интеллектуальный анализ данных: базовые понятия

В лекции рассматривается понятие "интеллектуальный анализ данных", описываются основные задачи интеллектуального анализа и приводятся примеры использования в разных отраслях деятельности.

Оглавление

Интеллектуальный анализ данных в СУБД MicrosoftSQLServer

В лекции рассматривается архитектура СУБД Microsoft SQL Server, место занимаемое в ней аналитическими службами, а также способы их взаимодействия с внешними приложениями. Приводится перечень алгоритмов интеллектуального анализа, входящих в поставку SQL Server 2008 и описываются имеющиеся различия между версиями СУБД.

Оглавление

Лекция 3

10 минут

Этапы проведения интеллектуального анализа данных

В лекции рассматривается предлагаемая Майкрософт последовательность этапов решения задачи интеллектуального анализа данных.

Оглавление

Самостоятельная работа 1

14 минут

Надстройки интеллектуального анализа данных для MicrosoftOffice

В ходе данной лабораторной работы будет рассмотрен процесс установки пакета надстроек интеллектуального анализа данных для MicrosoftOffice 2007 и начального конфигурирования MicrosoftSQLServer 2008 (2008 R2).

Оглавление

Самостоятельная работа 2

18 минут

Использование инструментов "AnalyzeKeyInfluencers" и "DetectCategories"

В ходе данной лабораторной работы будет рассмотрено использование инструментов "Анализ ключевых факторов влияния" ("AnalyzeKeyInfluencers") и "Обнаружение категорий" ("DetectCategories"), относящихся к компоненту "Средства анализа таблиц для Excel" пакета надстроек интеллектуального анализа данных для MicrosoftOffice 2007.

Оглавление

Самостоятельная работа 3

15 минут

Использование инструментов "FillFromExample" и "Forecast"

В данной лабораторной работе будет рассмотрено использование инструментов "Заполнение по примеру" ("FillFromExample") и "Прогноз" ("Forecast"), относящихся к компоненту "Средства анализа таблиц для Excel" пакета надстроек интеллектуального анализа данных для MicrosoftOffice 2007.

Оглавление

Самостоятельная работа 4

20 минут

Использование инструментов "HighlightExceptions" и "ScenarioAnalysis"

Лабораторная работа посвящена использованию инструментов "Выделение исключений" ("HighlightExceptions") и "Анализ сценариев" ("ScenarioAnalysis").

Оглавление

Самостоятельная работа 5

18 минут

Использование инструментов "Prediction Calculator" и "ShoppingbasketAnalysis"

Лабораторная работа посвящена использованию инструментов "Расчет прогноза" ("PredictionCalculator") и "Анализ покупательской корзины" ("ShoppingBasketAnalysis").

Оглавление

Самостоятельная работа 6

24 минуты

8 заданий

Лекция 4

20 минут

Краткий обзор алгоритмов интеллектуального анализа данных. Упрощенный алгоритм Байеса. Деревья решений. Линейная регрессия

В лекции приводится обзор трех алгоритмов интеллектуального анализа данных, входящих в поставку SQL Server 2008. Это упрощенный алгоритм Байеса, алгоритмы деревьев решений и линейной регрессии. При выборе алгоритма линейной регрессии, СУБД вызывает особый вариант алгоритма дерева решений.

Оглавление

Лекция 5

20 минут

Краткий обзор алгоритмов интеллектуального анализа данных. Алгоритмы временных рядов и кластеризации

Данная лекция посвящена рассмотрению двух классов алгоритмов интеллектуального анализа данных – алгоритмов временных рядов и алгоритмов кластеризации. Описываются особенности реализации указанных алгоритмов в MS SQL Server 2008.

Оглавление

Лекция 6

13 минут

Краткий обзор алгоритмов интеллектуального анализа данных. Алгоритмы взаимосвязей и кластеризации последовательностей

Лекция посвящена краткому рассмотрению двух алгоритмов интеллектуального анализа данных – алгоритма взаимосвязей и алгоритмов кластеризации последовательностей.

Оглавление

Лекция 7

13 минут

Краткий обзор алгоритмов интеллектуального анализа данных. Алгоритмы нейронных сетей и логистической регрессии

Лекция посвящена краткому рассмотрению двух алгоритмов интеллектуального анализа данных – нейронных сетей и логистической регрессии. Особенностью реализации этих алгоритмов в SQL Server 2008 является то, что алгоритм логистической регрессии, по сути, является алгоритмом нейронных сетей, запускаемым с особыми параметрами.

Оглавление

Самостоятельная работа 7

24 минуты

Использование инструментов Data Mining Client для Excel 2007 для подготовки данных

Данная лабораторная работа описывает возможности инструментов, относящихся к Data Mining Client для Excel 2007, в части подготовки данных для анализа.

Оглавление

Самостоятельная работа 8

16 минут

Использование инструментов Data Mining Client для Excel 2007 для создания модели интеллектуального анализа данных

В лабораторной работе будет рассмотрен процесс создания модели интеллектуального анализа с помощью инструментов, входящих в состав Data Mining Client для Excel.

Оглавление

Самостоятельная работа 9

21 минута

Анализ точности прогноза и использование модели интеллектуального анализа

Лабораторная работа посвящена проверке точности модели и выполнению запросов к модели интеллектуального анализа.

Оглавление

Самостоятельная работа 10

18 минут

Построение модели кластеризации, трассировка и перекрестная проверка

В лабораторной работе рассматривается построение модели интеллектуального анализа данных, использующей алгоритм кластеризации, проводится анализ модели с использованием перекрестной проверки и рассматриваются предоставляемые DataMiningClient возможности по выполнению трассировки запросов к серверу.

Оглавление

Самостоятельная работа 11

24 минуты

8 заданий

Лекция 8

29 минут

Концепции языка DMX

В лекции рассматриваются базовые понятия языка DMX – атрибут, вариант, структура. Приводится обзор используемых типов данных и содержимого.

Оглавление

Лекция 9

22 минуты

DMX. Создание структуры и модели

В лекции рассматривается создание средствами языка DMX моделей и структур интеллектуального анализа данных.

Оглавление

Лекция 10

25 минут

DMX. Обработка, очистка, удалениеи восстановление структур и моделей

В лекции рассматриваются основные операции, которые можно проводить с моделями и структурами данных после их создания – обработка (обучение), очистка содержимого, удаление, экспорт и импорт.

Оглавление

Лекция 11

19 минут

DMX. Запросы

В лекции рассматривается написание запросов к структурам и моделям интеллектуального анализа данных.

Оглавление

Лекция 12

18 минут

DMX. Прогнозы

В лекции рассматриваются вопросы, связанные с написанием прогнозирующих запросов на языке DMX, а также с созданием копий существующих моделей интеллектуального анализа.

Оглавление

Самостоятельная работа 12

14 минут

Начало работы в BIDevStudio

В ходе выполнения данной работы будут рассмотрены начальные этапы выполнения интеллектуального анализа в среде BusinessIntelligenceDevelopmentStudio (BIDevStudio) - создание проекта и определение источников данных.

Оглавление

Самостоятельная работа 13

18 минут

Создание представления источника данных

В предыдущей лабораторной работе была создана база данных аналитических служб и источник данных (DataSource). В ходе выполнения этой работы мы познакомимся с созданием представления источника данных (DataSourceView, DSV), а также именованных вычислений и запросов.

Оглавление

Самостоятельная работа 14

24 минуты

8 заданий

Лекция 13

16 минут

DMX. Параметры алгоритмов интеллектуального анализа данных. Упрощённый алгоритм Байеса, деревья решений, линейная регрессия

В данной лекции мы рассмотрим некоторые особенности определения моделей данных, основанных на упрощенном алгоритме Байеса и деревьях принятия решений.

Оглавление

Лекция 14

22 минуты

DMX. Параметры алгоритмов интеллектуального анализа данных. Временные ряды, кластеризация

В лекции рассмотрены особенности определения на языке DMX моделей данных, основанных на алгоритмах временных рядов и кластеризации.

Оглавление

Лекция 15

11 минут

DMX. Параметры алгоритмов интеллектуального анализа данных. Алгоритм взаимосвязей, кластеризация последовательностей

В лекции рассмотрены особенности определения моделей данных, основанных на алгоритмах взаимосвязей и кластеризации последовательностей.

Оглавление

Лекция 16

11 минут

DMX. Параметры алгоритмов интеллектуального анализа данных. Алгоритмы нейронных сетей и логистической регрессии

В лекции рассмотрены особенности определения на языке DMX моделей данных, основанных на алгоритмах нейронных сетей и логистической регрессии.

Оглавление

Самостоятельная работа 15

22 минуты

Создание структуры и модели интеллектуального анализа. Задача кластеризации

В ходе выполнения предыдущих лабораторных работ была создана база аналитических служб MSSQLServer и определены источник данных и представление источника данных. Текущая работа посвящена созданию в среде BIDevStudio структуры и модели интеллектуального анализа данных.

Оглавление

Самостоятельная работа 16

16 минут

Задача классификации. Создание структуры и моделей интеллектуального анализа. Сравнение точности моделей

Данная лабораторная работа посвящена решению задачи классификации и оценке точности прогнозов, получаемых с использованием разных алгоритмов.

Оглавление

Самостоятельная работа 17

14 минут

Просмотр моделей интеллектуального анализа (деревья решений, упрощенный алгоритма Байеса, нейронные сети). Написание "одноэлементных" прогнозирующих запросов

В ходе предыдущей лабораторной работы были созданы три модели интеллектуального анализа. Данная работа посвящена более подробному знакомству с содержимым модели, а также написанию прогнозирующих запросов.

Оглавление

Авторизоваться

Академия Microsoft: Интеллектуальный анализ данных средствами MS SQL Server 2008: Информация

Дополнительные курсы

План занятий