Автор: Сергей Нестеров | Санкт-Петербургский государственный политехнический университет
Форма обучения:
дистанционная
Стоимость самостоятельного обучения:
бесплатно
Доступ:
свободный
Документ об окончании:
Вам нравится? Нравится 39 студентам
Уровень:
Специалист
Длительность:
10:52:00
Студентов:
2001
Выпускников:
185
Качество курса:
4.00 | 4.00
Курс посвящен использованию технологии интеллектуального анализа данных (Data Mining) и ее реализации в Microsoft SQL Server 2008 и связанных программных продуктах.
Рассматриваются все алгоритмы DM, поддерживаемые Microsoft SQL Server 2008, надстройки интеллектуального анализа данных для Microsoft Office, основы языка DMX.
Темы: Базы данных
Специальности: Системный архитектор
Теги: classify, discretization, DMX, mile, objective-c, regressor, xml, алгоритмы, анализ, анализ исключений, базы данных, взаимно независимые, дерево принятия решений, кластеры, клиенты, обучение, полная группа, провайдеры, прогнозирование, серверы, статистика, теория, форматы, центр кластера, элементы
Дополнительные курсы
- SQL Server 2000
- Программирование в Microsoft SQL Server 2000
- Разработка и защита баз данных в Microsoft SQL Server 2005
- Оптимизация работы серверов баз данных Microsoft SQL Server 2005
- Проектирование информационных систем в Microsoft SQL Server 2008 и Visual Studio 2008
- Использование MS SQL Server Analysis Services 2008 для построения хранилищ данных
- Data Mining
План занятий
Занятие
Заголовок <<
Дата изучения
Лекция 1
15 минут
Интеллектуальный анализ данных: базовые понятия
В лекции рассматривается понятие "интеллектуальный анализ данных", описываются основные задачи интеллектуального анализа и приводятся примеры использования в разных отраслях деятельности.
Оглавление
-
Лекция 2
16 минут
Интеллектуальный анализ данных в СУБД MicrosoftSQLServer
В лекции рассматривается архитектура СУБД Microsoft SQL Server, место занимаемое в ней аналитическими службами, а также способы их взаимодействия с внешними приложениями. Приводится перечень алгоритмов интеллектуального анализа, входящих в поставку SQL Server 2008 и описываются имеющиеся различия между версиями СУБД.
Оглавление
-
Лекция 3
10 минут
Этапы проведения интеллектуального анализа данных
В лекции рассматривается предлагаемая Майкрософт последовательность этапов решения задачи интеллектуального анализа данных.
Оглавление
-
Самостоятельная работа 1
14 минут
Надстройки интеллектуального анализа данных для MicrosoftOffice
В ходе данной лабораторной работы будет рассмотрен процесс установки пакета надстроек интеллектуального анализа данных для MicrosoftOffice 2007 и начального конфигурирования MicrosoftSQLServer 2008 (2008 R2).
Оглавление
-
Самостоятельная работа 2
18 минут
Использование инструментов "AnalyzeKeyInfluencers" и "DetectCategories"
В ходе данной лабораторной работы будет рассмотрено использование инструментов "Анализ ключевых факторов влияния" ("AnalyzeKeyInfluencers") и "Обнаружение категорий" ("DetectCategories"), относящихся к компоненту "Средства анализа таблиц для Excel" пакета надстроек интеллектуального анализа данных для MicrosoftOffice 2007.
Оглавление
-
Самостоятельная работа 3
15 минут
Использование инструментов "FillFromExample" и "Forecast"
В данной лабораторной работе будет рассмотрено использование инструментов "Заполнение по примеру" ("FillFromExample") и "Прогноз" ("Forecast"), относящихся к компоненту "Средства анализа таблиц для Excel" пакета надстроек интеллектуального анализа данных для MicrosoftOffice 2007.
Оглавление
-
Самостоятельная работа 4
20 минут
Использование инструментов "HighlightExceptions" и "ScenarioAnalysis"
Лабораторная работа посвящена использованию инструментов "Выделение исключений" ("HighlightExceptions") и "Анализ сценариев" ("ScenarioAnalysis").
Оглавление
-
Самостоятельная работа 5
18 минут
Использование инструментов "Prediction Calculator" и "ShoppingbasketAnalysis"
Лабораторная работа посвящена использованию инструментов "Расчет прогноза" ("PredictionCalculator") и "Анализ покупательской корзины" ("ShoppingBasketAnalysis").
Оглавление
-
Лекция 4
20 минут
Краткий обзор алгоритмов интеллектуального анализа данных. Упрощенный алгоритм Байеса. Деревья решений. Линейная регрессия
В лекции приводится обзор трех алгоритмов интеллектуального анализа данных, входящих в поставку SQL Server 2008. Это упрощенный алгоритм Байеса, алгоритмы деревьев решений и линейной регрессии. При выборе алгоритма линейной регрессии, СУБД вызывает особый вариант алгоритма дерева решений.
Оглавление
-
Лекция 5
20 минут
Краткий обзор алгоритмов интеллектуального анализа данных. Алгоритмы временных рядов и кластеризации
Данная лекция посвящена рассмотрению двух классов алгоритмов интеллектуального анализа данных – алгоритмов временных рядов и алгоритмов кластеризации. Описываются особенности реализации указанных алгоритмов в MS SQL Server 2008.
Оглавление
-
Лекция 6
13 минут
Краткий обзор алгоритмов интеллектуального анализа данных. Алгоритмы взаимосвязей и кластеризации последовательностей
Лекция посвящена краткому рассмотрению двух алгоритмов интеллектуального анализа данных – алгоритма взаимосвязей и алгоритмов кластеризации последовательностей.
Оглавление
-
Лекция 7
13 минут
Краткий обзор алгоритмов интеллектуального анализа данных. Алгоритмы нейронных сетей и логистической регрессии
Лекция посвящена краткому рассмотрению двух алгоритмов интеллектуального анализа данных – нейронных сетей и логистической регрессии. Особенностью реализации этих алгоритмов в SQL Server 2008 является то, что алгоритм логистической регрессии, по сути, является алгоритмом нейронных сетей, запускаемым с особыми параметрами.
Оглавление
-
Самостоятельная работа 7
24 минуты
Использование инструментов Data Mining Client для Excel 2007 для подготовки данных
Данная лабораторная работа описывает возможности инструментов, относящихся к Data Mining Client для Excel 2007, в части подготовки данных для анализа.
Оглавление
-
Самостоятельная работа 8
16 минут
Использование инструментов Data Mining Client для Excel 2007 для создания модели интеллектуального анализа данных
В лабораторной работе будет рассмотрен процесс создания модели интеллектуального анализа с помощью инструментов, входящих в состав Data Mining Client для Excel.
Оглавление
-
Самостоятельная работа 9
21 минута
Анализ точности прогноза и использование модели интеллектуального анализа
Лабораторная работа посвящена проверке точности модели и выполнению запросов к модели интеллектуального анализа.
Оглавление
-
Самостоятельная работа 10
18 минут
Построение модели кластеризации, трассировка и перекрестная проверка
В лабораторной работе рассматривается построение модели интеллектуального анализа данных, использующей алгоритм кластеризации, проводится анализ модели с использованием перекрестной проверки и рассматриваются предоставляемые DataMiningClient возможности по выполнению трассировки запросов к серверу.
Оглавление
-
Лекция 8
29 минут
Концепции языка DMX
В лекции рассматриваются базовые понятия языка DMX – атрибут, вариант, структура. Приводится обзор используемых типов данных и содержимого.
Оглавление
-
Лекция 9
22 минуты
DMX. Создание структуры и модели
В лекции рассматривается создание средствами языка DMX моделей и структур интеллектуального анализа данных.
Оглавление
-
Лекция 10
25 минут
DMX. Обработка, очистка, удалениеи восстановление структур и моделей
В лекции рассматриваются основные операции, которые можно проводить с моделями и структурами данных после их создания – обработка (обучение), очистка содержимого, удаление, экспорт и импорт.
Оглавление
-
Лекция 11
19 минут
DMX. Запросы
В лекции рассматривается написание запросов к структурам и моделям интеллектуального анализа данных.
Оглавление
-
Лекция 12
18 минут
DMX. Прогнозы
В лекции рассматриваются вопросы, связанные с написанием прогнозирующих запросов на языке DMX, а также с созданием копий существующих моделей интеллектуального анализа.
Оглавление
-
Самостоятельная работа 12
14 минут
Начало работы в BIDevStudio
В ходе выполнения данной работы будут рассмотрены начальные этапы выполнения интеллектуального анализа в среде BusinessIntelligenceDevelopmentStudio (BIDevStudio) - создание проекта и определение источников данных.
Оглавление
-
Самостоятельная работа 13
18 минут
Создание представления источника данных
В предыдущей лабораторной работе была создана база данных аналитических служб и источник данных (DataSource). В ходе выполнения этой работы мы познакомимся с созданием представления источника данных (DataSourceView, DSV), а также именованных вычислений и запросов.
Оглавление
-
Лекция 13
16 минут
DMX. Параметры алгоритмов интеллектуального анализа данных. Упрощённый алгоритм Байеса, деревья решений, линейная регрессия
В данной лекции мы рассмотрим некоторые особенности определения моделей данных, основанных на упрощенном алгоритме Байеса и деревьях принятия решений.
Оглавление
-
Лекция 14
22 минуты
DMX. Параметры алгоритмов интеллектуального анализа данных. Временные ряды, кластеризация
В лекции рассмотрены особенности определения на языке DMX моделей данных, основанных на алгоритмах временных рядов и кластеризации.
Оглавление
-
Лекция 15
11 минут
DMX. Параметры алгоритмов интеллектуального анализа данных. Алгоритм взаимосвязей, кластеризация последовательностей
В лекции рассмотрены особенности определения моделей данных, основанных на алгоритмах взаимосвязей и кластеризации последовательностей.
Оглавление
-
Лекция 16
11 минут
DMX. Параметры алгоритмов интеллектуального анализа данных. Алгоритмы нейронных сетей и логистической регрессии
В лекции рассмотрены особенности определения на языке DMX моделей данных, основанных на алгоритмах нейронных сетей и логистической регрессии.
Оглавление
-
Самостоятельная работа 15
22 минуты
Создание структуры и модели интеллектуального анализа. Задача кластеризации
В ходе выполнения предыдущих лабораторных работ была создана база аналитических служб MSSQLServer и определены источник данных и представление источника данных. Текущая работа посвящена созданию в среде BIDevStudio структуры и модели интеллектуального анализа данных.
Оглавление
-
Самостоятельная работа 16
16 минут
Задача классификации. Создание структуры и моделей интеллектуального анализа. Сравнение точности моделей
Данная лабораторная работа посвящена решению задачи классификации и оценке точности прогнозов, получаемых с использованием разных алгоритмов.
Оглавление
-
Самостоятельная работа 17
14 минут
Просмотр моделей интеллектуального анализа (деревья решений, упрощенный алгоритма Байеса, нейронные сети). Написание "одноэлементных" прогнозирующих запросов
В ходе предыдущей лабораторной работы были созданы три модели интеллектуального анализа. Данная работа посвящена более подробному знакомству с содержимым модели, а также написанию прогнозирующих запросов.
Оглавление
-
Самостоятельная работа 18
12 минут
Работа с моделями интеллектуального анализа данных из SQLServerManagementStudio
В ходе выполнения данной лабораторной работы будут рассмотрены вопросы, связанные с использованием среды SQLServerManagementStudioпри интеллектуальном анализе данных.
Оглавление
-
Самостоятельная работа 19
16 минут
Использование алгоритма MicrosoftTimeSeries для прогнозирования значений временных рядов
Данная лабораторная работа посвящена вопросам использования аналитических служб SQLServer 2008 для прогнозирования временных рядов.
Оглавление
-