Опубликован: 11.12.2006 | Доступ: свободный | Студентов: 5820 / 381 | Оценка: 4.42 / 3.86 | Длительность: 57:15:00
Лекция 29:

Использование Microsoft SQL Server Аnalysis Services

Схемы

Схема типа "звезда" (или плоская схема) характерна для складов данных. Эта схема состоит из одной таблицы фактов и нескольких таблиц размерности. Схема типа "звезда" обычно представляется как таблица фактов, окруженная несколькими таблицами размерности в форме звезды. Каждая таблица размерности соответствует какой-либо колонке в таблице фактов. Таблицы размерности используются как основа для анализа данных в таблице фактов.

В схеме типа "снежинка" (или многомерной схеме) несколько таблиц размерности связываются друг с другом, прежде чем присоединиться к таблице фактов; иными словами, создается несколько уровней таблиц размерности, и каждый уровень соответствует колонке в таблице фактов (рис. 29.1).

Схемы типа "звезда" и "снежинка"

Рис. 29.1. Схемы типа "звезда" и "снежинка"

Агрегирование данных

Аnalysis Services агрегирует колонки в таблице фактов, используя данные таблиц размерности. Например, таблицы размерности, которые относятся к сотрудникам, можно использовать для суммирования данных по продажам на одного сотрудника. Таблицы размерности, которые относятся к товарам, можно использовать для суммирования данных по товарам. Поскольку при агрегировании, основанном на таблицах размерности, создаются различные слои (или размерности) данных, это приводит к формированию виртуального куба данных, который описан выше.

Кубы OLAP, создаваемые с помощью Аnalysis Services, это, по сути, функции агрегирования, которые рассчитываются в соответствии со схемой типа "звезда" или "снежинка". Для создания этих агрегатов применяется мастер Аnalysis Services Wizard, который вы используете по своему усмотрению для создания бизнес-моделей и принятия деловых решений.

Метаданные

Термин "метаданные" используется для описания данных о данных. Так, подробные и итоговые данные, которые используются для описания данных в базе данных, считаются метаданными. В примере, который мы использовали, таблица продаж и окружающие таблицы размерности представляют данные. Итоговая информация, которую мы создаем (распределение продаж по продавцам, продаж по товарам), – это метаданные. Возможность создания метаданных (итоговых таблиц или агрегатов данных) является главным преимуществом Аnalysis Services. Используя Аnalysis Services, вы можете легко создавать метаданные и далее заниматься другой работой без необходимости поддержки этих данных вручную.

Улучшения анализа данных в SQL Server 2000

В SQL Server 2000 включено несколько улучшений и новых средств для анализа данных и складов данных. Эти улучшения включают дополнительные средства и информацию, помогающие выполнять процесс анализа данных. В этом разделе вы узнаете о некоторых важных улучшениях.

Улучшения в извлечении данных

В Аnalysis Services включена новая технология извлечения (добычи) данных, которую можно использовать для выявления связей данных в реляционных базах данных и кубах OLAP. Эти связи можно добавлять к существующим кубам OLAP для дополнительного анализа данных. Одним из уникальных новых средств извлечения данных является дерево решений Microsoft Decision Tree. Decision Tree использует для анализа данных усложненные методы и алгоритмы классификации. Затем процесс дерева решений формирует одно или несколько деревьев решений, которые можно использовать для упреждающего анализа по новым данным. Например, дерево решений можно сформировать для анализа кредитной истории и покупательской истории потенциальных покупателей в нашем магазине велосипедов. Это дерево решений можно, тем самым, использовать для оценки кредитоспособности покупателя.

Еще одним новым средством извлечения данных в Аnalysis Services является использование кластеризации. Технология кластеризации, используемая в извлечении данных, полностью отличается от типа кластеризации, описанного в "Microsoft SQL Server и Microsoft Cluster Services" . При выполнении кластеризации в Аnalysis Services используется алгоритм "ближайшего соседа", позволяющий быстро группировать записи данных в кластеры, имеющие сходные характеристики. Эти связи часто бывают неочевидными или интуитивными. Тем самым технология кластеризации открывает новые пути для анализа данных.

Кроме того, в состав средств извлечения данных SQL Server включены новые мастера и диалоговые окна, что упрощает их использование. Эти улучшения позволяют DBA быстро выполнять большинство задач создания и поддержки рынка данных или склада данных.

Улучшения для таблиц размерности

SQL Server 2000 содержит несколько улучшений по таблицам размерности. SQL Server теперь поддерживает родительские/дочерние размерности, размерности реляционной OLAP (ROLAP) и размерности с разрешением записи.

Родительские/дочерние размерности позволяют определять иерархии, которые базируются на родительских/дочерних отношениях между элементами исходной таблицы. Примером родительских/дочерних отношений является сборка компонента из частей. Одна часть (родительская) может иметь много подчиненных (дочерних) компонентов. Использование родительской/дочерней размерности "привязывает" подчиненные компоненты к родительской части при выполнении анализа данных.

ROLAP-размерность смягчает ограничения размеров, присущие стандартной многомерной модели OLAP (MOLAP), которая используется в Аnalysis Services. Модель MOLAP позволяет использовать размерности, содержащие до 5 миллионов элементов. Если набор элементов выходит за этот предел, требуется ROLAP-размерность. Модель ROLAP может разрастаться до очень больших размеров, но модель MOLAP существенно превосходит ROLAP в производительности при запросе набора элементов. По этой причине вам следует определять модели ROLAP только для очень больших размерностей.

При использовании размерности с разрешением записи элементы этой размерности можно модифицировать с помощью Аnalysis Manager и клиентских приложений, поддерживающих отложенную запись по размерности. Для управления доступом к размерности по записи клиентских приложений используются роли SQL Server. Роли SQL Server описываются в "Управление пользователями и системой безопасности" .

Улучшения по безопасности

В SQL Server 2000 включены также улучшения по безопасности, которые позволяют вам лучше защищать используемые в анализе вашего предприятия данные, которые могут оказаться крайне важными. Эти улучшения включают изменения в защите таблиц размерности, средства защиты ячеек и поддержку дополнительных методов аутентификации.

Таблицы размерности теперь функционируют в рамках основанной на ролях модели безопасности SQL Server. Для каждой из определенных ролей вы можете ограничить доступ к отдельным размерностям, уровням и элементам. Кроме того, вы можете задать полномочия доступа к этим ресурсам по чтению и чтению/записи. SQL Server 2000 поддерживает основанную на ролях модель безопасности как для систем FAT, так и систем NTFS.

SQL Server 2000 позволяет применять роли на уровне ячеек куба. В Аnalysis Manager включены диалоговые окна, позволяющие управлять доступом роли к любой комбинации ячеек куба. Кроме того, вы можете изменять полномочия доступа к кубу по чтению и чтению/записи для каждой роли.

Поскольку в систему SQL Server 2000 включена модель безопасности Windows 2000, в ней можно использовать протокол Kerberos, NT Lane Manager Security Support Provider или любой другой тип провайдера, использующего интерфейс Security Support Provider Interface (SSPI) для выполнения аутентификации, когда пользователь или приложение запрашивает доступ к кубам и их данным. Это позволяет вам использовать согласованную модель безопасности на всех уровнях вашей системы SQL Server.

Улучшения в English Query

Средство English Query улучшено в SQL Server 2000 для обеспечения большей интеграции с комплектом продуктов Microsoft Visual Studio 6. Это позволяет разработчикам включать в приложения обычные предложения на английском языке вместо операторов T-SQL. Кроме того, включено новое графическое авторское средство, помогающее разработке предложений English Query. В SQL Server 2000 включен также мастер SQL Project Wizard, который автоматически создает базовые структуры базы данных для поддержки English Query, что несколько смягчает сложность установки среды English Query. Этот мастер сканирует таблицы базы данных и строит соответствующие компоненты SQL Server.