Волгоградский государственный университет
Опубликован: 15.03.2010 | Доступ: свободный | Студентов: 2381 / 239 | Оценка: 4.39 / 4.28 | Длительность: 18:09:00
Самостоятельная работа 11:

Заполнение куба при помощи Integration Services

< Лекция 5 || Самостоятельная работа 11: 1234567891011 || Лекция 6 >
Аннотация: Данная лабораторная работа посвящена вопросам создания новых пакетов, добавления и настройки соединения с источниками данных и назначениями, а также работы с новыми компонентами потока управления и потока данных для заполнения хранилищ данных.

Теоретическое введение

Службы Microsoft SQL Server Integration Services (SSIS) - это платформа для создания высокопроизводительных решений по интеграции данных, включая пакеты, обеспечивающие извлечение, преобразование и загрузку для хранения данных. Службы SSIS содержат:

  1. графические средства и мастера сборки и отладки пакетов;
  2. задачи выполнения функций потока операций, таких как FTP, выполнение инструкций SQL и отправка сообщений по электронной почте;
  3. источники данных и адреса назначения для получения и загрузки данных;
  4. преобразования для очистки, статистической обработки, слияния и копирования данных;
  5. службу управления, службу SSIS для администрирования выполнения и хранения пакетов, а также API-интерфейсы для программирования модели объектов служб SSIS.

Практические задания

В данной лабораторной работе при помощи конструктора служб SSIS будет произведено создание простого пакета, который извлекает данные из файла, выполняет уточняющий запрос в ссылочной таблице и записывает данные в таблицу фактов FactCurrencyRate образца базы данных AdventureWorksDW.

Формат данных источника

Данные источника представлены в виде набора курсов валют, содержащегося в плоском файле SampleCurrencyData.txt. Данные источника в этом файле имеют четыре столбца: средний курс валюты, ключ валюты, ключ даты и курс на конец дня.

 Фрагмент файла SampleCurrencyData.txt

Рис. 16.1. Фрагмент файла SampleCurrencyData.txt

При работе с данными источника плоских файлов важно понимать, как диспетчер соединений с плоскими файлами интерпретирует данные плоских файлов. Если плоский файл является документом в кодировке Unicode, диспетчер соединений с плоскими файлами определяет все столбцы как [DT_WSTR] с шириной, по умолчанию равной 50. Если же исходный файл является документом в кодировке ANSI, столбцы определяются как [DT_STR] с шириной 50. Возможно, потребуется изменить эти настройки, чтобы оптимизировать столбцы для конкретных данных. Чтобы сделать это, необходимо узнать тип данных в назначении, куда будут заноситься эти данные, а затем выбрать правильный тип данных в диспетчере соединений с плоскими файлами.

Формат таблицы-назначения

Конечным назначением источника данных является таблица фактов FactCurrencyRate в базе данных AdventureWorksDW (Таблица 16.1).

Таблица 16.1. Формат таблицы фактов FactCurrencyRate
Имя столбца Тип данных Таблица уточняющих запросов Столбец подстановки
AverageRate float Нет Нет
CurrencyKey int (FK) DimCurrency CurrencyKey (PK)
TimeKey Int (FK) DimTime TimeKey (PK)
EndOfDayRate float Нет Нет

Таблица фактов FactCurrencyRate имеет четыре столбца и связи с двумя таблицами измерений

Сопоставление данных источника и назначения

Анализ форматов данных источника и назначения показывает, что для значений CurrencyKey и TimeKey необходимы преобразования "Уточняющий запрос". Преобразования, которые будут выполнены, получат значения CurrencyKey и TimeKey, используя альтернативные ключи из таблиц измерений DimCurrency и DimTime (Таблица 16.2).

Таблица 16.2. Сопоставление данных источника и назначения
Столбец плоских файлов Имя таблицы Имя столбца Тип данных
0 FactCurrencyRate AverageRate Float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimTime FullDateAlternateKey Datetime
3 FactCurrencyRate EndOfDayRate Float
< Лекция 5 || Самостоятельная работа 11: 1234567891011 || Лекция 6 >
Ксения Кожанова
Ксения Кожанова

Здравствуйте! Я прошла 1 лекцию и 1 самостоятельную работу. В конце контрольные вопросы, их надо для как-то ответить или куда-то отослать?

Андрей Павлов
Андрей Павлов