В этой статье мы рассмотрим основные концепции SQL Server 2005 Integration Services и научимся создавать простой пакет ETL (извлечение, преобразование и загрузка) с помощью Business Intelligence Development Studio.
Integration Services – это мощный инструмент в SQL Server 2005, который позволяет управлять задачами извлечения, преобразования и загрузки данных. Он предоставляет удобный интерфейс для проектирования, разработки и выполнения пакетов, автоматизирующих эти процессы.
Для начала откройте Business Intelligence Development Studio из меню “Пуск”. Из интерфейса вы можете создать новый проект, выбрав шаблон Integration Services Project. Назначьте имя и расположение для файлов проекта.
Окно проекта состоит из четырех основных областей:
- Область проектирования пакета: здесь вы создаете и управляете элементами управления потоком, элементами потока данных, обработчиками событий и просматриваете характеристики пакета.
- Область проектирования: здесь происходит основная разработка пакета. Вы можете создавать и редактировать задачи, преобразования и подключения.
- Область подключений: здесь содержится список подключений, включенных в текущий пакет. Она появляется при работе в контексте управления потоком и обработчиков событий.
- Окно Обозреватель решений: это предоставляет графическое представление решения, его проектов, источников данных, представлений и пакетов DTS.
Теперь давайте создадим простой пакет, который загружает данные из внешнего хранилища данных и сохраняет их в таблицу в базе данных SQL Server 2005.
Сначала создайте пакетный файл, который будет выполнять команду SET для получения списка переменных среды на компьютере SQL Server. Сохраните этот пакетный файл под именем SETOUT.CMD в нужном месте.
Затем создайте новое решение и проект интеграционных служб в Business Intelligence Development Studio. Во вкладке управления потоком перетащите элемент задачи выполнения процесса из панели инструментов на рабочую область дизайнера. Дважды щелкните по нему, чтобы отредактировать свойства и установить исполняемый файл и рабочий каталог в место расположения файла SETOUT.CMD.
Протестируйте пакет, нажав Ctrl+F5 или выбрав “Запустить без отладки”. Проверьте содержимое выходного файла, чтобы убедиться, что он содержит список всех переменных среды.
Теперь нам нужно создать подключение к текстовому файлу и соответствующий источник данных, а также подключение к целевой базе данных и соответствующий назначение данных. Перетащите задачу потока данных из панели инструментов в область управления потоком.
В области потока данных создайте подключение к плоскому файлу SETOUT.TXT. Укажите расположение файла и установите разделитель столбцов “=”.
Создайте подключение OLE DB к целевой базе данных. Укажите имя сервера, метод аутентификации и целевую базу данных.
Добавьте компонент источника плоского файла в задачу потока данных и настройте его для использования подключения к плоскому файлу. Сопоставьте внешние столбцы с выходными столбцами.
Добавьте компонент назначения OLE DB в задачу потока данных и настройте его для использования подключения OLE DB. Сопоставьте входные столбцы с целевыми столбцами.
Сохраните и выполните пакет. Это создаст таблицу в целевой базе данных, содержащую имена переменных среды и их соответствующие значения.
В следующей статье мы рассмотрим более продвинутые возможности, доступные в SQL Server 2005 Integration Services, и измените наш существующий пакет.