SQL Server 2019, недавно выпущенный компанией Microsoft, предлагает множество новых функций и улучшений. Одной из ключевых функций, которая была улучшена в этой версии, является PolyBase. В этой статье мы рассмотрим улучшенную функцию PolyBase в SQL Server 2019 и ее возможности.
Обзор ETL и PolyBase
В современной индустрии у нас часто есть данные, хранящиеся в различных базах данных, таких как Oracle, MongoDB, Teradata, PostgreSQL и других. Доступ и объединение данных из этих разных источников может быть сложной задачей для разработчиков баз данных и ученых по данным. Традиционно мы использовали процессы ETL (извлечение-трансформация-загрузка) для перемещения данных между разными источниками. Однако процессы ETL имеют свои собственные проблемы, такие как необходимость в дополнительных ресурсах, проблемы безопасности данных и сложная логика.
В SQL Server 2016 Microsoft представила функцию PolyBase, которая позволяет выполнять запросы к реляционным и нереляционным базам данных без перемещения данных. Эта виртуализация данных создает виртуальный слой данных, часто называемый озером данных или центром данных, где данные из нескольких источников могут быть доступны и управляемы из одной точки. С помощью PolyBase мы можем выполнять запросы к Hadoop и Azure Blob Storage в SQL Server 2016.
В SQL Server 2019 PolyBase был дополнительно улучшен для поддержки доступа к данным из различных источников, таких как Oracle, Teradata, MongoDB и PostgreSQL. Кроме того, мы также можем получать доступ к данным из любого источника данных с помощью драйвера ODBC. Можно создавать внешние таблицы для связи с этими источниками данных, позволяя пользователям получать доступ к данным, как если бы это была реляционная таблица базы данных.
Установка PolyBase в SQL Server 2019
Чтобы установить PolyBase в SQL Server 2019, выполните следующие шаги:
- Убедитесь, что у вас установлена предварительная версия SQL Server 2019.
- Во время процесса установки выберите опцию “Служба запросов PolyBase для внешних данных” на странице выбора функций.
- Установите Oracle JRE 7 обновление 51 или выше, если он еще не установлен.
- Настройте PolyBase, выбрав соответствующую опцию в зависимости от типа вашей установки (автономная или масштабируемая конфигурация).
- Укажите учетные записи служб PolyBase.
- Проверьте конфигурацию и нажмите “Установить”, чтобы завершить процесс установки.
Обзор и установка Azure Data Studio
Azure Data Studio – это инструмент с графическим интерфейсом, который работает на операционных системах Windows, Mac OS и Linux. Он поддерживает SQL Server, базу данных Azure и SQL Data Warehouse. В октябрьском релизе Azure Data Studio добавила поддержку новых функций SQL Server 2019, включая улучшенный PolyBase.
Чтобы установить Azure Data Studio в Windows, выполните следующие шаги:
- Скачайте последний октябрьский релиз Azure Data Studio с официального веб-сайта.
- Дважды щелкните по файлу установки, чтобы запустить мастер установки.
- Примите лицензионное соглашение и укажите папку назначения.
- Выберите, создать ли папку в меню “Пуск” и иконку на рабочем столе.
- Завершите процесс установки, нажав “Установить”.
После установки Azure Data Studio вы можете подключиться к экземпляру предварительной версии SQL Server 2019 и установить расширение “SQL Server 2019 (Preview)” из Маркетплейса, чтобы получить доступ ко всем предварительным функциям.
Заключение
В этой статье мы рассмотрели улучшенную функцию PolyBase в SQL Server 2019 и ее возможности. Мы также обсудили процесс установки как PolyBase, так и Azure Data Studio. В следующей статье мы более подробно рассмотрим использование внешних таблиц для доступа к данным из баз данных Oracle с помощью PolyBase в SQL Server 2019.