Azure SQL Database – популярный и широко используемый сервис баз данных, предлагаемый Azure. Он обычно используется для хранения транзакционных данных в системах онлайн-обработки транзакций (OLTP). Однако SQL Database также может использоваться в качестве хранилища данных или хранилища данных благодаря его универсальности в хранении различных типов данных.
В этой статье мы рассмотрим, как получить данные из базы данных Azure SQL для использования в рабочем процессе машинного обучения с использованием службы Azure ML. Машинное обучение – это мощный инструмент для извлечения интеллекта из данных, а служба Azure ML предоставляет основную платформу для создания рабочих процессов машинного обучения.
Предварительные требования
Прежде чем мы начнем, убедитесь, что у вас есть доступ к службе Azure Machine Learning и базе данных Azure SQL. Вам понадобится экземпляр базы данных с некоторыми образцовыми данными. Вы можете легко создать образцовые данные в SQL Database, используя встроенную опцию образцовых данных при создании экземпляра.
Кроме того, вам понадобится рабочее пространство Azure ML, которое можно создать в Azure ML Studio. Если вы новичок в Azure ML Studio, вы можете обратиться к статье “Введение в Azure Machine Learning с использованием Azure ML Studio”, чтобы начать работу и создать рабочее пространство.
Наборы данных и хранилища данных в Azure Machine Learning
В Azure ML данные получаются с использованием хранилищ данных и наборов данных. Хранилища данных – это зарегистрированные хранилища данных, которые могут содержать целое хранилище данных или транзакционную базу данных. Наборы данных – это области данных, выбранные из хранилищ данных.
Чтобы настроить источник данных из базы данных Azure SQL, выполните следующие шаги:
- Перейдите к экземпляру рабочего пространства Azure ML и откройте Azure ML Studio.
- Нажмите на значок хранилищ данных в левой панели.
- Нажмите на кнопку “Новое хранилище данных” и предоставьте необходимые данные, выбрав тип “Azure SQL Database”.
- Настройте тип аутентификации и предоставьте учетные данные для проверки источника данных и создания нового хранилища данных.
- После создания хранилища данных перейдите к значку дома и нажмите кнопку “Новый” для создания нового набора данных.
- Выберите ранее созданное хранилище данных и укажите имя для набора данных.
- Выберите вкладку “табличный” в качестве типа, так как наш источник данных – база данных Azure SQL.
- Укажите желаемый запрос, который определяет объем данных, который будет использоваться в рабочем процессе машинного обучения.
- Проверьте данные и настройте любые связанные с данными параметры.
- Настройте любые параметры, связанные с схемой, такие как изменение типов данных или удаление нежелательных полей.
- Подтвердите детали и создайте новый набор данных.
Теперь, когда набор данных создан, его можно использовать в рабочих процессах Azure Machine Learning. В конструкторе, вкладка “набор данных”, вы найдете только что созданный набор данных. Вы можете перетащить набор данных на макет и щелкнуть правой кнопкой мыши, чтобы визуализировать данные в рабочем процессе.
Заключение
В этой статье мы узнали, как получить данные из базы данных Azure SQL для использования в рабочих процессах машинного обучения Azure. Создав хранилище данных и набор данных, мы легко можем получать доступ и использовать данные из SQL Database в наших моделях машинного обучения и прогнозах.