SQL Server 2017 поддерживает выполнение скриптов R из T-SQL в рамках служб машинного обучения в базе данных. R – это язык программирования с открытым исходным кодом для статистического анализа с широким сообществом профессионалов в области статистики, математики и науки о данных. Эти профессионалы разрабатывают пользовательские пакеты R, которые могут использоваться для расширения функциональности R в SQL Server.
По умолчанию SQL Server 2017 не устанавливает тысячи доступных пакетов R. Однако вы можете легко установить и использовать эти пакеты для выполнения сложных статистических и математических вычислений в SQL Server. В этой статье мы рассмотрим, как установить и использовать пакеты R в SQL Server 2017.
Установка пакетов R
Пакеты R могут быть установлены из консоли R, которая затем может быть доступна из T-SQL. Чтобы установить пакет, вы можете использовать функцию install.packages() в консоли R. Например, чтобы установить пакет dplyr, вы можете выполнить следующую команду:
install.packages("dplyr")
Это загрузит и установит пакет dplyr в вашу установку R. После установки пакета его можно использовать в ваших скриптах R, выполняемых из T-SQL.
Использование пакетов R в SQL Server
После установки пакета R вы можете использовать его в ваших скриптах R, выполняемых из T-SQL. Чтобы использовать пакет, вам нужно загрузить его с помощью функции library(). Например, чтобы использовать пакет dplyr в вашем скрипте R, вы можете включить следующую строку кода:
library(dplyr)
Это сделает функции и возможности пакета dplyr доступными для использования в вашем скрипте R.
Пример: использование пакета dplyr
Пакет dplyr – это мощный пакет для быстрой манипуляции данными в R. Он предоставляет сокращения для подмножества, суммирования, перестановки и объединения наборов данных. Допустим, у вас есть данные, считанные из T-SQL, и вы хотите их обработать с использованием пакета dplyr. Вы можете написать следующий код в вашем скрипте R:
# Загрузка пакета dplyr
library(dplyr)
# Обработка данных с использованием функций dplyr
filtered_data <- data %>%
filter(column > 10) %>%
group_by(column2) %>%
summarise(total = sum(column3))
В этом примере функции filter(), group_by() и summarise() из пакета dplyr используются для фильтрации, группировки и суммирования данных соответственно. Полученные обработанные данные сохраняются в переменной filtered_data.
Это всего лишь один пример того, как вы можете использовать пакеты R в SQL Server 2017 для расширения функциональности R. Существует тысячи доступных пакетов R, которые могут использоваться для различных целей, таких как визуализация данных, машинное обучение, финансовое моделирование и многое другое. В зависимости от ваших конкретных потребностей вы можете установить и использовать соответствующие пакеты R для выполнения сложного анализа в SQL Server.
Заключение
SQL Server 2017 поддерживает выполнение скриптов R из T-SQL. Установка и использование пакетов R позволяет расширить функциональность R в SQL Server и выполнять сложные статистические и математические вычисления. Установка пакетов R – это простой процесс, и после установки пакеты могут быть легко использованы в ваших скриптах R, выполняемых из T-SQL. Воспользуйтесь широким спектром доступных пакетов R, чтобы расширить возможности анализа данных в SQL Server 2017.