Недавно Microsoft выпустила новую версию SQL Server 2008 R2 под названием Parallel Data Warehouse Edition. Эта новая архитектура вызвала большой интерес, поскольку она является входом Microsoft в область масштабируемых параллельных обработок данных (MPP) для хранилищ данных.
Традиционно Microsoft предлагала SQL Server в архитектуре с симметричным мультипроцессорным (SMP) подходом, где все процессоры, память и хранилище находятся в одной физической архитектуре, и операции с базой данных выполняются в рамках одного экземпляра SQL Server. Однако с Parallel Data Warehousing (PDW) Microsoft представляет архитектуру на основе аппаратного обеспечения, которая обеспечивает значительные возможности масштабирования.
PDW основан на технологии, приобретенной от Datallegro Corp в 2008 году, и предлагает более масштабируемую и предсказуемую производительность для значительно больших рабочих нагрузок, даже до сотен терабайт. Особенно интересной реализацию Microsoft делает то, что PDW обеспечивает гораздо более низкую стоимость за терабайт по сравнению с проприетарными системами, такими как Teradata или Netezza. PDW может быть реализован с использованием стандартного оборудования, что делает его более экономичным и увеличивает возврат инвестиций.
PDW работает путем управления несколькими физическими серверами, каждый из которых работает с собственным экземпляром SQL Server 2008 R2. База данных и ее таблицы распределены по этим физическим серверам, но для конечного пользователя они выглядят как одна база данных и таблица(ы). Аппаратное обеспечение или “мозг” PDW управляет выполнением запросов и метаданными о том, что хранится и обрабатывается на каждой части PDW.
С увеличением необходимости обработки больших объемов данных в современных бизнесах, PDW предоставляет сообществу SQL Server сравнимую архитектуру с Teradata или Netezza. Однако основное отличие состоит в том, что PDW использует стандартное оборудование от HP и Dell, что делает расширение более экономичным и значительно увеличивает возврат инвестиций.
В предстоящих статьях этой серии мы более подробно рассмотрим архитектуру PDW, изучим новые объекты и функции схемы PDW, узнаем, как работать с объектами базы данных PDW, поймем, что такое разделение с PDW и запросы к вашему PDW, изучим работу с базами данных PDW и обсудим, как реализовать PDW в вашей среде. Мы также сравним PDW с архитектурой Fast Track.
Если у вас есть конкретные области, о которых вы хотели бы узнать больше, пожалуйста, не стесняйтесь написать мне по электронной почте или оставить свои комментарии, и я обязательно свяжусь с командами разработчиков, чтобы предоставить вам больше информации. Как один из немногих партнеров, уже работающих с PDW, мы с радостью поможем вам понять и увидеть, как этот пакет может быть полезен для вашего предприятия.
Спасибо, что ознакомились с этим введением в серию. Ожидайте новых статей о SQL Server Parallel Data Warehouse Edition!
Продолжайте делать свой бизнес интеллектуальным!
Адам