Dans le monde d’aujourd’hui axé sur les données, la gestion et l’extraction de valeur des données sont des capacités cruciales. Deux des capacités les plus couramment requises pour cela sont la catalogage des données et l’entreposage des données. Le catalogage des données nous permet de suivre les métadonnées et sert de guide pour les pipelines de données. D’autre part, l’entreposage des données nous permet de traiter de grands volumes de données de manière efficace pour en tirer des informations.
Azure propose deux services puissants pour ces capacités – Azure Purview pour le catalogage et la gouvernance des données, et Azure Synapse Analytics pour l’entreposage des données. Dans cet article, nous explorerons comment intégrer ces deux services pour accéder aux ressources du catalogue de données hébergées dans Azure Purview à partir d’Azure Synapse.
Prérequis
Avant de commencer, assurez-vous d’avoir les privilèges nécessaires pour administrer et utiliser les services Azure Purview et Azure Synapse sur votre compte Azure. Vous aurez également besoin d’une instance d’Azure Purview avec certains référentiels de données catalogués, ainsi que d’une instance d’Azure Synapse Workspace.
Configuration d’Azure Purview pour l’intégration
Pour intégrer Azure Purview à Azure Synapse, ouvrez Azure Synapse Studio et accédez à la section Gérer. Sous la section Connexions externes, vous trouverez Azure Purview (Aperçu). Cliquez sur “Se connecter à un compte Purview” et sélectionnez votre compte Purview dans la liste. Cela enregistrera le compte avec Azure Synapse et l’intégrera à Purview.
Une fois l’intégration terminée, vous pouvez accéder au catalogue Purview depuis Synapse Studio. Accédez à l’onglet Données et sélectionnez “Purview” dans la liste déroulante de la barre de recherche. Vous pouvez maintenant rechercher des ressources de données cataloguées dans Purview directement depuis Synapse Studio.
Exploration du catalogue Purview
Lorsque vous recherchez le catalogue Purview depuis Synapse Studio, vous pouvez taper le nom complet ou partiel de l’objet de base de données que vous souhaitez rechercher. Les résultats de la recherche afficheront une liste d’objets de base de données correspondant aux critères. Ces résultats sont spécifiques à l’instance du compte Purview et non aux pools Synapse.
En cliquant sur un élément dans les résultats de la recherche, des informations détaillées sur la ressource de données s’afficheront. Vous pouvez explorer son schéma, sa lignée, sa classification des données, ses objets de base de données associés, et plus encore. L’onglet associé peut également vous aider à trouver des objets de base de données similaires ou associés.
Actions dans Synapse Studio
Une fois que vous avez découvert une ressource de données qui vous intéresse, vous pouvez effectuer des actions correspondantes dans Synapse Studio. Cela inclut la création d’un service lié, d’un jeu de données d’intégration ou d’un nouveau flux de données pour sourcer les données de l’objet ciblé. Les éléments de menu Connecter et Développer fournissent des liens pour initier ces actions.
L’avantage de l’intégration d’Azure Purview avec Azure Synapse est que vous pouvez accéder au catalogue directement dans la console opérationnelle d’un environnement d’entreposage de données. Cela élimine la nécessité de passer d’un service à l’autre et simplifie le processus d’approvisionnement des données.
Conclusion
Dans cet article, nous avons appris comment intégrer Azure Purview et Azure Synapse Analytics. En cataloguant les données dans Purview et en les intégrant à Synapse, nous pouvons accéder aux ressources de données du catalogue directement dans Synapse Studio. Cette intégration rationalise le processus d’entreposage des données et offre un moyen pratique de gérer et de sourcer des données dans un environnement unique.