Introduction:
Assurer la qualité des données est un aspect crucial de tout système de gestion de base de données. Dans cet article, nous explorerons comment améliorer la qualité des données dans SQL Server en utilisant Data Quality Services (DQS).
Pour commencer:
Pour commencer, ouvrez Microsoft Master Data Services 2016 et accédez à l’onglet “Explorer”. Sélectionnez le modèle et l’entité (table) souhaités avec lesquels vous souhaitez travailler. Dans notre exemple, nous utiliserons l’entité “Produit”.
Data Quality Services:
Data Quality Services est un logiciel intelligent qui apprend à reconnaître les modèles de données et à signaler les données anormales. Il peut envoyer des erreurs vers une table “Erreur”, permettant aux analystes métier et aux responsables des données d’inspecter et de rectifier les erreurs éventuelles.
Approche stratégique de haut niveau:
L’approche stratégique recommandée consiste à télécharger les données du service de données maître (MDS) vers Data Quality Services (DQS). DQS validera ensuite les données à l’aide de règles prédéfinies et signalera les enregistrements invalides. Les données validées peuvent ensuite être renvoyées à MDS pour un traitement ultérieur.
Mise en place de l’infrastructure nécessaire:
Pour mettre en place l’infrastructure nécessaire dans Data Quality Services, ouvrez le client Data Quality Services et créez une nouvelle “Base de connaissances”. Définissez les domaines (tables) et leurs valeurs d’attribut autorisées. Importez les données nécessaires, telles qu’une liste principale de couleurs, dans les domaines.
Découverte des connaissances et politique de correspondance:
Une fois la gestion des domaines terminée, la prochaine étape consiste à couvrir les parties “Découverte des connaissances” et “Politique de correspondance” du processus. Cela implique de définir des règles et des modèles pour identifier et faire correspondre les données avec précision.
Création d’un package Integration Services:
Pour lier toutes les parties ensemble, créez un package SQL Server Integration Services. Ce package comprendra des tâches telles que l’extraction des données de MDS, le nettoyage des données à l’aide de DQS et le renvoi des données validées à MDS pour un traitement ultérieur.
Conclusion:
Améliorer la qualité des données dans SQL Server est essentiel pour maintenir des données précises et fiables. En utilisant Data Quality Services, vous pouvez facilement valider et signaler toute donnée invalide, ce qui permet une gestion et une maintenance efficaces des données.