Published on

August 26, 2021

Améliorer la qualité des données avec les services de qualité des données de SQL Server 2012

À mesure que la quantité de données continue de croître, il devient de plus en plus important de garantir la qualité de ces données. Les problèmes de qualité des données tels que l’incohérence, l’incomplétude, l’invalidité, l’inexactitude et les doublons peuvent avoir un impact significatif sur les opérations commerciales et la prise de décision. Heureusement, SQL Server 2012 offre une fonctionnalité puissante appelée Data Quality Services (DQS) qui peut aider à résoudre ces défis.

Défis de la qualité des données

Avant d’entrer dans les détails de DQS, il est important de comprendre certains des défis courants de qualité des données auxquels les organisations sont confrontées :

  • Incomplétude : La valeur des données est-elle complète et significative ?
  • Incohérence : La valeur des données est-elle cohérente dans toute l’organisation ?
  • Invalidité : Les valeurs des données se situent-elles dans le domaine défini ?
  • Inexactitude : Les valeurs des données sont-elles exactes ?
  • Non-conformité : Les valeurs des données sont-elles conformes à des normes ou formats spécifiques ?
  • Duplicité : Y a-t-il des valeurs de données en double ?

Ces problèmes de qualité des données peuvent provenir de différentes sources, notamment de saisies de données erronées, de la consolidation de données provenant de différentes sources avec des normes différentes, et de la corruption des données lors de la transmission ou du stockage.

Présentation des services de qualité des données de SQL Server 2012 (DQS)

Les services de qualité des données (DQS) de SQL Server 2012 sont une fonctionnalité conçue pour améliorer et maintenir la qualité des données dans une entreprise. Il offre aux responsables des données et aux professionnels de l’informatique une solution basée sur les connaissances pour gérer l’intégrité et la qualité des données.

Les principales fonctionnalités de DQS comprennent :

  • Basé sur les connaissances : Les utilisateurs peuvent créer une base de connaissances sur la qualité des données (DQKB) réutilisable pour améliorer l’intégrité et la qualité des données.
  • Sémantique : Les données sont mappées dans des domaines de données, ce qui permet aux utilisateurs de capturer la sémantique.
  • Découverte des connaissances : DQS peut acquérir des connaissances supplémentaires à partir de données d’échantillon et des commentaires des utilisateurs.
  • Ouvert et extensible : Les utilisateurs peuvent tirer parti de fournisseurs de données de référence tiers pour comparer et garantir la qualité des données.
  • Intégration avec SSIS : DQS peut être intégré à SQL Server Integration Services pour une exécution automatisée en mode de correspondance.
  • Facile à utiliser : DQS offre une expérience utilisateur intuitive et convaincante pour une productivité accrue.

Processus de qualité des données dans DQS

DQS effectue plusieurs processus pour améliorer la qualité des données :

  • Surveillance : DQS permet aux utilisateurs de suivre et de surveiller l’état des activités de qualité des données et la qualité des données.
  • Profilage : DQS analyse les sources de données pour fournir un aperçu des problèmes de qualité des données à chaque étape des processus de découverte des connaissances, de gestion des domaines, de correspondance et de nettoyage des données.
  • Nettoyage : Le nettoyage des données peut être effectué de manière interactive à l’aide de l’outil client DQS ou en mode batch à l’aide d’un composant SSIS. Il met à jour, modifie, supprime ou enrichit les données incorrectes ou incomplètes.
  • Correspondance : DQS identifie, relie ou fusionne des entrées liées au sein ou entre des ensembles de données pour supprimer les doublons. La correspondance peut être effectuée dans une source ou par rapport à une table de recherche.

Ces processus aident à classer les données dans différentes catégories, telles que correctes, corrigées, non corrigées, suggérées automatiquement et nouvelles.

Conclusion

La qualité des données est cruciale pour une analyse, un reporting et une prise de décision précis. Les services de qualité des données (DQS) de SQL Server 2012 offrent une solution complète pour améliorer et maintenir l’intégrité et la qualité des données. En tirant parti de l’approche basée sur les connaissances de DQS et de ses différents processus, les organisations peuvent s’assurer que leurs données restent cohérentes, précises et fiables.

Dans le prochain article de cette série, nous explorerons les différents composants de DQS, discuterons de l’installation et de la configuration, et nous plongerons dans le fonctionnement de DQS. Restez à l’écoute !

Click to rate this post!
[Total: 0 Average: 0]

Let's work together

Send us a message or book free introductory meeting with us using button below.