Collecte de données

S’applique à :SQL Server

Le collecteur de données est un composant de SQL Server qui collecte différents jeux de données. La collecte de données peut s'exécuter de façon constante ou selon une planification définie par l'utilisateur. Le collecteur de données stocke les données recueillies dans une base de données relationnelle appelée entrepôt de données de gestion.

Qu’est-ce que le collecteur de données ?

Le collecteur de données est un composant principal de la plateforme de collecte de données pour SQL Server et les outils fournis par SQL Server. Le collecteur de données centralise la collecte de données sur vos serveurs et applications de base de données. Ce point de collecte peut obtenir des données provenant de différentes sources et n’est pas limité aux données de performances, contrairement à SQL Trace.

Le collecteur de données vous permet d'ajuster l'étendue de la collecte de données pour l'adapter à vos environnements de test et de production. Le collecteur de données utilise également un entrepôt de données, une base de données relationnelle qui vous permet de gérer les données que vous collectez en définissant pour elles différentes périodes de rétention.

Le collecteur de données prend en charge le paramétrage dynamique de la collecte de données et il est extensible via son API. Pour plus d’informations, consultez Programmation du collecteur de données.

L’illustration suivante montre comment le collecteur de données s’adapte à la stratégie globale pour la collecte de données et la gestion des données dans SQL Server.

Diagram of the data collector's role in data management.

Concepts

Le collecteur de données est intégré à SQL Server Agent et Integration Services, et utilise les deux en profondeur. Avant de travailler avec le collecteur de données, vous devez donc comprendre certains concepts liés à chacun de ces composants SQL Server.

SQL Server Agent est utilisé pour planifier et exécuter des travaux de collecte. Vous devez maîtriser les concepts suivants :

  • Travail
  • Étape de travail
  • Planification du travail
  • Sous-système
  • Comptes proxy

Pour plus d’informations, consultez Tâches de Administration istration automatisées (SQL Server Agent).

Integration Services (SSIS) est utilisé pour exécuter des packages qui collectent des données à partir de fournisseurs de données individuels. Vous devez être familiarisé avec les outils et concepts SSIS suivants :

  • Package SSIS
  • Configuration du package SSIS

Pour plus d’informations, consultez Packages Integration Services (SSIS).

Terminologie

Terme Description
Cible Instance du Moteur de base de données dans une édition de SQL Server qui prend en charge la collecte de données. Pour plus d’informations sur les éditions prises en charge, consultez la section « Facilité de gestion » des éditions et fonctionnalités prises en charge de SQL Server 2022.

Une racine cible définit une sous-arborescence dans la hiérarchie cible. Un jeu de cibles désigne le groupe de cibles obtenu après l’application d’un filtre à une sous-arborescence définie par une racine cible. Une racine cible peut être une base de données, une instance de SQL Server ou une instance d’ordinateur.
Type de cible Type de cible présentant des caractéristiques et un comportement spécifiques. Par exemple, une cible d’instance SQL Server a des caractéristiques différentes d’une cible de base de données SQL Server.
Fournisseur de données Source de données connue, spécifique à un type cible, qui fournit des données à un type collecteur.
Type de collecteur Wrapper logique autour des packages SSIS qui fournissent le mécanisme réel permettant de collecter des données et de les charger dans l’entrepôt de données de gestion.
Élément de collection Instance d'un type de collecteur. Un élément de collecte est créé avec un jeu de propriétés d'entrée et une fréquence de collecte spécifiques.
Jeu de collections Groupe d'éléments de collecte. Un jeu d'éléments de collection est une unité de collecte de données avec laquelle un utilisateur peut interagir par le biais de l'interface utilisateur.
Mode collection Manière dont les données sont recueillies et stockées. Le mode de collecte peut être avec mise en cache ou sans mise en cache. Le mode avec mise en cache prend en charge la collecte continue, alors que le mode sans mise en cache est destiné à une collecte à la demande ou à un instantané de collecte.
Entrepôt de données de gestion Base de données relationnelle utilisée pour stocker les données collectées.

L'illustration suivante montre les dépendances et les relations entre les différents composants du collecteur de données.

Diagram of data collector functional dependencies.

Tel qu'indiqué dans l'illustration, le fournisseur de données est externe au collecteur de données et, par définition, entretient une relation implicite avec la cible. Le fournisseur de données est spécifique à une cible particulière (par exemple, un service SQL Server tel que le moteur relationnel) et fournit des données telles que des vues système dans SQL Server, des compteurs Analyseur de performances et des fournisseurs WMI, qui peuvent être consommées par le collecteur de données.

Le type de collecteur est spécifique à un type de cible, en fonction de l'association logique entre un fournisseur de données et un type de cible. Le type de collecteur définit la manière dont les données sont collectées à partir d'un fournisseur de données spécifique (en utilisant des paramètres schématisés) et spécifie le schéma de stockage des données. Le schéma de fournisseur de données et le schéma de stockage sont requis pour stocker les données collectées. Le type de collecteur fournit également l'emplacement de l'entrepôt de données de gestion, qui peut résider sur l'ordinateur exécutant la collecte de données ou sur un autre ordinateur.

Un élément de collecte, tel qu'indiqué dans l'illustration, est une instance d'un type de collecteur spécifique, paramétrable avec des paramètres d'entrée, tels que le schéma XML pour le type de collecteur. Tous les éléments de collecte doivent fonctionner sur la même racine cible ou sur une racine cible vide. Cela permet au collecteur de données de combiner différents types de collecteurs à partir du système d'exploitation ou d'une racine cible spécifique, mais pas à partir d'autres racines cibles.

Un élément de collection possède une fréquence de collecte définie qui détermine la fréquence d'instantanés de valeurs. Bien qu’il s’agit d’un bloc de construction pour un ensemble de collections, un élément de collection ne peut pas exister seul.

Les jeux d'éléments de collection sont définis et déployés sur une instance de serveur et peuvent être exécutés indépendamment les uns des autres. Chaque jeu d'éléments de collection peut être appliqué à une cible correspondant aux types de cibles de tous les types de collecteurs appartenant à un jeu d'éléments de collection. L’ensemble de collectes est exécuté par un travail ou des travaux SQL Server Agent, et les données sont chargées dans l’entrepôt de données de gestion selon une planification prédéfinie.

Toutes les données recueillies par les différentes instances du jeu d'éléments de collection sont téléchargées dans l'entrepôt de données de gestion selon la même planification. Cette planification est définie comme une planification partagée de SQL Server Agent et peut être utilisée par plusieurs ensembles de collectes. Un jeu de collections est activé ou désactivé en tant qu’entité unique ; les éléments de collection ne peuvent pas être activés ou désactivés individuellement.

Lorsque vous créez ou mettez à jour un jeu de regroupements, vous pouvez configurer le mode de collecte pour collecter des données et le charger dans l’entrepôt de données de gestion. Le type de collection détermine le type de planification : mis en cache ou non mis en cache. Si la collection est mise en cache, la collecte de données et charge les tâches chaque exécution dans un travail distinct. La collection s’exécute selon une planification qui démarre lorsque SQL Server Agent démarre et s’exécute sur la fréquence spécifiée dans l’élément de collection. Le téléchargement s'exécute en fonction de la planification spécifiée par l'utilisateur.

Dans le cadre d'une collecte sans mise en cache, la collecte et le téléchargement des données s'exécutent sur un même travail, mais en deux étapes. L’étape 1 est la collecte et l’étape 2 est en cours de chargement. Une collecte à la demande ne requiert aucune planification.

Après l'activation d'un jeu d'éléments de collecte, la collecte de données peut démarrer, selon une planification ou à la demande. Au démarrage de la collecte de données, SQL Server Agent génère un processus pour le collecteur de données, qui charge à son tour les packages Integration Services pour le jeu de collecte. Les éléments de collection, qui représentent des types de collections, rassemblent des données à partir des fournisseurs de données appropriés sur les cibles spécifiées. Au terme du cycle de collecte, ces données sont téléchargées dans l'entrepôt de données de gestion.