Freigeben über


Modellieren von Flags (Data Mining)

Gilt für: SQL Server 2019 und frühere Analysis Services Azure Analysis Services Fabric/Power BI Premium

Von Bedeutung

Data Mining wurde in SQL Server 2017 Analysis Services verworfen und ist in SQL Server 2022 Analysis Services eingestellt worden. Die Dokumentation wird nicht für veraltete und nicht mehr unterstützte Features aktualisiert. Weitere Informationen finden Sie unter "Analysis Services-Abwärtskompatibilität".

Sie können Modellierungskennzeichnungen in SQL Server SQL Server Analysis Services verwenden, um zusätzliche Informationen für einen Data Mining-Algorithmus zu den Daten bereitzustellen, die in einer Falltabelle definiert sind. Der Algorithmus kann diese Informationen verwenden, um ein genaueres Data Mining-Modell zu erstellen.

Einige Modellierungsflags werden auf der Ebene der Bergbaustruktur definiert, während andere auf der Ebene der Miningmodellspalte definiert sind. Beispielsweise wird das NOT NULL-Modelierungs-Flag mit Spalten der Miningstruktur verwendet. Sie können zusätzliche Modellierungskennzeichnungen für die Miningmodellspalten definieren, je nach dem Algorithmus, den Sie zum Erstellen des Modells verwenden.

Hinweis

Plug-Ins von Drittanbietern können zusätzlich zu den von SQL Server Analysis Services vordefinierten Modellierungskennzeichnungen verwendet werden.

Liste der Modellierungs-Flags

In der folgenden Liste werden die Modellierungskennzeichnungen beschrieben, die in SQL Server Analysis Services unterstützt werden. Informationen zu Modellierungskennzeichnungen, die von bestimmten Algorithmen unterstützt werden, finden Sie im technischen Referenzthema für den Algorithmus, der zum Erstellen des Modells verwendet wurde.

NICHT NULL
Gibt an, dass die Werte für die Attributspalte niemals einen NULL-Wert enthalten sollen. Wenn SQL Server Analysis Services während des Modellschulungsprozesses auf einen NULL-Wert für diese Attributspalte stößt, tritt ein Fehler auf.

MODEL_EXISTENCE_ONLY
Gibt an, dass die Spalte mit zwei Zuständen behandelt wird: Fehlende und vorhandene. Wenn der Wert NULL ist, wird er als fehlender Wert behandelt. Das flag MODEL_EXISTENCE_ONLY wird auf das vorhersagbare Attribut angewendet und wird von den meisten Algorithmen unterstützt.

Das Festlegen des MODEL_EXISTENCE_ONLY-Kennzeichens auf "True " ändert die Darstellung der Werte so, dass nur zwei Zustände vorhanden sind: "Fehlende" und " Vorhanden". Alle nicht fehlenden Zustände werden in einem einzigen vorhandenen Wert kombiniert.

Eine typische Verwendung für dieses Modellierungsflagge wäre in Attributen, für die der NULL-Zustand eine implizite Bedeutung hat, und der explizite Wert des NOT NULL-Zustands ist möglicherweise nicht so wichtig wie die Tatsache, dass die Spalte einen Wert aufweist. Eine [DateContractSigned]-Spalte kann z. B. NULL sein, wenn ein Vertrag nie unterzeichnet wurde und NOT NULL , wenn der Vertrag unterzeichnet wurde. Wenn das Modell daher beabsichtigt, vorherzusagen, ob ein Vertrag unterzeichnet wird, können Sie das kennzeichen MODEL_EXISTENCE_ONLY verwenden, um den genauen Datumswert in den NOT NULL-Fällen zu ignorieren und nur zwischen Fällen zu unterscheiden, in denen ein Vertrag fehlt oder vorhanden ist.

Hinweis

Missing ist ein spezieller Zustand, der vom Algorithmus verwendet wird, und sich von dem Textwert "Missing" in einer Spalte unterscheidet. Weitere Informationen finden Sie unter Fehlende Werte (Analysis Services – Data Mining).

Regressor
Gibt an, dass die Spalte ein Kandidat für die Verwendung als Regressor während der Verarbeitung ist. Dieses Flag ist für eine Miningmodellspalte definiert und kann nur auf Spalten angewendet werden, die einen kontinuierlichen numerischen Datentyp aufweisen. Weitere Informationen zur Verwendung dieses Flags finden Sie im Abschnitt in diesem Thema: Verwendung des REGRESSOR-Modellierungsflags.

Anzeigen und Ändern von Modellierungskennzeichnungen

Sie können die Modellkennzeichnungen anzeigen, die einer Miningstrukturspalte oder Modellspalte in Data Mining Designer zugeordnet sind, indem Sie die Eigenschaften der Struktur oder des Modells anzeigen.

Um zu ermitteln, welche Modellierungskennzeichnungen auf die aktuelle Miningstruktur angewendet wurden, können Sie eine Abfrage für das Data Mining-Schema-Rowset erstellen, das die Modellierungskennzeichnungen nur für die Strukturspalten zurückgibt, indem Sie eine Abfrage wie die folgende verwenden:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS  
WHERE STRUCTURE_NAME = '<structure name>'  

Sie können die in einem Modell verwendeten Modellkennzeichnungen hinzufügen oder ändern, indem Sie den Data Mining-Designer verwenden und die Eigenschaften der zugehörigen Spalten bearbeiten. Für solche Änderungen muss die Struktur oder das Modell neu verarbeitet werden.

Sie können Modellierungskennzeichnungen in einer neuen Miningstruktur oder einem neuen Miningmodell mithilfe von DMX sowie AMO- oder XMLA-Skripts angeben. Allerdings können Sie die Modellierungskennzeichnungen, die in einem bestehenden Miningmodell und einer Struktur verwendet werden, nicht mithilfe von DMX ändern. Sie müssen ein neues Miningmodell mithilfe der Syntax erstellen. ALTER MINING STRUCTURE....ADD MINING MODEL

Verwendung des REGRESSOR-Modellierungsflags

Wenn Sie das REGRESSOR-Modellierungskennzeichnung für eine Spalte festlegen, geben Sie dem Algorithmus an, dass die Spalte potenzielle Regressoren enthält. Die tatsächlichen Regressoren, die im Modell verwendet werden, werden durch den Algorithmus bestimmt. Ein potenzieller Regressor kann verworfen werden, wenn es das vorhersagbare Attribut nicht modelliert.

Wenn Sie ein Modell mithilfe des Data Mining-Assistenten erstellen, werden alle fortlaufenden Eingabespalten als mögliche Regressoren gekennzeichnet. Selbst wenn Sie das REGRESSOR-Flag nicht explizit für eine Spalte festlegen, wird die Spalte möglicherweise als Regressor im Modell verwendet.

Sie können die Regressoren ermitteln, die tatsächlich im verarbeiteten Modell verwendet wurden, indem Sie eine Abfrage für das Schema-Rowset für das Miningmodell ausführen, wie im folgenden Beispiel gezeigt:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_COLUMNS  
WHERE MODEL_NAME = '<model name>'  

Hinweis Wenn Sie ein Miningmodell ändern und den Inhaltstyp einer Spalte von fortlaufend in diskret ändern, müssen Sie die Kennzeichnung in der Miningspalte manuell ändern und dann das Modell erneut verarbeiten.

Regressoren in linearen Regressionsmodellen

Lineare Regressionsmodelle basieren auf dem Microsoft Decision Trees-Algorithmus. Auch wenn Sie den Microsoft Linear Regressionsalgorithmus nicht verwenden, kann jedes Entscheidungsstrukturmodell eine Struktur oder Knoten enthalten, die eine Regression für ein fortlaufendes Attribut darstellen.

Daher müssen Sie in diesen Modellen nicht angeben, dass eine fortlaufende Spalte einen Regressor darstellt. Der Microsoft Decision Trees-Algorithmus partitioniert das Dataset in Regionen mit aussagekräftigen Mustern, auch wenn Sie das REGRESSOR-Flag in der Spalte nicht festlegen. Der Unterschied besteht darin, dass der Algorithmus beim Festlegen des Modellierungsflags versucht, Regressionsgleichungen der folgenden Form zu finden, um die Muster in den Knoten des Baums einzupassen.

a*C1 + b*C2 + ...

Dann wird die Summe der Reste berechnet, und wenn die Abweichung zu groß ist, wird eine Aufteilung im Baum erzwungen.

Wenn Sie z. B. das Einkaufsverhalten des Kunden mithilfe von Income als Attribut vorhersagen und das REGRESSOR-Modellierungsflag für die Spalte festlegen, würde der Algorithmus zuerst versuchen, die Einkommen mithilfe einer standard Regressionsformel anzupassen. Wenn die Abweichung zu groß ist, wird die Regressionsformel verworfen, und der Baum würde anhand eines anderen Attributs aufgeteilt werden. Der Entscheidungsbaumalgorithmus würde dann versuchen, einen Regressor für das Einkommen in jedem der Zweige nach der Teilung anzupassen.

Sie können den parameter FORCE_REGRESSOR verwenden, um sicherzustellen, dass der Algorithmus einen bestimmten Regressor verwendet. Dieser Parameter kann mit dem Decision Trees-Algorithmus und dem Linear Regressionsalgorithmus verwendet werden.

Verwenden Sie die folgenden Links, um mehr über die Verwendung von Modellierungskennzeichnungen zu erfahren.

Aufgabe Thema
Bearbeiten von Modellierungskennzeichnungen mithilfe des Data Mining-Designers Anzeigen oder Ändern der Modellierungskennzeichnungen (Data Mining)
Geben Sie einen Hinweis auf den Algorithmus an, um wahrscheinliche Regressoren zu empfehlen. Angeben einer Spalte, die als Regressor in einem Modell verwendet werden soll
Siehe die Modellierungskennzeichnungen, die von bestimmten Algorithmen unterstützt werden (im Abschnitt "Modellierungskennzeichnungen" für jeden Algorithmusreferenzthema) Data Mining-Algorithmen (Analysis Services - Data Mining)
Erfahren Sie mehr über die Miningstrukturspalten und die Eigenschaften, die Sie für sie festlegen können. Miningstrukturspalten
Informationen zu Miningmodellspalten und Modellierungskennzeichnungen, die auf Modellebene angewendet werden können Miningmodell-Spalten
Siehe Syntax zum Arbeiten mit Modellierungsflags in DMX-Anweisungen. Modellierung von Flags (DMX)
Verstehen Sie fehlende Werte und wie man mit ihnen arbeitet Fehlende Werte (Analysis Services - Data Mining)
Informationen zum Verwalten von Modellen und Strukturen und festlegen von Verwendungseigenschaften Verschieben von Data Mining-Objekten