Festlegen von Domäneneigenschaften
Gilt für: SQL Server
In diesem Thema wird beschrieben, wie Domäneneigenschaften in Data Quality Services (DQS) festgelegt werden.
Vorbereitungen
Voraussetzungen
Um Eigenschaften für eine Domäne festzulegen, müssen Sie eine Wissensdatenbank und eine Domäne erstellt haben.
Sicherheit
Berechtigungen
Sie müssen über die Rolle „dqs_kb_editor“ oder „dqs_administrator“ in der DQS_MAIN-Datenbank verfügen, um Eigenschaften für eine Domäne festzulegen.
Festlegen von Domäneneigenschaften
Um Eigenschaften für eine vorhandene Domäne festzulegen, öffnen Sie eine Wissensdatenbank in der Domänenverwaltungsaktivität (siehe Open a Knowledge Base), und wählen Sie dann die entsprechende Domäne in der Liste Domäne aus. In der Standardeinstellung wird die Seite „Domäneneigenschaften“ angezeigt.
Legen Sie Eigenschaften für eine neue Domäne fest, nachdem Sie diese wie unter Create a Domainbeschrieben erstellt haben.
Klicken Sie auf Fertig stellen , um die Domänenverwaltungsaktivität abzuschließen, wie in Beenden der Domänenverwaltungsaktivitätbeschrieben.
Nachverfolgung: Nach dem Festlegen von Domäneneigenschaften
Nachdem Sie Domäneneigenschaften festgelegt haben, können Sie andere Domänenverwaltungstasks in der Domäne ausführen, Sie können die Wissensermittlung durchführen, um der Domäne Wissen hinzuzufügen, oder Sie können der Domäne eine Abgleichsrichtlinie hinzufügen. Weitere Informationen finden Sie unter Durchführen der Wissensermittlung, Verwalten einer Domäne oder Erstellen einer Abgleichsrichtlinie.
Domäneneigenschaften
Domänenname und Beschreibung
Nachdem eine Domäne erstellt wurde, kann der Domänenname oder die Beschreibung geändert werden. Der Domänenname muss für die Wissensdatenbank eindeutig sein. Die Beschreibung kann bis zu 256 Zeichen enthalten.
Datentyp
Wenn Sie die Domäne erstellen, wählen Sie einen der folgenden Datentypen für die Werte in der Domäne aus: Zeichenfolge (Standardeinstellung), Datum, Ganze Zahloder Dezimal. Nachdem Sie die Domäne erstellt haben, können Sie den Datentyp anzeigen, jedoch nicht mehr ändern. Der für eine Domäne ausgewählte Datentyp definiert den Typ von Quelldaten, die der Domäne zugeordnet werden können. Informationen zu unterstützten Datentypen für jeden der vier Domänendatentypen in DQS finden Sie unter Supported SQL Server and SSIS Data Types for DQS Domains (Unterstützte SQL Server- und SSIS-Datentypen für DQS-Domänen).
Führende Werte verwenden
Aktivieren Sie dieses Kontrollkästchen, um anzugeben, dass der führende Wert in einer Gruppe von Synonymen statt eines Werts ausgegeben wird, der ein Synonym dafür ist. Deaktivieren Sie Führende Werte verwenden , um anzugeben, dass jeder Synonymwert in seinem richtigen oder korrigierten Format ausgegeben und nicht durch den führenden Wert für die zugehörige Gruppe ersetzt wird.
Zeichenfolge normalisieren
Wenn der Datentyp Zeichenfolgeangegeben ist, klicken Sie hier, um die Sonderzeichen in den Quelldaten bei der Data Quality-Verarbeitung durch DQS zu ignorieren. DQS ersetzt die Sonderzeichen intern beim Laden der Daten in die Domäne durch NULL oder ein Leerzeichen. Ein Doppelpunkt, Bindestrich, Punkt, doppeltes Anführungszeichen oder Semikolon wird durch ein Leerzeichen ersetzt. Ein einfaches Anführungszeichen wird durch NULL ersetzt. Durch Verwendung des NULL-Werts werden die beiden Teile der Zeichenfolge verbunden.
Das Ignorieren von Sonderzeichen in einem Zeichenfolgenwert kann die Abgleichgenauigkeit vergrößern. Das Ähnlichkeitsergebnis zwischen zwei Zeichenfolgen kann vergrößert werden, indem Sonderzeichen durch NULL oder ein Leerzeichen ersetzt werden. Satzzeichen oder andere Symbole können sich in zwei Zeichenfolgen unterscheiden. Durch internes Ersetzen von Sonderzeichen kann das Ergebnis den unteren Schwellenwert für die Übereinstimmung in DQS überschreiten, sodass zwei Zeichenfolgen als Übereinstimmung erkannt werden, was andernfalls nicht der Fall gewesen wäre. Ob Sie Sonderzeichen ignorieren, hängt jedoch auch von dem Datentyp ab, für den Sie den Abgleich ausführen. Wenn Sie z. B. Daten aus dem englischen Maßsystem verarbeiten, kann das Ignorieren von doppelten und einfachen Anführungszeichen in den Produktdaten Fehler verursachen, wenn ein doppeltes Anführungszeichen für Zoll oder ein einfaches Anführungszeichen für Fuß steht.
Die Normalisierung wird beim Laden und Indizieren der Daten in den Datenverarbeitungsphasen der Ermittlungs-, Abgleichsrichtlinien-, Abgleichsprojekt- und Bereinigungsprojektaktivitäten ausgeführt. Bei Aktivierung werden Normalisierung und begriffsbasierte Beziehungstransformation vor der Analyse in einer Vorverarbeitungsphase durchgeführt. Sie werden für jede Domäne ausgeführt, bevor Algorithmen zur Berechnung der Ähnlichkeit zwischen Zeichenfolgen angewendet werden. Wenn eine Verbunddomänenanalyse angefordert wird, erfolgt diese vor der Normalisierung und begriffsbasierter Beziehungstransformation, da für die Trennzeichenanalyse Symbole erforderlich sind. Andere Vorgänge, z. B. Änderung an Domänenregeln und Domänenwerten, werden nach den Transformationen ausgeführt. Die resultierenden Daten werden durch das interne Ersetzen der Sonderzeichen in DQS nicht geändert.
Formatausgabe
Wählen Sie die Formatierung aus, die beim Ausgeben der Datenwerte in der Domäne angewendet wird. Die Formatierung ist für den ausgewählten Datentyp spezifisch, wie in der folgenden Liste gezeigt. Bei Auswahl von Keine wird keines der Formate in der Liste angewendet.
Für einen Zeichenfolgenwert können Sie angeben, dass die Zeichenfolge in Großbuchstaben, in Kleinbuchstaben oder in Großschreibung ausgegeben wird.
Für einen Datumswert können Sie das Format von Tag, Monat und Jahr angeben.
Für einen ganzzahligen Wert können Sie den Typ der Formatmaske angeben, die angewendet werden soll.
Für einen Dezimalwert können Sie die Genauigkeit und den Typ der Formatmaske angeben, die angewendet werden soll.
Sprache
Wenn der Datentyp Zeichenfolgeist, wählen Sie die Sprache aus, mit der die Domäne für die Rechtschreibprüfung verknüpft werden soll. Diese Auswahl gilt nur für die Rechtschreibprüfung, da die Ergebnisse der Rechtschreibprüfung von der verwendeten Sprache abhängig sind. Die Auswahl gilt nur für eine einzelne Domäne mit dem Datentyp „Zeichenfolge“. Die Spracheigenschaft ist für Verbunddomänen irrelevant. Die Sprache für jeden Teil einer Verbunddomäne wird von der relevanten Einzeldomäne bestimmt.
Englisch ist die Standardsprache. Wenn Sie die Eigenschaft Sprache auf Sonstige festlegen, wird die Rechtschreibprüfung für die Domäne deaktiviert.
Tipp
Wenn Ihre Sprache nicht in der Dropdownliste Sprache aufgeführt ist, müssen Sie Sonstigeauswählen. Dadurch wird sichergestellt, dass Duplikate für Daten in der nicht aufgeführten Sprache auf der Basis des verfügbaren Wissens (Domänenregeln, Domänenwerte, TBRs, Abgleichsregel) von DQS in der Domäne bereinigt und eliminiert werden.
Rechtschreibprüfung aktivieren
Wenn der Datentyp Zeichenfolgeist, klicken Sie hierauf, um die DQS-Rechtschreibprüfung für die Domäne zu aktivieren. Die Rechtschreibprüfung funktioniert nur in Domänen mit dem Datentyp „Zeichenfolge“. Das Kontrollkästchen Rechtschreibprüfung aktivieren aktiviert die Rechtschreibprüfung nur für die mit dem Kontrollkästchen verknüpfte Einzeldomäne. Das Kontrollkästchen gilt nicht für eine Verbunddomäne.
Die Rechtschreibprüfung schlägt Syntax- und Überprüfungskorrekturen für Werte in der Domäne vor. Weitere Informationen finden Sie unter Use the DQS Speller.
Syntaxfehleralgorithmen deaktivieren
Wenn der Datentyp Zeichenfolgeist, wählen Sie dies aus, um anzugeben, dass DQS während der Bereinigung keine Syntaxfehler in der Domäne identifiziert. Aktivieren Sie dieses Kontrollkästchen, wenn die Identifizierung von Syntaxfehlern für diese Domäne irrelevant ist. Die Identifizierung von Syntaxfehler ist für eine Seriennummer beispielsweise unwichtig. Dieses Steuerelement ist nur für den Datentyp „Zeichenfolge“ verfügbar. DQS überprüft keine anderen Datentypen als Zeichenfolgen auf Syntaxfehler.