Äußerungen
Wichtig
LUIS wird am 1. Oktober 2025 eingestellt, und ab dem 1. April 2023 können Sie keine neuen LUIS-Ressourcen erstellen. Es wird die Migration Ihrer LUIS-Anwendungen zu Conversational Language Understanding empfohlen, um fortgesetzte Produktunterstützung und mehrsprachige Funktionen zu erhalten.
Äußerungen sind Eingaben von Benutzer*innen, die Ihre App interpretieren muss. Es ist wichtig, viele verschiedene Beispieläußerungen für jede Absicht zu erfassen, um LUIS für die Extrahierung von Absichten und Entitäten aus diesen Eingaben zu trainieren. Aktives Lernen bzw. das fortlaufende Training mit neuen Äußerungen ist unverzichtbar für die Machine Learning-Intelligenz von LUIS.
Sammeln Sie Äußerungen, die Benutzer möglicherweise eingeben. Schließen Sie Äußerungen mit ein, die zwar die gleiche Bedeutung haben, aber unterschiedlich konstruiert sind:
- Äußerungslänge (kurz, mittel und lang für Ihre Clientanwendung)
- Wort- und Ausdruckslänge
- Wortposition (Entität am Anfang, in der Mitte und am Ende der Äußerung)
- Grammatik
- Pluralisierung
- Wortstammerkennung
- Nomen und Verb
- Interpunktion: Verwenden der richtigen und falschen Grammatik
Auswählen verschiedener Äußerungen
Wenn Sie mit dem Hinzufügen von Beispieläußerungen zu Ihrem LUIS-Modell beginnen, müssen Sie verschiedene Prinzipien beachten:
Äußerungen sind nicht immer ordnungsgemäß formatiert
Ihre App muss möglicherweise Sätze (z. B. „Ein Ticket nach Paris für mich buchen“) oder einen Teil eines Satzes (z. B. „Buchen“ oder „Flug nach Paris“) verarbeiten. Benutzerinnen und Benutzer machen dabei auch häufig Rechtschreibfehler. Überlegen Sie sich daher bei der Planung Ihrer App, ob Sie Benutzereingaben mithilfe der Bing-Rechtschreibprüfung korrigieren, bevor Sie sie an LUIS übergeben.
Wenn Sie keine Rechtschreibprüfung auf die Äußerungen Ihrer Benutzerinnen und Benutzer anwenden, sollten Sie LUIS mit Äußerungen trainieren, die Tipp- und Schreibfehler enthalten.
Verwenden Sie Sprache, die den Benutzern entspricht
Beachten Sie bei der Wahl der Äußerungen, dass das, was Sie als allgemeinen Begriff oder Ausdruck kennen, unter Umständen für typische Benutzer*innen Ihrer Clientanwendung nicht geeignet ist. Sie verfügen möglicherweise nicht über das Fachwissen oder verwenden eine andere Terminologie. Seien Sie daher vorsichtig mit Begriffen oder Ausdrücken, die ein Benutzer nur verwenden würde, wenn er bestens mit der Thematik vertraut ist.
Auswählen unterschiedlicher Terminologie und Formulierungen
Auch wenn Sie sich bemühen, variierende Satzstrukturen zu verwenden, werden Sie feststellen, dass Sie einiges an Vokabular wiederholen müssen. Beispielsweise haben die folgenden Äußerungen zwar eine ähnliche Bedeutung, aber unterschiedliche Terminologie und Formulierungen:
- „Wie bekomme ich einen Computer?“
- „Wo bekomme ich einen Computer?“
- „Ich möchte einen Computer haben, wie gehe ich dazu vor?“
- „Wann kann ich einen Computer bekommen?“
Für den zentralen Begriff Computer sind keine Varianten vorhanden. Verwenden Sie Alternativen wie „Desktopcomputer“, „Laptop“, „Arbeitsstation“ oder sogar nur „Maschine“. LUIS kann diese Synonyme auf intelligente Weise vom Kontext ableiten. Wenn Sie jedoch Äußerungen zum Trainieren erstellen, ist es immer besser, diese zu variieren.
Beispieläußerungen mit jeder Absicht
Jede Absicht benötigt mindestens 15 Beispieläußerungen. Wenn Sie jedoch über eine Absicht verfügen, die keine Beispieläußerungen aufweist, können Sie LUIS nicht trainieren. Wenn Sie über eine Absicht mit nur einer oder wenigen Beispieläußerungen verfügen, sagt LUIS die Absicht möglicherweise nicht genau vorher.
Hinzufügen kleiner Gruppen von Äußerungen
Fügen Sie keine großen Mengen an Äußerungen hinzu, wenn Sie Beurteilungen für Ihr Modell durchführen. Es wird empfohlen, Äußerungen in Mengen von jeweils 15 hinzufügen. Trainieren, veröffentlichen und testen Sie anschließend erneut.
LUIS erstellt effektive Modelle mit sorgfältig vom LUIS-Modellersteller ausgewählten Äußerungen. Das Hinzufügen zu vieler Äußerungen ist nicht nützlich, da es zu Verwechslungen führen kann.
Es ist besser, mit nur wenigen Äußerungen anzufangen und anschließend die Endpunktäußerungen zu überprüfen, um die richtige Vorhersage der Absicht und Extraktion der Entität zu gewährleisten.
Äußerungsnormalisierung
Bei der Äußerungsnormalisierung wird die Wirkung von Textelementen wie Interpunktion und diakritischen Zeichen beim Trainieren und bei Vorhersagen ignoriert.
Standardmäßig sind die Äußerungsnormalisierungseinstellungen deaktiviert. Dies umfasst Folgendes:
- Wortformen
- Diakritische Zeichen
- Interpunktion
Wenn Sie eine Normalisierungseinstellung aktivieren, ändern sich Bewertungen im Bereich Test sowie Batchtests und Endpunktabfragen für alle Äußerungen, für die diese Normalisierungseinstellung gilt.
Wenn Sie eine Version im LUIS-Portal klonen, werden die Versionseinstellungen in der neuen geklonten Version beibehalten.
Legen Sie die Versionseinstellungen Ihrer App über das LUIS-Portal fest, indem Sie im oberen Navigationsmenü auf der Seite Anwendungseinstellungen die Option Verwalten auswählen. Sie können auch die API zum Aktualisieren der Versionseinstellungen verwenden. Weitere Informationen finden Sie in der Referenzdokumentation.
Wortformen
Bei der Normalisierung von Wortformen werden über den Wortstamm hinausgehende Unterschiede ignoriert.
Diakritische Zeichen
Diakritische Zeichen sind Markierungen oder Kennzeichnungen innerhalb des Texts, z. B.:
İ ı Ş Ğ ş ğ ö ü
Interpunktion
Interpunktion zu normalisieren bedeutet, dass die Interpunktionszeichen aus den Äußerungen entfernt werden, bevor Ihre Modelle trainiert und bevor Ihre Endpunktabfragen vorhergesagt werden.
Interpunktion ist ein separates Token in LUIS. Eine Äußerung mit einem Punkt am Ende ist eine andere Äußerung als eine ohne Punkt am Ende. So werden möglicherweise zwei verschiedene Vorhersagen ausgegeben.
Wenn die Interpunktion nicht normalisiert wird, ignoriert LUIS Satzzeichen standardmäßig nicht, da diese für einige Clientanwendungen unter Umständen wichtig sind. Stellen Sie sicher, dass Sie Beispieläußerungen einschließen, die Interpunktion verwenden. Schließen Sie zudem Äußerungen ein, die keine Interpunktion verwenden, damit beide Stile die gleichen relativen Bewertungen zurückgeben.
Stellen Sie sicher, dass das Modell die Interpunktion entweder in den Beispieläußerungen (mit und ohne Interpunktion) oder in den Mustern behandelt, wo es einfacher ist, die Interpunktion zu ignorieren. Beispiel: I am applying for the {Job} position[.]
Wenn die Interpunktion in Ihrer Clientanwendung keine besondere Bedeutung hat, sollten Sie erwägen, Satzzeichen zu ignorieren, indem Sie die Interpunktion normalisieren.
Ignorieren von Wörtern und Interpunktion
Wenn Sie bestimme Wörter oder Satzzeichen ignorieren möchten, können Sie Muster verwenden. Verwenden Sie in diesen zum Ignorieren von Wörtern und Satzzeichen eine Syntax mit eckigen Klammern ([]
).
Trainieren mit allen Äußerungen
Das Training ist nicht deterministisch: Die Vorhersage von Äußerungen kann je nach Version oder App variieren. Sie können nicht deterministisches Training entfernen, indem Sie die API für die Versionseinstellungen mit dem Name-Wert-Paar UseAllTrainingData aktualisieren, um alle Trainingsdaten zu verwenden.
Testen von Äußerungen
Entwickler*innen sollten damit beginnen, ihre LUIS-Anwendung mit echtem Daten zu testen, indem sie Äußerungen an die URL des Vorhersageendpunkts senden. Diese Äußerungen werden verwendet, um die Leistung der Absichten und Entitäten mit Überprüfungsäußerungen zu verbessern. Über den Testbereich im LUIS-Portal übermittelte Tests werden nicht über den Endpunkt gesendet und tragen nicht zum aktiven Lernen bei.
Überprüfen von Äußerungen
Nachdem Ihr Modell trainiert sowie veröffentlicht ist und Endpunktabfragen empfängt, überprüfen Sie die Äußerungen, die LUIS vorschlägt. LUIS wählt Endpunktäußerungen aus, die niedrige Bewertungen für die Absicht oder Entität aufweisen.
Bewährte Methoden
Bezeichnungen für Wortbedeutungen
Wenn die Wortauswahl oder die Anordnung der Wörter identisch ist, sie aber nicht dieselbe Bedeutung haben, sollten Sie sie nicht mit der Entität bezeichnen.
In den folgenden Äußerungen ist das Wort „fair“ ein Homogramm, was bedeutet, dass es gleich geschrieben ist, aber eine andere Bedeutung hat:
- Welche Arten von Jahrmärkten finden in diesem Sommer in der Region Seattle statt?
- „Is the current 2-star rating for the restaurant fair?“ (Ist die derzeitige Bewertung von 2 Sternen für das Restaurant fair?)
Wenn Sie mit einer Veranstaltungsentität alle Veranstaltungsdaten suchen möchten, bezeichnen Sie das Wort „fair“ in der ersten Äußerung, aber nicht in der zweiten.
Ignorieren Sie dabei nicht die möglichen Äußerungsabweichungen.
LUIS erwartet Variationen in den Äußerungen zu einer Absicht. Die Äußerungen können variieren, sollten aber eine einheitliche Bedeutung haben. Variationen können durch die Länge der Äußerung, die Wortwahl und die Wortanordnung entstehen.
Verwenden Sie nicht das gleiche Format. | Verwenden Sie unterschiedliche Formate. |
---|---|
Kaufe ein Ticket nach Seattle | Kaufe 1 Ticket nach Seattle |
Kaufe ein Ticket nach Paris | Reserviere zwei Tickets für den Nachtflug nach Paris nächsten Montag |
Kaufe ein Ticket nach Orlando | Ich möchte 3 Tickets nach Orlando in den Frühjahrsferien buchen |
In der zweiten Spalte werden verschiedene Verben (kaufen, reservieren, buchen), verschiedene Mengenangaben (1, zwei, 3) und unterschiedliche Wortanordnungen verwendet, alle enthalten jedoch dieselbe Absicht: Flugtickets für eine Reise zu erwerben.
Fügen Sie Absichten nicht zu viele Beispieläußerungen hinzu.
Nachdem die Anwendung veröffentlicht wurde, fügen Sie im Entwicklungslebenszyklus-Prozess nur Äußerungen aus dem aktiven Lernen hinzu. Wenn sich die Äußerungen zu ähnlich sind, fügen Sie ein Muster hinzu.