Freigeben über


Bewährte Methoden zum Konfigurieren Ihres Daten-Agents

In diesem Artikel werden bewährte Methoden zum Konfigurieren eines Daten-Agents beschrieben, um genaue, relevante und hilfreiche Antworten auf Benutzerfragen bereitzustellen. Indem Sie klare Anweisungen auf Ebene des Agenten und für spezifische Datenquellen festlegen, können Sie steuern, wie der Agent Abfragen interpretiert, Datenquellen auswählt und Antworten generiert. Sie erfahren, wie Sie das Ziel des Agents definieren, Datenquellen priorisieren, wichtige Terminologie integrieren und Abfragelogik für allgemeine Szenarien bereitstellen. Diese Konfigurationstipps helfen sicherzustellen, dass der Agent zuverlässig in verschiedenen Datenumgebungen und Benutzeranforderungen ausgeführt wird.

Informationen zu den verschiedenen Arten von Daten-Agent-Konfigurationen finden Sie unter Data Agent-Konfigurationen.

1. Machen Sie Ihre Daten bereit für KI

Um sicherzustellen, dass der Daten-Agent genaue Abfragen generieren kann, ist es wichtig, dass Ihre Datenquellen, Tabellen und Spalten klare und beschreibende Namen verwenden. Vermeiden Sie vage oder generische Bezeichnungen wie Table1, col1oder flag, was es für den Agent schwierig machen kann, Benutzerabsichten zu interpretieren.

Weniger effektiv:

  • Tabellennamen: Table1, Table2
  • Spaltennamen: col1, statusflag

Besser:

  • Tabellennamen: CustomerOrders, ProductCatalog, SalesTransactionsOrderItems
  • Spaltennamen: customer_email_address, order_submission_dateproduct_unit_price

Die beschreibende Benennung hilft dem Agent, die Datenstruktur zu verstehen und die Qualität der generierten Abfragen zu verbessern.

2. Erstellen von speziellen Agents für bestimmte Domänen

Für eine bessere Genauigkeit und Relevanz entwerfen Sie Daten-Agents, die sich auf eine bestimmte Domäne oder einen Anwendungsfall konzentrieren, anstatt zu versuchen, eine breite Palette von Fragen zu behandeln. Spezialisierte Agents können mit gezielten Anweisungen, relevanten Datenquellen und domänenspezifischer Terminologie optimiert werden, wodurch sie zuverlässiger und effektiver werden.

Weniger effektiv: Ein allgemeiner Datenagent, der eine Vielzahl von kundenbezogenen Fragen in verschiedenen Benutzerpersonas beantwortet

Besser: Ein Datenagent, der auf die Unterstützung des Führungsteams zugeschnitten ist, indem Erkenntnisse aus mehreren Datenquellen für die Besprechungsvorbereitung kombiniert werden

Indem Sie den Fokus des Agents einschränken, verbessern Sie die Fähigkeit, präzise Antworten zu generieren und die Mehrdeutigkeit bei der Abfrageinterpretation zu reduzieren.

3. Minimieren des Datenquellenbereichs

Schließen Sie nur die Datenquellen ein, die erforderlich sind, um die erwarteten Benutzerfragen zu beantworten. Wählen Sie in jeder Datenquelle nur die spezifischen Tabellen und Spalten aus, die für Ihren Anwendungsfall relevant sind. Eine fokussiertere Konfiguration verbessert die Fähigkeit des Agents, genaue und effiziente Abfragen zu generieren.

Weniger effektiv: Verbinden eines gesamten Lakehouse- oder Modellmodells mit allen Tabellen und Spalten

Besser: Auswählen der wesentlichen Tabellen und Spalten, die für allgemeine Abfragen erforderlich sind

Tipp

Um optimale Ergebnisse zu erzielen, beschränken Sie die Anzahl der Tabellen auf 25 oder weniger für eine bestimmte Datenquelle.

4. Seien Sie genau, was Sie tun sollen, und nicht nur, was Sie nicht tun sollen

Anstatt nur anzugeben, was der Agent vermeiden sollte, geben Sie klare Anleitungen zum richtigen Ansatz. Dies hilft dem Agenten, effektiver zu reagieren und Mehrdeutigkeiten bei der Behandlung von Randfällen zu vermeiden.

Weniger effektiv: Stellen Sie keine veralteten Zahlungsinformationen bereit oder machen Sie Annahmen zu fehlenden Daten.
Besser: Stellen Sie immer die aktuellsten Lohninformationen aus dem offiziellen Lohnbuchhaltungssystem zur Verfügung. Wenn die Zahlung fehlt oder unvollständig ist, informieren Sie den Mitarbeiter, dass Sie keine aktuellen Datensätze finden können, und empfehlen sie, sich an die Personalabteilung zu wenden, um weitere Unterstützung zu erhalten.

5. Definieren von Geschäftsbegriffen, Abkürzungen und Synonymen

Um sicherzustellen, dass der Daten-Agent Fragen richtig interpretiert, definieren Sie alle Begriffe, die mehrdeutig, organisationsspezifisch oder domänenspezifisch sein können. Diese Definitionen helfen dem Agent, konsistente Logik anzuwenden und genaue Antworten zu generieren – insbesondere, wenn Benutzerfragen auf interne Terminologie oder ähnliche Konzepte verweisen.

Beispiele für die Definition

  • Ähnliche Konzepte: "calendar year" vs. "fiscal year"
  • Allgemeine Geschäftsbedingungen: "quarter", , "SKU""sales""shoes"
  • Abkürzungen oder Akronyme: "NPS" (Net Promoter Score), "MAU" (Monatliche aktive Benutzer)

Speicherort für Definitionen

  • Anweisungen auf Agentebene: Verwenden Sie dies für Definitionen, die für alle Datenquellen und Abfragen gelten (z. B. was ein "Viertel" darstellt).
  • Anweisungen zur Datenquelle: Verwenden Sie dies für Definitionen, die spezifisch dafür sind, wie ein Begriff innerhalb eines bestimmten Datasets verwendet wird (z. B. "Vertrieb", der in verschiedenen Systemen definiert ist).

6. Verwenden von führenden Wörtern zum Auslösen der Abfragegenerierung

In Ihren Datenquellenanweisungen können Sie Hinweise oder Fragmente der SQL/DAX/KQL-Syntax einschließen, um das Modell zum Generieren von Abfragen in einem bestimmten Format zu leiten. Diese "führenden Wörter" helfen dem Agent, die richtige Logik beim Übersetzen natürlicher Sprache in Code zu ableiten.

Weniger effektiv:
Suchen Sie alle Produkte mit Namen mit "Bike".

Besser:
Finden Sie alle Produkte, deren Namen das Wort "Fahrrad" enthalten
WIE '%bike%'

Das Einschließen von Syntaxfragmenten wie LIKE '%...%' hilft dem Modell zu erkennen, dass eine Musterabgleichsklausel in der Abfrage erwartet wird. Diese Technik verbessert die Genauigkeit der generierten SQL, insbesondere bei der Behandlung von partiellen Übereinstimmungen, Filtern oder Verknüpfungen.

7. Schreiben Sie klare, fokussierte Anweisungen; Unnötige Details vermeiden

Anweisungen sollten prägnant und gezielt sein. Fügen Sie nur die erforderlichen Informationen ein, um dem Agent dabei zu helfen, genaue Antworten zu generieren. Vermeiden Sie vage, veraltete oder allzu umfassende Inhalte, die Verwirrung stiften oder den Fokus des Agenten beeinträchtigen.

Weniger effektiv:

You are an HR data agent who should try to help employees with all kinds of questions about work. You have access to many systems, like the HRIS platform, old payroll databases from previous vendors, archived employee files, scanned PDF policy documents, and maybe even some spreadsheets that HR used in the past. If someone asks about their pay, you might want to look in one of the old systems if needed. Also, sometimes data isn't updated immediately, so just do your best. Remember that the company reorganized in 2017, so department names might be different before then. Try to be friendly, but also make sure you don’t seem robotic. Sometimes HR policies change, so answers might not always be the same depending on the date. Just explain if something seems complicated.

Warum ist dies weniger effektiv?

  • Der Bereich ist zu breit ("alle Arten von Fragen zur Arbeit")
  • Verweise auf veraltete oder unzuverlässige Quellen (z. B. "alte Lohnbuchhaltungsdatenbanken")
  • Fehlende Priorisierung von Datenquellen
  • Führt unnötigen historischen Kontext ein
  • Erstellt Mehrdeutigkeit mit Ausdrücken wie "Nur ihr Bestes tun"
  • Fehlende klare Anleitungen für die Behandlung fehlender oder komplexer Daten

Besser:

You are an HR Assistant Agent responsible for answering employee questions about employment status, job details, pay history, and leave balances.  
Use the official HR data warehouse to retrieve current and accurate records.  
If data is missing or unclear, inform the user and recommend they contact HR for further support.  
Keep responses concise, professional, and easy for employees to understand.

Warum ist das besser?

  • Klärung des Aufgabenbereichs und der Verantwortlichkeiten des Agenten
  • Verweist auf die richtige Datenquelle, ohne technische Details zu überladen
  • Stellt ein klares Fallbackverhalten bereit.
  • Richtet Ton- und Kommunikationsstil ein
  • Überlässt die Details auf Tabellenebene den Anweisungen der Datenquelle.

Schreiben Sie detaillierte Anweisungen für Datenagenten

Agent-Anweisungen definieren, wie der Agent Benutzerfragen interpretiert, Datenquellen auswählt und Antworten formatiert. Verwenden Sie diesen Abschnitt, um die Rolle des Agents, das erwartete Verhalten, den Ton und die Behandlung verschiedener Arten von Abfragen deutlich zu beschreiben. Fügen Sie spezifische Details zu den vorgesehenen Anwendungsfällen, bevorzugten Datenquellen und Fallbackverhalten ein, wenn Informationen fehlen.

Tipp

Fragen Sie sich beim Schreiben Ihrer Agent-Anweisungen: Könnte jemand mit diesen Datenquellen nicht vertraut sein, welche Quellen verwendet werden sollen, und wie sie basierend auf den Anweisungen verwendet werden können? Falls nicht, überarbeiten Sie die Anweisungen, um den fehlenden Kontext einzuschließen.

Weniger effektiv:

You are an agent that helps with HR topics.  
Find answers if possible.  
Try not to give wrong information.  
If you cannot find something, you can tell the user to check elsewhere.  
Answer employee questions about work, pay, and other topics using available systems.  
Keep responses professional.

Besser:

## Tone and style
Use clear, simple, and professional language.  
Sound friendly and helpful, like an internal HR support agent.  
Avoid technical jargon unless it's part of the business terminology used in the data.

## General knowledge
You are an HR Assistant Agent designed to help employees access accurate information about their employment, benefits, and pay.  
Only answer questions using the official HR data sources provided.  
If multiple records exist, prioritize the most recent and most official source.  
Do not guess or assume answers—if information is missing or unclear, advise the employee to contact HR directly.  

## Data source descriptions
- **Employee Data Warehouse**: Contains employment records including status, role, start date, and department.
- **Payroll System**: Contains pay history, compensation details, and tax withholding information.
- **Benefits Enrollment Database**: Includes information about health insurance, retirement plans, and other employee benefits.
- **HR Policy Lakehouse**: Stores official company policies, including holidays, leave policies, and onboarding documents.

## When asked about
- **Employment status (e.g., active, on leave, terminated)**: Use the *Employee Data Warehouse*  
- **Pay history or compensation**: Use the *Payroll System*  
- **Benefits and enrollment details**: Use the *Benefits Enrollment Database*  
- **Company holidays and leave of absence policies**: Use the *HR Policy Lakehouse*

9. Bereitstellen detaillierter Datenquellenanweisungen

Anweisungen zur Datenquelle sollten spezifisch, strukturiert und beschreibend sein. Sie leiten den Agent bei der Erstellung präziser Abfragen, indem definiert wird, wie die Daten organisiert werden, welche Tabellen und Spalten relevant sind und wie Beziehungen zwischen Tabellen behandelt werden sollen.

Verwenden Sie diesen Abschnitt, um Folgendes zu beschreiben:

  • Zweck der Datenquelle
  • Welche Arten von Fragen soll beantwortet werden?
  • Erforderliche Spalten, die in Antworten eingeschlossen werden sollen
  • Verknüpfungslogik zwischen Tabellen
  • Typische Wertformate (z. B. Abkürzungen im Vergleich zu vollständigen Namen)

Tipp

Stellen Sie sich vor, wie ein neues Teammitglied dieses Dataset zum ersten Mal verwendet – könnten sie eine korrekte Abfrage schreiben, nur indem sie diese Anweisungen befolgen?
Falls nicht, fügen Sie den fehlenden Kontext hinzu, klären Sie Annahmen, oder fügen Sie Beispielabfragen hinzu, um sie zu leiten.

Tipp

Der Daten-Agent kann vor dem Ausführen einer Abfrage keine einzelnen Zeilenwerte sehen.
Um die Filterlogik zu leiten, schließen Sie Beispiele für typische Werte und Formate ein, z. B. angeben, ob eine State Spalte Abkürzungen wie "CA" oder vollständige Namen verwendet "California".

Weniger effektiv:

## General instructions
Use the EmployeeData warehouse to find answers about employees.  
Try to get useful employee details when needed.

### Employment status
You can use the EmployeeStatusFact table.  
Join to EmployeeDim if necessary.

Besser:

## General instructions
Use the EmployeeData data warehouse to answer questions related to employee details, employment status, pay history, and organizational structure.

When generating queries:
• Use EmployeeDim as the primary table for employee details.  
• Always include the following columns in the response (if available):  
  - EmployeeID  
  - EmployeeName  
  - EmploymentStatus  
  - JobTitle  
  - DepartmentName  
• Join other tables to EmployeeDim using EmployeeID unless otherwise specified.  
• Filter for the most recent records when applicable.  

Example values:
- EmploymentStatus: "Active", "On Leave", "Terminated"  
- DepartmentName: "Finance", "HR", "Engineering"  
- State: Use U.S. state abbreviations like "CA", "NY", "TX"

## When asked about

When asked about **employee status**, use the `EmployeeStatusFact` table.  
Join it to `EmployeeDim` on `EmployeeID`.  
Filter by the most recent `StatusEffectiveDate` and return the following columns: `EmploymentStatus`, `StatusEffectiveDate`, `EmployeeName`, and `DepartmentName`.

When asked about **current job title or department**, use the `EmployeeDim` table.  
Return `JobTitle` and `DepartmentName`.  
If multiple records exist, filter for the record where `IsCurrent = True`.

10. Verwenden Sie Beispielabfragen, um komplexe Abfragelogik auszudrücken.

Verwenden Sie Beispielabfragen , um dem Daten-Agent zu helfen, zu verstehen, wie genaue Abfragen erstellt werden – insbesondere, wenn die Logik komplex oder differenziert ist. Diese Beispiele dienen als Vorlagen, aus denen der Agent generalisieren kann, auch wenn die Benutzerfrage nicht exakt übereinstimmt.

  • Schließen Sie Beispielabfragen für allgemeine oder repräsentative Fragetypen ein.
  • Konzentrieren Sie sich auf Beispiele, bei denen die Abfragelogik Filterung, Verknüpfungen, Aggregationen oder Die Datumsbehandlung umfasst.
  • Halten Sie die Struktur klar und gut formatiert, indem Sie die richtige Syntax für Ihre Datenquelle (SQL, DAX oder KQL) verwenden.
  • Sie müssen die Benutzerfragen nicht wortwörtlich übereinstimmen; Beispiele sollten die Absicht und Struktur veranschaulichen.

Tipp

Die Bereitstellung einer wohlgeformten Abfrage ist häufig klarer und effizienter als der Versuch, komplexe Logik allein durch Text zu erklären.

Verwendung von Beispielabfragen

Für jede Benutzerfrage führt der Daten-Agent eine Vektor-Ähnlichkeitssuche aus , um die wichtigsten 3 relevantesten Beispielabfragen abzurufen. Diese werden dann an die erweiterte Eingabeaufforderung des Agents übergeben, um die Abfragegenerierung zu leiten.

Nächste Schritte