Red Teams - Create
Erstellt einen Redteam-Lauf.
POST {endpoint}/redTeams/runs:run?api-version=2025-05-15-preview
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
endpoint
|
path | True |
string (uri) |
Endpunkt des Projekts. In der Form "https://.services.ai.azure.com/api/projects/_project" wenn Ihr Foundry Hub nur über ein Projekt verfügt, oder um das Standardprojekt in Ihrem Hub zu verwenden. Oder in der Form "https://.services.ai.azure.com/api/projects/" , wenn Sie den Namen des Foundry-Projekts explizit angeben möchten. |
api-version
|
query | True |
string minLength: 1 |
Die API-Version, die für diesen Vorgang verwendet werden soll. |
Anforderungstext
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
target | True | TargetConfig: |
Zielkonfiguration für den Red-Team-Run. |
applicationScenario |
string |
Anwendungsszenario für die Red-Team-Operation, um szenariospezifische Angriffe zu generieren. |
|
attackStrategies |
Liste der Angriffsstrategien oder verschachtelte Listen von Angriffsstrategien. |
||
displayName |
string |
Name des Red-Team-Laufs. |
|
numTurns |
integer (int32) |
Anzahl der Simulationsrunden. |
|
properties |
object |
Eigenschaften des roten Teams. Im Gegensatz zu Tags sind Eigenschaften nur add-only. Nachdem eine Eigenschaft hinzugefügt wurde, kann keine Eigenschaft entfernt werden. |
|
riskCategories |
Liste der Risikokategorien, für die Angriffsziele generiert werden sollen. |
||
simulationOnly |
boolean |
Reine Simulation oder Simulation + Bewertung. Standardwert false, wenn true, gibt der Scan die Konversation und nicht das Auswertungsergebnis aus. |
|
tags |
object |
Tags des roten Teams. Im Gegensatz zu Eigenschaften sind Tags vollständig änderbar. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
201 Created |
Die Anforderung ist erfolgreich und eine neue Ressource wurde als Ergebnis erstellt. |
|
Other Status Codes |
Unerwartete Fehlerantwort. Header x-ms-error-code: string |
Sicherheit
OAuth2Auth
Typ:
oauth2
Ablauf:
implicit
Autorisierungs-URL:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Bereiche
Name | Beschreibung |
---|---|
https://ai.azure.com/.default |
Beispiele
Red |
Red |
RedTeams_Create_MaximumSet
Beispielanforderung
POST {endpoint}/redTeams/runs:run?api-version=2025-05-15-preview
{
"numTurns": 10,
"attackStrategies": [
"easy"
],
"simulationOnly": true,
"riskCategories": [
"HateUnfairness"
],
"applicationScenario": "qaxxxhjp",
"tags": {
"key1287": "gbklekkgmxkfbhehgh"
},
"properties": {
"key9280": "fwzjtipl"
},
"target": {
"type": "TargetConfig"
}
}
Beispiel für eine Antwort
{
"id": "tztegmf",
"numTurns": 10,
"attackStrategies": [
"easy"
],
"simulationOnly": true,
"riskCategories": [
"HateUnfairness"
],
"applicationScenario": "qaxxxhjp",
"tags": {
"key1287": "gbklekkgmxkfbhehgh"
},
"properties": {
"key9280": "fwzjtipl"
},
"status": "owgxaiudnkkeqwlnhtmihvhdkbgd",
"target": {
"type": "TargetConfig"
}
}
RedTeams_Create_MinimumSet
Beispielanforderung
POST {endpoint}/redTeams/runs:run?api-version=2025-05-15-preview
{
"numTurns": 10,
"attackStrategies": [
"easy"
],
"simulationOnly": true,
"riskCategories": [
"HateUnfairness"
],
"target": {
"type": "TargetConfig"
}
}
Beispiel für eine Antwort
{
"id": "tztegmf",
"numTurns": 10,
"attackStrategies": [
"easy"
],
"simulationOnly": true,
"riskCategories": [
"HateUnfairness"
],
"target": {
"type": "TargetConfig"
}
}
Definitionen
Name | Beschreibung |
---|---|
Attack |
Strategien für Angriffe. |
Azure. |
Das Fehlerobjekt. |
Azure. |
Eine Antwort, die Fehlerdetails enthält. |
Azure. |
Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Microsoft One-API-Richtlinien – https://github.com/microsoft/api-guidelines/blob/vNext/azure/Guidelines.md#handling-errors. |
Azure |
Konfiguration des Azure OpenAI-Modells. Die API-Version wird vom Dienst für die Abfrage des Modells ausgewählt. |
Red |
Details zum roten Team. |
Risk |
Risikokategorie für das Angriffsziel. |
AttackStrategy
Strategien für Angriffe.
Wert | Beschreibung |
---|---|
ansii_attack |
Verwendet ANSI-Escapesequenzen, um die Erscheinung und das Verhalten von Text zu verändern. |
ascii_art |
Generiert visuelle Kunst mithilfe von ASCII-Zeichen, die häufig für kreative oder Verschleierungszwecke verwendet werden. |
ascii_smuggler |
Verdeckt Daten innerhalb von ASCII-Zeichen, wodurch die Erkennung erschwert wird. |
atbash |
Implementiert die Atbash-Verschlüsselungsverfahren, ein einfaches Ersetzungs-Verschlüsselungsverfahren, bei dem jeder Buchstabe seinem umgekehrten zugeordnet ist. |
base64 |
Codiert Binärdaten mithilfe von Base64 in ein Textformat, das häufig für die Datenübertragung verwendet wird. |
baseline |
Stellt das Baseline Direct Adversarial Probing dar, das von Angriffsstrategien als Angriffsziel verwendet wird. |
binary |
Konvertiert Text in Binärcode, der Daten in einer Reihe von 0 und 1s darstellt. |
caesar |
Wendet die Caesar-Chiffre an, eine Ersetzungs-Chiffre, die Zeichen um eine feste Anzahl von Positionen verschiebt. |
character_space |
Ändert Text durch Hinzufügen von Leerzeichen zwischen Zeichen, die häufig zur Verschleierung verwendet werden. |
character_swap |
Tauscht Zeichen innerhalb von Text, um Variationen zu erstellen oder den ursprünglichen Inhalt zu verschleiern. |
diacritic |
Fügt diakritische Zeichen hinzu, ändert ihr Aussehen und manchmal ihre Bedeutung. |
difficult |
Stellt einen Standardsatz von Angriffen mit schwieriger Komplexität dar. Zu den Angriffen mit schwieriger Komplexität gehören Angriffe, die Zugang zu erheblichen Ressourcen und Aufwand für die Ausführung eines Angriffs erfordern, wie z. B. Kenntnisse über suchbasierte Algorithmen zusätzlich zu einem generativen KI-Modell. |
easy |
Stellt einen Standardsatz einfacher Komplexitätsangriffe dar. Einfache Komplexitätsangriffe erfordern weniger Aufwand, z. B. die Übersetzung einer Eingabeaufforderung in eine Codierung, und erfordern kein großes Sprachmodell zum Konvertieren oder Orchestrieren. |
flip |
Dreht Zeichen von vorne nach hinten um und verursacht einen Spiegeleffekt. |
jailbreak |
Fügt speziell gestaltete Eingabeaufforderungen zum Umgehen von KI-Schutzmaßnahmen ein, die als Benutzerinjizierte Eingabeaufforderungsangriffe (UPIA) bezeichnet werden. |
leetspeak |
Wandelt Text in Leetspeak um, eine Form der Codierung, die Buchstaben durch ähnlich aussehende Zahlen oder Symbole ersetzt. |
moderate |
Stellt einen Standardsatz von Angriffen mittlerer Komplexität dar. Angriffe mit mittlerer Komplexität erfordern den Zugriff auf Ressourcen wie ein anderes generatives KI-Modell. |
morse |
Codiert Text in Morse-Code, wobei Punkte und Striche verwendet werden, um Zeichen darzustellen. |
rot13 |
Wendet das ROT13-Verschlüsselungsverfahren an, ein einfaches Ersetzungs-Verschlüsselungsverfahren, bei dem Zeichen um 13 Positionen verschoben werden. |
string_join |
Verknüpft mehrere Zeichenfolgen, die häufig zur Verkettung oder Obfuskation verwendet werden. |
suffix_append |
Fügt ein kontradiktorisches Suffix an die Eingabeaufforderung an. |
unicode_confusable |
Verwendet Unicode-Zeichen, die ähnlich wie Standardzeichen aussehen, wodurch visuelle Verwirrung entsteht. |
unicode_substitution |
Ersetzt Standardzeichen durch Unicode-Entsprechungen, häufig zur Verschleierung. |
url |
Codiert Text in das URL-Format. |
Azure.Core.Foundations.Error
Das Fehlerobjekt.
Name | Typ | Beschreibung |
---|---|---|
code |
string |
Eine serverdefinierte Gruppe von Fehlercodes. |
details |
Ein Array von Details zu bestimmten Fehlern, die zu diesem gemeldeten Fehler geführt haben. |
|
innererror |
Ein Objekt, das spezifischere Informationen enthält als das aktuelle Objekt über den Fehler. |
|
message |
string |
Eine normal lesbare Darstellung des Fehlers. |
target |
string |
Das Ziel des Fehlers. |
Azure.Core.Foundations.ErrorResponse
Eine Antwort, die Fehlerdetails enthält.
Name | Typ | Beschreibung |
---|---|---|
error |
Das Fehlerobjekt. |
Azure.Core.Foundations.InnerError
Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Microsoft One-API-Richtlinien – https://github.com/microsoft/api-guidelines/blob/vNext/azure/Guidelines.md#handling-errors.
Name | Typ | Beschreibung |
---|---|---|
code |
string |
Eine serverdefinierte Gruppe von Fehlercodes. |
innererror |
Innerer Fehler. |
AzureOpenAIModelConfiguration
Konfiguration des Azure OpenAI-Modells. Die API-Version wird vom Dienst für die Abfrage des Modells ausgewählt.
Name | Typ | Beschreibung |
---|---|---|
modelDeploymentName |
string |
Bereitstellungsname für das AOAI-Modell. Beispiel: gpt-4o, wenn in AIServices oder verbindungsbasiert |
type |
string:
Azure |
Typ der Modellkonfiguration. |
RedTeam
Details zum roten Team.
Name | Typ | Standardwert | Beschreibung |
---|---|---|---|
applicationScenario |
string |
Anwendungsszenario für die Red-Team-Operation, um szenariospezifische Angriffe zu generieren. |
|
attackStrategies |
Liste der Angriffsstrategien oder verschachtelte Listen von Angriffsstrategien. |
||
displayName |
string |
Name des Red-Team-Laufs. |
|
id |
string |
Kennung des Red Team Runs. |
|
numTurns |
integer (int32) |
Anzahl der Simulationsrunden. |
|
properties |
object |
Eigenschaften des roten Teams. Im Gegensatz zu Tags sind Eigenschaften nur add-only. Nachdem eine Eigenschaft hinzugefügt wurde, kann keine Eigenschaft entfernt werden. |
|
riskCategories |
Liste der Risikokategorien, für die Angriffsziele generiert werden sollen. |
||
simulationOnly |
boolean |
False |
Reine Simulation oder Simulation + Bewertung. Standardwert false, wenn true, gibt der Scan die Konversation und nicht das Auswertungsergebnis aus. |
status |
string |
Status des roten Teams. Sie wird vom Dienst festgelegt und ist schreibgeschützt. |
|
tags |
object |
Tags des roten Teams. Im Gegensatz zu Eigenschaften sind Tags vollständig änderbar. |
|
target | TargetConfig: |
Zielkonfiguration für den Red-Team-Run. |
RiskCategory
Risikokategorie für das Angriffsziel.
Wert | Beschreibung |
---|---|
HateUnfairness |
Stellt Inhalte dar, die sich auf Hass oder Unfairness beziehen. |
SelfHarm |
Stellt Inhalte dar, die sich auf Selbstverletzung beziehen. |
Sexual |
Stellt Inhalte sexueller Natur dar. |
Violence |
Stellt Inhalte dar, die sich auf Gewalt beziehen. |