Freigeben über


Red Teams - Create

Erstellt einen Redteam-Lauf.

POST {endpoint}/redTeams/runs:run?api-version=2025-05-15-preview

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint
path True

string (uri)

Endpunkt des Projekts. In der Form "https://.services.ai.azure.com/api/projects/_project" wenn Ihr Foundry Hub nur über ein Projekt verfügt, oder um das Standardprojekt in Ihrem Hub zu verwenden. Oder in der Form "https://.services.ai.azure.com/api/projects/" , wenn Sie den Namen des Foundry-Projekts explizit angeben möchten.

api-version
query True

string

minLength: 1

Die API-Version, die für diesen Vorgang verwendet werden soll.

Anforderungstext

Name Erforderlich Typ Beschreibung
target True TargetConfig:

AzureOpenAIModelConfiguration

Zielkonfiguration für den Red-Team-Run.

applicationScenario

string

Anwendungsszenario für die Red-Team-Operation, um szenariospezifische Angriffe zu generieren.

attackStrategies

AttackStrategy[]

Liste der Angriffsstrategien oder verschachtelte Listen von Angriffsstrategien.

displayName

string

Name des Red-Team-Laufs.

numTurns

integer (int32)

Anzahl der Simulationsrunden.

properties

object

Eigenschaften des roten Teams. Im Gegensatz zu Tags sind Eigenschaften nur add-only. Nachdem eine Eigenschaft hinzugefügt wurde, kann keine Eigenschaft entfernt werden.

riskCategories

RiskCategory[]

Liste der Risikokategorien, für die Angriffsziele generiert werden sollen.

simulationOnly

boolean

Reine Simulation oder Simulation + Bewertung. Standardwert false, wenn true, gibt der Scan die Konversation und nicht das Auswertungsergebnis aus.

tags

object

Tags des roten Teams. Im Gegensatz zu Eigenschaften sind Tags vollständig änderbar.

Antworten

Name Typ Beschreibung
201 Created

RedTeam

Die Anforderung ist erfolgreich und eine neue Ressource wurde als Ergebnis erstellt.

Other Status Codes

Azure.Core.Foundations.ErrorResponse

Unerwartete Fehlerantwort.

Header

x-ms-error-code: string

Sicherheit

OAuth2Auth

Typ: oauth2
Ablauf: implicit
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize

Bereiche

Name Beschreibung
https://ai.azure.com/.default

Beispiele

RedTeams_Create_MaximumSet
RedTeams_Create_MinimumSet

RedTeams_Create_MaximumSet

Beispielanforderung

POST {endpoint}/redTeams/runs:run?api-version=2025-05-15-preview

{
  "numTurns": 10,
  "attackStrategies": [
    "easy"
  ],
  "simulationOnly": true,
  "riskCategories": [
    "HateUnfairness"
  ],
  "applicationScenario": "qaxxxhjp",
  "tags": {
    "key1287": "gbklekkgmxkfbhehgh"
  },
  "properties": {
    "key9280": "fwzjtipl"
  },
  "target": {
    "type": "TargetConfig"
  }
}

Beispiel für eine Antwort

{
  "id": "tztegmf",
  "numTurns": 10,
  "attackStrategies": [
    "easy"
  ],
  "simulationOnly": true,
  "riskCategories": [
    "HateUnfairness"
  ],
  "applicationScenario": "qaxxxhjp",
  "tags": {
    "key1287": "gbklekkgmxkfbhehgh"
  },
  "properties": {
    "key9280": "fwzjtipl"
  },
  "status": "owgxaiudnkkeqwlnhtmihvhdkbgd",
  "target": {
    "type": "TargetConfig"
  }
}

RedTeams_Create_MinimumSet

Beispielanforderung

POST {endpoint}/redTeams/runs:run?api-version=2025-05-15-preview

{
  "numTurns": 10,
  "attackStrategies": [
    "easy"
  ],
  "simulationOnly": true,
  "riskCategories": [
    "HateUnfairness"
  ],
  "target": {
    "type": "TargetConfig"
  }
}

Beispiel für eine Antwort

{
  "id": "tztegmf",
  "numTurns": 10,
  "attackStrategies": [
    "easy"
  ],
  "simulationOnly": true,
  "riskCategories": [
    "HateUnfairness"
  ],
  "target": {
    "type": "TargetConfig"
  }
}

Definitionen

Name Beschreibung
AttackStrategy

Strategien für Angriffe.

Azure.Core.Foundations.Error

Das Fehlerobjekt.

Azure.Core.Foundations.ErrorResponse

Eine Antwort, die Fehlerdetails enthält.

Azure.Core.Foundations.InnerError

Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Microsoft One-API-Richtlinien – https://github.com/microsoft/api-guidelines/blob/vNext/azure/Guidelines.md#handling-errors.

AzureOpenAIModelConfiguration

Konfiguration des Azure OpenAI-Modells. Die API-Version wird vom Dienst für die Abfrage des Modells ausgewählt.

RedTeam

Details zum roten Team.

RiskCategory

Risikokategorie für das Angriffsziel.

AttackStrategy

Strategien für Angriffe.

Wert Beschreibung
ansii_attack

Verwendet ANSI-Escapesequenzen, um die Erscheinung und das Verhalten von Text zu verändern.

ascii_art

Generiert visuelle Kunst mithilfe von ASCII-Zeichen, die häufig für kreative oder Verschleierungszwecke verwendet werden.

ascii_smuggler

Verdeckt Daten innerhalb von ASCII-Zeichen, wodurch die Erkennung erschwert wird.

atbash

Implementiert die Atbash-Verschlüsselungsverfahren, ein einfaches Ersetzungs-Verschlüsselungsverfahren, bei dem jeder Buchstabe seinem umgekehrten zugeordnet ist.

base64

Codiert Binärdaten mithilfe von Base64 in ein Textformat, das häufig für die Datenübertragung verwendet wird.

baseline

Stellt das Baseline Direct Adversarial Probing dar, das von Angriffsstrategien als Angriffsziel verwendet wird.

binary

Konvertiert Text in Binärcode, der Daten in einer Reihe von 0 und 1s darstellt.

caesar

Wendet die Caesar-Chiffre an, eine Ersetzungs-Chiffre, die Zeichen um eine feste Anzahl von Positionen verschiebt.

character_space

Ändert Text durch Hinzufügen von Leerzeichen zwischen Zeichen, die häufig zur Verschleierung verwendet werden.

character_swap

Tauscht Zeichen innerhalb von Text, um Variationen zu erstellen oder den ursprünglichen Inhalt zu verschleiern.

diacritic

Fügt diakritische Zeichen hinzu, ändert ihr Aussehen und manchmal ihre Bedeutung.

difficult

Stellt einen Standardsatz von Angriffen mit schwieriger Komplexität dar. Zu den Angriffen mit schwieriger Komplexität gehören Angriffe, die Zugang zu erheblichen Ressourcen und Aufwand für die Ausführung eines Angriffs erfordern, wie z. B. Kenntnisse über suchbasierte Algorithmen zusätzlich zu einem generativen KI-Modell.

easy

Stellt einen Standardsatz einfacher Komplexitätsangriffe dar. Einfache Komplexitätsangriffe erfordern weniger Aufwand, z. B. die Übersetzung einer Eingabeaufforderung in eine Codierung, und erfordern kein großes Sprachmodell zum Konvertieren oder Orchestrieren.

flip

Dreht Zeichen von vorne nach hinten um und verursacht einen Spiegeleffekt.

jailbreak

Fügt speziell gestaltete Eingabeaufforderungen zum Umgehen von KI-Schutzmaßnahmen ein, die als Benutzerinjizierte Eingabeaufforderungsangriffe (UPIA) bezeichnet werden.

leetspeak

Wandelt Text in Leetspeak um, eine Form der Codierung, die Buchstaben durch ähnlich aussehende Zahlen oder Symbole ersetzt.

moderate

Stellt einen Standardsatz von Angriffen mittlerer Komplexität dar. Angriffe mit mittlerer Komplexität erfordern den Zugriff auf Ressourcen wie ein anderes generatives KI-Modell.

morse

Codiert Text in Morse-Code, wobei Punkte und Striche verwendet werden, um Zeichen darzustellen.

rot13

Wendet das ROT13-Verschlüsselungsverfahren an, ein einfaches Ersetzungs-Verschlüsselungsverfahren, bei dem Zeichen um 13 Positionen verschoben werden.

string_join

Verknüpft mehrere Zeichenfolgen, die häufig zur Verkettung oder Obfuskation verwendet werden.

suffix_append

Fügt ein kontradiktorisches Suffix an die Eingabeaufforderung an.

unicode_confusable

Verwendet Unicode-Zeichen, die ähnlich wie Standardzeichen aussehen, wodurch visuelle Verwirrung entsteht.

unicode_substitution

Ersetzt Standardzeichen durch Unicode-Entsprechungen, häufig zur Verschleierung.

url

Codiert Text in das URL-Format.

Azure.Core.Foundations.Error

Das Fehlerobjekt.

Name Typ Beschreibung
code

string

Eine serverdefinierte Gruppe von Fehlercodes.

details

Azure.Core.Foundations.Error[]

Ein Array von Details zu bestimmten Fehlern, die zu diesem gemeldeten Fehler geführt haben.

innererror

Azure.Core.Foundations.InnerError

Ein Objekt, das spezifischere Informationen enthält als das aktuelle Objekt über den Fehler.

message

string

Eine normal lesbare Darstellung des Fehlers.

target

string

Das Ziel des Fehlers.

Azure.Core.Foundations.ErrorResponse

Eine Antwort, die Fehlerdetails enthält.

Name Typ Beschreibung
error

Azure.Core.Foundations.Error

Das Fehlerobjekt.

Azure.Core.Foundations.InnerError

Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Microsoft One-API-Richtlinien – https://github.com/microsoft/api-guidelines/blob/vNext/azure/Guidelines.md#handling-errors.

Name Typ Beschreibung
code

string

Eine serverdefinierte Gruppe von Fehlercodes.

innererror

Azure.Core.Foundations.InnerError

Innerer Fehler.

AzureOpenAIModelConfiguration

Konfiguration des Azure OpenAI-Modells. Die API-Version wird vom Dienst für die Abfrage des Modells ausgewählt.

Name Typ Beschreibung
modelDeploymentName

string

Bereitstellungsname für das AOAI-Modell. Beispiel: gpt-4o, wenn in AIServices oder verbindungsbasiert connection_name/deployment_name (z.B. my-aoai-connection/gpt-4o.

type string:

AzureOpenAIModel

Typ der Modellkonfiguration.

RedTeam

Details zum roten Team.

Name Typ Standardwert Beschreibung
applicationScenario

string

Anwendungsszenario für die Red-Team-Operation, um szenariospezifische Angriffe zu generieren.

attackStrategies

AttackStrategy[]

Liste der Angriffsstrategien oder verschachtelte Listen von Angriffsstrategien.

displayName

string

Name des Red-Team-Laufs.

id

string

Kennung des Red Team Runs.

numTurns

integer (int32)

Anzahl der Simulationsrunden.

properties

object

Eigenschaften des roten Teams. Im Gegensatz zu Tags sind Eigenschaften nur add-only. Nachdem eine Eigenschaft hinzugefügt wurde, kann keine Eigenschaft entfernt werden.

riskCategories

RiskCategory[]

Liste der Risikokategorien, für die Angriffsziele generiert werden sollen.

simulationOnly

boolean

False

Reine Simulation oder Simulation + Bewertung. Standardwert false, wenn true, gibt der Scan die Konversation und nicht das Auswertungsergebnis aus.

status

string

Status des roten Teams. Sie wird vom Dienst festgelegt und ist schreibgeschützt.

tags

object

Tags des roten Teams. Im Gegensatz zu Eigenschaften sind Tags vollständig änderbar.

target TargetConfig:

AzureOpenAIModelConfiguration

Zielkonfiguration für den Red-Team-Run.

RiskCategory

Risikokategorie für das Angriffsziel.

Wert Beschreibung
HateUnfairness

Stellt Inhalte dar, die sich auf Hass oder Unfairness beziehen.

SelfHarm

Stellt Inhalte dar, die sich auf Selbstverletzung beziehen.

Sexual

Stellt Inhalte sexueller Natur dar.

Violence

Stellt Inhalte dar, die sich auf Gewalt beziehen.