Standardrichtlinien für die Inhaltssicherheit

Artikel
09/03/2024

Azure OpenAI Service umfasst Standardsicherheit, die auf alle Modelle angewendet wird, mit Ausnahme von Azure OpenAI Whisper. Diese Konfigurationen bieten Ihnen standardmäßig eine verantwortungsvolle Umgebung, die Inhaltsfiltermodelle, Blockierlisten, Prompttransformation, Inhaltsanmeldeinformationen und mehr enthält.

Die Standardsicherheit zielt darauf ab, Risiken in Bezug auf Hass und Fairness, sexuelle Inhalte, Gewalt, Selbstverletzungen, geschützte Materialinhalte und Einschleusungsangriffe durch Benutzerprompts zu mindern. Weitere Informationen zur Inhaltsfilterung finden Sie hier in unserer Dokumentation zur Beschreibung von Kategorien und Schweregraden.

Die gesamte Sicherheit kann konfiguriert werden. Weitere Informationen zur Konfigurierbarkeit finden Sie in unserer Dokumentation zum Konfigurieren der Inhaltsfilterung.

Textmodelle: GPT-4, GPT-3.5

Textmodelle in Azure OpenAI Service können sowohl Text als auch Code erfassen und generieren. Diese Modelle nutzen die Textinhaltsfiltermodelle von Azure, um schädliche Inhalte zu erkennen und zu vermeiden. Dieses System funktioniert sowohl beim Prompt als auch bei der Vervollständigung.

Risikokategorie	Eingabeaufforderung/Abschluss	Schwellenwert für den Schweregrad
Hass und Fairness	Prompts und Vervollständigungen	Medium
Gewalt	Prompts und Vervollständigungen	Medium
Sexuell	Prompts und Vervollständigungen	Medium
Selbstverletzung	Prompts und Vervollständigungen	Medium
Einschleusungsangriff durch Benutzerprompts (Jailbreak)	Eingabeaufforderungen	N/V
Geschütztes Material – Text	Vervollständigungen	N/V
Geschütztes Material – Code	Vervollständigungen	N/V

Vision-Modelle: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o und GPT-4 Turbo

Risikokategorie	Eingabeaufforderung/Abschluss	Schwellenwert für den Schweregrad
Hass und Fairness	Prompts und Vervollständigungen	Medium
Gewalt	Prompts und Vervollständigungen	Medium
Sexuell	Prompts und Vervollständigungen	Medium
Selbstverletzung	Prompts und Vervollständigungen	Medium
Identifizierung von Einzelpersonen und Rückschlüsse vertraulicher Attribute	Eingabeaufforderungen	N/V
Einschleusungsangriff durch Benutzerprompts (Jailbreak)	Eingabeaufforderungen	N/V

DALL-E 3 und DALL-E 2

Risikokategorie	Eingabeaufforderung/Abschluss	Schwellenwert für den Schweregrad
Hass und Fairness	Prompts und Vervollständigungen	Niedrig
Gewalt	Prompts und Vervollständigungen	Niedrig
Sexuell	Prompts und Vervollständigungen	Niedrig
Selbstverletzung	Prompts und Vervollständigungen	Niedrig
Inhaltsnachweise	Vervollständigungen	N/V
Täuschendes Generieren politischer Kandidaten	Eingabeaufforderungen	N/V
Darstellungen von Personen des öffentlichen Lebens	Eingabeaufforderungen	N/V
Einschleusungsangriff durch Benutzerprompts (Jailbreak)	Eingabeaufforderungen	N/V
Geschütztes Material – Kunst und Studio-Charaktere	Eingabeaufforderungen	N/V
Anstößige Ausdrücke	Eingabeaufforderungen	N/V

Zusätzlich zu den oben genannten Sicherheitskonfigurationen bietet Azure OpenAI DALL-E standardmäßig auch die Prompttransformation. Diese Transformation wird für alle Prompts durchgeführt, um die Sicherheit Ihrer ursprünglichen Prompts zu verbessern, insbesondere in den Risikokategorien Vielfalt, täuschendes Generieren politischer Kandidaten, Darstellungen von Personen des öffentlichen Lebens, geschützte Materialien und andere.

Freigeben über

Standardrichtlinien für die Inhaltssicherheit

Textmodelle: GPT-4, GPT-3.5

Vision-Modelle: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o und GPT-4 Turbo

DALL-E 3 und DALL-E 2

Feedback

Zusätzliche Ressourcen