Standardrichtlinien für die Inhaltssicherheit
Azure OpenAI Service umfasst Standardsicherheit, die auf alle Modelle angewendet wird, mit Ausnahme von Azure OpenAI Whisper. Diese Konfigurationen bieten Ihnen standardmäßig eine verantwortungsvolle Umgebung, die Inhaltsfiltermodelle, Blockierlisten, Prompttransformation, Inhaltsanmeldeinformationen und mehr enthält.
Die Standardsicherheit zielt darauf ab, Risiken in Bezug auf Hass und Fairness, sexuelle Inhalte, Gewalt, Selbstverletzungen, geschützte Materialinhalte und Einschleusungsangriffe durch Benutzerprompts zu mindern. Weitere Informationen zur Inhaltsfilterung finden Sie hier in unserer Dokumentation zur Beschreibung von Kategorien und Schweregraden.
Die gesamte Sicherheit kann konfiguriert werden. Weitere Informationen zur Konfigurierbarkeit finden Sie in unserer Dokumentation zum Konfigurieren der Inhaltsfilterung.
Textmodelle: GPT-4, GPT-3.5
Textmodelle in Azure OpenAI Service können sowohl Text als auch Code erfassen und generieren. Diese Modelle nutzen die Textinhaltsfiltermodelle von Azure, um schädliche Inhalte zu erkennen und zu vermeiden. Dieses System funktioniert sowohl beim Prompt als auch bei der Vervollständigung.
Risikokategorie | Eingabeaufforderung/Abschluss | Schwellenwert für den Schweregrad |
---|---|---|
Hass und Fairness | Prompts und Vervollständigungen | Medium |
Gewalt | Prompts und Vervollständigungen | Medium |
Sexuell | Prompts und Vervollständigungen | Medium |
Selbstverletzung | Prompts und Vervollständigungen | Medium |
Einschleusungsangriff durch Benutzerprompts (Jailbreak) | Eingabeaufforderungen | N/V |
Geschütztes Material – Text | Vervollständigungen | N/V |
Geschütztes Material – Code | Vervollständigungen | N/V |
Vision-Modelle: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2
GPT-4o und GPT-4 Turbo
Risikokategorie | Eingabeaufforderung/Abschluss | Schwellenwert für den Schweregrad |
---|---|---|
Hass und Fairness | Prompts und Vervollständigungen | Medium |
Gewalt | Prompts und Vervollständigungen | Medium |
Sexuell | Prompts und Vervollständigungen | Medium |
Selbstverletzung | Prompts und Vervollständigungen | Medium |
Identifizierung von Einzelpersonen und Rückschlüsse vertraulicher Attribute | Eingabeaufforderungen | N/V |
Einschleusungsangriff durch Benutzerprompts (Jailbreak) | Eingabeaufforderungen | N/V |
DALL-E 3 und DALL-E 2
Risikokategorie | Eingabeaufforderung/Abschluss | Schwellenwert für den Schweregrad |
---|---|---|
Hass und Fairness | Prompts und Vervollständigungen | Niedrig |
Gewalt | Prompts und Vervollständigungen | Niedrig |
Sexuell | Prompts und Vervollständigungen | Niedrig |
Selbstverletzung | Prompts und Vervollständigungen | Niedrig |
Inhaltsnachweise | Vervollständigungen | N/V |
Täuschendes Generieren politischer Kandidaten | Eingabeaufforderungen | N/V |
Darstellungen von Personen des öffentlichen Lebens | Eingabeaufforderungen | N/V |
Einschleusungsangriff durch Benutzerprompts (Jailbreak) | Eingabeaufforderungen | N/V |
Geschütztes Material – Kunst und Studio-Charaktere | Eingabeaufforderungen | N/V |
Anstößige Ausdrücke | Eingabeaufforderungen | N/V |
Zusätzlich zu den oben genannten Sicherheitskonfigurationen bietet Azure OpenAI DALL-E standardmäßig auch die Prompttransformation. Diese Transformation wird für alle Prompts durchgeführt, um die Sicherheit Ihrer ursprünglichen Prompts zu verbessern, insbesondere in den Risikokategorien Vielfalt, täuschendes Generieren politischer Kandidaten, Darstellungen von Personen des öffentlichen Lebens, geschützte Materialien und andere.