Standard-Guardrail-Richtlinien für Azure OpenAI (klassisch)

Zurzeit wird folgendes angezeigt:Foundry (klassische) Portalversion - Wechseln zur Version für das neue Foundry-Portal

Azure OpenAI in Foundry Models enthält Standardsicherheitsrichtlinien, die auf alle Modelle angewendet werden (ausgenommen Azure OpenAI Whisper). Diese Konfigurationen bieten Ihnen standardmäßig eine verantwortungsvolle Oberfläche, einschließlich Inhaltsfiltermodelle, Blocklisten, Aufforderungstransformation, Inhaltsanmeldeinformationen und anderen Features.

Die Standardsicherheitsmaßnahmen zielen darauf ab, Risiken in verschiedenen Kategorien wie Hass und Fairness, Sexualität, Gewalt, Selbstverletzung, geschützte Inhalte und Benutzer-Prompt-Injection-Angriffe zu mindern. Weitere Informationen zur Inhaltsfilterung finden Sie in unserer Dokumentation zur Beschreibung von Kategorien und Schweregraden.

Alle Sicherheitsrichtlinien sind konfigurierbar. Weitere Informationen zur Konfigurierbarkeit finden Sie in der Dokumentation zum Konfigurieren der Inhaltsfilterung.

Textmodelle

Textmodelle in der Azure OpenAI können sowohl Text als auch Code generieren. Diese Modelle nutzen Azure Textinhaltsfilter, um schädliche Inhalte zu erkennen und zu verhindern. Dieses System funktioniert sowohl bei Eingabeaufforderungen als auch bei Abschlussen.

Risikokategorie Eingabeaufforderung/Vervollständigung Schweregradschwellenwert
Hass und Fairness Aufforderungen und Fertigstellungen Mittel
Gewalt Aufforderungen und Fertigstellungen Mittel
Sexuelle Aufforderungen und Fertigstellungen Mittel
Selbstverletzung Aufforderungen und Fertigstellungen Mittel
Benutzer-Prompt-Injection-Angriff (Jailbreak) Aufforderungen N/A
Geschütztes Material – Text Fertigstellungen N/A
Geschütztes Material – Code Fertigstellungen N/A

Visionsmodelle

Vision-fähige Chatmodelle

Risikokategorie Eingabeaufforderung/Vervollständigung Schweregradschwellenwert
Hass und Fairness Aufforderungen und Fertigstellungen Mittel
Gewalt Aufforderungen und Fertigstellungen Mittel
Sexuelle Aufforderungen und Fertigstellungen Mittel
Selbstverletzung Aufforderungen und Fertigstellungen Mittel
Identifizierung von Einzelpersonen und Ableitung sensibler Attribute Aufforderungen N/A
Benutzer-Prompt-Injection-Angriff (Jailbreak) Aufforderungen N/A

Modelle der Bildgenerierung

Risikokategorie Eingabeaufforderung/Vervollständigung Schweregradschwellenwert
Hass und Fairness Aufforderungen und Fertigstellungen Mittel
Gewalt Aufforderungen und Fertigstellungen Mittel
Sexuelle Aufforderungen und Fertigstellungen Mittel
Selbstverletzung Aufforderungen und Fertigstellungen Mittel
Inhaltsnachweise Fertigstellungen N/A
Täuschende Generation politischer Kandidaten Aufforderungen N/A
Darstellungen öffentlicher Figuren Aufforderungen N/A
Benutzer-Prompt-Injection-Angriff (Jailbreak) Aufforderungen N/A
Geschütztes Material – Kunst- und Studiofiguren Aufforderungen N/A
Profanität Aufforderungen N/A

Audiomodelle

Risikokategorie Eingabeaufforderung/Vervollständigung Schweregradschwellenwert
Hass und Fairness Aufforderungen und Fertigstellungen Mittel
Gewalt Aufforderungen und Fertigstellungen Mittel
Sexuelle Aufforderungen und Fertigstellungen Mittel
Selbstverletzung Aufforderungen und Fertigstellungen Mittel
Benutzer-Prompt-Injection-Angriff (Jailbreak) Aufforderungen N/A
Geschütztes Material - Text Fertigstellungen N/A
Geschütztes Material - Code Fertigstellungen N/A