Megosztás a következőn keresztül:


Tartalomszűrők konfigurálása az Azure OpenAI Szolgáltatással

Feljegyzés

Minden ügyfél módosíthatja a tartalomszűrőket, és konfigurálhatja a súlyossági küszöbértékeket (alacsony, közepes és magas). Jóváhagyás szükséges a tartalomszűrők részleges vagy teljes kikapcsolásához. A felügyelt ügyfelek csak ezen az űrlapon keresztül igényelhetnek teljes tartalomszűrési vezérlést: Azure OpenAI Korlátozott hozzáférésű felülvizsgálat: Módosított tartalomszűrők. Jelenleg nem lehet felügyelt ügyfélré válni.

Az Azure OpenAI Service-be integrált tartalomszűrési rendszer az alapvető modellek mellett fut, beleértve a DALL-E képgenerálási modelleket is. Többosztályos besorolási modellek együttesével négy súlyossági szinten (biztonságos, alacsony, közepes és magas) észleli a káros tartalmak négy kategóriáját (erőszak, gyűlölet, szexuális és önkárosító), valamint választható bináris osztályozókat a jailbreak kockázatának, a meglévő szövegnek és a kódnak a nyilvános adattárakban való észleléséhez. Az alapértelmezett tartalomszűrési konfiguráció úgy van beállítva, hogy mind a négy tartalomkárosítási kategória közepes súlyossági küszöbértékén szűrjön mind a kérések, mind a befejezések esetében. Ez azt jelenti, hogy a közepes vagy magas súlyossági szinten észlelt tartalom szűrve van, míg az alacsony vagy biztonságos súlyossági szinten észlelt tartalmakat a tartalomszűrők nem szűrik. Itt további információt talál a tartalomkategóriákról, a súlyossági szintekről és a tartalomszűrő rendszer viselkedéséről. A jailbreak-kockázatészlelés és a védett szöveg- és kódmodellek alapértelmezés szerint nem kötelezőek és ki vannak kapcsolva. A jailbreak és a védett anyagszöveg- és kódmodellek esetében a konfigurálhatósági funkció lehetővé teszi, hogy minden ügyfél be- és kikapcsolja a modelleket. A modellek alapértelmezés szerint ki vannak kapcsolva, és a forgatókönyv szerint be is kapcsolhatók. Bizonyos modelleknek be kell kapcsolniuk bizonyos forgatókönyveket, hogy megőrizzék a lefedettséget az ügyfél szerzői jogi kötelezettségvállalása alapján.

A tartalomszűrők erőforrásszinten konfigurálhatók. Az új konfiguráció létrehozása után egy vagy több üzembe helyezéshez társítható. A modellek üzembe helyezéséről a modellek üzembe helyezésének ismertetőjében talál további információt.

A konfigurálhatósági funkció előzetes verzióban érhető el, és lehetővé teszi az ügyfelek számára, hogy külön módosítják a beállításokat a kérések és befejezések esetében, hogy az egyes tartalomkategóriák tartalmát különböző súlyossági szinteken szűrik az alábbi táblázatban leírtak szerint. A "biztonságos" súlyossági szinten észlelt tartalom széljegyzetekben van megjelölve, de szűrésre nem vonatkozik, és nem konfigurálható.

Súlyosság szűrve A kérésekhez konfigurálható Befejezésekhez konfigurálható Leírások
Alacsony, közepes, magas Igen Igen A legszigorúbb szűrési konfiguráció. A rendszer szűri az alacsony, közepes és magas súlyossági szinteken észlelt tartalmakat.
Közepes, magas Igen Igen Alapértelmezett beállítás. Az alacsony súlyosságú tartalom nem szűrt, a közepes és a magas szintű tartalmak szűrve lesznek.
Magas Igen Igen Az alacsony és közepes súlyossági szinteken észlelt tartalom nincs szűrve. A rendszer csak a magas súlyosságú tartalmakat szűri.
Nincsenek szűrők Ha jóváhagyták* Ha jóváhagyták* A rendszer a súlyossági szinttől függetlenül nem szűri a tartalmat. Jóváhagyást* igényel.

* Csak a jóváhagyott ügyfelek rendelkeznek teljes tartalomszűrési vezérlővel, és részlegesen vagy teljesen kikapcsolhatják a tartalomszűrőket. A felügyelt ügyfelek csak a teljes tartalomszűrési vezérlőre jelentkezhetnek ezen az űrlapon keresztül: Azure OpenAI Korlátozott hozzáférésű felülvizsgálat: Módosított tartalomszűrők. Jelenleg nem lehet felügyelt ügyfélré válni.

Az ügyfelek feladata annak biztosítása, hogy az Azure OpenAI-t integráló alkalmazások megfeleljenek a magatartási kódexnek.

Kategória szűrése Alapértelmezett beállítás A kérésre vagy a befejezésre alkalmazva? Leírás
Jailbreak-kockázatészlelés Kikapcsolva Felszólítás Bekapcsolható a Jailbreak-kockázatot jelentő felhasználói kérések szűrése vagy jegyzetelése. A széljegyzetek felhasználásával kapcsolatos további információkért látogasson el az Azure OpenAI Szolgáltatás tartalomszűrési webhelyére
Védett anyag – kód kikapcsolva Befejezése A példa idézőjelek és licencinformációk a nyilvános kódforrásoknak megfelelő kódrészletek széljegyzeteiben való lekéréséhez kapcsolhatók be. A széljegyzetek felhasználásával kapcsolatos további információkért tekintse meg a tartalomszűrési fogalmakat ismertető útmutatót
Védett anyag – szöveg kikapcsolva Befejezése Bekapcsolható, hogy azonosítsa és letiltsa az ismert szöveges tartalmak megjelenítését a modell kimenetében (például dalszövegek, receptek és kijelölt webes tartalom).

Tartalomszűrők konfigurálása az Azure OpenAI Studióval (előzetes verzió)

Az alábbi lépések bemutatják, hogyan állíthat be egyéni tartalomszűrési konfigurációt az erőforráshoz.

  1. Nyissa meg az Azure OpenAI Studiót, és lépjen a Tartalomszűrők lapra (a bal alsó navigációs sávon, az alábbi piros mező által kijelölt módon).

    Képernyőkép az AI Studio felhasználói felületéről, kiemelt tartalomszűrőkkel

  2. Hozzon létre egy új testreszabott tartalomszűrési konfigurációt.

    Képernyőkép a tartalomszűrési konfiguráció felhasználói felületéről a kijelölt létrehozással

    Ez a következő konfigurációs nézethez vezet, ahol kiválaszthatja az egyéni tartalomszűrési konfiguráció nevét.

    Képernyőkép a tartalomszűrési konfiguráció felhasználói felületéről

  3. Ez az alapértelmezett tartalomszűrési konfiguráció nézete, ahol a tartalom szűrése közepes és nagy súlyosságú szinten történik minden kategóriához. A tartalomszűrés súlyossági szintjét külön módosíthatja mind a felhasználói kérések, mind a modellkiegészítések esetében (a kérések konfigurációja a bal oldali oszlopban van, a befejezések konfigurációja pedig a jobb oszlopban, az alábbi kék mezőkkel jelölve) mind a négy tartalomkategóriához (a tartalomkategóriák a képernyő bal oldalán jelennek meg, az alábbi zöld mezővel jelölve). A konfigurálható kategóriákhoz három súlyossági szint tartozik: alacsony, közepes és magas. A csúszkával beállíthatja a súlyossági küszöbértéket.

    Képernyőkép a tartalomszűrési konfiguráció felhasználói felületéről, kiemelt felhasználói kérésekkel és modellkiegészítésekkel

  4. Ha úgy ítéli meg, hogy az alkalmazás vagy a használati forgatókönyv egyes vagy az összes tartalomkategóriára szigorúbb szűrést igényel, a beállításokat külön konfigurálhatja a kérések és befejezések esetében, hogy az alapértelmezett beállításnál nagyobb súlyossági szinten szűrjön. Az alábbi képen egy példa látható, ahol a felhasználói kérések szűrési szintje a legszigorúbb konfigurációra van beállítva a gyűlölet és a szexuális tartalom esetében, az alacsony súlyosságú tartalmak szűrésével, valamint a közepes és nagy súlyosságú (az alábbi piros mezőben látható) besorolással. A példában a modellkiegészítések szűrési szintjei az összes tartalomkategória legszigorúbb konfigurációjában vannak beállítva (az alábbi kék mező). Ezzel a módosított szűrési konfigurációval az alacsony, közepes és nagy súlyosságú tartalmak szűrve lesznek a felhasználói kérések gyűlölet- és szexuális kategóriáira; a közepes és nagy súlyosságú tartalmakat szűrjük az önkárosítás és az erőszak kategóriáira a felhasználói kérésekben; és az alacsony, közepes és nagy súlyosságú tartalmak a modellkizárások összes tartalomkategóriája esetében szűrve lesznek.

    Képernyőkép a tartalomszűrési konfigurációról alacsony, közepes, magas, kiemelt beállításokkal.

  5. Ha a használati esetet a fent ismertetett módon módosított tartalomszűrőkre hagyta jóvá, teljes mértékben szabályozhatja a tartalomszűrési konfigurációkat, és dönthet úgy, hogy részben vagy teljesen kikapcsolja a szűrést. Az alábbi képen a szűrés ki van kapcsolva erőszak esetén (zöld mező alább), míg az alapértelmezett konfigurációk megmaradnak más kategóriák esetében. Bár ez letiltotta az erőszak szűrési funkcióját, a tartalom továbbra is széljegyzetet kap. Ha ki szeretné kapcsolni az összes szűrőt és széljegyzetet, kapcsolja ki a Szűrők és széljegyzetek elemet (az alábbi piros mező).

    Képernyőkép a tartalomszűrési konfigurációról, amelyen az önkárosítás és az erőszak ki van kapcsolva.

    A követelményeknek megfelelően több tartalomszűrési konfigurációt is létrehozhat.

  6. Az opcionális modellek bekapcsolásához a bal oldalon bármelyik jelölőnégyzetet kijelölheti. Ha minden választható modell be van kapcsolva, jelezheti, hogy a modellnek széljegyzetet vagy szűrőt kell-e használnia.

  7. A széljegyzet kiválasztása futtatja a megfelelő modellt, és API-válaszon keresztül ad vissza széljegyzeteket, de nem szűri a tartalmat. A széljegyzetek mellett a tartalom szűrését is választhatja a Szűrő kapcsoló bekapcsolásával.

  8. A követelményeknek megfelelően több tartalomszűrési konfigurációt is létrehozhat.

    Képernyőkép több tartalomkonfigurációról az Azure Portalon.

  9. Ezután egy egyéni tartalomszűrési konfiguráció üzembe helyezéséhez rendeljen hozzá egy konfigurációt az erőforrás egy vagy több üzembe helyezéséhez. Ehhez lépjen a Központi telepítés lapra, és válassza az Üzembe helyezés szerkesztése lehetőséget (a képernyő tetején, az alábbi piros mezőben látható) elemet.

    Képernyőkép a tartalomszűrési konfigurációról, kiemelt szerkesztési üzembe helyezéssel.

  10. Nyissa meg a speciális beállításokat (az alábbi kék mezőben körvonalazva) válassza ki az adott üzembe helyezéshez megfelelő tartalomszűrő-konfigurációt a Tartalomszűrő legördülő menüből (a párbeszédpanel alján, az alábbi piros mezőben).

    Képernyőkép az üzembehelyezési konfiguráció szerkesztéséről a speciális beállítások kiválasztásával.

  11. Válassza a Mentés és a Közel lehetőséget a kiválasztott konfiguráció központi telepítésre való alkalmazásához.

    Képernyőkép az üzembehelyezési konfiguráció szerkesztéséről a kijelölt tartalomszűrővel.

  12. Szükség esetén szerkesztheti és törölheti is a tartalomszűrő konfigurációját. Ehhez lépjen a Tartalomszűrők lapra, és válassza ki a kívánt műveletet (az alábbi piros mezőben a képernyő tetején látható beállítások). Egyszerre csak egy szűrési konfigurációt szerkeszthet/törölhet.

    Képernyőkép a tartalomszűrő konfigurációjáról, kiemelt szerkesztéssel és törléssel.

    Feljegyzés

    Mielőtt törölné a tartalomszűrési konfigurációt, le kell bontania azt az Üzembe helyezés lap bármely központi telepítéséről.

Ajánlott eljárások

Javasoljuk, hogy a tartalomszűrési konfigurációs döntéseket iteratív azonosítással (például vörös csapat tesztelésével, stresszteszteléssel és elemzéssel) és mérési folyamattal tájékoztassa, hogy elhárítsa az adott modell, alkalmazás és üzembe helyezési forgatókönyv szempontjából releváns lehetséges károkat. Az olyan kockázatcsökkentések implementálása után, mint a tartalomszűrés, ismételje meg a mérést a hatékonyság teszteléséhez. Javaslatok és ajánlott eljárások az Azure OpenAI felelős AI-jénekA Microsoft Responsible AI Standard az Azure OpenAI felelős AI-áttekintésében található.

Következő lépések