Tartalomszűrők konfigurálása az Azure OpenAI szolgáltatásban
Az Azure OpenAI Service-be integrált tartalomszűrési rendszer az alapvető modellek mellett fut, beleértve a DALL-E képgenerálási modelleket is. Többosztályos besorolási modellek együttesével négy súlyossági szinten (biztonságos, alacsony, közepes és magas) észleli a káros tartalmak négy kategóriáját (erőszak, gyűlölet, szexuális és önkárosító), valamint választható bináris osztályozókat a jailbreak kockázatának, a meglévő szövegnek és a kódnak a nyilvános adattárakban való észleléséhez. Az alapértelmezett tartalomszűrési konfiguráció úgy van beállítva, hogy mind a négy tartalomkárosítási kategória esetén közepes súlyossági küszöbértéknél szűrjön mind a felhívások, mind az elvégzések tekintetében. Ez azt jelenti, hogy a közepes vagy magas súlyossági szinten észlelt tartalom szűrve van, míg az alacsony vagy biztonságos súlyossági szinten észlelt tartalmakat a tartalomszűrők nem szűrik. Itt további információt talál a tartalomkategóriákról, a súlyossági szintekről és a tartalomszűrő rendszer viselkedéséről. A jailbreak-kockázatészlelés és a védett szöveg- és kódmodellek alapértelmezés szerint nem kötelezőek és ki vannak kapcsolva. A jailbreak és a védett anyagszöveg- és kódmodellek esetében a konfigurálhatósági funkció lehetővé teszi, hogy minden ügyfél be- és kikapcsolja a modelleket. A modellek alapértelmezés szerint ki vannak kapcsolva, és a forgatókönyv szerint be is kapcsolhatók. Bizonyos modelleknek be kell kapcsolniuk bizonyos forgatókönyveket, hogy megőrizzék a lefedettséget az ügyfél szerzői jogi kötelezettségvállalása alapján.
Megjegyzés
Minden ügyfélnek lehetősége van módosítani a tartalomszűrőket és konfigurálni a súlyossági küszöbértékeket (alacsony, közepes és magas). A tartalomszűrők részleges vagy teljes kikapcsolásához jóváhagyás szükséges. Csak a felügyelt ügyfelek igényelhetik a tartalomszűrés fölötti teljes ellenőrzést ezen az űrlapon keresztül: Azure OpenAI korlátozott hozzáférés felülvizsgálata: módosított tartalomszűrők. Jelenleg nem lehet felügyelt ügyfélré válni.
A tartalomszűrők az erőforrás szintjén konfigurálhatók. Az új konfiguráció létrehozása után egy vagy több üzembe helyezéshez társítható. A modellek üzembe helyezéséről a modellek üzembe helyezésének ismertetőjében talál további információt.
- A tartalomszűrők konfigurálásához Rendelkeznie kell egy Azure OpenAI-erőforrással és egy nagy nyelvi modell (LLM) üzembe helyezésével. Az első lépésekhez kövesse a rövid útmutatót.
Az Azure OpenAI Szolgáltatás az összes modellre alkalmazott alapértelmezett biztonsági beállításokat tartalmazza, az Azure OpenAI Whisper kivételével. Ezek a konfigurációk alapértelmezés szerint felelősségteljes felhasználói élményt nyújtanak, beleértve a tartalomszűrési modelleket, a tiltólistákat, a parancssori átalakítást, a tartalom hitelesítő adatait és másokat. Erről itt olvashat bővebben.
Minden ügyfél konfigurálhatja a tartalomszűrőket, és egyéni biztonsági szabályzatokat hozhat létre, amelyek a használati eset követelményeinek megfelelően vannak kialakítva. A konfigurálhatósági funkció lehetővé teszi az ügyfelek számára, hogy külön módosítják a beállításokat a kérések és a kiegészítések esetében, hogy az egyes tartalomkategóriák tartalmát különböző súlyossági szinteken szűrik az alábbi táblázatban leírtak szerint. A "biztonságos" súlyossági szinten észlelt tartalom széljegyzetekben van megjelölve, de szűrésre nem vonatkozik, és nem konfigurálható.
Súlyosság szűrve | A kérésekhez konfigurálható | Befejezésekhez konfigurálható | Leírások |
---|---|---|---|
Alacsony, közepes, magas | Igen | Igen | A legszigorúbb szűrési konfiguráció. A rendszer szűri az alacsony, közepes és magas súlyossági szinteken észlelt tartalmakat. |
Közepes, magas | Igen | Igen | Az alacsony súlyosságú tartalom nem szűrt, a közepes és a magas szintű tartalmak szűrve lesznek. |
Magas | Igen | Igen | Az alacsony és közepes súlyossági szinteken észlelt tartalom nincs szűrve. A rendszer csak a magas súlyosságú tartalmakat szűri. |
Nincsenek szűrők | Ha jóváhagyták1 | Ha jóváhagyták1 | A rendszer a súlyossági szinttől függetlenül nem szűri a tartalmat. Jóváhagyást igényel 1. |
Csak jegyzetelés | Ha jóváhagyták1 | Ha jóváhagyták1 | Letiltja a szűrőfunkciókat, így a tartalom nem lesz letiltva, de a széljegyzetek API-válaszon keresztül lesznek visszaadva. Jóváhagyást igényel 1. |
1 Az Azure OpenAI-modellek esetében csak a módosított tartalomszűréshez jóváhagyott ügyfelek rendelkeznek teljes tartalomszűrési vezérlővel, és kikapcsolhatják a tartalomszűrőket. A módosított tartalomszűrőkre az alábbi űrlapon jelentkezhet: Azure OpenAI Korlátozott hozzáférésű felülvizsgálat: Módosított tartalomszűrők. Az Azure Government-ügyfelek a módosított tartalomszűrőkre az alábbi űrlapon jelentkezhetnek: Azure Government – Módosított tartalomszűrés kérése az Azure OpenAI szolgáltatáshoz.
A bemenetekhez (parancssorokhoz) és kimenetekhez (befejezésekhez) konfigurálható tartalomszűrők az alábbi Azure OpenAI-modellekhez érhetők el:
- GPT-modellsorozat
- GPT-4 Turbo Vision GA* (
turbo-2024-04-09
) - GPT-4o
- GPT-4o mini
- DALL-E 2 és 3
A konfigurálható tartalomszűrők nem érhetők el
- o1-preview
- o1-mini
*Csak a GPT-4 Turbo Vision GA-hoz érhető el, a GPT-4 Turbo Vision előzetes verziójára nem vonatkozik
A tartalomszűrési konfigurációk egy Azure AI Studio-erőforráson belül jönnek létre, és az üzembe helyezésekkel társíthatók. A konfigurálhatóságról itt talál további információt.
Az ügyfelek feladata annak biztosítása, hogy az Azure OpenAI-t integráló alkalmazások megfeleljenek a magatartási kódexnek.
Az alapértelmezett kárkategória-szűrők mellett az alábbi szűrőkategóriákat is konfigurálhatja.
Kategória szűrése | Állapot | Alapértelmezett beállítás | A kérésre vagy a befejezésre alkalmazva? | Leírás |
---|---|---|---|---|
Parancssori pajzsok közvetlen támadásokhoz (jailbreak) | FE | Be | Felhasználói kérés | Szűrők/ széljegyzetek olyan felhasználói kéréseket jelenít meg, amelyek Jailbreak-kockázatot jelenthetnek. A széljegyzetekkel kapcsolatos további információkért látogasson el az Azure OpenAI Szolgáltatás tartalomszűrési webhelyére. |
Pajzsok indirekt támadásokra való kérése | FE | Be | Felhasználói kérés | A közvetett támadások szűrése/ jegyzetelése, más néven közvetett parancssori támadások vagy tartományközi parancssori injektálási támadások, egy lehetséges biztonsági rés, amely miatt harmadik felek rosszindulatú utasításokat helyeznek el a dokumentumokon belül, amelyeket a generatív AI-rendszer hozzáférhet és feldolgozhat. Kötelező: Dokumentumformázás . |
Védett anyag – kód | FE | Be | Teljesítés | Szűri a védett kódot, vagy a GitHub Copilot által működtetett bármely nyilvános kódforrásnak megfelelő kódrészletek jegyzeteiben lekéri a példa idézőjeleket és licencinformációkat. A széljegyzetek felhasználásával kapcsolatos további információkért tekintse meg a tartalomszűrési fogalmakat ismertető útmutatót |
Védett anyag – szöveg | FE | Be | Teljesítés | Azonosítja és letiltja az ismert szöveges tartalmak megjelenítését a modell kimenetében (például dalszövegek, receptek és kijelölt webes tartalom). |
Földiesség* | Előnézet | Kikapcsolva | Teljesítés | Észleli, hogy a nagy nyelvi modellek (LLM-ek) szöveges válaszai a felhasználók által biztosított forrásanyagokban vannak-e alapulva. A rendezetlenség olyan példányokra utal, ahol az LLM-ek olyan információkat hoznak létre, amelyek nem tényszerűek vagy pontatlanok a forrásanyagokban található információkból. |
*Dokumentumokat kell beágyazni a parancssorba. További információ.
Az alábbi lépések bemutatják, hogyan állíthat be testreszabott tartalomszűrési konfigurációt az Azure OpenAI-erőforráshoz az AI Studióban. Az Azure AI Studio-projekt tartalomszűrőivel kapcsolatos útmutatásért az Azure AI Studio tartalomszűrésében olvashat bővebben.
Nyissa meg az Azure AI Studiót, és keresse meg a bal oldali menü Biztonság + biztonsági oldalát.
Lépjen a Tartalomszűrők lapra, és hozzon létre egy új testreszabott tartalomszűrési konfigurációt.
Ez a következő konfigurációs nézethez vezet, ahol kiválaszthatja az egyéni tartalomszűrési konfiguráció nevét. A név megadása után konfigurálhatja a bemeneti szűrőket (a felhasználói kérésekhez) és a kimeneti szűrőket (a modell befejezéséhez).
Az első négy tartalomkategória esetében három súlyossági szint konfigurálható: Alacsony, közepes és magas. A csúszkákkal beállíthatja a súlyossági küszöbértéket, ha megállapítja, hogy az alkalmazás vagy a használati forgatókönyv más szűrést igényel, mint az alapértelmezett értékek.
Egyes szűrők, például a Prompt Shields és a védett anyagészlelés lehetővé teszik annak megállapítását, hogy a modellnek széljegyzeteket kell-e fűznie és/vagy letiltania a tartalmat. A Széljegyzet kiválasztása csak a megfelelő modellt futtatja, és API-válaszon keresztül ad vissza széljegyzeteket, de nem szűri a tartalmat. A széljegyzetek mellett a tartalom blokkolását is választhatja.
Ha a használati esetet jóváhagyták a módosított tartalomszűrőkhöz, teljes mértékben szabályozhatja a tartalomszűrési konfigurációkat, és dönthet úgy, hogy részlegesen vagy teljesen kikapcsolja a szűrést, vagy csak a tartalomkárosító kategóriák (erőszak, gyűlölet, szexuális és önkárosítás) esetén engedélyezi a megjegyzéseket.
A követelményeknek megfelelően több tartalomszűrési konfigurációt is létrehozhat.
Ezután egy egyéni tartalomszűrési konfiguráció használatához rendelje hozzá egy vagy több üzembe helyezéshez az erőforrásban. Ehhez lépjen az Üzembe helyezés lapra, és válassza ki az üzembe helyezést. Ezután válassza az Edit (Szerkesztés) elemet.
A megjelenő Frissítés üzembehelyezési ablakban válassza ki az egyéni szűrőt a Tartalomszűrő legördülő menüből. Ezután válassza a Mentés és a Közel lehetőséget a kiválasztott konfiguráció központi telepítésre való alkalmazásához.
Szükség esetén szerkesztheti és törölheti is a tartalomszűrő konfigurációját.
Mielőtt törölné a tartalomszűrési konfigurációt, le kell bontania és le kell cserélnie azt a Központi telepítések lapon található bármely üzembe helyezésről.
Ha tartalomszűrési problémát tapasztal, válassza a Visszajelzés küldése gombot a játszótér tetején. Ez engedélyezve van a Képek, Csevegés és Befejezések játszótéren.
Amikor megjelenik a párbeszédpanel, válassza ki a megfelelő tartalomszűrési problémát. Adja meg a tartalomszűréssel kapcsolatos lehető legrészletesebb információkat, például a megadott parancssori és tartalomszűrési hibát. Ne adjon meg bizalmas vagy bizalmas információkat.
Támogatásért küldjön támogatási jegyet.
Javasoljuk, hogy a tartalomszűrési konfigurációs döntéseket iteratív azonosítással (például vörös csapat tesztelésével, stresszteszteléssel és elemzéssel) és mérési folyamattal tájékoztassa, hogy elhárítsa az adott modell, alkalmazás és üzembe helyezési forgatókönyv szempontjából releváns lehetséges károkat. Az olyan kockázatcsökkentések implementálása után, mint a tartalomszűrés, ismételje meg a mérést a hatékonyság teszteléséhez. Az Azure OpenAI felelős AI-jának ajánlásai és ajánlott eljárásai a Microsoft Responsible AI Standardban találhatók az Azure OpenAI felelős AI-áttekintésében.
- További információ az Azure OpenAI felelős AI-eljárásairól: Az Azure OpenAI-modellek felelős AI-eljárásainak áttekintése.
- További információ a tartalomszűrési kategóriákról és súlyossági szintekről az Azure OpenAI Szolgáltatással.
- További információ a vörös összevonásról a következő cikkünkből: Bevezetés a vörös összevonási nagy nyelvi modellek (LLM-ek) című cikkünkből.