Tartalomszűrők konfigurálása az Azure AI Foundryvel

Cikk
2025. 01. 30.

Az Azure AI Foundrybe integrált tartalomszűrési rendszer az alapmodellek mellett fut, beleértve a DALL-E képgenerálási modelleket is. Többosztályos besorolási modellek együttesével négy súlyossági szinten (biztonságos, alacsony, közepes és magas) észleli a káros tartalmak négy kategóriáját (erőszak, gyűlölet, szexuális és önkárosító), valamint választható bináris osztályozókat a jailbreak kockázatának, a meglévő szövegnek és a kódnak a nyilvános adattárakban való észleléséhez.

Az alapértelmezett tartalomszűrési konfiguráció úgy van beállítva, hogy mind a négy tartalomkárosítási kategória esetén közepes súlyossági küszöbértéknél szűrjön mind a felhívások, mind az elvégzések tekintetében. Ez azt jelenti, hogy a közepes vagy magas súlyossági szinten észlelt tartalom szűrve van, míg az alacsony vagy biztonságos súlyossági szinten észlelt tartalmakat a tartalomszűrők nem szűrik. Itt további információt talál a tartalomkategóriákról, a súlyossági szintekről és a tartalomszűrő rendszer viselkedéséről.

A jailbreak-kockázatészlelés és a védett szöveg- és kódmodellek alapértelmezés szerint nem kötelezőek és be vannak kapcsolva. A jailbreak és a védett anyagszöveg- és kódmodellek esetében a konfigurálhatósági funkció lehetővé teszi, hogy minden ügyfél be- és kikapcsolja a modelleket. A modellek alapértelmezés szerint be vannak kapcsolva, és esetenként kikapcsolhatók. Bizonyos modelleknek be kell kapcsolniuk bizonyos forgatókönyveket, hogy megőrizzék a lefedettséget az ügyfél szerzői jogi kötelezettségvállalása alapján.

Megjegyzés

Minden ügyfélnek lehetősége van módosítani a tartalomszűrőket és konfigurálni a súlyossági küszöbértékeket (alacsony, közepes és magas). A tartalomszűrők részleges vagy teljes kikapcsolásához jóváhagyás szükséges. Csak a felügyelt ügyfelek igényelhetik a tartalomszűrés fölötti teljes ellenőrzést ezen az űrlapon keresztül: Azure OpenAI korlátozott hozzáférés felülvizsgálata: módosított tartalomszűrők. Jelenleg nem lehet felügyelt ügyfélré válni.

A tartalomszűrők az erőforrás szintjén konfigurálhatók. Az új konfiguráció létrehozása után egy vagy több üzembe helyezéshez társítható. A modellek üzembe helyezéséről a modellek üzembe helyezésének ismertetőjében talál további információt.

Előfeltételek

A tartalomszűrők konfigurálásához Rendelkeznie kell egy Azure OpenAI-erőforrással és egy nagy nyelvi modell (LLM) üzembe helyezésével. Az első lépésekhez kövesse a rövid útmutatót.

A tartalomszűrő konfigurálhatóságának ismertetése

Az Azure OpenAI Szolgáltatás az összes modellre alkalmazott alapértelmezett biztonsági beállításokat tartalmazza, az Azure OpenAI Whisper kivételével. Ezek a konfigurációk alapértelmezés szerint felelősségteljes felhasználói élményt nyújtanak, beleértve a tartalomszűrési modelleket, a tiltólistákat, a parancssori átalakítást, a tartalom hitelesítő adatait és másokat. Erről itt olvashat bővebben.

Minden ügyfél konfigurálhatja a tartalomszűrőket, és egyéni biztonsági szabályzatokat hozhat létre, amelyek a használati eset követelményeinek megfelelően vannak kialakítva. A konfigurálhatósági funkció lehetővé teszi az ügyfelek számára, hogy külön módosítják a beállításokat a kérések és a kiegészítések esetében, hogy az egyes tartalomkategóriák tartalmát különböző súlyossági szinteken szűrik az alábbi táblázatban leírtak szerint. A "biztonságos" súlyossági szinten észlelt tartalom széljegyzetekben van megjelölve, de szűrésre nem vonatkozik, és nem konfigurálható.

Súlyosság szűrve	A kérésekhez konfigurálható	Befejezésekhez konfigurálható	Leírások
Alacsony, közepes, magas	Igen	Igen	A legszigorúbb szűrési konfiguráció. A rendszer szűri az alacsony, közepes és magas súlyossági szinteken észlelt tartalmakat.
Közepes, magas	Igen	Igen	Az alacsony súlyosságú tartalom nem szűrt, a közepes és a magas szintű tartalmak szűrve lesznek.
Magas	Igen	Igen	Az alacsony és közepes súlyossági szinteken észlelt tartalom nincs szűrve. A rendszer csak a magas súlyosságú tartalmakat szűri.
Nincsenek szűrők	Ha jóváhagyták¹	Ha jóváhagyták¹	A rendszer a súlyossági szinttől függetlenül nem szűri a tartalmat. ^{Jóváhagyást igényel 1}.
Csak jegyzetelés	Ha jóváhagyták¹	Ha jóváhagyták¹	Letiltja a szűrőfunkciókat, így a tartalom nem lesz letiltva, de a széljegyzetek API-válaszon keresztül lesznek visszaadva. ^{Jóváhagyást igényel 1}.

¹ Az Azure OpenAI-modellek esetében csak a módosított tartalomszűréshez jóváhagyott ügyfelek rendelkeznek teljes tartalomszűrési vezérlővel, és kikapcsolhatják a tartalomszűrőket. A módosított tartalomszűrőkre az alábbi űrlapon jelentkezhet: Azure OpenAI Korlátozott hozzáférésű felülvizsgálat: Módosított tartalomszűrők. Az Azure Government-ügyfelek a módosított tartalomszűrőkre az alábbi űrlapon jelentkezhetnek: Azure Government – Módosított tartalomszűrés kérése az Azure OpenAI szolgáltatáshoz.

A bemenetek (parancssorok) és kimenetek (befejezések) konfigurálható tartalomszűrői az összes Azure OpenAI-modellhez elérhetők.

A tartalomszűrési konfigurációk az Azure AI Foundry portál egyik erőforrásában jönnek létre, és az üzembe helyezésekhez társíthatók. A konfigurálhatóságról itt talál további információt.

Az ügyfelek feladata annak biztosítása, hogy az Azure OpenAI-t integráló alkalmazások megfeleljenek a magatartási kódexnek.

Egyéb szűrők ismertetése

Az alapértelmezett kárkategória-szűrők mellett az alábbi szűrőkategóriákat is konfigurálhatja.

Kategória szűrése	Állapot	Alapértelmezett beállítás	A kérésre vagy a befejezésre alkalmazva?	Leírás
Parancssori pajzsok közvetlen támadásokhoz (jailbreak)	FE	Be	Felhasználói kérés	Szűrők/ széljegyzetek olyan felhasználói kéréseket jelenít meg, amelyek Jailbreak-kockázatot jelenthetnek. A széljegyzetekkel kapcsolatos további információkért látogasson el az Azure AI Foundry tartalomszűrési webhelyére.
Pajzsok indirekt támadásokra való kérése	FE	Kikapcsolva	Felhasználói kérés	A közvetett támadások szűrése/ jegyzetelése, más néven közvetett parancssori támadások vagy tartományközi parancssori injektálási támadások, egy lehetséges biztonsági rés, amely miatt harmadik felek rosszindulatú utasításokat helyeznek el a dokumentumokon belül, amelyeket a generatív AI-rendszer hozzáférhet és feldolgozhat. Szükséges: Dokumentum beágyazása és formázása.
Védett anyag – kód	FE	Be	Teljesítés	Szűri a védett kódot, vagy a GitHub Copilot által működtetett bármely nyilvános kódforrásnak megfelelő kódrészletek jegyzeteiben lekéri a példa idézőjeleket és licencinformációkat. A széljegyzetek felhasználásával kapcsolatos további információkért tekintse meg a tartalomszűrési fogalmakat ismertető útmutatót
Védett anyag – szöveg	FE	Be	Teljesítés	Azonosítja és letiltja az ismert szöveges tartalmak megjelenítését a modell kimenetében (például dalszövegek, receptek és kijelölt webes tartalom).
Földiesség*	Előnézet	Kikapcsolva	Teljesítés	Észleli, hogy a nagy nyelvi modellek (LLM-ek) szöveges válaszai a felhasználók által biztosított forrásanyagokban vannak-e alapulva. A rendezetlenség olyan példányokra utal, ahol az LLM-ek olyan információkat hoznak létre, amelyek nem tényszerűek vagy pontatlanok a forrásanyagokban található információkból. Szükséges: Dokumentum beágyazása és formázása.

Tartalomszűrő létrehozása az Azure AI Foundryben

Az Azure AI Foundry bármely modelltelepítéséhez használhatja közvetlenül az alapértelmezett tartalomszűrőt, de érdemes lehet több vezérlést használnia. Például szigorúbbá vagy megengedhetőbbé teheti a szűrőt, vagy speciálisabb képességeket is engedélyezhet, például a parancssori pajzsokat és a védett anyagészlelést.

Tipp.

Az Azure AI Foundry-projekt tartalomszűrőivel kapcsolatos útmutatásért tekintse meg az Azure AI Foundry tartalomszűrését.

Tartalomszűrő létrehozásához kövesse az alábbi lépéseket:

Nyissa meg az Azure AI Foundryt , és keresse meg a projektet. Ezután válassza a Bal oldali menü Biztonság+ biztonsági oldalát, és válassza a Tartalomszűrők lapot.
Válassza a +Tartalomszűrő létrehozása lehetőséget.
Az Alapszintű információ lapon adja meg a tartalomszűrési konfiguráció nevét. Válassza ki a tartalomszűrőhöz társítandó kapcsolatot. Ezután válassza a Tovább gombra.

Most már konfigurálhatja a bemeneti szűrőket (a felhasználói kérésekhez) és a kimeneti szűrőket (a modell befejezéséhez).
A Bemeneti szűrők lapon beállíthatja a bemeneti kérés szűrőit. Az első négy tartalomkategória esetében három súlyossági szint konfigurálható: Alacsony, közepes és magas. A csúszkákkal beállíthatja a súlyossági küszöbértéket, ha megállapítja, hogy az alkalmazás vagy a használati forgatókönyv más szűrést igényel, mint az alapértelmezett értékek. Egyes szűrők, például a Prompt Shields és a védett anyagészlelés lehetővé teszik annak megállapítását, hogy a modellnek széljegyzeteket kell-e fűznie és/vagy letiltania a tartalmat. A Széljegyzet kiválasztása csak a megfelelő modellt futtatja, és API-válaszon keresztül ad vissza széljegyzeteket, de nem szűri a tartalmat. A széljegyzetek mellett a tartalom blokkolását is választhatja.

Ha a használati esetet jóváhagyták a módosított tartalomszűrőkhöz, teljes mértékben szabályozhatja a tartalomszűrési konfigurációkat, és dönthet úgy, hogy részlegesen vagy teljesen kikapcsolja a szűrést, vagy csak a tartalomkárosító kategóriák (erőszak, gyűlölet, szexuális és önkárosítás) esetén engedélyezi a megjegyzéseket.

A tartalom kategória szerint lesz széljegyzetet kap, és a beállított küszöbértéknek megfelelően le lesz tiltva. Az erőszak, a gyűlölet, a szexuális és az önkárosító kategóriák esetében állítsa be a csúszkát a magas, közepes vagy alacsony súlyosságú tartalmak blokkolásához.
A Kimeneti szűrők lapon konfigurálhatja a kimeneti szűrőt, amely a modell által létrehozott összes kimeneti tartalomra lesz alkalmazva. Konfigurálja az egyes szűrőket a korábbiakhoz hasonlóan. Ez a lap a Streamelési mód lehetőséget is biztosítja, amely lehetővé teszi a tartalom közel valós idejű szűrését a modell által generált módon, csökkentve a késést. Ha végzett, válassza a Tovább gombot.

A tartalmat minden kategória széljegyzetekkel nyitja meg, és a küszöbértéknek megfelelően letiltja. Az erőszakos tartalmak, a gyűlölettartalmak, a szexuális tartalmak és az önkárosító tartalmak kategóriája esetén állítsa be a küszöbértéket, hogy a káros tartalmakat azonos vagy magasabb súlyossági szinttel tiltsa le.
Az Üzembe helyezés lapon a tartalomszűrőt társíthatja az üzembe helyezéshez. Ha egy kijelölt üzembe helyezéshez már van csatolt szűrő, meg kell győződnie arról, hogy lecseréli azt. A tartalomszűrőt később egy üzembe helyezéshez is társíthatja. Válassza a Létrehozás lehetőséget.

A tartalomszűrési konfigurációk az Azure AI Foundry portál központi szintjén jönnek létre. További információ a konfigurálhatóságról az Azure OpenAI szolgáltatás dokumentációjában.
A Véleményezés lapon tekintse át a beállításokat, majd válassza a Szűrő létrehozása lehetőséget.

Tiltólista használata szűrőként

A blokklistát alkalmazhatja bemeneti vagy kimeneti szűrőként, vagy mindkettőre. Engedélyezze a Tiltólista beállítást a Bemeneti szűrő és/vagy a Kimeneti szűrő lapon. Válasszon ki egy vagy több tiltólistát a legördülő listából, vagy használja a beépített trágárság tiltólistát. Több blokklistát is kombinálhat ugyanabban a szűrőben.

Tartalomszűrő alkalmazása

A szűrőlétrehozás folyamata lehetővé teszi, hogy a szűrőt a kívánt üzemelő példányokra alkalmazza. A tartalomszűrőket bármikor módosíthatja vagy eltávolíthatja az üzemelő példányokból.

A tartalomszűrő üzembe helyezéséhez kövesse az alábbi lépéseket:

Nyissa meg az Azure AI Foundryt , és válasszon ki egy projektet.
A bal oldali panelen válassza a Modellek + végpontok lehetőséget, és válasszon ki egy üzemelő példányt, majd válassza a Szerkesztés lehetőséget.
A Frissítés központi telepítési ablakban válassza ki az üzembe helyezésre alkalmazni kívánt tartalomszűrőt. Ezután válassza a Mentés és bezárás lehetőséget.

Szükség esetén szerkesztheti és törölheti is a tartalomszűrő konfigurációját. Mielőtt törölné a tartalomszűrési konfigurációt, le kell bontania és le kell cserélnie azt a Központi telepítések lapon található bármely üzembe helyezésről.

Most a játszótérre léphet, és tesztelheti, hogy a tartalomszűrő a várt módon működik-e.

Jelentés tartalomszűrési visszajelzése

Ha tartalomszűrési problémát tapasztal, válassza a Visszajelzés szűrése gombot a játszótér tetején. Ezt a rendszer engedélyezi a Képek, csevegés és befejezések játszótéren, miután beküldött egy kérést.

Amikor megjelenik a párbeszédpanel, válassza ki a megfelelő tartalomszűrési problémát. Adja meg a tartalomszűréssel kapcsolatos lehető legrészletesebb információkat, például a megadott parancssori és tartalomszűrési hibát. Ne adjon meg bizalmas vagy bizalmas információkat.

Támogatásért küldjön támogatási jegyet.

Kövesse az ajánlott eljárásokat

Javasoljuk, hogy a tartalomszűrési konfigurációs döntéseket iteratív azonosítással (például vörös csapat tesztelésével, stresszteszteléssel és elemzéssel) és mérési folyamattal tájékoztassa, hogy elhárítsa az adott modell, alkalmazás és üzembe helyezési forgatókönyv szempontjából releváns lehetséges károkat. Az olyan kockázatcsökkentések implementálása után, mint a tartalomszűrés, ismételje meg a mérést a hatékonyság teszteléséhez. Az Azure OpenAI felelős AI-jának ajánlásai és ajánlott eljárásai a Microsoft Responsible AI Standardban találhatók az Azure OpenAI felelős AI-áttekintésében.

További információ az Azure OpenAI felelős AI-eljárásairól: Az Azure OpenAI-modellek felelős AI-eljárásainak áttekintése.
További információ a tartalomszűrési kategóriákról és a súlyossági szintekről az Azure AI Foundryvel.
További információ a vörös összevonásról a következő cikkünkből: Bevezetés a vörös összevonási nagy nyelvi modellek (LLM-ek) című cikkünkből.

További források

Dokumentáció

Tartalomszűrés az Azure OpenAI Service szolgáltatásban - Azure OpenAI

Ismerje meg az Azure OpenAI tartalomszűrési képességeit az Azure AI-szolgáltatásokban.
Blokklisták használata az Azure OpenAI Szolgáltatással - Azure OpenAI

Blokklisták használata az Azure OpenAI Szolgáltatással
Kockázatok és biztonság monitorozásának használata az Azure AI Foundryben - Azure OpenAI Service

Megtudhatja, hogyan ellenőrizheti az Azure OpenAI-tartalomszűrési tevékenység statisztikáit és megállapításait.
Az Azure OpenAI alapértelmezett tartalombiztonsági szabályzatai - Azure OpenAI

Ismerje meg az Azure OpenAI által a tartalom megjelölésére és a szolgáltatás felelősségteljes használatára vonatkozó alapértelmezett tartalombiztonsági szabályzatokat.
Tartalom hitelesítő adatai az Azure OpenAI-ban - Azure OpenAI

Ismerje meg a Tartalom hitelesítő adatai funkciót, amellyel ellenőrizheti, hogy a rendszerképet egy AI-modell hozta-e létre.
Tartalomszűrés modellkövetkezéshez az Azure AI-szolgáltatásokban - Azure AI Foundry

Ismerje meg az Azure AI-modellek tartalomszűrési képességeit az Azure AI-szolgáltatásokban.

Oktatás

Modul

Tartalom moderálása és károk észlelése az Azure AI Studióban a Content Safety használatával - Training

Megtudhatja, hogyan választhatja ki és hozhat létre con sátormód ration rendszert az Azure AI Studióban.

Tanúsítvány

Microsoft Tanúsítvány: Azure AI Mérnök Társ=minősítéssel Rendelkező - Certifications

Azure AI-megoldás tervezése és implementálása Az Azure AI-szolgáltatások, az Azure AI Search és az Azure Open AI használatával.

esemény

Intelligens alkalmazások létrehozása

márc. 17. 21 - márc. 21. 10

Csatlakozzon a meetup sorozathoz, hogy valós használati esetek alapján, skálázható AI-megoldásokat hozzon létre más fejlesztőkkel és szakértőkkel.

Regisztráció

Megosztás a következőn keresztül: