Kockázatok és biztonság monitorozása az Azure AI Foundryben (előzetes verzió)

Cikk
2025. 02. 20.

Ha egy Azure OpenAI-modell üzembe helyezését tartalomszűrővel használja, érdemes lehet ellenőrizni a szűrési tevékenység eredményeit. Ezekkel az információkkal tovább módosíthatja a szűrőkonfigurációt az adott üzleti igények és a felelős AI-alapelvek kiszolgálása érdekében.

Az Azure AI Foundry egy kockázat- és biztonsági monitorozási irányítópultot biztosít minden olyan üzemelő példányhoz, amely tartalomszűrő-konfigurációt használ.

Hozzáférési kockázatok és biztonság monitorozása

A Kockázatok és biztonság monitorozás eléréséhez szüksége van egy Azure OpenAI-erőforrásra az egyik támogatott Azure-régióban: USA keleti régiója, Észak-Svájc, Közép-Franciaország, Közép-Svédország, Kelet-Kanada. Olyan modelltelepítésre is szüksége van, amely tartalomszűrő-konfigurációt használ.

Nyissa meg az Azure AI Foundryt , és jelentkezzen be az Azure OpenAI-erőforráshoz társított hitelesítő adatokkal. Válasszon ki egy projektet. Ezután válassza a bal oldali Modellek + végpontok lapot, majd válassza ki a modell üzembe helyezését a listából. Az üzembe helyezés oldalán válassza a Metrika lapot a tetején. Ezután válassza a Megnyitás az Azure Monitorban lehetőséget a teljes jelentés megtekintéséhez az Azure Portalon.

Mérőszámok konfigurálása

Jelentés leírása

A tartalomszűrési adatok a következő módokon jelennek meg:

A letiltott kérelmek teljes száma és a blokkolási arány: Ez a nézet az idő függvényében szűrt tartalom mennyiségének és sebességének globális nézetét jeleníti meg. Ez segít megérteni a felhasználóktól érkező káros kérések trendjeit, és látni a váratlan tevékenységeket.
Letiltott kérelmek kategória szerint: Ez a nézet az egyes kategóriákhoz letiltott tartalom mennyiségét jeleníti meg. Ez a káros kérelmek teljes körű statisztikája a kiválasztott időtartományban. Jelenleg támogatja a gyűlölet, a szexuális, az önsértés és az erőszak ártalmait.
Blokkolási sebesség az idő függvényében kategória szerint: Ez a nézet az egyes kategóriák blokkolási sebességét jeleníti meg az idő függvényében. Jelenleg támogatja a gyűlölet, a szexuális, az önsértés és az erőszak ártalmait.
Súlyosság eloszlása kategória szerint: Ez a nézet az egyes kárkategóriákhoz észlelt súlyossági szinteket jeleníti meg a teljes kijelölt időtartományban. Ez nem csak a letiltott tartalmakra vonatkozik, hanem a tartalomszűrők által megjelölt összes tartalmat is tartalmazza.
Súlyossági arányok időbeli eloszlása kategória szerint: Ez a nézet az észlelt súlyossági szintek időbeli arányát mutatja az egyes kárkategóriákhoz. Válassza ki a lapokat a támogatott kategóriák közötti váltáshoz.

Javasolt műveletek

Módosítsa a tartalomszűrő konfigurációját az üzleti igényeknek és a felelős AI-alapelveknek megfelelően.

Potenciálisan sértő felhasználói észlelés

A potenciálisan visszaélésszerű felhasználói észlelési panel felhasználói szintű visszaélés-jelentésekkel jeleníti meg azokat a felhasználókat, akiknek a viselkedése blokkolt tartalmat eredményezett. A cél az, hogy segítsen a káros tartalmak forrásainak megtekintésében, hogy rugalmas műveleteket hajthasson végre annak biztosítása érdekében, hogy a modell felelősségteljes módon legyen használva.

A potenciálisan visszaélésszerű felhasználói észlelés használatához a következőkre van szüksége:

Az üzembe helyezésre alkalmazott tartalomszűrő-konfiguráció.
A csevegővégzítési kérelmekben felhasználói azonosító adatokat kell küldenie (lásd például a Completions API felhasználói paraméterét).

Figyelemfelhívás

A GUID sztringek használatával azonosíthatja az egyes felhasználókat. Ne adjon meg bizalmas személyes adatokat a felhasználói mezőben.
A felhasználói elemzési eredmények tárolására beállított Azure Data Explorer-adatbázis (az alábbi utasítások).

Az Azure Data Explorer-adatbázis beállítása

A felhasználói adatok adatvédelmi védelme és az adatok engedélyének kezelése érdekében támogatjuk azt a lehetőséget, hogy ügyfeleink saját tárterületet hozzanak létre a felhasználók részletes, potenciálisan sértő észlelési megállapításainak (beleértve a felhasználói GUID-t és a káros kérelmek kategóriánkénti statisztikáit) megfelelő módon és teljes hozzáféréssel történő tárolásához. Az engedélyezéshez kövesse az alábbi lépéseket:

Az Azure AI Foundryben keresse meg azt a modelltelepítést, amellyel felhasználói visszaélések elemzését szeretné beállítani, és válassza az Adattár hozzáadása lehetőséget.
Töltse ki a szükséges adatokat, és válassza a Mentés lehetőséget. Javasoljuk, hogy hozzon létre egy új adatbázist az elemzési eredmények tárolásához.
Az adattár csatlakoztatása után végezze el az alábbi lépéseket, hogy engedélyt adjon az elemzési eredményeknek a csatlakoztatott adatbázisba való írására:
1. Lépjen az Azure OpenAI-erőforrás lapjára az Azure Portalon, és válassza az Identitás lapot.
2. Kapcsolja be az állapotot a rendszer által hozzárendelt identitáshoz, és másolja a létrehozott azonosítót.
3. Nyissa meg az Azure Data Explorer-erőforrást az Azure Portalon, válassza ki az adatbázisokat, majd válassza ki a felhasználóelemzési eredmények tárolásához létrehozott adatbázist.
4. Válassza ki az engedélyeket, és adjon hozzá egy rendszergazdai szerepkört az adatbázishoz.
5. Illessze be a korábbi lépésben létrehozott Azure OpenAI-identitást, és válassza ki a keresettet. Mostantól az Azure OpenAI-erőforrás identitása jogosult a tárfiókba való olvasásra/írásra.
Adjon hozzáférést a csatlakoztatott Azure Data Explorer-adatbázishoz azoknak a felhasználóknak, akiknek meg kell tekinteni az elemzési eredményeket:
1. Nyissa meg a csatlakoztatott Azure Data Explorer-erőforrást, válassza a hozzáférés-vezérlést, és adja hozzá az Azure Data Explorer-fürt olvasói szerepkörét azokhoz a felhasználókhoz, akiknek hozzá kell férnie az eredményekhez.
2. Válassza ki az adatbázisokat , és válassza ki azt az adatbázist, amely a felhasználói szintű visszaélések elemzési eredményeinek tárolásához kapcsolódik. Válassza ki az engedélyeket , és adja hozzá az adatbázis olvasói szerepkörét azokhoz a felhasználókhoz, akiknek hozzá kell férnie az eredményekhez.

Jelentés leírása

A potenciálisan sértő felhasználói észlelés az ügyfelek által az Azure OpenAI API-hívásokkal küldött felhasználói adatokra és a kérelem tartalmára támaszkodik. A következő megállapítások jelennek meg:

Potenciálisan sértő felhasználók teljes száma: Ez a nézet az észlelt potenciálisan visszaélést okozó felhasználók számát jeleníti meg az idő függvényében. Ezek azok a felhasználók, akiknél visszaélési mintát észleltek, és akik magas kockázatot jelenthetnek.
Potenciálisan sértő felhasználók listája: Ez a nézet az észlelt potenciálisan sértő felhasználók részletes listáját tartalmazza. A következő információkat adja meg minden felhasználó számára:
- UserGUID: Ezt az ügyfél az Azure OpenAI API-k "felhasználó" mezőjén keresztül küldi el.
- Visszaélési pontszám: Ezt a modellt a modell az egyes felhasználók kéréseinek és viselkedésének elemzésével hozza létre. A pontszám normalizálása 0–1. A magasabb pontszám magasabb visszaélési kockázatot jelez.
- Visszaélési pontszám trendje: A visszaélési pontszám változása a kiválasztott időtartományban.
- Kiértékelési dátum: Az eredmények elemzésének dátuma.
- A visszaélésekre vonatkozó kérelmek teljes aránya/száma
- Visszaélés aránya/száma kategória szerint

Javasolt műveletek

Ezeket az adatokat gazdagított jelekkel kombinálva ellenőrizheti, hogy az észlelt felhasználók valóban sértőek-e. Ha így van, akkor olyan rugalmas műveletet kell elvégeznie, mint például a felhasználó szabályozása vagy felfüggesztése az alkalmazás felelősségteljes használatának biztosítása érdekében.

Következő lépés

Ezután hozzon létre vagy szerkesszen egy tartalomszűrő-konfigurációt az Azure AI Foundryben.

Tartalomszűrők konfigurálása az Azure OpenAI szolgáltatással

További források

Dokumentáció

Blokklisták használata az Azure OpenAI Szolgáltatással - Azure OpenAI

Blokklisták használata az Azure OpenAI Szolgáltatással
Tartalomszűrők (előzetes verzió) használata az Azure AI Foundryvel - Azure OpenAI

Megtudhatja, hogyan használhatja és konfigurálhatja az Azure AI Foundryhez tartozó tartalomszűrőket, beleértve a kapus módosítások jóváhagyását is.
Tartalomszűrés az Azure OpenAI Service szolgáltatásban - Azure OpenAI

Ismerje meg az Azure OpenAI tartalomszűrési képességeit az Azure AI-szolgáltatásokban.
Az Azure OpenAI alapértelmezett tartalombiztonsági szabályzatai - Azure OpenAI

Ismerje meg az Azure OpenAI által a tartalom megjelölésére és a szolgáltatás felelősségteljes használatára vonatkozó alapértelmezett tartalombiztonsági szabályzatokat.
Az Azure OpenAI szolgáltatás tárolt befejezéseinek és lepárlásának használata - Azure OpenAI

Megtudhatja, hogyan használhatja a tárolt befejezéseket és lepárlást az Azure OpenAI-val
Az Azure OpenAI Service modelljei - Azure OpenAI

Ismerje meg az Azure OpenAI-ban elérhető különböző modellfunkciókat.

Oktatás

Modul

Generatív AI-alkalmazások kockázatainak mérése és csökkentése az Azure AI Foundryben - Training

Megtudhatja, hogyan mérheti és csökkentheti a felelős AI-eszközöket és -funkciókat kihasználó generatív AI-alkalmazások kockázatait az Azure AI Foundryben.

Tanúsítvány

Microsoft Tanúsítvány: Azure AI Mérnök Társ=minősítéssel Rendelkező - Certifications

Azure AI-megoldás tervezése és implementálása Az Azure AI-szolgáltatások, az Azure AI Search és az Azure Open AI használatával.

esemény

Intelligens alkalmazások létrehozása

márc. 17. 21 - márc. 21. 10

Csatlakozzon a meetup sorozathoz, hogy valós használati esetek alapján, skálázható AI-megoldásokat hozzon létre más fejlesztőkkel és szakértőkkel.

Regisztráció

Megosztás a következőn keresztül:

Kockázatok és biztonság monitorozása az Azure AI Foundryben (előzetes verzió)

Hozzáférési kockázatok és biztonság monitorozása

Mérőszámok konfigurálása

Jelentés leírása

Javasolt műveletek

Potenciálisan sértő felhasználói észlelés

Az Azure Data Explorer-adatbázis beállítása

Jelentés leírása

Javasolt műveletek

Következő lépés

Visszajelzés

További források