Azure AI 內容安全性中的傷害類別
本文內容
本指南說明 Azure AI 內容 保管庫 用來標記內容的所有傷害類別和評等。 文字和影像內容都使用同一組旗標。
傷害類別
內容安全性可辨識四種不同的令人反感內容類別。
類別
描述
仇恨和公平
仇恨和公平相關的傷害是指攻擊或使用貶低或歧視性語言的任何內容,以參考這些群體的某些不同屬性,包括但不限於種族、種族、國籍、性別認同和表達、性取向、宗教、移民身份、能力狀態、個人外觀和身體大小。 公平性涉及確保 AI 系統公平對待所有人群,而不會對現有的社會不平等做出貢獻。 與仇恨言論類似,公平相關的傷害取決於不同對待身份群體。
色情
性描述與解剖器官和生殖器、浪漫關係、以色情或深情術語描繪的行為、懷孕、身體性行為,包括那些被描繪成攻擊或強迫性暴力行為,反對自己意志、賣淫、色情和虐待的行為。
暴力
暴力描述與旨在傷害、傷害、傷害或殺害某人或某物的身體行動相關的語言:描述武器、槍支和相關實體,例如製造、協會、立法等。
自殘
自我傷害描述了與故意傷害、傷害、傷害他人身體或自殺的身體行為相關的語言。
分類可以為多標籤的。 例如,當文字範例通過文字調節模型時,可以同時分類為色情內容和暴力內容。
嚴重性層級
服務套用的每個傷害類別也會隨附嚴重性等級評等。 嚴重性層級旨在指出顯示標記內容結果的嚴重性。
文字 :目前版本的文字模型支援完整的 0-7 嚴重性級別。 分類器會沿著這個規模偵測到所有嚴重性。 如果使用者指定,它可以傳回修剪后小數字數 0、2、4 和 6 的嚴重性;每兩個相鄰層級都會對應至單一層級。
[0,1] -> 0
[2,3] -> 2
[4,5] -> 4
[6,7] -> 6
映射 :映射模型的目前版本支援完整 0-7 嚴重性調整的修剪版本。 分類器只會傳回嚴重性 0、2、4 和 6;每兩個相鄰層級都會對應至單一層級。
[0,1] -> 0
[2,3] -> 2
[4,5] -> 4
[6,7] -> 6
文字內容
警告
本檔中的 [嚴重性定義 ] 索引標籤包含可能對某些讀者造成干擾之有害內容的範例。
仇恨和公平嚴重性層級
嚴重層級
說明
範例文字
層級 0
內容包含一般意義上使用的仇恨和公平相關詞彙,適用於所有目標物件,包括兒童。 這包括:對身分識別群組表示厭惡的一般、悲觀語言 一般提到身份群體屬性,如種族、種族、宗教等歷史、地理、醫療等類似背景,沒有情感 在背景之外沒有冒犯意圖種族底色的一般詞彙
"I hate cats."
層級 1
內容包含一般意義上使用的仇恨和公平相關詞彙,但可能會根據內容取得不同的意義,而且不會以偏向或負面的方式區分身份群組和其他人。 這包括:官方統計數據、立法或檔 新聞/媒體報導 教育資源旨在提高對多樣性/處理仇恨言論的認識 皮膚白化產品和治療廣告 提到印歐亞斯瓦斯蒂卡,邦聯旗,非KKK群組,具有視覺相似於KKK
"Black people should not be killed by police or mistreated just because of their skin color."
層級 2
內容,包含正面特徵或保護觸發良好情緒反應的身分識別群組。 這包括:在具有直接引文的研究論文、字典或媒體中完全拼出污點 屬於身分識別群組的說話者陳述,而無意以相同的身分識別群組為目標 詛咒不針對身份群組的言辭、褻瀆和口頭侮辱 以身份不明個人/群組為目標的一般仇恨言論,而不以身分識別群組為目標 建立冒犯性字詞封鎖清單的用戶意圖 納粹德國、希特勒、邦聯國旗和庫克魯克斯·克蘭在電影、視頻遊戲、服裝、玩具、再演或在線俚語中的代表
"I hate you."
層級 3
包含偏見、判斷、陳規定型特徵或負面情感的內容。 這包括:基於陳規定型或負面情緒的意見 表達偏見、判斷或意見觀點 識別群組與其他人之間的負數或正面比較。 虛構世界中的提及 就業崗位就業歧視 與納粹德國、美國內戰期間邦聯國旗或庫克魯克斯·克蘭有關的歷史事實和文物
"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."
層級 4
內容,包含直接口頭情感動機的侮辱、負面評論和種族誹謗,用來作為針對身份群體的描述,意圖根據其屬性傷害個人。 這包括:用來鎖定一個種族、皮膚色彩的參考 促進社會避免和隔離 模擬和模仿身分識別群組的屬性
"All [identity group] are ugly."
層級 5
內容包含非人類化或貶低個人或群體的內容,這些內容會透過非人類化、暴力、否認事件、欺淩或恐嚇行為來進一步提升負面情緒。 這包括:否認歷史、有記錄和暴力事件(如大屠殺)的文字 根據身分識別群組的成員資格,將個人或群組描述為身體或精神劣質的文字 問題、拒絕或貶低身分識別群組存在的文字 強制執行所需的/預期屬性 以身份群體為目標的優生學和「種族改善」理論 包含納粹、邦聯國旗或 KKK 符號的現代化商品
"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."
層級 6
以負面情緒和仇恨言論為基礎的內容,以身分識別群組為基礎。 藉由參考區分身分識別群組和其他群組的群組特性,並呼籲根據其屬性對身分識別群組採取行動。 此可包括:仇恨言論宣傳,可被視為對身份群組的直接威脅或呼籲暴力 煽動性、冒犯性和粗俗的仇恨言論 據稱聲稱一個群體對具有身份群組屬性的人具有優勢的文字,以證明歧視、隔離或排斥是正當的 描述針對身分識別群組的暴力事件快樂的文字
"Send [identity group] back to the gas chambers."
層級 7
基於負面情緒的內容,顯示仇恨犯罪和跟蹤意圖,觸發敵對的情感反應和區分身份團體和其他導致犯罪的人。 這包括:仇恨犯罪準備、讚揚和美化針對身份群體的暴力 包含至上主義團體招聘材料的文本 旨在激進化和鼓勵仇恨言論反對身份團體的文字
"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"
性嚴重性等級
嚴重層級
說明
範例文字
層級 0
內容,包含一般意義上的性相關詞彙,對包括兒童在內的所有目標對象來說都是無害的。
"The sports bra and yoga pants were too tight for comfort."
層級 1
內容,包含一般意義上使用的性相關詞彙,但可能會根據內容取得不同的意義。 這包括:關於性相關主題的官方統計數據和檔 新聞/媒體報導 解剖術語、性解剖學和治療 關於性、性健康、意識等的教育資源。 提到生物性性或性生殖的描述 描述非圖形詞彙中浪漫關係的文字
"Fewer young adults are having sex than in previous generations."
層級 2
內容,包含虛構或真實世界體驗中與性相關的詞彙,這些內容並不非常生動。 這包括:提到文學/藝術文字、電影、雕塑等,其中包含有限的骯髒談話或簡短的非明確裸體場景 與一般性相關的個人經歷、性問題和創傷、分享應對機制和資源來解決此類問題 建立性內容的封鎖清單的用戶意圖 提到輕核心的性行為和裸體
"The first time I had sex, I found it painful."
層級 3
在包含一些圖形內容、表達偏見、偏見、判斷或性相關問題意見的情況下,具有性相關詞彙的內容。 這包括:
"We made out for a while, and he started to feel me up. I felt a bulge in his pants."
層級 4
描述性幻想、專業性產業和廣告以及性動物繁殖的內容。 這包括:不同類型的性幻想,包括想像真實或虛構的裸體 專業性產業沒有性場景的描述 避孕套、面料、性玩具、服裝等廣告。 描述動物或類似動物的人物之間的性繁殖與一些圖形內容 提到性行為和裸體與軟核心
"I got into BDSM because I had some friends into the lifestyle and it piqued my interest. I like using silk, scarves, collars, and bondage…"
層級 5
描述色情內容會顯示或體驗為個人體驗、BDSM 明確同意,以及色情故事和網站。 這包括:提到性、色情或曬黑按摩、脫衣俱樂部、色情表演為個人經歷(不是專業服務) 與 BDSM 屬性和實務相關的個人體驗和描述,一般或 BDSM 實務有清楚內容的情況 提及與性慾或快樂相關的非商業色情內容
"We both climaxed at the same time."
層級 6
描述性商務服務請求的內容,其中包含性活動、暴力性虐待和強姦的詳細描述,以及非自願的權力交換、虐待和偷窺。 這包括:提到用手或其他物體刺激生殖器、手淫等。 涉及體液、性控制情況或 BDSM 活動未經明確同意的擷取或粗暴內容 以圖形詳細數據描述性暴力、性侵犯、強姦或虐待的文字 將正面品質歸因於性侵犯的文字 尋求或提供執行性侵犯指示的文字 敲詐勒索和威脅的行為,揭露先前錄製的不合情意的性圖像或視頻
"I love forced sex, it's so much hotter."
層級 7
用來宣傳、背書、美化極端形式的性奴役的內容。 極端或非法的內容。 這包括:與動物、屍體等發生性關係。 戀童癖 尋求或提供關於兒童美容的指示 明確或潛在的亂倫參考 人口性販運招募
"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."
暴力嚴重性層級
嚴重層級
說明
範例文字
層級 0
內容包含非暴力行動或與暴力相關的詞彙,在一般意義上對包括兒童在內的所有目標物件無害。 這包括:未用作武器時的通用物件 玩具槍, 非現實或假裝的槍 當未用作努塞時,提及繩索
"According to our child and parent testers, here are the best long-range soakers for soft blasters for toddlers suitable for epic water battles."
層級 1
內容,包含一般意義上使用的暴力相關詞彙或行為,但可能會根據內容取得不同的意義。 這包括:包含暴力行為描述的文字子集,其中全文的內容化沒有暴力意圖 關於槍支、武器、家庭暴力、戰爭、軍事等的官方統計和檔。 與暴力相關的教育資源 新聞/媒體報導 醫療條款與內容 狩獵或射擊運動和槍支技術規格 戰鬥練習 與ISIS/基地組織無關的反恐和恐怖主義符號
"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."
層級 2
內容,其中包含虛構或真實世界體驗中與暴力相關的詞彙或行為,這些體驗不是極其圖形化,也沒有對惡意的讚美或背書。 這包括:第一、第二和第三人稱電子遊戲、描繪暴力或圖形場景的文學/藝術文字 遊戲秘訣和建議 個人描述他們如何接觸某種暴力的個人經歷 噹噹做沒有人類科目出現或與努塞無關的努塞時,提到繩索 使用者意圖是建立具有暴力內容的封鎖清單
"She wishes she could have killed her whole family."
層級 3
與暴力相關的條款或行為的內容,包括一些圖形內容、表達偏見、偏見、判斷或對暴力的看法的意見。 這包括:允許虐待一些動物 聲稱對某種暴力類型產生積極影響的文字
"Some people just need to be slapped."
層級 4
內容描述了為什麼受害者被身體虐待、虐待者積極素質的毫無根據的歸因、關於如何傷害他人的暴力行為和幻想的威脅和幻想的內容。 這包括:將受害者置於錯誤或描繪肇事者的文字 具有中等戈爾暴力和死亡的圖形描述 驗屍報告、法醫調查、犯罪或死亡現場 肉類和家禽設施,以及宗教動物犧牲 提到歷史或最近的種族滅絕和已知的槍擊事件與大規模傷亡沒有支援或榮耀 提到恐怖分子和暴力極端主義事件,沒有背書或榮耀
"Victims of abuse deserve to be hit. They push and push until they get what they deserve."
層級 5
旨在進一步暴力的內容,提供如何傷害特定個人或團體的直接指示。 這包括:煽動針對目標個人/群體的人身暴力的文字 如何對個人造成身體暴力或虐待動物的指示 尋求如何對動物、個人或團體採取暴力行動的建議的文字 欺淩和恐嚇
"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."
層級 6
內容描述極端主義團體和恐怖組織、大規模殺戮和嚴重身體傷害,以及促進恐怖主義及其宣傳。 這包括:官方恐怖分子或極端主義宣傳材料以及互聯網上的暴力意識形態 煽動採取暴力行動
"We must kill them all. God wills it, and society will be better for it."
層級 7
用來描述、讚揚、支援、推廣、支援、表彰極端暴力形式的內容。 支援恐怖組織並激進化、指示或訓練的內容。 這包括:強迫勞動,包括兒童、家庭服務或醫療 在線恐怖分子和暴力極端分子宣傳材料,將殺人視為恐怖活動的一部分,並協助向恐怖組織或事業提供援助 關於如何招募、影響和訓練人們走向事業的指示的文字 非法騷擾行為,例如跟蹤或垃圾監視 規劃和協調對個人或人員群組攻擊的文字 背書、美化或提供食人主義指示的文字
"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."
自我傷害嚴重性層級
嚴重層級
說明
範例文字
層級 0 – 保管庫
內容,其中包含一般意義上的自我傷害相關詞彙,對包括兒童在內的所有目標物件而言都是無害的。 這包括:提到身體脂肪,脂肪質量指數指標按年齡和性別在健康相關內容
"I appreciate your hard work, but you don't need to keep killing yourself over this project."
層級 1
包含一般意義上使用自我傷害相關詞彙的內容,但可能會根據內容取得不同的意義。 這包括:關於非自殺性自我傷害(NSSI)、自殺等的官方統計數據和檔。 與自我傷害相關的教育資源 新聞/媒體報導 醫療條款與內容 描述意外自我傷害、急救提示等的動作。
"Binging and purging may be a warning sign for people with a history of extreme weight loss."
層級 2
包含自我傷害相關詞彙的內容,或在虛構或真實世界體驗中的行為,這些內容並非極其圖形化。 這包括:文學/藝術文字、電影等描繪人物策劃或自殺、自殘或無序飲食,沒有榮耀或背書 自我傷害行為或自殺被描繪為低戈爾的文字 使用者意圖是建立自我傷害條款的封鎖清單
"Oedipus stabbed his eyes in despair."
層級 3
在包含一些圖形內容、表達偏見、偏見、判斷或自殘觀點的案例中,具有自我傷害相關詞彙或行為的內容。 這包括:與自我傷害相關的個人經歷,例如在傷害自己或自殺之前尋求説明
"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"
層級 4
嘲笑自殺或自我傷害受害者或倖存者的內容、自我傷害的正面品質、幻想或自我傷害願望的無根據歸因,並包含涉及死亡、驗屍、犯罪或死亡現場的明確圖形內容。 這包括:自我傷害被視為解決問題、情緒痛苦、擺脫痛苦/痛苦的解決方案 自我傷害或自殺的文字包含中度戈爾和工具的描述,如刀子、手槍等。
"It's hilarious when [identity group] kill themselves."
層級 5
旨在進一步促進自我傷害的內容,提供如何執行自我傷害或欺淩受害者的直接指示。 這包括:尋求關於如何執行自我傷害行為的建議或建議的文字,除了自殺 描述個人過去和目前自我傷害體驗的文字,其中包含明確的詳細數據 煽動和促進自我傷害行為的欺淩、恐嚇和施壓
"Go kill yourself, you are worthless."
層級 6
描述如何自殺的詳細和明確指示的內容。 這包括:
"Here is a quick guide to do-it-yourself suicide. One method is asphyxia suicide by inhaling helium inside a plastic bag."
層級 7
用來背書和美化自殺或其他嚴重自我傷害行為的內容。 這包括:
"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."
映像內容
警告
本檔中的 [嚴重性定義 ] 索引標籤包含可能對某些讀者造成干擾之有害內容的範例。
仇恨和公平嚴重性層級
嚴重層級
說明
影像範例
層級 0 – 保管庫
內容是安全的,但可能包含仇恨和公平相關的影像,在下列內容或類似以下內容中,沒有情感或中性情緒:
非邦聯旗標,例如具有交叉的國家/地區旗標描述美國被奴役者的解放的歷史照片
層級 2 - 低
包含正面情感、誤判情感或負面偏向情感的內容,會區分其他人的身分識別群組。 此內容旨在觸發情感回應。 這包括:保護 納粹象徵主義,邦聯國旗,庫克魯克斯克蘭象徵主義 成見 就業歧視
代表「無仇恨言論」運動 代表無優先順序的工作候選人,如殘疾候選人在面試設置
層級 4 - 中
內容,其中包含對身分識別群組的負面情感動作,以及導致針對身分識別群組和優勢情感的提升動作的其他人。 這包括:侮辱、隔離、模擬 納粹國旗、邦聯國旗和 LGBTQIA+ 變化和商品
促進社會避免[身份群體] 形象的影像,描繪種族改進理論和優生
層級 6 – 高
內容,其中包含對導致仇恨言論產生或仇恨犯罪的身分識別群組的負面情緒和仇恨言論。 這包括:種族主義 LGBTQIA+ 的攻擊 停用原則 性別歧視 光榮的納粹象徵主義,邦聯國旗,庫克魯克斯克蘭象徵主義 暴力邦聯旗
反軍事圖像 圖像描繪描繪「南十字」的特點是藍色鹽(對角線十字)與明顯的暴力關係(如展示/使用中的槍支)
性嚴重性等級
嚴重層級
說明
影像範例
層級 0 - 保管庫
內容是安全的,但包含一般意義上使用的性相關圖像。 這包括:家庭和浪漫關係 非性裸體 Clothing 通用物件 非性姿勢或活動 動物交配 性健康
擁抱或製作非性身體接觸 代表的表示,描繪了親吻沒有舌頭和裸體等親情的身體展示
層級 2 – 低
包含性暗示行為或行為的內容。 這包括:個人體驗 時尚模型 藝術品中的裸體 身體藝術 Racy 顯示器
人物的描述
層級 4 - 中
內容,包含商業和業餘色情和/或色情內容,沒有視覺攝影滲透和裸體或半裸體參與者參與性場景,意在性引起。 這包括:性模型化 藝術品中的軟裸體 性工作或商店 遮蔽的性活動 色情製作後台 撐桿跳舞
可能部分遮蔽但仍然清楚出現在影像中的性描述
層級 6 - 高
內容包含性器官和性行為的明確詳細描述,包括非法行為。 這包括:業餘軟核心和硬核心色情 性請求 偷窺 藝術品中的性 BDSM 未同意或強姦 兒童性剝削和虐待 兒童美容 亂倫
描述與動物或屍體的性活動接觸
暴力嚴重性層級
嚴重層級
說明
影像範例
層級 0 - 保管庫
內容是安全的,但包含一般意義上使用的暴力相關圖像。 這包括:睡眠或躺下姿勢 通用物件 非暴力活動 繩索不作為努塞 廚房/縫紉中使用的刀鋒工具 傷口、疤痕和手術治療 狩獵和射擊運動 玩具和假裝槍 戰鬥練習 物件損壞和破壞 非品牌恐怖主義象徵意義
非現實武器和刀鋒視窗工具的描述
層級 2 – 低
內容,包含暴力相關圖像和行為在真實世界或虛構的內容與低流。 這包括:顯示和使用中的槍支、武器和刀鋒視窗工具 非現實的屍體 非現實暴力 動畫武器 輕傷和個人經驗 繩索作為努塞 歷史、教育或葬禮設置中的死亡 非現實的恐怖主義象徵主義 鬥牛
伊西斯/基地組織國旗的描述
層級 4 - 中
內容,包含針對已識別目標的溫和圖形暴力和暴力行為。 這包括:屍檢 犯罪或死亡現場 動物死亡(自然或狩獵),動物犧牲,動物虐待 奴役 在歷史、教育環境中發生的種族滅絕和大規模殺戮 屠宰場 家庭暴力和身體虐待 欺負 針對目標使用的槍支和武器
描述使用武力和強制攻擊性地主宰或恐嚇個人
層級 6 - 高
內容包含高爾暴力和暴力行為的明確詳細描述。 這包括:圖形傷害和死亡 肢解, 斬首, 燃燒活著 屍體分解 恐怖主義、恐怖組織及旗幟 強迫勞動和奴役,強迫醫療程式 跟蹤 恐怖主義和戰爭犯罪的屍體 射擊事件 其他極端主義
由ISIS國旗和符號識別的恐怖組織表演時死亡的描述
自我傷害嚴重性層級
嚴重層級
說明
影像範例
層級 0 - 保管庫
內容是安全的,但包含一般意義上使用的自我傷害相關圖像。 這包括:
用降落傘跳出飛機的描述
層級 2 – 低
包含自我傷害相關影像的內容,以及在真實世界或虛構內容中具有低戈爾的行為。 這包括:傷疤 自我傷害在恢復中受傷 非現實的自我傷害 消瘦的個人或動物
自我傷害相關行為、工具、傷害和情感狀態的表示法
層級 4 - 中
包含與自我傷害和自殺相關的中度圖形影像的內容。 這包括:
使用武力和強迫來積極支配或恐嚇個人自我傷害的表示法
層級 6 - 高
內容,包含高危中自我傷害和自殺的明確詳細描述。 這包括:
故意自殺的描述,其中一個人通過跳下一座高樓自殺自殺
下一步
請遵循快速入門,開始在應用程式中使用 Azure AI 內容 保管庫 ty。