Skadekategorier i Azure AI Content Valv ty

Den här guiden beskriver alla skadekategorier och klassificeringar som Azure AI Content Valv ty använder för att flagga innehåll. Både text- och bildinnehåll använder samma uppsättning flaggor.

Skadekategorier

Innehåll Valv ty identifierar fyra olika kategorier av stötande innehåll.

Kategori beskrivning
Hat och rättvisa Hat- och rättviserelaterade skador avser allt innehåll som attackerar eller använder nedsättande eller diskriminerande språk med hänvisning till en person eller identitetsgrupp baserat på vissa differentieringsattribut för dessa grupper, inklusive men inte begränsat till ras, etnicitet, nationalitet, könsidentitet och uttryck, sexuell läggning, religion, invandringsstatus, förmågasstatus, personligt utseende och kroppsstorlek.

Rättvisa handlar om att se till att AI-system behandlar alla grupper av människor rättvist utan att bidra till befintliga samhälleliga orättvisor. Precis som hatpropaganda beror rättviserelaterade skador på olika behandling av identitetsgrupper.
Sexuella Sexuell beskriver språk som rör anatomiska organ och könsorgan, romantiska relationer, handlingar som porträtteras i erotiska eller tillgivna termer, graviditet, fysiska sexuella handlingar, inklusive de som framställs som ett övergrepp eller en tvingad sexuell våldsam handling mot ens vilja, prostitution, pornografi och övergrepp.
Våld Våld beskriver språk som rör fysiska handlingar som är avsedda att skada, skada, skada eller döda någon eller något; beskriver vapen, vapen och relaterade enheter, till exempel tillverkning, associationer, lagstiftning och så vidare.
Självskadebeteende Självskadebeteende beskriver språk relaterade till fysiska handlingar som är avsedda att avsiktligt skada, skada, skada ens kropp eller döda sig själv.

Klassificering kan vara flera etiketter. När ett textexempel till exempel går igenom textmodereringsmodellen kan det klassificeras som både sexuellt innehåll och våld.

Allvarlighetsgrad

Varje skadekategori som tjänsten gäller har också en allvarlighetsgrad. Allvarlighetsgraden är avsedd att indikera allvarlighetsgraden för konsekvenserna av att visa det flaggade innehållet.

Text: Den aktuella versionen av textmodellen stöder den fullständiga allvarlighetsgraden 0–7. Klassificeraren identifierar bland alla allvarlighetsgraderna längs den här skalan. Om användaren anger kan den returnera allvarlighetsgraderna i den trimmade skalan 0, 2, 4 och 6. varje två intilliggande nivåer mappas till en enda nivå.

  • [0,1] -> 0
  • [2,3] -> 2
  • [4,5] -> 4
  • [6,7] -> 6

Bild: Den aktuella versionen av bildmodellen stöder den trimmade versionen av den fullständiga allvarlighetsgraden 0–7. Klassificeraren returnerar endast allvarlighetsgrad 0, 2, 4 och 6. varje två intilliggande nivåer mappas till en enda nivå.

  • [0,1] -> 0
  • [2,3] -> 2
  • [4,5] -> 4
  • [6,7] -> 6

Textinnehåll

Varning

Fliken Allvarlighetsgradsdefinitioner i det här dokumentet innehåller exempel på skadligt innehåll som kan vara störande för vissa läsare.

Avbildningsinnehåll

Varning

Fliken Allvarlighetsgradsdefinitioner i det här dokumentet innehåller exempel på skadligt innehåll som kan vara störande för vissa läsare.

Nästa steg

Följ en snabbstart för att komma igång med Azure AI Content Valv ty i ditt program.