Dela via


Identifiering av skyddat material

API:et för skyddad materialtext flaggar känt textinnehåll (till exempel låttexter, artiklar, recept och valt webbinnehåll) som kan matas ut av stora språkmodeller.

API:et för skyddad materialkod flaggar skyddat kodinnehåll (från kända GitHub-lagringsplatser, inklusive programvarubibliotek, källkod, algoritmer och annat upphovsrättsskyddat programmeringsinnehåll) som kan matas ut av stora språkmodeller.

Varning

Innehållssäkerhetstjänstens kodskanner/indexerare är endast aktuell till och med den 6 november 2021. Kod som lades till i GitHub efter det här datumet identifieras inte. Använd ditt eget omdöme när du använder skyddat material för kod för att identifiera de senaste kodkropparna.

Genom att identifiera och förhindra visning av skyddat material kan organisationer säkerställa efterlevnad av lagar om immateriella rättigheter, upprätthålla innehållets originalitet och skydda deras rykte.

Den här guiden innehåller information om vilka typer av innehåll som det skyddade material-API:et identifierar.

Användarscenarier

Plattformar för innehållsgenerering för kreativt skrivande

  • Scenario: En plattform för innehållsgenerering som använder generativ AI för kreativt skrivande (till exempel blogginlägg, berättelser, marknadsföringskopiering) integrerar funktionen Skyddat material för text för att förhindra att innehåll skapas som nära matchar känt upphovsrättsskyddat material.
  • Användare: Plattformsadministratörer och innehållsskapare.
  • Åtgärd: Plattformen använder Azure AI Content Safety för att skanna AI-genererat innehåll innan det tillhandahålls till användare. Om den genererade texten matchar skyddat material flaggas innehållet och blockeras eller revideras.
  • Resultat: Plattformen undviker potentiella intrång i upphovsrätten och ser till att allt genererat innehåll är original och följer immaterialrättslagstiftningen.

Automatiserat skapande av innehåll på sociala medier

  • Scenario: En digital marknadsföringsbyrå använder generativ AI för att automatisera skapandet av innehåll på sociala medier. Byrån integrerar funktionen Skyddat material för text för att undvika publicering av AI-genererat innehåll som innehåller upphovsrättsskyddad text, till exempel sångtexter eller utdrag från böcker.
  • Användare: Digitala marknadsförare och chefer för sociala medier.
  • Åtgärd: Byrån använder Azure AI Content Safety för att kontrollera allt AI-genererat innehåll på sociala medier efter matchningar mot en databas med skyddat material. Innehåll som matchar flaggas för revision eller blockeras från att publiceras.
  • Resultat: Byrån upprätthåller efterlevnaden av upphovsrättslagar och undviker ryktesrisker i samband med publicering av obehörigt innehåll.

AI-assisterad nyhetsskrivning

  • Scenario: En nyhetskanal använder generativ AI för att hjälpa journalister att skriva artiklar och rapporter. För att säkerställa att innehållet inte oavsiktligt replikerar skyddade nyhetsartiklar eller annat upphovsrättsskyddat material använder uttaget funktionen Skyddat material för text.
  • Användare: Journalister, redaktörer och efterlevnadsansvariga.
  • Åtgärd: Nyhetskanalen integrerar Azure AI Content Safety i arbetsflödet för att skapa innehåll. AI-genererade utkast genomsöks automatiskt efter skyddat innehåll innan de skickas in för redaktionell granskning.
  • Resultat: Nyhetskanalen förhindrar oavsiktliga upphovsrättsöverträdelser och upprätthåller integriteten och originaliteten i sin rapportering.

E-utbildningsplattformar med AI för innehållsgenerering

  • Scenario: En e-utbildningsplattform använder generativ AI för att generera utbildningsinnehåll, till exempel sammanfattningar, frågesporter och förklarande text. Plattformen använder funktionen Skyddat material för text för att säkerställa att det genererade innehållet inte innehåller skyddat material från läroböcker, artiklar eller akademiska artiklar.
  • Användare: Skapare av utbildningsinnehåll och efterlevnadsansvariga.
  • Åtgärd: Plattformen integrerar funktionen för att skanna AI-genererat utbildningsmaterial. Om något innehåll matchar känt skyddat akademiskt material flaggas det för revision eller tas bort automatiskt.
  • Resultat: Plattformen upprätthåller kvaliteten på utbildningsinnehållet och följer upphovsrättslagarna, vilket undviker användning av skyddat material i AI-genererade utbildningsresurser.

AI-baserade receptgeneratorer

  • Scenario: En webbplats för livsmedel och recept använder generativ AI för att generera nya recept baserat på användarpreferenser. För att undvika att generera innehåll som matchar skyddade recept från kända kokböcker eller webbplatser integrerar webbplatsen funktionen Skyddat material för text.
  • Användare: Innehållshanterare och plattformsadministratörer.
  • Åtgärd: Webbplatsen använder Azure AI Content Safety för att kontrollera AI-genererade recept mot en databas med känt skyddat innehåll. Om ett genererat recept matchar ett skyddat recept flaggas det och ändras eller blockeras.
  • Resultat: Webbplatsen säkerställer att alla AI-genererade recept är ursprungliga, vilket minskar risken för intrång i upphovsrätten.

Exempel på skyddad materialtext

I den här tabellen finns information om de viktigaste kategorierna av skyddad materialtextidentifiering. Alla fyra kategorierna tillämpas när du anropar API:et.

Kategori Omfattning Anses acceptabelt Anses vara skadligt
Recept Upphovsrättsskyddat innehåll som är relaterat till recept.

Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte överlappar receptens IP-upphovsrättsskada.
  • Länkar till webbsidor som innehåller information om recept
  • Allt innehåll från recept som inte har något eller lågt IP-/upphovsrättsskydd:
    • Listor över ingredienser
    • Grundläggande instruktioner för att kombinera och tillagningsingredienser
  • Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll:
    • Ändra ett ämne för att undvika att dela upphovsrättsskyddat innehåll
    • Vägran att dela upphovsrättsskyddat innehåll
    • Tillhandahålla information som inte svarar
  • Annat litterärt innehåll i ett recept
    • Matchande anekdoter, berättelser eller personliga kommentarer om receptet (40 tecken eller mer)
    • Kreativa namn för receptet som inte är begränsade till det välkända namnet på maträtten, eller en vanlig beskrivande sammanfattning av skålen som anger vad den primära ingrediensen är (40 tecken eller mer)
    • Kreativa beskrivningar av ingredienser eller steg för att kombinera eller laga ingredienser, inklusive beskrivningar som innehåller mer information än vad som behövs för att skapa skålen, förlita sig på oprecis formulering eller innehålla svordomar (40 tecken eller mer)
  • Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
    • Sätt att kringgå paywalls för att komma åt recept
Webbinnehåll Alla webbplatser som har webmd.com som url-domännamn. Fokuserar bara på frågor om upphovsrättsskyddat innehåll kring valt webbinnehåll.

Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar den valda webbinnehållsskadan.
  • Länkar till webbsidor
  • Korta utdrag eller kodfragment av valt webbinnehåll så länge som:
    • De är relevanta för användarens fråga
    • De är färre än 200 tecken
  • Väsentligt innehåll i valt webbinnehåll
    • Svarsavsnitt som är längre än 200 tecken och som har betydande likheter med ett textblock från det valda webbinnehållet
    • Utdrag från valt webbinnehåll som är längre än 200 tecken
    • Citattecken från markerat webbinnehåll som är längre än 200 tecken
  • Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
    • Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddat valt webbinnehåll
Nyheter Fokusera bara på frågor om upphovsrättsskyddat innehåll kring Nyheter.

Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar nyhets-IP Copyright-skada.
  • Länkar till webbsidor som är värdar för nyheter eller information om nyheter, tidskrifter eller bloggartiklar så länge:
    • De har legitima behörigheter
    • De har licensierad nyhetsbevakning
    • De är auktoriserade plattformar
  • Länkar till auktoriserade webbsidor som innehåller inbäddade ljud-/videospelare så länge:
    • De har legitima behörigheter
    • De har licensierad nyhetsbevakning
    • De är auktoriserade strömningsplattformar
    • De är officiella YouTube-kanaler
  • Korta utdrag/kodfragment som rubriker eller bildtexter från nyhetsartiklar så länge som:
    • De är relevanta för användarens fråga
    • De är inte en väsentlig del av artikeln
    • De är inte hela artikeln
  • Sammanfattning av nyhetsartiklar så länge:
    • Det är relevant för användarens fråga
    • Det är kort och sakligt
    • Den kopierar/parafraserar inte en väsentlig del av artikeln
    • Det anges tydligt och synligt som en sammanfattning
  • Analys/kritik/granskning av nyhetsartiklar så länge:
    • Det är relevant för användarens fråga
    • Det är kort och sakligt
    • Den kopierar/parafraserar inte en väsentlig del av artikeln
    • Det anges tydligt och synligt som en analys/kritik/granskning
  • Nyhetsinnehåll som inte har något IP-/upphovsrättsskydd:
    • Nyheter/tidskrifter/bloggar som är offentliga
    • Nyheter/tidskrifter/bloggar för vilka upphovsrättsskyddet har förflutit, överlämnats eller aldrig funnits
  • Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll:
    • Ändra ämne för att undvika att dela upphovsrättsskyddat innehåll
    • Vägran att dela upphovsrättsskyddat innehåll
    • Tillhandahålla information som inte svarar
  • Länkar till pdf eller någon annan fil som innehåller fulltext i nyhets-/tidnings-/bloggartiklar, såvida inte:
    • De kommer från auktoriserade plattformar med legitima behörigheter och licenser
  • Nyhetsinnehåll
    • Mer än 200 tecken tagna ordagrant från någon nyhetsartikel
    • Mer än 200 tecken liknar ett textblock från alla nyhetsartiklar
    • Direktåtkomst till nyheter/magasin/bloggartiklar som ligger bakom betalväggar
  • Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
    • Steg för att ladda ned nyheter från en obehörig webbplats
    • Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddade nyheter eller videor
Sångtext Fokuserar bara på frågor om upphovsrättsskyddat innehåll kring Låtar.

Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar Songs IP Copyright harm.
  • Länkar till webbsidor som innehåller information om låtar som:
    • Låttexter av låtarna
    • Ackord eller flikar i den associerade musiken
    • Analys eller recensioner av låten/musiken
  • Länkar till auktoriserade webbsidor som innehåller inbäddade ljud-/videospelare så länge:
    • De har legitima behörigheter
    • De har licensierat musik
    • De är auktoriserade strömningsplattformar
    • De är officiella YouTube-kanaler
  • Korta utdrag eller kodfragment från låtarnas texter så länge som:
    • De är relevanta för användarens fråga
    • De är inte en väsentlig del av texten
    • De är inte hela texten
    • De är inte mer än 11 ord långa
  • Korta utdrag eller kodfragment från ackord/flikar i låtarna så länge som:
    • De är relevanta för användarens fråga
    • De är inte en väsentlig del av ackorden/flikarna
    • De är inte hela ackorden/flikarna
  • Allt innehåll från låtar som inte har något IP-/upphovsrättsskydd:
    • Sånger/texter/ackord/flikar som finns i den offentliga domänen
    • Sånger/texter/ackord/flikar för vilka upphovsrättsskyddet har förflutit, överlämnats eller aldrig funnits
  • Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll:
    • Ändra ämne för att undvika att dela upphovsrättsskyddat innehåll
    • Vägran att dela upphovsrättsskyddat innehåll
    • Tillhandahålla information som inte svarar
  • Text av en låt
    • Hela texten
    • En betydande del av texten
    • En del av texter som innehåller mer än 11 ord
  • Ackord eller flikar i en låt
    • Hela ackord/flikar
    • Väsentlig del av ackorden/flikarna
  • Länkar till webbsidor som innehåller inbäddade ljud-/videospelare som:
    • Har inte legitima behörigheter
    • Har inte licensierad musik
    • Är inte auktoriserade strömningsplattformar
    • Är inte officiella YouTube-kanaler
  • Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
    • Steg för att ladda ned låtar från en obehörig webbplats
    • Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddade låtar eller videor

Nästa steg

Följ snabbstarten för att komma igång med Azure AI Content Safety för att identifiera skyddat material.