Udostępnij za pośrednictwem


Wykrywanie chronionych materiałów

Interfejs API tekstu chronionego materiału flaguje znaną zawartość tekstową (na przykład teksty piosenek, artykuły, przepisy i wybraną zawartość internetową), która może być wyjściowa przez duże modele językowe.

Interfejs API chronionego kodu materiałów flaguje chronioną zawartość kodu (ze znanych repozytoriów GitHub, w tym bibliotek oprogramowania, kodu źródłowego, algorytmów i innej zastrzeżonej zawartości programowania), która może być wyjściowa przez duże modele językowe.

Uwaga

Skaner/indeksator kodu usługi bezpieczeństwa zawartości jest obecny tylko do 6 listopada 2021 r. Kod dodany do usługi GitHub po tej dacie nie zostanie wykryty. Użyj własnego uznania w przypadku używania materiałów chronionych dla kodu do wykrywania ostatnich treści kodu.

Wykrywając i uniemożliwiając wyświetlanie materiałów chronionych, organizacje mogą zapewnić zgodność z przepisami dotyczącymi własności intelektualnej, zachować oryginalność treści i chronić ich reputację.

Ten przewodnik zawiera szczegółowe informacje o rodzajach zawartości wykrywanej przez chroniony interfejs API materiałów.

Scenariusze użytkownika

Platformy generowania zawartości do pisania kreatywnego

  • Scenariusz: platforma generowania zawartości, która używa generacyjnej sztucznej inteligencji do pisania twórczego (na przykład wpisów w blogu, historii, kopiowania marketingu) integruje funkcję Chronione materiały dla tekstu, aby zapobiec generowaniu zawartości, która ściśle pasuje do znanych materiałów chronionych prawami autorskimi.
  • Użytkownik: Administratorzy platformy i twórcy zawartości.
  • Akcja: platforma używa bezpieczeństwa zawartości usługi Azure AI do skanowania zawartości wygenerowanej przez sztuczną inteligencję przed udostępnieniem jej użytkownikom. Jeśli wygenerowany tekst jest zgodny z materiałem chronionym, zawartość jest oflagowana i blokowana lub zmieniana.
  • Wynik: Platforma unika potencjalnych naruszeń praw autorskich i zapewnia, że cała wygenerowana zawartość jest oryginalna i zgodna z prawami własności intelektualnej.

Automatyczne tworzenie zawartości w mediach społecznościowych

  • Scenariusz: Agencja marketingowa cyfrowa używa generowania sztucznej inteligencji do automatyzowania tworzenia zawartości w mediach społecznościowych. Agencja integruje funkcję Protected Material for Text, aby uniknąć publikowania zawartości wygenerowanej przez sztuczną inteligencję, która zawiera tekst chroniony prawem autorskim, taki jak teksty piosenek lub fragmenty książek.
  • Użytkownik: marketingowcy cyfrowi i menedżerowie mediów społecznościowych.
  • Akcja: Agencja zatrudnia bezpieczeństwo zawartości sztucznej inteligencji platformy Azure, aby sprawdzić całą zawartość mediów społecznościowych wygenerowaną przez sztuczną inteligencję pod kątem dopasowań do bazy danych materiałów chronionych. Zawartość zgodna z wersją jest oflagowana w celu uzyskania poprawki lub zablokowana do publikowania.
  • Wynik: Agencja utrzymuje zgodność z prawami autorskimi i unika ryzyka reputacji związanego z publikowaniem nieautoryzowanej zawartości.

Pisanie wiadomości wspomaganych przez sztuczną inteligencję

  • Scenariusz: Serwis informacyjny korzysta z generowania sztucznej inteligencji, aby pomóc dziennikarzom w tworzeniu artykułów i raportów. Aby upewnić się, że zawartość nie jest przypadkowo replikowana chronionych artykułów z wiadomościami ani innych materiałów chronionych prawami autorskimi, źródło korzysta z funkcji Chronione materiały do tekstu.
  • Użytkownik: Dziennikarze, redaktorzy i oficerowie zgodności.
  • Akcja: serwis informacyjny integruje bezpieczeństwo zawartości usługi Azure AI z przepływem pracy tworzenia zawartości. Wersje robocze generowane przez sztuczną inteligencję są automatycznie skanowane pod kątem chronionej zawartości przed przesłaniem do przeglądu redakcyjnego.
  • Wynik: Serwis informacyjny zapobiega przypadkowym naruszeniom praw autorskich i utrzymuje integralność i oryginalność jego raportowania.

Platformy uczenia elektronicznego korzystające ze sztucznej inteligencji na potrzeby generowania zawartości

  • Scenariusz: Platforma e-learningowa wykorzystuje generowaną sztuczną inteligencję do generowania treści edukacyjnych, takich jak podsumowania, quizy i tekst objaśniający. Platforma używa funkcji Chronione materiały dla tekstu, aby upewnić się, że wygenerowana zawartość nie zawiera materiałów chronionych przed podręcznikami, artykułami ani dokumentami akademickimi.
  • Użytkownik: Twórcy treści edukacyjnych i funkcjonariusze zgodności.
  • Akcja: Platforma integruje tę funkcję w celu skanowania materiałów edukacyjnych generowanych przez sztuczną inteligencję. Jeśli jakakolwiek zawartość jest zgodna ze znanym chronionym materiałem akademickim, jest oflagowana do wersji lub jest automatycznie usuwana.
  • Wynik: Platforma utrzymuje jakość treści edukacyjnych i jest zgodna z prawami autorskimi, unikając korzystania z materiałów chronionych w zasobach szkoleniowych generowanych przez sztuczną inteligencję.

Generatory przepisów opartych na sztucznej inteligencji

  • Scenariusz: witryna internetowa żywności i przepisu używa generowania sztucznej inteligencji do generowania nowych przepisów na podstawie preferencji użytkownika. Aby uniknąć generowania zawartości zgodnej z przepisami chronionymi ze znanych książek kucharzy lub stron internetowych, witryna internetowa integruje funkcję Chroniony materiał do tekstu.
  • Użytkownik: Menedżerowie zawartości i administratorzy platformy.
  • Akcja: Witryna internetowa używa bezpieczeństwa zawartości sztucznej inteligencji platformy Azure do sprawdzania przepisów generowanych przez sztuczną inteligencję względem bazy danych znanej chronionej zawartości. Jeśli wygenerowany przepis jest zgodny z chronionym przepisem, jest oflagowany i poprawiony lub zablokowany.
  • Wynik: Witryna internetowa gwarantuje, że wszystkie przepisy generowane przez sztuczną inteligencję są oryginalne, zmniejszając ryzyko naruszenia praw autorskich.

Przykłady tekstu chronionego materiału

Zapoznaj się z tą tabelą, aby uzyskać szczegółowe informacje na temat głównych kategorii wykrywania tekstu chronionego materiału. Wszystkie cztery kategorie są stosowane podczas wywoływania interfejsu API.

Kategoria Scope Uznane za dopuszczalne Uważane za szkodliwe
Przepisy Zawartość z prawami autorskimi związana z przepisami.

Inny szkodliwy lub poufny tekst jest poza zakresem tego zadania, chyba że przecina się z prawami autorskimi IP przepisów.
  • Linki do stron internetowych zawierających informacje o przepisach
  • Wszelkie treści z przepisów, które nie mają lub nie mają niskich ochrony ip/praw autorskich:
    • Listy składników
    • Podstawowe instrukcje dotyczące łączenia i gotowania składników
  • Odrzucenie lub odmowa podania treści chronionych prawami autorskimi:
    • Zmienianie tematu w celu uniknięcia udostępniania zawartości chronionej prawami autorskimi
    • Odmowa udostępniania treści chronionych prawami autorskimi
    • Podawanie informacji o braku odpowiedzi
  • Inne treści literackie w przepisie
    • Dopasowywanie anegdot, opowieści lub osobistego komentarza na temat przepisu (40 znaków lub więcej)
    • Twórcze nazwy przepisu, które nie są ograniczone do dobrze znanej nazwy danie, lub zwykłe opisowe podsumowanie danie wskazujące, co jest podstawowym składnikiem (40 znaków lub więcej)
    • Twórcze opisy składników lub kroków do łączenia lub gotowania składników, w tym opisy zawierające więcej informacji niż potrzebne do utworzenia danie, polegają na nieprecyzyjnym sformułowaniu lub zawierają wulgaryzmy (40 znaków lub więcej)
  • Metody uzyskiwania dostępu do zawartości chronionej prawem autorskim:
    • Sposoby obejścia paywalls w celu uzyskania dostępu do przepisów
Zawartość sieci Web Wszystkie witryny internetowe, które mają webmd.com jako nazwę domeny adresu URL. Koncentruje się tylko na kwestiach dotyczących zawartości chronionej prawem autorskim wokół wybranej zawartości sieci Web.

Inny szkodliwy lub poufny tekst jest poza zakresem tego zadania, chyba że przecina zaznaczoną zawartość sieci Web.
  • Łącza do stron internetowych
  • Krótkie fragmenty lub fragmenty wybranej zawartości sieci Web, o ile:
    • Są one istotne dla zapytania użytkownika
    • Są one mniejsze niż 200 znaków
  • Znaczna zawartość wybranej zawartości sieci Web
    • Sekcje odpowiedzi dłuższe niż 200 znaków, które mają znaczne podobieństwo do bloku tekstu z wybranej zawartości sieci Web
    • Fragmenty wybranej zawartości sieci Web, które są dłuższe niż 200 znaków
    • Cytaty z wybranej zawartości sieci Web, które są dłuższe niż 200 znaków
  • Metody uzyskiwania dostępu do zawartości chronionej prawem autorskim:
    • Sposoby obejścia funkcji paywalls lub ochrony DRM w celu uzyskania dostępu do wybranej zawartości internetowej objętej prawami autorskimi
Wiadomości Skoncentruj się tylko na kwestiach treści chronionych prawami autorskimi wokół Wiadomości.

Inny szkodliwy lub poufny tekst jest poza zakresem tego zadania, chyba że przecina szkody w prawach autorskich do wiadomości.
  • Linki do stron internetowych hostujących wiadomości lub informacje o wiadomościach, magazynach lub artykułach w blogu, o ile:
    • Mają one uzasadnione uprawnienia
    • Mają licencjonowane wiadomości
    • Są to autoryzowane platformy
  • Linki do autoryzowanych stron internetowych zawierających osadzone odtwarzacze audio/wideo, o ile:
    • Mają one uzasadnione uprawnienia
    • Mają licencjonowane wiadomości
    • Są to autoryzowane platformy przesyłania strumieniowego
    • Są to oficjalne kanały YouTube
  • Krótkie fragmenty/fragmenty, takie jak nagłówki lub napisy z artykułów informacyjnych, o ile:
    • Są one istotne dla zapytania użytkownika
    • Nie są one istotną częścią artykułu
    • Nie są one całym artykułem
  • Podsumowanie artykułów z wiadomościami, o ile:
    • Jest to istotne dla zapytania użytkownika
    • Jest to krótkie i faktyczne
    • Nie kopiuje/parafrazuje istotnej części artykułu
    • Jest wyraźnie i wyraźnie cytowany jako podsumowanie
  • Analiza/Krytyka/Przegląd artykułów z wiadomościami, o ile:
    • Jest to istotne dla zapytania użytkownika
    • Jest to krótkie i faktyczne
    • Nie kopiuje/parafrazuje istotnej części artykułu
    • Jest wyraźnie i wyraźnie cytowany jako analiza/krytyka/przegląd
  • Każda zawartość wiadomości, która nie ma ochrony adresów IP/praw autorskich:
    • News/Magazines/Blogi, które znajdują się w domenie publicznej
    • News/Magazines/Blogi, dla których ochrona praw autorskich upłynęła, została poddana lub nigdy nie istniała
  • Odrzucenie lub odmowa podania treści chronionych prawami autorskimi:
    • Zmienianie tematu w celu uniknięcia udostępniania zawartości chronionej prawem autorskim
    • Odmowa udostępniania treści chronionych prawami autorskimi
    • Podawanie informacji o braku odpowiedzi
  • Linki do pliku PDF lub dowolnego innego pliku zawierającego pełny tekst artykułów news/magazine/blog, chyba że:
    • Pochodzą one z autoryzowanych platform z uzasadnionymi uprawnieniami i licencjami
  • Zawartość wiadomości
    • Więcej niż 200 znaków wykonanych dosłownie z dowolnego artykułu z wiadomościami
    • Więcej niż 200 znaków jest znacznie podobnych do bloku tekstu z dowolnego artykułu z wiadomościami
    • Bezpośredni dostęp do wiadomości/magazynu/artykułów w blogu, które znajdują się za paywalls
  • Metody uzyskiwania dostępu do zawartości chronionej prawem autorskim:
    • Kroki pobierania wiadomości z nieautoryzowanej witryny internetowej
    • Sposoby obejścia paywalls lub ochrony DRM w celu uzyskania dostępu do chronionych prawami autorskimi wiadomości lub filmów wideo
Tekst Koncentruje się tylko na kwestiach treści chronionych prawem autorskim wokół piosenek.

Inny szkodliwy lub poufny tekst jest poza zakresem tego zadania, chyba że przecina prawa autorskie do piosenek.
  • Łącza do stron internetowych zawierających informacje o piosenkach, takich jak:
    • Teksty piosenek
    • Akordy lub karty skojarzonej muzyki
    • Analiza lub przeglądy piosenki/muzyki
  • Linki do autoryzowanych stron internetowych zawierających osadzone odtwarzacze audio/wideo, o ile:
    • Mają one uzasadnione uprawnienia
    • Mają licencjonowane muzykę
    • Są to autoryzowane platformy przesyłania strumieniowego
    • Są to oficjalne kanały YouTube
  • Krótkie fragmenty lub fragmenty tekstów piosenek tak długo, jak:
    • Są one istotne dla zapytania użytkownika
    • Nie są one znaczną częścią tekstów
    • Nie są to całe teksty
    • Nie są dłuższe niż 11 wyrazów
  • Krótkie fragmenty lub fragmenty z akordów/tabulatorów piosenek tak długo, jak:
    • Są one istotne dla zapytania użytkownika
    • Nie są one znaczną częścią akordów/tabulacji
    • Nie są one całymi akordami/tabulatorami
  • Wszelkie treści z piosenek, które nie mają ochrony adresów IP/praw autorskich:
    • Utwory/teksty/akordy/karty, które znajdują się w domenie publicznej
    • Piosenki/teksty/akordy/tabulatory, dla których ochrona praw autorskich upłynęła, została poddana lub nigdy nie istniała
  • Odrzucenie lub odmowa podania treści chronionych prawami autorskimi:
    • Zmienianie tematu w celu uniknięcia udostępniania zawartości chronionej prawem autorskim
    • Odmowa udostępniania treści chronionych prawami autorskimi
    • Podawanie informacji o braku odpowiedzi
  • Teksty piosenki
    • Całe teksty
    • Znaczna część tekstów
    • Część tekstów zawierających więcej niż 11 słów
  • Akordy lub tabulatory piosenki
    • Całe akordy/tabulatory
    • Znaczna część akordów/kart
  • Linki do stron internetowych zawierających osadzone odtwarzacze audio/wideo, które:
    • Nie masz uzasadnionych uprawnień
    • Nie masz licencjonowanej muzyki
    • Nie są autoryzowanymi platformami przesyłania strumieniowego
    • Nie są oficjalnymi kanałami YouTube
  • Metody uzyskiwania dostępu do zawartości chronionej prawem autorskim:
    • Kroki pobierania piosenek z nieautoryzowanej witryny internetowej
    • Sposoby obejścia paywalls lub ochrony DRM w celu uzyskania dostępu do chronionych praw autorskich piosenek lub filmów wideo

Następne kroki

Postępuj zgodnie z przewodnikiem Szybki start, aby rozpocząć korzystanie z bezpieczeństwa zawartości usługi Azure AI w celu wykrywania chronionych materiałów.