Der Filter für die Geschützte Materialerkennung überprüft die Ausgabe großer Sprachmodelle (LLMs), um bekannte geschütztes Material zu identifizieren und zu kennzeichnen. Es hilft Organisationen, die Generierung von Inhalten zu verhindern, die eng mit urheberrechtlich geschütztem Text oder Code übereinstimmen.
Der Geschützte Materialtextfilter kennzeichnet bekannte Textinhalte, die von großen Sprachmodellen ausgegeben werden können, z. B. Songtexte, Artikel, Rezepte und ausgewählte Webinhalte.
Der geschützte Materialcodefilter kennzeichnet geschützte Codeinhalte, die von großen Sprachmodellen ausgegeben werden können. Dies ist Inhalt in bekannten GitHub Repositorys und umfasst Softwarebibliotheken, Quellcode, Algorithmen und andere proprietäre Programmierinhalte.
Wichtig
Die Guardrails- und Kontrollmodelle für geschützte Materialerkennung, Erdheitserkennung und benutzerdefinierte Kategorien (Standard) funktionieren nur mit Englisch.
Andere Inhaltsfiltermodelle werden speziell geschult und auf die folgenden Sprachen getestet: Chinesisch, Englisch, Französisch, Deutsch, Spanisch, Italienisch, Japanisch, Portugiesisch. Diese Features können jedoch in vielen anderen Sprachen funktionieren, aber die Qualität kann variieren. In allen Fällen sollten Sie eigene Tests durchführen, um sicherzustellen, dass sie für Ihre Anwendung funktioniert.
Vorsicht
Der Codescanner/Indexer des Inhaltssicherheitsdiensts ist nur bis zum 6. April 2023 aktuell. Code, der nach diesem Datum zu GitHub hinzugefügt wurde, wird nicht erkannt. Verwenden Sie Ihren eigenen Ermessensspielraum, wenn Sie geschütztes Material für Code verwenden, um aktuelle Codetexte zu erkennen.
Durch das Erkennen und Verhindern der Anzeige geschützter Materialien können Organisationen die Einhaltung der Gesetze zum geistigen Eigentum sicherstellen, die Originalität von Inhalten beibehalten und ihre Reputation schützen.
Dieses Handbuch enthält Details zu den Arten von Inhalten, die von der geschützten Material-API erkannt werden.
Benutzerszenarien
Plattformen für die Inhaltsgenerierung für kreatives Schreiben
- Szenario: Eine Plattform zur Inhaltsgenerierung, die generative KI für kreatives Schreiben verwendet (z. B. Blogbeiträge, Geschichten, Marketingkopie), integriert das Feature "Geschütztes Material für Text", um die Generierung von Inhalten zu verhindern, die eng mit bekannten urheberrechtlich geschützten Materialien übereinstimmen.
- Benutzer: Plattformadministratoren und Inhaltsersteller.
- Aktion: Die Plattform verwendet Azure KI Inhaltssicherheit, um KI-generierte Inhalte zu scannen, bevor sie den Benutzern zur Verfügung gestellt wird. Wenn der generierte Text mit geschütztem Material übereinstimmt, wird der Inhalt gekennzeichnet und entweder blockiert oder überarbeitet.
- Ergebnis: Die Plattform vermeidet potenzielle Urheberrechtsverletzungen und stellt sicher, dass alle generierten Inhalte original sind und den Gesetzen des geistigen Eigentums entsprechen.
Automatisierte Erstellung von Social Media-Inhalten
- Szenario: Eine digitale Marketingagentur verwendet generative KI, um die Erstellung von Social Media-Inhalten zu automatisieren. Die Agentur integriert das Geschützte Material für Text-Feature, um die Veröffentlichung von KI-generierten Inhalten zu vermeiden, die urheberrechtlich geschützte Texte enthalten, z. B. Songtexte oder Auszüge aus Büchern.
- Benutzer: Digitale Vermarkter und Social Media Manager.
- Aktion: Die Agentur setzt Azure KI Inhaltssicherheit ein, um alle KI-generierten Social Media-Inhalte auf Übereinstimmungen mit einer Datenbank geschützten Materials zu überprüfen. Inhalte, die übereinstimmen, werden für Überarbeitungen gekennzeichnet oder für die Veröffentlichung blockiert.
- Ergebnis: Die Agentur hält die Einhaltung der Urheberrechtsgesetze aufrecht und vermeidet Reputationsrisiken im Zusammenhang mit der Veröffentlichung nicht autorisierter Inhalte.
KI-unterstütztes Nachrichtenschreiben
- Szenario: Eine Nachrichtenagentur verwendet generative KI, um Journalisten bei der Erstellung von Artikeln und Berichten zu unterstützen. Um sicherzustellen, dass der Inhalt nicht unbeabsichtigt geschützte Nachrichtenartikel oder andere urheberrechtlich geschützte Inhalte repliziert, verwendet das Outlet das Feature "Geschütztes Material für Text".
- Benutzer: Journalisten, Redakteure und Compliance Officer.
- Aktion: Das News-Outlet integriert Azure KI Inhaltssicherheit in seinen Inhaltserstellungsworkflow. KI-generierte Entwürfe werden automatisch nach geschützten Inhalten gescannt, bevor sie zur redaktionellen Überprüfung eingereicht werden.
- Ergebnis: Die News-Outlet verhindert versehentliche Urheberrechtsverletzungen und behält die Integrität und Originalität ihrer Berichterstattung bei.
E-Learning-Plattformen, die KI für die Inhaltsgenerierung verwenden
- Szenario: Eine E-Learning-Plattform verwendet generative KI zum Generieren von Lerninhalten, z. B. Zusammenfassungen, Quizfragen und erläuterndem Text. Die Plattform verwendet das Feature "Geschütztes Material für Text", um sicherzustellen, dass die generierten Inhalte kein geschütztes Material aus Lehrbüchern, Artikeln oder akademischen Arbeiten enthalten.
- Benutzer: Ersteller von Bildungsinhalten und Compliance-Beauftragte.
- Aktion: Die Plattform integriert das Feature zum Scannen von KI-generierten Lernmaterialien. Wenn Inhalte mit bekannten geschützten akademischen Materialien übereinstimmen, wird sie zur Überarbeitung gekennzeichnet oder automatisch entfernt.
- Ergebnis: Die Plattform verwaltet die Qualität von Bildungsinhalten und hält die Urheberrechte ein und vermeidet die Verwendung geschützter Materialien in KI-generierten Lernressourcen.
KI-gestützte Rezeptgeneratoren
- Szenario: Eine Lebensmittel- und Rezeptwebsite verwendet generative KI, um neue Rezepte basierend auf den Benutzereinstellungen zu generieren. Um zu vermeiden, dass Inhalte generiert werden, die geschützten Rezepten aus berühmten Kochbüchern oder Websites entsprechen, integriert die Website das geschützte Material für Text-Feature.
- Benutzer: Inhaltsmanager und Plattformadministratoren.
- Aktion: Die Website verwendet Azure KI Inhaltssicherheit, um KI-generierte Rezepte anhand einer Datenbank bekannter geschützter Inhalte zu überprüfen. Wenn ein generiertes Rezept mit einem geschützten Rezept übereinstimmt, wird es gekennzeichnet und überarbeitet oder blockiert.
- Ergebnis: Die Website stellt sicher, dass alle KI-generierten Rezepte original sind und das Risiko einer Urheberrechtsverletzung verringern.
- Szenario: Eine Softwareentwicklungsplattform, die generative KI nutzt, um Entwicklern beim Schreiben von Code zu helfen, das Feature "Geschütztes Material für Code" zu integrieren, um die Generierung von Code zu verhindern, die Material aus vorhandenen GitHub Repositorys repliziert.
- Benutzer: Plattformadministratoren, Entwickler.
- Aktion: Die Plattform verwendet Azure KI Inhaltssicherheit, um KI-generierten Code zu scannen. Wenn Code mit geschütztem Material übereinstimmt, wird er zur Überprüfung, Überarbeitung oder Sperrung gekennzeichnet.
- Ergebnis: Die Plattform stellt sicher, dass der gesamte KI-generierte Code original ist und Lizenzvereinbarungen erfüllt, wodurch rechtliche und Compliance-Risiken reduziert werden.
- Szenario: Ein Entwicklungsteam verwendet generative KI, um Teile des Schreibens von Code zu automatisieren. Das Team integriert das Feature "Geschütztes Material für Code", um die versehentliche Verwendung von Codeausschnitten zu verhindern, die mit Inhalten aus vorhandenen GitHub Repositorys übereinstimmen, einschließlich Open-Source-Code mit restriktiven Lizenzen.
- Benutzer: Softwareentwickler, DevOps-Teams.
- Aktion: Azure KI Inhaltssicherheit überprüft den generierten Code anhand bekannter Materialien aus GitHub Repositorys. Wenn eine Übereinstimmung gefunden wird, wird der Code gekennzeichnet und überarbeitet, bevor er in das Projekt integriert wird.
- Ergebnis: Das Team vermeidet potenzielle Urheberrechtsverletzungen und stellt sicher, dass der ki-generierte Code den entsprechenden Lizenzen entspricht.
KI-unterstützte Codeüberprüfungen
- Szenario: Ein Softwareunternehmen integriert KI-unterstützte Codeüberprüfungstools in seinen Entwicklungsprozess. Um zu vermeiden, dass geschützter Code aus GitHub oder externen Bibliotheken eingeführt wird, verwendet das Unternehmen das Feature "Geschütztes Material für Code".
- Benutzer: Codeprüfer, Softwareentwickler, Compliance Officer.
- Aktion: Das Unternehmen überprüft vor der endgültigen Codeüberprüfung und -bereitstellung alle KI-generierten Code auf Übereinstimmungen gegen geschütztes Material aus GitHub Repositorys.
- Ergebnis: Das Unternehmen verhindert, dass geschütztes Material in ihre Projekte aufgenommen wird, wobei die Einhaltung der Gesetze zum geistigen Eigentum und interne Standards beibehalten wird.
- Szenario: Eine E-Learning-Plattform verwendet generative KI, um Beispielcode für Programmierlernprogramme und Kurse zu generieren. Die Plattform integriert das Feature "Geschütztes Material für Code", um sicherzustellen, dass generierte Beispiele keinen Code aus vorhandenen GitHub Repositorys oder anderen Bildungsquellen duplizieren.
- Benutzer: Kursersteller, Plattformadministratoren.
- Aktion: Azure KI Inhaltssicherheit überprüft alle KI-generierten Codebeispiele auf geschützte Inhalte. Übereinstimmungen werden gekennzeichnet, überprüft und überarbeitet.
- Ergebnis: Die Plattform behält die Integrität und Originalität ihrer Bildungsinhalte bei, während sie den Urheberrechtsgesetzen entspricht.
KI-gestützte Codierungsassistenten
- Szenario: Ein Codierungs-Assistent-Tool, das von generativer KI unterstützt wird, hilft Entwicklern durch Generieren von Codevorschlägen. Um sicherzustellen, dass keine Vorschläge gegen Code aus GitHub Repositorys verstoßen, verwendet das Assistenttool das Feature "Geschütztes Material für Code".
- Benutzer: Entwickler, Tooladministratoren.
- Aktion: Das Tool durchsucht alle Codevorschläge nach geschütztem Material von GitHub, bevor sie Entwicklern präsentiert werden. Wenn ein Vorschlag mit geschütztem Code übereinstimmt, wird er gekennzeichnet und nicht angezeigt.
- Ergebnis: Der Codierungs-Assistent stellt sicher, dass alle Codevorschläge frei von geschützten Inhalten sind, die Originalität fördern und rechtliche Risiken reduzieren.
Durch die Integration des Features "Geschütztes Material für Code" können Organisationen Risiken im Zusammenhang mit KI-generierten Code verwalten, die Einhaltung der Gesetze zum geistigen Eigentum beibehalten und die Originalität ihrer Codeausgabe sicherstellen.
Beispiele für geschützten Materialtext
Ausführliche Informationen zu den hauptkategorien der Erkennung geschützter Materialtexte finden Sie in dieser Tabelle. Alle vier Kategorien werden angewendet, wenn Sie die API aufrufen.
| Kategorie |
Umfang |
Als akzeptabel angesehen |
Als schädlich eingestuft |
| Rezepte |
Urheberrechtlich geschützte Inhalte im Zusammenhang mit Rezepten.
Andere schädliche oder sensible Texte fallen nicht in den Aufgabenbereich, es sei denn, sie überschneiden sich mit Schäden an den Urheberrechtsverletzungen im Zusammenhang mit Rezepten. |
- Links zu Webseiten, die Informationen zu Rezepten enthalten
- Alle Inhalte aus Rezepten, die keinen oder geringen IP/Copyright-Schutz aufweisen:
- Zutatenlisten
- Grundlegende Anweisungen zum Kombinieren und Kochen von Zutaten
- Ablehnung oder Verweigerung der Bereitstellung urheberrechtlich geschützter Inhalte.
- Ändern eines Themas, um die Freigabe von urheberrechtlich geschützten Inhalten zu vermeiden
- Weigerung, urheberrechtlich geschützte Inhalte zu teilen
- Bereitstellen nicht reagierender Informationen
|
- Andere literarische Inhalte in einem Rezept
- Passende Anekdoten, Geschichten oder persönliche Kommentare zum Rezept (40 Zeichen oder mehr)
- Kreative Namen für das Rezept, das nicht auf den bekannten Namen des Gerichts beschränkt ist, oder eine einfache beschreibende Zusammenfassung des Gerichts, die angibt, was der Hauptzutat ist (40 Zeichen oder mehr)
- Kreative Beschreibungen der Zutaten oder Schritte zum Kombinieren oder Kochen von Zutaten, einschließlich Beschreibungen, die mehr Informationen enthalten als erforderlich, um das Gericht zu erstellen, sich auf ungenaue Formulierungen verlassen oder Profanität enthalten (40 Zeichen oder mehr)
- Methoden für den Zugriff auf urheberrechtlich geschützte Inhalte:
- Möglichkeiten zum Umgehen von Paywalls für den Zugriff auf Rezepte
|
| Webinhalte |
Alle Websites, deren URL-Domänenname webmd.com ist. Konzentriert sich nur auf Themen mit urheberrechtlich geschützten Inhalten rund um ausgewählte Webinhalte.
Andere schädliche oder vertrauliche Texte sind für diese Aufgabe außerhalb des Gültigkeitsbereichs, es sei denn, er überschneidet den Beeinträchtigungen des ausgewählten Webinhalts. |
- Links zu Webseiten
- Kurze Auszüge oder Codeausschnitte ausgewählter Webinhalte, sofern:
- Sie sind für die Abfrage des Benutzers relevant.
- Sie sind weniger als 200 Zeichen
|
- Substanzieller Inhalt des ausgewählten Webinhalts
- Antwortabschnitte mit mehr als 200 Zeichen, die eine erhebliche Ähnlichkeit mit einem Textblock aus dem ausgewählten Webinhalt aufweisen
- Auszüge aus ausgewählten Webinhalten, die länger als 200 Zeichen sind
- Zitate aus ausgewählten Webinhalten, die eine Länge von mehr als 200 Zeichen haben
- Methoden für den Zugriff auf urheberrechtlich geschützte Inhalte:
- Möglichkeiten zum Umgehen von Paywalls oder DRM-Schutz für den Zugriff auf urheberrechtlich geschützte ausgewählte Webinhalte
|
| Nachrichten |
Konzentrieren Sie sich nur auf Themen mit urheberrechtlich geschützten Inhalten rund um News.
Andere schädliche oder sensible Texte fallen nicht in den Aufgabenbereich, es sei denn, sie betreffen Urheberrechtsverletzungen im Zusammenhang mit Nachrichtendiensten. |
- Links zu Webseiten, auf denen Nachrichten oder Informationen zu News, Zeitschriften oder Blogartikeln gehostet werden, sofern:
- Sie verfügen über legitime Berechtigungen
- Sie verfügen über lizenzierte Nachrichtenberichterstattung
- Sie sind autorisierte Plattformen
- Links zu autorisierten Webseiten, die eingebettete Audio-/Videoplayer enthalten, sofern:
- Sie verfügen über legitime Berechtigungen
- Sie verfügen über lizenzierte Nachrichtenberichterstattung
- Sie sind autorisierte Streamingplattformen
- Sie sind offizielle YouTube-Kanäle
- Kurze Textschnipsel wie Überschriften oder Bildunterschriften aus Nachrichtenartikeln, sofern:
- Sie sind für die Abfrage des Benutzers relevant.
- Sie sind kein wesentlicher Bestandteil des Artikels.
- Sie sind nicht der gesamte Artikel
- Zusammenfassung der Newsartikel, sofern:
- Es ist für die Abfrage des Benutzers relevant.
- Es ist kurz und sachlich
- Es kopiert oder paraphrasiert keinen wesentlichen Teil des Artikels.
- Es wird klar und sichtbar als Zusammenfassung zitiert.
- Analyse/Kritik/Bewertung von Newsartikeln solange:
- Es ist für die Abfrage des Benutzers relevant.
- Es ist kurz und sachlich
- Es kopiert oder paraphrasiert keinen wesentlichen Teil des Artikels.
- Es wird klar und sichtbar als Analyse/Kritik/Rezension zitiert.
- Alle Nachrichteninhalte ohne IP/Copyright-Schutz:
- News/Magazine/Blogs, die sich in der öffentlichen Domäne befinden
- News/Magazine/Blogs, für die urheberrechtsschutz verstrichen, aufgegeben oder nie existierte
- Ablehnung oder Verweigerung der Bereitstellung urheberrechtlich geschützter Inhalte:
- Ändern des Themas, um die Freigabe von urheberrechtlich geschützten Inhalten zu vermeiden
- Weigerung, urheberrechtlich geschützte Inhalte zu teilen
- Bereitstellen nicht reagierender Informationen
|
- Links zu PDF oder einer anderen Datei, die vollständigen Text von News/Magazin/Blogartikeln enthält, es sei denn,
- Sie stammen aus autorisierten Plattformen mit legitimen Berechtigungen und Lizenzen
- Newsinhalte
- Mehr als 200 Zeichen, die aus einem Newsartikel stammen
- Mehr als 200 Zeichen ähnlich einem Textblock aus jedem Newsartikel
- Direkter Zugang zu News/Magazin/Blogartikeln, die hinter Paywalls stehen
- Methoden für den Zugriff auf urheberrechtlich geschützte Inhalte:
- Schritte zum Herunterladen von Nachrichten von einer nicht autorisierten Website
- Möglichkeiten, Paywalls oder DRM-Schutz zu umgehen, um auf urheberrechtlich geschützte Nachrichten oder Videos zuzugreifen
|
| Songtexte |
Konzentriert sich nur auf Themen mit urheberrechtlich geschützten Inhalten rund um Songs.
Texte, die schädlich oder sensibel sind, liegen außerhalb des Aufgabenbereichs für diese Aufgabe, es sei denn, sie überschneiden sich mit Songs Urheberrecht Schaden. |
- Links zu Webseiten, die Informationen zu Songs enthalten, z. B.:
- Texte der Lieder
- Akkorde oder Tabulaturen der zugehörigen Musik
- Analyse oder Bewertungen des Songs/der Musik
- Links zu autorisierten Webseiten, die eingebettete Audio-/Videoplayer enthalten, sofern:
- Sie verfügen über legitime Berechtigungen
- Sie haben lizenzierte Musik
- Sie sind autorisierte Streamingplattformen
- Sie sind offizielle YouTube-Kanäle
- Kurze Auszüge oder Ausschnitte aus Songtexten, sofern:
- Sie sind für die Abfrage des Benutzers relevant.
- Sie sind kein wesentlicher Bestandteil der Texte
- Sie sind nicht die gesamten Liedtexte
- Sie sind nicht mehr als 11 Wörter lang
- Kurze Auszüge oder Ausschnitte aus Akkorden/Tabulaturen der Songs, sofern:
- Sie sind für die Abfrage des Benutzers relevant.
- Sie sind kein wesentlicher Bestandteil der Akkorde/Tabs.
- Sie sind nicht die gesamten Akkorde/Tabs.
- Alle Inhalte von Songs ohne IP/Copyright-Schutz:
- Lieder, Texte, Akkorde, Tabs, die gemeinfrei sind
- Songs/Lyrics/Chords/Tabs, für die der Urheberrechtsschutz verfallen ist, aufgegeben wurde oder nie existiert hat
- Ablehnung oder Verweigerung der Bereitstellung urheberrechtlich geschützter Inhalte:
- Ändern des Themas, um die Freigabe von urheberrechtlich geschützten Inhalten zu vermeiden
- Weigerung, urheberrechtlich geschützte Inhalte zu teilen
- Bereitstellen nicht reagierender Informationen
|
- Texte eines Liedes
- Ganze Texte
- Wesentlicher Teil der Texte
- Teil von Texten, die mehr als 11 Wörter enthalten
- Akkorde oder Tabulaturen eines Liedes
- Ganze Akkorde/Tabulaturen
- Ein wesentlicher Teil der Akkorde/Tabulaturen
- Links zu Webseiten, die eingebettete Audio-/Videoplayer enthalten, die:
- Keine gültigen Berechtigungen vorhanden.
- Keine lizenzierte Musik
- Keine autorisierten Streamingplattformen
- Sind keine offiziellen YouTube-Kanäle
- Methoden für den Zugriff auf urheberrechtlich geschützte Inhalte:
- Schritte zum Herunterladen von Songs von einer nicht autorisierten Website
- Möglichkeiten, Paywalls oder DRM-Schutz zu umgehen, um auf urheberrechtlich geschützte Songs oder Videos zuzugreifen
|
Problembehandlung
Falsch positive Ergebnisse
Wenn geschützte Materialerkennung Inhalte kennzeichnet, die tatsächlich nicht geschützt sind:
- Überprüfen Sie, ob die Erkennungskategorie (Lyrics, Nachrichten, Rezepte, Code) mit Ihrem Anwendungsfall übereinstimmt.
- Überprüfen Sie, ob der gekennzeichnete Inhalt die Zeichen-/Wortschwellenwerte überschreitet (40 Zeichen für Rezepte, 200 Zeichen für News, 11 Wörter für Text)
- Überprüfen Sie die Kriterien "Als akzeptabel angesehen" in der Tabelle mit den Erkennungskategorien.
Inhalt wird nicht erkannt
Falls das erwartete geschützte Material nicht gekennzeichnet ist:
- Für den Code: Überprüfen, ob das Repository vor dem 6. April 2023 indiziert wurde
- Für Text: Bestätigen Sie, dass der Inhalt einer der vier Erkennungskategorien entspricht (Rezepte, Webinhalt, News, Text)
- Überprüfen Sie, ob die Sprachunterstützungsanforderungen erfüllt sind (Englisch für Guardrails-Modelle)
Integrationsprobleme
Für Integrationsprobleme:
- Überprüfen, ob Ihre Azure KI Inhaltssicherheit Ressource ordnungsgemäß konfiguriert ist
- Überprüfen, ob API-Authentifizierungsanmeldeinformationen gültig sind
- Überprüfen Sie den Schnellstart für Inhaltssicherheit für die korrekte Verwendung der API
Nächste Schritte