Partager via


Détection de matériel protégé

L’API texte de matériel protégé indique les contenus de texte connu (par exemple, paroles de chanson, articles, recettes et contenu web sélectionné) qui peuvent être générés par les grands modèles de langage.

L’interface de programmation d’applications (API) Matériel protégé pour le code signale du contenu de code protégé (provenant de référentiels GitHub connus, notamment les bibliothèques de logiciels, le code source, les algorithmes et d’autres contenus de programmation propriétaires) qui est susceptible être généré par de grands modèles de langage.

Attention

Le scanneur/indexeur de code du service de sécurité du contenu est uniquement actif jusqu’au 6 novembre 2021. Le code ajouté à GitHub après cette date n’est pas détecté. Utilisez votre propre jugement lors de l’utilisation de Matériel protégé pour le code afin de détecter des corps récents de code.

La détection et la prévention de l’affichage du code protégé permet aux organisations de garantir la conformité aux lois sur la propriété intellectuelle, de respecter l’originalité du code et de protéger leur réputation.

Ce guide fournit des informations sur les types de contenu détectés par l’API de matériel protégé.

Scénarios utilisateur

Plateformes de génération de contenu pour l’écriture créative

  • Scénario : une plateforme de génération de contenu qui utilise l’IA générative pour l’écriture créative (par exemple, des publications de blog, des témoignages et des copies marketing) intègre la fonctionnalité Matériel protégé pour le texte afin d’empêcher la génération de contenu correspondant étroitement aux documents connus protégés par droits d’auteur.
  • Utilisateurs : administrateurs de plateforme et créateurs de contenu.
  • Action : la plateforme utilise Azure AI Sécurité du Contenu pour analyser le contenu généré par l’IA avant de le fournir aux utilisateurs. Si le texte généré correspond au matériel protégé, le contenu est marqué d’un indicateur et bloqué ou mis à jour.
  • Résultat : la plateforme évite les infractions éventuelles liées aux droits d’auteur et veille à ce que tout le contenu généré soit original et conforme aux lois sur la propriété intellectuelle.

Création automatisée de contenu sur les réseaux sociaux

  • Scénario : une agence de marketing digital utilise l’IA générative pour automatiser la création de contenu sur les réseaux sociaux. L’agence intègre la fonctionnalité Matériel protégé pour le texte afin d’empêcher la publication de contenu généré par l’IA qui inclut du texte protégé par droits d’auteur, comme les paroles des chansons ou les extraits de livres.
  • Utilisateurs : spécialistes du marketing numérique et responsables des réseaux sociaux.
  • Action : l’agence utilise Azure AI Sécurité du Contenu pour vérifier tout le contenu des réseaux sociaux généré par l’IA afin de rechercher les correspondances par rapport à une base de données de matériel protégé. Le contenu correspondant est marqué d’un indicateur pour révision ou ne peut pas être publié.
  • Résultat : l’agence maintient la conformité aux lois sur les droits d’auteur et évite les risques sur la réputation liés à la publication de contenu non autorisé.

Écriture d’actualités assistée par l’IA

  • Scénario : un organe d’information utilise l’IA générative pour aider les journalistes à rédiger des articles et des reportages. Pour veiller à ce que le contenu ne réplique pas de manière involontaire des articles d’information protégés ou tout autre matériel protégé par droits d’auteur, l’organe utilise la fonctionnalité Matériel protégé pour le texte.
  • Utilisateurs : journalistes, rédacteurs et responsables de la conformité.
  • Action : l’organe d’information intègre Azure AI Sécurité du Contenu dans son workflow de création de contenu. Les brouillons générés par l’IA sont automatiquement analysés pour le contenu protégé avant l’envoi pour la révision éditoriale.
  • Résultat : l’organe d’information empêche les violations accidentelles de droits d’auteur et maintient l’intégrité et l’originalité de son reportage.

Plateformes de formation en ligne utilisant l’IA pour la génération de contenu

  • Scénario : une plateforme de formation en ligne utilise l’IA générative pour générer du contenu pédagogique, comme des résumés, des questionnaires et du texte explicatif. La plateforme utilise la fonctionnalité Matériel protégé pour le texte afin de veiller à ce que le contenu généré n’inclue pas de matériel protégé provenant de livres, articles et de publications universitaires.
  • Utilisateurs : créateurs de contenu pédagogique et responsables de la conformité.
  • Action : la plateforme intègre la fonctionnalité pour analyser des documents pédagogiques générés par l’IA. Si un contenu correspond à du matériel pédagogique protégé connu, il est marqué d’un indicateur pour révision ou automatiquement supprimé.
  • Résultat : la plateforme conserve la qualité du contenu pédagogique et respecte les lois sur les droits d’auteur, évitant ainsi l’utilisation de matériel protégé dans des ressources d’apprentissage générées par l’IA.

Générateurs de recettes basés sur l’intelligence artificielle

  • Scénario : un site de recettes et sur l’alimentation utilise l’IA générative pour générer de nouvelles recettes basées sur les préférences des utilisateurs. Pour éviter la génération de contenu correspondant à des recettes protégées de sites web ou livres de recettes connus, le site web intègre la fonctionnalité Matériel protégé pour le texte.
  • Utilisateurs : responsables de contenu et administrateurs de plateforme.
  • Action : le site web utilise Azure AI Sécurité du Contenu pour vérifier les recettes générées par l’IA par rapport à une base de données de contenu protégé connu. Si une recette générée correspond à une recette protégée, elle est marquée d’un indicateur et révisée ou bloquée.
  • Résultat : le site web veille à ce que toutes les recettes générées par l’IA soit originales, ce qui réduit le risque d’infraction aux droits d’auteur.

Exemples de texte de matériel protégé

Pour plus d’informations sur les principales catégories de détection de texte de matériel protégé, reportez-vous à ce tableau. Les quatre catégories sont toutes appliquées lorsque vous appelez l’API.

Catégorie Étendue Considéré comme acceptable Considéré comme nuisible
Recettes Contenu protégé par les droits d’auteur lié aux recettes.

Les autres textes nuisibles ou sensibles ne sont pas concernés par cette tâche, sauf s’ils tombent sous le coup des préjudices liés à la propriété intellectuelle et aux droits d’auteur des recettes.
  • Liens vers des pages web qui contiennent des informations sur les recettes
  • Tout contenu provenant de recettes qui n’ont aucune protection, ou une protection faible, en matière de propriété intellectuelle ou de droits d’auteur :
    • Listes d’ingrédients
    • Instructions de base pour combiner et cuisiner des ingrédients
  • Rejet ou refus de fournir du contenu protégé par les droits d’auteur :
    • Modification d’une rubrique pour éviter le partage de contenu protégé par les droits d’auteur
    • Refus de partager du contenu protégé par les droits d’auteur
    • Fourniture d’informations irrecevables
  • Autres contenus littéraires dans une recette
    • Anecdotes, histoires ou commentaires personnels correspondants sur la recette (40 caractères ou plus)
    • Noms créatifs de la recette qui ne sont pas limités au nom bien connu du plat, ou un résumé descriptif simple du plat indiquant ce que l’ingrédient principal est (40 caractères ou plus)
    • Descriptions créatives des ingrédients ou des étapes de combinaison ou de cuisson, y compris les descriptions qui contiennent plus d’informations que nécessaire pour créer le plat, s’appuient sur une formulation imprécise ou contiennent des grossièretés (40 caractères ou plus)
  • Méthodes d’accès au contenu protégé par les droits d’auteur :
    • Façons de contourner les modèles payants pour accéder aux recettes
Contenu web Tous les sites web qui ont webmd.com comme nom de domaine d’URL. Se concentre uniquement sur les problèmes de contenu protégé par les droits d’auteur concernant le contenu web sélectionné.

Les autres textes nuisibles ou sensibles ne sont pas concernés par cette tâche, sauf s’ils tombent sous le coup des préjudices liés au contenu web sélectionné.
  • Liens vers des pages web
  • Extraits courts ou extraits de contenu web sélectionné, tant que :
    • Ils sont pertinents pour la requête de l’utilisateur
    • Ils comportent moins de 200 caractères
  • Contenu important du contenu web sélectionné
    • Sections de réponse supérieures à 200 caractères qui présentent une similarité importante avec un bloc de texte du contenu web sélectionné
    • Extraits de contenu web sélectionné qui dépassent 200 caractères
    • Citations provenant du contenu web sélectionné dont la taille est supérieure à 200 caractères
  • Méthodes d’accès au contenu protégé par les droits d’auteur :
    • Façons de contourner les modèles payants ou les protections DRM pour accéder au contenu web sélectionné protégé par les droits d’auteur
Actualités Se concentrent uniquement sur les questions de contenu protégé par les droits d’auteur concernant les actualités.

Les autres textes nuisibles ou sensibles ne sont pas concernés par cette tâche, sauf s’ils tombent sous le coup des préjudices liés à la propriété intellectuelle et aux droits d’auteur des actualités.
  • Liens vers des pages web qui hébergent des actualités ou des informations sur les actualités, les magazines ou les articles de blog tant que :
    • Ils disposent d’autorisations légitimes
    • Ils ont une couverture des actualités sous licence
    • Ce sont des plateformes autorisées
  • Liens vers des pages web autorisées qui contiennent des lecteurs audio ou vidéo incorporés tant que :
    • Ils disposent d’autorisations légitimes
    • Ils ont une couverture des actualités sous licence
    • Ce sont les plateformes de diffusion en continu autorisées
    • Ce sont les chaînes YouTube officielles
  • Extraits ou extraits courts, comme les titres ou les légendes des articles d’actualités tant que :
    • Ils sont pertinents pour la requête de l’utilisateur
    • Ils ne représentent pas une partie importante de l’article
    • Ils ne représentent pas l’intégralité de l’article
  • Résumés des articles d’actualités tant que :
    • Ils sont pertinents pour la requête de l’utilisateur
    • Ils sont brefs et factuels
    • Ils ne copient pas ou ne paraphrasent pas une partie importante de l’article
    • Ils sont clairement et visiblement cités comme résumés
  • Analyse, critique ou révision des articles d’actualités tant que :
    • Ils sont pertinents pour la requête de l’utilisateur
    • Ils sont brefs et factuels
    • Ils ne copient pas ou ne paraphrasent pas une partie importante de l’article
    • Ils sont clairement et visiblement cités comme analyse, critique ou révision
  • Tout contenu d’actualités qui n’a aucune protection de propriété intellectuelle et de droits d’auteur :
    • Actualités, magazines ou blogs qui se trouvent dans le domaine public
    • Actualités, magazines ou blogs pour lesquels la protection des droits d’auteur s’est écoulée, a été abandonnée ou n’a jamais existé
  • Rejet ou refus de fournir du contenu protégé par les droits d’auteur :
    • Modification de la rubrique pour éviter le partage de contenu protégé par les droits d’auteur
    • Refus de partager du contenu protégé par les droits d’auteur
    • Fourniture d’informations irrecevables
  • Liens vers des fichiers .pdf ou tout autre fichier contenant le texte intégral d’articles d’actualités, de magasine ou de blog, sauf si :
    • Ils sont sourcés depuis des plateformes agréées, avec des autorisations et des licences légitimes
  • Contenu d’actualités
    • Verbatim de plus de 200 caractères extrait de tout article d’actualité
    • Plus de 200 caractères ressemblent fortement à un bloc de texte de tout article d’actualité
    • Accès direct aux articles d’actualités, de magasine ou de blog qui sont en accès payant
  • Méthodes d’accès au contenu protégé par les droits d’auteur :
    • Étapes de téléchargement des actualités depuis un site web non autorisé
    • Moyens de contourner les modèles payants ou les protections DRM pour accéder à des actualités ou à des vidéos protégées par les droits d’auteur
Lyrics Se concentre uniquement sur les problèmes de contenu protégé par les droits d’auteur concernant les chansons.

Les autres textes nuisibles ou sensibles ne sont pas concernés par cette tâche, sauf s’ils tombent sous le coup des préjudices liés à la propriété intellectuelle et aux droits d’auteur des chansons.
  • Liens vers des pages web qui contiennent des informations sur des chansons telles que :
    • Paroles des chansons
    • Accords ou tablatures de la musique associée
    • Analyse ou révisions de la chanson ou de la musique
  • Liens vers des pages web autorisées qui contiennent des lecteurs audio ou vidéo incorporés tant que :
    • Ils disposent d’autorisations légitimes
    • Ils dispose de musique sous licence
    • Ce sont les plateformes de diffusion en continu autorisées
    • Ce sont les chaînes YouTube officielles
  • Extraits courts ou extraits de paroles des chansons tant que :
    • Ils sont pertinents pour la requête de l’utilisateur
    • Ils ne représentent pas une partie importante des paroles
    • Ils ne représentent pas l’intégralité des paroles
    • Ils ne sont pas plus longs que 11 mots
  • Extraits courts ou extraits d’accords ou tablatures des chansons tant que :
    • Ils sont pertinents pour la requête de l’utilisateur
    • Ils ne représentent pas une partie importante des accords ou tablatures
    • Ils ne représentent pas l’intégralité des accords ou tablatures
  • Tout contenu provenant de chansons qui n’ont aucune protection en matière de propriété intellectuelle ou de droits d’auteur :
    • Chansons, paroles, accords ou tablatures qui se trouvent dans le domaine public
    • Chansons, paroles, accords ou tablatures pour lesquels la protection des droits d’auteur s’est écoulée, a été abandonnée ou n’a jamais existé
  • Rejet ou refus de fournir du contenu protégé par les droits d’auteur :
    • Modification de la rubrique pour éviter le partage de contenu protégé par les droits d’auteur
    • Refus de partager du contenu protégé par les droits d’auteur
    • Fourniture d’informations irrecevables
  • Paroles d’une chanson
    • Paroles entières
    • Partie importante des paroles
    • Partie des paroles contenant plus de 11 mots
  • Accords ou tablatures d’une chanson
    • Intégralités des accords ou tablatures
    • Partie importante des accords ou tablatures
  • Liens vers des pages web qui contiennent des lecteurs audio ou vidéo incorporés qui :
    • Ne disposent pas d’autorisations légitimes
    • Ne disposent pas de musique sous licence
    • Ne sont pas des plateformes de diffusion en continu agréées
    • Ne sont pas des chaînes YouTube officielles
  • Méthodes d’accès au contenu protégé par les droits d’auteur :
    • Étapes de téléchargement de chansons depuis un site web non autorisé
    • Moyens de contourner les modèles payants ou les protections DRM pour accéder à des chansons ou à des vidéos protégées par les droits d’auteur

Étapes suivantes

Suivez le guide de démarrage rapide pour commencer à utiliser Azure AI Sécurité du contenu pour détecter le matériel protégé.