Поделиться через


Обнаружение защищенных материалов

Защищенный текстовый API помечает известное текстовое содержимое (например, текст песни, статьи, рецепты и выбранное веб-содержимое), которое может выводиться большими языковыми моделями.

Api защищенного кода материалов флаги защищенного содержимого кода (из известных репозиториев GitHub, включая библиотеки программного обеспечения, исходный код, алгоритмы и другое закрытое содержимое программирования), которые могут быть выходными данными больших языковых моделей.

Внимание

Средство проверки кода и индексатора службы безопасности содержимого выполняется только с 6 ноября 2021 г. Код, добавленный в GitHub после этой даты, не будет обнаружен. Используйте собственное усмотрение при использовании защищенного материала для кода для обнаружения последних тел кода.

Обнаруживая и предотвращая отображение защищенного материала, организации могут обеспечить соответствие законам интеллектуальной собственности, поддерживать оригинальность содержимого и защищать свою репутацию.

В этом руководстве содержатся сведения о типах контента, обнаруженных защищенным API материалов.

Сценарии пользователей

Платформы создания контента для творческого письма

  • Сценарий: платформа создания контента, использующая генерированный ИИ для творческого написания (например, записи блога, истории, маркетинговая копия) интегрирует функцию защищенного материала для текста, чтобы предотвратить создание содержимого, которое тесно соответствует известному авторскому материалу.
  • Пользователь: администраторы платформы и создатели содержимого.
  • Действие. Платформа использует безопасность содержимого ИИ Azure для сканирования содержимого, созданного ИИ, прежде чем он будет предоставлен пользователям. Если созданный текст соответствует защищенному материалу, содержимое помечается и блокируется или пересматривается.
  • Результат: платформа избегает потенциальных нарушений авторских прав и гарантирует, что все созданное содержимое является оригинальным и соответствует законам об интеллектуальной собственности.

Автоматическое создание контента социальных сетей

  • Сценарий: агентство цифрового маркетинга использует созданный ИИ для автоматизации создания контента социальных сетей. Агентство интегрирует функцию "Защищенный материал для текста", чтобы избежать публикации содержимого, созданного ИИ, которое включает в себя авторские права, например текст песни или фрагменты из книг.
  • Пользователь: цифровые маркетинговики и менеджеры социальных сетей.
  • Действие. Агентство использует Azure AI Content Safety для проверки всех содержимого социальных сетей, созданных ИИ, для совпадений с базой данных защищенного материала. Содержимое, которое соответствует, помечается для изменения или заблокировано для публикации.
  • Результат: агентство поддерживает соответствие законам об авторских правах и избегает рисков репутации, связанных с размещением несанкционированного содержимого.

Написание новостей с поддержкой ИИ

  • Сценарий: новостной канал использует генерированный ИИ для помощи журналистам в разработке статей и отчетов. Чтобы содержимое непреднамеренно реплицировало защищенные новостные статьи или другие материалы, защищенные авторским правом, в выпуске используется функция "Защищенный материал для текста".
  • Пользователь: журналисты, редакторы и сотрудники по соответствию требованиям.
  • Действие. Выпуск новостей интегрирует Безопасность содержимого ИИ Azure в рабочий процесс создания контента. Созданные искусственным интеллектом черновики автоматически проверяются на защищенное содержимое перед отправкой для редактирования.
  • Результат: новостной канал предотвращает случайные нарушения авторских прав и поддерживает целостность и оригинальность его отчетности.

Платформы e-learning с использованием ИИ для создания контента

  • Сценарий: платформа электронного обучения использует генерированный ИИ для создания учебного содержимого, например сводок, тестов и пояснительных текстов. Платформа использует функцию "Защищенный материал для текста", чтобы гарантировать, что созданное содержимое не включает защищенный материал из учебников, статей или академических статей.
  • Пользователь: создатели содержимого для образовательных учреждений и сотрудники по соответствию требованиям.
  • Действие. Платформа интегрирует функцию для сканирования учебных материалов, созданных ИИ. Если любое содержимое соответствует известному защищенному академическому материалу, оно помечается для изменения или автоматически удаляется.
  • Результат: платформа поддерживает качество содержимого образования и соответствует законам об авторских правах, избегая использования защищенного материала в ресурсах обучения, созданных ИИ.

Генераторы рецептов с использованием искусственного интеллекта

  • Сценарий: веб-сайт продуктов питания и рецептов использует генерирующий ИИ для создания новых рецептов на основе предпочтений пользователей. Чтобы избежать создания содержимого, соответствующего защищенным рецептам из известных книг или веб-сайтов, веб-сайт интегрирует функцию защищенного материала для текста.
  • Пользователь: диспетчеры содержимого и администраторы платформы.
  • Действие. Веб-сайт использует безопасность содержимого ИИ Azure для проверки рецептов, созданных ИИ, в базе данных известного защищенного содержимого. Если созданный рецепт соответствует защищенному, он помечен и изменен или заблокирован.
  • Результат: веб-сайт гарантирует, что все созданные искусственным интеллектом рецепты являются оригинальными, что снижает риск нарушения авторских прав.

Примеры текста защищенного материала

Дополнительные сведения о основных категориях обнаружения защищенного текста см. в этой таблице. При вызове API применяются все четыре категории.

Категория Область Считается приемлемым Считается вредным
Рецепты Содержимое, защищенное авторским правом, связанное с рецептами.

Другие вредные или конфиденциальные тексты выходят за рамки этой задачи, если только он не пересекается с вредом IP-прав на рецепты.
  • Ссылки на веб-страницы, содержащие сведения о рецептах
  • Любое содержимое из рецептов, у которых нет или низкой защиты IP/авторских прав:
    • Списки ингредиентов
    • Основные инструкции по объединению и приготовлению ингредиентов
  • Отклонение или отказ в предоставлении содержимого, защищенного авторским правом:
    • Изменение раздела, чтобы избежать предоставления общего доступа к содержимому, защищенному авторским правом
    • Отказ от совместного использования содержимого, защищенного авторским правом
    • Предоставление неответственных сведений
  • Другое литературное содержимое в рецепте
    • Сопоставление анекдотов, историй или личных комментариев о рецепте (40 символов или больше)
    • Творческие имена рецепта, которые не ограничиваются хорошо известным именем блюда, или простое описательное сводка блюда, указывающее, что основной ингредиент (40 символов или больше)
    • Творческие описания ингредиентов или шагов для объединения или приготовления ингредиентов, включая описания, содержащие больше информации, чем необходимо для создания блюда, полагаться на нечеткое слово или содержать ненормативную лексику (40 символов или более)
  • Методы доступа к содержимому, защищенному авторским правом:
    • Способы обхода paywalls для доступа к рецептам
Веб-содержимое Все веб-сайты, имеющие webmd.com имя домена URL-адреса. Основное внимание уделяется только вопросам защищенного авторским правом содержимого вокруг выбранного веб-содержимого.

Другой опасный или конфиденциальный текст не является областью действия для этой задачи, если он не пересекается с выбранным веб-контентом.
  • Ссылки на веб-страницы
  • Короткие фрагменты или фрагменты выбранного веб-содержимого до тех пор, пока:
    • Они относятся к запросу пользователя
    • Они меньше 200 символов
  • Существенное содержимое выбранного веб-содержимого
    • Разделы ответа длиной более 200 символов, которые имеют существенное сходство с блоком текста из выбранного веб-содержимого
    • Фрагменты из выбранного веб-содержимого, которые длиннее 200 символов
    • Кавычки из выбранного веб-содержимого, длиннее 200 символов
  • Методы доступа к содержимому, защищенному авторским правом:
    • Способы обхода paywalls или защиты DRM для доступа к защищенному веб-содержимому
News Сосредоточиться только на проблемах авторского контента вокруг Новостей.

Другие вредные или конфиденциальные тексты не являются областью действия для этой задачи, если только она не пересекает вред IP-адреса новостей.
  • Ссылки на веб-страницы, в которых размещаются новости или сведения о новостях, журналах или статьях блога до тех пор, пока:
    • У них есть допустимые разрешения
    • У них есть лицензированное освещение новостей
    • Они являются авторизованными платформами
  • Ссылки на авторизованные веб-страницы, содержащие внедренные аудио-проигрыватели и видео, до тех пор:
    • У них есть допустимые разрешения
    • У них есть лицензированное освещение новостей
    • Они являются авторизованными платформами потоковой передачи
    • Это официальные каналы YouTube
  • Короткие фрагменты/фрагменты, такие как заголовки или подписи из новостей до тех пор:
    • Они относятся к запросу пользователя
    • Они не являются существенной частью статьи
    • Они не являются всей статьей
  • Сводка новостей до тех пор, пока:
    • Это относится к запросу пользователя
    • Это краткое и фактическое
    • Она не копирует или парафразирует значительную часть статьи
    • Ясно и заметно цитируется в качестве сводки
  • Анализ/критика/обзор новостей до тех пор, пока:
    • Это относится к запросу пользователя
    • Это краткое и фактическое
    • Она не копирует или парафразирует значительную часть статьи
    • Ясно и заметно цитируется как анализ/критика/обзор
  • Любое содержимое новостей без защиты IP/авторских прав:
    • Новости,журналы/блоги, которые находятся в общественном домене
    • News/Magazines/Blogs, для которых защита авторских прав истекла, была передана или никогда не существовала
  • Отклонение или отказ в предоставлении содержимого, защищенного авторским правом:
    • Изменение раздела, чтобы избежать общего доступа к содержимому, защищенному авторским правом
    • Отказ от совместного использования содержимого, защищенного авторским правом
    • Предоставление неответственных сведений
  • Ссылки на pdf-файл или любой другой файл, содержащий полный текст статей новостей, журналов или блогов, если только не:
    • Они создаются на авторизованных платформах с законными разрешениями и лицензиями
  • Содержимое новостей
    • Более 200 символов, взятых из любой новостной статьи
    • Более 200 символов существенно похожи на блок текста из любой новостной статьи
    • Прямой доступ к статьям новостей, журналов и блогов, которые находятся за paywalls
  • Методы доступа к содержимому, защищенному авторским правом:
    • Шаги по скачиванию новостей с несанкционированного веб-сайта
    • Способы обхода paywalls или защиты DRM для доступа к авторским правам новостей или видео
Lyrics Основное внимание уделяется вопросам авторского права на содержание песен.

Другие вредные или конфиденциальные тексты не являются областью действия для этой задачи, если только она не пересекается с ip-правами на ip-адрес.
  • Ссылки на веб-страницы, содержащие сведения о таких песнях, как:
    • Тексты песен
    • Аккорды или вкладки связанной музыки
    • Анализ или отзывы о песне или музыке
  • Ссылки на авторизованные веб-страницы, содержащие внедренные аудио-проигрыватели и видео, до тех пор:
    • У них есть допустимые разрешения
    • У них есть лицензированная музыка
    • Они являются авторизованными платформами потоковой передачи
    • Это официальные каналы YouTube
  • Короткие фрагменты или фрагменты текста песен до тех пор, пока:
    • Они относятся к запросу пользователя
    • Они не являются существенной частью текста
    • Они не все тексты
    • Они не более 11 слов длиннее
  • Короткие фрагменты или фрагменты из аккордов/вкладок песен до тех пор, пока:
    • Они относятся к запросу пользователя
    • Они не являются существенной частью аккордов/вкладок
    • Они не являются целыми аккордами или вкладками
  • Любое содержимое из песен без защиты IP/авторских прав:
    • Песни,тексты/аккорды/вкладки, которые находятся в общественном домене
    • Песни, тексты/ аккорды/вкладки, для которых защита авторских прав истекла, была сдана или никогда не существовала
  • Отклонение или отказ в предоставлении содержимого, защищенного авторским правом:
    • Изменение раздела, чтобы избежать общего доступа к содержимому, защищенному авторским правом
    • Отказ от совместного использования содержимого, защищенного авторским правом
    • Предоставление неответственных сведений
  • Текст песни
    • Все тексты текста
    • Существенная часть текста
    • Часть текста, содержащая более 11 слов
  • Аккорды или вкладки песни
    • Все аккорды и вкладки
    • Существенная часть аккордов или вкладок
  • Ссылки на веб-страницы, содержащие внедренные проигрыватели аудио и видео, которые:
    • У вас нет допустимых разрешений
    • У вас нет лицензированной музыки
    • Не авторизованные платформы потоковой передачи
    • Не являются официальными каналами YouTube
  • Методы доступа к содержимому, защищенному авторским правом:
    • Шаги по скачиванию песен с несанкционированного веб-сайта
    • Способы обхода paywalls или защиты DRM для доступа к авторским правам песни или видео

Следующие шаги

Следуйте краткому руководству, чтобы приступить к работе с безопасностью содержимого ИИ Azure для обнаружения защищенного материала.