Las API de detección de material protegido examinan la salida de los modelos de lenguaje grandes para identificar y marcar material protegido conocido. Estas API ayudan a las organizaciones a evitar la generación de contenido que coincida estrechamente con el texto o el código protegidos por derechos de autor.
La API de texto de material protegido marca cualquier contenido de texto conocido que genera modelos de lenguaje grandes, como letras de canciones, artículos, recetas y contenido web seleccionado.
La API de código de material protegido marca el contenido del código protegido que podrían generar modelos de lenguaje grandes. Este contenido procede de repositorios conocidos de GitHub e incluye bibliotecas de software, código fuente, algoritmos y otro contenido de programación propietario.
Precaución
El analizador o indexador de código del servicio Content Safety solo está actualizado hasta el 6 de abril de 2023. No se detectará el código que se agregó a GitHub después de esta fecha. Use su propia discreción al usar Material protegido para código para detectar cuerpos recientes de código.
Al detectar y evitar la visualización de material protegido, las organizaciones pueden garantizar el cumplimiento de las leyes de propiedad intelectual, mantener la originalidad del contenido y proteger su reputación.
En esta guía se proporcionan detalles sobre los tipos de contenido que detecta la API de material protegido.
Escenarios de usuario
Plataformas de generación de contenido para escritura creativa
- Escenario: una plataforma de generación de contenidos que utiliza IA generativa para la escritura creativa (por ejemplo, entradas de blog, relatos, textos de marketing) integra la función Material protegido para texto para evitar la generación de contenidos que coincidan estrechamente con material protegido por derechos de autor conocido.
- Usuario: administradores de plataformas y creadores de contenido.
- Acción: la plataforma usa la seguridad del contenido de Azure AI para examinar el contenido generado por IA antes de proporcionarlo a los usuarios. Si el texto generado coincide con el material protegido, el contenido se marca y se bloquea o revisa.
- Resultado: la plataforma evita posibles infracciones de derechos de autor y garantiza que todo el contenido generado sea original y conforme a las leyes de propiedad intelectual.
Creación automatizada de contenido en redes sociales
- Escenario: una agencia de marketing digital usa inteligencia artificial generativa para automatizar la creación de contenido en redes sociales. La agencia integra la característica Material protegido para texto para evitar la publicación de contenido generado por IA que incluye texto con derechos de autor, como letras de canciones o extractos de libros.
- Usuario: vendedores digitales y administradores de redes sociales.
- Acción: la agencia emplea Seguridad del contenido de Azure AI para comprobar si todo el contenido de las redes sociales generado por IA coincide con una base de datos de material protegido. El contenido que coincide se marca para la revisión o se bloquea la publicación.
- Resultado: la agencia mantiene el cumplimiento de las leyes de copyright y evita riesgos de reputación asociados con la publicación de contenido no autorizado.
Redacción de noticias asistidas por IA
- Escenario: un medio de noticias usa inteligencia artificial generativa para ayudar a los periodistas a redactar artículos e informes. Para asegurarse de que el contenido no replica involuntariamente artículos de noticias protegidos u otro material protegido con derechos de autor, la salida utiliza la característica Material protegido para texto.
- Usuario: periodistas, editores y responsables de cumplimiento.
- La salida de noticias integra Seguridad del contenido de Azure AI en su flujo de trabajo de creación de contenidos. Los borradores generados por IA se analizan automáticamente en busca de contenido protegido antes de someterlos a revisión editorial.
- Resultado: la salida de noticias evita infracciones accidentales de derechos de autor y mantiene la integridad y originalidad de su informe.
Plataformas de aprendizaje electrónico que utilizan la IA para generar contenidos
- Escenario: una plataforma de aprendizaje electrónico emplea inteligencia artificial generativa para generar contenido educativo, como resúmenes, cuestionarios y texto explicativo. La plataforma utiliza la característica Material protegido para texto para asegurarse de que el contenido generado no incluye material protegido de libros de texto, artículos o documentos académicos.
- Usuario: creadores de contenido educativo y responsables de cumplimiento.
- Acción: la plataforma integra la característica para examinar los materiales educativos generados por la inteligencia artificial. Si algún contenido coincide con el material académico protegido conocido, se marca para revisión o se quita automáticamente.
- Resultado: la plataforma mantiene la calidad del contenido educativo y cumple con las leyes de copyright, evitando el uso de material protegido en los recursos de aprendizaje generados por la inteligencia artificial.
Generadores de recetas con tecnología de inteligencia artificial
- Escenario: un sitio web de alimentos y recetas usa inteligencia artificial generativa para generar nuevas recetas basadas en las preferencias del usuario. Para evitar generar contenido que coincida con recetas protegidas de libros o sitios web famosos, el sitio web integra la característica Material protegido para texto.
- Usuario: administradores de contenido y administradores de plataforma.
- Acción: el sitio web usa la seguridad del contenido de Azure AI para comprobar las recetas generadas por IA en una base de datos de contenido protegido conocido. Si una receta generada coincide con una protegida, se marca y se revisa o se bloquea.
- Resultado: el sitio web garantiza que todas las recetas generadas por IA sean originales, lo que reduce el riesgo de infracción de derechos de autor.
- Escenario: Una plataforma de desarrollo de software que utiliza IA generativa para ayudar a los desarrolladores a escribir código integra la función Material protegido para código para evitar la generación de código que replique material de repositorios de GitHub existentes.
- Usuario: administradores de plataformas, desarrolladores.
- Acción: La plataforma utiliza Seguridad del contenido de Azure AI para examinar el código generado por IA. Si algún código coincide con el material protegido, se marca para su revisión, revisión o bloqueo.
- Resultados: la plataforma garantiza que todo el código generado por IA es original y cumple los acuerdos de licencia, lo que reduce los riesgos legales y de cumplimiento.
- Escenario: un equipo de desarrollo usa inteligencia artificial generativa para automatizar partes de su escritura de código. El equipo integra la característica Material protegido para código para evitar el uso accidental de fragmentos de código que coinciden con el contenido de repositorios de GitHub existentes, incluido el código abierto con licencias restrictivas.
- Usuario: desarrolladores de software, equipos de DevOps.
- Acción: la Seguridad del contenido de Azure AI comprueba el código generado con el material conocido de repositorios de GitHub. Si se encuentra una coincidencia, el código se marca y se revisa antes de incorporarlo al proyecto.
- Resultados: El equipo evita posibles infracciones de copyright y se asegura de que el código generado por la IA se adhiere a las licencias adecuadas.
Revisiones de código asistidas por IA
- Escenario: una empresa de software integra las herramientas de revisión de código asistido por IA en su proceso de desarrollo. Para evitar introducir código protegido de GitHub o bibliotecas externas, la empresa usa la característica Material protegido para código.
- Usuario: revisores de código, desarrolladores de software, responsables de cumplimiento.
- Acción: la empresa analiza todo el código generado por IA en busca de coincidencias con material protegido de los repositorios de GitHub antes de la revisión final del código y su implementación.
- Resultado: la empresa impide la inclusión de material protegido en sus proyectos, manteniendo el cumplimiento de las leyes de propiedad intelectual y las normas internas.
- Escenario: una plataforma de aprendizaje electrónico usa IA generativa para generar código de ejemplo para los tutoriales y cursos de programación. La plataforma integra la característica Material protegido para código para asegurarse de que los ejemplos generados no duplican el código de repositorios de GitHub existentes u otros orígenes educativos.
- Usuario: creadores de cursos, administradores de plataformas.
- Acción: la seguridad del contenido de Azure AI comprueba todos los ejemplos de código generados por IA para obtener contenido protegido. Las coincidencias se marcan, revisan y revisan.
- Resultado: la plataforma mantiene la integridad y originalidad de su contenido educativo mientras se adhiere a las leyes de copyright.
Asistentes de codificación con tecnología de inteligencia artificial
- Escenario: una herramienta de asistente de codificación con tecnología de IA generativa ayuda a los desarrolladores mediante la generación de sugerencias de código. Para asegurarse de que ninguna sugerencia infringe el código de los repositorios de GitHub, la herramienta de asistente usa la característica Material protegido para código.
- Usuario: desarrolladores, administradores de herramientas.
- Acción: la herramienta examina todas las sugerencias de código de material protegido de GitHub antes de presentarlas a los desarrolladores. Si una sugerencia coincide con el código protegido, se marca y no se muestra.
- Resultado: el asistente de codificación garantiza que todas las sugerencias de código estén libres de contenido protegido, fomentando la originalidad y reduciendo los riesgos legales.
Al integrar la característica Material protegido para código, las organizaciones pueden administrar los riesgos asociados con el código generado por IA, mantener el cumplimiento de las leyes de propiedad intelectual y garantizar la originalidad de sus salidas de código.
Ejemplos de texto de material protegido
Consulte esta tabla para obtener más información sobre las principales categorías de detección de texto de material protegido. Las cuatro categorías se aplican cuando se llama a la API.
| Category |
Ámbito |
Considerado aceptable |
Considerado perjudicial |
| Recetas |
Contenido con derechos de autor relacionados con recetas.
Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con recetas que perjudiquen los derechos de propiedad intelectual. |
- Vínculos a páginas web que contienen información sobre recetas
- Cualquier contenido de recetas que no estén protegidas por derechos de propiedad intelectual o de autor, o que lo estén en escasa medida:
- Listas de ingredientes
- Instrucciones básicas para combinar y cocinar ingredientes
- Rechazo o negativa a proporcionar contenido protegido por derechos de autor:
- Cambio de tema para evitar compartir contenidos protegidos por derechos de autor
- Negativa a compartir contenido protegido por derechos de autor
- Proporcionar información que no responde
|
- Otro contenido literario en una receta
- Anécdotas, historias o comentarios personales sobre la receta (40 caracteres o más)
- Nombres creativos para la receta que no se limiten al nombre conocido del plato, o un simple resumen descriptivo del plato que indique cuál es el ingrediente principal (40 caracteres o más)
- Descripciones creativas de los ingredientes o de los pasos para combinar o cocinar los ingredientes, incluidas las descripciones que contengan más información de la necesaria para crear el plato, se basen en una redacción imprecisa o contengan blasfemias (40 caracteres o más)
- Métodos para acceder al contenido protegido por derechos de autor:
- Cómo saltarse los muros de pago para acceder a las recetas
|
| Contenido web |
Todos los sitios web que tienen webmd.com como nombre de dominio URL. Solo se centra en los problemas de contenido protegido por derechos de autor en torno al contenido web seleccionado.
Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con los contenidos web perjudiciales seleccionados. |
- Vínculos a páginas web
- Fragmentos cortos o fragmentos de contenido web seleccionado siempre que:
- Sean relevantes para la consulta del usuario
- Tengan menos de 200 caracteres
|
- Contenido sustancial del contenido web seleccionado
- Secciones de respuesta de más de 200 caracteres que tienen una similitud sustancial con un bloque de texto del contenido web seleccionado
- Extractos del contenido web seleccionado que tienen más de 200 caracteres
- Citas del contenido web seleccionado que tienen más de 200 caracteres
- Métodos para acceder al contenido protegido por derechos de autor:
- Formas de saltarse los muros de pago o las protecciones DRM para acceder a contenidos web seleccionados protegidos por derechos de autor
|
| Noticias |
Solo se centran en cuestiones de contenido protegido por derechos de autor en torno a noticias.
Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con noticias perjudiciales para la propiedad intelectual. |
- Vínculos a páginas web que hospedan noticias o información sobre noticias, revistas o artículos de blog siempre y cuando:
- Tengan permisos legítimos
- Tengan cobertura de noticias con licencia
- Sean plataformas autorizadas
- Vínculos a páginas web autorizadas que contienen reproductores de audio y vídeo insertados siempre que:
- Tengan permisos legítimos
- Tengan cobertura de noticias con licencia
- Sean plataformas de streaming autorizadas
- Sean canales oficiales de YouTube
- Extractos breves, como titulares o pies de foto de artículos de noticias, siempre que:
- Sean relevantes para la consulta del usuario
- No sean una parte sustancial del artículo
- No sean todo el artículo
- Resumen de artículos de noticias siempre y cuando:
- Sean relevantes para la consulta del usuario
- Sean breves y objetivos
- No copie ni parafrasee una parte sustancial del artículo
- Se cite claramente y visiblemente como resumen
- Análisis, crítica, o revisión de artículos de noticias siempre y cuando:
- Sean relevantes para la consulta del usuario
- Sean breves y objetivos
- No copie ni parafrasee una parte sustancial del artículo
- Se cite claramente y visiblemente como un análisis, crítica o revisión
- Cualquier contenido de noticias que no esté protegido por derechos de propiedad intelectual o de autor:
- Noticias, revistas o blogs de dominio público
- Noticias, revistas o blogs cuyos derechos de autor han expirado, han sido cedidos o nunca han existido
- Rechazo o negativa a proporcionar contenido protegido por derechos de autor:
- Cambio de tema para evitar el uso compartido de contenido protegido por derechos de autor
- Negativa a compartir contenido protegido por derechos de autor
- Proporcionar información que no responde
|
- Vínculos a PDF o cualquier otro archivo que contenga el texto completo de artículos de noticias, revistas o blogs, a menos que:
- Se obtengan de plataformas autorizadas con permisos legítimos y licencias
- Contenido de noticias
- Más de 200 caracteres tomados textualmente de cualquier artículo de noticias
- Más de 200 caracteres sustancialmente similares a un bloque de texto de cualquier artículo de noticias
- Acceso directo a artículos de noticias, revistas o blog que estén detrás de los muros de pago
- Métodos para acceder al contenido protegido por derechos de autor:
- Pasos para descargar noticias de un sitio web no autorizado
- Formas de saltarse los muros de pago o las protecciones DRM para acceder a noticias o vídeos protegidos por derechos de autor
|
| Lyrics |
Solo se centra en cuestiones de contenido protegido por derechos de autor en torno a canciones.
Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con canciones perjudiciales para la propiedad intelectual. |
- Vínculos a páginas web que contienen información sobre canciones como:
- Letras de las canciones
- Acordes o tablaturas de la música asociada
- Análisis o reseñas de la canción o música
- Vínculos a páginas web autorizadas que contienen reproductores de audio y vídeo insertados siempre que:
- Tengan permisos legítimos
- Tengan música con licencia
- Sean plataformas de streaming autorizadas
- Sean canales oficiales de YouTube
- Fragmentos cortos o fragmentos de texto de las canciones siempre y cuando:
- Sean relevantes para la consulta del usuario
- No sean una parte sustancial de las letras
- No sean las letras completas
- No sean más de 11 palabras largas
- Fragmentos cortos o fragmentos de acordes o tablaturas de las canciones siempre y cuando:
- Sean relevantes para la consulta del usuario
- No sean una parte sustancial de los acordes o tablaturas
- No sean los acordes o tablaturas completos
- Cualquier contenido de canciones que no tengan protección de propiedad intelectual o derechos de autor:
- Canciones, letras, acordes o tablaturas que se encuentran en el dominio público
- Canciones, letras, acordes o tablaturas cuyos derechos de autor han expirado, han sido cedidos o nunca han existido
- Rechazo o negativa a proporcionar contenido protegido por derechos de autor:
- Cambio de tema para evitar el uso compartido de contenido protegido por derechos de autor
- Negativa a compartir contenido protegido por derechos de autor
- Proporcionar información que no responde
|
- Letras de una canción
- Letras completas
- Parte sustancial de las letras
- Parte de las letras que contienen más de 11 palabras
- Acordes o tablaturas de una canción
- Acordes o tablaturas completos
- Parte sustancial de los acordes o tablaturas
- Vínculos a páginas web que contienen reproductores de audio y vídeo insertados que:
- No tengan permisos legítimos
- No tengan música con licencia
- No sean plataformas de streaming autorizadas
- No sean canales oficiales de YouTube
- Métodos para acceder al contenido protegido por derechos de autor:
- Pasos para descargar canciones de un sitio web no autorizado
- Formas de saltarse los muros de pago o las protecciones DRM para acceder a canciones o vídeos protegidos por derechos de autor
|
Paso siguiente
Para detectar material protegido, siga el inicio rápido para empezar a usar la seguridad del contenido de Azure AI.