Comparteix via


Redacción de credenciales

En este artículo se proporciona información general sobre cómo Azure Databricks redacta las claves de acceso y las credenciales en los registros.

Introducción a la redacción de credenciales

La redacción de credenciales es una práctica de seguridad crítica que implica enmascarar información confidencial, como contraseñas o claves de API, para evitar el acceso no autorizado. Azure Databricks redacta las claves y las credenciales en los registros de auditoría y los registros de Apache Spark de log4j para proteger los datos frente a la pérdida de información. Azure Databricks redacta automáticamente las credenciales de la nube y las credenciales en la URI. La redacción se basa en el valor obtenido del secreto, independientemente de la variable o el contexto en el que se use.

Para algunos tipos de credenciales, Azure Databricks agrega un hash_prefix, que es un código corto generado a partir de la credencial mediante un método denominado MD5. Este código se usa para comprobar que la credencial es válida y no se ha modificado.

Redacción de credenciales en la nube

Las credenciales de la nube redactadas podrían tener uno de varios reemplazos de redacción. Algunos dicen [REDACTED], mientras que otros podrían tener reemplazos más específicos, como REDACTED_POSSIBLE_CLOUD_SECRET_ACCESS_KEY.

Azure Databricks puede censurar ciertas cadenas largas que aparecen aleatoriamente generadas, incluso si no son credenciales en la nube.

Credenciales en la redacción de URI

Azure Databricks detecta //username:password@mycompany.com en el URI y reemplaza username:password por REDACTED_CREDENTIALS(hash_prefix). Azure Databricks calcula el hash desde username:password (incluyendo el :).

Por ejemplo, Azure Databricks registra 2017/01/08: Accessing https://admin:admin@mycompany.com como 2017/01/08: Accessing https://REDACTED_CREDENTIALS(d2abaa37)@mycompany.com.