Base de référence de sécurité Azure pour Azure Databricks

Cette base de référence de sécurité applique les conseils du benchmark de sécurité cloud Microsoft version 1.0 à Azure Databricks. Le Benchmark de sécurité Microsoft Cloud fournit des recommandations sur la façon dont vous pouvez sécuriser vos solutions cloud sur Azure. Le contenu est regroupé selon les contrôles de sécurité définis par le benchmark de sécurité cloud Microsoft et les conseils associés applicables à Azure Databricks.

Vous pouvez superviser cette base de référence de la sécurité et ses recommandations en utilisant Microsoft Defender pour le cloud. Azure Policy définitions sont répertoriées dans la section Conformité réglementaire de la page Microsoft Defender pour le portail cloud.

Lorsqu’une fonctionnalité a des définitions de Azure Policy pertinentes, elles sont répertoriées dans cette base de référence pour vous aider à mesurer la conformité avec les contrôles et recommandations du benchmark de sécurité cloud Microsoft. Certaines recommandations peuvent nécessiter un plan de Microsoft Defender payant pour activer certains scénarios de sécurité.

Notes

Les fonctionnalités non applicables à Azure Databricks ont été exclues. Pour voir comment Azure Databricks est entièrement mappé au benchmark de sécurité cloud Microsoft, consultez le fichier de mappage complet de la base de référence de sécurité Azure Databricks.

Profil de sécurité

Le profil de sécurité résume les comportements à fort impact d’Azure Databricks, ce qui peut entraîner des considérations de sécurité accrues.

Attribut de comportement du service Valeur
Catégorie de produit Analytique, stockage
Le client peut accéder à HOST/OS Aucun accès
Le service peut être déployé dans le réseau virtuel du client Vrai
Stocke le contenu client au repos Vrai

Sécurité du réseau

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Sécurité réseau.

NS-1 : Établir des limites de segmentation réseau

Fonctionnalités

Intégration du réseau virtuel

Description : Le service prend en charge le déploiement dans le Réseau virtuel privé (VNet) du client. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Conseils de configuration : Le déploiement par défaut d’Azure Databricks est un service entièrement managé sur Azure : toutes les ressources de plan de données, y compris un réseau virtuel auquel tous les clusters seront associés, sont déployées sur un groupe de ressources verrouillé. Cependant, si vous devez personnaliser votre réseau, vous pouvez déployer les ressources de plan de données Azure Databricks dans votre propre réseau virtuel (injection de réseau virtuel), ce qui vous permet de mettre en œuvre des configurations réseau personnalisées. Vous pouvez appliquer votre propre groupe de sécurité réseau (NSG) avec des règles personnalisées à des restrictions de trafic de sortie spécifiques.

Référence : Intégration au réseau virtuel Databricks

Prise en charge des groupes de sécurité réseau

Description : Le trafic réseau de service respecte l’attribution de règles groupes de sécurité réseau sur ses sous-réseaux. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Conseils de configuration : Utilisez des groupes de sécurité réseau (NSG) pour restreindre ou surveiller le trafic par port, protocole, adresse IP source ou adresse IP de destination. Créez des règles NSG pour restreindre les ports ouverts de votre service (par exemple, pour empêcher l’accès aux ports de gestion à partir de réseaux non approuvés). N’oubliez pas que par défaut, les groupes de sécurité réseau refusent tout le trafic entrant, mais autorisent le trafic provenant du réseau virtuel et d’équilibreurs de charge Azure.

Référence : Groupe de sécurité réseau

NS-2 : Sécuriser les services cloud avec des contrôles réseau

Fonctionnalités

Description : Fonctionnalité de filtrage IP native du service pour le filtrage du trafic réseau (à ne pas confondre avec le groupe de sécurité réseau ou Pare-feu Azure). Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
False Non applicable Non applicable

Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.

Désactiver l’accès public au réseau

Description : le service prend en charge la désactivation de l’accès au réseau public à l’aide d’une règle de filtrage de liste de contrôle d’accès IP au niveau du service (pas de groupe de sécurité réseau ou de Pare-feu Azure) ou à l’aide d’un commutateur bascule « Désactiver l’accès réseau public ». Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Conseils de configuration : Les clients Azure Databricks peuvent utiliser la fonctionnalité listes d’accès IP pour définir un ensemble d’adresses IP approuvées afin d’empêcher l’accès à partir d’adresses IP publiques ou non approuvées.

Référence : Liste d’accès IP dans Databricks

Gestion des identités

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Gestion des identités.

IM-1 : utiliser le système centralisé d’identité et d’authentification

Fonctionnalités

Azure AD Authentication requis pour l’accès au plan de données

Description : Le service prend en charge l’utilisation de l’authentification Azure AD pour l’accès au plan de données. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
True Vrai Microsoft

Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.

IM-3 : gérer les identités d’application de façon sécurisée et automatique

Fonctionnalités

Identités managées

Description : les actions du plan de données prennent en charge l’authentification à l’aide d’identités managées. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
False Non applicable Non applicable

Remarques sur les fonctionnalités : Azure Databricks est automatiquement configuré pour utiliser l’authentification unique Azure Active Directory (Azure AD) pour authentifier les utilisateurs. Les utilisateurs en dehors de votre organisation doivent suivre le processus d’invitation et être ajoutés à votre locataire Active Directory avant de pouvoir se connecter à Azure Databricks via l’authentification unique. Vous pouvez implémenter SCIM pour automatiser le provisionnement et le déprovisionnement des utilisateurs à partir des espaces de travail.

Comprendre l’authentification unique pour Azure Databricks

Comment utiliser les API SCIM pour Azure Databricks

Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.

Principaux de service

Description : Le plan de données prend en charge l’authentification à l’aide de principaux de service. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Conseils de configuration : Pour les services qui ne prennent pas en charge les identités managées, utilisez Azure Active Directory (Azure AD) pour créer un principal de service avec des autorisations restreintes au niveau de la ressource. Configurez les principaux de service avec des informations d’identification de certificat et revenez aux secrets client pour l’authentification.

Référence : Principal de service dans Databricks

IM-7 : restreindre l’accès aux ressources en fonction des conditions

Fonctionnalités

Accès conditionnel pour le plan de données

Description : L’accès au plan de données peut être contrôlé à l’aide de stratégies d’accès conditionnel Azure AD. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
True Vrai Microsoft

Remarques sur les fonctionnalités : En outre, Azure Databricks prend en charge les listes d’accès IP pour sécuriser l’accès à l’application web et à l’API REST.

Listes d’accès IP dans Databricks

Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.

Référence : Accès conditionnel dans Databricks

IM-8 : restreindre l’exposition des informations d’identification et des secrets

Fonctionnalités

Prise en charge de l’intégration et du stockage des informations d’identification et des secrets de service dans Azure Key Vault

Description : Le plan de données prend en charge l’utilisation native d’Azure Key Vault pour le magasin d’informations d’identification et de secrets. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Remarques sur les fonctionnalités : Azure Databricks prend également en charge une étendue de secret stockée dans (soutenue par) une base de données chiffrée détenue et gérée par Azure Databricks.

Étendues Databricks

Conseils de configuration : Assurez-vous que les secrets et les informations d’identification sont stockés dans des emplacements sécurisés tels que Azure Key Vault, au lieu de les incorporer dans du code ou des fichiers de configuration.

Référence : intégration Key Vault dans Databricks

Accès privilégié

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Accès privilégié.

PA-7 : Suivre le principe JEA, Just Enough Administration (privilège minimum)

Fonctionnalités

Azure RBAC pour le plan de données

Description : Azure Role-Based Access Control (Azure RBAC) peut être utilisé pour gérer l’accès aux actions du plan de données du service. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
True Vrai Microsoft

Remarques sur les fonctionnalités : vous pouvez utiliser les API SCIM Azure Databricks pour gérer les utilisateurs dans un espace de travail Azure Databricks et accorder des privilèges d’administration aux utilisateurs désignés.

Comment utiliser les API SCIM

Dans Azure Databricks, vous pouvez utiliser des listes de contrôle d’accès (ACL) pour configurer l’autorisation d’accéder à différents objets d’espace de travail.

Contrôle d’accès dans Databricks

Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.

Référence : Comment gérer le contrôle d’accès dans Azure Databricks

PA-8 : Déterminer le processus d’accès pour la prise en charge du fournisseur de services cloud

Fonctionnalités

Customer Lockbox

Description : Customer Lockbox peut être utilisé pour l’accès au support Microsoft. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Conseils de configuration : Dans les scénarios de support dans lesquels Microsoft doit accéder à vos données, utilisez Customer Lockbox pour passer en revue, puis approuver ou rejeter chacune des demandes d’accès aux données de Microsoft.

Référence : Customer Lockbox

Protection des données

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Protection des données.

DP-3 : chiffrer les données sensibles en transit

Fonctionnalités

Chiffrement des données en transit

Description : Le service prend en charge le chiffrement des données en transit pour le plan de données. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Remarques sur les fonctionnalités : par défaut, les données échangées entre les nœuds Worker d’un cluster ne sont pas chiffrées. Si votre environnement exige que les données soient chiffrées à tout moment, vous pouvez créer un script init qui configure vos clusters pour chiffrer le trafic entre les nœuds Worker.

Conseils de configuration : Activez le transfert sécurisé dans les services où une fonctionnalité de chiffrement des données en transit native est intégrée. Appliquez HTTPS sur toutes les applications et services web et assurez-vous que TLS v1.2 ou version ultérieure est utilisé. Les versions héritées telles que SSL 3.0 et TLS v1.0 doivent être désactivées. Pour la gestion à distance de Machines Virtuelles, utilisez SSH (pour Linux) ou RDP/TLS (pour Windows) au lieu d’un protocole non chiffré.

Référence : Chiffrement des données en transit pour Databricks

DP-4 : activer le chiffrement des données au repos par défaut

Fonctionnalités

Chiffrement des données au repos à l’aide de clés de plateforme

Description : Le chiffrement des données au repos à l’aide de clés de plateforme est pris en charge. Tout contenu client au repos est chiffré avec ces clés gérées par Microsoft. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
True Vrai Microsoft

Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.

Référence : Chiffrement des données au repos à l’aide de clés managées de plateforme dans Databricks

DP-5 : utiliser l’option de clé gérée par le client dans le chiffrement des données au repos si nécessaire

Fonctionnalités

Chiffrement des données au repos à l’aide de CMK

Description : le chiffrement des données au repos à l’aide de clés gérées par le client est pris en charge pour le contenu client stocké par le service. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Remarques sur les fonctionnalités : Azure Databricks dispose de deux fonctionnalités clés gérées par le client pour différents types de données.

Clés gérées par le client pour le chiffrement

Conseils de configuration : si nécessaire pour la conformité réglementaire, définissez le cas d’usage et l’étendue du service où le chiffrement à l’aide de clés gérées par le client est nécessaire. Activez et implémentez le chiffrement des données au repos à l’aide de la clé gérée par le client dans ces services.

Référence : Chiffrement des données au repos à l’aide de CMK dans Databricks

DP-6 : Utiliser un processus sécurisé de gestion de clés

Fonctionnalités

Gestion des clés dans Azure Key Vault

Description : Le service prend en charge l’intégration d’Azure Key Vault pour toutes les clés client, secrets ou certificats. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Remarques sur les fonctionnalités : Notez que vous ne pouvez pas utiliser un jeton d’accès personnel Azure Databricks ou un jeton d’application Azure AD qui appartient à un principal de service.

Éviter le jeton d’accès personnel

Conseils de configuration : Utilisez Azure Key Vault pour créer et contrôler le cycle de vie de vos clés de chiffrement, y compris la génération, la distribution et le stockage des clés. Faire pivoter et révoquer vos clés dans Azure Key Vault et votre service en fonction d’une planification définie ou en cas de retrait ou de compromission de clé. Lorsqu’il est nécessaire d’utiliser une clé gérée par le client (CMK) au niveau de la charge de travail, du service ou de l’application, veillez à suivre les meilleures pratiques pour la gestion des clés : utilisez une hiérarchie de clés pour générer une clé de chiffrement de données distincte (DEK) avec votre clé de chiffrement de clé (KEK) dans votre coffre de clés. Vérifiez que les clés sont inscrites auprès d’Azure Key Vault et référencées via des ID de clé à partir du service ou de l’application. Si vous devez apporter votre propre clé (BYOK) dans le service (par exemple, importer des clés protégées par HSM à partir de vos HSM locaux dans Azure Key Vault), suivez les instructions recommandées pour effectuer la génération et le transfert de clés initiaux.

Référence : Gestion des clés dans Databricks

Gestion des ressources

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Gestion des ressources.

AM-2 : Utiliser uniquement des services approuvés

Fonctionnalités

Prise en charge d’Azure Policy

Description : Les configurations de service peuvent être surveillées et appliquées via Azure Policy. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Conseils de configuration : Utilisez Microsoft Defender pour le cloud pour configurer Azure Policy afin d’auditer et d’appliquer des configurations de vos ressources Azure. Utilisez Azure Monitor pour créer des alertes en cas d’écart de configuration détecté sur les ressources. Utilisez les effets Azure Policy [refuser] et [déployer s’il n’existe pas] pour appliquer une configuration sécurisée sur les ressources Azure.

Référence : Databricks Azure Policy

Journalisation et détection des menaces

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Journalisation et détection des menaces.

LT-1 : activer les fonctionnalités de détection des menaces

Fonctionnalités

Microsoft Defender pour les offres de services/produits

Description : le service dispose d’une solution de Microsoft Defender spécifique à l’offre pour surveiller et alerter sur les problèmes de sécurité. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
False Non applicable Non applicable

Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.

LT-4 : Activer la journalisation pour l’examen de sécurité

Fonctionnalités

Journaux des ressources Azure

Description : le service produit des journaux de ressources qui peuvent fournir des métriques et une journalisation améliorées spécifiques au service. Le client peut configurer ces journaux de ressources et les envoyer à son propre récepteur de données, comme un compte de stockage ou un espace de travail Log Analytics. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Conseils de configuration : Pour la journalisation d’audit, Azure Databricks fournit des journaux de diagnostic complets de bout en bout des activités effectuées par les utilisateurs d’Azure Databricks, ce qui permet à votre entreprise de surveiller les modèles d’utilisation détaillés d’Azure Databricks.

Remarque : les journaux de diagnostic Azure Databricks nécessitent le plan Azure Databricks Premium.

Guide pratique pour activer les paramètres de diagnostic du journal d’activité Azure

Comment activer les paramètres de diagnostic pour Azure Databricks

Référence : Journaux de ressources dans Databricks

Gestion des postures et des vulnérabilités

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Gestion de la posture et des vulnérabilités.

PV-3 : définir et établir des configurations sécurisées pour les ressources de calcul

Fonctionnalités

Autres conseils pour PV-3

Lorsque vous créez un cluster Azure Databricks, il génère des images de machine virtuelle de base. Le code utilisateur est exécuté dans les conteneurs qui sont déployés sur les machines virtuelles. Implémentez une solution tierce de gestion des vulnérabilités. Si vous disposez d’un abonnement à une plateforme de gestion des vulnérabilités, vous pouvez utiliser des scripts d’initialisation Azure Databricks s’exécutant dans les conteneurs de chaque nœud, pour installer des agents d’évaluation des vulnérabilités sur vos nœuds de cluster Azure Databricks, et gérer les nœuds par le biais du portail correspondant. Notez que chaque solution tierce fonctionne différemment.

Scripts d’initialisation de nœud de cluster Databricks

Sauvegarde et récupération

Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Sauvegarde et récupération.

BR-1 : Garantir des sauvegardes automatiques régulières

Fonctionnalités

Sauvegarde Azure

Description : le service peut être sauvegardé par le service Sauvegarde Azure. Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
False Non applicable Non applicable

Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.

Fonctionnalité de sauvegarde native du service

Description : le service prend en charge sa propre fonctionnalité de sauvegarde native (s’il n’utilise pas Sauvegarde Azure). Plus d’informations

Prise en charge Activé par défaut Responsabilité de la configuration
Vrai False Customer

Remarques sur les fonctionnalités : Pour vos sources de données Azure Databricks, vérifiez que vous avez configuré un niveau approprié de redondance des données pour votre cas d’usage. Par exemple, si vous utilisez un compte de stockage Azure comme magasin de données Azure Databricks, choisissez l’option de redondance appropriée (stockage localement redondant, stockage redondant interzone, stockage géoredondant, stockage géographiquement redondant avec accès en lecture).

Sources de données pour Azure Databricks

Conseils de configuration : Il n’existe aucune aide Microsoft actuelle pour cette configuration de fonctionnalité. Vérifiez et déterminez si votre organization souhaite configurer cette fonctionnalité de sécurité.

Référence : Récupération d’urgence régionale pour les clusters Azure Databricks

Étapes suivantes