Base de référence de sécurité Azure pour Azure Databricks
Cette base de référence de sécurité applique les conseils du benchmark de sécurité cloud Microsoft version 1.0 à Azure Databricks. Le Benchmark de sécurité Microsoft Cloud fournit des recommandations sur la façon dont vous pouvez sécuriser vos solutions cloud sur Azure. Le contenu est regroupé selon les contrôles de sécurité définis par le benchmark de sécurité cloud Microsoft et les conseils associés applicables à Azure Databricks.
Vous pouvez superviser cette base de référence de la sécurité et ses recommandations en utilisant Microsoft Defender pour le cloud. Azure Policy définitions sont répertoriées dans la section Conformité réglementaire de la page Microsoft Defender pour le portail cloud.
Lorsqu’une fonctionnalité a des définitions de Azure Policy pertinentes, elles sont répertoriées dans cette base de référence pour vous aider à mesurer la conformité avec les contrôles et recommandations du benchmark de sécurité cloud Microsoft. Certaines recommandations peuvent nécessiter un plan de Microsoft Defender payant pour activer certains scénarios de sécurité.
Notes
Les fonctionnalités non applicables à Azure Databricks ont été exclues. Pour voir comment Azure Databricks est entièrement mappé au benchmark de sécurité cloud Microsoft, consultez le fichier de mappage complet de la base de référence de sécurité Azure Databricks.
Profil de sécurité
Le profil de sécurité résume les comportements à fort impact d’Azure Databricks, ce qui peut entraîner des considérations de sécurité accrues.
Attribut de comportement du service | Valeur |
---|---|
Catégorie de produit | Analytique, stockage |
Le client peut accéder à HOST/OS | Aucun accès |
Le service peut être déployé dans le réseau virtuel du client | Vrai |
Stocke le contenu client au repos | Vrai |
Sécurité du réseau
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Sécurité réseau.
NS-1 : Établir des limites de segmentation réseau
Fonctionnalités
Intégration du réseau virtuel
Description : Le service prend en charge le déploiement dans le Réseau virtuel privé (VNet) du client. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Conseils de configuration : Le déploiement par défaut d’Azure Databricks est un service entièrement managé sur Azure : toutes les ressources de plan de données, y compris un réseau virtuel auquel tous les clusters seront associés, sont déployées sur un groupe de ressources verrouillé. Cependant, si vous devez personnaliser votre réseau, vous pouvez déployer les ressources de plan de données Azure Databricks dans votre propre réseau virtuel (injection de réseau virtuel), ce qui vous permet de mettre en œuvre des configurations réseau personnalisées. Vous pouvez appliquer votre propre groupe de sécurité réseau (NSG) avec des règles personnalisées à des restrictions de trafic de sortie spécifiques.
Référence : Intégration au réseau virtuel Databricks
Prise en charge des groupes de sécurité réseau
Description : Le trafic réseau de service respecte l’attribution de règles groupes de sécurité réseau sur ses sous-réseaux. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Conseils de configuration : Utilisez des groupes de sécurité réseau (NSG) pour restreindre ou surveiller le trafic par port, protocole, adresse IP source ou adresse IP de destination. Créez des règles NSG pour restreindre les ports ouverts de votre service (par exemple, pour empêcher l’accès aux ports de gestion à partir de réseaux non approuvés). N’oubliez pas que par défaut, les groupes de sécurité réseau refusent tout le trafic entrant, mais autorisent le trafic provenant du réseau virtuel et d’équilibreurs de charge Azure.
Référence : Groupe de sécurité réseau
NS-2 : Sécuriser les services cloud avec des contrôles réseau
Fonctionnalités
Azure Private Link
Description : Fonctionnalité de filtrage IP native du service pour le filtrage du trafic réseau (à ne pas confondre avec le groupe de sécurité réseau ou Pare-feu Azure). Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
False | Non applicable | Non applicable |
Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.
Désactiver l’accès public au réseau
Description : le service prend en charge la désactivation de l’accès au réseau public à l’aide d’une règle de filtrage de liste de contrôle d’accès IP au niveau du service (pas de groupe de sécurité réseau ou de Pare-feu Azure) ou à l’aide d’un commutateur bascule « Désactiver l’accès réseau public ». Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Conseils de configuration : Les clients Azure Databricks peuvent utiliser la fonctionnalité listes d’accès IP pour définir un ensemble d’adresses IP approuvées afin d’empêcher l’accès à partir d’adresses IP publiques ou non approuvées.
Référence : Liste d’accès IP dans Databricks
Gestion des identités
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Gestion des identités.
IM-1 : utiliser le système centralisé d’identité et d’authentification
Fonctionnalités
Azure AD Authentication requis pour l’accès au plan de données
Description : Le service prend en charge l’utilisation de l’authentification Azure AD pour l’accès au plan de données. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
True | Vrai | Microsoft |
Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.
IM-3 : gérer les identités d’application de façon sécurisée et automatique
Fonctionnalités
Identités managées
Description : les actions du plan de données prennent en charge l’authentification à l’aide d’identités managées. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
False | Non applicable | Non applicable |
Remarques sur les fonctionnalités : Azure Databricks est automatiquement configuré pour utiliser l’authentification unique Azure Active Directory (Azure AD) pour authentifier les utilisateurs. Les utilisateurs en dehors de votre organisation doivent suivre le processus d’invitation et être ajoutés à votre locataire Active Directory avant de pouvoir se connecter à Azure Databricks via l’authentification unique. Vous pouvez implémenter SCIM pour automatiser le provisionnement et le déprovisionnement des utilisateurs à partir des espaces de travail.
Comprendre l’authentification unique pour Azure Databricks
Comment utiliser les API SCIM pour Azure Databricks
Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.
Principaux de service
Description : Le plan de données prend en charge l’authentification à l’aide de principaux de service. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Conseils de configuration : Pour les services qui ne prennent pas en charge les identités managées, utilisez Azure Active Directory (Azure AD) pour créer un principal de service avec des autorisations restreintes au niveau de la ressource. Configurez les principaux de service avec des informations d’identification de certificat et revenez aux secrets client pour l’authentification.
Référence : Principal de service dans Databricks
IM-7 : restreindre l’accès aux ressources en fonction des conditions
Fonctionnalités
Accès conditionnel pour le plan de données
Description : L’accès au plan de données peut être contrôlé à l’aide de stratégies d’accès conditionnel Azure AD. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
True | Vrai | Microsoft |
Remarques sur les fonctionnalités : En outre, Azure Databricks prend en charge les listes d’accès IP pour sécuriser l’accès à l’application web et à l’API REST.
Listes d’accès IP dans Databricks
Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.
Référence : Accès conditionnel dans Databricks
IM-8 : restreindre l’exposition des informations d’identification et des secrets
Fonctionnalités
Prise en charge de l’intégration et du stockage des informations d’identification et des secrets de service dans Azure Key Vault
Description : Le plan de données prend en charge l’utilisation native d’Azure Key Vault pour le magasin d’informations d’identification et de secrets. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Remarques sur les fonctionnalités : Azure Databricks prend également en charge une étendue de secret stockée dans (soutenue par) une base de données chiffrée détenue et gérée par Azure Databricks.
Conseils de configuration : Assurez-vous que les secrets et les informations d’identification sont stockés dans des emplacements sécurisés tels que Azure Key Vault, au lieu de les incorporer dans du code ou des fichiers de configuration.
Référence : intégration Key Vault dans Databricks
Accès privilégié
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Accès privilégié.
PA-7 : Suivre le principe JEA, Just Enough Administration (privilège minimum)
Fonctionnalités
Azure RBAC pour le plan de données
Description : Azure Role-Based Access Control (Azure RBAC) peut être utilisé pour gérer l’accès aux actions du plan de données du service. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
True | Vrai | Microsoft |
Remarques sur les fonctionnalités : vous pouvez utiliser les API SCIM Azure Databricks pour gérer les utilisateurs dans un espace de travail Azure Databricks et accorder des privilèges d’administration aux utilisateurs désignés.
Dans Azure Databricks, vous pouvez utiliser des listes de contrôle d’accès (ACL) pour configurer l’autorisation d’accéder à différents objets d’espace de travail.
Contrôle d’accès dans Databricks
Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.
Référence : Comment gérer le contrôle d’accès dans Azure Databricks
PA-8 : Déterminer le processus d’accès pour la prise en charge du fournisseur de services cloud
Fonctionnalités
Customer Lockbox
Description : Customer Lockbox peut être utilisé pour l’accès au support Microsoft. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Conseils de configuration : Dans les scénarios de support dans lesquels Microsoft doit accéder à vos données, utilisez Customer Lockbox pour passer en revue, puis approuver ou rejeter chacune des demandes d’accès aux données de Microsoft.
Référence : Customer Lockbox
Protection des données
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Protection des données.
DP-3 : chiffrer les données sensibles en transit
Fonctionnalités
Chiffrement des données en transit
Description : Le service prend en charge le chiffrement des données en transit pour le plan de données. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Remarques sur les fonctionnalités : par défaut, les données échangées entre les nœuds Worker d’un cluster ne sont pas chiffrées. Si votre environnement exige que les données soient chiffrées à tout moment, vous pouvez créer un script init qui configure vos clusters pour chiffrer le trafic entre les nœuds Worker.
Conseils de configuration : Activez le transfert sécurisé dans les services où une fonctionnalité de chiffrement des données en transit native est intégrée. Appliquez HTTPS sur toutes les applications et services web et assurez-vous que TLS v1.2 ou version ultérieure est utilisé. Les versions héritées telles que SSL 3.0 et TLS v1.0 doivent être désactivées. Pour la gestion à distance de Machines Virtuelles, utilisez SSH (pour Linux) ou RDP/TLS (pour Windows) au lieu d’un protocole non chiffré.
Référence : Chiffrement des données en transit pour Databricks
DP-4 : activer le chiffrement des données au repos par défaut
Fonctionnalités
Chiffrement des données au repos à l’aide de clés de plateforme
Description : Le chiffrement des données au repos à l’aide de clés de plateforme est pris en charge. Tout contenu client au repos est chiffré avec ces clés gérées par Microsoft. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
True | Vrai | Microsoft |
Conseils de configuration : Aucune configuration supplémentaire n’est requise, car elle est activée sur un déploiement par défaut.
Référence : Chiffrement des données au repos à l’aide de clés managées de plateforme dans Databricks
DP-5 : utiliser l’option de clé gérée par le client dans le chiffrement des données au repos si nécessaire
Fonctionnalités
Chiffrement des données au repos à l’aide de CMK
Description : le chiffrement des données au repos à l’aide de clés gérées par le client est pris en charge pour le contenu client stocké par le service. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Remarques sur les fonctionnalités : Azure Databricks dispose de deux fonctionnalités clés gérées par le client pour différents types de données.
Clés gérées par le client pour le chiffrement
Conseils de configuration : si nécessaire pour la conformité réglementaire, définissez le cas d’usage et l’étendue du service où le chiffrement à l’aide de clés gérées par le client est nécessaire. Activez et implémentez le chiffrement des données au repos à l’aide de la clé gérée par le client dans ces services.
Référence : Chiffrement des données au repos à l’aide de CMK dans Databricks
DP-6 : Utiliser un processus sécurisé de gestion de clés
Fonctionnalités
Gestion des clés dans Azure Key Vault
Description : Le service prend en charge l’intégration d’Azure Key Vault pour toutes les clés client, secrets ou certificats. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Remarques sur les fonctionnalités : Notez que vous ne pouvez pas utiliser un jeton d’accès personnel Azure Databricks ou un jeton d’application Azure AD qui appartient à un principal de service.
Éviter le jeton d’accès personnel
Conseils de configuration : Utilisez Azure Key Vault pour créer et contrôler le cycle de vie de vos clés de chiffrement, y compris la génération, la distribution et le stockage des clés. Faire pivoter et révoquer vos clés dans Azure Key Vault et votre service en fonction d’une planification définie ou en cas de retrait ou de compromission de clé. Lorsqu’il est nécessaire d’utiliser une clé gérée par le client (CMK) au niveau de la charge de travail, du service ou de l’application, veillez à suivre les meilleures pratiques pour la gestion des clés : utilisez une hiérarchie de clés pour générer une clé de chiffrement de données distincte (DEK) avec votre clé de chiffrement de clé (KEK) dans votre coffre de clés. Vérifiez que les clés sont inscrites auprès d’Azure Key Vault et référencées via des ID de clé à partir du service ou de l’application. Si vous devez apporter votre propre clé (BYOK) dans le service (par exemple, importer des clés protégées par HSM à partir de vos HSM locaux dans Azure Key Vault), suivez les instructions recommandées pour effectuer la génération et le transfert de clés initiaux.
Référence : Gestion des clés dans Databricks
Gestion des ressources
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Gestion des ressources.
AM-2 : Utiliser uniquement des services approuvés
Fonctionnalités
Prise en charge d’Azure Policy
Description : Les configurations de service peuvent être surveillées et appliquées via Azure Policy. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Conseils de configuration : Utilisez Microsoft Defender pour le cloud pour configurer Azure Policy afin d’auditer et d’appliquer des configurations de vos ressources Azure. Utilisez Azure Monitor pour créer des alertes en cas d’écart de configuration détecté sur les ressources. Utilisez les effets Azure Policy [refuser] et [déployer s’il n’existe pas] pour appliquer une configuration sécurisée sur les ressources Azure.
Référence : Databricks Azure Policy
Journalisation et détection des menaces
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Journalisation et détection des menaces.
LT-1 : activer les fonctionnalités de détection des menaces
Fonctionnalités
Microsoft Defender pour les offres de services/produits
Description : le service dispose d’une solution de Microsoft Defender spécifique à l’offre pour surveiller et alerter sur les problèmes de sécurité. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
False | Non applicable | Non applicable |
Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.
LT-4 : Activer la journalisation pour l’examen de sécurité
Fonctionnalités
Journaux des ressources Azure
Description : le service produit des journaux de ressources qui peuvent fournir des métriques et une journalisation améliorées spécifiques au service. Le client peut configurer ces journaux de ressources et les envoyer à son propre récepteur de données, comme un compte de stockage ou un espace de travail Log Analytics. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Conseils de configuration : Pour la journalisation d’audit, Azure Databricks fournit des journaux de diagnostic complets de bout en bout des activités effectuées par les utilisateurs d’Azure Databricks, ce qui permet à votre entreprise de surveiller les modèles d’utilisation détaillés d’Azure Databricks.
Remarque : les journaux de diagnostic Azure Databricks nécessitent le plan Azure Databricks Premium.
Guide pratique pour activer les paramètres de diagnostic du journal d’activité Azure
Comment activer les paramètres de diagnostic pour Azure Databricks
Référence : Journaux de ressources dans Databricks
Gestion des postures et des vulnérabilités
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Gestion de la posture et des vulnérabilités.
PV-3 : définir et établir des configurations sécurisées pour les ressources de calcul
Fonctionnalités
Autres conseils pour PV-3
Lorsque vous créez un cluster Azure Databricks, il génère des images de machine virtuelle de base. Le code utilisateur est exécuté dans les conteneurs qui sont déployés sur les machines virtuelles. Implémentez une solution tierce de gestion des vulnérabilités. Si vous disposez d’un abonnement à une plateforme de gestion des vulnérabilités, vous pouvez utiliser des scripts d’initialisation Azure Databricks s’exécutant dans les conteneurs de chaque nœud, pour installer des agents d’évaluation des vulnérabilités sur vos nœuds de cluster Azure Databricks, et gérer les nœuds par le biais du portail correspondant. Notez que chaque solution tierce fonctionne différemment.
Scripts d’initialisation de nœud de cluster Databricks
Sauvegarde et récupération
Pour plus d’informations, consultez le benchmark de sécurité cloud Microsoft : Sauvegarde et récupération.
BR-1 : Garantir des sauvegardes automatiques régulières
Fonctionnalités
Sauvegarde Azure
Description : le service peut être sauvegardé par le service Sauvegarde Azure. Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
False | Non applicable | Non applicable |
Conseils de configuration : cette fonctionnalité n’est pas prise en charge pour sécuriser ce service.
Fonctionnalité de sauvegarde native du service
Description : le service prend en charge sa propre fonctionnalité de sauvegarde native (s’il n’utilise pas Sauvegarde Azure). Plus d’informations
Prise en charge | Activé par défaut | Responsabilité de la configuration |
---|---|---|
Vrai | False | Customer |
Remarques sur les fonctionnalités : Pour vos sources de données Azure Databricks, vérifiez que vous avez configuré un niveau approprié de redondance des données pour votre cas d’usage. Par exemple, si vous utilisez un compte de stockage Azure comme magasin de données Azure Databricks, choisissez l’option de redondance appropriée (stockage localement redondant, stockage redondant interzone, stockage géoredondant, stockage géographiquement redondant avec accès en lecture).
Sources de données pour Azure Databricks
Conseils de configuration : Il n’existe aucune aide Microsoft actuelle pour cette configuration de fonctionnalité. Vérifiez et déterminez si votre organization souhaite configurer cette fonctionnalité de sécurité.
Référence : Récupération d’urgence régionale pour les clusters Azure Databricks
Étapes suivantes
- Consultez la vue d’ensemble du benchmark de sécurité cloud Microsoft
- En savoir plus sur les bases de référence de la sécurité Azure