Partager via


Vue d’ensemble du calcul standard

Cette page fournit une vue d’ensemble du calcul standard.

Qu’est-ce que le calcul standard ?

Le calcul standard est configuré avec le mode d’accès standard. Les ressources de calcul standard peuvent être utilisées par n’importe quel utilisateur autorisé à le faire.

Le calcul standard est recommandé pour la plupart des charges de travail. Le calcul standard permet à n’importe quel nombre d’utilisateurs d’attacher et d’exécuter simultanément des charges de travail sur la même ressource de calcul, ce qui permet d’économiser des coûts et de simplifier la gestion du calcul. Le calcul standard exécute le code utilisateur en isolation complète sans accès aux ressources de niveau inférieur.

Sélection du mode d’accès

Le mode d’accès est configuré lors de la création d’une ressource de calcul à usage unique ou de travail. Le paramètre du mode d’accès se trouve sous la section Avancé de l’interface utilisateur de calcul et représenté par data_security_mode l’API.

Par défaut, dans l’interface utilisateur, le mode d’accès est défini sur Automatique, ce qui signifie que le mode d’accès est automatiquement choisi pour vous en fonction de votre runtime Databricks sélectionné. La valeur par défaut automatique est Standard , sauf si un runtime Machine Learning ou un Databricks Runtimes inférieur à 14.3 est sélectionné, auquel cas Dedicated est utilisé.

Quand utiliser le calcul standard

Le calcul standard est recommandé pour la plupart des charges de travail, notamment :

  • Ingénierie générale des données et pipelines ETL : la plupart des charges de travail de traitement des données
  • Projets de science des données collaboratives : Équipes travaillant ensemble sur l’analyse et le développement de modèles
  • Exploration interactive des données : analyse ad hoc et développement basé sur des notebooks
  • Optimisation des coûts : Quand vous souhaitez partager des ressources de calcul sur plusieurs utilisateurs

Choisissez le calcul dédié uniquement pour les charges de travail spécialisées nécessitant un accès aux ordinateurs privilégiés, des API RDD, un ML distribué, des GPU ou R. Pour obtenir la liste des limitations de calcul standard, consultez les exigences et limitations de calcul standard.

Prise en charge du langage et du runtime

Le calcul standard prend en charge le langage de programmation suivant :

  • Python : Prise en charge complète de toutes les versions de Databricks Runtime
  • SQL : Prise en charge complète de toutes les versions de Databricks Runtime
  • Scala : prise en charge sur Databricks Runtime 13.3 LTS et versions ultérieures avec le catalogue Unity
  • R : Non pris en charge sur le calcul standard

Lakeguard pour l’isolation des utilisateurs

Le calcul standard utilise Azure Databricks Lakeguard pour fournir une isolation utilisateur sécurisée et une gouvernance des données. Lakeguard utilise des techniques d’isolation de code avancées qui séparent le code utilisateur de l’infrastructure Spark sous-jacente.

Pour plus d’informations, consultez Comment Databricks applique-t-il l’isolation des utilisateurs ?.