Beperkingen voor de compute-toegangsmodus voor Unity Catalog
Databricks raadt aan unity catalog en de modus voor gedeelde toegang te gebruiken voor de meeste workloads. In dit artikel worden verschillende beperkingen beschreven voor elke toegangsmodus met Unity Catalog. Zie Access-modi voor meer informatie over toegangsmodi.
Databricks raadt het gebruik van rekenbeleid aan om configuratieopties voor de meeste gebruikers te vereenvoudigen. Zie Rekenbeleid maken en beheren.
Notitie
Gedeeld zonder isolatie is een verouderde toegangsmodus die geen ondersteuning biedt voor Unity Catalog.
Belangrijk
Init-scripts en -bibliotheken bieden verschillende ondersteuning voor toegangsmodi en Databricks Runtime-versies. Zie Waar kunnen init-scripts worden geïnstalleerd? en bibliotheken met clusterbereik.
Beperkingen voor de toegangsmodus voor één gebruiker voor Unity Catalog
De toegangsmodus voor één gebruiker in Unity Catalog heeft de volgende beperkingen. Dit zijn naast de algemene beperkingen voor alle Unity Catalog-toegangsmodus. Zie Algemene beperkingen voor Unity Catalog.
Gedetailleerde beperkingen voor toegangsbeheer voor Unity Catalog-modus voor één gebruiker
Dynamische weergaven worden niet ondersteund.
Als u vanuit een weergave wilt lezen, moet
SELECT
u beschikken over alle tabellen en weergaven waarnaar wordt verwezen.U hebt geen toegang tot een tabel met een rijfilter of kolommasker.
U kunt geen rekenkracht van één gebruiker gebruiken om query's uit te voeren op tabellen die zijn gemaakt met een Delta Live Tables-pijplijn met Unity Catalog, inclusief streamingtabellen en gerealiseerde weergaven die zijn gemaakt in Databricks SQL. Als u een query wilt uitvoeren op tabellen die zijn gemaakt met een Delta Live Tables-pijplijn, moet u een gedeelde berekening gebruiken met Databricks Runtime 13.3 LTS en hoger.
Streamingbeperkingen voor de toegangsmodus voor één gebruiker in Unity Catalog
- Asynchrone controlepunten worden niet ondersteund in Databricks Runtime 11.3 LTS en hieronder.
Beperkingen voor gedeelde toegangsmodus voor Unity Catalog
De modus Voor gedeelde toegang in Unity Catalog gelden de volgende beperkingen. Dit zijn naast de algemene beperkingen voor alle Unity Catalog-toegangsmodus. Zie Algemene beperkingen voor Unity Catalog.
Databricks Runtime ML en Spark Machine Learning Library (MLlib) worden niet ondersteund.
Spark-submit-taken worden niet ondersteund.
In Databricks Runtime 13.3 en hoger mogen afzonderlijke rijen niet groter zijn dan de maximale grootte van 128 MB.
Wanneer deze wordt gebruikt met referentiepassthrough, worden Unity Catalog-functies uitgeschakeld.
Aangepaste containers worden niet ondersteund.
Taalondersteuning voor de gedeelde toegangsmodus van Unity Catalog
- R wordt niet ondersteund.
- Scala wordt ondersteund in Databricks Runtime 13.3 en hoger.
Spark-API-beperkingen voor de modus voor gedeelde toegang van Unity Catalog
- RDD-API's worden niet ondersteund.
- DBUtils en andere clients die de gegevens rechtstreeks lezen uit cloudopslag, worden alleen ondersteund wanneer u een externe locatie gebruikt voor toegang tot de opslaglocatie. Zie Een externe locatie maken om cloudopslag te verbinden met Azure Databricks.
- Spark-context (
sc
),spark.sparkContext
ensqlContext
worden niet ondersteund voor Scala in een Databricks Runtime en worden niet ondersteund voor Python in Databricks Runtime 14.0 en hoger.- Databricks raadt aan de
spark
variabele te gebruiken om met hetSparkSession
exemplaar te communiceren. - De volgende
sc
functies worden ook niet ondersteund:emptyRDD
,range
,init_batched_serializer
,parallelize
, ,textFile
setSystemProperty
binaryFiles
wholeTextFiles
binaryRecords
sequenceFile
newAPIHadoopFile
pickleFile
hadoopFile
hadoopRDD
newAPIHadoopRDD
stop
uiWebUrl
union
runJob
,setJobGroup
, , .setLocalProperty
getConf
- Databricks raadt aan de
UDF-beperkingen voor de gedeelde toegangsmodus van Unity Catalog
Belangrijk
Ondersteuning voor Scala UDF's voor rekenkracht met gedeelde toegangsmodus in Unity Catalog bevindt zich in openbare preview.
Door de gebruiker gedefinieerde functies (UDF's) hebben de volgende beperkingen met de modus voor gedeelde toegang:
Hive UDF's worden niet ondersteund.
applyInPandas
enmapInPandas
worden niet ondersteund in Databricks Runtime 14.2 en lager.In Databricks Runtime 14.2 en hoger worden Scalaire UDF's ondersteund. Andere Scala UDF's en UDAF's worden niet ondersteund.
In Databricks Runtime 13.3 LTS en hoger worden Python scalaire UDF's en Pandas UDF's ondersteund. Andere Python UDF's, waaronder UDAFs, UDFS en Pandas in Spark, worden niet ondersteund.
Zie door de gebruiker gedefinieerde functies (UDF's) in Unity Catalog.
Streamingbeperkingen voor de gedeelde toegangsmodus van Unity Catalog
Notitie
Sommige van de vermelde Kafka-opties hebben beperkte ondersteuning wanneer ze worden gebruikt voor ondersteunde configuraties in Azure Databricks. Zie Stream-verwerking met Apache Kafka en Azure Databricks.
- Voor Scala
foreach
enforeachBatch
worden niet ondersteund. - Voor Python heeft u
foreachBatch
nieuw gedrag in Databricks Runtime 14.0 en hoger. Zie Gedragswijzigingen voor foreachBatch in Databricks Runtime 14.0. - Voor Scala
from_avro
is Databricks Runtime 14.2 of hoger vereist. applyInPandasWithState
wordt niet ondersteund.- Werken met socketbronnen wordt niet ondersteund.
- De
sourceArchiveDir
moet zich op dezelfde externe locatie bevinden als de bron wanneer u een gegevensbron gebruiktoption("cleanSource", "archive")
die wordt beheerd door Unity Catalog. - Voor Kafka-bronnen en -sinks worden de volgende opties niet ondersteund:
kafka.sasl.client.callback.handler.class
kafka.sasl.login.callback.handler.class
kafka.sasl.login.class
kafka.partition.assignment.strategy
- De volgende Kafka-opties worden ondersteund in Databricks Runtime 13.3 LTS en hoger, maar niet ondersteund in Databricks Runtime 12.2 LTS. U kunt alleen externe locaties opgeven die worden beheerd door Unity Catalog voor deze opties:
kafka.ssl.truststore.location
kafka.ssl.keystore.location
Toegangsbeperkingen voor netwerk- en bestandssysteem voor de gedeelde toegangsmodus van Unity Catalog
Opdrachten moeten worden uitgevoerd op rekenknooppunten als een gebruiker met beperkte bevoegdheden die geen toegang heeft tot gevoelige onderdelen van het bestandssysteem.
In Databricks Runtime 11.3 LTS en hieronder kunt u alleen netwerkverbindingen maken met poorten 80 en 443.
Kan geen verbinding maken met de instantiemetagegevensservice of Azure WireServer.
Algemene beperkingen voor Unity Catalog
De volgende beperkingen gelden voor alle toegangsmodi voor Unity Catalog.
Streamingbeperkingen voor Unity Catalog
- De modus continue verwerking van Apache Spark wordt niet ondersteund. Zie Continue verwerking in de Spark Structured Streaming Programming Guide.
StreamingQueryListener
kan geen referenties gebruiken of werken met objecten die worden beheerd door Unity Catalog.
Zie ook streamingbeperkingen voor de toegangsmodus voor één gebruiker in Unity Catalog en streamingbeperkingen voor de modus voor gedeelde toegang tot Unity Catalog.
Zie Unity Catalog gebruiken met Structured Streaming voor meer informatie over streamen met Unity Catalog.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor