Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek vysvětluje aktuální omezení výpočetních prostředků bez serveru pro poznámkové bloky a úlohy. Začíná přehledem nejdůležitějších aspektů a pak poskytuje komplexní referenční seznam omezení.
Podpora jazyků a rozhraní API
- R není podporován.
- Podporují se pouze rozhraní API služby Spark Connect. Rozhraní API Spark RDD nejsou podporována.
- Spark Connect, který je využíván bezserverovými výpočty, odkládá analýzy a překlad názvů na dobu provádění, což může změnit chování vašeho kódu. Viz Porovnání Spark Connect s Klasickým Sparkem.
- ANSI SQL je výchozí při psaní SQL. Odhlaste se z režimu ANSI nastavením
spark.sql.ansi.enablednafalse. - Při vytváření datového rámce z místních dat pomocí
spark.createDataFrame, velikosti řádků nesmí překročit 128 MB.
Přístup k datům a úložiště
- Abyste se mohli připojit k externím zdrojům dat, musíte použít Katalog Unity. K přístupu ke cloudovému úložišti používejte externí umístění.
- Přístup k DBFS je omezený. Místo toho použijte svazky Unity Catalog nebo soubory pracovního prostoru.
- Souřadnice Mavenu nejsou podporovány.
- Globální dočasná zobrazení se nepodporují. Pokud se vyžaduje předávání dat mezi relacemi, databricks doporučuje používat dočasná zobrazení relace nebo vytvářet tabulky.
Uživatelem definované funkce (UDF)
- Uživatelem definované funkce (UDF) nemají přístup k internetu. Z tohoto důvodu se příkaz CREATE FUNCTION (externí) nepodporuje. Databricks doporučuje k vytváření UDF používat CREATE FUNCTION (SQL a Python).
- Uživatelem definovaný vlastní kód, jako například UDF,
mapamapPartitions, nesmí překročit 1 GB využití paměti. - Scala UDF nelze použít uvnitř funkcí s vyšším pořadím.
Uživatelské rozhraní a protokolování
- Uživatelské rozhraní Sparku není k dispozici. Místo toho použijte profil dotazu k zobrazení informací o dotazech Sparku. Viz profil dotazu.
- Protokoly Sparku nejsou k dispozici. Uživatelé mají přístup pouze k protokolům aplikací na straně klienta.
Přístup k sítím a pracovním prostorům
- Přístup mezi pracovními prostory je povolený jen v případě, že se pracovní prostory nacházejí ve stejné oblasti a cílový pracovní prostor nemá nakonfigurovaný ACL IP ani front-end PrivateLink.
- Služba Databricks Container Services se nepodporuje.
Omezení streamování
Bezserverové výpočetní prostředky podporují následující triggery strukturovaného streamování:
-
Trigger.AvailableNow(). Databricks doporučuje tento režim triggeru pro bezserverové výpočetní prostředky. -
Trigger.Once(). Tento zastaralý režim se podporuje, ale nedoporučuje se.
Na výpočetních prostředcích bez serveru se nepodporují následující triggery:
-
Trigger.Continuous(interval). -
Trigger.ProcessingTime(interval).- Pokud nezadáte režim triggeru, Apache Spark ve výchozím nastavení nastaví trigger na
Trigger.ProcessingTime("0 seconds"). U výpočetních prostředků bez serveru musíte nastavit podporovaný trigger.
- Pokud nezadáte režim triggeru, Apache Spark ve výchozím nastavení nastaví trigger na
Pokud se pokusíte použít nepodporovanou aktivační událost, dotaz vyvolá chybu INFINITE_STREAMING_TRIGGER_NOT_SUPPORTED.
Pro úlohy průběžného streamování použijte režim spuštění na vyžádání nebo nepřetržitý režim kanálu na serverless, nebo používejte Trigger.AvailableNow() pro nepřetržité spouštění úloh.
Platí také všechna omezení pro streamování v režimu standardního přístupu. Viz omezení streamování.
Omezení notebooků
- Jazyk Scala ani R není v noteboocích podporován.
- Knihovny JAR nejsou v poznámkových blocích podporované. Alternativní řešení najdete v tématu Osvědčené postupy pro výpočetní prostředky bez serveru. Podporují se úlohy JAR v rámci úloh. Podívejte se na úkol JAR přiřazený pracovním úlohám.
- Knihovny určené pro poznámkové bloky se neukládají do mezipaměti napříč vývojovými relacemi.
- Sdílení tabulek a zobrazení TEMP při sdílení poznámkového bloku mezi uživateli se nepodporuje.
- Automatické dokončování a průzkumník proměnných pro datové rámce v poznámkových sešitech nejsou podporovány.
- Ve výchozím nastavení se nové poznámkové bloky ukládají ve
.ipynbformátu. Pokud je váš poznámkový blok uložen ve zdrojovém formátu, nemusí se bezserverová metadata zachytit správně a některé funkce nemusí fungovat podle očekávání. - Značky poznámkových bloků nejsou podporovány. Použijte zásady pro bezserverové využití k označení bezserverového využití.
Omezení úloh
- Protokoly úloh nejsou izolované pro jednotlivá spuštění úloh. Logy budou obsahovat výsledky z více úloh.
- Knihovny úloh nejsou podporovány pro úkoly poznámkového bloku. Místo toho používejte knihovny omezené na poznámkový blok. Viz knihovny Python v rámci notebooků.
- Ve výchozím nastavení nemají úlohy bez serveru časový limit provádění dotazů. Pomocí vlastnosti
spark.databricks.execution.timeoutmůžete nastavit časový limit provádění dotazů úloh. Další podrobnosti najdete v tématu Konfigurace vlastností Sparku pro bezserverové poznámkové bloky a úlohy.
Omezení specifická pro výpočty
Následující funkce specifické pro výpočetní prostředky se nepodporují:
- Výpočetní zásady
- Inicializační skripty pro oblast výpočtů
- Knihovny s výpočetním zaměřením, včetně vlastních zdrojů dat a rozšíření pro Spark. Místo toho používejte knihovny s vymezeným poznámkovým blokem.
- Fondy instancí
- Protokoly výpočetních událostí
- Většina konfigurací výpočtů Apache Sparku Seznam podporovaných konfigurací najdete v tématu Konfigurace vlastností Sparku pro bezserverové poznámkové bloky a úlohy.
- Proměnné prostředí. Místo toho Databricks doporučuje k vytvoření parametrů úloh a úkolů používat widgety.
Omezení ukládání do mezipaměti
- Metadata se ukládají do mezipaměti v bezserverových výpočetních relacích. Z tohoto důvodu se kontext relace při přepínání katalogů nemusí plně obnovit. Pokud chcete vymazat kontext relace, resetujte výpočetní prostředek bez serveru nebo spusťte novou relaci.
- Rozhraní API DataFrame a mezipaměti SQL se na bezserverových výpočetních prostředcích nepodporují. Když použijete některá z těchto rozhraní API nebo příkazů SQL, dojde k výjimce.
Omezení Hive
Tabulky Hive SerDe se nepodporují. Kromě toho se nepodporuje odpovídající příkaz LOAD DATA, který načte data do tabulky Hive SerDe. Při použití příkazu dojde k výjimce.
Podpora zdrojů dat je omezená na AVRO, BINARYFILE, CSV, DELTA, JSON, KAFKA, ORC, PARQUET, ORC, TEXT a XML.
Proměnné Hive (například
${env:var},${configName},${system:var}aspark.sql.variable) nebo odkazy na proměnné konfigurace používající${var}syntaxi nejsou podporovány. Při použití proměnných Hive dojde k výjimce.Místo toho použijte DECLARE VARIABLE odkazy na proměnné relace SQL SET VARIABLE a značky parametrů ('?', nebo ':var') k deklaraci, úpravě a odkazu na stav relace. V mnoha případech můžete také použít klauzuli IDENTIFIER k parametrizaci názvů objektů.
Podporované zdroje dat
Bezserverové výpočetní prostředky podporují pro operace DML následující zdroje dat (zápis, aktualizace, odstranění):
CSVJSONAVRODELTAKAFKAPARQUETORCTEXTUNITY_CATALOGBINARYFILEXMLSIMPLESCANICEBERG
Výpočetní prostředí bez serveru podporuje pro operace čtení následující zdroje dat:
CSVJSONAVRODELTAKAFKAPARQUETORCTEXTUNITY_CATALOGBINARYFILEXMLSIMPLESCANICEBERGMYSQLPOSTGRESQLSQLSERVERREDSHIFTSNOWFLAKE-
SQLDW(Azure Synapse) DATABRICKSBIGQUERYORACLESALESFORCESALESFORCE_DATA_CLOUDTERADATAWORKDAY_RAASMONGODB