Školení
Modul
Práce se soubory a adresáři v aplikaci Node.js pomocí JavaScriptu - Training
Sestavte aplikaci, která manipuluje se soubory a adresáři s Node.js pomocí JavaScript CommonJS.
Tento prohlížeč se už nepodporuje.
Upgradujte na Microsoft Edge, abyste mohli využívat nejnovější funkce, aktualizace zabezpečení a technickou podporu.
S pracovními soubory uloženými v Azure Databricks můžete pracovat programově. To umožňuje úlohy, jako jsou:
Soubory pracovního prostoru můžete vytvářet, upravovat, přejmenovat a odstraňovat prostřednictvím kódu programu v Databricks Runtime 11.3 LTS a novějších. Tato funkce je podporována pro poznámkové bloky v Databricks Runtime 16.2 a novějších a v bezserverových prostředích 2 a novějších.
Poznámka
Pokud chcete zakázat zápis do souborů pracovního prostoru, nastavte proměnnou prostředí clusteru WSFS_ENABLE_WRITE_SUPPORT=false
. Další informace naleznete v tématu Proměnné prostředí.
Poznámka
Ve službě Databricks Runtime 14.0 a vyšší je výchozí aktuální pracovní adresář (CWD) pro kód spuštěný místně, je adresář obsahující spuštěný poznámkový blok nebo skript. Jedná se o změnu chování z Databricks Runtime 13.3 LTS a níže. Viz Co je výchozí aktuální pracovní adresář?.
Příkazy shellu slouží ke čtení umístění souborů, například v úložišti nebo v místním systému souborů.
Pokud chcete určit umístění souborů, zadejte následující:
%sh ls
/databricks/driver
./Workspace/Repos/name@domain.com/public_repo_2/repos_file_system
.Malé datové soubory, jako jsou soubory .csv
nebo .json
, můžete programově načíst z kódu v poznámkových blocích. Následující příklad používá Pandas k dotazování souborů uložených v adresáři /data
vzhledem ke kořenovému adresáři úložiště projektu:
import pandas as pd
df = pd.read_csv("./data/winequality-red.csv")
df
Spark můžete použít ke čtení datových souborů. Musíte poskytnout Sparku plně kvalifikovanou cestu.
file:/Workspace/Repos/<user-folder>/<repo-name>/path/to/file
.file:/Workspace/Users/<user-folder>/path/to/file
.Absolutní nebo relativní cestu k souboru můžete zkopírovat z rozevírací nabídky vedle souboru:
Následující příklad ukazuje použití {os.getcwd()}
k získání úplné cesty.
import os
spark.read.format("csv").load(f"file:{os.getcwd()}/my_data.csv")
Další informace o souborech v Azure Databricks najdete v tématu Práce se soubory v azure Databricks.
V Databricks Runtime 11.3 LTS a novějších můžete přímo manipulovat se soubory pracovního prostoru v Azure Databricks. Poznámkové bloky jsou považovány za soubory pracovního prostoru v Databricks Runtime 16.2 a vyšším a v bezserverovém prostředí 2 a vyšším. Následující příklady používají standardní balíčky a funkce Pythonu k vytváření a manipulaci se soubory a adresáři.
# Create a new directory
os.mkdir('dir1')
# Create a new file and write to it
with open('dir1/new_file.txt', "w") as f:
f.write("new content")
# Append to a file
with open('dir1/new_file.txt', "a") as f:
f.write(" continued")
# Delete a file
os.remove('dir1/new_file.txt')
# Delete a directory
os.rmdir('dir1')
Také všechny programatické interakce se soubory jsou k dispozici pro poznámkové bloky v Databricks Runtime 16.2 a novějším a v bezserverovém prostředí 2 a vyšším. Prostředek v pracovním prostoru je identifikován jako poznámkový blok, pokud má příponu .ipynb
, nebo pokud obsahuje řetězec Databricks notebook source
v komentáři na prvním řádku a má jednu z následujících přípon: .py
, .r
, .scala
, .sql
. Jakýkoli zápis nebo přejmenování poznámkového bloku nebo souboru, který tyto podmínky změní, změní také typ poznámkového bloku nebo souboru. Pokud máte například soubor myfile.txt
, který má na prvním řádku # Databricks notebook source
, přejmenujte ho na myfile.py
, což ho promění v poznámkový blok.
Školení
Modul
Práce se soubory a adresáři v aplikaci Node.js pomocí JavaScriptu - Training
Sestavte aplikaci, která manipuluje se soubory a adresáři s Node.js pomocí JavaScript CommonJS.
Dokumentace
Co jsou soubory pracovního prostoru? – Azure Databricks
Zjistěte, co jsou soubory pracovního prostoru a jak s nimi pracovat v Azure Databricks.
Doporučení pro soubory ve svazcích a souborech pracovních prostorů – Azure Databricks
Vyhledejte doporučení úložiště pro soubory ve svazcích a souborech pracovních prostorů v Databricks.
Základní využití souborů pracovního prostoru – Azure Databricks
Naučte se používat uživatelské rozhraní k vytváření, nahrávání a úpravám souborů pracovního prostoru ve složkách Databricks Git.