Управление файлами в томах каталога Unity с помощью драйвера ODBC Databricks
В этой статье описывается, как отправлять, скачивать и удалять файлы в томах каталога Unity с помощью драйвера ODBC Databricks.
Требования
- Databricks ODBC Driver версии 2.8.2 или более поздней версии.
- По умолчанию режим собственного запроса включен. В противном случае добавьте
UseNativeQuery
свойство в строка подключения ODBC, присвойте ей значение1
или2
.
Отправка файла
Чтобы отправить файл в том, необходимо добавить StagingAllowedLocalPaths
свойство в строка подключения ODBC, установив значение этого свойства в путь к отправке файла. Чтобы отправить несколько файлов из отдельных расположений, задайте для этого свойства список путей, разделенных запятыми, например /tmp/,/usr/tmp/
.
Чтобы переопределить содержимое любого существующего файла в указанном расположении отправки, добавьте OVERWRITE
.
В следующем фрагменте кода Python показано, как отправить файл в том.
conn_string = "".join([
"DRIVER=", os.getenv("ODBC_DRIVER", "/Library/simba/spark/lib/libsparkodbc_sbu.dylib"),
";Host=", os.getenv("ODBC_HOST_NAME", "<<HOST_NAME>>"),
";PORT=443",
";HTTPPath=", os.getenv("ODBC_HTTP_PATH", "/sql/1.0/endpoints/1234567890"),
";AuthMech=11",
";SSL=1",
";ThriftTransport=2",
";SparkServerType=3",
";Auth_Flow=0",
";Auth_AccessToken=", os.getenv("API_TOKEN", "<<NO_ACCESS_TOKEN_IS_SET>>"),
";StagingAllowedLocalPaths=", "/tmp"),
os.getenv("ODBC_OPTIONS", ""),
])
conn = pyodbc.connect(conn_string, autocommit=True)
cursor = conn.cursor()
cursor.execute("PUT '" +
"/tmp/my-data.csv" +
"' INTO '" +
"/Volumes/main/default/my-volume/my-data.csv" +
"' OVERWRITE")
Скачивание файла
В следующем фрагменте кода Python показано, как скачать файл из тома.
conn = pyodbc.connect(conn_string, autocommit=True)
cursor = conn.cursor()
cursor.execute("GET '" +
"/Volumes/main/default/my-volume/my-data.csv" +
"' TO '" +
"/tmp/my-downloaded-data.csv" +
"'")
Удаление файла
В следующем фрагменте кода Python показано, как удалить файл из тома.
conn = pyodbc.connect(conn_string, autocommit=True)
cursor = conn.cursor()
cursor.execute("REMOVE '" +
"/Volumes/main/default/my-volume/my-data.csv" +
"'")