Выбор каталога рабочей области для расширения Databricks для Visual Studio Code
В этой статье описывается, как выбрать каталог рабочей области Azure Databricks для используемого расширения Databricks для Visual Studio Code. Ознакомьтесь с расширением Databricks для Visual Studio Code?
В следующих сведениях предполагается, что вы уже настроили расширение Databricks для Visual Studio Code для проверки подлинности с помощью рабочей области Azure Databricks. Сведения о настройке проверки подлинности для расширения Databricks для VS Code.
Примечание.
Если вы уже выполнили руководство по расширению VSCode для Databricks: запустите Python в кластере и в качестве задания, и вы хотите продолжать использовать каталог рабочей области из этого руководства, перейдите к задачам разработки для расширения Databricks для Visual Studio Code.
Примечание.
Расширение Databricks для Visual Studio Code работает только с создаваемыми каталогами рабочих областей. Вы не можете использовать существующий каталог рабочей области в рабочей области, если оно не было создано расширением.
Чтобы использовать каталоги рабочей области с расширением Databricks для Visual Studio Code, необходимо использовать расширение 0.3.5 или более поздней версии, а кластер Azure Databricks должен иметь Databricks Runtime 11.3 LTS или более поздней версии.
Каталоги рабочей области — это параметр по умолчанию, начиная с версии 0.3.15 расширения. Однако если вы задали расширение для использования папки Databricks Git вместо каталога рабочей области, вы можете настроить расширение обратно на использование каталогов рабочей области следующим образом:
- Открыв расширение и открыв проект кода, и профиль конфигурации Azure Databricks уже установлен, в палитре команд (просмотр палитры команд) введите
Preferences: Open User Settings
и нажмите кнопку "Параметры: Открыть Параметры пользователя".> - На вкладке "Пользователь" разверните расширения и щелкните Databricks.
- Для синхронизации: тип назначения выберите рабочую область.
- Закройте и перезапустите Visual Studio Code.
Обратите внимание, что после изменения параметра с помощью папки Databricks Git на использование каталогов рабочей области может потребоваться вручную пересинхронизировать код с рабочей областью. Для этого после создания каталога рабочей области в следующей процедуре щелкните значок со стрелками (начать синхронизацию) рядом с назначением синхронизации.
Открыв расширение и открыв проект кода, создайте новый каталог рабочей области Azure Databricks, который вы хотите использовать, или выберите существующий каталог рабочей области, созданный ранее с расширением.
Создание каталога рабочей области
Чтобы создать каталог рабочей области, сделайте следующее:
В области конфигурации рядом с пунктом "Назначение синхронизации" щелкните значок шестеренки (настройка назначения синхронизации).
В палитре команд нажмите кнопку "Создать назначение синхронизации".
Введите имя нового каталога рабочей области и нажмите клавишу ВВОД.
Расширение создает каталог с указанным именем каталога в
/Users/<your-username>/.ide
рабочей области, а затем добавляет путь каталога рабочей области к файлу проекта.databricks/project.json
кода, например"workspacePath": "/Users/<your-username>/.ide/<your-directory-name>"
.Примечание.
Если имя каталога удаленной рабочей области не соответствует имени локального проекта кода, появится значок предупреждения с этим сообщением: имя назначения удаленной синхронизации не соответствует текущему имени рабочей области Visual Studio Code. Это предупреждение можно игнорировать, если имена не должны совпадать.
После установки каталога рабочей области начните синхронизацию с каталогом рабочей области, щелкнув значок со стрелками (начать синхронизацию) рядом с назначением синхронизации.
Внимание
Расширение Databricks для Visual Studio Code выполняет только односторонней синхронизации изменений файлов из локального проекта Visual Studio Code с соответствующим каталогом рабочей области в удаленной рабочей области Azure Databricks. Файлы в этом каталоге удаленной рабочей области предназначены для временных. Не инициируйте изменения этих файлов из удаленной рабочей области, так как эти изменения не будут синхронизированы с локальным проектом.
Продолжайте выполнять задачи разработки для расширения Databricks для Visual Studio Code.
Повторное использование существующего каталога рабочей области
Если у вас есть существующий каталог рабочей области, созданный ранее с расширением Databricks для Visual Studio Code и который хотите повторно использовать в текущем проекте Visual Studio Code, выполните следующие действия.
В области конфигурации рядом с пунктом "Назначение синхронизации" щелкните значок шестеренки (настройка назначения синхронизации).
В палитре команд выберите имя каталога рабочей области из списка.
Расширение добавляет путь каталога рабочей области к файлу проекта .databricks/project.json
кода, например "workspacePath": "/Users/<your-username>/.ide/<your-directory-name>"
.
Примечание.
Если имя каталога удаленной рабочей области не соответствует имени локального проекта кода, появится значок предупреждения с этим сообщением: имя назначения удаленной синхронизации не соответствует текущему имени рабочей области Visual Studio Code. Это предупреждение можно игнорировать, если имена не должны совпадать.
После установки каталога рабочей области начните синхронизацию с каталогом рабочей области, щелкнув значок со стрелками (начать синхронизацию) рядом с назначением синхронизации.
Внимание
Расширение Databricks для Visual Studio Code выполняет только односторонней синхронизации изменений файлов из локального проекта Visual Studio Code с соответствующим каталогом рабочей области в удаленной рабочей области Azure Databricks. Файлы в этом каталоге удаленной рабочей области предназначены для временных. Не инициируйте изменения этих файлов из удаленной рабочей области, так как эти изменения не будут синхронизированы с локальным проектом.
Продолжайте выполнять задачи разработки для расширения Databricks для Visual Studio Code.