Изучение и создание таблиц в DBFS

Внимание

Поддержка этой документации прекращена, она может больше не обновляться. Продукты, службы или технологии, упоминание в этом содержимом больше не поддерживаются. См. статью "Загрузка данных с помощью пользовательского интерфейса добавления данных", "Создание или изменение таблицы с помощью отправки файлов" и "Что такое каталог Обозреватель?".

Доступ к устаревшей отправке и созданию таблиц DBFS с помощью пользовательского интерфейса добавления данных. Нажмите кнопку Значок "Создать > базу данных".>

Вы также можете получить доступ к пользовательскому интерфейсу из записных книжек, нажав кнопку "Добавить данные".>

Databricks рекомендует использовать Обозреватель каталога для улучшения работы с объектами данных и управления списками управления доступом и таблицей создания или изменения таблицы с страницы отправки файлов для легкого приема небольших файлов в Delta Lake.

Примечание.

Доступность некоторых элементов, описанных в этой статье, зависит от конфигураций рабочей области. Обратитесь к администратору рабочей области или группе учетной записи Azure Databricks.

Импорт данных

Если у вас есть небольшие файлы данных на локальном компьютере, которые требуется проанализировать с помощью Azure Databricks, можно импортировать их в DBFS с помощью пользовательского интерфейса.

Примечание.

Администраторы рабочей области могут отключить эту функцию. Дополнительные сведения см. в разделе "Управление отправкой данных".

Файлы, импортированные в DBFS с помощью этих методов, хранятся в FileStore.

Создание таблицы

Вы можете запустить пользовательский интерфейс таблицы DBFS, нажав кнопку Значок "Создать" на боковой панели или кнопку DBFS в пользовательском интерфейсе добавления данных. Вы можете заполнить таблицу из файлов в DBFS или отправить файлы.

С помощью пользовательского интерфейса можно создавать только внешние таблицы.

  1. Выберите источник данных и выполните действия, описанные в соответствующем разделе, чтобы настроить таблицу.

    Если администратор рабочей области Azure Databricks отключил параметр "Отправить файл", у вас нет возможности отправлять файлы; вы можете создать таблицы с помощью одного из других источников данных.

    Инструкции по отправке файла

    1. Перетащите файлы в область Файлы или щелкните эту область для просмотра и выбора файлов. После отправки для каждого файла будет отображаться путь. Путь будет выглядеть примерно так: /FileStore/tables/<filename>-<integer>.<file-type>. Его можно использовать в записной книжке для считывания данных.
    2. Щелкните Создать таблицу с помощью пользовательского интерфейса.
    3. В раскрывающемся меню "Кластер" выберите кластер.

    Инструкции по DBFS

    1. Выберите файл.
    2. Щелкните Создать таблицу с помощью пользовательского интерфейса.
    3. В раскрывающемся меню "Кластер" выберите кластер.
  2. Щелкните Предварительный просмотр таблицы, чтобы просмотреть таблицу.

  3. В поле Имя таблицы при необходимости переопределите имя таблицы по умолчанию. Имя таблицы может содержать только буквенно-цифровые символы в нижнем регистре и знаки подчеркивания, а также должно начинаться с буквы в нижнем регистре или знака подчеркивания.

  4. В поле Создать в базе данных при необходимости переопределите выбранную базу данных default.

  5. В поле Тип файла при необходимости переопределите выведенный тип файла.

  6. Если файл имеет тип CSV:

    1. В поле Разделитель столбцов выберите, следует ли переопределить выведенный разделитель.
    2. Укажите, следует ли использовать первую запись в качестве заголовка столбца.
    3. Укажите, следует ли выводить схему.
  7. Если файл имеет тип JSON, укажите, содержит ли он несколько строк.

  8. Щелкните Создать таблицу.

Просмотр баз данных и таблиц

Примечание.

Рабочие области с включенными Обозреватель каталога не имеют доступа к устаревшему поведению, описанному ниже.

Щелкните Значок каталогакаталог на боковой панели. Azure Databricks выберет работающий кластер, к которому у вас есть доступ. Папка Databases (Базы данных) отображает список баз данных с выбранной базой данных default. Папка Tables (Таблицы) отображает список таблиц в базе данных default.

Создание списка таблиц

Вы можете изменить кластер в меню Databases (Базы данных), создать пользовательский интерфейс таблицы или просмотреть пользовательский интерфейс таблицы. Например, в меню Databases (Базы данных):

  1. Щелкните стрелку Down Caret вниз в верхней части папки "Базы данных".

  2. Выберите кластер.

    Выбор кластера

Просмотр сведений о таблице

В представлении сведений о таблице отображаются схема таблицы и выборка данных.

  1. Щелкните Значок каталогакаталог на боковой панели.

  2. В папке Databases (Базы данных) щелкните базу данных.

  3. В папке Tables (Таблицы) щелкните имя таблицы.

  4. В раскрывающемся списке "Кластер" при необходимости выберите другой кластер, чтобы отобразить предварительный просмотр таблицы.

    Сведения о таблицах

    Примечание.

    При предварительном отображении таблицы запрос Spark SQL выполняется на кластере, выбранном в раскрывающемся списке Кластер. Если в кластере уже выполняется рабочая нагрузка, на загрузку предварительного просмотра таблицы может понадобится больше времени.

Удаление таблицы с помощью пользовательского интерфейса

  1. Щелкните Значок каталогакаталог на боковой панели.
  2. Щелкните рядом Раскрывающийся список меню с именем таблицы и нажмите кнопку "Удалить".