События
Присоединяйтесь к нам в FabCon Vegas
31 мар., 23 - 2 апр., 23
Конечное событие Microsoft Fabric, Power BI, SQL и ai community. 31 марта по 2 апреля 2025 г.
Зарегистрироваться сегодняЭтот браузер больше не поддерживается.
Выполните обновление до Microsoft Edge, чтобы воспользоваться новейшими функциями, обновлениями для системы безопасности и технической поддержкой.
Область применения:✅ хранилище в Microsoft Fabric
В этой статье описаны основные понятия разработки таблиц в Microsoft Fabric.
В таблицах данные логически организованы в формате строк и столбцов. Каждая строка представляет собой уникальную запись, а каждый столбец — поле записи.
Схема звезды упорядочивает данные в таблицы фактов и таблицы измерений. Некоторые таблицы используются для интеграции или промежуточного хранения данных до того, как они перейдут в таблицу фактов или измерений. При конструировании таблицы решите, к какой таблице относятся данные: фактов, измерений или интеграции. Это решение информирует соответствующую структуру таблицы.
Таблицы фактов содержат количественные данные, которые обычно создаются в транзакционной системе, а затем загружаются в хранилище данных. Например, розничное предприятие ежедневно создает транзакции продаж, а затем загружает данные в таблицу фактов хранилища данных для анализа.
Таблицы измерений содержат данные атрибутов, которые могут измениться, хотя обычно это происходит редко. Например, имя и адрес клиента хранятся в таблице измерений и обновляются только при изменении профиля клиента. Чтобы минимизировать размер большой таблицы фактов, необязательно включать имя и адрес клиента в каждой строке. Вместо этого в таблице фактов и таблице измерений может совместно использоваться идентификатор клиента. Запрос может объединить две таблицы, чтобы связать профиль и транзакции клиента.
Таблицы интеграции служат для интеграции или промежуточного размещения данных. Например, вы можете загружать данные в промежуточную таблицу, выполнять преобразования данных в режиме промежуточного размещения, а затем вставлять их в рабочую таблицу.
Таблица хранит данные в OneLake в составе хранилища. Таблица и данные сохраняются независимо от того, открыт ли сеанс.
Чтобы отобразить организацию таблиц, можно использовать fact
dim
int
или в качестве префиксов в именах таблиц. В следующей таблице показаны некоторые имена схем и таблиц для примера хранилища данных WideWorldImportersDW .
Имя исходной таблицы WideWorldImportersDW | Тип таблицы | Имя таблицы хранилища данных |
---|---|---|
Город | Измерение | wwi.DimCity |
Порядок | Факт | wwi.FactOrder |
/
или \
заканчиваться ими .
.Для хранилища можно создать таблицу в виде новой пустой таблицы. Вы также можете создать и заполнить таблицу результатами инструкции Select. Ниже приведены команды T-SQL для создания таблицы.
Инструкция Т-SQL | Description |
---|---|
CREATE TABLE | Создает пустую таблицу, определив все столбцы и параметры таблицы. |
CREATE TABLE AS SELECT | Задает новую таблицу с результатами инструкции Select. Столбцы и типы данных таблицы основаны на результатах инструкции Select. Чтобы импортировать данные, эта инструкция может выбрать данные из внешней таблицы. |
В этом примере создается таблица с двумя столбцами:
CREATE TABLE MyTable (col1 int, col2 int );
Хранилище поддерживает создание пользовательских схем. Как и в SQL Server, схемы — это хороший способ группировки объектов, которые используются аналогичным образом. В следующем коде создается пользовательская схема с именем wwi
.
/
или \
заканчиваться ими .
.CREATE SCHEMA wwi;
Microsoft Fabric поддерживает наиболее часто используемые типы данных T-SQL.
Latin1_General_100_BIN2_UTF8
В настоящее время используется значение по умолчанию и поддерживается только параметры сортировки для таблиц и метаданных.
Оптимизатор запросов использует статистику уровня столбца при создании плана выполнения запроса. Чтобы повысить производительность запросов, важно получить статистику по отдельным столбцам, особенно столбцам, используемым в объединениях запросов. Хранилище поддерживает автоматическое создание статистики.
Обновление статистики выполняется вручную. Обновите статистику после добавления или изменения значительного числа строк. Например, есть смысл обновить статистику после загрузки. Дополнительные сведения см. в статье Managing statistics on tables in SQL Data Warehouse (Управление статистикой таблиц в хранилище данных SQL).
Для хранилища ограничения PRIMARY KEY и UNIQUE поддерживаются только при использовании НЕКЛАСТЕРED и NOT ENFORCED.
ВНЕШНИЙ КЛЮЧ поддерживается только в том случае, если используется NOT ENFORCED.
Таблицы хранилища заполняются путем загрузки данных из другого источника данных. Для успешной загрузки число и типы данных столбцов исходных данных должны совпадать с определением таблицы в хранилище данных.
Если данные поступают из нескольких хранилищ данных, вы можете перенести их в хранилище данных и сохранить их в таблице интеграции. После ввода данных в таблицу интеграции можно использовать возможности хранилища данных для реализации операций преобразования. После подготовки данных их можно вставить в рабочие таблицы.
Хранилище поддерживает множество функций таблицы, предлагаемых другими базами данных, но не все.
В следующем списке показаны некоторые функции таблицы, которые сейчас не поддерживаются.
Важно!
Существуют ограничения при добавлении ограничений таблицы или столбцов при использовании системы управления версиями с хранилищем.
События
Присоединяйтесь к нам в FabCon Vegas
31 мар., 23 - 2 апр., 23
Конечное событие Microsoft Fabric, Power BI, SQL и ai community. 31 марта по 2 апреля 2025 г.
Зарегистрироваться сегодняОбучение
Модуль
Начало работы с хранилищами данных в Microsoft Fabric - Training
Ознакомьтесь с ключевыми компонентами и рекомендациями по проектированию для реализации хранилищ данных в Microsoft Fabric.
Сертификация
Сертифицировано корпорацией Майкрософт: Связывание Инженер данных Fabric - Certifications
Специалист по обработке данных структуры должен иметь опыт работы с шаблонами загрузки данных, архитектурами данных и процессами оркестрации.