Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Применимо к:
SQL Server 2019 и более ранних версий Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Это важно
Интеллектуальный анализ данных был признан устаревшим в службах SQL Server 2017 Analysis Services и теперь прекращён в службах SQL Server 2022 Analysis Services. Документация не обновляется для устаревших и прекращённых функций. Дополнительные сведения см. в статье о обратной совместимости служб Analysis Services.
В Microsoft SQL Server SQL Server Analysis Services можно определить как физический тип данных для столбца в структуре интеллектуального анализа данных, так и логический тип контента для столбца при использовании в модели.
Тип данных определяет, как алгоритмы обрабатывают данные в этих столбцах при создании моделей интеллектуального анализа данных. Определение типа данных столбца дает алгоритму сведения о типе данных в столбцах и способах обработки данных. Каждый тип данных в SQL Server Analysis Services поддерживает один или несколько типов контента для интеллектуального анализа данных.
Тип контента описывает поведение содержимого, содержащегося в столбце. Например, если содержимое в столбце повторяется в определенном интервале, например дня недели, можно указать тип контента этого столбца как циклический.
Некоторые алгоритмы требуют правильной работы определенных типов данных и конкретных типов контента. Например, алгоритм Microsoft Naive Bayes не может использовать непрерывные столбцы в качестве входных данных и не может прогнозировать непрерывные значения. Некоторые типы контента, такие как последовательность ключей, используются только определенным алгоритмом. Список алгоритмов и типов контента, поддерживаемых каждым из них, см. в разделе "Алгоритмы интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных).
В следующем списке описываются типы контента, используемые в интеллектуальном анализе данных, и определяются типы данных, поддерживающие каждый тип.
Дискретный
Дискретный означает, что столбец содержит конечное число значений без континуума между значениями. Например, гендерный столбец является типичным дискретным столбцом атрибутов, в том, что данные представляют определенное количество категорий.
Значения в дискретном столбце атрибутов не могут подразумевать упорядочение, даже если значения числовые. Кроме того, даже если значения, используемые для дискретного столбца, числовые, дробные значения не могут быть вычисляться. Коды областей телефонов являются хорошим примером дискретных данных, которые являются числовыми.
Дискретный тип контента поддерживается всеми типами данных анализа данных.
Непрерывный
Непрерывный означает, что столбец содержит значения, представляющие числовые данные в масштабе, который позволяет промежуточным значениям. В отличие от дискретного столбца, представляющего конечные, подсчитываемые данные, непрерывный столбец представляет масштабируемые измерения и может содержать бесконечное количество дробных значений. Столбец температуры является примером столбца непрерывного атрибута.
Если столбец содержит непрерывные числовые данные, и вы знаете, как следует распределять данные, можно повысить точность анализа, указав ожидаемое распределение значений. Вы указываете распределение столбцов на уровне структуры анализа данных. Таким образом, параметр применяется ко всем моделям, основанным на структуре, дополнительные сведения см. в разделе "Распределение столбцов" (интеллектуальный анализ данных).
Тип непрерывного контента поддерживается следующими типами данных: Date, Double и Long.
Дискретизировано
Дискретизация — это процесс размещения значений непрерывного набора данных в контейнеры, чтобы было ограниченное количество возможных значений. Вы можете дискретизировать только числовые данные.
Таким образом, дискретизированный тип контента указывает, что столбец содержит значения, представляющие группы или контейнеры значений, производных от непрерывного столбца. Бакеты обрабатываются как упорядоченные и дискретные значения.
Вы можете дискретизировать данные вручную, чтобы обеспечить получение нужных сегментов или использовать методы дискретизации, предоставляемые в службах SQL Server Analysis Services. Некоторые алгоритмы выполняют дискретизацию автоматически. Дополнительные сведения см. в разделе "Изменение дискретизации столбца в модели интеллектуального анализа данных".
Дискретизированный тип контента поддерживается следующими типами данных: Date, Double, Long и Text.
Key
Тип данных ключ означает, что столбец однозначно идентифицирует строку. В таблице кейсов обычно ключевой столбец представляет собой числовой или текстовый идентификатор. Тип контента устанавливается на ключ, чтобы указать, что столбец не должен использоваться для анализа, а только для отслеживания записей.
Вложенные таблицы также имеют ключи, но использование вложенного ключа таблицы немного отличается. Если столбец является атрибутом, который вы хотите проанализировать, необходимо указать key как тип контента во вложенной таблице. Значения в ключе вложенной таблицы должны быть уникальными для каждого случая, но могут повторяться во всем наборе случаев.
Например, если вы анализируете продукты, которые покупают клиенты, необходимо задать content type как key для столбца CustomerID в основной таблице и снова задать content type как key для столбца PurchasedProducts в вложенной таблице.
Замечание
Вложенные таблицы доступны только в том случае, если вы используете данные из внешнего источника данных, который был определен как представление источника данных служб Analysis Services.
Этот тип контента поддерживается следующими типами данных: Date, Double, Long и Text.
Последовательность ключей
Тип контента последовательности ключей можно использовать только в моделях кластеризации последовательностей. При установке типа контента на последовательность ключей указывает, что столбец содержит значения, представляющие последовательность событий. Значения упорядочены, но не обязательно равными интервалами.
Этот тип контента поддерживается следующими типами данных: Double, Long, Text и Date.
Ключевое время
Тип контента key time можно использовать только в моделях временных рядов. При установке типа контента на ключевое время указывает, что значения упорядочены и представляют шкалу времени.
Этот тип контента поддерживается следующими типами данных: Double, Long и Date.
Таблица
Тип содержимого таблицы указывает, что столбец содержит другую таблицу данных с одним или несколькими столбцами и одной или несколькими строками. Для любой строки в таблице регистров этот столбец может содержать несколько значений, связанных с родительской записью регистра. Например, если в таблице основного дела содержится список клиентов, вы можете иметь несколько столбцов, содержащих вложенные таблицы, такие как столбец ProductsPurchased , где вложенная таблица перечисляет продукты, приобретенные этим клиентом в прошлом, и столбец "Хобби ", который перечисляет интересы клиента.
Тип данных этого столбца всегда является таблицей.
Циклические
Тип циклического контента означает, что столбец содержит значения, представляющие циклический упорядоченный набор. Например, нумерованные дни недели являются циклическим упорядоченным набором, так как день номер один следует за днем номер семь.
Циклические столбцы считаются упорядоченными и дискретными с точки зрения типа контента.
Этот тип контента поддерживается всеми типами данных для интеллектуального анализа данных в Службах SQL Server Analysis Services. Однако большинство алгоритмов рассматривают циклические значения как дискретные значения и не выполняют специальную обработку.
Упорядоченный
Тип упорядоченного контента также указывает, что столбец содержит значения, определяющие последовательность или порядок. Однако в этом типе контента значения, используемые для упорядочивания, не подразумевают никакого расстояния или связи величин между значениями в наборе. Например, если упорядоченный столбец атрибутов содержит сведения о уровнях навыков в порядке ранжирования от одного до пяти, не существует подразумеваемой информации на расстоянии между уровнями навыков; Уровень навыка из пяти не обязательно пять раз лучше, чем уровень навыка одного.
Упорядоченные столбцы атрибутов считаются дискретными с точки зрения типа контента.
Этот тип контента поддерживается всеми типами данных анализа данных в службах SQL Server Analysis Services. Однако большинство алгоритмов рассматривают упорядоченные значения как дискретные значения и не выполняют специальную обработку.
Классифицированы
Помимо предыдущих типов контента, которые обычно используются со всеми моделями, для некоторых типов данных можно использовать классифицированные столбцы для определения типов контента. Дополнительные сведения о классифицированных столбцах см. в разделе "Классифицированные столбцы" (интеллектуальный анализ данных).
См. также
Типы контента (DMX)
Типы данных (интеллектуальный анализ данных)
Типы данных (DMX)
Изменение свойств структуры интеллектуального анализа данных
Столбцы структуры интеллектуального анализа данных