Таблица данных
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Класс таблицы данных
Набор данных — это данные, отправленные в Студию машинного обучения (классическую) для использования в процессе моделирования. Даже если вы загрузите данные в другом формате или зададите формат хранения, такой как CSV, ARFF или TSV, при каждом использовании модулем в эксперименте данные будут неявно преобразовываться в объект DataTable
.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Набор данных основан на таблице данных .NET
Типы столбцов
DataTable
состоит из набора столбцов с соответствующими метаданными. Эти столбцы реализуют интерфейс IArray
. столбцы данных в Машинное обучение Studio (классическая модель) понятны как одномерные массивы, то есть векторы.
Класс массива .NET реализует эти универсальные интерфейсы: System.Collections.Generic.IList<T>
, System.Collections.Generic.ICollection<T>
и System.Collections.Generic.IEnumerable<T>
.
Столбцы типов int
, double
и Boolean
обычно представляются как числовые сжатые массивы. Если в сжатом столбце содержатся отсутствующие значения, он будет обрабатывать либо как отсутствующий массив значений, либо как неограниченный массив объектов, допускающий значение null.
Столбцы, содержащие строки, обрабатываются как плотные массивы объектов. Если отсутствуют значения, отсутствующие значения представляются либо как значения NULL, либо как тип MissingValuesObjectArray<string>
.
дополнительные сведения см. в разделе класс Array (библиотека MSDN).
Получение столбцов в DataTable
Столбец можно получить, вызвав GetColumn
метод для DataTable. GetColumn
Метод имеет две перегрузки:
GetColumn(<Int64>)
получает столбец по его индексу.GetColumn(<string>)
получает столбец по его имени.
Другие интерфейсы в студии (классическая модель)
в этом разделе также описаны следующие интерфейсы для Машинное обучение Studio (классическая модель):
Тип | Описание |
---|---|
Интерфейс ICluster | Интерфейс Иклустер определяет структуру моделей кластеризации. |
Интерфейс IFilter | Интерфейс IFilter определяет структуру фильтров обработки цифровых сигналов, применяемых ко всему ряду числовых значений. Фильтры можно создать, а затем сохранить и применить к новому ряду. |
Интерфейс ILearner | Интерфейс ILearner предоставляет универсальную структуру для определения и сохранения аналитических моделей, исключая некоторые специальные типы, такие как модели кластеризации. |
Интерфейс ITransform | Интерфейс Итрансформ предоставляет универсальную структуру для определения и сохранения преобразований. вы можете создать итрансформ с помощью Машинное обучение Studio (классическая модель), а затем применить преобразование к новым наборам данных. |