Поделиться через


Таблица данных

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Класс таблицы данных

Набор данных — это данные, отправленные в Студию машинного обучения (классическую) для использования в процессе моделирования. Даже если вы загрузите данные в другом формате или зададите формат хранения, такой как CSV, ARFF или TSV, при каждом использовании модулем в эксперименте данные будут неявно преобразовываться в объект DataTable.

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Набор данных основан на таблице данных .NET

Типы столбцов

DataTable состоит из набора столбцов с соответствующими метаданными. Эти столбцы реализуют интерфейс IArray. столбцы данных в Машинное обучение Studio (классическая модель) понятны как одномерные массивы, то есть векторы.

Класс массива .NET реализует эти универсальные интерфейсы: System.Collections.Generic.IList<T> , System.Collections.Generic.ICollection<T> и System.Collections.Generic.IEnumerable<T> .

Столбцы типов int , double и Boolean обычно представляются как числовые сжатые массивы. Если в сжатом столбце содержатся отсутствующие значения, он будет обрабатывать либо как отсутствующий массив значений, либо как неограниченный массив объектов, допускающий значение null.

Столбцы, содержащие строки, обрабатываются как плотные массивы объектов. Если отсутствуют значения, отсутствующие значения представляются либо как значения NULL, либо как тип MissingValuesObjectArray<string> .

дополнительные сведения см. в разделе класс Array (библиотека MSDN).

Получение столбцов в DataTable

Столбец можно получить, вызвав GetColumn метод для DataTable. GetColumnМетод имеет две перегрузки:

  • GetColumn(<Int64>) получает столбец по его индексу.

  • GetColumn(<string>) получает столбец по его имени. 

Другие интерфейсы в студии (классическая модель)

в этом разделе также описаны следующие интерфейсы для Машинное обучение Studio (классическая модель):

Тип Описание
Интерфейс ICluster Интерфейс Иклустер определяет структуру моделей кластеризации.
Интерфейс IFilter Интерфейс IFilter определяет структуру фильтров обработки цифровых сигналов, применяемых ко всему ряду числовых значений. Фильтры можно создать, а затем сохранить и применить к новому ряду.
Интерфейс ILearner Интерфейс ILearner предоставляет универсальную структуру для определения и сохранения аналитических моделей, исключая некоторые специальные типы, такие как модели кластеризации.
Интерфейс ITransform Интерфейс Итрансформ предоставляет универсальную структуру для определения и сохранения преобразований. вы можете создать итрансформ с помощью Машинное обучение Studio (классическая модель), а затем применить преобразование к новым наборам данных.

См. также раздел

Типы данных модуля