Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Преобразует входные данные в формат файла связи атрибутов, который используется инструментарием Weka.
Категория: преобразования форматов данных
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Обзор модуля
в этой статье описывается, как использовать модуль convert to ARFF в Машинное обучение Studio (классическая модель) для преобразования наборов данных и результатов в формат файла связи атрибутов, используемый набором инструментов Weka. Этот формат известен как ARFF.
Спецификация данных ARFF для weka поддерживает несколько задач машинного обучения, включая предварительную обработку данных, классификацию и выбор компонентов. В этом формате данные упорядочены по показателями и их атрибутам и содержатся в одном текстовом файле. Подробные сведения о формате файла weka можно найти в разделе Технические примечания .
как правило, преобразование в формат файла Weka требуется только в том случае, если вы хотите использовать как Машинное обучение, так и Weka и хотите перемещать обучающие данные между ними.
Дополнительные сведения о наборе инструментов weka см. в статье Википедии: weka (машинное обучение) .
Предупреждение
Невозможно перезаписать существующий файл ARFF в службу хранилища Azure.
Использование Convert to ARFF
Добавьте модуль Convert to ARFF в свой эксперимент. этот модуль можно найти в категории преобразования форматов данных в Машинное обучение Studio (классическая модель).
Подключите его к любому модулю, который выводит набор данных.
Запустите эксперимент или выберите модуль преобразовать в ARFF и нажмите кнопку Выполнить выбранное.
Результаты
Чтобы создать копию данных в локальной папке, дважды щелкните выходные данные Convert to ARFFи выберите параметр Download (загрузить ).
Если папка не указана, применяется имя файла по умолчанию и файл сохраняется в локальной библиотеке загрузок .
Примечание
Этот модуль не поддерживает экспорт в код Python или R.
Примеры
В Коллекция решений ии Azureнет примеров, относящихся к этому формату. Однако эти эксперименты демонстрируют другие типы преобразования форматов:
Сжатие изображений на основе цветов: экспортирует наборы данных, используемые для каждой части анализа, в файлы для воспроизводимость и использования на других платформах аналитики.
Перекрестная проверка для примера двоичной классификации: экспортирует результаты перекрестной проверки в файлы, чтобы результаты для нескольких моделей можно было сравнивать с помощью такого средства, как Excel.
Технические примечания
В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.
Пример формата ARFF
В этом разделе приведен пример того, как типичный набор данных будет выглядеть при преобразовании в ARFF.
Обычно файл данных ARFF состоит из двух разделов: заголовка , определяющего источник данных и схему, и раздела данных , содержащего фактические сущности и их атрибуты.
Заголовок ARFF
Заголовок для файла ARFF определяет список атрибутов (в столбцах) и их типы данных. Заголовок также может содержать несколько строк комментариев, описывающих источник данных, или другие примечания.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Совет
Если в преобразуемом наборе данных отсутствуют имена столбцов, используйте модуль изменение метаданных для добавления имен столбцов перед использованием преобразования в ARFF.
Данные ARFF
Раздел данных состоит из значений, разделенных запятыми, и очень похож на CSV-файл без заголовков столбцов.
@DATA 5.1,3.5,1.4,0.2,0
Дополнительные сведения об этом формате файлов см. на вики-странице weka: ARFF (версия для разработчиков).
Текущая версия ARFF
Машинное обучение Studio (классическая модель) сохраняет файлы ARFF, используя формат ARFF 3,0.
Ожидаемые входные данные
Имя | Тип | Описание |
---|---|---|
Dataset | Таблица данных | Входной набор данных |
Выходные данные
Имя | Тип | Описание |
---|---|---|
Набор данных результатов | Arff | Выходной набор данных |
См. также раздел
Преобразование формата данных
Список модулей в алфавитном порядке