Udostępnij za pośrednictwem


Konwertowanie na TSV

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Konwertuje dane wejściowe na format rozdzielany tabulatorami

Kategoria: Konwersje formatu danych

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób używania modułu Convert to TSV w programie Machine Learning Studio (wersja klasyczna) do konwertowania dowolnego zestawu danych z formatu wewnętrznego, który jest używany przez wszystkie moduły programu Machine Learning Studio (klasyczne) do pliku płaskiego w formacie rozdzielanym tabulatorami.

Pliki wartości rozdzielanych tabulatorami (TSV) są zgodne z wieloma narzędziami zewnętrznymi, w tym:

  • R i Python

  • Excel i PowerPivot

  • Wszystkie relacyjne bazy danych

Jeśli na przykład eksperyment zawiera pośredni zestaw danych, który chcesz zapisać do ponownego użycia w innym narzędziu lub który chcesz wywołać z kodu, przekonwertuj go na format TSV, a następnie kliknij prawym przyciskiem myszy przekonwertowany zestaw danych, aby uzyskać kod języka Python wymagany do uzyskania dostępu do zestawu danych.

Jak używać funkcji Konwertuj na TSV

Użyj modułu Convert to TSV (Konwertuj na TSV ), gdy zajdzie potrzeba pobrania zestawu danych w formacie rozdzielanym tabulatorami.

  1. Dodaj do eksperymentu pozycję Konwertuj na TSV . Ten moduł można znaleźć w kategorii Konwersje formatu danych w programie Machine Learning Studio (wersja klasyczna).

  2. Połączenie moduł do innego zestawu danych lub do modułu, który wyprowadza tabelarowy zestaw danych.

  3. Uruchom eksperyment lub kliknij prawym przyciskiem myszy tylko moduł Convert to TSV (Konwertuj na TSV), a następnie wybierz pozycję Run selected (Uruchom wybrane).

Wyniki

Po zakończeniu konwersji możesz otworzyć zestaw danych, wywołać go z kodu języka R lub Python, użyć go w notesie Jupyter lub zapisać w pliku lokalnym.

Jeśli chcesz pobrać zestaw danych, kliknij dwukrotnie dane wyjściowe modułu i wskaż, czy chcesz otworzyć, czy zapisać zestaw dat.

  • Jeśli wybierzesz pozycję Otwórz, zestaw danych zostanie załadowany przy użyciu dowolnego narzędzia używanego domyślnie przez komputer do otwierania programu . Pliki TSV. Zazwyczaj jest to Microsoft Excel.

  • Jeśli wybierzesz pozycję Pobierz zestaw danych, domyślnie plik zostanie zapisany z nazwą modułu oraz identyfikatorem GUID reprezentującym identyfikator obszaru roboczego. Można jednak wybrać opcję Zapisz jako podczas pobierania i zmienić nazwę lub lokalizację pliku.

Przykłady

Chociaż nie ma przykładów specyficznych dla tego formatu, można zobaczyć przykłady sposobu konwersji formatu używanego przez eksplorowanie tych przykładowych eksperymentów w Azure AI Gallery:

  • Krzyżowa weryfikacja klasyfikacji binarnej: eksportuje wyniki krzyżowej weryfikacji do formatu wartości rozdzielanych przecinkami (CSV), dzięki czemu wyniki dla wielu modeli można porównać za pomocą narzędzia, takiego jak Excel.

  • Kwantyzacja kompresji obrazów na podstawie kolorów: eksportuje zestawy danych używane dla każdej części analizy do plików CSV, dzięki czemu można łatwo uruchomić podobny model w dowolnym narzędziu, które obsługuje format CSV.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

Wymagania dotyczące formatu TSV

Wartości rozdzielane tabulatorami (TSV) to format tekstu, który jest używany do przechowywania danych w strukturze tabelarowej. Jest bardzo podobny do formatu CSV, ale ogranicznikiem jest tabulator, a nie przecinek.

Format TSV jest przydatną alternatywą dla formatu CSV, jeśli dane zawierają przecinki. Przecinki są bardzo popularne w danych tekstowych i są używane w europejskich formatach liczbowych.

Jednym z problemów z formatem rozdzielanym tabulatorami jest to, że tabulatory są często traktowane jako białe znaki w tekście bez struktury. Jednak standard IANA dla TSV wspiera czystą i dokładną analizę plików TSV przez nie zezwalanie na karty w polach.

Zwróć uwagę na następujące wymagania dotyczące plików TSV w programie Machine Learning Studio (wersja klasyczna):

  • Moduł Convert to TSV obsługuje dane wyjściowe pojedynczego wiersza nagłówka, jeśli zestaw danych zawiera nazwy kolumn.

  • Dostawca TSV obsługuje tylko kodowanie znaków UTF-8.

  • Podczas odczytywania lub zapisywania w plikach TSV wydajność może być niższa niż w przypadku innych formatów (takich jak CSV).

Oczekiwane dane wejściowe

Nazwa Typ Opis
Zestaw danych Tabela danych Wejściowy zestaw danych

Dane wyjściowe

Nazwa Typ Opis
Zestaw danych wyników OgólneTsv Wyjściowy zestaw danych

Zobacz też

Konwersje formatu danych
Lista modułów A–Z