Udostępnij za pośrednictwem


Importowanie danych do projektanta usługi Azure Machine Learning

Ważne

Ten artykuł zawiera informacje na temat korzystania z zestawu Azure Machine Learning SDK w wersji 1. Zestaw SDK w wersji 1 jest przestarzały od 31 marca 2025 r. Wsparcie dla niego zakończy się 30 czerwca 2026 r. Do tej pory można zainstalować zestaw SDK w wersji 1 i używać go.

Zalecamy przejście do zestawu SDK w wersji 2 przed 30 czerwca 2026 r. Aby uzyskać więcej informacji na temat zestawu SDK w wersji 2, zobacz Co to jest interfejs wiersza polecenia usługi Azure Machine Learning i zestaw Python SDK w wersji 2? oraz dokumentacja zestawu SDK w wersji 2.

Z tego artykułu dowiesz się, jak zaimportować własne dane do projektanta usługi Azure Machine Learning w celu utworzenia niestandardowych rozwiązań. Istnieją dwa sposoby importowania danych do projektanta:

  • Zestawy danych usługi Azure Machine Learning: rejestrowanie zestawów danych w usłudze Azure Machine Learning w celu włączenia zaawansowanych funkcji ułatwiających zarządzanie danymi.
  • Składnik importu danych: użyj składnika Importuj dane , aby uzyskać bezpośredni dostęp do danych ze źródeł danych online.

Ważne

Jeśli nie widzisz elementów graficznych wymienionych w tym dokumencie, takich jak przyciski w studio lub projektancie, być może nie masz odpowiedniego poziomu uprawnień do obszaru roboczego. Skontaktuj się z administratorem subskrypcji platformy Azure, aby sprawdzić, czy udzielono Ci właściwego poziomu dostępu. Aby uzyskać więcej informacji, zobacz Zarządzanie użytkownikami i rolami.

Korzystanie z zestawów danych usługi Azure Machine Learning

Zalecamy użycie zestawów danych do zaimportowania danych do projektanta. Podczas rejestrowania zestawu danych możesz w pełni korzystać z zaawansowanych funkcji danych, takich jak przechowywanie wersji i śledzenie i monitorowanie danych.

Rejestrowanie zestawu danych

Istniejące zestawy danych można zarejestrować programowo za pomocą zestawu SDK lub wizualnie w usłudze Azure Machine Learning Studio.

Możesz również zarejestrować dane wyjściowe dla dowolnego składnika projektanta jako zestaw danych.

  1. Wybierz składnik, który generuje dane, które chcesz zarejestrować.

  2. W okienku właściwości wybierz pozycję Dane wyjściowe + dzienniki>Dane wyjściowe>Zarejestruj dane.

    Zrzut ekranu przedstawiający sposób przechodzenia do opcji Zarejestruj zestaw danych.

Jeśli dane wyjściowe składnika mają format tabelaryczny, musisz zarejestrować dane wyjściowe jako zestaw danych plików lub tabelaryczny zestaw danych.

  • Zestaw danych pliku rejestruje folder wyjściowy składnika jako zestaw danych plików. Folder wyjściowy zawiera plik danych i pliki meta, których projektant używa wewnętrznie. Wybierz tę opcję, jeśli chcesz nadal używać zarejestrowanego zestawu danych w projektancie.

  • Tabelaryczny zestaw danych rejestruje tylko plik danych wyjściowych składnika jako tabelaryczny zestaw danych. Ten format jest łatwo używany przez inne narzędzia, na przykład w zautomatyzowanym uczeniu maszynowym lub zestawie SDK języka Python. Wybierz tę opcję, jeśli planujesz używać zarejestrowanego zestawu danych poza projektantem.

Korzystanie z zestawu danych

Zarejestrowane zestawy danych można znaleźć na palecie składników w obszarze Dane. Aby użyć zestawu danych, przeciągnij go i upuść na kanwę potoku. Następnie połącz port wyjściowy zestawu danych z innymi składnikami na kanwie.

Jeśli zarejestrujesz zestaw danych plików, typ portu wyjściowego zestawu danych to AnyDirectory. Jeśli zarejestrujesz tabelaryczny zestaw danych, typ portu wyjściowego zestawu danych, jeśli DataFrameDirectory. Należy pamiętać, że jeśli połączysz port wyjściowy zestawu danych z innymi składnikami w projektancie, typ portu zestawów danych i składników musi być wyrównany.

Zrzut ekranu przedstawiający lokalizację zapisanych zestawów danych na palecie projektanta

Uwaga

Projektant obsługuje przechowywanie wersji zestawu danych. Określ wersję zestawu danych w panelu właściwości składnika zestawu danych.

Ograniczenia

  • Obecnie można wizualizować tylko tabelaryczny zestaw danych w projektancie. Jeśli zarejestrujesz zestaw danych poza projektantem, nie możesz go zwizualizować na płótnie projektanta.
  • Obecnie projektant obsługuje tylko dane wyjściowe w wersji zapoznawczej przechowywane w usłudze Azure Blob Storage. Magazyn danych wyjściowych można sprawdzić i zmienić w sekcji Ustawienia danych wyjściowych na karcie Parametry w prawym panelu składnika.
  • Jeśli dane są przechowywane w sieci wirtualnej i chcesz wyświetlić podgląd, musisz włączyć tożsamość zarządzaną obszaru roboczego magazynu danych.
    1. Przejdź do powiązanego magazynu danych i wybierz pozycję Aktualizuj uwierzytelnianie. Zrzut ekranu przedstawiający sposób aktualizowania poświadczeń.
    2. Wybierz przełącznik, aby użyć tożsamości zarządzanej obszaru roboczego. Zrzut ekranu przedstawiający, jak włączyć tożsamość zarządzaną dla obszaru roboczego.

Importowanie danych przy użyciu składnika Importuj dane

Zalecamy używanie zestawów danych do importowania danych, ale można również użyć składnika Import Data . Składnik Importuj dane pomija rejestrowanie zestawu danych w usłudze Azure Machine Learning i importuje dane bezpośrednio z magazynu danych lub adresu URL HTTP.

Aby uzyskać szczegółowe informacje na temat używania składnika Importuj dane, zobacz stronę Dokumentacja importu danych.

Uwaga

Jeśli zestaw danych zawiera zbyt wiele kolumn, może wystąpić następujący błąd: "Walidacja nie powiodła się z powodu ograniczenia rozmiaru". Aby tego uniknąć, zarejestruj zestaw danych w interfejsie Zestawy danych.

Obsługiwane źródła

W tej sekcji wymieniono źródła danych obsługiwane przez projektanta. Dane są dostarczane do projektanta z magazynu danych lub z tabelarycznego zestawu danych.

Źródła magazynu danych

Aby uzyskać listę obsługiwanych źródeł magazynu danych, zobacz Access data in Azure storage services (Uzyskiwanie dostępu do danych w usługach azure storage).

Tabelaryczne źródła zestawów danych

Projektant obsługuje tabelaryczne zestawy danych utworzone na podstawie następujących źródeł:

  • Plik rozdzielany
  • Pliki JSON
  • Pliki Parquet
  • Zapytania SQL

Typy danych

Projektant wewnętrznie rozpoznaje następujące typy danych:

  • Ciąg
  • Liczba całkowita
  • Liczba dziesiętna
  • Wartość logiczna
  • Data kalendarzowa

Projektant używa wewnętrznego typu danych do przekazywania danych między składnikami. Dane można jawnie przekonwertować na format tabeli danych przy użyciu składnika Konwertowanie na zestaw danych. Każdy składnik, który akceptuje formaty inne niż format wewnętrzny, przekonwertuje dane w trybie dyskretnym, a następnie przekaże je do następnego składnika.

Ograniczenia danych

Moduły w projektancie są ograniczone przez rozmiar docelowego obiektu obliczeniowego. W przypadku większych zestawów danych należy użyć większego zasobu obliczeniowego usługi Azure Machine Learning. Aby uzyskać więcej informacji na temat zasobów obliczeniowych usługi Azure Machine Learning, zobacz Co to są cele obliczeniowe w usłudze Azure Machine Learning?

Uzyskiwanie dostępu do danych w sieci wirtualnej

Jeśli obszar roboczy znajduje się w sieci wirtualnej, należy wykonać dodatkowe kroki konfiguracji, aby wizualizować dane w projektancie. Aby uzyskać więcej informacji na temat używania magazynów danych i zestawów danych w sieci wirtualnej, zobacz Korzystanie z usługi Azure Machine Learning Studio w sieci wirtualnej platformy Azure.

Następny krok