Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
Ten artykuł zawiera informacje na temat korzystania z zestawu Azure Machine Learning SDK w wersji 1. Zestaw SDK w wersji 1 jest przestarzały od 31 marca 2025 r. Wsparcie dla niego zakończy się 30 czerwca 2026 r. Do tej pory można zainstalować zestaw SDK w wersji 1 i używać go.
Zalecamy przejście do zestawu SDK w wersji 2 przed 30 czerwca 2026 r. Aby uzyskać więcej informacji na temat zestawu SDK w wersji 2, zobacz Co to jest interfejs wiersza polecenia usługi Azure Machine Learning i zestaw Python SDK w wersji 2? oraz dokumentacja zestawu SDK w wersji 2.
Z tego artykułu dowiesz się, jak zaimportować własne dane do projektanta usługi Azure Machine Learning w celu utworzenia niestandardowych rozwiązań. Istnieją dwa sposoby importowania danych do projektanta:
- Zestawy danych usługi Azure Machine Learning: rejestrowanie zestawów danych w usłudze Azure Machine Learning w celu włączenia zaawansowanych funkcji ułatwiających zarządzanie danymi.
- Składnik importu danych: użyj składnika Importuj dane , aby uzyskać bezpośredni dostęp do danych ze źródeł danych online.
Ważne
Jeśli nie widzisz elementów graficznych wymienionych w tym dokumencie, takich jak przyciski w studio lub projektancie, być może nie masz odpowiedniego poziomu uprawnień do obszaru roboczego. Skontaktuj się z administratorem subskrypcji platformy Azure, aby sprawdzić, czy udzielono Ci właściwego poziomu dostępu. Aby uzyskać więcej informacji, zobacz Zarządzanie użytkownikami i rolami.
Korzystanie z zestawów danych usługi Azure Machine Learning
Zalecamy użycie zestawów danych do zaimportowania danych do projektanta. Podczas rejestrowania zestawu danych możesz w pełni korzystać z zaawansowanych funkcji danych, takich jak przechowywanie wersji i śledzenie i monitorowanie danych.
Rejestrowanie zestawu danych
Istniejące zestawy danych można zarejestrować programowo za pomocą zestawu SDK lub wizualnie w usłudze Azure Machine Learning Studio.
Możesz również zarejestrować dane wyjściowe dla dowolnego składnika projektanta jako zestaw danych.
Wybierz składnik, który generuje dane, które chcesz zarejestrować.
W okienku właściwości wybierz pozycję Dane wyjściowe + dzienniki>Dane wyjściowe>Zarejestruj dane.
Jeśli dane wyjściowe składnika mają format tabelaryczny, musisz zarejestrować dane wyjściowe jako zestaw danych plików lub tabelaryczny zestaw danych.
Zestaw danych pliku rejestruje folder wyjściowy składnika jako zestaw danych plików. Folder wyjściowy zawiera plik danych i pliki meta, których projektant używa wewnętrznie. Wybierz tę opcję, jeśli chcesz nadal używać zarejestrowanego zestawu danych w projektancie.
Tabelaryczny zestaw danych rejestruje tylko plik danych wyjściowych składnika jako tabelaryczny zestaw danych. Ten format jest łatwo używany przez inne narzędzia, na przykład w zautomatyzowanym uczeniu maszynowym lub zestawie SDK języka Python. Wybierz tę opcję, jeśli planujesz używać zarejestrowanego zestawu danych poza projektantem.
Korzystanie z zestawu danych
Zarejestrowane zestawy danych można znaleźć na palecie składników w obszarze Dane. Aby użyć zestawu danych, przeciągnij go i upuść na kanwę potoku. Następnie połącz port wyjściowy zestawu danych z innymi składnikami na kanwie.
Jeśli zarejestrujesz zestaw danych plików, typ portu wyjściowego zestawu danych to AnyDirectory. Jeśli zarejestrujesz tabelaryczny zestaw danych, typ portu wyjściowego zestawu danych, jeśli DataFrameDirectory. Należy pamiętać, że jeśli połączysz port wyjściowy zestawu danych z innymi składnikami w projektancie, typ portu zestawów danych i składników musi być wyrównany.
Uwaga
Projektant obsługuje przechowywanie wersji zestawu danych. Określ wersję zestawu danych w panelu właściwości składnika zestawu danych.
Ograniczenia
- Obecnie można wizualizować tylko tabelaryczny zestaw danych w projektancie. Jeśli zarejestrujesz zestaw danych poza projektantem, nie możesz go zwizualizować na płótnie projektanta.
- Obecnie projektant obsługuje tylko dane wyjściowe w wersji zapoznawczej przechowywane w usłudze Azure Blob Storage. Magazyn danych wyjściowych można sprawdzić i zmienić w sekcji Ustawienia danych wyjściowych na karcie Parametry w prawym panelu składnika.
- Jeśli dane są przechowywane w sieci wirtualnej i chcesz wyświetlić podgląd, musisz włączyć tożsamość zarządzaną obszaru roboczego magazynu danych.
- Przejdź do powiązanego magazynu danych i wybierz pozycję Aktualizuj uwierzytelnianie.
- Wybierz przełącznik, aby użyć tożsamości zarządzanej obszaru roboczego.
- Przejdź do powiązanego magazynu danych i wybierz pozycję Aktualizuj uwierzytelnianie.
Importowanie danych przy użyciu składnika Importuj dane
Zalecamy używanie zestawów danych do importowania danych, ale można również użyć składnika Import Data . Składnik Importuj dane pomija rejestrowanie zestawu danych w usłudze Azure Machine Learning i importuje dane bezpośrednio z magazynu danych lub adresu URL HTTP.
Aby uzyskać szczegółowe informacje na temat używania składnika Importuj dane, zobacz stronę Dokumentacja importu danych.
Uwaga
Jeśli zestaw danych zawiera zbyt wiele kolumn, może wystąpić następujący błąd: "Walidacja nie powiodła się z powodu ograniczenia rozmiaru". Aby tego uniknąć, zarejestruj zestaw danych w interfejsie Zestawy danych.
Obsługiwane źródła
W tej sekcji wymieniono źródła danych obsługiwane przez projektanta. Dane są dostarczane do projektanta z magazynu danych lub z tabelarycznego zestawu danych.
Źródła magazynu danych
Aby uzyskać listę obsługiwanych źródeł magazynu danych, zobacz Access data in Azure storage services (Uzyskiwanie dostępu do danych w usługach azure storage).
Tabelaryczne źródła zestawów danych
Projektant obsługuje tabelaryczne zestawy danych utworzone na podstawie następujących źródeł:
- Plik rozdzielany
- Pliki JSON
- Pliki Parquet
- Zapytania SQL
Typy danych
Projektant wewnętrznie rozpoznaje następujące typy danych:
- Ciąg
- Liczba całkowita
- Liczba dziesiętna
- Wartość logiczna
- Data kalendarzowa
Projektant używa wewnętrznego typu danych do przekazywania danych między składnikami. Dane można jawnie przekonwertować na format tabeli danych przy użyciu składnika Konwertowanie na zestaw danych. Każdy składnik, który akceptuje formaty inne niż format wewnętrzny, przekonwertuje dane w trybie dyskretnym, a następnie przekaże je do następnego składnika.
Ograniczenia danych
Moduły w projektancie są ograniczone przez rozmiar docelowego obiektu obliczeniowego. W przypadku większych zestawów danych należy użyć większego zasobu obliczeniowego usługi Azure Machine Learning. Aby uzyskać więcej informacji na temat zasobów obliczeniowych usługi Azure Machine Learning, zobacz Co to są cele obliczeniowe w usłudze Azure Machine Learning?
Uzyskiwanie dostępu do danych w sieci wirtualnej
Jeśli obszar roboczy znajduje się w sieci wirtualnej, należy wykonać dodatkowe kroki konfiguracji, aby wizualizować dane w projektancie. Aby uzyskać więcej informacji na temat używania magazynów danych i zestawów danych w sieci wirtualnej, zobacz Korzystanie z usługi Azure Machine Learning Studio w sieci wirtualnej platformy Azure.