Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
W tym artykule opisano sposób używania modułu Import danych w programie Machine Learning Studio (wersja klasyczna) w celu uzyskania danych z Azure SQL Database lub Azure SQL Data Warehouse.
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Aby zaimportować dane z bazy danych, należy określić zarówno nazwę serwera, jak i nazwę bazy danych oraz SQL, która definiuje tabelę, widok lub zapytanie.
Ogólnie rzecz biorąc, przechowywanie danych w bazach danych platformy Azure jest droższe niż używanie tabel lub obiektów blob na platformie Azure. W zależności od typu subskrypcji mogą również wystąpić ograniczenia dotyczące ilości danych, które można przechowywać w bazie danych. Nie ma jednak żadnych opłat za transakcje związane z usługą Usługi SQL Azure Database, więc ta opcja jest idealna do szybkiego dostępu do mniejszych ilości często używanych informacji, takich jak tabele wyszukiwania danych lub słowniki danych.
Przechowywanie danych w bazie danych platformy Azure jest również preferowane, jeśli musisz mieć możliwość filtrowania danych przed ich odczytaniem lub jeśli chcesz zapisać przewidywania lub metryki z powrotem w bazie danych na potrzeby raportowania.
Jak importować dane z Azure SQL Database lub SQL Data Warehouse
Korzystanie z Kreatora importu danych
Moduł zawiera nowy kreator, który pomaga wybrać opcję magazynu, wybrać jedną z istniejących subskrypcji i kont oraz szybko skonfigurować wszystkie opcje.
Dodaj moduł Import data (Importuj dane) do eksperymentu. Moduł można znaleźć w programie Studio (wersja klasyczna) w kategorii Dane wejściowe i Wyjściowe .
Kliknij pozycję Uruchom Kreatora importu danych i postępuj zgodnie z monitami.
Po zakończeniu konfiguracji, aby rzeczywiście skopiować dane do eksperymentu, kliknij prawym przyciskiem myszy moduł i wybierz pozycję Uruchom wybrane.
Jeśli musisz edytować istniejące połączenie danych, kreator ładuje wszystkie poprzednie szczegóły konfiguracji, aby nie trzeba było ponownie uruchamiać od podstaw
Ręczne ustawianie właściwości w module Importowanie danych
W poniższych krokach opisano sposób ręcznego konfigurowania źródła importu.
Dodaj moduł Import data (Importuj dane) do eksperymentu. Ten moduł można znaleźć w programie Studio (wersja klasyczna) w kategorii Dane wejściowe i Wyjściowe .
W przypadku opcji Źródło danych wybierz pozycję Azure SQL Database.
Ustaw następujące opcje specyficzne dla Azure SQL Database lub Azure SQL Data Warehouse.
Nazwa serwera bazy danych: wpisz nazwę serwera wygenerowaną przez platformę Azure. Zazwyczaj ma postać
<generated_identifier>.database.windows.net.Nazwa bazy danych: wpisz nazwę istniejącej bazy danych na określonym serwerze.
Nazwa konta użytkownika serwera: wpisz nazwę użytkownika konta z uprawnieniami dostępu do bazy danych.
Hasło konta użytkownika serwera: podaj hasło dla określonego konta użytkownika.
Zapytanie bazy danych: wpisz lub wklej SQL opisującą dane, które chcesz odczytać. Zawsze weryfikuj SQL i zweryfikuj wyniki zapytania z wyprzedzeniem przy użyciu narzędzia, takiego jak Visual Studio Eksplorator serwera lub SQL Server Data Tools.
Uwaga
Moduł Import danych obsługuje tylko wprowadzanie nazwy bazy danych, nazwy konta użytkownika i hasła jako poświadczeń.
Jeśli zestaw danych odczytywany do Machine Learning między przebiegami eksperymentu nie powinien się zmieniać, wybierz opcję Użyj wyników w pamięci podręcznej.
Jeśli ta opcja jest zaznaczona, jeśli nie ma żadnych innych zmian parametrów modułu, eksperyment ładuje dane przy pierwszym uruchomieniu modułu, a następnie używa buforowanej wersji zestawu danych.
Jeśli chcesz ponownie załadować zestaw danych do każdej iteracji eksperymentu, usuń zaznaczenie tej opcji. Zestaw danych jest ponownie ładowany ze źródła za każdym razem, gdy zostaną zmienione jakiekolwiek parametry w sekcji Importowanie danych.
Uruchom eksperyment.
Ponieważ dane importowane są ładowane do programu Studio (wersja klasyczna), może być również wykonywana niejawna konwersja typu, w zależności od typów danych używanych w źródłowej bazie danych.
Wyniki
Po zakończeniu importowania kliknij wyjściowy zestaw danych i wybierz pozycję Visualize (Wizualizacja), aby sprawdzić, czy dane zostały zaimportowane pomyślnie.
Opcjonalnie możesz zmienić zestaw danych i jego metadane przy użyciu narzędzi w programie Studio (wersja klasyczna):
Użyj funkcji Edytuj metadane , aby zmienić nazwy kolumn, przekonwertować kolumnę na inny typ danych lub wskazać, które kolumny są etykietami lub cechami.
Użyj opcji Wybierz kolumny w zestawie danych, aby wybrać podzbiór kolumn.
Użyj partycji i przykładu , aby oddzielić zestaw danych według kryteriów, lub pobierz n górnych wierszy.
Przykłady
Aby dowiedzieć się, jak używać danych z baz danych platformy Azure w uczeniu maszynowym, zobacz następujące artykuły i eksperymenty:
Prognozowanie handlu detalicznego — krok 1 z 6 — przetwarzanie wstępne danych: szablon Prognozowanie handlu detalicznego ilustruje typowy scenariusz, w którym do analizy są używane dane przechowywane w usłudze Azure SQLDB.
Pokazano w nim również kilka przydatnych technik, takich jak używanie usługi Azure SQLDB do przekazywania zestawów danych między eksperymentami na różnych kontach, zapisywania i łączenia prognoz oraz sposobu tworzenia bazy danych Azure SQLDB do uczenia maszynowego.
Używanie Machine Learning z SQL Data Warehouse: w tym artykule pokazano, jak utworzyć model regresji w celu przewidywania cen przy użyciu Azure SQL Data Warehouse.
Jak używać usługi Azure ML z Azure SQL Data Warehouse: w tym artykule opisano tworzenie modelu klastrowania w usłudze AdventureWorks przy użyciu funkcji importowania danych i eksportowania danych Azure SQL Data Warehouse.
Uwagi techniczne
Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.
Często zadawane pytania
Czy mogę filtrować dane, gdy są odczytywane ze źródła?
Moduł Import danych nie obsługuje filtrowania w przypadku odczytywania danych. Zalecamy utworzenie widoku lub zdefiniowanie zapytania, które generuje tylko potrzebne wiersze.
Uwaga
Jeśli okazuje się, że załadowano więcej danych, niż potrzebujesz, możesz zastąpić buforowany zestaw danych, odczytując nowy zestaw danych i zapisując go o takiej samej nazwie jak starsze, większe dane.
Dlaczego otrzymuję błąd "Typ dziesiętny nie jest obsługiwany"?
Podczas odczytywania danych z SQL danych może wystąpić komunikat o błędzie z raportem o nieobsługiwanym typie danych.
Jeśli dane z bazy danych programu SQL zawierają typy danych, które nie są obsługiwane w programie Machine Learning, przed odczytaniem danych należy rzutować lub przekonwertować liczby dziesiętne na obsługiwane dane. Import danych nie może automatycznie wykonywać żadnych konwersji, które spowodowałyby utratę dokładności.
Aby uzyskać więcej informacji na temat obsługiwanych typów danych, zobacz Module Data Types (Typy danych modułów).
Co się stanie, jeśli baza danych znajduje się w innym regionie geograficznym. Czy importowane dane nadal mogą uzyskać dostęp do bazy danych? Gdzie są przechowywane dane?
Jeśli baza danych znajduje się w innym regionie niż konto uczenia maszynowego, dostęp do danych może być wolniejszy. Ponadto opłaty są naliczane za ruch przychodzący i wychodzący danych w subskrypcji, jeśli węzeł obliczeniowy znajduje się w innym regionie niż konto magazynu.
Dane odczytane do obszaru roboczego dla eksperymentu są zapisywane na koncie magazynu skojarzonym z eksperymentem.
Dlaczego niektóre znaki nie są wyświetlane poprawnie?
Machine Learning obsługuje kodowanie UTF-8. Jeśli kolumny ciągów w bazie danych używają innego kodowania, znaki mogą nie zostać zaimportowane poprawnie.
Jedną z opcji jest wyeksportowanie danych do pliku CSV w usłudze Azure Storage i użycie opcji CSV z kodowaniem w celu określenia parametrów dla ograniczników niestandardowych, strony kodowej itd.
Parametry modułu
| Nazwa | Zakres | Typ | Domyślny | Opis |
|---|---|---|---|---|
| Źródło danych | Lista | Źródło danych lub ujścia | Azure Blob Storage | Źródłem danych może być protokół HTTP, FTP, anonimowy protokół HTTPS lub FTPS, plik w usłudze Azure BLOB Storage, tabela platformy Azure, Azure SQL Database, lokalna baza danych SQL Server, tabela Programu Hive lub punkt końcowy OData. |
| URI serwera HDFS | dowolny | Ciąg | brak | Punkt końcowy rest systemu plików HDFS |
| Nazwa serwera bazy danych | dowolny | Ciąg | brak | Nazwa konta usługi Azure Storage |
| Nazwa bazy danych | dowolny | Securestring | brak | Klucz usługi Azure Storage |
| Nazwa konta użytkownika serwera | dowolny | Ciąg | brak | Nazwa kontenera platformy Azure |
| Nazwa konta użytkownika serwera | Lista (podzbiór) | Zawartość adresu URL | OData | Typ formatu danych |
| Zapytanie bazy danych | dowolny | Ciąg | brak | Typ formatu danych |
| Używanie buforowanych wyników | PRAWDA/FAŁSZ | Wartość logiczna | FALSE | description (opis) |
Dane wyjściowe
| Nazwa | Typ | Opis |
|---|---|---|
| Zestaw danych wyników | Tabela danych | Zestaw danych z pobranymi danymi |
Wyjątki
| Wyjątek | Opis |
|---|---|
| Błąd 0027 | Wyjątek występuje, gdy dwa obiekty muszą mieć ten sam rozmiar, ale nie są. |
| Błąd 0003 | Wyjątek występuje, gdy co najmniej jeden element wejściowy ma wartość null lub jest pusty. |
| Błąd 0029 | Wyjątek występuje, gdy zostanie przekazany nieprawidłowy identyfikator URI. |
| Błąd 0030 | występuje wyjątek w programie , gdy nie jest możliwe pobranie pliku. |
| Błąd 0002 | Wyjątek występuje, jeśli co najmniej jeden parametr nie może zostać analizowany lub przekonwertowany z określonego typu na typ wymagany przez metodę docelową. |
| Błąd 0009 | Wyjątek występuje, jeśli nazwa konta usługi Azure Storage lub nazwa kontenera jest niepoprawnie określona. |
| Błąd 0048 | Wyjątek występuje, gdy nie jest możliwe otwarcie pliku. |
| Błąd 0015 | Jeśli połączenie z bazą danych nie powiodło się, wystąpi wyjątek. |
| Błąd 0046 | Wyjątek występuje, gdy nie jest możliwe utworzenie katalogu w określonej ścieżce. |
| Błąd 0049 | Wyjątek występuje, gdy nie jest możliwe analizowanie pliku. |
Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kodów błędów.
Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).
Zobacz też
Importowanie danych
Eksportowanie danych
Importowanie z internetowego adresu URL za pośrednictwem protokołu HTTP
Importowanie z zapytania Hive
Importowanie z tabeli platformy Azure
Importowanie z Azure Blob Storage
Importowanie od dostawców źródła danych
Importowanie z lokalnej bazy SQL Server Database