Udostępnij za pośrednictwem


Wykonywanie analizy przy użyciu usługi Machine Learning Studio (klasycznej) przy użyciu bazy danych SQL Server

DOTYCZY:Dotyczy. Usługa Machine Learning Studio (klasyczna) nie ma zastosowania.Azure Machine Learning

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Często przedsiębiorstwa, które pracują z danymi lokalnymi, chcą korzystać ze skalowania i elastyczności chmury na potrzeby obciążeń uczenia maszynowego. Nie chcą jednak zakłócać bieżących procesów biznesowych i przepływów pracy przez przeniesienie danych lokalnych do chmury. Usługa Machine Learning Studio (klasyczna) obsługuje teraz odczytywanie danych z bazy danych SQL Server, a następnie trenowanie i ocenianie modelu przy użyciu tych danych. Nie trzeba już ręcznie kopiować i synchronizować danych między chmurą a serwerem lokalnym. Zamiast tego moduł Importuj dane w usłudze Machine Learning Studio (wersja klasyczna) może teraz odczytywać bezpośrednio z bazy danych SQL Server na potrzeby zadań trenowania i oceniania.

Ten artykuł zawiera omówienie sposobu ruchu przychodzącego SQL Server danych w usłudze Machine Learning Studio (wersja klasyczna). Przyjęto założenie, że znasz pojęcia dotyczące programu Studio (klasycznego), takie jak obszary robocze, moduły, zestawy danych, eksperymenty itp.

Uwaga

Ta funkcja nie jest dostępna dla bezpłatnych obszarów roboczych. Aby uzyskać więcej informacji na temat cen i warstw usługi Machine Learning, zobacz Cennik usługi Machine Learning Studio (wersja klasyczna).

Instalowanie własnego Integration Runtime usługi Data Factory

Aby uzyskać dostęp do bazy danych SQL Server w usłudze Machine Learning Studio (wersja klasyczna), musisz pobrać i zainstalować własne Integration Runtime usługi Data Factory, wcześniej znane jako brama Zarządzanie danymi. Podczas konfigurowania połączenia w usłudze Machine Learning Studio (wersja klasyczna) możesz pobrać i zainstalować Integration Runtime (IR) przy użyciu okna dialogowego Pobieranie i rejestrowanie bramy danych opisanego poniżej.

Środowisko IR można również zainstalować przed upływem czasu, pobierając i uruchamiając pakiet instalacyjny MSI z Centrum pobierania Microsoft. Tożsamość usługi zarządzanej może również służyć do uaktualniania istniejącego środowiska IR do najnowszej wersji z zachowanymi wszystkimi ustawieniami.

Usługa Data Factory Self-Hosted Integration Runtime ma następujące wymagania wstępne:

  • Integracja usługi Data Factory Self-Hosted wymaga 64-bitowego systemu operacyjnego z .NET Framework 4.6.1 lub nowszym.
  • Obsługiwane wersje systemu operacyjnego Windows to Windows 10 , Windows Server 2012, Windows Server 2012 R2, Windows Server 2016.
  • Zalecaną konfiguracją dla maszyny IR jest co najmniej 2 GHz, 4 Rdzeni procesora CPU, 8 GB pamięci RAM i 80 GB dysku.
  • Jeśli maszyna hosta hibernacji, środowisko IR nie będzie odpowiadać na żądania danych. W związku z tym należy skonfigurować odpowiedni plan zasilania na komputerze przed zainstalowaniem środowiska IR. Jeśli maszyna jest skonfigurowana do hibernacji, instalacja środowiska IR wyświetla komunikat.
  • Ponieważ działanie kopiowania występuje z określoną częstotliwością, użycie zasobów (procesor CPU, pamięć) na maszynie jest również zgodne z tym samym wzorcem ze szczytowymi i bezczynnymi godzinami. Wykorzystanie zasobów zależy również od ilości przenoszonych danych. Gdy w toku jest wiele zadań kopiowania, zauważysz, że użycie zasobów wzniesie się w godzinach szczytu. Chociaż minimalna konfiguracja wymieniona powyżej jest technicznie wystarczająca, możesz mieć konfigurację z większą ilością zasobów niż minimalna konfiguracja w zależności od określonego obciążenia do przenoszenia danych.

Podczas konfigurowania i używania własnego Integration Runtime usługi Data Factory należy wziąć pod uwagę następujące kwestie:

  • Na jednym komputerze można zainstalować tylko jedno wystąpienie środowiska IR.

  • Można użyć jednego środowiska IR dla wielu lokalnych źródeł danych.

  • Wiele adresów IRs można połączyć na różnych komputerach z tym samym lokalnym źródłem danych.

  • Adresy IP można skonfigurować tylko dla jednego obszaru roboczego naraz. Obecnie nie można udostępniać adresów IP między obszarami roboczymi.

  • Można skonfigurować wiele adresów IP dla jednego obszaru roboczego. Na przykład możesz chcieć użyć środowiska IR połączonego ze źródłami danych testowych podczas programowania i środowiska IR produkcyjnego, gdy wszystko będzie gotowe do operacji.

  • Środowisko IR nie musi znajdować się na tej samej maszynie co źródło danych. Jednak zbliżenie do źródła danych skraca czas nawiązywania połączenia z źródłem danych przez bramę. Zalecamy zainstalowanie środowiska IR na maszynie, która różni się od tego, który hostuje lokalne źródło danych, aby brama i źródło danych nie konkurowały o zasoby.

  • Jeśli masz już zainstalowane środowisko IR na komputerze obsługującym usługę Power BI lub Azure Data Factory scenariusze, zainstaluj oddzielne środowisko IR dla usługi Machine Learning Studio (wersja klasyczna) na innym komputerze.

    Uwaga

    Nie można uruchomić własnego Integration Runtime usługi Data Factory i Power BI Gateway na tym samym komputerze.

  • Musisz użyć własnego Integration Runtime usługi Data Factory dla usługi Machine Learning Studio (klasycznej), nawet jeśli używasz usługi Azure ExpressRoute dla innych danych. Źródło danych należy traktować jako lokalne źródło danych (które znajduje się za zaporą), nawet w przypadku korzystania z usługi ExpressRoute. Użyj własnego Integration Runtime usługi Data Factory, aby nawiązać łączność między usługą Machine Learning i źródłem danych.

Szczegółowe informacje na temat wymagań wstępnych instalacji, kroków instalacji i wskazówek dotyczących rozwiązywania problemów można znaleźć w artykule Integration Runtime w usłudze Data Factory.

Dane przychodzące z bazy danych SQL Server do usługi Machine Learning

W tym przewodniku skonfigurujesz Azure Data Factory Integration Runtime w obszarze roboczym usługi Azure Machine Learning, skonfigurujesz go, a następnie odczytasz dane z bazy danych SQL Server.

Porada

Przed rozpoczęciem wyłącz blokowanie wyskakujących okienek przeglądarki dla polecenia studio.azureml.net. Jeśli używasz przeglądarki Google Chrome, pobierz i zainstaluj jedną z kilku wtyczek dostępnych w sklepie Google Chrome WebStore kliknij pozycję Po rozszerzeniu aplikacji.

Uwaga

Azure Data Factory Self-hosted Integration Runtime była wcześniej znana jako Zarządzanie danymi Gateway. Samouczek krok po kroku będzie nadal odwoływać się do niej jako brama.

Krok 1. Tworzenie bramy

Pierwszym krokiem jest utworzenie i skonfigurowanie bramy w celu uzyskania dostępu do bazy danych SQL.

  1. Zaloguj się do usługi Machine Learning Studio (klasycznej) i wybierz obszar roboczy, w którym chcesz pracować.

  2. Kliknij blok USTAWIENIA po lewej stronie, a następnie kliknij kartę BRAMY DANYCH u góry.

  3. Kliknij pozycję NOWA BRAMA DANYCH w dolnej części ekranu.

    Nowa brama danych

  4. W oknie dialogowym Nowa brama danych wprowadź nazwę bramy i opcjonalnie dodaj opis. Kliknij strzałkę w prawym dolnym rogu, aby przejść do następnego kroku konfiguracji.

    Wprowadź nazwę i opis bramy

  5. W oknie dialogowym Pobieranie i rejestrowanie bramy danych skopiuj klucz rejestracji bramy do schowka.

    Pobieranie i rejestrowanie bramy danych

  6. Jeśli jeszcze nie pobrano i zainstalowano bramę Microsoft Zarządzanie danymi Gateway, kliknij pozycję Pobierz bramę zarządzania danymi. Spowoduje to przejście do Centrum pobierania Microsoft, w którym można wybrać potrzebną wersję bramy, pobrać ją i zainstalować. Szczegółowe informacje na temat wymagań wstępnych instalacji, kroków instalacji i wskazówek dotyczących rozwiązywania problemów można znaleźć w początkowych sekcjach artykułu Przenoszenie danych między źródłami lokalnymi i chmurą przy użyciu usługi Zarządzanie danymi Gateway.

  7. Po zainstalowaniu bramy zostanie otwarty Zarządzanie danymi Brama Configuration Manager, a zostanie wyświetlone okno dialogowe Rejestrowanie bramy. Wklej klucz rejestracji bramy skopiowany do schowka i kliknij przycisk Zarejestruj.

  8. Jeśli masz już zainstalowaną bramę, uruchom Configuration Manager bramy Zarządzanie danymi. Kliknij przycisk Zmień klucz, wklej klucz rejestracji bramy skopiowany do schowka w poprzednim kroku, a następnie kliknij przycisk OK.

  9. Po zakończeniu instalacji zostanie wyświetlone okno dialogowe Rejestrowanie bramy usługi Microsoft Zarządzanie danymi Gateway Configuration Manager. Wklej klucz rejestracji bramy skopiowany do schowka w poprzednim kroku, a następnie kliknij przycisk Zarejestruj.

    Rejestrowanie bramy

  10. Konfiguracja bramy jest ukończona po ustawieniu następujących wartości na karcie Narzędzia główne w usłudze Microsoft Zarządzanie danymi Gateway Configuration Manager:

    • Nazwa bramy i nazwa wystąpienia są ustawione na nazwę bramy.

    • Rejestracja jest ustawiona na Zarejestrowano.

    • Stan jest ustawiony na Uruchomiono.

    • Na pasku stanu w dolnej części jest wyświetlana wartość Połączono z usługą w chmurze bramy Zarządzanie danymi wraz z zielonym znacznikiem wyboru.

      menedżer bramy Zarządzanie danymi

      Usługa Machine Learning Studio (klasyczna) jest również aktualizowana po pomyślnym zakończeniu rejestracji.

    Rejestracja bramy zakończyła się pomyślnie

  11. W oknie dialogowym Pobieranie i rejestrowanie bramy danych kliknij znacznik wyboru, aby ukończyć instalację. Na stronie Ustawienia wyświetlany jest stan bramy jako "Online". W okienku po prawej stronie znajdziesz stan i inne przydatne informacje.

    Ustawienia bramy

  12. W usłudze Microsoft Zarządzanie danymi Gateway Configuration Manager przełącz się na kartę Certyfikat. Certyfikat określony na tej karcie służy do szyfrowania/odszyfrowywania poświadczeń dla lokalnego magazynu danych określonego w portalu. Ten certyfikat jest certyfikatem domyślnym. Firma Microsoft zaleca zmianę tego certyfikatu na własny certyfikat, który jest kopią zapasową w systemie zarządzania certyfikatami. Kliknij przycisk Zmień , aby zamiast tego użyć własnego certyfikatu.

    Zmienianie certyfikatu bramy

  13. (opcjonalnie) Jeśli chcesz włączyć pełne rejestrowanie w celu rozwiązywania problemów z bramą, w usłudze Microsoft Zarządzanie danymi Gateway Configuration Manager przejdź do karty Diagnostyka i zaznacz opcję Włącz pełne rejestrowanie na potrzeby rozwiązywania problemów. Informacje rejestrowania można znaleźć w Podgląd zdarzeń systemu Windows w obszarze Dzienniki aplikacji i usług ->Zarządzanie danymi Brama. Możesz również użyć karty Diagnostyka , aby przetestować połączenie z lokalnym źródłem danych przy użyciu bramy.

    Włącz pełne rejestrowanie

Spowoduje to ukończenie procesu konfiguracji bramy w usłudze Machine Learning Studio (wersja klasyczna). Teraz możesz przystąpić do korzystania z danych lokalnych.

Możesz utworzyć i skonfigurować wiele bram w programie Studio (klasycznym) dla każdego obszaru roboczego. Na przykład możesz mieć bramę, którą chcesz połączyć ze źródłami danych testowych podczas programowania, oraz inną bramę dla produkcyjnych źródeł danych. Usługa Machine Learning Studio (wersja klasyczna) zapewnia elastyczność konfigurowania wielu bram w zależności od środowiska firmowego. Obecnie nie można udostępnić bramy między obszarami roboczymi i na jednym komputerze można zainstalować tylko jedną bramę. Aby uzyskać więcej informacji, zobacz Przenoszenie danych między źródłami lokalnymi i chmurą przy użyciu usługi Zarządzanie danymi Gateway.

Krok 2. Odczytywanie danych z lokalnego źródła danych przy użyciu bramy

Po skonfigurowaniu bramy możesz dodać moduł Importuj dane do eksperymentu, który wprowadza dane z bazy danych SQL Server.

  1. W usłudze Machine Learning Studio (wersja klasyczna) wybierz kartę EKSPERYMENTY , kliknij pozycję +NOWY w lewym dolnym rogu i wybierz pozycję Pusty eksperyment (lub wybierz jeden z kilku dostępnych przykładowych eksperymentów).

  2. Znajdź i przeciągnij moduł Import Data (Importuj dane ) do kanwy eksperymentu.

  3. Kliknij przycisk Zapisz, jak poniżej kanwy. Wprowadź ciąg "Machine Learning Studio (wersja klasyczna) Lokalny SQL Server Tutorial" jako nazwę eksperymentu, wybierz obszar roboczy, a następnie kliknij znacznik wyboru OK.

    Zapisywanie eksperymentu przy użyciu nowej nazwy

  4. Kliknij moduł Importuj dane, aby go zaznaczyć, a następnie w okienku Właściwości po prawej stronie kanwy wybierz pozycję "Lokalne SQL Database" na liście rozwijanej Źródło danych.

  5. Wybierz zainstalowaną i zarejestrowaną bramę danych . Możesz skonfigurować inną bramę, wybierając pozycję "(dodaj nową bramę danych...)".

    Wybieranie bramy danych dla modułu Import Data (Importowanie danych)

  6. Wprowadź nazwę serwera usługi SQL Database i nazwę bazy danych wraz z zapytaniem usługi SQL Database , które chcesz wykonać.

  7. Kliknij pozycję Wprowadź wartości w obszarze Nazwa użytkownika i hasło , a następnie wprowadź poświadczenia bazy danych. W zależności od konfiguracji SQL Server można użyć uwierzytelniania zintegrowanego systemu Windows lub uwierzytelniania SQL Server.

    Wprowadzanie poświadczeń bazy danych

    Komunikat "wymagane wartości" zmienia się na "wartości ustawione" zielonym znacznikiem wyboru. Wystarczy wprowadzić poświadczenia tylko raz, chyba że informacje o bazie danych lub hasło się zmienią. Usługa Machine Learning Studio (klasyczna) używa certyfikatu podanego podczas instalowania bramy do szyfrowania poświadczeń w chmurze. Platforma Azure nigdy nie przechowuje poświadczeń lokalnych bez szyfrowania.

    Importowanie właściwości modułu danych

  8. Kliknij pozycję URUCHOM , aby uruchomić eksperyment.

Po zakończeniu eksperymentu możesz zwizualizować dane zaimportowane z bazy danych, klikając port wyjściowy modułu Import Data (Importuj dane) i wybierając pozycję Visualize (Wizualizacja).

Po zakończeniu opracowywania eksperymentu można wdrożyć i zoperalizować model. Przy użyciu usługi Batch Execution Service dane z bazy danych SQL Server skonfigurowanej w module Importowanie danych będą odczytywane i używane do oceniania. Chociaż możesz użyć usługi Request Response Service do oceniania danych lokalnych, firma Microsoft zaleca zamiast tego korzystanie z dodatku programu Excel . Obecnie zapisywanie w bazie danych SQL Server za pomocą funkcji Eksportuj dane nie jest obsługiwane w eksperymentach lub opublikowanych usługach internetowych.