Udostępnij za pośrednictwem


Używanie kompleksowych przykładów modeli sztucznej inteligencji w Microsoft Fabric

Środowisko usługi Synapse Data Science software as a service (SaaS) jest częścią usługi Microsoft Fabric. Może to pomóc specjalistom uczenia maszynowego tworzyć, wdrażać i operacjonalizować modele uczenia maszynowego. Oprogramowanie Synapse Data Science działa na jednej platformie analitycznej, ale współpracuje z innymi kluczowymi rolami w tym samym czasie. W tym artykule opisano możliwości środowiska nauki o danych synapse oraz sposób, w jaki modele uczenia maszynowego mogą rozwiązywać typowe problemy biznesowe.

Instalowanie bibliotek języka Python

Niektóre kompleksowe przykłady sztucznej inteligencji wymagają innych bibliotek na potrzeby tworzenia modeli uczenia maszynowego lub analizy danych ad hoc. Możesz wybrać jedną z tych opcji, aby szybko zainstalować te biblioteki dla sesji platformy Apache Spark.

Instalacja przy użyciu wbudowanych funkcji instalacyjnych

W notesie użyj wbudowanych funkcji instalacji języka Python , na przykład %pip lub %conda , aby zainstalować nowe biblioteki. Ta opcja instaluje biblioteki tylko w bieżącym notesie. Nie instaluje bibliotek w obszarze roboczym. Użyj poniższego fragmentu kodu, aby zainstalować bibliotekę. Zastąp <library name> nazwą swojej biblioteki: imblearn lub wordcloud:

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

Ustawianie bibliotek domyślnych dla obszaru roboczego

Użyj środowiska Fabric aby udostępnić biblioteki do użycia w notesie obszaru roboczego. Możesz utworzyć środowisko, zainstalować w niej bibliotekę, a administrator obszaru roboczego może dołączyć środowisko do obszaru roboczego jako domyślne środowisko. Aby uzyskać więcej informacji na temat ustawiania domyślnych bibliotek obszaru roboczego, odwiedź stronę Administrator ustawia domyślne biblioteki dla zasobu obszaru roboczego .

Ważne

Zarządzanie biblioteką w ustawieniu obszaru roboczego nie jest już obsługiwane. Odwiedź stronę "Migrowanie bibliotek obszarów roboczych i właściwości platformy Spark do środowiska domyślnego" , aby uzyskać więcej informacji na temat migracji istniejących bibliotek obszarów roboczych do środowiska oraz wyboru domyślnego środowiska obszaru roboczego.

Korzystaj z samouczków, aby tworzyć modele uczenia maszynowego

Te samouczki zawierają przykłady od początku do końca dla typowych scenariuszy.

Odpływ klientów

Zbuduj model do przewidywania wskaźnika odpływu klientów bankowych. Wskaźnik odpływu klientów - nazywany również wskaźnikiem rezygnacji - jest wskaźnikiem, w jakim klienci przestają robić interesy z bankiem.

Postępuj zgodnie z instrukcjami w samouczku przewidywanie odejścia klientów.

Rekomendacje

Księgarnia internetowa chce udostępnić dostosowane rekomendacje w celu zwiększenia sprzedaży. Dzięki danym klasyfikacji książek klientów można opracowywać i wdrażać model rekomendacji w celu przewidywania.

Śledź samouczek trenowania modelu rekomendacji dla handlu detalicznego.

Wykrywanie oszustw

W miarę zwiększania się nieautoryzowanych transakcji wykrywanie oszustw kart kredytowych w czasie rzeczywistym może pomóc instytucjom finansowym szybciej rozwiązywać skargi klientów. Model wykrywania oszustw obejmuje wstępne przetwarzanie, trenowanie, przechowywanie modelu i wnioskowanie. Etap trenowania sprawdza wiele modeli i metod, które odpowiadają konkretnym wyzwaniom — na przykład sytuacje nierównowagi, kompromisy między fałszywie dodatnimi i fałszywie ujemnymi itp.

Postępuj zgodnie z instrukcjami w samouczku dotyczącym wykrywania oszustw .

Prognozowanie

W przypadku zarówno historycznych danych sprzedaży nieruchomości w Nowym Jorku, jak i Proroka Facebooka, utwórz model szeregów czasowych z informacjami o trendach i sezonowości, aby prognozować sprzedaż w przyszłych cyklach.

Postępuj zgodnie z instrukcjami w samouczku prognozowania szeregów czasowych .

Klasyfikacja tekstu

Na podstawie metadanych książki zastosuj klasyfikację tekstu za pomocą języka Word2vec i modelu regresji liniowej, aby przewidzieć, w platformie Spark, czy książka British Library jest fikcją, czy nonfiction.

Postępuj zgodnie z instrukcjami w samouczku dotyczącym klasyfikacji tekstu .

Model zwiększenia efektywności

Użyj modelu uplift, aby oszacować przyczynowy wpływ niektórych zabiegów medycznych na zachowanie osoby. Dotykaj czterech podstawowych obszarów w tych modułach:

  • Moduł przetwarzania danych: wyodrębnia funkcje, zabiegi i etykiety
  • Moduł szkoleniowy: przewidywanie różnicy w zachowaniu osoby, gdy jest leczona i gdy nie jest leczona, przy użyciu klasycznego modelu uczenia maszynowego — na przykład LightGBM
  • Moduł przewidywania: wywołuje model uplift w celu uzyskania prognoz dotyczących danych testowych
  • Moduł oceny: ocenia wpływ modelu uplift na dane testowe

Śledź przebieg samouczka dotyczącego wpływu przyczynowego leczenia medycznego.

Konserwacja predykcyjna

Trenowanie wielu modeli na danych historycznych w celu przewidywania awarii mechanicznych — na przykład awarii obejmujących temperaturę procesu lub prędkość rotacji narzędzi. Następnie określ, który model służy jako najlepszy do przewidywania przyszłych awarii.

Postępuj zgodnie z instrukcjami w samouczku dotyczącym konserwacji predykcyjnej .

Prognoza sprzedaży

Przewidywanie przyszłej sprzedaży dla kategorii produktów superstore. Wytrenuj model na danych historycznych, aby osiągnąć zamierzony cel.

Postępuj zgodnie z instrukcjami w samouczku dotyczącym prognozowania sprzedaży .