Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
L'esperienza SaaS (Data Science Software as a Service) di Synapse fa parte di Microsoft Fabric. Può aiutare i professionisti di Machine Learning a creare, distribuire e rendere operativi i modelli di Machine Learning. Il software di data science synapse opera in una singola piattaforma di analisi, ma collabora con altri ruoli chiave contemporaneamente. Questo articolo descrive le funzionalità dell'esperienza di data science di Synapse e il modo in cui i modelli di Machine Learning possono risolvere i problemi aziendali comuni.
Installare librerie Python
Alcuni esempi di IA end-to-end richiedono altre librerie per lo sviluppo di modelli di Machine Learning o per l'analisi dei dati ad hoc. È possibile scegliere una di queste opzioni per installare rapidamente tali librerie per la sessione di Apache Spark.
Installare con funzionalità di installazione inline
Nel notebook usare le funzionalità di installazione inline di Python , %pip
ad esempio o %conda
, per installare nuove librerie. Questa opzione installa le librerie solo nel notebook corrente. Non installa le librerie nell'area di lavoro. Usare il frammento di codice seguente per installare una libreria. Sostituire <library name>
con il nome della libreria: imblearn
o wordcloud
:
# Use pip to install libraries
%pip install <library name>
# Use conda to install libraries
%conda install <library name>
Impostare le librerie predefinite per l'area di lavoro
Usare un ambiente Fabric per rendere le librerie disponibili per l'uso in un notebook dell'area di lavoro. È possibile creare un ambiente, installare la libreria e l'amministratore dell'area di lavoro può collegare l'ambiente all'area di lavoro come ambiente predefinito. Per altre informazioni sull'impostazione delle librerie predefinite di un'area di lavoro, vedere Le librerie predefinite impostate dall'amministratore per la risorsa dell'area di lavoro .
Importante
La gestione delle librerie nell'impostazione dell'area di lavoro non è più supportata. Visitare "Eseguire la migrazione delle librerie di aree di lavoro e delle proprietà di Spark a un ambiente predefinito" per ulteriori informazioni sia sulla migrazione delle librerie di aree di lavoro esistenti a un ambiente sia sulla selezione di un ambiente predefinito per l'area di lavoro.
Seguire le esercitazioni per creare modelli di Machine Learning
Queste esercitazioni forniscono esempi end-to-end per scenari comuni.
Abbandono dei clienti
Creare un modello per stimare il tasso di varianza per i clienti bancari. Il tasso di varianza - detto anche tasso di attrito - è il tasso a cui i clienti smettono di fare affari con la banca.
Segui l'esercitazione predire la defezione dei clienti.
Consigli
Un bookstore online vuole fornire raccomandazioni personalizzate per aumentare le vendite. Con i dati sulle valutazioni dei libri da parte dei clienti, è possibile sviluppare e distribuire un modello di raccomandazione per eseguire previsioni.
Segui l'esercitazione sul addestramento di un modello di raccomandazione per il commercio al dettaglio.
Rilevamento delle frodi
Con l'aumentare delle transazioni non autorizzate, il rilevamento delle frodi con carta di credito in tempo reale può aiutare gli istituti finanziari a risolvere i reclami dei clienti più rapidamente. Un modello di rilevamento delle frodi include la pre-elaborazione, il training, l'archiviazione dei modelli e l'inferenza. La fase di training esamina più modelli e metodi che affrontano sfide specifiche, ad esempio situazioni di squilibrio, compromessi tra falsi positivi e falsi negativi e così via.
Seguite il tutorial sul rilevamento delle frodi.
Previsioni
Con i dati storici delle vendite delle proprietà di New York City e Facebook Prophet, creare un modello time series con informazioni sulla tendenza e sulla stagionalità, per prevedere le vendite nei cicli futuri.
Segui l'esercitazione sulla previsione delle serie temporali.
Classificazione testo
In base ai metadati dei libri, applicare la classificazione del testo con Word2vec e un modello di regressione lineare per prevedere, in Spark, se un libro della British Library è di narrativa o non narrativa.
Seguire la procedura descritta nell'esercitazione sulla classificazione del testo .
Modello di uplift
Usare un modello di aumento per stimare l'impatto causale di determinati trattamenti medici sul comportamento di un individuo. Toccare quattro aree principali in questi moduli:
- Modulo di elaborazione dati: estrae caratteristiche, trattamenti ed etichette
- Modulo di training: stimare la differenza nel comportamento di un individuo quando trattato e quando non viene trattato, con un modello di Machine Learning classico, ad esempio LightGBM
- Modulo di predizione: chiama il modello di uplift per le previsioni sui dati di test
- Modulo di valutazione: valuta l'effetto del modello di sollevamento sui dati di test
Segui il tutorial sull'impatto causale dei trattamenti medici.
Manutenzione predittiva
Eseguire il training di più modelli sui dati cronologici per prevedere i guasti meccanici, ad esempio guasti che coinvolgono la temperatura del processo o la velocità di rotazione degli strumenti. Determinare quindi quale modello funge da soluzione ottimale per stimare gli errori futuri.
Segui l'esercitazione sulla manutenzione predittiva.
Previsioni di vendita
Prevedere le vendite future per le categorie di prodotti superstore. Eseguire il training di un modello sui dati storici a tale scopo.
Segui l'esercitazione sulle previsioni di vendita.