Carico di lavoro applicazioni analitiche e di data science in Visual Studio

Le funzionalità delle applicazioni di data science e analitica in Visual Studio riuniscono diversi linguaggi e le rispettive distribuzioni di runtime.

Python è un linguaggio di scripting principale usato per l'analisi scientifica dei dati. Python è facile da apprendere e offre supporto da un ricco ecosistema di pacchetti. Questi pacchetti riguardano un'ampia gamma di scenari, ad esempio l'acquisizione dei dati, la pulizia, il training del modello, la distribuzione e il tracciato. F# è anche un potente linguaggio .NET funzionale applicabile per un'ampia gamma di attività di elaborazione dati.

Screenshot che mostra Visual Studio con progetti di codice R, Python e F#.

Installazione del carico di lavoro

Il carico di lavoro delle applicazioni di scienza dei dati e analitiche è disponibile nel programma di installazione di Visual Studio in Carichi di lavoro>Altri set di strumenti:

Screenshot che mostra come selezionare il carico di lavoro applicazioni di scienza dei dati e analisi nel programma di installazione di Visual Studio.

Per impostazione predefinita, il carico di lavoro installa le opzioni seguenti, che è possibile modificare nella sezione di riepilogo per il carico di lavoro nel programma di installazione di Visual Studio:

  • Supporto per il linguaggio F# desktop
  • Pitone:
    • Supporto linguaggio Python
    • Supporto Web Python
    • Strumenti di sviluppo nativo Python

Integrazione di SQL Server

SQL Server supporta l'uso di Python per eseguire analisi avanzate direttamente all'interno di SQL Server. Il supporto di Python è disponibile in SQL Server 2017 CTP 2.0 e versioni successive.

È possibile sfruttare i vantaggi seguenti eseguendo il codice in cui si trovano già i dati:

  • Eliminazione dello spostamento dei dati: invece di spostare dati dal database all'applicazione o al modello, è possibile compilare applicazioni nel database. Questa funzionalità elimina le barriere di sicurezza, conformità, governance, integrità e una serie di problemi simili correlati allo spostamento di grandi quantità di dati. È anche possibile utilizzare set di dati che non rientrano nella memoria di un computer client.

  • Distribuzione semplice: dopo aver pronto un modello, distribuirlo nell'ambiente di produzione è una semplice questione di incorporamento del modello in uno script T-SQL. Qualsiasi applicazione client SQL scritta in qualsiasi linguaggio può quindi sfruttare i modelli e l'intelligenza tramite una chiamata di stored procedure. Non sono necessarie integrazioni specifiche del linguaggio.

  • Prestazioni e scalabilità di livello aziendale: è possibile usare le funzionalità avanzate di SQL Server, ad esempio tabelle in memoria e indici dell'archivio colonne, con le API scalabili ad alte prestazioni nei pacchetti RevoScale. L'eliminazione dello spostamento dei dati implica anche l'evitare vincoli di memoria client man mano che i dati aumentano o si desidera aumentare le prestazioni dell'applicazione.

  • Estendibilità avanzata: è possibile installare ed eseguire uno dei pacchetti open source più recenti in SQL Server per creare applicazioni di Deep Learning e intelligenza artificiale su enormi quantità di dati in SQL Server. L'installazione di un pacchetto in SQL Server è semplice quanto l'installazione di un pacchetto nel computer locale.

  • Disponibilità elevata senza costi aggiuntivi: le integrazioni del linguaggio sono disponibili in tutte le edizioni di SQL Server 2017 e versioni successive, inclusa l'edizione Express.

Installazione dell'integrazione di SQL Server

Per sfruttare al meglio l'integrazione di SQL Server, usare il programma di installazione di Visual Studio per installare il carico di lavoro Carichi> di lavoroAltri set di strumenti>Archiviazione dati ed elaborazione. Selezionare l'opzione SQL Server Data Tools per abilitare SQL IntelliSense, evidenziazione della sintassi e distribuzione:

Screenshot che mostra come selezionare il carico di lavoro Archiviazione ed elaborazione dati nel programma di installazione di Visual Studio.

Per altre informazioni, vedere Python in SQL Server 2017: Enhanced in-database Machine Learning (blog) (Python in SQL Server 2017: Apprendimento automatico avanzato nel database).

Altri servizi e SDK

Oltre a ciò che è incluso direttamente nei carichi di lavoro delle applicazioni di data science e analisi, i Notebooks in Visual Studio Code e l'SDK di Azure per Python sono anch'essi utili per la data science.

Azure SDK per Python semplifica l'uso e la gestione dei servizi di Microsoft Azure dalle applicazioni in esecuzione in Windows, Mac e Linux. Per altre informazioni, vedere Azure per sviluppatori Python.

È possibile combinare l'estensione Jupyter con notebook in Visual Studio Code per supportare lo sviluppo di Jupyter e migliorare il progetto con estensioni del linguaggio aggiuntive. Il servizio include notebook di esempio in Python, R e F# per iniziare. Per altre informazioni, vedere Esperienze di notebook di Microsoft e GitHub.

Screenshot che mostra l'uso di Notebook con Jupyter in un'introduzione all'esempio R.