Obciążenie aplikacji do analizy i nauki o danych w programie Visual Studio

Obciążenie Aplikacje do analizy i nauki o danych w programie Visual Studio łączy kilka języków i ich odpowiednich dystrybucji środowiska uruchomieniowego:

Python to podstawowy język skryptowy używany do nauki o danych. Język Python jest łatwy do nauki i obsługuje bogaty ekosystem pakietów. Te pakiety obejmują szeroką gamę scenariuszy, takich jak pozyskiwanie danych, czyszczenie, trenowanie modelu, wdrażanie i kreślenie. Język F# to również zaawansowany, funkcjonalny język .NET, który ma zastosowanie do szerokiej gamy zadań przetwarzania danych.

Zrzut ekranu przedstawiający program Visual Studio z projektami kodu W języku R, Python i F#.

Instalacja obciążenia

Obciążenie Aplikacje do analizy i nauki o danych jest dostępne w Instalator programu Visual Studio w obszarze Obciążenia Inne zestawy> narzędzi:

Zrzut ekranu przedstawiający sposób wybierania obciążenia aplikacje do nauki o danych i analizy w Instalator programu Visual Studio 2022.

Zrzut ekranu przedstawiający sposób wybierania obciążenia aplikacje do nauki o danych i analizy w Instalator programu Visual Studio 2019 r.

Domyślnie obciążenie instaluje następujące opcje, które można zmodyfikować w sekcji podsumowania obciążenia w Instalator programu Visual Studio:

  • Obsługa języka klasycznego F#
  • Python:
    • Obsługa języka Python
    • Obsługa sieci Web w języku Python
    • Natywne narzędzia programistyczne języka Python

Integracja programu SQL Server

Program SQL Server obsługuje używanie języka Python do wykonywania zaawansowanych analiz bezpośrednio w programie SQL Server. Obsługa języka Python jest dostępna w programie SQL Server 2017 CTP 2.0 lub nowszym.

Możesz korzystać z następujących korzyści, uruchamiając kod, w którym już istnieją dane:

  • Eliminacja przenoszenia danych: Zamiast przenosić dane z bazy danych do aplikacji lub modelu, możesz tworzyć aplikacje w bazie danych. Ta funkcja eliminuje bariery bezpieczeństwa, zgodności, ładu, integralności i wielu podobnych problemów związanych z przenoszeniem ogromnych ilości danych. Możesz również korzystać z zestawów danych, które nie mieszczą się w pamięci maszyny klienckiej.

  • Łatwe wdrażanie: po dokonaniu gotowego modelu wdrożenie go w środowisku produkcyjnym jest prostą kwestią osadzania modelu w skrycie języka T-SQL. Każda aplikacja kliencka SQL napisana w dowolnym języku może następnie korzystać z modeli i analizy za pomocą wywołania procedury składowanej. Nie są konieczne żadne konkretne integracje językowe.

  • Wydajność i skala klasy korporacyjnej: możesz użyć zaawansowanych funkcji programu SQL Server, takich jak tabele w pamięci i indeksy magazynu kolumn z skalowalnymi interfejsami API o wysokiej wydajności w pakietach RevoScale. Eliminacja przenoszenia danych oznacza również, że należy unikać ograniczeń pamięci klienta w miarę zwiększania się danych lub zwiększania wydajności aplikacji.

  • Zaawansowana rozszerzalność: możesz zainstalować i uruchomić dowolne z najnowszych pakietów typu open source w programie SQL Server, aby tworzyć aplikacje uczenia głębokiego i sztucznej inteligencji na ogromnych ilościach danych w programie SQL Server. Instalowanie pakietu w programie SQL Server jest tak proste, jak instalowanie pakietu na komputerze lokalnym.

  • Szeroka dostępność bez dodatkowych kosztów: integracje językowe są dostępne we wszystkich wersjach programu SQL Server 2017 i nowszych, w tym w wersji Express.

Instalacja integracji z programem SQL Server

Aby w pełni wykorzystać integrację z programem SQL Server, użyj Instalator programu Visual Studio do zainstalowania obciążenia Inne zestawy>>narzędzi Magazynu danych i przetwarzania. Wybierz opcję SQL Server Data Tools, aby włączyć funkcję SQL IntelliSense, wyróżnianie składni i wdrażanie:

Zrzut ekranu przedstawiający sposób wybierania obciążenia Magazynu danych i przetwarzania w Instalator programu Visual Studio 2022.

Zrzut ekranu przedstawiający sposób wybierania obciążenia Magazyn danych i przetwarzanie w Instalator programu Visual Studio 2019.

Aby uzyskać więcej informacji, zobacz Python in SQL Server 2017: Enhanced in-database machine learning (blog).

Inne usługi i zestawy SDK

Oprócz tego, co znajduje się bezpośrednio w obciążeniu Aplikacje do nauki o danych i analizy, notesy w programie Visual Studio Code i zestaw Azure SDK dla języka Python są również przydatne w nauce o danych.

Zestaw Azure SDK dla języka Python ułatwia korzystanie z usług platformy Microsoft Azure i zarządzanie nimi z poziomu aplikacji działających w systemach Windows, Mac i Linux. Aby uzyskać więcej informacji, zobacz Azure for Python Developers (Platforma Azure dla deweloperów języka Python).

Rozszerzenie Jupyter można połączyć z notesami w programie Visual Studio Code, aby obsługiwać programowanie w programie Jupyter i ulepszać projekt za pomocą dodatkowych rozszerzeń języka. Usługa zawiera przykładowe notesy w językach Python, R i F#, aby rozpocząć pracę. Aby uzyskać więcej informacji, zobacz Środowiska notesów firmy Microsoft i GitHub.

Zrzut ekranu przedstawiający korzystanie z notesów z programem Jupyter w ramach wprowadzenia do przykładu języka R.