Szybki start: tworzenie nowej bezserwerowej puli platformy Apache Spark przy użyciu witryny Azure Portal

Usługa Azure Synapse Analytics oferuje różne aparaty analityczne, które ułatwiają pozyskiwanie, przekształcanie, modelowanie, analizowanie i dystrybuowanie danych. Pula platformy Apache Spark zapewnia możliwości obliczeniowe danych big data typu open source. Po utworzeniu puli platformy Apache Spark w obszarze roboczym usługi Synapse można ładować, modelować, przetwarzać i dystrybuować dane w celu uzyskania szybszych analiz analitycznych.

Z tego przewodnika Szybki start dowiesz się, jak za pomocą witryny Azure Portal utworzyć pulę platformy Apache Spark w obszarze roboczym usługi Synapse.

Ważne

Rozliczenia wystąpień platformy Spark są naliczane proporcjonalnie na minutę, niezależnie od tego, czy są używane. Pamiętaj, aby zamknąć wystąpienie platformy Spark po zakończeniu korzystania z niego lub ustawić krótki limit czasu. Aby uzyskać więcej informacji, zobacz sekcję Czyszczenie zasobów w tym artykule.

Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.

Wymagania wstępne

Zaloguj się do witryny Azure Portal.

Zaloguj się do witryny Azure Portal.

  1. Przejdź do obszaru roboczego usługi Synapse, w którym zostanie utworzona pula platformy Apache Spark, wpisując nazwę usługi (lub nazwę zasobu bezpośrednio) na pasku wyszukiwania. Screenshot of the Azure portal search bar with Synapse workspaces typed in.

  2. Z listy obszarów roboczych wpisz nazwę (lub część nazwy) obszaru roboczego do otwarcia. W tym przykładzie używamy obszaru roboczego o nazwie contosoanalytics. Screenshot from the Azure portal of the list of Synapse workspaces filtered to show those containing the name Contoso.

Tworzenie nowej puli platformy Apache Spark

Ważne

Środowisko Uruchomieniowe usługi Azure Synapse dla platformy Apache Spark 2.4 zostało wycofane i oficjalnie nie jest obsługiwane od września 2023 r. Biorąc pod uwagę, że platforma Spark 3.1 i platforma Spark 3.2 są również ogłaszane jako koniec wsparcia technicznego, zalecamy przeprowadzenie migracji klientów do platformy Spark 3.3.

  1. W obszarze roboczym usługi Synapse, w którym chcesz utworzyć pulę platformy Apache Spark, wybierz pozycję Nowa pula platformy Apache Spark. Screenshot from the Azure portal of a Synapse workspace with a red box around the command to create a new Apache Spark pool.

  2. Wprowadź następujące szczegóły na karcie Podstawy :

    Ustawienie Sugerowana wartość Opis
    Nazwa puli platformy Apache Spark Prawidłowa nazwa puli, na przykład contosospark Jest to nazwa, którą będzie miała pula platformy Apache Spark.
    Rozmiar węzła Mały (4 procesory wirtualne / 32 GB) Ustaw ten rozmiar na najmniejszy, aby zmniejszyć koszty dla tego przewodnika Szybki start
    Skalowanie automatyczne Disabled Na potrzeby tego przewodnika Szybki start nie potrzebujemy automatycznego skalowania
    Liczba węzłów 5 Użyj małego rozmiaru, aby ograniczyć koszty dla tego przewodnika Szybki start

    Screenshot from the Azure portal of the Apache Spark pool create flow - basics tab.

    Ważne

    Istnieją określone ograniczenia dotyczące nazw, których mogą używać pule platformy Apache Spark. Nazwy muszą zawierać tylko litery lub cyfry, muszą zawierać co najmniej 15 znaków, muszą zaczynać się literą, nie zawierać wyrazów zarezerwowanych i być unikatowe w obszarze roboczym.

  3. Wybierz pozycję Dalej: dodatkowe ustawienia i przejrzyj ustawienia domyślne. Nie modyfikuj żadnych ustawień domyślnych. Screenshot from the Azure portal that shows the 'Create Apache Spark pool' page with the 'Additional settings' tab selected.

  4. Wybierz pozycję Dalej: tagi. Rozważ użycie tagów platformy Azure. Na przykład tag "Właściciel" lub "CreatedBy", aby zidentyfikować, kto utworzył zasób, oraz tag "Środowisko", aby określić, czy ten zasób znajduje się w środowisku produkcyjnym, programistycznym itp. Aby uzyskać więcej informacji, zobacz Develop your naming and tagging strategy for Azure resources (Opracowywanie strategii nazewnictwa i tagowania zasobów platformy Azure). Screenshot from the Azure portal of Apache Spark pool create flow - additional settings tab.

  5. Wybierz pozycję Przejrzyj i utwórz.

  6. Upewnij się, że szczegóły wyglądają poprawnie w zależności od tego, co zostało wcześniej wprowadzone, i wybierz pozycję Utwórz. Screenshot from the Azure portal of Apache Spark pool create flow - review settings tab.

  7. W tym momencie rozpocznie się przepływ aprowizacji zasobów wskazujący po zakończeniu. Screenshot from the Azure portal of that shows the 'Overview' page with a 'Your deployment is complete' message displayed.

  8. Po zakończeniu aprowizacji przejście z powrotem do obszaru roboczego spowoduje wyświetlenie nowego wpisu dla nowo utworzonej puli platformy Apache Spark. Screenshot from the Azure portal of Apache Spark pool create flow - resource provisioning.

  9. W tym momencie nie ma uruchomionych zasobów, opłat za platformę Spark, utworzono metadane dotyczące wystąpień platformy Spark, które chcesz utworzyć.

Czyszczenie zasobów

Poniższe kroki usuwają pulę platformy Apache Spark z obszaru roboczego.

Ostrzeżenie

Usunięcie puli platformy Apache Spark spowoduje usunięcie aparatu analizy z obszaru roboczego. Połączenie z pulą nie będzie już możliwe, a wszystkie zapytania, potoki i notesy korzystające z tej puli platformy Apache Spark nie będą już działać.

Jeśli chcesz usunąć pulę platformy Apache Spark, wykonaj następujące kroki:

  1. Przejdź do okienka Pule platformy Apache Spark w obszarze roboczym.
  2. Wybierz pulę platformy Apache Spark, która ma zostać usunięta (w tym przypadku contosospark).
  3. Wybierz Usuń. Screenshot from the Azure portal of a list of Apache Spark pools, with the recently created pool selected.
  4. Potwierdź usunięcie i wybierz przycisk Usuń . Screenshot from the Azure portal of the Confirmation dialog to delete the selected Apache Spark pool.
  5. Po pomyślnym zakończeniu procesu pula platformy Apache Spark nie będzie już wyświetlana w zasobach obszaru roboczego.