Udostępnij za pomocą


Szybki start: tworzenie nowej bezserwerowej puli platformy Apache Spark przy użyciu witryny Azure Portal

Usługa Azure Synapse Analytics oferuje różne aparaty analityczne, które ułatwiają pozyskiwanie, przekształcanie, modelowanie, analizowanie i dystrybuowanie danych. Pula Apache Spark zapewnia open-source'owe możliwości obliczeniowe dla danych big data. Po utworzeniu puli platformy Apache Spark w obszarze roboczym usługi Synapse można ładować, modelować, przetwarzać i dystrybuować dane w celu uzyskania szybszych analiz analitycznych.

W tym szybkim przewodniku dowiesz się, jak za pomocą portalu Azure utworzyć pulę Apache Spark w workspacie Synapse.

Ważne

Rozliczanie instancji Spark odbywa się proporcjonalnie do minuty, niezależnie od tego, czy są używane. Pamiętaj, aby zamknąć instancję Spark po zakończeniu korzystania z niego lub ustawić krótki czas oczekiwania. Aby uzyskać więcej informacji, zobacz sekcję Czyszczenie zasobów w tym artykule.

Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.

Wymagania wstępne

Zaloguj się do witryny Azure Portal

Zaloguj się do witryny Azure Portal.

  1. Przejdź do obszaru roboczego usługi Synapse, w którym zostanie utworzona pula platformy Apache Spark, wpisując nazwę usługi (lub nazwę zasobu bezpośrednio) na pasku wyszukiwania. Zrzut ekranu przedstawiający pasek wyszukiwania witryny Azure Portal z wpisanymi obszarami roboczymi usługi Synapse.

  2. Z listy obszarów roboczych wpisz nazwę (lub część nazwy) obszaru roboczego do otwarcia. W tym przykładzie używamy obszaru roboczego o nazwie contosoanalytics. Zrzut ekranu z witryny Azure Portal listy obszarów roboczych usługi Synapse przefiltrowanych w celu wyświetlenia tych, które zawierają nazwę Contoso.

Utwórz nową pulę Apache Spark

  1. W obszarze roboczym usługi Synapse, w którym chcesz utworzyć pulę platformy Apache Spark, wybierz pozycję Nowa pula platformy Apache Spark. Zrzut ekranu z portalu Azure obszaru roboczego Synapse z czerwonym polem wokół polecenia utworzenia nowej puli Apache Spark.

  2. Wprowadź następujące szczegóły na karcie Podstawy :

    Ustawienie Sugerowana wartość Opis
    Nazwa puli Apache Spark Prawidłowa nazwa puli, na przykład contosospark Jest to nazwa, którą będzie miała pula Apache Spark.
    Rozmiar węzła Mały (4 procesory wirtualne / 32 GB) Ustaw ten rozmiar na najmniejszy, aby zmniejszyć koszty tej szybkiej instrukcji.
    Autoskalowanie Niepełnosprawny Dla tej szybkiej konfiguracji nie potrzebujemy automatycznego skalowania.
    Liczba węzłów 5 Użyj małego rozmiaru, aby ograniczyć koszty dla tego szybkiego startu

    Zrzut ekranu z portalu Azure przedstawiający proces tworzenia puli Apache Spark - zakładka podstawy.

    Ważne

    Istnieją określone ograniczenia dotyczące nazw, których mogą używać pule platformy Apache Spark. Nazwy muszą zawierać tylko litery lub cyfry, muszą zawierać co najmniej 15 znaków, muszą zaczynać się literą, nie zawierać wyrazów zarezerwowanych i być unikatowe w obszarze roboczym.

  3. Wybierz pozycję Dalej: dodatkowe ustawienia i przejrzyj ustawienia domyślne. Nie modyfikuj żadnych ustawień domyślnych. Zrzut ekranu witryny Azure Portal przedstawiający stronę

  4. Wybierz Dalej: tagi. Rozważ użycie tagów platformy Azure. Na przykład tag "Właściciel" lub "CreatedBy", aby zidentyfikować, kto utworzył zasób, oraz tag "Środowisko", aby określić, czy ten zasób znajduje się w środowisku produkcyjnym, programistycznym itp. Aby uzyskać więcej informacji, zobacz Develop your naming and tagging strategy for Azure resources (Opracowywanie strategii nazewnictwa i tagowania zasobów platformy Azure). Zrzut ekranu z Azure Portal przedstawiający proces tworzenia puli platformy Apache Spark – zakładka dodatkowe ustawienia.

  5. Wybierz opcję Recenzja i utwórz.

  6. Upewnij się, że szczegóły wyglądają poprawnie w zależności od tego, co zostało wcześniej wprowadzone, i wybierz pozycję Utwórz. Zrzut ekranu z portalu Azure przedstawiający proces tworzenia puli Apache Spark – zakładkę ustawień w celu przeglądu.

  7. W tym momencie rozpocznie się proces aprowizacji zasobów, który zasygnalizuje, gdy zostanie zakończony. Zrzut ekranu z witryny Azure Portal przedstawiający stronę

  8. Po zakończeniu aprowizacji powrót do obszaru roboczego spowoduje wyświetlenie nowego wpisu dla nowo utworzonej puli Apache Spark. Zrzut ekranu przedstawiający proces tworzenia puli Apache Spark w portalu Azure — aprowizowanie zasobów.

  9. W tym momencie nie ma uruchomionych zasobów, nie są naliczane opłaty za korzystanie z platformy Spark; utworzyłeś metadane dotyczące wystąpień Spark, które zamierzasz utworzyć.

Czyszczenie zasobów

Poniższe kroki usuwają pulę Apache Spark z obszaru roboczego.

Ostrzeżenie

Usunięcie puli Apache Spark spowoduje usunięcie mechanizmu analitycznego z obszaru roboczego. Nie będzie już możliwe połączenie z klastrem, a wszystkie zapytania, przepływy danych i notesy używające tego klastra Apache Spark nie będą już działać.

Jeśli chcesz usunąć pulę platformy Apache Spark, wykonaj następujące kroki:

  1. Przejdź do panelu pul Apache Spark w obszarze roboczym.
  2. Wybierz pulę Apache Spark, która ma zostać usunięta (w tym przypadku contosospark).
  3. Wybierz Usuń. Zrzut ekranu z witryny Azure Portal przedstawiający listę pul platformy Apache Spark z wybraną ostatnio utworzoną pulą.
  4. Potwierdź usunięcie i wybierz przycisk Usuń . Zrzut ekranu z portalu Azure przedstawiający okno dialogowe potwierdzenia usunięcia wybranej puli Apache Spark.
  5. Po pomyślnym zakończeniu procesu pula platformy Apache Spark nie będzie już wyświetlana w zasobach obszaru roboczego.