Szybki start: tworzenie nowej bezserwerowej puli platformy Apache Spark przy użyciu witryny Azure Portal
Usługa Azure Synapse Analytics oferuje różne aparaty analityczne, które ułatwiają pozyskiwanie, przekształcanie, modelowanie, analizowanie i dystrybuowanie danych. Pula platformy Apache Spark zapewnia możliwości obliczeniowe danych big data typu open source. Po utworzeniu puli platformy Apache Spark w obszarze roboczym usługi Synapse można ładować, modelować, przetwarzać i dystrybuować dane w celu uzyskania szybszych analiz analitycznych.
Z tego przewodnika Szybki start dowiesz się, jak za pomocą witryny Azure Portal utworzyć pulę platformy Apache Spark w obszarze roboczym usługi Synapse.
Ważne
Rozliczenia wystąpień platformy Spark są naliczane proporcjonalnie na minutę, niezależnie od tego, czy są używane. Pamiętaj, aby zamknąć wystąpienie platformy Spark po zakończeniu korzystania z niego lub ustawić krótki limit czasu. Aby uzyskać więcej informacji, zobacz sekcję Czyszczenie zasobów w tym artykule.
Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Wymagania wstępne
- Konieczna jest subskrypcja platformy Azure. W razie potrzeby utwórz bezpłatne konto platformy Azure
- Będziesz używać obszaru roboczego usługi Synapse.
Zaloguj się do witryny Azure Portal.
Zaloguj się do witryny Azure Portal.
Przejdź do obszaru roboczego usługi Synapse
Przejdź do obszaru roboczego usługi Synapse, w którym zostanie utworzona pula platformy Apache Spark, wpisując nazwę usługi (lub nazwę zasobu bezpośrednio) na pasku wyszukiwania.
Z listy obszarów roboczych wpisz nazwę (lub część nazwy) obszaru roboczego do otwarcia. W tym przykładzie używamy obszaru roboczego o nazwie contosoanalytics.
Tworzenie nowej puli platformy Apache Spark
Ważne
Środowisko Uruchomieniowe usługi Azure Synapse dla platformy Apache Spark 2.4 zostało wycofane i oficjalnie nie jest obsługiwane od września 2023 r. Biorąc pod uwagę, że platforma Spark 3.1 i platforma Spark 3.2 są również ogłaszane jako koniec wsparcia technicznego, zalecamy przeprowadzenie migracji klientów do platformy Spark 3.3.
W obszarze roboczym usługi Synapse, w którym chcesz utworzyć pulę platformy Apache Spark, wybierz pozycję Nowa pula platformy Apache Spark.
Wprowadź następujące szczegóły na karcie Podstawy :
Ustawienie Sugerowana wartość Opis Nazwa puli platformy Apache Spark Prawidłowa nazwa puli, na przykład contosospark
Jest to nazwa, którą będzie miała pula platformy Apache Spark. Rozmiar węzła Mały (4 procesory wirtualne / 32 GB) Ustaw ten rozmiar na najmniejszy, aby zmniejszyć koszty dla tego przewodnika Szybki start Skalowanie automatyczne Disabled Na potrzeby tego przewodnika Szybki start nie potrzebujemy automatycznego skalowania Liczba węzłów 5 Użyj małego rozmiaru, aby ograniczyć koszty dla tego przewodnika Szybki start Ważne
Istnieją określone ograniczenia dotyczące nazw, których mogą używać pule platformy Apache Spark. Nazwy muszą zawierać tylko litery lub cyfry, muszą zawierać co najmniej 15 znaków, muszą zaczynać się literą, nie zawierać wyrazów zarezerwowanych i być unikatowe w obszarze roboczym.
Wybierz pozycję Dalej: dodatkowe ustawienia i przejrzyj ustawienia domyślne. Nie modyfikuj żadnych ustawień domyślnych.
Wybierz pozycję Dalej: tagi. Rozważ użycie tagów platformy Azure. Na przykład tag "Właściciel" lub "CreatedBy", aby zidentyfikować, kto utworzył zasób, oraz tag "Środowisko", aby określić, czy ten zasób znajduje się w środowisku produkcyjnym, programistycznym itp. Aby uzyskać więcej informacji, zobacz Develop your naming and tagging strategy for Azure resources (Opracowywanie strategii nazewnictwa i tagowania zasobów platformy Azure).
Wybierz pozycję Przejrzyj i utwórz.
Upewnij się, że szczegóły wyglądają poprawnie w zależności od tego, co zostało wcześniej wprowadzone, i wybierz pozycję Utwórz.
W tym momencie rozpocznie się przepływ aprowizacji zasobów wskazujący po zakończeniu.
Po zakończeniu aprowizacji przejście z powrotem do obszaru roboczego spowoduje wyświetlenie nowego wpisu dla nowo utworzonej puli platformy Apache Spark.
W tym momencie nie ma uruchomionych zasobów, opłat za platformę Spark, utworzono metadane dotyczące wystąpień platformy Spark, które chcesz utworzyć.
Czyszczenie zasobów
Poniższe kroki usuwają pulę platformy Apache Spark z obszaru roboczego.
Ostrzeżenie
Usunięcie puli platformy Apache Spark spowoduje usunięcie aparatu analizy z obszaru roboczego. Połączenie z pulą nie będzie już możliwe, a wszystkie zapytania, potoki i notesy korzystające z tej puli platformy Apache Spark nie będą już działać.
Jeśli chcesz usunąć pulę platformy Apache Spark, wykonaj następujące kroki:
- Przejdź do okienka Pule platformy Apache Spark w obszarze roboczym.
- Wybierz pulę platformy Apache Spark, która ma zostać usunięta (w tym przypadku contosospark).
- Wybierz Usuń.
- Potwierdź usunięcie i wybierz przycisk Usuń .
- Po pomyślnym zakończeniu procesu pula platformy Apache Spark nie będzie już wyświetlana w zasobach obszaru roboczego.