Szybki start: Tworzenie obszaru roboczego usługi Synapse
W tym przewodniku Szybki start utworzysz obszar roboczy usługi Synapse i możesz skorzystać z pozostałych samouczków, aby utworzyć dedykowaną pulę SQL i bezserwerową pulę platformy Apache Spark.
Wymagania wstępne
- Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
- Aby wykonać kroki tego samouczka, musisz mieć dostęp do grupy zasobów, dla której przypisano rolę Właściciel . Utwórz obszar roboczy usługi Synapse w tej grupie zasobów.
Tworzenie obszaru roboczego usługi Synapse w witrynie Azure Portal
Uruchamianie procesu
- Otwórz witrynę Azure Portal, na pasku wyszukiwania wprowadź ciąg Synapse bez naciśnięcia Enter.
- W wynikach wyszukiwania w obszarze Usługi wybierz pozycję Azure Synapse Analytics.
- Wybierz pozycję Utwórz , aby utworzyć obszar roboczy.
> Karta Podstawowe szczegóły projektu
Wypełnij następujące pola:
- Subskrypcja — wybierz dowolną subskrypcję.
- Grupa zasobów — użyj dowolnej grupy zasobów.
- Zarządzana grupa zasobów — pozostaw to pole puste.
Szczegóły obszaru roboczego na karcie > Podstawy
Wypełnij następujące pola:
- Nazwa obszaru roboczego — wybierz dowolną globalnie unikatową nazwę. W tym samouczku użyjemy przestrzeni myworkspace.
- Region — wybierz region, w którym umieszczono aplikacje/usługi klienckie (na przykład Azure Virtual Machine, Power BI, Azure Analysis Service) i magazyny zawierające dane (na przykład Azure Data Lake Storage, magazyn analityczny usługi Azure Cosmos DB).
Uwaga
Obszar roboczy, który nie znajduje się we współpracy z aplikacjami klienckimi lub magazynem, może być główną przyczyną wielu problemów z wydajnością. Jeśli dane lub klienci znajdują się w wielu regionach, możesz utworzyć oddzielne obszary robocze w różnych regionach, w których znajdują się dane i klienci.
W obszarze Wybierz usługę Data Lake Storage Gen 2:
Według nazwy konta wybierz pozycję Utwórz nowy i nadaj nowe konto magazynu nazwę contosolake lub podobną, jak nazwa musi być unikatowa.
Napiwek
Jeśli zostanie wyświetlony komunikat o błędzie "Dostawca zasobów usługi Azure Synapse (Microsoft.Synapse) musi zostać zarejestrowany w wybranej subskrypcji", otwórz witrynę Azure Portal i wybierz pozycję Subskrypcje. Wybierz subskrypcję. Na liście Ustawienia wybierz pozycję Dostawcy zasobów. Wyszukaj pozycję Microsoft.Synapse, wybierz ją, a następnie wybierz pozycję Zarejestruj.
Według nazwy systemu plików wybierz pozycję Utwórz nowy i nadaj jej nazwę użytkownikom. Spowoduje to utworzenie kontenera magazynu o nazwie użytkownicy. Obszar roboczy będzie używać tego konta magazynu jako "podstawowego" konta magazynu do tabel platformy Spark i dzienników aplikacji platformy Spark.
Zaznacz rolę Przypisz sobie rolę Współautor danych obiektu blob usługi Storage na koncie usługi Data Lake Storage Gen2.
Kończenie procesu
Wybierz pozycję Przeglądanie + tworzenie>Utwórz. Obszar roboczy jest gotowy w ciągu kilku minut.
Uwaga
Aby włączyć funkcje obszaru roboczego z istniejącej dedykowanej puli SQL (dawniej SQL DW), zobacz Jak włączyć obszar roboczy dla dedykowanej puli SQL (dawniej SQL DW).
Otwórz program Synapse Studio
Po utworzeniu obszaru roboczego usługi Azure Synapse masz dwa sposoby otwierania programu Synapse Studio:
Otwórz obszar roboczy usługi Synapse w witrynie Azure Portal, w sekcji Przegląd obszaru roboczego usługi Synapse wybierz pozycję Otwórz w polu Otwórz program Synapse Studio.
Przejdź do obszaru roboczego
https://web.azuresynapse.net
i zaloguj się.
Uwaga
Aby zalogować się do obszaru roboczego, istnieją dwie metody wyboru konta. Jedna z nich pochodzi z subskrypcji platformy Azure, a druga z sekcji Wprowadź ręcznie. Jeśli masz rolę platformy Azure usługi Synapse lub role platformy Azure wyższego poziomu, możesz użyć obu metod do zalogowania się do obszaru roboczego. Jeśli nie masz powiązanych ról platformy Azure i udzielono Ci roli RBAC usługi Synapse, wprowadź ręcznie jest jedynym sposobem logowania się do obszaru roboczego. Aby dowiedzieć się więcej na temat kontroli dostępu opartej na rolach usługi Synapse, zobacz Co to jest kontrola dostępu oparta na rolach (RBAC) usługi Synapse.
Umieść przykładowe dane na podstawowym koncie magazynu
Użyjemy małego przykładowego zestawu danych 100 tys. wierszy danych NYC Taxi Cab dla wielu przykładów w tym przewodniku wprowadzającym. Zaczynamy od umieszczenia go na podstawowym koncie magazynu utworzonym dla obszaru roboczego.
- Pobierz zestaw danych NYC Taxi - green trip na komputer:
- Przejdź do oryginalnej lokalizacji zestawu danych z linku, wybierz konkretny rok i pobierz rekordy przejazdów zielonych taksówek w formacie Parquet.
- Zmień nazwę pobranego pliku na NYCTripSmall.parquet.
- W programie Synapse Studio przejdź do centrum danych .
- Wybierz pozycję Połączone.
- W kategorii Azure Data Lake Storage Gen2 zobaczysz element o nazwie takiej jak myworkspace ( Primary - contosolake ).
- Wybierz kontener o nazwie users (Primary).
- Wybierz pozycję Przekaż i wybierz
NYCTripSmall.parquet
pobrany plik.
Po przekazaniu pliku parquet jest on dostępny za pośrednictwem dwóch równoważnych identyfikatorów URI:
https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet
abfss://users@contosolake.dfs.core.windows.net/NYCTripSmall.parquet
Napiwek
W przykładach, które zostały opisane w tym samouczku, pamiętaj, aby zastąpić contosolake w interfejsie użytkownika nazwą podstawowego konta magazynu wybranego dla obszaru roboczego.