Skapa Azure Synapse Analytics-arbetsyta
Det första steget i att distribuera Azure Synapse Analytics är att distribuera en Azure Synapse Analytics-arbetsyta. Den här distributionen skapar flera resurser som innehåller ett Azure Data Lake Storage Gen2-konto som fungerar som primär lagring och containern för lagring av arbetsytedata. Arbetsytan lagrar data i Apache Spark-tabeller. Den lagrar även Spark-programloggar under en mapp med namnet /synapse/workspacename. Det finns slutpunkter som kan användas för att ansluta till SQL-tjänsten på begäran och själva Azure Synapse Analytics-arbetsytan.
Med Azure Synapse Analytics kan du skapa pooler, antingen SQL-pooler eller Spark-pooler på arbetsytan som sömlöst kan blandas och matchas baserat på dina krav. Det kan göra detta via delade metadata i Azure Synapse Analytics, vilket gör att de olika motorerna kan dela databaser och tabeller.
Ett delat Hive-kompatibelt metadatasystem gör till exempel att tabeller som definierats för filer i datasjön kan användas sömlöst av antingen Spark eller Hive. SQL och Spark kan direkt utforska och analysera Parquet-, CSV-, TSV- och JSON-filer som lagras i datasjön. Det finns också en snabb skalbar belastning och avlastning för data som går mellan SQL- och Spark-databaser.
Det är den här funktionen som möjliggör arbetsbelastningsmönstret Modern Datalagring och ger arbetsytans SQL-motorer åtkomst till databaser och tabeller som skapats med Spark. Det gör också att SQL-motorerna kan skapa egna objekt som inte delas med de andra motorerna.
Azure Synapse Analytics-arbetsytan är den centrala platsen där du kan visa information om dessa resurser och ansluta till dem från Azure-portalen. Den första installationen ser ut så här:
Med en serverlös SQL-slutpunkt på begäran tillgänglig och ett Azure Data Lake Storage Gen2-konto (ADLS Gen2) kan du omedelbart realisera värdet från produkten genom att ladda upp filer till datasjön och använda den serverlösa SQL-tjänsten på begäran för att förbereda och utforska filerna
Även om du kan hantera vissa aspekter av tjänsten i Azure-portalen är bästa praxis att ansluta till Azure Synapse Studio för att utföra din aktivitet därifrån.