Förbereda ditt system för självstudiekursen om datavetenskap
Innan du påbörjar självstudiemodulerna för datavetenskap från slutpunkt till slutpunkt bör du lära dig mer om förutsättningar, exempeldatauppsättningen, vilka notebook-filer som ska importeras och hur du kopplar en lakehouse till dessa notebook-filer.
Viktigt
Microsoft Fabric är en förhandsversion.
Förutsättningar
Power BI Premium prenumeration. Mer information finns i Så här köper du Power BI Premium.
En Power BI-arbetsyta med tilldelad premiumkapacitet.
Ett befintligt Microsoft Fabric Lakehouse. Skapa ett sjöhus genom att följa stegen i Skapa ett sjöhus i Microsoft Fabric.
Exempeldatauppsättning
I den här självstudien använder vi den gula datauppsättningen NYC Taxi och Limousine, som är en storskalig datamängd som innehåller taxiresor i staden från 2009 till 2018. Datamängden innehåller olika funktioner som hämtnings- och avlämningsdatum, tider, platser, priser, betalningstyper och antal passagerare. Datamängden kan användas för olika syften, till exempel för att analysera trafikmönster, efterfrågetrender, prisstrategier och drivrutinsbeteende.
Importera självstudieanteckningsböcker
Vi använder notebook-objektet i Datavetenskap för att demonstrera olika infrastrukturfunktioner. Notebook-filerna är tillgängliga som Jupyter Notebook-filer som kan importeras till din Infrastruktur-aktiverade arbetsyta.
Ladda ned notebook-filerna (.ipynb) för den här självstudien från den överordnade mappen Datavetenskap Källkod för självstudie.
Växla till Datavetenskap med hjälp av upplevelseväxlingsikonen i det vänstra hörnet på startsidan.
På startsidan för Data Science Experience väljer du Importera anteckningsbok och laddar upp notebook-filerna för modulerna 1–5 som du laddade ned i steg 1.
När notebook-filerna har importerats väljer du Gå till arbetsyta i dialogrutan Importera.
De importerade notebook-filerna är nu tillgängliga på din arbetsyta för användning.
Bifoga ett sjöhus i anteckningsböckerna
För att demonstrera lakehouse-funktionerna i Fabric kräver de första fem modulerna i den här självstudien att du kopplar ett standardsjöhus till notebook-filerna. Följande steg visar hur du lägger till ett befintligt lakehouse i en notebook-fil på en arbetsyta som är aktiverad av infrastrukturresurser.
Öppna notebook-filen för den första modulen 01 Mata in data i Lakehouse med Apache Spark på arbetsytan.
Välj Lägg till lakehouse i det vänstra fönstret och välj Befintligt lakehouse för att öppna dialogrutan Datahubb .
Välj arbetsytan och det lakehouse som du vill använda med de här självstudierna och välj Lägg till.
När ett sjöhus har lagts till visas det i lakehouse-fönstret i notebook-gränssnittet där tabeller och filer som lagras i lakehouse kan visas.
Anteckning
Innan du kör alla notebook-filer måste du utföra de här stegen för varje notebook-fil i den här självstudien.