Förbereda ditt system för självstudiekursen om datavetenskap

Innan du påbörjar självstudiemodulerna för datavetenskap från slutpunkt till slutpunkt bör du lära dig mer om förutsättningar, exempeldatauppsättningen, vilka notebook-filer som ska importeras och hur du kopplar en lakehouse till dessa notebook-filer.

Viktigt

Microsoft Fabric är en förhandsversion.

Förutsättningar

  1. Power BI Premium prenumeration. Mer information finns i Så här köper du Power BI Premium.

  2. En Power BI-arbetsyta med tilldelad premiumkapacitet.

  3. Ett befintligt Microsoft Fabric Lakehouse. Skapa ett sjöhus genom att följa stegen i Skapa ett sjöhus i Microsoft Fabric.

Exempeldatauppsättning

I den här självstudien använder vi den gula datauppsättningen NYC Taxi och Limousine, som är en storskalig datamängd som innehåller taxiresor i staden från 2009 till 2018. Datamängden innehåller olika funktioner som hämtnings- och avlämningsdatum, tider, platser, priser, betalningstyper och antal passagerare. Datamängden kan användas för olika syften, till exempel för att analysera trafikmönster, efterfrågetrender, prisstrategier och drivrutinsbeteende.

Importera självstudieanteckningsböcker

Vi använder notebook-objektet i Datavetenskap för att demonstrera olika infrastrukturfunktioner. Notebook-filerna är tillgängliga som Jupyter Notebook-filer som kan importeras till din Infrastruktur-aktiverade arbetsyta.

  1. Ladda ned notebook-filerna (.ipynb) för den här självstudien från den överordnade mappen Datavetenskap Källkod för självstudie.

  2. Växla till Datavetenskap med hjälp av upplevelseväxlingsikonen i det vänstra hörnet på startsidan.

    Skärmbild av meny för upplevelseväxlare som visar var du väljer Datavetenskap.

  3. På startsidan för Data Science Experience väljer du Importera anteckningsbok och laddar upp notebook-filerna för modulerna 1–5 som du laddade ned i steg 1.

    Skärmbild som visar var du väljer Importera anteckningsbok på startsidan för Data science.

    Skärmbild av dialogrutan Importera status som visar var du väljer Ladda upp.

  4. När notebook-filerna har importerats väljer du Gå till arbetsyta i dialogrutan Importera.

    Skärmbild av dialogrutan För lyckad import som visar var du väljer Gå till arbetsyta.

  5. De importerade notebook-filerna är nu tillgängliga på din arbetsyta för användning.

    Skärmbild som visar en lista över tillgängliga anteckningsböcker på en arbetsyta.

Bifoga ett sjöhus i anteckningsböckerna

För att demonstrera lakehouse-funktionerna i Fabric kräver de första fem modulerna i den här självstudien att du kopplar ett standardsjöhus till notebook-filerna. Följande steg visar hur du lägger till ett befintligt lakehouse i en notebook-fil på en arbetsyta som är aktiverad av infrastrukturresurser.

  1. Öppna notebook-filen för den första modulen 01 Mata in data i Lakehouse med Apache Spark på arbetsytan.

  2. Välj Lägg till lakehouse i det vänstra fönstret och välj Befintligt lakehouse för att öppna dialogrutan Datahubb .

  3. Välj arbetsytan och det lakehouse som du vill använda med de här självstudierna och välj Lägg till.

  4. När ett sjöhus har lagts till visas det i lakehouse-fönstret i notebook-gränssnittet där tabeller och filer som lagras i lakehouse kan visas.

Anteckning

Innan du kör alla notebook-filer måste du utföra de här stegen för varje notebook-fil i den här självstudien.

Diagram över processstegen för att koppla ett lakehouse till en notebook-fil.

Nästa steg