Dela via


Copilot Översikt över datavetenskap och datateknik (förhandsversion)

Viktigt!

Den här funktionen är i förhandsversion.

Copilot for Data Science and Data Engineering är en AI-assistent som hjälper till att analysera och visualisera data. Det fungerar med Lakehouse-tabeller och -filer, Power BI-datauppsättningar och pandas/spark/infrastrukturdataramar, vilket ger svar och kodfragment direkt i notebook-filen. Det mest effektiva sättet att använda Copilot är att lägga till dina data som en dataram. Du kan ställa dina frågor i chattpanelen och AI:n tillhandahåller svar eller kod för att kopiera till din notebook-fil. Den förstår dina datas schema och metadata, och om data läses in i en dataram har den även medvetenhet om data i dataramen. Du kan be att Copilot få insikter om data, skapa kod för visualiseringar eller ange kod för datatransformeringar och identifiera filnamn för enkel referens. Copilot effektiviserar dataanalysen genom att eliminera komplex kodning.

Kommentar

Introduktion till Copilot datavetenskap och datateknik för Fabric Data Science

Med Copilot för datavetenskap och datateknik kan du chatta med en AI-assistent som kan hjälpa dig att hantera dina dataanalys- och visualiseringsuppgifter. Du kan ställa Copilot frågor om lakehouse-tabeller, Power BI-datauppsättningar eller Pandas/Spark-dataramar i notebook-filer. Copilot svar på naturligt språk eller kodfragment. Copilot kan också generera dataspecifik kod åt dig, beroende på aktiviteten. För datavetenskap och datateknik kan du till exempel Copilot generera kod för:

  • Skapa diagram
  • Filtrera data
  • Tillämpa transformeringar
  • Maskininlärningsmodeller

Välj Copilot först ikonen i menyfliksområdet notebook-filer. Chattpanelen Copilot öppnas och en ny cell visas överst i anteckningsboken. Den här cellen måste köras varje gång en Spark-session läses in i en Fabric-anteckningsbok. Annars Copilot fungerar inte upplevelsen korrekt. Vi håller på att utvärdera andra mekanismer för att hantera den här nödvändiga initieringen i framtida versioner.

Skärmbild som visar menyfliksområdet Copilot .

Kör cellen överst i anteckningsboken. När cellen har körts kan du använda Copilot. Du måste köra cellen överst i anteckningsboken varje gång sessionen i anteckningsboken stängs.

Skärmbild som visar lyckad cellkörning.

För att maximera Copilot effektiviteten läser du in en tabell eller datauppsättning som en dataram i din notebook-fil. På så sätt kan AI:n komma åt data och förstå dess struktur och innehåll. Börja sedan chatta med AI:n. Välj chattikonen i notebook-verktygsfältet och skriv din fråga eller begäran i chattpanelen. Du kan till exempel fråga:

  • "Vilken är den genomsnittliga åldern för kunder i den här datamängden?"
  • "Visa mig ett stapeldiagram över försäljning per region"

Och mer. Copilot svarar med svaret eller koden, som du kan kopiera och klistra in den i anteckningsboken. Copilot för datavetenskap och datateknik är ett bekvämt, interaktivt sätt att utforska och analysera dina data.

När du använder Copilotkan du också anropa de magiska kommandona i en notebook-cell för att hämta utdata direkt i notebook-filen. För svar på naturligt språk kan du till exempel ställa frågor med kommandot %%chat, till exempel:

%%chat
What are some machine learning models that may fit this dataset?

Skärmbild som visar kodgenerering.

eller

%%code
Can you generate code for a logistic regression that fits this data?

Skärmbild som visar generering av logistisk regressionskod.

Copilot för datavetenskap och datateknik har även schema- och metadatamedvetenhet för tabeller i lakehouse. Copilot kan tillhandahålla relevant information i samband med dina data i ett bifogat sjöhus. Du kan till exempel fråga:

  • "Hur många tabeller finns det i sjöhuset?"
  • "Vilka är kolumnerna i tabellkunderna?"

Copilot svarar med relevant information om du har lagt till lakehouse i notebook-filen. Copilot har också medvetenhet om namnen på filer som läggs till i alla lakehouse som är kopplade till notebook-filen. Du kan referera till filerna efter namn i chatten. Om du till exempel har en fil med namnet sales.csv i lakehouse kan du fråga "Skapa en dataram från sales.csv". Copilot genererar koden och visar den i chattpanelen. Med Copilot för notebook-filer kan du enkelt komma åt och köra frågor mot dina data från olika källor. Du behöver inte den exakta kommandosyntaxen för att göra det.

Tips

  • "Rensa" konversationen Copilot i chattpanelen med sopborsten längst upp i chattpanelen. Copilot Behåller kunskap om indata eller utdata under sessionen, men det hjälper om du tycker att det aktuella innehållet är distraherande.
  • Använd biblioteket chat magics för att konfigurera inställningar för Copilot, inklusive sekretessinställningar. Standarddelningsläget är utformat för att maximera kontextdelningen Copilot har åtkomst till, så att begränsa den information som tillhandahålls till copilot kan direkt och avsevärt påverka relevansen av dess svar.
  • När Copilot den första startar erbjuder den en uppsättning användbara frågor som kan hjälpa dig att komma igång. De kan hjälpa dig att starta konversationen med Copilot. Om du vill referera till frågor senare kan du använda knappen sparkle längst ned i chattpanelen.
  • Du kan "dra" sidopanelen i copilot-chatten för att expandera chattpanelen för att visa kod tydligare eller för läsbarhet för utdata på skärmen.

Begränsningar

Copilot funktioner i Data Science-upplevelsen är för närvarande begränsade till notebook-filer. Dessa funktioner omfattar Copilot chattfönstret, magiska IPython-kommandon som kan användas i en kodcell och automatiska kodförslag när du skriver in en kodcell. Copilot kan också läsa Power BI-semantiska modeller med hjälp av en integrering av semantisk länk.

Copilot har två viktiga avsedda användningsområden:

  • För det första kan du be om Copilot att undersöka och analysera data i notebook-filen (till exempel genom att först läsa in en DataFrame och sedan fråga Copilot om data i DataFrame).
  • För det andra kan du be om Copilot att få generera en rad förslag om din dataanalysprocess, till exempel vilka förutsägelsemodeller som kan vara relevanta, kod för att utföra olika typer av dataanalys och dokumentation för en slutförd notebook-fil.

Tänk på att kodgenerering med snabbrörliga eller nyligen släppta bibliotek kan innehålla felaktigheter eller fabriceringar.