Delen via


Overzicht van Copilot voor Data Science en Data Engineering (preview)

Belangrijk

Deze functie is beschikbaar als preview-versie.

Copilot voor Data Science en Data Engineering is een AI-assistent waarmee u gegevens kunt analyseren en visualiseren. Het werkt met Lakehouse-tabellen en -bestanden, Power BI-gegevenssets en pandas/spark/fabric-gegevensframes om antwoorden en codefragmenten rechtstreeks in een notebook te bieden. Verbindingen met OneLake en standaard gekoppelde Lakehouses stellen Copilot in staat contextuele codesuggesties en reacties in natuurlijke taal te bieden die zijn afgestemd op uw gegevens.

Copilot kan u helpen uw gegevens beter te begrijpen en suggesties te doen om uw notebook te starten, inclusief het genereren van code voor de eerste cellen. Nadat u gegevensbronnen hebt geïdentificeerd en toegevoegd via de Fabric-objectverkenner, stelt Copilot modeltypen voor om te implementeren. U kunt deze aanbevelingen rechtstreeks naar uw notebook kopiëren om de ontwikkeling te starten. Als u niet zeker weet welke volgende stappen u moet uitvoeren, kunt u Copilot in de cel aanroepen voor inzichten in de richting van modellen.

Wanneer je fouten tegenkomt, geeft Copilot voorgestelde oplossingen. Voor verdere hulp kunt u met Copilot chatten voor meer opties, zodat u constante online zoekopdrachten kunt vermijden.

U profiteert ook van automatische documentatie met een eenvoudige functie Opmerkingen toevoegen waarmee code- en gegevenswijzigingen worden samengevat. Dit maakt cellen inzichtelijk voor u en anderen. In uw werkstroom kunt u Copilot raadplegen op specifieke punten, waardoor u directe ondersteuning en begeleiding ontvangt om uw ontwikkelingsproces te versnellen en te verbeteren.

Notitie

Met Spark 3.4 en latere versies in Microsoft Fabric is er geen installatiecel vereist voor het gebruik van Copilot in uw notebook. Eerdere versies waarvoor een installatiecel (Spark 3.3 en eerder) is vereist, worden niet meer ondersteund.

Notitie

  • De beheerder moet de tenantswitch inschakelen voordat u Copilotgaat gebruiken. Zie het artikel Copilot tenantinstellingen voor meer informatie.
  • Uw F2- of P1-capaciteit moet zich in een van de regio's bevinden die in dit artikel worden vermeld, beschikbaarheid van infrastructuurregio's.
  • Als uw tenant of capaciteit zich buiten de VS of Frankrijk bevindt, is Copilot standaard uitgeschakeld, tenzij uw Fabric-tenantbeheerder de tenantinstelling "Gegevens die naar Azure OpenAI worden verzonden, kunnen buiten de geografische regio, de nalevingsgrens of de nationale cloudinstantie van uw tenant worden verwerkt" inschakelt in het Fabric-beheerportaal.
  • Copilot in Microsoft Fabric wordt niet ondersteund voor proef-SKU's. Alleen betaalde SKU's (F2 of hoger of P1 of hoger) worden ondersteund.
  • Zie het artikel Overzicht van Copilot in Fabric en Power BI voor meer informatie.

Inleiding tot Copilot voor Data Science en Data Engineering voor Fabric Data Science

Met Copilot voor Data Science en Data Engineering kunt u chatten met een AI-assistent om uw gegevensanalyse- en visualisatietaken af te handelen. U kunt binnen notebooks vragen stellen over lakehouse-tabellen, Power BI-gegevenssets of Pandas-/Spark-gegevensframes. Copilot geeft antwoorden in natuurlijke taal of codefragmenten. Copilot kan ook gegevensspecifieke code voor u genereren, afhankelijk van de taak. Copilot voor Data Science en Data Engineering kan bijvoorbeeld code genereren voor:

  • Grafiek maken
  • Gegevens filteren
  • Transformaties toepassen
  • Machine learning-modellen

Selecteer eerst het Copilot pictogram op het lint met notitieblokken. Het Copilot chatvenster wordt geopend en er wordt een nieuwe cel boven aan het notitieblok weergegeven. U kunt ook bovenaan in de cel van uw Fabric Notebooks Copilot selecteren.

Laad een tabel of gegevensset als een dataframe in uw notebook om de effectiviteit van Copilot te maximaliseren. De AI heeft vervolgens toegang tot de gegevens en begrijpt de structuur en inhoud ervan. Begin vervolgens te chatten met de AI. Selecteer het chatpictogram op de werkbalk van het notitieblok en typ uw vraag of aanvraag in het chatvenster. U kunt bijvoorbeeld het volgende vragen:

  • Wat is de gemiddelde leeftijd van klanten in deze gegevensset?
  • "Toon een staafdiagram van verkoop per regio."

Copilot reageert met het antwoord of de code, die u in uw notitieboek kunt kopiëren en plakken. Copilot voor Data Science en Data Engineering is een handige, interactieve manier om uw gegevens te verkennen en te analyseren.

Copilot Het chatvenster gebruiken om te communiceren met uw gegevens

Selecteer het chatpictogram op de werkbalk van het notitieblok om het Copilot chatvenster te openen en inzichten uit uw gegevens te krijgen. Typ uw vragen of aanvragen in het chatvenster. U kunt bijvoorbeeld het volgende vragen:

  • Wat is de gemiddelde leeftijd van klanten in deze gegevensset?
  • "Toon een staafdiagram van verkoop per regio."

Copilot reageert met het antwoord of de code, die u in uw notitieboek kunt kopiëren en plakken. Daarnaast kan Copilot voorstellen wat u vervolgens moet doen met uw gegevens. Copilot biedt suggesties en genereert relevante codefragmenten om u te helpen bij uw gegevensanalyse- en visualisatietaken.

Voer de volgende stappen uit om te interacteren met het Copilot chatvenster in Microsoft Fabric-notitieblokken:

  1. Open de Copilot Chatvenster: selecteer het chatpictogram op de werkbalk van het notitieblok.

  2. Vragen stellen of aanvragen indienen: typ uw vragen of aanvragen in het chatvenster. Hier volgen enkele specifieke voorbeelden voor data science en data engineering:

  • Gegevens verkennen:

    • Wat is de distributie van de kolom Leeftijd in deze gegevensset?
    • 'Toon een histogram van de kolom 'inkomen'.
  • gegevens opschonen:

    • "Hoe kan ik ontbrekende waarden in deze gegevensset verwerken?"
    • "Genereer code om duplicaten uit dit dataframe te verwijderen."
  • Gegevenstransformatie:

    • "Hoe normaliseer ik de kolom Verkoop?"
    • 'Maak een nieuwe kolom 'winst' door 'kosten' af te trekken van 'revenue'.
  • Visualisatie:

    • "Maak een spreidingsdiagram van 'hoogte' tegen 'gewicht'."
    • 'Genereer een boxplot voor de kolom 'salaris'.
  • Machinaal Leren:

    • Leid een beslissingsboomclassificator op met deze dataset.
    • "Genereer code voor een k-means-clustering-algoritme met drie clusters."
  • Modelevaluatie:

    • "Hoe evalueer ik de nauwkeurigheid van een logistiek regressiemodel?"
    • 'Een verwarringsmatrix genereren voor de voorspellingen'.
  1. Antwoorden ontvangen: Copilot reageert met uitleg in natuurlijke taal of codefragmenten. U kunt de code kopiëren en plakken in uw notebook om deze uit te voeren.

  2. Suggesties ophalen: Als u niet weet hoe u kunt doorgaan, vraagt u om Copilot suggesties:

  • Wat moet ik nu doen met deze gegevensset?
  • "Wat zijn enkele aanbevolen functie-engineeringtechnieken voor deze gegevens?"
  1. Gegenereerde code gebruiken: kopieer de gegenereerde codefragmenten uit het chatvenster en plak deze in uw notebookcellen om ze uit te voeren.

Met deze stappen en de opgegeven voorbeelden kunt u effectief communiceren met het Copilot chatvenster om uw data science- en data engineering-workflows in Microsoft Fabric-notebooks te verbeteren.

Copilot Het In-Cell panel en snelle acties gebruiken

U kunt met Copilot rechtstreeks binnen uw notebookcellen werken om code te genereren en snelle acties uit te voeren op uw codeblokken. Hier is hoe u het Copilot in-celldeelvenster gebruikt:

  1. Code genereren: Als u code voor specifieke taken wilt genereren, kunt u het Copilot deelvenster in de cel gebruiken. U kunt uw aanvraag bijvoorbeeld typen in het tekstvenster boven de codecel:
Can you generate code for a logistic regression that fits this data?

Copilot bevat het benodigde codefragment rechtstreeks in de onderstaande cel.

  1. Code herstellen: u kunt vragen Copilot om fouten in uw code op te lossen. Typ uw verzoek in het tekstpaneel boven de codecel en Copilot stelt correcties voor.

  2. Opmerkingen toevoegen: Als u uw code automatisch wilt documenteren, gebruikt u de functie Opmerkingen toevoegen. Copilot genereert opmerkingen die de code en gegevenswijzigingen samenvatten, waardoor uw notitieblok beter leesbaar wordt.

  3. Code optimaliseren: Voor prestatieverbeteringen kunt u vragen Copilot om uw code te optimaliseren. Copilot biedt suggesties om de efficiëntie van uw code te verbeteren.

  4. Uitleg code: als u meer informatie nodig hebt over een stukje code, vraagt u om Copilot een uitleg. Copilot biedt een gedetailleerde uitleg van de functionaliteit van de code.

Stappen voor het gebruik van snelle acties

  1. Aanroepen Copilot In-cel: Selecteer het pictogram op de werkbalk van het Copilot-notitieboek om te beginnen met interageren met Copilot.

  2. Typ uw aanvraag: voer uw aanvraag of vraag in in het tekstpaneel boven de codecel. Voorbeeld:

Explain the following code snippet.
  1. Suggesties ontvangen: Copilot reageert met de relevante code, fixes, opmerkingen, optimalisaties of uitleg.

  2. #c0 Suggesties toepassen#: kopieer de gegenereerde code of suggesties van #c1 en plak deze in uw notebook-cellen om ze uit te voeren.

Met het Copilot in-celpaneel kunt u code genereren, fouten oplossen, opmerkingen toevoegen, prestaties optimaliseren en uw code beter begrijpen, allemaal binnen uw Microsoft Fabric notebooks.

Schermopname van het genereren van logistieke regressiecode.

Copilot voor Data Science en Data Engineering heeft tevens besef van het schema en de metagegevens van lakehouse-tabellen. Copilot kan relevante informatie bieden in de context van uw gegevens die worden gehost in een gekoppeld lakehouse. U kunt bijvoorbeeld het volgende vragen:

  • Hoeveel tafels zijn er in het lakehouse?
  • Wat zijn de kolommen van de klantentabel?

Copilot reageert met de relevante informatie wanneer u het lakehouse aan de notebook hebt toegevoegd. Copilot heeft ook inzicht in de namen van bestanden die zijn toegevoegd aan elk lakehouse dat aan het notitieblok is gekoppeld. U kunt deze bestanden op naam in uw chat raadplegen. Als u bijvoorbeeld een bestand met de naam sales.csv in uw lakehouse hebt, kunt u vragen Copilot om een dataframe te maken op basis van sales.csv. Copilot de code genereert en deze weergeeft in het chatvenster. Met Copilot voor notebooks kunt u eenvoudig gegevens uit verschillende bronnen openen en er query's op uitvoeren. U hebt niet de exacte opdrachtsyntaxis nodig om dit te doen.

Copilot voltooiing van inlinecode (preview)

Copilot Inline codevoltooiing is een ai-functie waarmee u sneller en efficiënter code kunt schrijven in Fabric Notebooks. Deze functie biedt intelligente, contextbewuste codesuggesties terwijl u code typt. Zie voor meer informatie Copilot inline codevoltooiing

Tips

  • Verwijder uw chatgesprek in het chatvenster Copilot met de bezem bovenin het chatvenster. Copilot behoudt tijdens de sessie kennis van invoer en uitvoer, maar dit helpt als u de huidige inhoud als afleidend ervaart.
  • Gebruik de magics-bibliotheek voor chat om instellingen over Copilotte configureren, inclusief privacyinstellingen. De standaardmodus voor delen maximaliseert het delen van de context die Copilot kan benaderen. Daarom kan het beperken van de verstrekte Copilot informatie rechtstreeks en aanzienlijk van invloed zijn op de relevantie van de antwoorden.
  • Wanneer Copilot voor het eerst wordt gestart, biedt het een set nuttige aanwijzingen waarmee u aan de slag kunt gaan. Ze kunnen u helpen uw gesprek te starten met Copilot. Als u later naar prompts wilt verwijzen, kunt u de sparkle-knop onder aan het chatvenster gebruiken.
  • U kunt de zijbalk van de Copilot chat 'slepen' om het chatvenster uit te vouwen, om de code duidelijker weer te geven of om de leesbaarheid van de uitvoer op het scherm te verbeteren.

Beperkingen

Copilot-functies in de Data Science-omgeving zijn momenteel beperkt tot notebooks. Deze functies omvatten het Copilot chatvenster, IPython magic-opdrachten die kunnen worden gebruikt in een codecel en automatische codesuggesties terwijl u een codecel typt. Copilot kan ook semantische Power BI-modellen lezen met behulp van de integratie van semantische koppeling.

Copilot heeft twee belangrijke toepassingen:

  • U kunt vragen Copilot om gegevens in uw notebook te onderzoeken en te analyseren (bijvoorbeeld door eerst een DataFrame te laden en vervolgens te vragen Copilot over gegevens in het DataFrame).
  • U kunt Copilot vragen om een reeks suggesties over uw gegevensanalyseproces te genereren, bijvoorbeeld welke voorspellende modellen mogelijk relevant zijn, code voor het uitvoeren van verschillende soorten gegevensanalyse en documentatie voor een afgerond notitieblok.

Codegeneratie met snel bewegende of onlangs uitgebrachte bibliotheken kan onnauwkeurigheden of fabricaties bevatten.

Verwijderen en exporteren van gegevens

Copilot in notebooks biedt gebruikers twee essentiële opdrachten voor het beheren van de chatgeschiedenis in notitieblokcellen: show_chat_history en clear_chat_history. De opdracht show_chat_history exporteert de volledige chatgeschiedenis voor nalevingsdoeleinden om ervoor te zorgen dat alle benodigde interacties worden gedocumenteerd en toegankelijk zijn voor controle. Als u bijvoorbeeld show_chat_history uitvoert, wordt er een uitgebreid logboek gegenereerd van de chatgeschiedenis, die vervolgens kan worden gecontroleerd of gearchiveerd voor naleving.

Met de opdracht clear_chat_history worden alle vorige gesprekken uit het notitieblok verwijderd, zodat de gebruiker opnieuw kan beginnen. Met deze opdracht worden oude interacties gewist om een nieuwe gespreksthread te starten. Als u bijvoorbeeld clear_chat_history uitvoert, worden alle vorige chatgeschiedenis verwijderd om het notitieblok vrij te laten van eerdere gesprekken. Deze functies verbeteren de algehele functionaliteit en gebruikerservaring van Copilot in notebooks.