Microsoft Fabric-terminologie

Meer informatie over de definities van termen die worden gebruikt in Microsoft Fabric, waaronder termen die specifiek zijn voor Synapse Data Warehouse, Synapse Data-engineer ing, Synapse Datawetenschap, Synapse Real-Time Analytics, Data Factory en Power BI.

Algemene begrippen

  • Capaciteit: Capaciteit is een toegewezen set resources die op een bepaald moment beschikbaar is om te worden gebruikt. Capaciteit definieert de mogelijkheid van een resource om een activiteit uit te voeren of uitvoer te produceren. Verschillende items verbruiken op een bepaald moment verschillende capaciteit. Fabric biedt capaciteit via de Fabric-SKU en proefversies. Zie Wat is capaciteit voor meer informatie ?

  • Ervaring: Een verzameling mogelijkheden die zijn gericht op een specifieke functionaliteit. De infrastructuurervaringen omvatten Synapse Data Warehouse, Synapse Data-engineer ing, Synapse Datawetenschap, Synapse Realtime Analytics, Data Factory en Power BI.

  • Item: Een item een set mogelijkheden binnen een ervaring. Gebruikers kunnen ze maken, bewerken en verwijderen. Elk itemtype biedt verschillende mogelijkheden. De Data-engineer-ervaring bevat bijvoorbeeld de taakdefinitie-items lakehouse, notebook en Spark.

  • Tenant: Een tenant is één exemplaar van Fabric voor een organisatie en is afgestemd op een Microsoft Entra-id.

  • Werkruimte: Een werkruimte is een verzameling items die verschillende functionaliteit samenbrengt in één omgeving die is ontworpen voor samenwerking. Het fungeert als een container die gebruikmaakt van capaciteit voor het uitgevoerde werk en biedt besturingselementen voor wie toegang heeft tot de items erin. In een werkruimte maken gebruikers bijvoorbeeld rapporten, notebooks, semantische modellen, enzovoort. Zie het artikel Werkruimten voor meer informatie.

Synapse Data Engineering

  • Lakehouse: Een lakehouse is een verzameling bestanden, mappen en tabellen die een database vertegenwoordigen over een data lake die wordt gebruikt door de Apache Spark-engine en SQL-engine voor verwerking van big data. Een lakehouse bevat verbeterde mogelijkheden voor ACID-transacties wanneer u de opensource Delta-tabellen gebruikt. Het lakehouse-item wordt gehost in een unieke werkruimtemap in Microsoft OneLake. Het bevat bestanden in verschillende indelingen (gestructureerd en ongestructureerd) ingedeeld in mappen en submappen. Zie Wat is een lakehouse voor meer informatie ?

  • Notebook: Een Fabric-notebook is een interactief programmeerprogramma met meerdere talen met uitgebreide functies. Dit omvat het ontwerpen van code en markdown, het uitvoeren en bewaken van een Spark-taak, het weergeven en visualiseren van het resultaat en het samenwerken met het team. Hiermee kunnen data engineers en data scientist gegevens verkennen en verwerken en machine learning-experimenten bouwen met zowel code als weinig code. Het kan eenvoudig worden getransformeerd naar een pijplijnactiviteit voor indeling.

  • Spark-toepassing: Een Apache Spark-toepassing is een programma dat is geschreven door een gebruiker met behulp van een van de API-talen van Spark (Scala, Python, Spark SQL of Java) of door Microsoft toegevoegde talen (.NET met C# of F#). Wanneer een toepassing wordt uitgevoerd, is deze onderverdeeld in een of meer Spark-taken die parallel worden uitgevoerd om de gegevens sneller te verwerken. Zie Bewaking van Spark-toepassingen voor meer informatie.

  • Apache Spark-taak: een Spark-taak maakt deel uit van een Spark-toepassing die parallel wordt uitgevoerd met andere taken in de toepassing. Een taak bestaat uit meerdere taken. Zie Spark-taakbewaking voor meer informatie.

  • Apache Spark-taakdefinitie: een Spark-taakdefinitie is een set parameters, ingesteld door de gebruiker, die aangeeft hoe een Spark-toepassing moet worden uitgevoerd. Hiermee kunt u batch- of streamingtaken verzenden naar het Spark-cluster. Zie Wat is een Apache Spark-taakdefinitie voor meer informatie ?

  • V-order: Een schrijfoptimalisatie naar de Parquet-bestandsindeling die snelle leesbewerkingen mogelijk maakt en kostenefficiëntie en betere prestaties biedt. Alle Fabric-engines schrijven standaard v-geordende Parquet-bestanden.

Data Factory

  • Verbinding maken or: Data Factory biedt een uitgebreide set connectors waarmee u verbinding kunt maken met verschillende typen gegevensarchieven. Nadat u verbinding hebt gemaakt, kunt u de gegevens transformeren. Zie connectors voor meer informatie.

  • Gegevenspijplijn: In Data Factory wordt een gegevenspijplijn gebruikt voor het organiseren van gegevensverplaatsing en -transformatie. Deze pijplijnen verschillen van de implementatiepijplijnen in Fabric. Zie Pijplijnen in het overzicht van Data Factory voor meer informatie.

  • Gegevensstroom Gen2: gegevensstromen bieden een interface met weinig code voor het opnemen van gegevens uit honderden gegevensbronnen en het transformeren van uw gegevens. Gegevensstromen in Fabric worden dataflow Gen2 genoemd. Gegevensstroom Gen1 bestaat in Power BI. Dataflow Gen2 biedt extra mogelijkheden in vergelijking met gegevensstromen in Azure Data Factory of Power BI. U kunt geen upgrade uitvoeren van Gen1 naar Gen2. Zie Gegevensstromen in het overzicht van Data Factory voor meer informatie.

Synapse Data Science

  • Data Wrangler: Data Wrangler is een hulpprogramma op basis van een notebook waarmee gebruikers een meeslepende ervaring hebben om verkennende gegevensanalyse uit te voeren. De functie combineert een rasterachtige gegevensweergave met dynamische samenvattingsstatistieken en een set algemene bewerkingen voor het opschonen van gegevens, die allemaal beschikbaar zijn met een paar geselecteerde pictogrammen. Elke bewerking genereert code die als een herbruikbaar script kan worden opgeslagen in het notebook.

  • Experiment: Een machine learning-experiment is de primaire eenheid van de organisatie en controle voor alle gerelateerde machine learning-uitvoeringen. Zie Machine Learning-experimenten in Microsoft Fabric voor meer informatie.

  • Model: Een machine learning-model is een bestand dat is getraind om bepaalde typen patronen te herkennen. U traint een model over een set gegevens en u geeft het een algoritme dat wordt gebruikt om redeneren en leren van die gegevensset. Zie Machine Learning-model voor meer informatie.

  • Uitvoeren: Een uitvoering komt overeen met één uitvoering van modelcode. In MLflow is het bijhouden gebaseerd op experimenten en uitvoeringen.

Synapse-datawarehouse

  • SQL-analyse-eindpunt: Elk Lakehouse heeft een SQL-analyse-eindpunt waarmee een gebruiker query's kan uitvoeren op deltatabelgegevens met TSQL via TDS. Zie het EINDPUNT van SQL Analytics voor meer informatie.

  • Synapse Data Warehouse: Synapse Data Warehouse fungeert als een traditioneel datawarehouse en biedt ondersteuning voor de volledige transactionele T-SQL-mogelijkheden die u zou verwachten van een datawarehouse voor ondernemingen. Zie Synapse Data Warehouse voor meer informatie.

Synapse Real-Time Analytics

  • KQL-database: de KQL-database bevat gegevens in een indeling waarop u KQL-query's kunt uitvoeren. Zie Een KQL-database opvragen voor meer informatie.

  • KQL-queryset: De KQL-queryset is het item dat wordt gebruikt voor het uitvoeren van query's, het weergeven van resultaten en het bewerken van queryresultaten op gegevens uit uw Data Explorer-database. De queryset bevat de databases en tabellen, de query's en de resultaten. Met de KQL-queryset kunt u query's opslaan voor toekomstig gebruik, of query's exporteren en delen met anderen. Zie Querygegevens in de KQL-queryset voor meer informatie

  • Gebeurtenisstroom: De functie Gebeurtenisstromen van Microsoft Fabric biedt een gecentraliseerde locatie in het Fabric-platform voor het vastleggen, transformeren en routeren van realtime gebeurtenissen naar bestemmingen zonder code. Een gebeurtenisstroom bestaat uit verschillende streaminggegevensbronnen, opnamebestemmingen en een gebeurtenisprocessor wanneer de transformatie nodig is. Zie Microsoft Fabric-gebeurtenisstromen voor meer informatie.

OneLake

  • Snelkoppeling: snelkoppelingen zijn ingesloten verwijzingen in OneLake die verwijzen naar andere bestandsopslaglocaties. Ze bieden een manier om verbinding te maken met bestaande gegevens zonder deze rechtstreeks te hoeven kopiëren. Zie OneLake-snelkoppelingen voor meer informatie.