Delen via


Verwerkingsvereisten en overwegingen (gegevensanalyse)

Van toepassing op: SQL Server 2019 en eerder Analysis Services Azure Analysis Services Fabric/Power BI Premium

Belangrijk

Data mining werd verouderd verklaard in SQL Server 2017 Analysis Services en is nu stopgezet in SQL Server 2022 Analysis Services. Documentatie wordt niet bijgewerkt voor afgeschafte en stopgezette functies. Zie Analysis Services-compatibiliteit met eerdere versies voor meer informatie.

In dit onderwerp worden enkele technische overwegingen beschreven waarmee u rekening moet houden bij het verwerken van gegevensanalyseobjecten. Zie Data Mining-objecten verwerken voor een algemene uitleg over wat verwerking is en hoe deze van toepassing is op gegevensanalyseobjecten.

Queries van relationele opslag

Verwerkende Mijnbouwstructuren

Mining-modellen verwerken

Queries op de relationele database tijdens de verwerking

Voor gegevensanalyse zijn er drie fasen voor verwerking: het opvragen van de brongegevens, het bepalen van onbewerkte statistieken en het gebruik van de modeldefinitie en het algoritme om het miningmodel te trainen.

De SQL Server Analysis Services-server voert query's uit naar de database die de onbewerkte gegevens levert. Deze database kan een exemplaar van SQL Server 2017 of een eerdere versie van de SQL Server-database-engine zijn. Wanneer u een gegevensmijnbouwstructuur verwerkt, worden de gegevens in de bron overgebracht naar de gegevensmijnbouwstructuur en op schijf bewaard in een nieuw, gecomprimeerd formaat. Niet elke kolom in de gegevensbron wordt verwerkt: alleen de kolommen die zijn opgenomen in de mijnbouwstructuur, zoals gedefinieerd door de bindingen.

Met behulp van deze gegevens bouwt SQL Server Analysis Services een index van alle gegevens en gediscretiseerde kolommen en maakt een afzonderlijke index voor doorlopende kolommen. Er wordt één query uitgegeven voor elke geneste tabel om de index te maken en er wordt een extra query per geneste tabel gegenereerd om relaties tussen elk paar van een geneste tabel en casetabel te verwerken. De reden voor het maken van meerdere query's is het verwerken van een speciaal intern multidimensionaal gegevensarchief. U kunt het aantal query's beperken dat SQL Server Analysis Services naar het relationele archief verzendt door de servereigenschap DatabaseConnectionPoolMax in te stellen. Zie OLAP-eigenschappen voor meer informatie.

Wanneer u het model verwerkt, worden de gegevens uit de gegevensbron niet opnieuw gelezen door het model, maar wordt in plaats daarvan de samenvatting opgehaald van de gegevens uit de mining-structuur. Met behulp van de kubus die is gemaakt, samen met de in de cache opgeslagen index- en casegegevens, maakt de server onafhankelijke threads om de modellen te trainen.

Zie Functies die worden ondersteund door de edities van SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473) voor meer informatie over de edities van SQL Server die ondersteuning bieden voor parallelle modelverwerking.

Verwerkingsprocesstructuren

Een mijnbouwstructuur kan samen met alle afhankelijke modellen of afzonderlijk worden verwerkt. Het verwerken van een mijnbouwstructuur afzonderlijk van modellen kan nuttig zijn wanneer sommige modellen naar verwachting lange tijd in beslag nemen en u die bewerking wilt uitstellen.

Zie Een mijnbouwstructuur verwerken voor meer informatie.

Als u zich zorgen maakt over het behoud van schijfruimte, houd er dan rekening mee dat SQL Server Analysis Services de caches van de datamijnstructuren lokaal behoudt. Dat betekent dat alle trainingsgegevens naar uw lokale harde schijf worden opgeslagen. Als u de gegevens niet in de cache wilt opslaan, kunt u de standaardinstelling wijzigen door de MiningStructureCacheMode eigenschap in de mijnbouwstructuur in te stellen op ClearAfterProcessing. Hierdoor wordt de cache vernietigd nadat modelen zijn verwerkt; er wordt echter ook drillthrough op de mijnbouwstructuur uitgeschakeld. Zie Drillthrough-query's (gegevensanalyse) voor meer informatie.

Als u de cache wist, kunt u de holdout-testset niet gebruiken, als u er een hebt gedefinieerd, en zal de definitie van de testsetpartitie verloren gaan. Zie trainings- en testdatasets voor meer informatie over holdout-testsets.

Het verwerken van mijnbouwmodellen

U kunt een mijnbouwmodel afzonderlijk verwerken van de bijbehorende mijnbouwstructuur of u kunt alle modellen verwerken die zijn gebaseerd op de structuur, samen met de structuur.

Zie Een mijnbouwmodel verwerken voor meer informatie.

In SQL Server Data Tools en SQL Server Management Studio kunt u echter niet meerdere miningmodellen selecteren om met de structuur te verwerken. Als u wilt bepalen welke modellen worden verwerkt, moet u ze afzonderlijk selecteren of XMLA of DMX gebruiken om modellen serieel te verwerken.

Wanneer opnieuw verwerken is vereist

U moet de SQL Server Analysis Services-modellen verwerken die u definieert voordat u ermee kunt gaan werken. U moet de mijnbouwmodellen ook opnieuw verwerken wanneer u de structuur van het mijnbouwmodel wijzigt, de trainingsgegevens bijwerkt, een bestaand mijnbouwmodel wijzigt of een nieuw mijnbouwmodel aan de structuur toevoegt.

Mijnbouwmodellen worden ook verwerkt in deze scenario's:

Implementatie van een project: afhankelijk van de projectinstellingen en de huidige status van het project, worden de mijnbouwmodellen in het project doorgaans volledig verwerkt wanneer het project wordt geïmplementeerd.

Wanneer u de implementatie initieert, wordt de verwerking automatisch gestart, tenzij er een eerder verwerkte versie is op de SQL Server Analysis Services-server en er geen structurele wijzigingen zijn aangebracht. U kunt een project implementeren door De oplossing implementeren te selecteren in de vervolgkeuzelijst of door op de F5-toets te drukken. U kunt

Zie Implementatie van Data Mining Solutions voor meer informatie over het instellen van SQL Server Analysis Services-implementatie-eigenschappen die bepalen hoe miningmodellen worden geïmplementeerd.

Een mijnbouwmodel verplaatsen: wanneer u een mijnbouwmodel verplaatst met behulp van de opdracht EXPORTEREN, wordt alleen de definitie van het model geëxporteerd, waaronder de naam van de mijnbouwstructuur die naar verwachting gegevens aan het model levert.

Vereisten voor het opnieuw verwerken van de volgende scenario's met behulp van de opdrachten EXPORTEREN en IMPORTEREN:

  • De datamijnstructuur bestaat op de doelinstantie en bevindt zich in een niet-verwerkte status.

    Zowel de structuur als het model moeten opnieuw worden verwerkt.

  • De datamijnstructuur bestaat op het doelsysteem en de datamijnstructuur is verwerkt. Alleen het mijnbouwmodel is geëxporteerd.

    Het model kan zonder verwerking worden gebruikt.

  • De definitie van de mijnbouwstructuur is ook geëxporteerd met behulp van het trefwoord WITH DEENDENCIES.

    Zowel de structuur als het model moeten opnieuw worden verwerkt.

Zie Gegevensanalyseobjecten exporteren en importeren voor meer informatie.

Zie ook

Mijnbouwstructuren (Analysis Services - Gegevensanalyse)
Mijnbouwstructuren (Analysis Services - Gegevensanalyse)
Een multidimensionaal model verwerken (Analysis Services)