Delen via


Handleiding: Een parallel_for_each lus schrijven

In dit voorbeeld ziet u hoe u het concurrency::parallel_for_each algoritme gebruikt om het aantal priemgetallen in een std::array object parallel te berekenen.

Voorbeeld

In het volgende voorbeeld wordt het aantal priemgetallen in een matrix twee keer berekend. In het voorbeeld wordt eerst het std::for_each algoritme gebruikt om het aantal serieel te berekenen. In het voorbeeld wordt vervolgens het parallel_for_each algoritme gebruikt om dezelfde taak parallel uit te voeren. In het voorbeeld wordt ook naar de console geprint hoeveel tijd er nodig is om beide berekeningen uit te voeren.

// parallel-count-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <iostream>
#include <algorithm>
#include <array>

using namespace concurrency;
using namespace std;

// Returns the number of milliseconds that it takes to call the passed in function.
template <class Function>
__int64 time_call(Function&& f)
{
    __int64 begin = GetTickCount();
    f();
    return GetTickCount() - begin;
}

// Determines whether the input is a prime.
bool is_prime(int n)
{
    if (n < 2)
    {
        return false;
    }

    for (int i = 2; i < int(std::sqrt(n)) + 1; ++i)
    {
        if (n % i == 0)
        {
            return false;
        }
    }
    return true;
}

int wmain()
{
    // Create an array object that contains 200000 integers.
    array<int, 200000> a;

    // Initialize the array such that a[i] == i.
    int n = 0;
    generate(begin(a), end(a), [&]
        {
            return n++;
        });

    // Use the for_each algorithm to count, serially, the number
    // of prime numbers in the array.
    LONG prime_count = 0L;
    __int64 elapsed = time_call([&]
        {
            for_each(begin(a), end(a), [&](int n)
            {
                if (is_prime(n))
                {
                    ++prime_count;
                }
            });
        });
    
    wcout << L"serial version: " << endl
        << L"found " << prime_count << L" prime numbers" << endl
        << L"took " << elapsed << L" ms" << endl << endl;

    // Use the parallel_for_each algorithm to count, in parallel, the number
    // of prime numbers in the array.
    prime_count = 0L;
    elapsed = time_call([&]
        {
            parallel_for_each(begin(a), end(a), [&](int n)
                {
                    if (is_prime(n))
                    {
                        InterlockedIncrement(&prime_count);
                    }
                });
        });

    wcout << L"parallel version: " << endl
        << L"found " << prime_count << L" prime numbers" << endl
        << L"took " << elapsed << L" ms" << endl << endl;
}

De volgende voorbeelduitvoer is voor een computer met vier kernen.

serial version:
found 17984 prime numbers
took 125 ms

parallel version:
found 17984 prime numbers
took 63 ms

De code compileren

Als u de code wilt compileren, kopieert u deze en plakt u deze in een Visual Studio-project of plakt u deze in een bestand met de naam parallel-count-primes.cpp en voert u vervolgens de volgende opdracht uit in een Visual Studio-opdrachtpromptvenster.

cl.exe /EHsc-parallel-count-primes.cpp

Robuuste programmering

De lambda-expressie die door het voorbeeld wordt doorgegeven aan het parallel_for_each algoritme, gebruikt de InterlockedIncrement functie om parallelle iteraties van de lus in te schakelen om de teller gelijktijdig te verhogen. Als u functies zoals InterlockedIncrement gebruikt om de toegang tot gedeelde resources te synchroniseren, kan dit leiden tot prestatieknelpunten in uw code. U kunt een synchronisatiemechanisme zonder vergrendeling gebruiken, bijvoorbeeld de concurrency::combinable klasse, om gelijktijdige toegang tot gedeelde resources te elimineren. Voor een voorbeeld waarin de combinable klasse op deze manier wordt gebruikt, zie Hoe te: Combinator gebruiken om de prestaties te verbeteren.

Zie ook

Parallelle algoritmen
parallel_for_each Functie