Cómo: Escribir un bucle parallel_for_each
En este ejemplo se muestra cómo utilizar el concurrency::parallel_for_each algoritmo para calcular la cantidad de números primos en un std::array objeto en paralelo.
Ejemplo
En el siguiente ejemplo se calcula dos veces el recuento de números primos en una matriz.En el ejemplo se usa primero el algoritmo std::for_each para calcular el contador consecutivamente.A continuación, en el ejemplo se usa el algoritmo parallel_for_each para realizar la misma tarea en paralelo.También se imprime en la consola el tiempo necesario para realizar ambos cálculos.
// parallel-count-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <iostream>
#include <algorithm>
#include <array>
using namespace concurrency;
using namespace std;
// Calls the provided work function and returns the number of milliseconds
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Determines whether the input value is prime.
bool is_prime(int n)
{
if (n < 2)
return false;
for (int i = 2; i < n; ++i)
{
if ((n % i) == 0)
return false;
}
return true;
}
int wmain()
{
// Create an array object that contains 200000 integers.
array<int, 200000> a;
// Initialize the array such that a[i] == i.
int n = 0;
generate(begin(a), end(a), [&] {
return n++;
});
LONG prime_count;
__int64 elapsed;
// Use the for_each algorithm to count the number of prime numbers
// in the array serially.
prime_count = 0L;
elapsed = time_call([&] {
for_each (begin(a), end(a), [&](int n ) {
if (is_prime(n))
++prime_count;
});
});
wcout << L"serial version: " << endl
<< L"found " << prime_count << L" prime numbers" << endl
<< L"took " << elapsed << L" ms" << endl << endl;
// Use the parallel_for_each algorithm to count the number of prime numbers
// in the array in parallel.
prime_count = 0L;
elapsed = time_call([&] {
parallel_for_each (begin(a), end(a), [&](int n ) {
if (is_prime(n))
InterlockedIncrement(&prime_count);
});
});
wcout << L"parallel version: " << endl
<< L"found " << prime_count << L" prime numbers" << endl
<< L"took " << elapsed << L" ms" << endl << endl;
}
La siguiente salida de ejemplo corresponde a un equipo con cuatro procesadores.
serial version:
found 17984 prime numbers
took 6115 ms
parallel version:
found 17984 prime numbers
took 1653 ms
Compilar el código
Para compilar el código, copiarlo y, a continuación, péguelo en un proyecto de Visual Studio o lo pega en un archivo denominado paralelo-count-primes.cpp y, a continuación, ejecute el siguiente comando en una ventana de símbolo del sistema de Visual Studio.
cl.exe /EHsc parallel-count-primes.cpp
Programación eficaz
La expresión lambda que el ejemplo pasa al algoritmo parallel_for_each usa la función InterlockedIncrement para permitir a las iteraciones paralelas del bucle incrementar el contador simultáneamente.Si usa funciones como InterlockedIncrement para sincronizar el acceso a los recursos compartidos, pueden presentarse cuellos de botella de rendimiento en el código.Puede utilizar un mecanismo de sincronización libres de bloqueo, por ejemplo, la concurrency::combinable (clase), para eliminar el acceso simultáneo a los recursos compartidos.Para consultar un ejemplo en el que se usa la clase combinable de esta forma, vea Cómo: Usar la clase combinable para mejorar el rendimiento.