Como converter um loop OpenMP paralelo para loop para usar o runtime de simultaneidade
Este exemplo demonstra como converter um loop básico que usa as diretivas parallel e for do OpenMP para usar o algoritmo de Runtime de Simultaneidade concurrency::parallel_for.
Exemplo – contagem de números primos
Este exemplo usa o OpenMP e o Runtime de Simultaneidade para calcular a contagem de números primos em uma matriz de valores aleatórios.
// concrt-omp-count-primes.cpp
// compile with: /EHsc /openmp
#include <ppl.h>
#include <random>
#include <array>
#include <iostream>
using namespace concurrency;
using namespace std;
// Determines whether the input value is prime.
bool is_prime(int n)
{
if (n < 2)
return false;
for (int i = 2; i < n; ++i)
{
if ((n % i) == 0)
return false;
}
return true;
}
// Uses OpenMP to compute the count of prime numbers in an array.
void omp_count_primes(int* a, size_t size)
{
if (size == 0)
return;
size_t count = 0;
#pragma omp parallel for
for (int i = 0; i < static_cast<int>(size); ++i)
{
if (is_prime(a[i])) {
#pragma omp atomic
++count;
}
}
wcout << L"found " << count
<< L" prime numbers." << endl;
}
// Uses the Concurrency Runtime to compute the count of prime numbers in an array.
void concrt_count_primes(int* a, size_t size)
{
if (size == 0)
return;
combinable<size_t> counts;
parallel_for<size_t>(0, size, [&](size_t i)
{
if (is_prime(a[i])) {
counts.local()++;
}
});
wcout << L"found " << counts.combine(plus<size_t>())
<< L" prime numbers." << endl;
}
int wmain()
{
// The length of the array.
const size_t size = 1000000;
// Create an array and initialize it with random values.
int* a = new int[size];
mt19937 gen(42);
for (size_t i = 0; i < size; ++i) {
a[i] = gen();
}
// Count prime numbers by using OpenMP and the Concurrency Runtime.
wcout << L"Using OpenMP..." << endl;
omp_count_primes(a, size);
wcout << L"Using the Concurrency Runtime..." << endl;
concrt_count_primes(a, size);
delete[] a;
}
Este exemplo gerencia a seguinte saída.
Using OpenMP...
found 107254 prime numbers.
Using the Concurrency Runtime...
found 107254 prime numbers.
O algoritmo parallel_for
e o OpenMP 3.0 permitem que o tipo de índice seja um tipo integral com sinal ou um tipo integral sem sinal. O algoritmo parallel_for
também garante que o intervalo especificado não estoure um tipo com sinal. As versões 2.0 e 2.5 do OpenMP permitem apenas tipos de índice integral com sinal. O OpenMP também não valida o intervalo de índice.
A versão deste exemplo que usa o Runtime de Simultaneidade também usa um objeto concurrency::combinable no lugar da diretiva atomic para incrementar o valor do contador sem a necessidade de sincronização.
Para obter mais informações sobre parallel_for
e outros algoritmos paralelos, consulte Algoritmos paralelos. Para mais informações sobre a classe combinable
, confira Contêineres e objetos paralelos.
Exemplo – usar std::array
Este exemplo modifica o anterior de modo a agir em um objeto std::array em vez de em uma matriz nativa. Como as versões 2.0 e 2.5 do OpenMP permitem tipos de índice integral com sinal somente em um constructo parallel_for
, você não pode usar iteradores para acessar os elementos de um contêiner da Biblioteca Padrão C++ em paralelo. A PPL (Biblioteca de Padrões Paralelos) fornece o algoritmo concurrency::parallel_for_each, que executa tarefas em paralelo em um contêiner iterativo, como as fornecidas pela Biblioteca Padrão C++. Ele usa a mesma lógica de particionamento que o algoritmo parallel_for
utiliza. O algoritmo parallel_for_each
se assemelha ao algoritmo std::for_each da Biblioteca Padrão do C++, exceto pelo fato de que o algoritmo parallel_for_each
executa as tarefas simultaneamente.
// Uses OpenMP to compute the count of prime numbers in an
// array object.
template<size_t Size>
void omp_count_primes(const array<int, Size>& a)
{
if (a.size() == 0)
return;
size_t count = 0;
int size = static_cast<int>(a.size());
#pragma omp parallel for
for (int i = 0; i < size; ++i)
{
if (is_prime(a[i])) {
#pragma omp atomic
++count;
}
}
wcout << L"found " << count
<< L" prime numbers." << endl;
}
// Uses the Concurrency Runtime to compute the count of prime numbers in an
// array object.
template<size_t Size>
void concrt_count_primes(const array<int, Size>& a)
{
if (a.size() == 0)
return;
combinable<size_t> counts;
parallel_for_each(begin(a), end(a), [&counts](int n)
{
if (is_prime(n)) {
counts.local()++;
}
});
wcout << L"found " << counts.combine(plus<size_t>())
<< L" prime numbers." << endl;
}
Compilando o código
Copie o código de exemplo e cole-o em um projeto do Visual Studio, ou cole-o em um arquivo chamado concrt-omp-count-primes.cpp
e execute o comando a seguir em uma janela do Prompt de comando do Visual Studio.
cl.exe /EHsc /openmp concrt-omp-count-primes.cpp
Confira também
Migrando do OpenMP para o runtime de simultaneidade
Algoritmos paralelos
Contêineres e objetos em paralelo