Практическое руководство. Использование класса combinable для повышения производительности

В этом примере показано, как использовать класс concurrency::combinable для вычисления суммы чисел в объекте std::array , который является простым. Класс combinable повышает производительность, устраняя общее состояние.

Совет

В некоторых случаях параллельная карта (параллелизм::p arallel_transform) и уменьшение (параллелизм:: parallel_reduce) может повысить производительность.combinable Пример, использующий операции сопоставления и сокращения для создания одинаковых результатов, см. в разделе "Параллельные алгоритмы".

Пример — накапливать

В следующем примере функция std::аккумулирует для вычисления суммы элементов в массиве, который является простым. В этом примере a объект и is_prime функция определяет, является ли входное array значение простым.

prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
   return acc + (is_prime(i) ? i : 0);
});

Пример — parallel_for_each

В следующем примере показан наивный способ параллелизации предыдущего примера. В этом примере используется алгоритм параллелизма::p arallel_for_each для параллельной обработки массива и объекта параллелизма::critical_section для синхронизации доступа к переменной prime_sum . Этот пример не масштабируется, так как каждый поток должен ждать, пока общий ресурс станет доступным.

critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
   cs.lock();
   prime_sum += (is_prime(i) ? i : 0);
   cs.unlock();
});

Пример — комбинируемая

В следующем примере объект используется combinable для повышения производительности предыдущего примера. В этом примере устраняется необходимость в объектах синхронизации; он масштабируется, так как combinable объект позволяет каждому потоку выполнять свою задачу независимо.

Объект combinable обычно используется двумя шагами. Во-первых, создайте ряд точных вычислений, выполняя параллельное выполнение работы. Затем объедините (или уменьшите) вычисления в окончательный результат. В этом примере используется метод параллелизма::combinable::local для получения ссылки на локальную сумму. Затем он использует метод параллелизма::combinable::combine и объект std::p lus для объединения локальных вычислений в окончательный результат.

combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
   sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());

Пример — последовательный и параллельный

Следующий полный пример вычисляет сумму простых чисел последовательно и параллельно. В примере выводится в консоль время, необходимое для выполнения обоих вычислений.

// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>

using namespace concurrency;
using namespace std;

// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
   __int64 begin = GetTickCount();
   f();
   return GetTickCount() - begin;
}

// Determines whether the input value is prime.
bool is_prime(int n)
{
   if (n < 2)
      return false;
   for (int i = 2; i < n; ++i)
   {
      if ((n % i) == 0)
         return false;
   }
   return true;
}

int wmain()
{   
   // Create an array object that contains 200000 integers.
   array<int, 200000> a;

   // Initialize the array such that a[i] == i.
   iota(begin(a), end(a), 0);

   int prime_sum;
   __int64 elapsed;

   // Compute the sum of the numbers in the array that are prime.
   elapsed = time_call([&] {
      prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
         return acc + (is_prime(i) ? i : 0);
      });
   });   
   wcout << prime_sum << endl;   
   wcout << L"serial time: " << elapsed << L" ms" << endl << endl;

   // Now perform the same task in parallel.
   elapsed = time_call([&] {
      combinable<int> sum;
      parallel_for_each(begin(a), end(a), [&](int i) {
         sum.local() += (is_prime(i) ? i : 0);
      });
      prime_sum = sum.combine(plus<int>());
   });
   wcout << prime_sum << endl;
   wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}

В следующем примере показаны выходные данные, полученные на четырехпроцессорном компьютере.

1709600813
serial time: 6178 ms

1709600813
parallel time: 1638 ms

Компиляция кода

Чтобы скомпилировать код, скопируйте его и вставьте его в проект Visual Studio или вставьте его в файл с именем parallel-sum-of-primes.cpp , а затем выполните следующую команду в окне командной строки Visual Studio.

cl.exe /EHsc parallel-sum-of-primes.cpp

Отказоустойчивость

Пример использования операций сопоставления и уменьшения для получения одинаковых результатов см. в разделе "Параллельные алгоритмы".

См. также

Параллельные контейнеры и объекты
Класс combinable
Класс critical_section