Sdílet prostřednictvím


Postupy: Použití objektu combinable ke zlepšení výkonu

Tento příklad ukazuje, jak pomocí třídy concurrency::combinable vypočítat součet čísel v objektu std::array , které jsou prime. Třída combinable zlepšuje výkon odstraněním sdíleného stavu.

Tip

V některých případech může paralelní mapování (concurrency::p arallel_transform) a redukce (concurrency:: parallel_reduce) poskytovat vylepšení combinablevýkonu . Příklad, který používá operace mapování a redukce k vytvoření stejných výsledků jako v tomto příkladu, najdete v tématu Paralelní algoritmy.

Příklad – kumulovat

Následující příklad používá funkci std::kumulovat k výpočtu součtu prvků v poli, které jsou prime. V tomto příkladu array je objekt a is_prime funkce určuje, a zda je její vstupní hodnota prime.

prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
   return acc + (is_prime(i) ? i : 0);
});

Příklad – parallel_for_each

Následující příklad ukazuje naïve způsob, jak paralelizovat předchozí příklad. Tento příklad používá souběžnost::p arallel_for_each algoritmus ke zpracování pole paralelně a objekt concurrency::critical_section k synchronizaci přístupu k prime_sum proměnné. Tento příklad se škáluje, protože každé vlákno musí čekat, až bude sdílený prostředek k dispozici.

critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
   cs.lock();
   prime_sum += (is_prime(i) ? i : 0);
   cs.unlock();
});

Příklad – kombinování

Následující příklad používá combinable objekt ke zlepšení výkonu předchozího příkladu. Tento příklad eliminuje potřebu synchronizačních objektů; škáluje se, protože objekt umožňuje každému combinable vláknu provádět svou úlohu nezávisle.

Objekt combinable se obvykle používá ve dvou krocích. Nejprve vytvořte řadu jemně odstupňovaných výpočtů provedením paralelní práce. V dalším kroku zkombinujte výpočty (nebo zmenšete) do konečného výsledku. Tento příklad používá souběžnost::combinable::local metoda k získání odkazu na místní součet. Pak použije concurrency::combinable::combine method a std::p lus objekt ke kombinování místních výpočtů do konečného výsledku.

combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
   sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());

Příklad – sériové a paralelní

Následující úplný příklad vypočítá součet primárních čísel sériově i paralelně. Příklad se vytiskne do konzoly čas potřebný k provedení obou výpočtů.

// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>

using namespace concurrency;
using namespace std;

// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
   __int64 begin = GetTickCount();
   f();
   return GetTickCount() - begin;
}

// Determines whether the input value is prime.
bool is_prime(int n)
{
   if (n < 2)
      return false;
   for (int i = 2; i < n; ++i)
   {
      if ((n % i) == 0)
         return false;
   }
   return true;
}

int wmain()
{   
   // Create an array object that contains 200000 integers.
   array<int, 200000> a;

   // Initialize the array such that a[i] == i.
   iota(begin(a), end(a), 0);

   int prime_sum;
   __int64 elapsed;

   // Compute the sum of the numbers in the array that are prime.
   elapsed = time_call([&] {
      prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
         return acc + (is_prime(i) ? i : 0);
      });
   });   
   wcout << prime_sum << endl;   
   wcout << L"serial time: " << elapsed << L" ms" << endl << endl;

   // Now perform the same task in parallel.
   elapsed = time_call([&] {
      combinable<int> sum;
      parallel_for_each(begin(a), end(a), [&](int i) {
         sum.local() += (is_prime(i) ? i : 0);
      });
      prime_sum = sum.combine(plus<int>());
   });
   wcout << prime_sum << endl;
   wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}

Následující ukázkový výstup je pro počítač se čtyřmi procesory.

1709600813
serial time: 6178 ms

1709600813
parallel time: 1638 ms

Probíhá kompilace kódu

Pokud chcete kód zkompilovat, zkopírujte ho a vložte ho do projektu sady Visual Studio nebo ho vložte do pojmenovaného parallel-sum-of-primes.cpp souboru a potom v okně příkazového řádku sady Visual Studio spusťte následující příkaz.

cl.exe /EHsc parallel-sum-of-primes.cpp

Robustní programování

Příklad, který používá operace mapování a redukce k vytvoření stejných výsledků, viz Paralelní algoritmy.

Viz také

Paralelní kontejnery a objekty
combinable – třída
critical_section – třída