Megosztás a következőn keresztül:


Hogyan: Kombinálható funkció használata a teljesítmény növelése érdekében

Ez a példa bemutatja, hogyan használható az egyidejűség::kombinálható osztály az std::array objektumban lévő számok összegének kiszámításához, amelyek prímozottak. Az combinable osztály a megosztott állapot megszüntetésével javítja a teljesítményt.

Jótanács

Bizonyos esetekben a párhuzamos leképezés (egyidejűség::parallel_transform) és a csökkentés (egyidejűség::parallel_reduce) teljesítménybeli javulást biztosíthat combinable-val szemben. Egy olyan példa, amely térkép- és csökkentési műveleteket használ a példához hasonló eredmények előállításához, tekintse meg a Párhuzamos algoritmusok című témakört.

Példa – halmozódás

Az alábbi példa az std::accumulate függvényt használja egy prímtömb elemeinek összegének kiszámításához. Ebben a példában egy a objektumról van szó, és a array függvény meghatározza, is_prime hogy a bemeneti értéke prímérték-e.

prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
   return acc + (is_prime(i) ? i : 0);
});

Példa – parallel_for_each

Az alábbi példa az előző példa párhuzamosításának naiv módját mutatja be. Ez a példa a concurrency::parallel_for_each algoritmust használja a tömb párhuzamos feldolgozásához, és egy concurrency::critical_section objektumot a prime_sum változóhoz való hozzáférés szinkronizálására. Ez a példa nem skálázható, mert minden szálnak meg kell várnia, amíg a megosztott erőforrás elérhetővé válik.

critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
   cs.lock();
   prime_sum += (is_prime(i) ? i : 0);
   cs.unlock();
});

Példa – kombinálható

Az alábbi példa egy combinable objektumot használ az előző példa teljesítményének javítására. Ez a példa kiküszöböli a szinkronizálási objektumok szükségességét; skálázható, mert az combinable objektum lehetővé teszi, hogy az egyes szálak egymástól függetlenül hajtják végre a feladatát.

Az combinable objektumokat általában két lépésben használják. Először is készítsen egy sor részletes számítást párhuzamosan végzett munkával. Ezután egyesítse (vagy csökkentse) a számításokat egy végső eredményben. Ez a példa a concurrency::combinable::local metódust használja a lokális összegre való hivatkozás megszerzéséhez. Ezután a concurrency::combinable::combine metódus és egy std::plus objektum használatával kombinálja a helyi számításokat a végeredmény eléréséhez.

combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
   sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());

Példa – soros és párhuzamos

Az alábbi teljes példa egyszerre és párhuzamosan számítja ki a prímszámok összegét. A példa a konzolra nyomtatja a két számítás elvégzéséhez szükséges időt.

// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>

using namespace concurrency;
using namespace std;

// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
   __int64 begin = GetTickCount();
   f();
   return GetTickCount() - begin;
}

// Determines whether the input value is prime.
bool is_prime(int n)
{
   if (n < 2)
      return false;
   for (int i = 2; i < n; ++i)
   {
      if ((n % i) == 0)
         return false;
   }
   return true;
}

int wmain()
{   
   // Create an array object that contains 200000 integers.
   array<int, 200000> a;

   // Initialize the array such that a[i] == i.
   iota(begin(a), end(a), 0);

   int prime_sum;
   __int64 elapsed;

   // Compute the sum of the numbers in the array that are prime.
   elapsed = time_call([&] {
      prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
         return acc + (is_prime(i) ? i : 0);
      });
   });   
   wcout << prime_sum << endl;   
   wcout << L"serial time: " << elapsed << L" ms" << endl << endl;

   // Now perform the same task in parallel.
   elapsed = time_call([&] {
      combinable<int> sum;
      parallel_for_each(begin(a), end(a), [&](int i) {
         sum.local() += (is_prime(i) ? i : 0);
      });
      prime_sum = sum.combine(plus<int>());
   });
   wcout << prime_sum << endl;
   wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}

Az alábbi mintakimenet egy négy processzorral rendelkező számítógéphez készült.

1709600813
serial time: 6178 ms

1709600813
parallel time: 1638 ms

A kód összeállítása

A kód fordításához másolja ki, majd illessze be egy Visual Studio-projektbe, vagy illessze be egy elnevezett parallel-sum-of-primes.cpp fájlba, majd futtassa a következő parancsot egy Visual Studio parancssori ablakban.

cl.exe /EHsc parallel-sum-of-primes.cpp

Robusztus programozás

Ha például leképezési és csökkentési műveleteket használ ugyanazon eredmények előállításához, tekintse meg a Párhuzamos algoritmusok című témakört.

Lásd még

párhuzamos tárolók és objektumok
kombinálható osztály
critical_section osztály