Udostępnij za pośrednictwem


Porady: korzystanie z wyników połączonych do poprawiania wydajności

W tym przykładzie pokazano, jak użyć klasy concurrency::combinable , aby obliczyć sumę liczb w obiekcie std::array , który jest prime. Klasa combinable poprawia wydajność, eliminując stan udostępniony.

Napiwek

W niektórych przypadkach mapa równoległa (concurrency::p arallel_transform) i reduce (concurrency:: parallel_reduce) może zapewnić ulepszenia wydajności w przypadku combinableprogramu . Przykład, który używa operacji mapowania i redukcji w celu uzyskania tych samych wyników co w tym przykładzie, zobacz Parallel Algorithms (Algorytmy równoległe).

Przykład — akumulacja

W poniższym przykładzie użyto funkcji std::accumulate , aby obliczyć sumę elementów w tablicy, które są prime. W tym przykładzie jest obiektemarray, a is_prime funkcja określa, a czy jego wartość wejściowa jest podstawowa.

prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
   return acc + (is_prime(i) ? i : 0);
});

Przykład — parallel_for_each

W poniższym przykładzie przedstawiono naiwny sposób równoległości poprzedniego przykładu. W tym przykładzie użyto algorytmu concurrency::p arallel_for_each w celu przetwarzania tablicy równolegle i obiektu współbieżności::critical_section w celu zsynchronizowania dostępu do zmiennej prime_sum . Ten przykład nie jest skalowany, ponieważ każdy wątek musi czekać na udostępnienie udostępnionego zasobu.

critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
   cs.lock();
   prime_sum += (is_prime(i) ? i : 0);
   cs.unlock();
});

Przykład — łączenie

W poniższym przykładzie użyto combinable obiektu w celu zwiększenia wydajności poprzedniego przykładu. W tym przykładzie eliminuje potrzebę synchronizacji obiektów; jest skalowana, ponieważ obiekt umożliwia każdemu combinable wątkowi niezależne wykonywanie zadania.

combinable Obiekt jest zwykle używany w dwóch krokach. Najpierw utwórz serię precyzyjnych obliczeń, wykonując równolegle pracę. Następnie połącz (lub zmniejsz) obliczenia w końcowy wynik. W tym przykładzie użyto metody concurrency::combinable::local w celu uzyskania odwołania do sumy lokalnej. Następnie używa współbieżności::combineable::combine method i obiektu std::p lus w celu połączenia obliczeń lokalnych w końcowy wynik.

combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
   sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());

Przykład — szeregowy i równoległy

Poniższy kompletny przykład oblicza sumę liczb pierwszych zarówno szeregowo, jak i równolegle. Przykład wyświetla w konsoli czas wymagany do wykonania obu obliczeń.

// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>

using namespace concurrency;
using namespace std;

// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
   __int64 begin = GetTickCount();
   f();
   return GetTickCount() - begin;
}

// Determines whether the input value is prime.
bool is_prime(int n)
{
   if (n < 2)
      return false;
   for (int i = 2; i < n; ++i)
   {
      if ((n % i) == 0)
         return false;
   }
   return true;
}

int wmain()
{   
   // Create an array object that contains 200000 integers.
   array<int, 200000> a;

   // Initialize the array such that a[i] == i.
   iota(begin(a), end(a), 0);

   int prime_sum;
   __int64 elapsed;

   // Compute the sum of the numbers in the array that are prime.
   elapsed = time_call([&] {
      prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
         return acc + (is_prime(i) ? i : 0);
      });
   });   
   wcout << prime_sum << endl;   
   wcout << L"serial time: " << elapsed << L" ms" << endl << endl;

   // Now perform the same task in parallel.
   elapsed = time_call([&] {
      combinable<int> sum;
      parallel_for_each(begin(a), end(a), [&](int i) {
         sum.local() += (is_prime(i) ? i : 0);
      });
      prime_sum = sum.combine(plus<int>());
   });
   wcout << prime_sum << endl;
   wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}

Następujące przykładowe dane wyjściowe są przeznaczone dla komputera z czterema procesorami.

1709600813
serial time: 6178 ms

1709600813
parallel time: 1638 ms

Kompilowanie kodu

Aby skompilować kod, skopiuj go, a następnie wklej go w projekcie programu Visual Studio lub wklej go w pliku o nazwie parallel-sum-of-primes.cpp , a następnie uruchom następujące polecenie w oknie wiersza polecenia programu Visual Studio.

cl.exe /EHsc parallel-sum-of-primes.cpp

Niezawodne programowanie

Aby zapoznać się z przykładem użycia operacji mapowania i redukcji w celu uzyskania tych samych wyników, zobacz Parallel Algorithms (Algorytmy równoległe).

Zobacz też

Równoległe kontenery oraz obiekty
combinable, klasa
critical_section, klasa